Компания Puget Systems протестировала производительность видеокарт: NVIDIA GeForce RTX 3080 и NVIDIA GeForce RTX 3090 в программе видеомонтажа DaVinci Resolve Studio.
В целом, новые карты RTX 30-й серии очень хорошо работают в DaVinci Resolve Studio. Для задач, которые в значительной степени зависят от графического процессора (шумоподавление или использование OpenFX в первую очередь), RTX 3080 более чем на 60% быстрее, чем RTX 2080 SUPER, в то время как RTX 3090 на 44% быстрее, чем Titan RTX и в пределах нескольких процентов от двух графических процессоров RTX 2080 Ti. Учитывая, что один RTX 3090 24GB имеет значительно больше VRAM, чем 2x RTX 2080 Ti 11Gb карт, и стоит на 1000 долларов меньше, это чрезвычайно впечатляющий результат от 3090.
DaVinci Resolve известна в отрасли как обладающая отличной поддержкой GPU-ускорения, и значительно выигрывающая от использования мощных (или нескольких мощных) видеокарт. Это делает его очень интересным при тестировании недавно анонсированных графических процессоров серии GeForce RTX 30 от NVIDIA, поскольку NVIDIA всё больше и больше продвигает свою линейку карт GeForce в профессиональное пространство для создания контента с помощью своей программы "Studio". Игры всё ещё могут быть в центре внимания во время этих анонсов, но мы возлагаем большие надежды на то, что эти новые графические процессоры смогут достичь больших высот в профессиональном приложении, таком как DaVinci Resolve.
Хотя технические характеристики редко совпадают с реальной производительностью, это отличный признак того, что NVIDIA удвоила количество ядер CUDA по сравнению с сопоставимыми картами серии RTX 20 с небольшим падением тактовой Boost частоты. В то же время RTX 3080 и RTX 3090 также стоят на $500-1000 дешевле, чем предыдущее поколение, в зависимости от того, с какими моделями вы их сравниваете.
Хотя технические характеристики редко совпадают с реальной производительностью, это отличный признак того, что NVIDIA удвоила количество ядер CUDA по сравнению с сопоставимыми видеокартами серии RTX 20 с небольшим падением тактовой Boost частоты. В то же время RTX 3080 и 3090 также стоят на $500-1000 дешевле, чем предыдущее поколение, в зависимости от того, с какими моделями вы их сравниваете.
Хотя немного странно, что RTX 3080 имеет меньше VRAM, чем 2080 Ti, все три эти новые карты должны быть способны работать с 4K таймлайнами в DaVinci Resolve. Однако если вы хотите работать с 8K и выше носителями, то только RTX 3090 (с 24 ГБ VRAM соответственно) будет соответствовать нашей текущей рекомендации. Использование графического процессора с менее чем 20 ГБ VRAM при использовании 8K и выше, скорее всего, приведет к постоянным ошибкам "out of GPU memory", которые не способствуют плавному рабочему процессу.
Тестовая конфигурация: 32-ядерный процессор AMD Ryzen Threadripper 3970X, процессорный кулер Noctua NH-U14S TR4-SP3, материнская плата Gigabyte TRX40 AORUS PRO WIFI, 64ГБ (4х 16ГБ) оперативной памяти DDR4-2933, системный накопитель Samsung 960 Pro 1TB.
Видеокарты: NVIDIA GeForce RTX 3090 24GB, Gigabyte GeForce RTX 3080 OC 10GB (это не Founders Edition, как в других обзорах), NVIDIA Titan RTX 24GB, NVIDIA GeForce RTX 2080 Ti 11GB, NVIDIA GeForce RTX 2080 SUPER 8GB, NVIDIA GeForce RTX 2070 SUPER 8GB, NVIDIA GeForce RTX 2060 SUPER 8GB, AMD Radeon RX 5700 XT 8GB и AMD Radeon RX Vega 64 8GB.
Софт: Windows 10 Pro 64 (2004), DaVinci Resolve Studio (v16.2.7 с оптимизацией под MVIDIA Ampere) и бенчмарк PugetBench for DaVinci Resolve (v0.92). Были также поставлены последние прошивки BIOS и драйвера, на 15 сентября 2020 года.
Для тестирования каждого графического процессора мы будем использовать самую быструю платформу, доступную в настоящее время для DaVinci Resolve - в первую очередь AMD Threadripper 3970X. поскольку Resolve использует процессор не так сильно, как Adobe Premiere Pro, это должно свести к минимуму воздействие процессора (CPU) и позволить каждому графическому процессору (GPU) работать в полную силу.
Мы будем использовать "расширенный" пресет, который включает в себя как 4K, так и 8K медиа, а также специальные эффекты и тесты слияния. Использование 8K носителей с большинством видеокарт, которые мы тестируем, на самом деле не очень хорошая идея из-за ошибок "out of GPU memory", с которыми вы, вероятно, столкнетесь, но наш бенчмарк не загружает пользовательский интерфейс Resolve (он также весит на GPU), что означает, что нагрузка на VRAM намного ниже; позволяя графическим процессорам всего с 8 ГБ VRAM успешно завершить тесты 8K.
В то время как мы собираемся пройти наш анализ тестирования в следующем разделе, мы всегда хотели бы предоставить сырые результаты для тех, кто хочет углубиться в детали. Если существует определенный кодек или параметр экспорта, который вы обычно используете в своем рабочем процессе, изучение исходных результатов для этой задачи будет гораздо более применимым, чем наш более общий анализ. Скрин кликабельный.
Extended Overall Score. Общий анализ производительности DaVinci Resolve Studio. В то время как многие тестеры любят смотреть исключительно на такие вещи, как временное шумоподавление (часто до нереалистичной степени) или OpenFX, которые в значительной степени используют графический процессор, мы сначала хотим начать с рассмотрения общей производительности, которую мы получили с помощью бенчмарка DaVinci Resolve с каждым графическим процессором, чтобы показать, с какой нагрузкой столкнётся большинство пользователей, в своей повседневной работе.
Глядя на общий анализ производительности, новые RTX 3080 и RTX 3090 работают очень хорошо, RTX 3080 быстрее RTX 2080 SUPER примерно на 20%, а RTX 3090 в свою очередь быстрее RTX 2080 Ti примерно на 13%. Обе эти видеокарты даже умудряются конкурировать с двумя RTX 2080 Ti (работающими в режиме Multi-GPU), теряя всего несколько процентов производительности.
Если вы в настоящее время используете более дешёвую RTX-карту, графический процессор AMD Radeon или более старый GTX 1080 Ti, то прирост производительности будет значительным. В зависимости от конкретной видеокарты, вы получите где-то от 20 до 50% увеличение производительности с новыми RTX 3080 и RTX 3090.
Однако, как вы, вероятно заметили, нет большой разницы между RTX 3080 10GB и более дорогим RTX 3090 24GB. Дополнительный VRAM, безусловно, имеет решающее значение для рабочих процессов 8K и даже удобен для более сложных 4K таймлайнов, но, учитывая заявленные технические характеристики, вы вероятно хотели получить большего от использования RTX 3090.
Проблема здесь заключается в том, что общий расширенный балл смотрит на производительность во всех наших тестах - включая и композёра Fusion, который больше ограничен центральным процессором (CPU). Чтобы получить лучшее представление о максимальной разнице в производительности между этими картами, мы должны использовать раздел бенчмарка "GPU Effects", который рассматривает такие задачи, как TNR (шумодав) и различные GPU-ускоренные OpenFX эффекты.
4K Media Score.
8K Media Score.
Fusion Score.
GPU Effects Score. Часть GPU effects наших бенчмарков рассматривает производительность отдельных ускоренных GPU эффектов, таких как временное шумоподавление (temporal noise reduction), зернистость пленки (film grain), размытие линз (lens blur), оптический поток (optical flow), уточнение лица (face refinement) и многое другое. В нашем тестировании эти эффекты легко показывают наибольшую выгоду от наличия мощного графического процессора, а это означает, что они должны дать нам лучший взгляд на максимальный прирост производительности, с которым вы можете столкнуться от каждого из графических процессоров, которые мы тестируем.
В этом тесте новые карты RTX 30-й серии показали некоторые очень впечатляющие цифры. RTX 3080 имеет потрясающее соотношение цена/производительность, опережая аналогичный по цене RTX 2080 SUPER на колоссальные 62%. По сравнению с более дорогими RTX 2080 Ti и Titan RTX, RTX 3080 также легко превосходит эти карты примерно на 30%. Две RTX 2080 Ti все еще быстрее, чем одна RTX 3080, но всего на ~15%.
RTX 3090 выглядит еще более впечатляюще (по производительности), опережая RTX 3080 на 13%, Titan RTX на 44% и RTX 2080 Ti на 52%. На самом деле, он находится в пределах 3% от Multi-GPU связки из двух RTX 2080 Ti, что, учитывая, что вы получаете 24 ГБ VRAM по сравнению с 11 ГБ на RTX 2080 Ti и один RTX 3090 значительно дешевле, чем два RTX 2080 Ti, то тут выбор очевиден, на фоне незначительной разницы в производительности.
По сравнению с более дешевыми картами RTX 20-серии и GTX 1080 Ti, новые видеокарты RTX 30-серии похожи на ночь и день. Вы можете получить почти удвоение производительности, по сравнению с RTX 2060 SUPER или GTX 1080 Ti. А если вы рассматриваете возможность перехода с графического процессора AMD Radeon на RTX 3080 или RTX 3090, то прирост производительности будет еще более значительным - до 3 раз быстрее!
Multi-GPU. Хотя Resolve может хорошо масштабироваться с несколькими графическими процессорами, дизайн новых карт серии RTX 30 представляет собой значительную проблему. Мало того, что потребляемая мощность значительно выше (что означает, что генерируется больше тепла), но и текущая конструкция кулера на картах FE (Founders Edition) от NVIDIA и всех сторонних производителей строго рассчитана на конфигурации с одним графическим процессором (т.е. не выкидывает воздух наружу, хотя есть и исключение Gigabyte GeForce RTX 3090 TURBO 24G).
На картах NVIDIA FE вентилятор на передней панели карты фактически продувает графический процессор-всасывая холодный воздух снизу и выдыхая сверху. Это означает, что если у вас есть несколько карт, вы будете выпускать горячий воздух из одной карты непосредственно в воздухозаборник карты над ней. Умножьте это на два, три или даже четыре графических процессора, и вы получите троттлинг, или прямой сбоя системы (из-за перегрева).
Тем временем мы можем провести некоторое тестирование производительности с несколькими графическими процессорами RTX 3080 и 3090, используя имеющиеся в настоящее время карты. Однако мы должны подчеркнуть, что это очень раннее тестирование. Карты RTX 30-й серии имеют гораздо более высокие требования к мощности по сравнению с предыдущим поколением, а кулеры не являются оптимальными для конфигураций с несколькими графическими процессорами. Мы пока не знаем, что будет стабильным и надежным в долгосрочной перспективе, но нам, скорее всего, придется ждать выпуска карт с другим дизайном (системой охлаждения). Поэтому, пока мы рассматриваем производительность в Resolve с несколькими картами в этой статье, мы настоятельно рекомендуем подождать, пока наша квалификационная команда не определит, что будет стабильным и надежным в долгосрочной перспективе.
Одна вещь, которую вы можете заметить, заключается в том, что мы использовали только три графических процессора RTX 2080 Ti и RTX 3080, и только два графических процессора RTX 3090. Причина, по которой мы не тестируем четырехъядерные конфигурации GPU, заключается просто в том, что мы почти никогда не поставляли клиентам подобную конфигурацию.
Для RTX 3090 мы максимизировали только две карты, потому что карты RTX 3090 FE имеют трёхслотовую систему охлаждения, а это означает, что мы можем поместить только две из них в наши текущие платформы Threadripper. С некоторыми материнскими платами можно втиснуть три карты RTX 3090 в одну рабочую станцию, но это будет чрезвычайно трудно сделать - не говоря уже о том, что, вероятно, невозможно их будет охладить. Поэтому до тех пор, пока не появятся двухслотовые карты с прмым выбросом горячего воздуха из корпуса (это будет скорее всего профессиональная серия Quadro), мы должны придерживаться только двойной конфигурации RTX 3090 для этого тестирования.
Еще раз подчеркнем, что используемые нами графические процессоры не предназначены для использования таким образом. Это не должно сильно повлиять на наши результаты, но мы абсолютно не рекомендуем использовать эту настройку для вашей собственной рабочей станции.
Необработанные результаты бенчмарка. Скрин кликабельный.
Extended Overall Score. Масштабирование GPU в Resolve интересно посмотреть, потому что в приложении так много аспектов. Большая часть Resolve на самом деле не использует преимущества графического процессора, так как производительность при ряде аспектов работы почти всегда ограничена вашим процессором (CPU), а не графическим процессором (GPU). Поскольку наш бенчмарк рассматривает такой широкий спектр задач, с разными разрешениями, то общая оценка, и даже индивидуальные оценки 4K и 8K media - не так уж и увлекательны.
4K Media Score.
8K Media Score.
Fusion Score. На этой диаграмме видно, что производительность ухудшается, при использовании нескольких графических процессоров (Multi-GPU).
Поэтому, чтобы получить лучшее представление о максимальном преимуществе производительности от использования нескольких графических процессоров, мы должны сосредоточиться на части "GPU Effects" нашего бенчмарка, которая рассматривает такие задачи, как шумоподавление и различные ускоренные графические процессоры OpenFX.
GPU Effects Score.
Две видеокарты RTX 3090, легко обходят конфигурацию с трёмя видеокартами RTX 2080 Ti. Это делает две RTX 3090 не только более доступным (по цене $3000 за две RTX 3090 против $3600 за три 2080 Ti), но и даёт вам 24 ГБ полезной VRAM против 11 ГБ на картах RTX 2080 Ti. Нынешняя трехслотовая конструкция карт RTX 3090 FE действительно означает, что вам будет трудно установить карту ввода-вывода видео (карту захвата), которая является обязательным требованием для большинства профессиональных рабочих процессов, но так как мы никогда не будем рекомендуем использовать именно эти карты в этой конфигурации в первую очередь, то пропустим этот нюанс.
Двойные и тройные конфигурации RTX 3080 также работают хорошо, последовательно опережая то же самое количество карт RTX 2080 Ti на солидные 30%.
Главное, что нужно знать,- это то, что масштабирование с несколькими видеокартами (Multi-GPU) ничем не отличается от того, что происходит с картами RTX 20-й серии. Две карты примерно на 50% быстрее, чем одна карта, в то время как три карты примерно вдвое выше по производительности одной видеокарты. Если мы экстраполируем это для тех, кто хочет установить четырехъядерный графический процессор, четыре видеокарты должны быть примерно в 2,5 раза выше по производительности одной карты.
Опытные пользователи DaVinci Resolve Studio любят загружать свою рабочую станцию несколькими графическими процессорами, и делать это с новыми картами серии RTX 30 так же эффективно, как и с предыдущим поколением. Однако, хотя каждый добавляемый графический процессор может увеличить производительность Resolve примерно на 50% для каждой карты, имейте в виду, что мы настоятельно рекомендуем дождаться видеокарт с другой системой охлаждения.
*Масштабирование. Тестовая система: 10-ядерный процессор Intel Xeon W-2255, процессорный кулер: Noctua NH-U12DX i4, материнская плата: ASUS WS C422 SAGE/10G, 128Гб оперативной памяти DDR4-3200 16GB REG ECC (8х 16ГБ), видеокарты: четыре штуки Gigabyte RTX 3090 TURBO 24G, системный накопитель: Samsung 970 Pro 512GB, два блока питания EVGA SuperNOVA 1600W P2, версия операционной системы: Microsoft Windows 10 Pro 64-bit (2004).
Отсутствие масштабирования четвёртой видеокарты, может быть связано со слабым центральным процессором, так как бенчмарк DaVinci Resolve GPU Effects активно грузит и CPU (тем самым тестируется максимальная производительность):
Также данный бенчмарк в пике мог потреблять до 1.71кВт (или 1.58кВт при 92% эффективности), поэтому были проведены тесты с двумя 1.6кВт блоками питания EVGA SuperNOVA 1600W P2, чтобы выдаваемая мощность не была узким местом.