Puget Systems опубликовала статью: Декодирование графическим процессором видео H.264/HEVC в Premiere Pro - это быстрее?
За последние 6 месяцев Adobe внесла ряд потрясающих улучшений в Premiere Pro для обработки носителей H.264 и H.265 (HEVC). Хотя это наиболее распространенные кодеки, используемые сегодня, они могут быть чрезвычайно трудны для обработки из-за природы внутрикадровых кодеков. Нормальное воспроизведение часто может быть приемлемым, но скраббинг, обратное воспроизведение, мультикамера и множество других задач могут быть почти непригодны, если ваш компьютер не имеет какого-то очень специфического оборудования.
В последнем обновлении Adobe Premiere Pro 2020 (v14.5) добавлено аппаратное декодирование с ускорением GPU для носителей H.264/HEVC (не путать с кодировкой GPU, которая добавлена в обновлении Adobe Premiere Pro 2020 (v14.2)). В предыдущих версиях аппаратное декодирование поддерживалось, но было доступно только при наличии процессора Intel с интегрированной видеокартой (iGPU) с поддержкой технологии Intel Quick Sync Video. Эта реализация работает очень хорошо, но быстрая синхронизация доступна только в семействах потребительских и мобильных процессоров Intel. Это означало, что высокопроизводительные системы Intel с процессорами X-серии или Xeon- а также все системы AMD - не имели возможности аппаратного декодирования, хотя эти системы часто значительно мощнее в целом.
Декодирование QSV по-прежнему доступно, если ваша система поддерживает его, но с добавлением декодирования GPU с использованием видеокарт AMD и NVIDIA почти каждый будет иметь доступ к технологии, которая значительно повысит производительность при работе с носителями H.264 и HEVC.
Тестовая Установка. Ниже перечислены технические характеристики систем, которые мы будем использовать для нашего тестирования:
10-ядерный процессор Intel Core i9-10900K, системная плата Gigabyte Z490 Vision D, кулер Noctua NH-U12S, 4x DDR4-2933 16GB (общий объём 64ГБ), 4x DDR4-2933 16GB (общий объём 64ГБ), системный накопитель Samsung 960 Pro 1TB, видеокарта NVIDIA GeForce RTX 3080.
12-ядерный процессор AMD Ryzen 9 3900X, системная плата Gigabyte X570 AORUS ULTRA, кулер Noctua NH-U12S, 4x DDR4-2933 16GB (общий объём 64ГБ), системный накопитель Samsung 960 Pro 1TB,видеокарта NVIDIA GeForce RTX 3080 10GB.
Софт: Microsoft Windows 10 Pro 64-разрядная (версия 2004), Adobe Premiere Pro (v14.3 & v14.5).
Чтобы увидеть, насколько хорошо работает аппаратное декодирование на основе GPU, мы будем использовать две разные тестовые системы - одну, которая поддерживает Intel Quick Sync, и другую, которая не поддерживает (на популярной платформе AMD Ryzen 3000). Это позволит нам увидеть, насколько хорошо работает новое декодирование GPU и получим возможность сравнить его с аппаратным декодированием с помощью Intel Quick Sync.
Для самого тестирования мы используем 4K H.264 и HEVC-носители со следующих девайсов: GoPro 7, iPhone 11 и DJI Mavic 2. Это устройства, которые часто являются источником носителей, которые дают плохую производительность в программах редактирования и должны дать нам отличный взгляд на то, насколько хорошо декодирование GPU работает для скраббинга, воспроизведения J/K/L (вперед и назад) и многокамерных последовательностей.
Одно большое различие между этим тестированием и нашим обычным заключается в том, что у нас нет никаких диаграмм или графиков. Многие задачи, которые мы тестируем, нелегко измерить с точки зрения чистого FPS, поэтому вместо этого мы решили записать на экран каждый набор тестов и скомпилировать их в серию видеороликов, показывающих производительность каждого режима декодирования бок о бок.
GoPro 7 - 4K 60mbps H.264/HEVC. Платформа Intel Core i9-10900K. Software, Quick Sync, & GPU Decoding:
Для GoPro Hero 7 мы решили посмотреть несколько тестовых роликов 4K 60mbps, записанных как в H.264, так и в HEVC. В видео выше мы показываем производительность между программным обеспечением и декодированием GPU, а также QSV декодирование в системе Intel. Сначала показываются кадры HEVC, а затем кадры H.264.
Начиная с производительности скраббинга, преимущество аппаратного декодирования (будь то GPU или QSV) сразу же становится очевидным. Там, где исходное окно очень изменчиво с программным декодированием, оно идеально гладко с аппаратным декодированием даже при скраббинге в довольно быстром темпе.
Если вы поклонник использования J/K/L (вперед, пауза, реверс) для редактирования, декодирование GPU также имеет некоторые большие преимущества. С процессорами, которые мы используем, прямое воспроизведение со скоростью до 2x может быть просто отлично с программным декодированием, но если вы хотите идти еще быстрее, вам действительно нужно аппаратное декодирование, чтобы сделать это. И если вы хотите иметь возможность воспроизводить этот тип кадров в обратном порядке... аппаратное декодирование является обязательным, если вы хотите, чтобы ваш таймлайн проигрывался плавно.
Наш последний тест состоял в том, чтобы посмотреть на производительность мультикамеры с 4, 9 и 12 потоками. Здесь основные преимущества декодирования GPU вступают в игру, как только у вас есть 9+ потоков, а именно тогда программное декодирование действительно начинает проваливаться на этих системах. Довольно интересно, какой тип аппаратного декодирования (GPU или Quick Sync) лучше в зависимости от того, использовали ли мы носители H.264 или HEVC. Декодирование GPU немного лучше с HEVC-носителями, а QSV лучше с H.264.
iPhone 11 - 4K VFR H.264/HEVC медиа. Платформа Intel Core i9-10900K. Software, Quick Sync, & GPU Decoding:
Использование смартфонов/айфонов для создания видеоконтента становится все более популярным по мере совершенствования встроенных камер, но при использовании чего-то вроде iPhone 11 возникает ряд проблем. Первая проблема заключается в том, что они записывают в двух форматах: H.264 и HEVC, и вдобавок ко всему они обычно также записывают видео с переменной частоте кадров (VFR). Это еще больше усложняет обработку видео, такими приложениями как Adobe Premiere Pro CC 2021, поэтому нам было очень интересно посмотреть, какие преимущества в производительности дает использование графического процессора для декодирования видеоматериалов с iPhone.
Опять же, начиная со скраббинга, программное декодирование здесь работает лучше, чем с носителями GoPro, но все равно значительно хуже, чем с графическим процессором (dGPU) или при использовании QSV декодирования.
Для редактирования J/K/L (вперед, пауза, реверс) 2x прямое воспроизведение отлично подходит со всеми вариантами декодирования, но когда мы поднялись до 4x, даже аппаратное декодирование несколько проваливается с этим VFR-носителем. С носителями HEVC декодирование GPU работает довольно хорошо и даже лучше, чем декодирование QSV, хотя оно всё ещё отбрасывает несколько кадров. Однако для H.264 ни графический процессор, ни QSV декодирование не способны воспроизводить отснятый материал с приемлемой частотой кадров.
Играя в обратном порядке, программное декодирование снова становится непригодным для использования. Аппаратное декодирование, с другой стороны, может воспроизводиться с полной частотой кадров в секунду вплоть до скорости 2x, хотя декодирование GPU действительно сбрасывает несколько больше кадров с клипами H.264 по сравнению с QSV.
Производительность мультикамеры с 4, 9 и 12 потоками очень интересна. Аппаратное декодирование значительно лучше программного, когда у вас есть 9 или более потоков, но между двумя аппаратными методами декодирования QSV была немного лучше с H.264 исходниками, в то время как декодирование GPU было лучше с клипами HEVC.
DJI Mavic 2 - 4K 100mbps H.264/HEVC медиа. Платформа Intel Core i9-10900K. Software, Quick Sync, & GPU Decoding:
Кадры с дронов печально известны тем, как трудно их обрабатывать, но по мере того, как цена на высококачественные дроны продолжает падать, их все чаще используют в проектах.
Для скраббинга производительность декодирования GPU - это то, что мы привыкли ожидать, и она значительно более плавная, чем декодирование программного обеспечения.
Редактирование J/K/L (вперед, пауза, реверс) также очень похоже на другие тесты, причем аппаратное декодирование становится гораздо более плавным, когда мы достигаем скорости 4x. Обратное воспроизведение снова непригодно для использования с программным декодированием, но более чем приемлемо при скорости до 2x в обратном направлении.
Для производительности multicam мы снова видим немного лучшую производительность от декодирования GPU с помощью HEVC-носителей, в то время как QSV немного лучше для H.264. Оба они отбрасывают гораздо меньше кадров, чем программное декодирование, когда мы получаем до 9 или 12 потоков, но это действительно продолжает тенденцию QSV, имеющей небольшое преимущество для H.264 и декодирования GPU для HEVC.
Насколько хорошо декодирование графического процессора H.264/HEVC работает в Premiere Pro?
В целом, новое аппаратное декодирование на основе GPU для носителей H.264/H.265 (HEVC) в Premiere Pro работает очень хорошо. Скраббинг значительно более плавный, и тот факт, что вы действительно можете воспроизводить эти кодеки в обратном порядке, не превращая их в слайд-шоу, просто потрясает. Не говоря уже о возможности работать с большим количеством потоков мультикамер, чем это возможно при программном декодировании.
В рамках нашего тестирования одной из вещей, на которые мы хотели обратить особое внимание, было то, как декодирование GPU сравнивается с декодированием Intel Quick Sync, которое уже давно является частью Premiere Pro. Хотя в некоторых ситуациях QSV действительно имела небольшое преимущество перед носителями H.264, декодирование GPU (на дискретных видеокартах) имело аналогичное преимущество для видеоматериалов HEVC. В конце концов, наш вывод заключается в том, что GPU и Quick Sync декодирование находятся в значительной степени на одном уровне друг с другом.
*Но, не забываем, что использовался новейший чип NVIDIA Ampere с новой версией аппаратного декодера NVIDIA NVDEC 5.0 (Gen5). В то время как за QSV выступала iGPU поколения Gen9.5. Как поведёт себя iGPU поколения Gen12 которая будет использоваться в процессорах 11-го поколения Intel Rocket Lake-S читаем здесь.
Также не стоит забывать: что Intel Xe (Gen11 & Gen12) пока единственная на рынке может аппаратно декодировать H.265 (HEVC) видео с цветовой субдискретизацией 4:2:2. Запись 10-битного HEVC 422 видео поддерживают следующие камеры: Panasonic LUMIX BGH1, Canon EOS R5, Canon EOS R6, Canon XF705, Canon EOS C70, Sony a7S III и т.д.
Теперь вы можете посмотреть на это и подумать: "если это не лучше, чем QSV, зачем беспокоиться?"
Причина, по которой это так важно, заключается в том, что QSV доступна только на некоторых процессорах Intel (в первую очередь с интегрированной графикой). Если вы хотите процессор Intel X-серии или Xeon, не говоря уже об одном из потрясающих процессоров Ryzen и Threadripper от AMD, вам в значительной степени придется смириться с тем, что вы получите значительно худшую производительность при работе с наиболее распространенными кодеками, используемыми сегодня.
С добавлением декодирования GPU вы больше не ограничены несколькими процессорами Intel среднего класса, которые поддерживают технологию QSV. Вы можете использовать процессор AMD Threadripper для повышения производительности при работе с кадрами R3D и по-прежнему получать преимущества аппаратного декодирования для носителей H.264 и HEVC.
Требования программы Adobe Premiere Pro 2021 к видеокарте.
Важность подбора графического драйвера.
Совместное использование двух и более видеокарт (iGPU+dGPU).
Как правильно включить работу связки интегрированная и дискретная видеокарты (iGPU+dGPU).
Аппаратное кодирование видео.
Тестирование видеокарты NVIDIA GeForce RTX 3060 Ti.
Тестирование видеокарты NVIDIA GeForce RTX 3070.
Тестирование видеокарты NVIDIA GeForce RTX 3080.
Тестирование видеокарты NVIDIA GeForce RTX 3090.