Home RADEON HD 4770, 4850, 4890 в исполнении HIS Cyberlink PowerDirector, NVIDIA CUDA и ATI Stream Обзор CrossFireX 2xRadeon HD 4770 512 Мбайт. Часть 2
RADEON HD 4770, 4850, 4890 в исполнении HIS
Опубликовано: 26 октября 2009, 08:19
Размер шрифта:
Итак сегодня вашему вниманию предлагаются три новые карты от HIS, все они объединены одним семейством iCooler (это новая марка, вероятно пойдет на замещение известной IceQ, хотя может быть обе линейки будут какое-то время выпускаться одновременно). По названию уже понятно, что эти карты имеют особенные системы охлаждения. Сразу же отмечу, что все три карты не имеют повышенных частот, поэтому ждать от них какой-то особенной, отличительной от номинальной производительности не стоит. Главная изюминка - карты снабжены особыми кулерами ну и имеют по три разных гнезда для вывода изображения (VGA, DVI и HDMI(.
Если кто не в курсе, то HIS это гонконгская компания, давно уже сотрудничающая с ATI (AMD) в плане выпуска видеокарт на графических процессорах марки ATI RADEON.
Платы
HIS RADEON HD 4770 iCooler III 512MB PCI-E
GPU: RADEON HD 4770 (RV740)
Интерфейс: PCI-Express x16
Частоты работы GPU (ROPs/Shaders): 750/750 MHz (номинал — 750/750 МГц)
Частоты работы памяти (физическая (эффективная)): 800 (3200) MHz (номинал — 800 (3200) МГц)
Ширина шины обмена с памятью: 128bit
Число вершинных процессоров: -
Число пиксельных процессоров: -
Число универсальных процессоров: 640
Число текстурных процессоров: 32 (BLF/TLF)
Число ROPs: 16
Размеры: 200x100x31 мм (последняя величина — максимальная толщина видеокарты).
Поддержка многопроцессорной работы: CrossFire (Hardware).
HIS RADEON HD 4770 iCooler III 512MB PCI-E
Карта имеет 512 МБ памяти GDDR5 SDRAM, размещенной в 8 микросхемах (по 4 на каждой стороне PCB).
Микросхемы памяти Qimonda (GDDR5). Микросхемы расчитаны на максимальную частоту работы в 1000 (4000) МГц.
HIS RADEON HD 4850 iCooler IV 1024MB PCI-E
Карта имеет 1024 МБ памяти GDDR3 SDRAM, размещенной в 8 микросхемах на лицевой стороне PCB.
Микросхемы памяти Qimonda (GDDR3). Микросхемы раcсчитаны на максимальную частоту работы в 1000 (2000) МГц.
HIS RADEON HD 4890 iCooler x4 1024MB PCI-E
Карта имеет 1024 МБ памяти GDDR5 SDRAM, размещенной в 8 микросхемах на лицевой стороне PCB
Микросхемы памяти Qimonda (GDDR5). Микросхемы рассчитаны на максимальную частоту работы в 1000 (4000) МГц.
Сравнение с эталонным дизайном, вид спереди
HIS RADEON HD 4890 iCooler x4 1024MB PCI-E
Reference card ATI RADEON HD 4890
HIS RADEON HD 4850 iCooler IV 1024MB PCI-E
Reference card ATI RADEON HD 4850
HIS RADEON HD 4770 iCooler III 512MB PCI-E
Reference card ATI RADEON HD 4770
Сравнение с эталонным дизайном, вид сзади
HIS RADEON HD 4890 iCooler x4 1024MB PCI-E
Reference card ATI RADEON HD 4890
HIS RADEON HD 4850 iCooler IV 1024MB PCI-E
Reference card ATI RADEON HD 4850
HIS RADEON HD 4770 iCooler III 512MB PCI-E
Reference card ATI RADEON HD 4770
Очевидно, что все три продукта выполнены на основе собственного дизайна инженеров HIS, хотя 4850 и 4890 очень близки к референсам, а вот 4770 кардинально отличается.
Подключение к аналоговым мониторам с d-Sub (VGA) производится через имеющиеся на всех картах гнезда. Также имеются гнезда HDMI (мы помним, что такие карты поддерживают полноценную передачу видео и звука на HDMI-приемник), поэтому проблем с такими мониторами также не должно быть. Однако в комплектах поставок нет обратных адаптеров HDMI-to-DVI , поэтому подключить два монитора через два DVI уже не получится.
Максимальные разрешения и частоты:
240 Hz Max Refresh Rate
2048 x 1536 x 32bit x85Hz Max - по аналоговому интерфейсу
2560 x 1600 @ 60Hz Max - по цифровому интерфейсу (все DVI-гнезда с Dual-Link)
Что касается возможностей видеокарт по проигрыванию MPEG2 (DVD-Video), то еще в 2002 году мы изучали этот вопрос , с тех пор мало что поменялось. В зависимости от фильма загрузка CPU при проигрывании на современных видеокартах не поднимается выше 25%.
По поводу HDTV. Одно из исследований также проведено, и с ним можно ознакомиться здесь .
Напомним, что все карты, требуют дополнительное питание, поэтому с каждой платой поставляются переходники с молекс на 6-пиновый разъем, хотя уже все современные БП имеют такие «хвосты». В комплекте с 4890 имеется и 8-пиновый соответствующий переходник.
Теперь о системах охлаждения.
HIS RADEON HD 4890 iCooler x4 1024MB PCI-E
Устройство охлаждает только ядро, микросхемы памяти без охлаждения. Кулер представляет собой большой массивный радиатор, на который тепло передается с помощью тепловых трубок. В центре радиатора есть вентилятор, работающий на малых оборотах и разгоняющий воздух в обе стороны, поэтому выбор теплого воздуха идет не только из корпуса, но и в сторону корзины с HDD, что не есть хорошо.
HIS RADEON HD 4850 iCooler IV 1024MB PCI-E
А это по принципу действия точно такой же кулер, но упрощен, нет тепловых трубок, да и размеры радиатора уменьшены. В центре также имеется большой вентилятор, плюс красивой формы пластиковый кожух, создающий внешний привлекательный вид.
Охлаждения микросхем памят также нет.
HIS RADEON HD 4770 iCooler III 512MB PCI-E
Аналогичная СО, просто иная форма радиатора, ну и дизайна в целом. А принцип действия тот же.
Все три кулера не регулируются, датчика оборотов не имеют (инженеры съэкономили).
Мы провели исследование температурного режима с помощью утилиты RivaTuner (автор А.Николайчук AKA Unwinder) и получили следующие результаты:
HIS RADEON HD 4890 iCooler x4 1024MB PCI-E
HIS RADEON HD 4850 iCooler IV 1024MB PCI-E
HIS RADEON HD 4770 iCooler III 512MB PCI-E
Ну мне сразу показалось, что предложенная HIS система охлаждения для 4890 явно не столь эффективна относительно референс (температура ядра практически та же самая, но зато нет охлаждения микросхем, а также нет возможности регулировать частотой вращения вентлятора). Вот кулер на 4850 - это другое дело, тут явно видна высокая его эффективность. Как и СО на 4770 показала себя хорошо.
Теперь о комплектации.
Базовый комплект поставки должен включать в себя: руководство пользователя, диск с драйверами и утилитами, HMDI-to-DVI адаптер, а также разветвитель внешнего питания. Ниже мы покажем, что предлагается к каждой карте дополнительно.
HIS RADEON HD 4770 iCooler III 512MB PCI-E HIS RADEON HD 4850 iCooler IV 1024MB PCI-E
Комплект поставки более беден, чем базовый: нет адаптера HMDI-to-DVI. Хотя имеется купон на скачивание и установку (с серийным номером) игры Stormrise. Надо отдельно отметить новый вид комплекта: руководство пользователя, диск и наклейка на корпус помещены теперь в специальный красивый конверт.
HIS RADEON HD 4890 iCooler x4 1024MB PCI-E
Аналогичный комплект с теми же минусами и плюсами.
Упаковки.
HIS RADEON HD 4770 iCooler III 512MB PCI-E
Компания кардинально изменила стиль и способ упаковки. Возможно что это касается только серии iCooler, а может быть и всех остальных продуктов. Коробки стали выполняться в более светлых и ярких тонах, что положительно сказывается на желании взять сие и потрогать. Внутри - фирменные боксы с логотипом, и весь комплект размещен в пластиковой фигурной коробке с отсеками. Потому карта надежно закреплена.
HIS RADEON HD 4850 iCooler IV 1024MB PCI-E
Точно такой же способ упаковки, никаких отличий от предыдущего нет, ну разве что надписи на коробке иные. :)
HIS RADEON HD 4890 iCooler x4 1024MB PCI-E
И в данном случае мы видим новый стиль упаковки, однако HIS традиционно экономит на толщине упаковки, и уже сколько лет все его Hi-End продукты выпускаются в коробках с выпуклыми стенками, поскольку ну банально не хватает толщины. Почему нельзя увеличить толщину коробки на 1-2 см. и не заставлять прикладывать силы при упаковки всего комплекта обратно в коробку - не знаю.
Установка и драйверы
Конфигурация тестового стенда:
Компьютер на базе Intel Core I7 CPU 920 (Socket 1366 LGA)
процессор Intel Core I7 CPU 920 (2667 MHz);
системная плата ASUS P6T Deluxe на чипсете Intel X58;
оперативная память 3 GB DDR3 SDRAM Corsair 1066MHz;
жесткий диск WD Caviar SE WD1600JD 160GB SATA.
блок питания Tagan TG900-BZ 900W.
операционная система Windows Vista 32bit SP1; DirectX 10.1;
монитор Dell 3007WFP (30").
драйверы ATI версии CATALYST 9.9; NVIDIA версии 191.00.
VSync отключен.
Результаты тестов: сравнение производительности
В качестве инструментария мы использовали:
Far Cry 2 (Ubisoft) — DirectX 10.0, shaders 4.0 (HDR), для тестирования использовалась утилита из комплекта игры (уровень Middle). Все настройки выставлены на максимальное качество.
S.T.A.L.K.E.R. Clear Sky 1.507 (GSC Game World/THQ) — DirectX 10.0, демо для запуска . Файлы надо положить в рабочий каталог игры, где все savegames (Documents and settings). После запуска игры, загрузить уровень ixbt4 и, выйдя в консоль, запустить демо: demo_play ixbt4. Настройки тестирования — maximum (ВКЛЮЧЕНО ДИНАМИЧЕСКОЕ ОСВЕЩЕНИЕ). Поэтому игра не поддерживает AA.
CRYSIS 1.2 (Crytek/EA), DirectX 10.0, shaders 4.0, ( батник и демо для запуска ), настройки тестирования - Very High, используется уровень RESCUE).
CRYSIS Warhead (Crytek/EA), DirectX 10.0, shaders 4.0, ( батник и демо для запуска ), настройки тестирования - Very High, используется уровень CARGO).
Company Of Heroes Opposing Fronts (Relic Entertainment/THQ) — DirectX 10.0, shaders 4.0, батник для запуска . После вхождения в игру вызвать опцию настроек, выбрать раздел по графике и нажать на кнопку с тестом. Тестирование проводилось при максимальном качестве.
World In Conflict 1.007 (Massive Entertainment/Sierra) — DirectX 10.0, shaders 4.0, После вхождения в игру вызвать опцию настроек, выбрать раздел по графике и нажать на кнопку с тестом. Тестирование проводилось при максимальном качестве (very high с регулировкой АА и АФ).
Devil May Cry 4 (CAPCOM) — DirectX 10.0, настройки тестирования — Super High (c регулировкой АА и АФ). Использовались результаты тестирования по Scene 1.
Lost Planet Extreme Condition Colonies Edition (CAPCOM) — DirectX 10.0, настройки тестирования — Super High (c регулировкой АА и АФ). Использовались результаты тестирования по Scene 1.
Внимание! Насчет набора тестовых инструментов!
В обновленном и дополненном материале , посвященном инструменту тестирования FRAPS, мы наглядно показали, как неточны и ненадежны тесты, полученные с помощью этой утилиты, а иного инструмента, кроме встроенных в игры бенчмарков, у тестеров и нет.
Поэтому мы считаем, что пусть набор тестовых игр будет не столь большим, но все тесты будут прозрачными, точными, и, главное, прекрасно отражающими картину соотношения ускорителей.
Производительность видеокарт
Важно! Придя к решению о самостоятельном выборе трехмерного ускорителя, то бишь видеокарты в своем компьютере, пользователь должен осознавать, что он меняет одну из основных составляющих работы его системного блока, которая может потребовать дополнительной настройки для лучшего быстродействия или включения ряда качественных функций. Это не конечный потребительский продукт, а лишь одно звено среди всех комплектующих компьютера. И поэтому пользователь должен понимать, что для получения наибольшей отдачи от новой видеокарты ему придется познать некоторые азы трехмерной графики. Да и графики в целом. Если он не хочет этим заниматься, то не стоит приступать к самостоятельному апгрейду в этом плане. Лучше приобретать готовые системные блоки с уже настроенным ПО (а также он будет обеспечен технической поддержкой со стороны компании-сборщика такого системника), либо приставки для игр, где не нужно ничего настраивать - все, что нужно, уже включено в самой игре.
Читатели, которые хорошо разбираются в трехмерной графике, смогут разобраться, посмотрев диаграммы далее, и сделают для себя вывод. А для новичков и тех, кто только-только занялся вопросом выбора видеокарты, мы сделаем некоторые пояснения.
Во-первых, есть смысл ознакомиться с нашими краткими справочниками по семействам современных видеокарт и процессоров, на основе которых они выпускаются. Следует отметить частоты работы, поддержку современных технологий (шейдеры), а также конвейерную архитектуру.
Справочник по ATI RADEON X1300-1600-1800-1900-х серий
Справочник по NVIDIA GeForce 7300-7600-7800-7900-х серий
Во-вторых, в разделе 3D-Video наш читатель, который только-только столкнулся с проблемой выбора видеокарты, и растерян, может ознакомиться как с азами трехмерной графики (все равно они понадобятся, ведь запуская игру, и входя в ее настройки, пользователь столкнется с такими понятиями, как текстуры, освещение и т.д.), так и с базовыми материалами по новым продуктам. Компаний, выпускающих ныне популярные графические процессоры, всего две: AMD (графикой занимается подразделение ATI) и NVIDIA (есть еще Matrox, S3, однако их доля в дискретной графике сегодня меньше 1%, и потому их можно не брать во внимание). Поэтому основная масса информации разбита именно на две части. Ежемесячно выходит 3DSpeed , где как бы сводятся в одно все сравнения различных карт для разных ценовых секторов.
В-третьих, посмотрим на тесты рассматриваемых сегодня карт. Анализ каждого теста проводить не будем, в конце тестов подведем итоги.
1. S.T.A.L.K.E.R. The Clear Sky
Все разрешения на одной странице, No AA, No AF
Разрешение 1280x1024
Разрешение 1680x1050
Разрешение 1920x1200
Разрешение 2560x1600
Все разрешения на одной странице, AA 4x + AF 16x
Разрешение 1280x1024, AA+AF
Разрешение 1680x1050, AA+AF
Разрешение 1920x1200, AA+AF
Разрешение 2560x1600, AA+AF
2. Far Cry 2
Все разрешения на одной странице, No AA, No AF
Разрешение 1280x1024
Разрешение 1680x1050
Разрешение 1920x1200
Разрешение 2560x1600
Все разрешения на одной странице, AA 4x + AF 16x
Разрешение 1280x1024, AA+AF
Разрешение 1680x1050, AA+AF
Разрешение 1920x1200, AA+AF
Разрешение 2560x1600, AA+AF
3. World In Conflict
Все разрешения на одной странице, No AA, No AF
Разрешение 1280x1024
Разрешение 1680x1050
Разрешение 1920x1200
Разрешение 2560x1600
Все разрешения на одной странице, AA 4x + AF 16x
Разрешение 1280x1024, AA+AF
Разрешение 1680x1050, AA+AF
Разрешение 1920x1200, AA+AF
Разрешение 2560x1600, AA+AF
4. CRYSIS, RESCUE
Все разрешения на одной странице, No AA, No AF
Разрешение 1280x1024
Разрешение 1680x1050
Разрешение 1920x1200
Разрешение 2560x1600
Все разрешения на одной странице, AA 4x + AF 16x
Разрешение 1280x1024, AA+AF
Разрешение 1680x1050, AA+AF
Разрешение 1920x1200, AA+AF
Разрешение 2560x1600, AA+AF
5. CRYSIS WARHEAD, CARGO
Все разрешения на одной странице, No AA, No AF
Разрешение 1280x1024
Разрешение 1680x1050
Разрешение 1920x1200
Разрешение 2560x1600
Все разрешения на одной странице, AA 4x + AF 16x
Разрешение 1280x1024, AA+AF
Разрешение 1680x1050, AA+AF
Разрешение 1920x1200, AA+AF
Разрешение 2560x1600, AA+AF
6. Company Of Heroes Opposing Fronts
Все разрешения на одной странице, No AA, No AF
Разрешение 1280x1024
Разрешение 1680x1050
Разрешение 1920x1200
Разрешение 2560x1600
Все разрешения на одной странице, AA 4x + AF 16x
Разрешение 1280x1024, AA+AF
Разрешение 1680x1050, AA+AF
Разрешение 1920x1200, AA+AF
Разрешение 2560x1600, AA+AF
7. 3DMark Vantage Graphics MARKS
Все разрешения на одной странице, No AA, No AF
Разрешение 1280x1024
Разрешение 1680x1050
Разрешение 1920x1200
Разрешение 2560x1600
Все разрешения на одной странице, AA 4x + AF 16x
Разрешение 1280x1024, AA+AF
Разрешение 1680x1050, AA+AF
Разрешение 1920x1200, AA+AF
Разрешение 2560x1600, AA+AF
8. Devil May Cry 4 (Scene 1)
Все разрешения на одной странице, No AA, No AF
Разрешение 1280x1024
Разрешение 1680x1050
Разрешение 1920x1200
Разрешение 2560x1600
Все разрешения на одной странице, AA 4x + AF 16x
Разрешение 1280x1024, AA+AF
Разрешение 1680x1050, AA+AF
Разрешение 1920x1200, AA+AF
Разрешение 2560x1600, AA+AF
9. Lost Planet Colonies Edition (Scene 1)
Все разрешения на одной странице, No AA, No AF
Разрешение 1280x1024
Разрешение 1680x1050
Разрешение 1920x1200
Разрешение 2560x1600
Все разрешения на одной странице, AA 4x + AF 16x
Разрешение 1280x1024, AA+AF
Разрешение 1680x1050, AA+AF
Разрешение 1920x1200, AA+AF
Разрешение 2560x1600, AA+AF
Выводы
HIS RADEON HD 4770 iCooler III 512MB PCI-E - очень интересный и крайне популярный продукт, однако уже снятый с производства, поэтому его изучение в данном обзоре было чисто академическим (если кому попадется в продаже, то смогут еще купить, хотя сейчас 4770 найти уже все сложнее и сложнее).
HIS RADEON HD 4850 iCooler IV 1024MB PCI-E - прекрасный продукт по своему соотношению цена-производительность, к тому же имеющий хороший плюс в плане СО, а также бонус в виде купона на современную игру (ее правда еще надо скачать из интернета). Минус у видеокарты - нельзя подключить два DVI-монитора.
HIS RADEON HD 4890 iCooler x4 1024MB PCI-E - интересный продукт, однако его СО могла бы быть и получше. Не вижу смысла менять кулер с референс на свой собственный, если второй работает менее эффективно, а также охлаждает только ядро. Минус тот же - можно подключать все три вида мониторов, но только по 1. Я лично не могу понять, зачем компании упорно стремятся разводить все три гнезда на видеокартах.. Для вывода на VGA-d-Sub мониторы есть адаптеры. Аналогичные есть и для вывода на HDMI. Зачем огород городить, когда имея два DVI вывода, можно получить всевозможные конфигурации? Ах, ну да. Экономия «на спичках».. то есть на адаптерах DVI-to-d-Sub и DVI-to-HDMI. Они же целый доллар стоят... Даже не смешно...
Вывод по линейке в целом. НА мой взгляд, ранее используемые кулеры от Arctic Cooling в линейке IceQ были куда более эффективными, чем нынешние. Компания снова упростила комплект до предела: дав красивую обертку от конфетки (красивый конверт) и не дав саму конфетку (не адаптеров и бонусов в виде полезных отверток, зато мало кому нужную игру дали).
Однако привлекательность с точки зрения внешнего вида стала намного выше. Вопрос: почему нкльзя было и упаковку улучшить, и сохранить полноценные комплекты (пусть без красивых конвертов)?
Выбор, как обычно, за нашими читателями. Мы лишь даем информацию о том или ином продукте, но не делаем прямых указаний по выбору того или иного изделия.
Может показаться, что в названии статьи присутствует некое противоречие. Что-то лишнее затесалось, да? Какое-то из слагаемых... но какое же? В отличие от технологии NVIDIA CUDA, архитектура ATI Stream освещается не в пример реже. Впрочем, расписывать особенности этой технологии нет особой нужды. Предназначение ATI Stream в точности то же самое, что и NVIDIA CUDA: перенос неграфических вычислений на графический процессор (GPU). Который, как известно, с развитием видеокарт "вдруг сделался" быстрее-выше-сильнее центрального процессора (CPU). Для того, чтобы такая технология заработала в привычных нам программах (а речь мы по традиции ведём о программах для обработки видео), разработчику такой программы следует всего лишь научить своё детище общаться на одном языке с графическим процессором. Кто и как это делает — совершенно иной разговор, касающийся нас, потенциальных потребителей, лишь вскользь. Всё, что нас волнует — это конечный результат, а не процесс.
Вот благодаря такому результату и родилась тема сегодняшней статьи. Мы не смогли пройти мимо описания новых возможностей знакомого нам видеоредактора — Cyberlink PowerDirector. Помимо совместной работы с NVIDIA CUDA, программа научилась понимать ATI Stream.
Мы не собираемся сталкивать лбами двух известных нам тяжеловесов в области видеотехнологий, отнюдь! Цель другая: попытаться выяснить, насколько тщательно проведена специалистами Cyberlink работа по "сращиванию" своего PowerDirector-а с двумя архитектурами: NVIDIA CUDA и ATI Stream. А работа проведена немалая: для того, чтобы программа заговорила с графическими процессорами на одном языке, одного лишь желания недостаточно.
Cyberlink PowerDirector
NVIDIA CUDA
ATI Stream
Тестирование
Выводы
Cyberlink PowerDirector
Ну кому из любителей не знаком этот ладно скроенный, с magic-ескими функциями, видеоредактор? Многие вещи делаются здесь буквально нажатием одной кнопки, машинных ресурсов при этом едва ли требуется больше, чем в любом другом видеоредакторе. А благодаря фирменной технологии Cyberlink RichVideo работа с большими проектами значительно облегчается (см. обзор Cyberlink PowerDirector 7).
Поддержка графических ускорителей в Cyberlink PowerDirector введена не вчера, а довольно давно. Однако наиболее благоприятный момент для изучения этой технологии — именно сейчас, когда программа умеет работать более чем с одним "брендом".
Пусть пользователя не сбивает с толку, что версия программы не меняется довольно длительное время, оставаясь всё той же "7 с хвостиком", а с заставки нам по-прежнему улыбается начинающий видеолюбитель с модной причёской "Good Morning!".
Но всё же, если вдуматься, то действительно: один только факт включения таких функций, как поддержка графических ускорителей, вполне является поводом для срочного приплюсовывания к текущей версии программы очередной единички. Ан нет, разработчик отчего-то не спешит, так и топчется вокруг версии 7.ххх — неужели готовит втихомолку ещё более полезные новшества?
NVIDIA CUDA
C установленной в системе видеокартой NVIDIA, поддерживающей архитектуру CUDA, окно "About", где обычно содержится информация о версии программы, украшено логотипом с надписью "DESIGNED FOR NVIDIA CUDA". Это означает, что Cyberlink PowerDirector распознал вашу видеокарту как годную к совместной работе.
Но заглянем в настройки программы. Оказывается, Cyberlink PowerDirector "дружит" с NVIDIA CUDA не только лишь во время завершающего этапа монтажа — кодирования, но также задействует данную технологию непосредственно при самом монтаже (и в самом деле, при установленном в настройках программы флажке многослойные композиции проигрываются в окне просмотра значительно увереннее, а переходы и вовсе перестают подтормаживать, даже если на таймлинии находится трудноредактируемое видео в "тяжёлом" формате).
Основное же предназначение интеграции программы с графическим ускорителем — это, конечно, кодирование. Но технология NVIDIA CUDA задействуется не всегда, а лишь при выборе наиболее требовательного к машинным ресурсам формата — конечно же, AVC.
Что же касается кодирования MPEG-2, тут CUDA ни сном, ни духом — если выбрать этот формат кодирования, то флажок, включающий графический ускоритель, оказывается неактивным. То есть, при кодировании в MPEG-2 работать будет только центральный процессор.
Спросим сами себя: почему мы вспомнили MPEG-2 и зачем вообще в него кодировать с помощью графического процессора, ведь упаковка в данный формат не так уж и трудоёмка? Хороший вопрос получился, но ответ на него будет ниже.
ATI Stream
Если в ПК установлена видеокарта AMD, поддерживающая технологию ATI Stream, то логотип в окне About сменяется на соответствующий имеющемуся видеоускорителю.
В настройках программы нас ожидает небольшое разочарование: программа не может задействовать данный видеоускоритель во время монтажа. По всей видимости, данная опция доступна (пока?) только с видеокартами NVIDIA.
При выборе предустановки AVC мы видим два вновь появившихся пункта: Video Preservation — High и Standard Definition. Как оказалось, технология ATI Stream задействуется только в том случае, если мы выберем одну из этих двух предустановок. Если же мы станем кодировать в один из "умолчальных" пресетов, то флажок Enable GPU Acceleration окажется неактивным. Таким образом, интеграция ATI Stream здесь организована посредством создания собственных предустановок кодирования.
А теперь ответим на вопрос об MPEG-2, заданный выше. Вот почему мы вспомнили об этом формате, не собирающемся пока сдавать позиции новому AVC: ATI Stream ускоряет кодирование в MPEG-2!
Насколько такая поддержка помогает ускорить кодирование в данный формат — покажет только проверка. К чему, собственно, пора уже и приступить.
Тестирование
Мудрить не станем, пойдём проторенной (и не раз затейливо обруганной читателем) дорожкой. В качестве исходного видео используем самые, пожалуй, распространённые сегодня форматы видео, которые по тем или иным причинам могут нуждаться в перекодировании:
AVCHD 1920x1080, снятый HD-видеокамерой (длительность 5 минут);
MPEG-2 720x576, длительность 7 мин 50 сек;
DV-AVI 720x576 длительностью 4 мин 50 сек.
Кодировать станем также в наиболее "злободневные" форматы:
AVCHD 1920x1080 (данный формат предназначается для дальнейшего авторинга Blu-ray диска);
AVC 720x576 (в такой формат мы будем кодировать не-HD видео, ну какой смысл из DV-AVI делать FullHD?);
MPEG-2 720x576 (готовый материал для авторинга DVD-Video диска);
MPEG4 AVC 320x240 (имеет условное название Portable, по всем параметрам подходит для просмотра на мобильном устройстве, к примеру, SONY PSP).
Характеристики тестового стенда:
центральный процессор: AMD Phenom II X4 810, 2600 MHz (13 x 200);
операционная система и установленные программы: 120 ГБ 7200 об/мин
исходное видео: 465 ГБ 7200 об/мин
результат просчёта: 320 ГБ 7200 об/мин
Операционная система Windows Vista SP1
Напоминаем: из-за отсутствия возможности ускорить на CUDA просчёт в MPEG-2, в диаграммах будут отсутствовать значения, касающиеся этого параметра. В этом случае сравнивать придётся скорость работы одного из графических процессоров только с CPU (что, в общем-то, и неплохо — меньше поводов для разжигания очередной священной войны "чей графический процессор быстрее?").
Исходное видео: AVCHD 1920x1080
Сделаем короткое лирическое отступление, предназначенное исключительно для ушей и глаз пользователя, который, как говорится, "не в теме". Обсуждая с коллегой очередные "железячные" проблемы, возникшие при тестировании, автор столкнулся с непониманием: коллега не мог представить себе, зачем перед кодированием в какой-либо формат программа еще и декодирует исходное видео? Ведь просмотра-де никакого не происходит, а декодирование — это же как раз задача плееров! Всё просто: любой кодировщик — это ещё и плеер, воспроизводящий видео. Только вместо того, чтобы выводить это видео на экран, программа-кодировщик пересчитывает материал и запаковывает видео в новый формат.
Формат AVC, как мы помним (и неоднократно с этим сталкивались), требует от центрального процессора чертовски много усилий, чтобы распаковать его. И, как бы ни были хороши технологии CUDA и Stream, распаковкой видео по-прежнему занимается центральный, но не графический, процессор. А вкупе с необходимостью дальнейшей подготовки кадра для передачи его графическому процессору для кодирования, усилия эти всегда выливаются в практически полную загрузку CPU, причём независимо от способа кодирования: посредством GPU или же CPU. А ну-ка, посмотрим, подтвердилась ли наша теория и в этот раз?
Поскольку результаты замеров приводятся в секундах, то, само собой, чем меньше секунд, тем результат лучше (попросту говоря, чем ниже столбик в диаграмме — тем выше скорость работы)
В первом случае, при кодировании в AVCHD 1920x1080, налицо ощутимое ускорение от использования GPU. При этом технология ATI Stream справилась с задачей чуть быстрее NVIDIA CUDA, однако, на фоне почти двукратного отрыва от центрального процессора, данный выигрыш незначителен. При кодировании в MPEG-2 один из участников турнира временно помещён на скамейку запасных — NVIDIA CUDA не ускоряет кодирование в MPEG-2. И мы видим причину: нет смысла ускорять то, что и без всякого ускорения практически достигло потолка. Примерно та же картина наблюдается на третьем "прогоне" — при кодировании в MPEG-4 Portable. Только, в отличие от второго теста, скамейку запасных занимает уже ATI Stream, который не желает ускорять и без того скоростную операцию. Что-ж, каждый прав по-своему...
Исходное видео: MPEG-2 720x576
Степень сжатия информации в MPEG-2 не так велика, как в AVC. Соответственно, и ресурсов для проигрывания требуется значительно меньше, просмотреть DVD-Video диск можно на любом маломощном ноутбуке. Помимо этого, MPEG-2 вот уже много лет занимает самое видное место на наших полках, и список программ, умеющих с ним работать (в том числе и без перекодирования) — просто огромен.
Сейчас мы увидим поистине странную, труднообъяснимую противоречивость. Разве может такое быть, чтобы графический процессор справлялся с кодированием медленнее, чем центральный?
Content on this page requires a newer version of Adobe Flash Player.
Оказывается, может. Чем же объяснить тот факт, что при кодировании в MPEG-2 ATI Stream оказался медленнее центрального процессора? Давайте попробуем разобраться. Всё выглядит так, словно графический процессор ATI не только кодирует, но и... декодирует видео! Ну а чем ещё можно объяснить такое отставание от центрального процессора? Ведь если бы ATI Stream занималась только кодированием, то справилась бы с этой задачей уж никак не медленнее центрального процессора. А здесь всё указывает на то, что работа построена по следующей цепочке: исходное видео поступает на GPU для декодирования, декодируется, после чего передаётся через связку память-центральный процессор опять же на графический, уже для кодирования.
Предел когда-то должен наступить. Похоже, здесь-то мы его и наблюдаем: мощный центральный процессор в одиночку работает быстрее, чем графический, обременённый множественными связями с тем же центральным. Для очистки совести данный тест был проведён на другом ПК, со средненьким центральным процессором (AMD Athlon 64 X2 4200+). После долгих процедур по установке видеокарт и нужного программного обеспечения все подозрения подтвердились:
Content on this page requires a newer version of Adobe Flash Player.
Ай, ну просто загляденье: теперь и в случае кодирования в MPEG-2 технология переноса вычислений даёт выигрыш! А всё отчего?
Как видим, работа центрального процессора замедлилась в среднем в два раза. Оно и понятно — два ядра против четырех скоростных! Обратим внимание также и на увеличение времени кодирования посредством GPU видеокарт. Нет, видеокарты медленнее работать не стали. Данное увеличение — всего лишь итог смены процессора на более слабый. В результате чего оба процессора (графический и центральный) просто стали медленнее обмениваться информацией!
Исходное видео: DV-AVI 720x576
Данный формат имеет ещё меньшее сжатие, чем MPEG-2. Поэтому не стоит удивляться, если мы вновь увидим нечто, похожее на предыдущий результат.
Content on this page requires a newer version of Adobe Flash Player.
Само собой, а что же мы хотели? Снова наблюдаем то же самое отставание графического процессора от центрального при кодировании в нересурсоёмкий формат!
Выводы
Что касается результатов тестирования, то не нужно делать скоропалительных выводов о ненужности технологий NVIDIA CUDA или ATI Stream. Да, в наших измерениях эти технологии не показывают тех сумасшедших ускорений, которыми иногда насыщены страницы официальных пресс-релизов.
Приходится согласиться: конфигурация нашего тестового стенда (ПК, на котором мы тренируемся в создании диаграмм) не является подходящей для получения очень уж оптимистичных результатов. То центральный процессор оказывается слишком мощным, то видеокарта требуется похилее (вспоминается притча о плохом танцоре). Вне всякого сомнения, десятикратное ускорение от использования ATI Stream или NVIDIA CUDA вполне реально получить. Вот только для этого придётся искусственно подобрать такие составляющие ПК, как скорость и количество ядер CPU, модель видеокарты, дисковую подсистему, количество оперативной памяти, операционную систему с установленным на ней ПО, формат исходного видео и, наконец, формат конечного сжатия. При достаточном умении жонглировать всеми этими параметрами вполне реально получение какого-то сногсшибательного результата (дурное дело всегда нехитрое). Впрочем, не исключена возможность и случайного совпадения, когда компьютер пользователя выдаст восхитительный результат. Для получения такого результата (но отнюдь не для повседневной работы) идеальным видится следующий расклад: слабый (но, опять же, до разумных пределов) центральный процессор, мощная видеокарта, скоростная дисковая подсистема, большое количество оперативной памяти, и — самое главное — исходное видео с небольшим размером кадра и запакованное каким-нибудь "лёгким" кодеком, желательно — DV, ну или, на худой конец, MPEG-2.
Напомним: данный материал не имел цели сравнивать какие-либо стороны двух разных, но вместе с тем похожих (по крайней мере по своему предназначению) технологий. Однако не следует думать, что такой важнейший аспект, как качество видео, не был затронут в статье по этой же причине. Так что же помешало сравнить это качество путём анализа кадров из видео, полученного кодированием на NVIDIA CUDA, и взятых из файлов, обработанных ATI Stream?
Помешали сами кадры. Дело в том, что с помощью пресетов, встроенных в Cyberlink PowerDirector, создаётся только интерлейсное видео, в то время как предустановка ATI Stream, называющаяся Video Preservation, создаёт прогрессивный кадр (сделаем оговорку: данная информация верна на сегодняшнюю дату; ближайшие обновления Cyberlink PowerDirector или драйверов ATI могут внести кардинальные изменения в данные предустановки).
И ещё одно важное замечание: всё тестирование проводилось под управлением Windows Vista, поскольку в Windows 7 технология ATI Stream в Cyberlink PowerDirector пока ещё не работает. Это не приговор, а опять же всего лишь состояние дел на момент написания статьи. Вне всякого сомнения, специалисты AMD уже вовсю заняты созданием драйверов к своим видеокартам, адаптированным под новую операционку.