Bigfoot Networks Killer Xeno Pro: сетевая карта для хардкорных геймеров

  • Размер шрифта:

Игра на персональном компьютере отличается от игры на приставок в том, что хардкорному геймеру на ПК придётся потратить немало денег на качественное "железо". Буквально все комплектующие компьютера необходимо модернизировать, чтобы получить высокую частоту кадров. Процессор и видеокарта являются, без сомнения, ключевыми элементами, но память, материнская плата, жёсткие диски, оптический привод и даже монитор тоже требуют к себе внимания, чтобы вы получили плавную и комфортную игру.

Впрочем, даже хардкорные геймеры вряд ли хотят выбрасывать деньги на ветер. Поэтому когда некая компания начинает утверждать, что мы кое-что забыли в нашей гонке максимальных fps (и это кое-что стоит приличной суммы денег), то невольно возникают сомнения. Компания должна доказать, что покупка оправдывает себя. Если обещания подтверждаются на практике, тогда открывается новый рынок, собирается длинная очередь геймеров, желающих отдать последние деньги, чтобы их машина была ещё чуть ближе к идеалу.

Введение

Сегодня мы рассмотрим продукт, который пытается создать подобную нишу: сетевую карту Bigfoot Networks Killer Xeno Pro. Ставки высоки, поскольку если Bigfoot Networks не сможет доказать, что данный продукт просто необходим для хардкорных геймеров, то карту будут покупать только те пользователи, кому деньги девать некуда.

И начнём мы наш обзор с общего рассмотрения карты, комплекта поставки и функций.

Сетевая карта для геймера Killer Xeno Pro

Bigfoot Networks переняла опыт nVidia/ATI и планирует лицензировать Killer Xeno Pro другим производителям, которые будут изготавливать карту под своим именем. Мы получили тестовый образец Killer Xeno Pro от компании EVGA. На первый взгляд кажется, что в коробке находится обычная видеокарта.

Сетевая карта для геймера Killer Xeno Pro

В комплект поставки входит CD с драйвером, инструкция, внешний и внутренний звуковые кабели и, конечно, сетевая карта Killer Xeno Pro.

Сетевая карта для геймера Killer Xeno Pro

Сама карта удивительно компактная. У неё есть звуковой вход, звуковой выход, USB-порт и сетевой порт 8P8C. Во времена, когда высокопроизводительные видеокарты могут "съедать" довольно приличное пространство внутри корпуса, ориентация Killer Xeno Pro на геймеров заставляла нас ожидать что-то более солидное и крупное. На процессор нанесён приятный отражающий логотип Killer, но если вы любите всё яркое и светящееся, то Killer Xeno Ultra может предложить ещё больше: там присутствует светодиодный дисплей и украшение карты, напоминающее кинжал, а также 256 Мбайт памяти. Но поскольку наш тестовый образец - это модель Killer Xeno Pro, а не Ultra, то пришлось сконцентрироваться на базовых функциях.

Сетевая карта для геймера Killer Xeno Pro

Обратите внимание, что Killer Xeno Pro - это карта PCI Express (PCIe) x1, поэтому она будет работать в любом открытом слоте PCIe вплоть до x16. В этом, наверное, кроется основное отличие между Killer Xeno Pro и предшествующими моделями Bigfoot Killer NIC и Killer K1. Шина PCIe обеспечивает более высокую пропускную способность по сравнению со старой шиной PCI, но это вряд ли имеет значение в играх, поскольку ваше подключение к Интернету окажется "узким местом" задолго до шины PCI. Впрочем, подобный переход всё равно приятен, если у вас дома установлена гигабитная LAN, и вы не хотите, чтобы общая шина PCI ограничивала передачи больших файлов.

Сетевая карта для геймера Killer Xeno Pro

У карты также есть и порт USB. Когда мы спросили о его предназначении, представители Bigfoot Networks ответили, что USB-порт используется во время изготовления, но в будущем компания планирует подключать через него хранилище, которое будет обходить вашу систему и позволит скачивать файлы FTP или Torrent напрямую на него. Функция звучит приятно, но мы не очень уверены, какие преимущества данная функция даёт в реальности.

Если коснуться аппаратных спецификаций, то у карты есть встроенный 400-МГц процессор NPU (network processing unit) на основе PowerPC и 128 Мбайт памяти DDR2. В принципе, карта представляет собой компактную систему Linux. Есть встроенный звуковой контроллер, который может снимать нагрузку с CPU при голосовом общении во время игры.

Что же обещает всё это "железо"? Более плавную игру, ускорение сетевых операций, контроль пропускной способности, брандмауэр и поддержку BitTorrent без "лагов" - это лишь немногие возможности. Однако все эти функции довольно тесно связаны с программным обеспечением Killer Xeno Pro, поэтому давайте поговорим немного и о нём.

Программное обеспечение

Bigfoot Networks заявляет, что одно из самых главных преимуществ Killer Xeno Pro заключается в возможности обходить сетевой стек Windows, передавая сетевые пакеты напрямую в игру и из неё. По информации Bigfoot сетевой стек Windows оптимизирован под высокую пропускную способность, а не под низкие сетевые задержки, поэтому обход стека позволяет сделать сетевую игру более отзывчивой. Компания обещает серьёзные преимущества при использовании карты Killer Xeno Pro, такие как 24% увеличение частоты кадров при игре в Team Fortress 2 и 10% увеличение частоты кадров в World of Warcraft. Обещают и 38% улучшение времени отклика при скачивании файлов и потоковом вещании интернет-видео во время игры в World of Warcraft. Для сетевой карты звучит фантастически, поэтому заявления явно нуждаются в проверке.

Программное обеспечение в комплекте поставки включает настройки оптимизации обработки пакетов и настройки ограничения пропускной способности для всех сетевых приложений, которые определяет программа. Она автоматически пытается определить, является ли приложение игрой, и если да, то обеспечивает игре приоритет в сетевых операциях. Все эти функции позволяют Killer Xeno Pro дать играм приоритет над другими приложениями, и в этом и должна заключаться реальная сила Killer Xeno Pro, поскольку вы сможете одновременно скачивать файлы и играть без ущерба играм.

Наконец, будущей функцией Killer является аппаратный брандмауэр, но он ещё не совсем готов. Bigfoot Networks планирует летом представить соответствующее обновление, которое можно будет скачать.

Установка

Установка карты очень простая - просто найдите свободный слот PCIe. Но с программным обеспечением ситуация чуть сложнее.

Мы тестировали Killer Xeno Pro под 64-битной операционной системой Windows Vista, и кроме драйвера на CD нам пришлось скачать hotfix с сайта Bigfoot Networks. Мы установили программное обеспечение, после чего всё было готово к работе. По крайней мере, нам так казалось.

Установка

Установка

Установка

Установка

Установка

Установка

Первые тесты показали, что функция управления пропускной способностью (Bandwidth Control) у Killer Xeno Pro не работала. Разные настройки пропускной способности не сказывались как-либо на скорости скачивания через Internet Explorer и uTorrent, поэтому мы решили найти ошибку вместе с персоналом поддержки Bigfoot Networks. В итоге, хотя карта аппаратно работала совершенно исправно, мы не смогли заставить работать функцию управления пропускной способностью на двух раздельных тестовых системах.

Killer Xeno Pro

Представители компании сообщили нам, что раньше такое не случалось, поэтому мы получили второй экземпляр сетевой карты и попробовали его, но с прежним результатом. Мы попытались протестировать карту на третьей тестовой системе, но получили такой же результат. Функция управления пропускной способностью Bandwidth Control работала в Firefox, но отказывалась работать в uTorrent. Обратите внимание на скриншот ниже, где мы выставили во время тестов ограничение пропускной способности 16 кбит/с. При этом 16 килобит/с - это примерно 2 килобайта в секунду, так что браузер Firefox правильно снижал скорость. Но программа uTorrent по прежнему сообщала финальную скорость скачивания около 100 кбайт/с.

Killer Xeno Pro

Результат не идеален, но мы протестировали Killer Xeno Pro в реальном окружении, включая функцию управления пропускной способностью Bandwidth Control.

Голосовой чат с аппаратным ускорением

Как мы уже упомянули, у сетевой карыты Killer Xeno Pro есть возможность переносить обработку звука на собственный аудиоконтроллер и NPU, снимая нагрузку с CPU. Чтобы использовать эту функцию нужно подключать микрофон к карте Killer Xeno Pro, после чего пропускать канал микрофона через линейный вход компьютера. Это можно сделать с помощью внутреннего или внешнего аудиокабелей, которые входят в комплект поставки.

Голосовой чат с аппаратным ускорением

Работает ли обработка звука? Да, приложение в комплекте поставки Xeno Chat вполне нормально заработало в паре с Mumble, бесплатной утилитой голосового общения с открытым исходным кодом. Данная функция будет более впечатляющей после поддержки приложения Teamspeak 2 (Bigfoot Networks обещает поддержку в будущем на своём сайте), поскольку Teamspeak 2 - намного более популярная утилита.

Killer Xeno Pro

Впрочем, даже программная версия Mumble показывала 0% загруженности CPU на нашей тестовой системе, так что мы не знаем, какое реальное ускорение даст использование для чата сетевой карты.

В любом случае позвольте перейти к тестам ключевых функций Killer Xeno Pro в играх.

Тестовая конфигурация

Тестировать сетевую производительность довольно сложно, но мы всё же попытаемся провести тесты сетевых игр в реальных условиях. Это означает связь через Интернет, "отпадание" соперников, лаги на серверах и все сопутствующие особенности.

Мы протестируем две многопользовательские игры. Мы взяли Team Fortress 2 в качестве многопользовательского шутера от первого лица (fps), а World of Warcraft представляла онлайновую многопользовательскую ролевую игру (MMORPG).

Bigfoot Networks порекомендовала провести 30-минутный тест при каждой настройке и замерять задержки каждую минуту. Поскольку за 30 минут на игровом сервере может измениться многое, мы решили провести три чередующихся 10-минутных прогона, чтобы минимизировать влияния изменений на сервере. Например, мы тестировали встроенную сетевую карту 10 минут, затем Killer Xeno Pro 10 минут, затем снова встроенную карту 10 минут и так далее, пока не провели все прогоны.

Хотя длительный 30-минутный прогон даст достаточно информации для анализа, следует отметить, что нельзя провести два идентичных теста, поскольку в каждом прогоне происходит много изменений.

Мы выделили две основные категории тестов: без нагрузки ("No Load"), когда только тестируемая игра использовала сетевые ресурсы, и под нагрузкой ("Load"), когда мы скачивали два крупных образа ISO Ubuntu в Firefox. В последнем сценарии мы ограничивали пропускную способность Killer Xeno Pro для Firefox на уровне 256 кбит/с.

Тесты проводились как с интегрированной сетевой картой материнской платы, так и с Killer Xeno Pro. В тесте нагрузки мы проверили и третий вариант: использование интегрированной сетевой карты с бесплатным плагином ограничения пропускной способности Firefox Throttle, который будет ограничивать скачивания Firefox подобно программному обеспечению Killer Xeno Pro. Мы выставили плагин Firefox Throttle на такой же уровень ограничений 256 кбит/с для скачиваний Firefox.

Ниже проведена конфигурация тестовой системы.

Тестовая система Killer Xeno Pro
CPU AMD Phenom II X4 955 Black Edition (3,2 ГГц, FSB-200), кэш 6 Мбайт, разгон до 3,6 ГГц FSB225, 2022 МГц HyperTransport
Материнская плата Gigabyte GA-MA790XT-UD4P, BIOS F4a, AMD790X
Сеть Встроенный контроллер LAN 1 Гбит/с
Память Kingston HyperX 9905403-048.A00LF PC3-10700, 2x 2048 Мбайт, 1498 МГц, CAS 9-9-9-24 2T
Видеокарта 2 x HIS Radeon HD 4890 в режиме CrossFire, 850 МГц GPU, 2200 МГц память, 1 Гбайт на карту
Жёсткий диск Seagate Barracuda ST31500341AS, 1,5 Тбайт, 7200 об/мин, кэш 16 Мбайт, SATA 3.0 Гбит/с
Блок питания Corsair CMPSU-650TX, 650 Вт, ATX 12V 2.2
Программное обеспечение и драйверы
Операционная система Microsoft Windows Vista 64-bit 6.0.6001, SP1
Версия DirectX DirectX 10
Графический драйвер Catalyst 9.5

Тесты и настройки

World of Warcraft Version: 3.1.3, 1920x1200, Visual Effects at Maximum, Shadows at Maximum -1, Vsync off
Team Fortress 2 Build: 3862, 1920x1200, video settings at maximum, 4xAA, 16xAF

Результаты тестов

Сетевые игры без дополнительной нагрузки

Сначала давайте посмотрим, что случится, если мы будем запускать только игры без другой сетевой нагрузки в фоне.

Сетевые игры без дополнительной нагрузки
Задержки (мс), меньше - лучше.

Удивительно, но мы получили практически идентичные результаты по задержкам и частоте кадров. Технология Killer Xeno Pro по обходу сетевого стека Windows не уменьшает задержки, если в фоне не работают другие приложения, потребляющие пропускную способность.

Сетевые игры без дополнительной нагрузки
Частота кадров в секунду (fps), больше - лучше.

Результаты частоты кадров близки, но Killer Xeno Pro проигрывает в тесте TF2 и выигрывает в тесте WoW. Помните, что подобные сценарии не очень хорошо подходят для измерения частоты кадров, поскольку нельзя провести два теста с идентичной "картинкой". В целом, мы не наблюдаем существенного различия по производительности, а разницу можно списать на погрешности, которые в данном сценарии весьма велики.

Что касается субъективных впечатлений, то мы не заметили какой-либо разницы между Killer Xeno Pro и встроенной сетевой картой по плавности игры и ощущениям.

Сетевые игры с нагрузкой

С тестом без нагрузки наша система справилась хорошо, но сейчас мы попытаемся скачать два крупных файла .iso в фоне, используя браузер Firefox. Программное обеспечение Killer Xeno Pro попытается определить приоритеты сетевого трафика и ограничить пропускную способность для скачиваний Firefox, что позволит получить в играх меньшие задержки.

Мы также протестируем бесплатный плагин Firefox Throttle и оценим, даёт ли он какие-либо преимущества по сравнению с интегрированной сетевой картой. Мы выставили ограничение по пропускной способности Killer Xeno Pro для скачиваний Firefox на уровне 128 кбит/с, а также указали такой же уровень в плагине Firefox Throttle.

Сетевые игры с нагрузкой
Задержки (мс), меньше - лучше.

В данной ситуации, когда во время игры происходит параллельное скачивание файлов, встроенная сетевая карта демонстрирует существенное падение по производительности по сравнению с Killer Xeno Pro.

Впрочем, если использовать бесплатный плагин Firefox Throttle, то интегрированная сетевая карта даёт производительность, практически идентичную Killer Xeno Pro.

Перейдём к частоте кадров.

Сетевые игры с нагрузкой
Частота кадров в секунду (fps), больше - лучше.

Здесь Killer Xeno Pro демонстрирует значимое преимущество по сравнению с интегрированной сетевой карты, но бесплатный плагин Firefox Throttle позволяет интегрированному решению оставаться на конкурентоспособном уровне. Несмотря на существенную погрешность в тестах карту Killer Xeno Pro можно признать победителем. Но достаточна ли такая победа, чтобы оправдать цену сетевой карты по сравнению с бесплатным плагином для браузера?

В наших субъективных тестах мы не заметили какой-либо разницы между Killer Xeno Pro и интегрированной сетевой картой с активным и неактивным плагином Firefox.

Взгляд с другой перспективы

Нам нравится работать с передовым "железом", которое обеспечивает высокую производительность, но в ряде случаев нужно проводить не совсем привычные тесты. Мы пригласили за тестовый стенд одного из наших редакторов, давнего любителя World of Warcraft, с которым он познакомился ещё в бета-версии.

Лечение в WoW

Сегодня в WoW играют 12 миллионов геймеров по всему миру.

Лечение в WoW

Некоторым геймерам WoW нравится играть несколькими персонажами и выполнять квесты, собираться группами по пять/десять человек, сражаться с другими геймерами (PvP) и т.д. Для нас самое интересное WoW начинается в конце. Когда вы поднимаете уровни, выполняете квесты и сражаетесь, то игра довольно расслабленная, всё идёт как по расписанию. Но в конце игры монстры становятся сильнее, атмосфера накаляется, а найденные вещи становятся интереснее. Если вы доберётесь до этого момента, то игра станет более жёсткой. И ваши напарники вряд ли будут рады, если ваш персонаж не будет вовремя выполнять нужные действия из-за лагов.

Лечение в WoW
"Диспетчер устройств/Device Manager" до установки драйверов. Сетевая карта распознаётся как процессор PowerPC.


Лечение в WoW
"Диспетчер устройств/Device Manager" с распознанным устройством.

Наш редактор играл паладином-лекарем на довольно быстром компьютере с выделенной линией в Интернет. Ближе к концу игры доли секунды могут определить, выживает ли ваш "танк" или умрёт из-за комбинаций действий врагов. Чтобы играть как можно эффективнее лекари должны знать о собственных задержках и творить заклинания с их учётом (даже до того, как предыдущий "каст" будет засчитан). Магам необходимо творить повреждающие заклинания тоже с учётом задержек, чтобы максимизировать DPS.

Лечение в WoW
Информация о состоянии Blizzard предоставляет значения задержек и частоты кадров.

На первом скриншоте можно видеть задержку 60 мс при игре через встроенный контроллер 1 Гбит/с.

Лечение в WoW
Заклинание лечения - обратите внимание на индикатор кастинга в верхнем левом углу.

На втором скриншоте показан процесс кастинга с соответствующей полоской-индикатором, становящейся красным при отмене каста. Если вы начнёте каст, когда полоска станет красной, то начнёте его сразу же, когда сервер Blizzard зарегистрирует результаты последнего каста. Если же вы будете ждать доли секунды, когда игровой клиент покажет завершение каста, то получите небольшую задержку между заклинаниями лечения - а она может привести к фатальным последствиям.

Если Xeno Pro сможет снизить задержки в игре, то будет более тесное совпадение между игровыми событиями клиента и их регистрацией на сервере Blizzard. Это будет действительно хорошей новостью для опытных поклонников игры, которые наверняка выложат за карту свои кровные деньги.

Во время игры мы обычно не качаем файлы через торрент в фоне, а также не выполняем сканирование системы на вирусы. Как правило, на компьютере запущен WoW, а в фоне работает только Ventrillo. Ваш сценарий, конечно, может отличаться. И если вам нравится играть параллельно со скачиванием больших файлов, то будем надеяться, что мы никогда не будем играть в одной команде, поскольку утомляет постоянно ждать какого-либо игрока из-за лагов.

Лечение в WoW
С картой Xeno Pro разница невелика.


Лечение в WoW
Схожая задержка приводит к схожей стратегии лечения.

Мы загрузили Ventrillo, загрузили игру, после чего направили персонажа в Icecrown для проведения тестов лечения. Задержки во время тестов естественно менялись, мы замерили задержки между 20 и 90 мс, при этом средняя задержка составила 60 мс. Мы не обнаружили каких-либо улучшений после установки сетевой карты Xeno Pro, стратегия лечения так и не изменилась.

В итоге, как считает наш любитель WoW, вложить $130 в графическую подсистему будет выгоднее, если ваш сценарий игры похож на протестированный.

Заключение

Результаты тестов так и не показали какого-либо преимущества по производительности сетевой карты Killer Xeno Pro по сравнению с интегрированным вариантом на 1 Гбит/с. Если вы пропустили статью и перешли сразу к заключению, то вывод будет простой: карта Killer Xeno Pro за $130 показала результаты, сравнимые с бесплатным плагином Firefox, причём только в тесте с фоновой сетевой нагрузкой. В игровых тестах, где мы не очень сильно нагружали сеть множественными скачиваниями, мы не заметили существенной разницы в задержках или преимущества по частоте кадров при сравнении сетевой карты Killer Xeno Pro и интегрированного гигабитного решения.

Заключение

Честно говоря, если у вас возникают проблемы с задержками в играх во время скачивания торрентов, файлов через FTP или при потоковом интернет-вещании, то лучше просто выключать подобные приложения прежде чем переходить к игре. Тогда игра будет идти более плавно и с меньшими задержками.

Если же вы жить не можете без скачивания торрентов во время игры, то у uTorrent уже есть встроенная функция ограничения пропускной способности. Что касается Firefox, то даже там есть специальный плагин для ограничения пропускной способности, который, как мы продемонстрировали, ведёт себя ничуть не хуже, чем сетевая карта Killer Xeno Pro.

Действительно, есть немало других более эффективных способов потратить $130 для улучшения качества и производительности в играх. Как насчёт беспроводного маршрутизатора с гигабитными проводными портами и встроенным движком QoS, который может самостоятельно повышать приоритет игровому трафику? Вы не только получите приоритет игр в вашей сети, но и сможете в полной мере насладиться гигабитными сетевым портами и беспроводной сетью. Если же отойти от темы сети, то как насчёт видеокарты Radeon HD 4850?

Проблема для энтузиастов в том, что Killer Zeno Pro обладает весьма впечатляющими спецификациями, поэтому потенциал у неё наверняка есть. Как мы уже упоминали, перед нами система на основе Linux с 400-МГц процессором и 128 Мбайт памяти на карте. Но впечатляющая производительность и длинный список функций не всегда дают прирост скорости в реальных условиях. Карта не обеспечила нам очень низких сетевых задержек по сравнению с менее дорогими решениями (например, бесплатным плагином Firefox), настройкой клиента torrent или просто выключением всех скачиваний перед игрой. Поэтому мы не видим причин, по которым стали бы рекомендовать Killer Xeno Pro для хардкорных геймеров.




RSS лента ВСЕГО блога с комментариями RSS лента ВСЕГО блога БЕЗ комментариев RSS лента этой КАТЕГОРИИ с комментариями RSS лента этой КАТЕГОРИИ и БЕЗ комментариев RSS лента ЭТОГО ПОСТА с комментариями к нему

Тесты Core 2 при различных частотах FSB и памяти DDR2/DDR3

  • Размер шрифта:

Хотя процессоры Core i7 с интегрированным контроллером памяти уже анонсированы и доступны в магазинах, их присутствие на рынке остается и будет оставаться незначительным (по прогнозам самой же Intel), до выхода i5 еще есть время, так что пока сборщики будут продолжать готовить системы на базе процессоров предыдущей микроархитектуры. И конечно, задача оптимального подбора конфигурации при этом сохранит свою актуальность в применении к системам на базе Core 2. В данной статье мы в очередной раз рассмотрим несколько вариантов конфигураций памяти, чтобы понять, насколько быстрая и какого типа она нужна, чтобы раскрыть потенциал самых быстрых процессоров, но не переплачивать при этом понапрасну.

Вопрос о переплате абсолютно уместен, так как только «обычные» производители (вроде, скажем, Samsung и Hynix) продают соответствующие стандартам JEDEC модули, в характеристиках которых и указать-то нечего, кроме максимальной частоты, на которой они могут работать. Зато производители «элитной» памяти (Corsair, OCZ, GeIL и пр.) легко перекрывают заданные стандартом потолки и по частотам, и по напряжению питания (как правило, конечно, одновременно), за что вполне резонно хотят получить дополнительных денег. Более того, многие варианты платформ под процессоры Intel предполагают использование DDR3, а эта память, помимо того, что все еще дороже, чем DDR2, также провоцирует покупку «элитных» модулей, только теперь с совсем уж запредельными скоростными характеристиками. Кстати, такая память скорее всего не будет иметь перспектив при апгрейде, так как для процессоров на базе Nehalem есть официальная рекомендация производителя не поднимать напряжение модулей DDR3 выше 1,65 В.

Для исследования мы возьмем системные платы на двух топовых чипсетах: Intel X48 и NVIDIA nForce 790i Ultra SLI. Оба они обеспечивают максимальные возможные конфигурации для Core 2: полноценную поддержку PCI Express 2.0, поддержку всех стандартов памяти DDR3 (по крайней мере, при использовании модулей с расширением SPD — EPP 2.0 или XMP), поддержку частоты процессорной шины 400(1600) МГц. Сразу возникает вопрос: насколько актуальна последняя характеристика для обычных покупателей с учетом того факта, что до сих пор с частотой FSB 1600 МГц выпущен один-единственный процессор? Ответ: действительно, неактуальна, но исследование этого режима поможет нам выстроить более ясную общую картину, а кроме того, такой режим можно рассматривать как частный случай разгона, чтобы делать прикидки, какой памятью следует запасаться при желании разогнать процессор.

Исследование производительности

Тестовый стенд:

Программное обеспечение:

Предваряя тестирование

Оба примененных чипсета, как уже было сказано выше, рассчитаны на память типа DDR3. К счастью, на базе чипсета Intel выпущено достаточное количество системных плат, предполагающих использование DDR2 или комбинированных, как примененная нами модель MSI.

Какие же конфигурации мы будем проверять? Здесь надо сделать традиционное вынужденное отступление и пояснить, что скорости операций с памятью ограничены собственно частотой и таймингами работы памяти, а также характеристиками процессорной шины, поскольку именно ее пропускная способность может лимитировать максимальную скорость перекачки данных из памяти и обратно. Действительно, начиная с момента использования двухканального доступа к DDR, пропускная способность памяти не уступает ПС системной шины, а со времен внедрения DDR2 — и значительно превосходит ее (для частоты FSB 1066 МГц, например, ПС шины составляет ~8533 МБ/с, что соответствует ПС двухканальной DDR2-533).

Но достаточно ли будет установить в плату два модуля DDR2-533 одновременно с процессором с FSB 1066 МГц? Однозначности ответа мешает еще как минимум такой параметр, как тайминги памяти. Из общих соображений понятно, что чем выше частота работы микросхемы памяти, тем больше должны быть относительные (выраженные в количестве тактов) задержки доступа к ней (просто потому, что время такта сократится). Однако на практике иногда, с одной стороны, удается обеспечить сохранение таймингов при повышении частоты (за счет того, что абсолютная задержка доступа может точнее уложиться в заданное количество тактов), а с другой стороны, в зависимости от организации микросхем и прочих параметров, при снижении частоты относительная задержка уже не может быть уменьшена, так как достигла предела рабочих характеристик. Таким образом, скажем, система с FSB 1066 МГц и двумя модулями DDR2-533, работающими при CL=4, должна, по идее, показать производительность чуть ниже, чем та же система с двумя модулями DDR2-667, работающими при той же задержке CL=4.

В нашем исследовании мы постарались обеспечить некоторое сочетание различных частот FSB, а также частоты и таймингов памяти, дополняя или проверяя результаты на двух чипсетах.

Результаты тестов при FSB 1066 МГц

Первым установим на тестовые стенды процессор с частотой FSB 1066 МГц. Как мы уже указали выше, с точки зрения величины пропускной способности при этой частоте шины достаточно использовать двухканальную DDR2-533. Впрочем, мы не включили в тестирование такую конфигурацию памяти, потому что DDR2-533 на рынке уже практически не представлена, так что ее цена неадекватна ситуации. Модули DDR2-667 и DDR2-800 представлены гораздо шире, но нельзя уверенно сказать, что между ними есть определенная разница по цене. Тем не менее, конфигурацию с двухканальной DDR2-667 мы все-таки рассмотрим — хотя бы из исследовательского интереса.

Мы уже отмечали в прошлых статьях, что при работе в равных режимах чипсет NVIDIA немного опережает решения Intel, а в синтетических тестах это иногда бывает заметно особенно хорошо. Также DDR3 в нынешних системах, как правило, немного медленнее, чем DDR2 (при использовании одинаковых скоростных режимов и таймингов). В дальнейшем не будем уделять внимания этим вопросам, если только разница не проявится в интересующем нас аспекте сравнения конфигураций памяти.

Традиционно начнем с низкоуровневого исследования потенциала памяти при помощи разработанного нашими программистами теста RightMark Memory Analyzer.

По данной диаграмме хорошо заметно, что скорость системы растет во всех случаях при увеличении частоты памяти до 1066 МГц, даже если это сопровождается повышением таймингов — иногда явно непропорциональным (например, абсолютные величины задержек доступа у DDR3-1066@7-7-7-20-1T гораздо хуже, чем у DDR3-800@5-5-5-16-1T). И лишь повышение частоты памяти до 1333 МГц ничего не дает (или, по крайней мере, перекрывается эффектом от повышения таймингов на шаг).

Картина при изучении скорости записи в память абсолютно соответствует описанной в предыдущем случае.

Неудивительно, что и тест латентности чтения из памяти демонстрирует те же соотношения, хотя в данном случае DDR3-1333 все-таки сумела чуть обойти DDR3-1066 по времени случайного доступа.

Теперь проверим, не изменится ли картина при многопоточном доступе в память: возможно, два ядра в конкурирующем режиме сумеют более эффективно использовать пропускную способность шины? Для этой цели используем тест RMMT (RightMark Multi-Threaded Memory Test) из пакета RMMA. (Для операций каждому потоку выделим по 32 МБ, дистанцию предвыборки данных будем подбирать индивидуально, чтобы максимизировать результат.)



Очевидно, что величина цифр несколько изменилась (многопоточное чтение идет чуть быстрее, многопоточная запись — чуть медленнее), однако взаимное расположение участников — нет.

Что ж, теперь проверим полученные данные на паре реальных приложений, а заодно оценим разницу в актуальных величинах.

Вооруженные результатами синтетических тестов, мы и не ожидали иного расклада. Производительность при архивировании (группа реальных тестов, наиболее сильно зависящих от скорости подсистемы памяти) действительно увеличивается с поднятием частоты памяти до 1066 МГц, даже при непропорциональном увеличении таймингов. В то же время, использование DDR3-1333 видимых дивидендов не приносит, хотя практически не снижает производительность, если тайминги при этом не слишком «задираются».

Производительность в играх подчиняется тем же закономерностям — по крайней мере, в тех игровых режимах, где скорость ограничена именно процессором и памятью, а не видеокартой.

Посмотрим на абсолютные величины выигрыша. В 7-Zip применение наиболее быстрой (де-факто) конфигурации на Intel X48 (DDR2-1066@5-5-5-16-2T) ускоряет систему с FSB 1066 МГц на 6,5% относительно базовой (DDR2-667@4-4-4-12-2T). Это не так уж мало: разница примерно соответствует 0,5 множителя частоты процессора, то есть при прочих равных такое ускорение обеспечивает ту же разницу, что и покупка процессора на одну модель старше. В Doom 3 аналогичный эффект равен и вовсе +8,3%. Главный же вывод из данной группы тестов: применение более скоростной памяти, вопреки чисто теоретическим выкладкам, обеспечивает ускорение системы вплоть до применения DDR2/DDR3-1066. Случайно ли, что максимальная эффективная частота памяти совпадает с частотой FSB? Попробуем найти ответ в следующих разделах.

Результаты тестов при FSB 1333 МГц

Теперь установим на тестовые стенды процессор с частотой FSB 1333 МГц. Опять-таки, с точки зрения величины пропускной способности при этой частоте шины достаточно использовать двухканальную DDR2-667. Поскольку штатные варианты DDR2 не могут даже приблизиться к этой частоте FSB, сосредоточимся мы на DDR3.

Скорость чтения из памяти по-прежнему уверенно растет при повышении частоты ее работы вплоть до 1333 МГц, даже в тех случаях, когда тайминги повышаются непропорционально (CL7 у DDR3-1333 в сравнении с CL5 у DDR3-1066). А вот частота памяти 1600 МГц прироста производительности не дает, и снижение абсолютной величины таймингов не помогает.

Впрочем, по скорости записи в память сравнительные результаты получаются чуть иными, но лишь в последнем пункте: здесь есть прирост и от повышения частоты памяти до 1600 МГц.

Результаты теста латентности чтения ближе к теоретическим выкладкам по подсчету таймингов: здесь выигрыш имеют те режимы, которые обеспечивают меньшие значения таймингов в абсолютных величинах. В итоге память с большей частотой всегда выигрывает но лишь поскольку (и насколько) имеет тайминги пониже.



Многопоточное чтение по-прежнему идет чуть быстрее, а многопоточная запись — чуть медленнее, а результаты в той же степени соответствуют результатам при однопоточном доступе в память.



Вряд ли кого-нибудь удивит практическое подтверждение синтетических тестов; по большому счету, интрига заключалась только в вопросе, сумеет ли DDR3-1600 при более низких таймингах опередить DDR3-1333. Практика деликатно уклонилась от прямого ответа на этот вопрос, предоставив нам самостоятельно оценивать статистическую погрешность тестирования. Что ж вполне можно признать эти режимы равными по скорости.

Теперь конкретные цифры разницы в реальных приложениях. 7-Zip уверенно отдает предпочтение чипсету NVIDIA, так что у нас есть два варианта сравнения: Intel X48 с DDR3 в лучшем случае выигрывает около 5,5% относительно режима с DDR2-667@4-4-4-12-2T, а NVIDIA nForce 790i Ultra — примерно столько же, но в сравнении с самым медленным режимом DDR3. Если бы мы рассматривали неофициальные скоростные вариации DDR2 (а производители такие модули предлагают), то, очевидно, могли бы получить и больший прирост на Intel X48, так как DDR2 на нем работает быстрее, а частота памяти задается независимо от ее типа. В случае Doom 3 максимальный прирост (из возможных штатных) на X48 составил почти 7%, у чипсета NVIDIA он скромнее, но и минимальный режим более скоростной.

В этом разделе тестов мы подтверждаем вывод о пользе применения более скоростной памяти, и лишь верхнюю границу однозначно определить затрудняемся: 1333 МГц достаточно, но хоть падения скорости от покупки DDR3-1600 с нормальными таймингами можно не ожидать.

Результаты тестов при FSB 1600 МГц

Наконец, настал черед единственного в своем роде процессора с частотой FSB 1600 МГц. Штатные возможности контроллера памяти в чипсете Intel не дадут нам создать здесь достаточно интересную непрерывную цепь показателей, так что воспользуемся по полной программе гибкостью контроллера памяти у NVIDIA nForce 790i Ultra. Вообще, такая частота FSB ограничивает минимальную частоту памяти на уровне 1066 МГц (только в случае контроллеров Intel, конечно), то есть штатные модули DDR2 здесь использовать невозможно. Это означает, что наше сравнение из практической плоскости «оправдана ли покупка нестандартной, более дорогой памяти?» переходит в чисто теоретическое «какая нестандартная память лучше?». Впрочем, не будем забывать и о DDR3 — там эти частоты вполне стандартны.

Что ж, вполне привычная по предыдущим частям сравнения картина: скорость чтения из памяти растет при повышении частоты ее работы вплоть до 1600 МГц, но не дальше, и, опять же, увеличение таймингов не нарушает эту закономерность.

Та же картина и при записи, только здесь еще более подчеркнута бесполезность и даже вредность DDR3-1800.

Впрочем, DDR3-1800 берет реванш в тесте латентности чтения: как ни крути, а абсолютные величины таймингов в этом режиме ниже.

Как мы помним по результатам первого тестирования процессора QX9770 с двухканальной DDR2-800, максимальная скорость многопоточного чтения достигается при конкурентной работе двух потоков, выполняющихся на физически разных ядрах, а максимальная скорость многопоточной записи — при конкурентной работе двух потоков, выполняющихся на ядрах, относящихся к физически единому ядру (разделяющих общий кэш L2). Дополнив прежнюю конфигурацию тестовых стендов чипсетом NVIDIA и куда более скоростными модулями памяти, мы получили следующие интересные наблюдения:

  1. на NVIDIA nForce 790i Ultra SLI скорость чтения практически одинакова при работе двух потоков, выполняющихся на физически разных ядрах и на ядрах, относящихся к физически единому ядру (а четырехпоточное чтение существенно медленнее);
  2. скорость чтения с предвыборкой происходит на NVIDIA nForce 790i Ultra SLI существенно быстрее в случае чтения в два потока с ядер, относящихся к физически единому ядру (а четырехпоточный вариант вновь заметно медленнее остальных);
  3. зато максимальная скорость записи на NVIDIA nForce 790i Ultra SLI выше именно при работе двух потоков на физически разных ядрах, запись в 4 потока занимает промежуточное положение по скорости.

Для наших целей возьмем именно максимальные показатели, полученные, таким образом, при немного отличающихся условиях тестирования многопоточных чтения и записи.



В случае чипсета Intel преимущества от использования DDR3-1600 очевидны; у чипсета NVIDIA разница между разными режимами отнюдь не так впечатляет, но общий итог прежний: более быстрая (но не быстрее FSB) память дает некоторый выигрыш в скорости.



Тем важнее практическая проверка, и ее результаты не столь оптимистичны: различия между режимами с памятью разной частоты укладываются в 2-3%, что вряд ли можно считать серьезным стимулом для покупки топовых модулей памяти.

Таким образом, «полусинтетический» раздел тестов позволил нам подтвердить вывод о принципиальной пользе применения более скоростной памяти, с небольшим максимумом в районе DDR3-1600, но реально измеримого превосходства в производительности относительно базовой DDR3-1066 можно не ждать. Еще раз напомним, что этот вывод относится не только к крайне немногочисленным обладателям QX9770, но и ко всем оверклокерам, серьезно увеличивающим частоту FSB для разгона процессора.

Выводы

Здесь нам остается только свести воедино результаты, полученные при тестировании в трех группах конфигураций, и соотнести их с изначальным вопросом статьи.

Итак, в случае распространенных процессоров семейства Core 2 с частотой FSB 1066/1333 МГц, вопреки чисто теоретическим выкладкам, имеет некоторый смысл использовать двухканальную память, существенно превосходящую по пропускной способности штатную системную шину. Если взять за опорную точку конфигурацию с DDR2-667 (как наиболее дешевый из реально представленных на рынке вариантов), то применением быстрой DDR2 или DDR3 можно выиграть 6-7-8% в реальных приложениях. Еще раз повторим, что это не так уж мало: разница примерно соответствует 0,5 множителя частоты процессора, то есть при прочих равных такое ускорение обеспечивает ту же разницу, что и покупка процессора на одну модель старше. Но, конечно, на ускорение в разы рассчитывать не стóит.

Память при этом оптимально подбирать такую, которая способна работать «псевдосинхронно» с FSB (их опорные частоты должны совпадать), не слишком задирая при этом тайминги (в абсолютных величинах, конечно). Будет ли такая покупка оправдана по большому счету? Почти всегда нет, так как разница в стоимости модулей «оверклокерской» и «обычной» памяти легко может составлять несколько раз (давая выигрыш, напомним, на 6–8%) — хотя вывод, безусловно, будет зависеть и от стоимости системы в сборе. Однако будут и ситуации, когда такая покупка явится наиболее рациональным способом улучшения системы — например, при намерении купить топовый или околотоповый процессор в линейке.

Сделанные выводы останутся справедливыми и для варианта разгона процессора, но тогда платы на наиболее популярных чипсетах (Intel) просто физически не позволят использовать память с низкой частотой работы, а значит, опорная точка в любом случае сместится в сторону более дорогих и производительных модулей. В итоге выигрыш от применения, скажем, DDR3-1600/1800 будет существенно меньше (в районе 2-3%), хотя и разница в цене модулей памяти несколько нивелируется.






RSS лента ВСЕГО блога с комментариями RSS лента ВСЕГО блога БЕЗ комментариев RSS лента этой КАТЕГОРИИ с комментариями RSS лента этой КАТЕГОРИИ и БЕЗ комментариев RSS лента ЭТОГО ПОСТА с комментариями к нему

Прыг: 21 22 23 24 25 26 27 28 29 30
Скок: 10 20 30

Рейтинг популярности - на эти заметки чаще всего ссылаются:


Система авторегистрации в каталогах, статьи про раскрутку сайтов, web дизайн, flash, photoshop, 
        хостинг, рассылки; форум, баннерная сеть, каталог сайтов, услуги продвижения и рекламы сайтов

Самые Главные

Анонсы статей:

Оглавление категорий:

   Сервисы :


 
сентябрь, 2010
пн вт ср чт пт сб вс
    1 2 3 4 5
6 7 8 9 10 11 12
13 14 15 16 17 18 19
20 21 22 23 24 25 26
27 28 29 30      


Компьютерный мир

На верх страницы .
Created in 0,03153 seconds Copyright © 2009 Компьютерный мир Design by Amalgams