Модули памяти Chaintech Apogee GT DDR2-1100 (PC2-8800)

  • Размер шрифта:

Высокочастотная память стандарта DDR2 уже давно выпускается фактически всеми основными производителями памяти. Ранее такая память была адресована лишь любителям разгона, но с выходом процессоров AMD Phenom, официально поддерживающих память DDR2-1066, получает прописку и на «штатной основе». Пока довольно ограниченную, но по мере расширения линейки Phenom, роста частоты и т.п., очевидно, что среди покупателей таких процессоров окажется немало желающих использовать возможности интегрированного контроллера памяти в полной мере, тем более что, как показывают наши исследования, в случае с AMD-платформой, игра стоит свеч.

Наиболее ходовым объемом памяти, на который разумно ориентироваться, собирая домашний (да и «служебный») компьютер, на сегодня является 2 ГБ. Двухканальный комплект памяти от Chaintech именно такого объема, мы сейчас и рассмотрим. Как и все представители серии Apogee GT, модули снабжены радиаторами с характерной гребенкой, напоминающей запатентованную систему охлаждения Corsair DHX, однако радиаторы в данном случае отводят тепло только от чипов памяти, дополнительного контакта с печатной платой не обеспечивается. Впрочем на протяжении всего тестирования модули оставались чуть теплыми, чему способствовал стандартный «коробочный» кулер на процессоре. Радиатор на нем ориентирован перпендикулярно слотам памяти, что способствует обдуву модулей памяти.

Информация о производителе модуля

Производитель модуля: Walton Chaintech Corporation
Производитель микросхем модуля: неизвестен
Сайт производителя модуля: Walton Chaintech

Внешний вид модуля

Part Number модуля

Руководство по расшифровке Part Number модулей памяти на сайте производителя отсутствует. Есть лишь краткое описание на сайте. Apogee GT DDR2-1100 представляет собой комплект из двух модулей объемом 1024 KБ каждый, основанных на 16 микросхемах в FBGA-упаковке с конфигурацией 64M x 8. Производитель гарантирует стабильную работу модулей в режиме DDR2-800 при таймингах 5-5-5-15 и питающем напряжении 1,8 В, а также DDR2-1100 с аналогичными таймингами и напряжении 2,3 В. В микросхеме SPD в качестве режима по умолчанию выбран режим DDR2-800 со схемой таймингов 5-5-5-15 и напряжением питания 1,8 В.

Данные микросхемы SPD модуля

Описание общего стандарта SPD:

Описание специфического стандарта SPD для DDR2:


Параметр Байт Значение Расшифровка
Фундаментальный тип памяти 2 08h DDR2 SDRAM
Общее количество адресных линий строки модуля 3 0Eh 14 (RA0-RA13)
Общее количество адресных линий столбца модуля 4 0Ah 10 (CA0-CA9)
Общее количество физических банков модуля памяти 5 60h 2 физических банка
Внешняя шина данных модуля памяти 6 40h 64 бит
Уровень питающего напряжения 8 05h SSTL 1.8V
Минимальная длительность периода синхросигнала (tCK) при максимальной задержке CAS# (CL X) 9 25h 2.50 нс (400 МГц)
Тип конфигурации модуля 11 00h Non-ECC
Тип и способ регенерации данных 12 82h 7.8125 мс — 0.5x сокращенная саморегенерация
Ширина внешнего интерфейса шины данных (тип организации) используемых микросхем памяти 13 08h x8
Ширина внешнего интерфейса шины данных (тип организации) используемых микросхем памяти ECC-модуля 14 00h Не определено
Длительность передаваемых пакетов (BL) 16 0Ch BL = 4, 8
Количество логических банков каждой микросхемы в модуле 17 04h 4
Поддерживаемые длительности задержки CAS# (CL) 18 30h CL = 5, 4
Минимальная длительность периода синхросигнала (tCK) при уменьшенной задержке CAS# (CL X-1) 23 3Dh 3.75 нс (266.7 МГц)
Минимальная длительность периода синхросигнала (tCK) при уменьшенной задержке CAS# (CL X-2) 25 50h 5.00 нс (200.0 МГц)
Минимальное время подзарядки данных в строке (tRP) 27 32h 12.5 нс
5, CL = 5
3.33, CL = 4
Минимальная задержка между активизацией соседних строк (tRRD) 28 1Eh 7.5 нс
3, CL = 5
2, CL = 4
Минимальная задержка между RAS# и CAS# (tRCD) 29 32h 12.5 нс
5, CL = 5
3.33, CL = 4
Минимальная длительность импульса сигнала RAS# (tRAS) 30 25h 37.0 нс
15, CL = 5
10, CL = 4
Емкость одного физического банка модуля памяти 31 80h 512 МБ
Период восстановления после записи (tWR) 36 3Ch 15.0 нс
6, CL = 5
4, CL = 4
Внутренняя задержка между командами WRITE и READ (tWTR) 37 1Eh 7.5 нс
3, CL = 5
2, CL = 4
Внутренняя задержка между командами READ и PRECHARGE (tRTP) 38 1Eh 7.5 нс
3, CL = 5
2, CL = 4
Минимальное время цикла строки (tRC) 41, 40 39h, 30h 57.5 нс
23, CL = 5
15.3, CL = 4
Период между командами саморегенерации (tRFC) 42, 40 69h, 30h 105.0 нс
42, CL = 5
28, CL = 4
Максимальная длительность периода синхросигнала (tCKmax) 43 80h 8.0 нс
Номер ревизии SPD 62 12h Ревизия 1.2
Контрольная сумма байт 0-62 63 D3h 76 (верно)
Идентификационный код производителя по JEDEC 64-71 00h, 00h Не определено
Part Number модуля 73-90 AU1G08E32-1G6P501
Дата изготовления модуля 93-94 07h, 14h 2007 год, 20 неделя
Серийный номер модуля 95-98 00h, 00h,
00h, 00h
Не определено

В SPD поддерживаются два значения задержки сигнала CAS# — 5 и 4. Первому (CL X = 5) соответствует режим функционирования DDR2-800 (время цикла 2.5 нс, частота 400 МГц) со схемой таймингов 5-5-5-15 (ровно), второму значению задержки сигнала CAS# (CL X-1 = 4) соответствует режим DDR2-533 (время цикла 3.75 нс, частота 266.7 МГц) с нестандартной схемой таймингов 4-3,3-3,3-10.

В очередной раз для модулей Chaintech довольно странно отсутствие достаточно распространенного режима DDR2-667, тем более, что вручную установить такой режим с типичной схемой таймингов 4-4-4-12 на стандартном напряжении не составило труда.

Номер ревизии SPD и контрольная сумма указаны верно, идентификационный код производителя и серийный номер модуля отсутствуют, а Part Number модуля не полностью соответствуют указанному на самих модулях.

Поддержка расширений SPD стандарта EPP в рассматриваемых модулях не предусмотрена, несмотря на заявленную поддержку частоты вплоть до DDR2-1100 со схемой таймингов 5-5-5-15 и напряжении 2,3 В.

Конфигурация тестового стенда

Результаты исследования

Мы протестировали модули в стандартном режиме (как DDR2-800) с основной схемой таймингов и напряжении 1,8 В. Затем установили делитель в значение соответствующее DDR2-1066, на что BIOS отреагировал установкой таймнгов 5-7-7-25, которые и решено было считать стандартными (вернее автоматически выбранными) для данного режима. Надо отметить, что память в таком режиме стабильно функционировала при относительно низком для такой частоты напряжении (1,95 В), соответственно, увеличивая напряжение, мы легко смогли вернуть тайминги к значению 5-5-5-15, однако дальнейшие попытки снизить тайминги, не выходя за пределы относительно безопасных 2,3 В, приводили к самопроизвольным перезапускам в тестах.

Следующим этапом тестирования была проверка работоспособности в, заявленном для модулей, режиме DDR2-1100 с таймингами 5-5-5-15 и напряжении 2,3 В. Для того чтобы получить такую частоту, пришлось немного разогнать процессор, однако система сохраняла стабильность без повышения каких-либо напряжений (за исключением напряжения на памяти, естественно). Дальнейший разгон потребовал смягчить тайминги, а полная стабильность сохранялась вплоть до частоты соответствующей DDR2-1150. Напряжение на процессоре, разогнанном до 2592 МГц было повышено всего на 0,1 В, и запас по наращиванию частоты оставался, то есть формально можно считать, что память не дотянула до разгонного потенциала процессора. Точнее удовлетворила бы запросы «неэкстремальных» разгонщиков, стремящихся оставаться в рамках штатного напряжения процессора, поскольку для дальнейшего разгона требовалось более существенно повышать напряжение на процессоре.

Все результаты получены в режиме с выключенным TLB-патчем (в BIOS от ASUS эта строчка называется CPU Tweak), поскольку, как уже отмечалось, применение патча серьезно снижает производительность, в то время как ни одного приложения или каких-то типичных условий, в которых бы проявлялась пресловутая «ошибка», до сих пор, не выявлено. Подчеркнем, что память как в режиме DDR2-800, так и DDR2-1066, работает именно на таких частотах на любом из процессоров Phenom (тогда как в случае с Athlon 64 X2 реальное значение частоты может отличаться в большую или меньшую сторону, поскольку частота памяти задается делителем от частоты процессора и не для каждой частоты есть соответствующий делитель). Реализовано это за счет фиксированной частоты контроллера памяти, которая, также как и частота ядер, может устанавливаться независимо. Так для существующих на сегодня процессоров Phenom, по умолчанию, частота контроллера памяти одинакова и равна 2 ГГц (множитель 10), в BIOS соответствующий пункт, как правило, связывается с частотой северного моста.

  Chaintech Apogee GT DDR2-1100
Частота памяти, МГц
(DDR2 МГц)
400
(800)
533
(1066)
551
(1102)
575
(1150)
Частота контроллера памяти в процессоре, МГц
(DDR2 МГц)
2000 (200x10) 2000 (200x10) 2070 (207x10) 2160 (216x10)
Частота ядер процессора, МГц
(частота FSB x FID)
2400
(200x12)
2400
(200x12)
2484
(207x12)
2592
(216x12)
Тайминги памяти по умолчанию, напряжение 5-5-5-15-2T,
1,8 В
5-7-7-25-2T,
1,95 В
5-5-5-15-2T,
2,3 В
5-7-7-25-2T,
2,3 В
Минимальные тайминги памяти, напряжение (не изучалось) 5-5-5-15-2T,
вплоть до 2,3 В
(не изучалось) (не изучалось)
Средняя ПСП на чтение (МБ/с),
1 ядро
5456 6495 6983 7208
Средняя ПСП на запись (МБ/с),
1 ядро
2702 3281 3775 3912
Макс. ПСП на чтение (МБ/с),
1 ядро
5934 7472 8153 8424
Макс. ПСП на запись (МБ/с),
1 ядро
6192 5887 5119 5366
Средняя ПСП на чтение (МБ/с),
4 ядра
10460 11228 11531 12110
Средняя ПСП на запись (МБ/с),
4 ядра
3448 3534 3735 3810
Макс. ПСП на чтение (w/PF, МБ/с),
4 ядра
10816 11096 11407 11976
Макс. ПСП на запись (NT, МБ/с),
4 ядра
6305 6305 6505 6786
Минимальная латентность псевдослучайного доступа, нс 38,3 34,0 30,5 29,5
Минимальная латентность случайного доступа*, нс 92,7 85,8 75,4 75,9

*размер блока 32 МБ

Результаты демонстрируют стабильный рост показателей по мере увеличения частоты, причем даже в случае «чистого» увеличения частоты памяти (собственно переходу от DDR2-800 к DDR2-1066, не сопровождающегося увеличением частоты процессора), наблюдается очевидный рост реальной пропускной способности памяти и снижение латентности. Соответственно, покупка высокочастотной памяти может быть оправдана с практической точки зрения. Забавный сюрприз приподносит лишь тестирование скорости записи, точнее максимальная ПСП в режиме одноядерного доступа. Логическое объяснение такому разбросу результатов подобрать сложно, впрочем и повода для беспокойства нет, ведь средняя ПСП стабильно растет, причем опять же пропорционально росту частоты самой памяти, что гораздо важнее с точки зрения влияния на производительность в реальных программах. Тогда как пиковые значения — это чистая синтетика, которая представляет интерес для теоретических исследований архитектуры.

Надо упомянуть еще один практический нюанс. В тестированиях мы пользуемся ganged (объединенным) режимом работы контроллера памяти в процессорах Phenom, который обеспечивает более высокие результаты в режиме одноядерного доступа, а значит и в задачах, где критическим является скорость исполнения какого-то одного основного потока. Но для компьютеров, на которых запускаются многопоточные приложения с равным приоритетом, лучше использовать режим unganged.

Итоги

Комплект модулей памяти Chaintech Apogee GT DDR2-1100 (PC2-8800) выглядит неплохим выбором для неэкстремально разогнанной системы на процессоре AMD Phenom. Как показывает практика, частота 2,6 ГГц как раз и является массово достижимой для процессоров на степпинге B2, тогда как для дальнейшего разгона требуется значительное повышения напряжений, да и степень удачности конкретного экземпляра играет не последнюю роль. Впрочем, такая оценка намекает и на то, что цены на такие модули должны быть исключительно практичными, иначе потребитель скорее обратится к продукции Corsair, Kingston и прочих грандов, в чьих линейках есть немало DDR2-модулей с куда более высокой максимальной частотой.




RSS лента ВСЕГО блога с комментариями RSS лента ВСЕГО блога БЕЗ комментариев RSS лента этой КАТЕГОРИИ с комментариями RSS лента этой КАТЕГОРИИ и БЕЗ комментариев RSS лента ЭТОГО ПОСТА с комментариями к нему

Phenom II и DDR3

  • Размер шрифта:

Говорят, что если собрать целый стадион людей и попросить всех одновременно загадать одинаковое желание, то оно непременно исполнится. Например, если все дружно начнут медитировать на фотографию какого-то дерева в лесу, представляя, что оно горит, то это самое дерево действительно может загореться. Не беремся утверждать, имеет ли этот психологический эксперимент что-то общее с действительностью, просто не проводили такого тестирования :) Однако, если представить: сколько обозревателей и интересующихся пользователей в разное время говорили о бесполезности перехода с DDR2 на DDR3, то теперь новому типу памяти, действительно, должно быть непросто оправдать свое существование, даже если какие-то предпосылки с технической точки зрения и начинают появляться. И мы, вполне отдавая себе отчет, что какого-то качественного скачка производительности, особенно в случае близких по частоте модулей, ожидать не приходится, решили провести полноценное тестирование.

Теория, между тем, содержит два аргумента в актив и одно — в пассив DDR3 (разумеется, не с точки зрения выбора системы охлаждения, тут у DDR3 есть преимущество в сниженном напряжении, и, как следствие, меньшем тепловыделении на равных частотах с DDR2, и, как минимум, не худших экономических показателях при сравнении реальных экземпляров одного класса, скажем, DDR2-1066 с DDR3-1600 или DDR2-667 с DDR3-1066 и т.п.). Положительные свойства касаются, во-первых, более высокой частоты, нежели доступная в стандарте DDR2, и, во-вторых, даже если пренебречь стандартом, и обратить внимание на частоты оверклокерских модулей, очевидно, что DDR3 все же штурмует более высокие рубежи, для чего и создавалась. В минусах, как нетрудно догадаться, находятся более высокие задержки, вернее: менее агрессивные тайминги, которые пользователь имеет возможность выставить. Но поскольку реальная величина задержек в равной мере определяется и частотой, и таймингами, имея достаточное превосходство по частоте, DDR3 должна выиграть или, как минимум, сравняться с DDR2 и по латентности, имея при этом более высокую пропускную способность, которая определяется почти только частотой.

Отсюда и должен происходить выигрыш в реальной производительности, разумеется, если процессор сумеет утилизировать прибавку в пропускной способности памяти, и на тех приложениях, которые ранее испытывали недостаток в эффективности обмена процессора с памятью. Но это — в теории, давайте, теперь посмотрим, как обстоят дела на практике.

Конфигурация тестового стенда

Используемое ПО и настройки

Штатным режимом контроллера памяти в процессорах для Socket AM3 на сегодняшний день является DDR3-1333, но мы протестировали и на меньшей частоте (1066) и на большей (1600), множитель для установки которой (автономно, то есть без подъема опорной частоты и прочего) также поддерживается процессорами для разъема Socket AM3 и, соответственно, присутствует в BIOS. Кроме того, мы протестировали стабильность работы с частотой DDR3-1333 при установке двух модулей на канал (то есть при заполнении всех 4 слотов памяти), а также сравнили результаты при подъеме частоты ядра и северного моста.
  DDR2 DDR3 DDR3 (8 ГБ, 4 модуля)
Частота памяти, МГц
(DDR2/DDR3 МГц)
400 (800) 533 (1066) 533 (1066) 667
(1333)
667
(1333)
800 (1600) 800 (1600) 667
(1333)
Частота «северного моста» процессора, МГц 2000 (200x10) 2000 (200x10) 2000 (200x10) 2000 (200x10) 2000 (200x10) 2000 (200x10) 2000 (200x10) 2000 (200x10)
Частота ядер процессора, МГц 2600
(200x13)
2600
(200x13)
2600
(200x13)
2600
(200x13)
2600
(200x13)
2600
(200x13)
2600
(200x13)
2600
(200x13)
Тайминги памяти 5-5-5-15-2T 5-5-5-15-2T 8-8-8-24-1T
9-9-9-24-2T
9-9-9-24-1T
9-9-9-24-2T 9-9-9-24-1T 9-9-9-24-1T
Средняя ПСП на чтение (МБ/с),
1 ядро
5930 6704 6536 6835 6985 7250 7377 6910
Средняя ПСП на запись (МБ/с),
1 ядро
3800 4295 4146 4323 4432 4746 4777 4530
Макс. ПСП на чтение (МБ/с),
1 ядро
6840 7798 7373 7824 7908 8466 8596 7882
Макс. ПСП на запись (МБ/с),
1 ядро
6612 6628 6573 6368 6572 6573 6640 6528
Средняя ПСП на чтение (МБ/с),
4 ядра
11280 14780 14155 15215 15105 15400 15432 15300
Средняя ПСП на запись (МБ/с),
4 ядра
4770 6100 5810 6532 6566 7475 7500 6688
Макс. ПСП на чтение (w/PF, МБ/с),
4 ядра
11412 14990 14780 16002 16024 16500 16600 15282
Макс. ПСП на запись (NT, МБ/с),
4 ядра
8010 8031 7794 7995 8113 8150 8020 7992
Минимальная латентность псевдослучайного доступа, нс 35,7 32,2 32,0 31,6 31,7 29,0 28,9 31,6
Минимальная латентность случайного доступа, нс 85,5 76,5 85,9 82,8 82,8 75,3 74,4 82,8


Первой, обратившей на себя внимание, приятной особенностью оказалась стабильность режима с минимальной задержкой командного интерфейса (1T). Ранее такую задержку удавалось использовать далеко не со всеми модулями, даже на частоте DDR2-800, а для DDR2-1066 почти всегда на практике устанавливалось 2T. Теперь же минимальную задержку удалось установить не только на штатной частоте, но и при подъеме до 1600, а также при установке сразу 4 модулей на 1333 МГц (причем мы установили комплекты от разных производителей: в дополнение к Apacer пару стандартных Kingston DDR3-1333). Последнее обстоятельство нас порадовало даже больше, поскольку в новостях проскакивала информация о возможных ограничениях по частоте для 4 модулей, а в действительности оказывается, что не только не приходится снижать частоту, но и тайминги можно сохранить те же самые, вплоть до вовсе не ожидавшейся возможности оставить 1T! Аналогичная картина наблюдалась на обоих платах, участвовавших в тестировании. Судя по всему, соответствующие поправки, если они и были нужны, уже внесены в BIOS плат. И это радует, пусть сразу ставить 4 модуля не имеет смысла в подавляющем большинстве случаев, но со временем, когда пользователь соберется расширить объем памяти, он сможет сделать это, не жертвуя производительностью.

Ясно, что какого-то радикального влияния на производительность, величина этой задержки не имеет (и возможно, для каких-то менее удачных модулей придется выставить и 2T, исходно эта задержка и была введена для повышения совместимости), но само по себе это обстоятельство свидетельствует, что контроллер памяти у AM3-процессоров уже с первых ревизий отлажен как следует. С другой стороны, для AMD это уже третье поколение интегрированных контроллеров, и видимо накоплен соответствующий опыт.

Что касается сравнения производительности в сочетании с DDR2 и DDR3, то в полном соответствии с теорией, режим DDR3-1333 приносит преимущество лишь в пропускной способности, а задержки при случайном поиске оказываются выше, чем у DDR2-1066. А DDR3-1600 превосходит DDR2-1066 уже по всем показателям. И наоборот: переход на DDR3-1066 является однозначно вредной затеей, пропускная способность аналогична DDR2 c той же частотой, а задержки выше. Кстати, на частоте 1600 МГц неожиданно смогли стабильно работать и модули Apacer, штатно являющиеся DDR3-1333, причем с минимальным подъемом напряжения до 1,6 В.

Но действительно существенный контраст между конфигурациями с DDR2 и DDR3 наблюдается в режиме разгона. Как мы отмечали, для успешного разгона Phenom II X4 810 нам пришлось скомпенсировать частоту памяти таким образом, чтобы она стремилась к DDR2-800, даже если в штатном режиме память работала как DDR2-1066. При переходе на DDR3 такого ограничения не наблюдается, да и стабильный максимум частоты оказался чуть выше. Впрочем, имея дело с процессором с разблокированным множителем, который позволяет в режиме разгона оставить DDR2-1066, разница несколько сократится. Но очевиден и тот факт, что разогнанный процессор в большей степени нуждается (и может эффективно использовать скоростную память), поэтому разница практически по всем тестам оказывается выше, нежели мы видим, сравнивая результаты на штатной частоте при использовании DDR2-800 и DDR3-1600, особено при многопоточном доступе. А значит для энтузиастов и любителей технических экспериментов переход на DDR3 будет оправдан в большей степени, нежели для тех, кто пользуется штатными режимами.

Но чтобы аргументированно судить, надо посмотреть результаты не только в синтетике, но и реальных приложениях, возьмем самые распространенные для такого рода оценок тесты: архиваторы и игры.

Phenom II X4 810 Штатные частоты Разгон
Частота ядер, ГГц 2,6 2,6 2,6 2,6 3,7 3,77
Частота CPU NB, ГГц 2,0 2,0 2,0 2,0 2,5 2,6
Частота памяти DDR2-800 DDR2-1066 DDR3-1333 DDR3-1600 DDR2-759 DDR3-1544
Тайминги памяти 5-5-5-15-2T 5-5-5-15-2T 9-9-9-24-1T 9-9-9-24-1T 5-5-5-15-2T 9-9-9-24-1T
7-Zip, мин:сек 2:23 2:17 2:15 2:13 1:58 1:44
WinRAR, мин:сек 1:18 1:15 1:15 1:13 1:02 0:56
GTA IV, fps 42,5 43,8 47,6 49,0 55,0 60,4
Lost Planet Extreme Condition, Cave , fps 76 79 82 82 100 108
FarCry 2, Ranch,
fps
56 61 62 64 76 85
World in Conflict, Very High,
fps
36 39 41 42 48 52
World in Conflict, High,
fps
44 50 51 54 57 66
PT Boards: Knights of the Sea,
fps
35 39 39 40 52 56

Фактически можно повторить выводы, сделанные по результатам синтетических тестов. Переход с DDR2-1066 на DDR3-1333 при работе процессора на штатных частотах приносит лишь небольшое преимущество, заметное в программах с активной многопоточностью (то есть когда все ядра вразнобой и под управлением разных процессов читают и пишут в память). Из нашей подборки к таким программам относятся две первые игры из таблицы. А вот если сравнивать DDR3-1600 с DDR2-1066, что само по себе логично, поскольку в обоих случаях соответствует максимальным частотам памяти, выставляемым с помощью штатного множителя (то есть без подъема опорной частоты и разгона процессора), то отличия уже более ощутимы. Но становится и заметно, что в ряде тестов, участвующий в тестах процессор уже просто не нуждается на штатных частотах в столь быстрой памяти. Поэтому, конечно, в тестировании с разгоном отличия проявляются наиболее заметно. Ну а оправдывают или нет эти преимущества расходы на DDR3 каждый может ответить для себя самостоятельно. Главное, что процессоры для Socket AM3 предоставляют возможность выбора платформы с поддержкой обоих типов памяти, и пользователи (а равно и производители компьютеров) могут ориентироваться, исходя из собственных соображений.

А мы, тем временем, решили проверить еще один теоретически обоснованный вопрос: влияет ли хоть в какой-то степени смена типа оперативной памяти на производительность интегрированного в чипсет графического ядра. Ведь на платах с чипсетом AMD 790GX обычно устанавливается видеобуфер, причем в максимальной конфигурации именно стандарта DDR3-1333, но 128 МБ по современным меркам, это все же маловато, и для размещения текстур этот буфер используется совместно с буфером в оперативной памяти. Разумеется, влияние можно попробовать вытащить на поверхность, взяв какие-то особенно старые игры типа Quake 3, и наверняка обнаружить приличную разницу. Мы решили так не делать, пусть условия будут реальные, а поскольку интегрированное в чипсет AMD 790GX ядро все же достаточно мощное, чтобы пользователь смог поиграть и в относительно современные игры, пусть и на низких настройках качества, мы такие игры и взяли. Здесь уже согласно теории упирание должно быть в первую очередь в вычислительные ресурсы графического ядра, но вдруг не только?

790 GX (128 MB UMA+128 MB SidePort DDR3-1333) + Phenom II X4 810 DDR2-800 DDR2-1066 DDR3-1333
FarCry 2 (Low для параметров графики, High для Performance, демо Ranch Medium), 1280х720, fps 33,9 34,3 34,7
Crysis (VGA test, Low, встроенное демо), 1024x768, fps 34 34 38
World in Conflict (Low, 1280х720),
среднее/минимальное значение fps
52/14 53/14 53/16

Практическая разница есть лишь в Crysis, в остальных случаях, в выбранных разрешениях и видеорежимах, скорее всего, объем активно задействуемой видеопамяти не превышает 128 МБ.

Выводы

Судя по всему, максимально, насколько это возможно, эволюционная стратегия перехода на DDR3, предложенная компанией AMD, адекватна реальному положению дел на рынке памяти. Ведь с одной стороны, небольшое преимущество в штатных режимах явно не оправдывает разницу в российских розничных ценах на комплекты DDR2 и DDR3 одинакового объема и класса (на момент публикации статьи). С другой стороны, компании-производители компьютеров уже сейчас могут закупать стандартные модули DDR3, получая гораздо более привлекательное соотношение, нежели в рознице, и, судя по всему, миграция уже становится оправданной даже с экономической точки зрения, а тем более, вводя поправку на небольшое, но все же существующее преимущество по производительности. Еще одна категория пользователей, которая может быть заинтересована в переходе (вернее выборе для нового компьютера) DDR3 — это последовательные любители разгона. Процессоры, работающие на поднятых частотах, могут выжать из высокочастотной DDR3 больший потенциал и, как следствие, пользователь получает более высокую общую производительность. Разница хотя и не так велика, но ее уже не требуется «искать с лупой», то есть она, например, сравнима с добавкой в сотню-другую мегагерц частоты ядер.




RSS лента ВСЕГО блога с комментариями RSS лента ВСЕГО блога БЕЗ комментариев RSS лента этой КАТЕГОРИИ с комментариями RSS лента этой КАТЕГОРИИ и БЕЗ комментариев RSS лента ЭТОГО ПОСТА с комментариями к нему

Тесты Core 2 при различных частотах FSB и памяти DDR2/DDR3

  • Размер шрифта:

Хотя процессоры Core i7 с интегрированным контроллером памяти уже анонсированы и доступны в магазинах, их присутствие на рынке остается и будет оставаться незначительным (по прогнозам самой же Intel), до выхода i5 еще есть время, так что пока сборщики будут продолжать готовить системы на базе процессоров предыдущей микроархитектуры. И конечно, задача оптимального подбора конфигурации при этом сохранит свою актуальность в применении к системам на базе Core 2. В данной статье мы в очередной раз рассмотрим несколько вариантов конфигураций памяти, чтобы понять, насколько быстрая и какого типа она нужна, чтобы раскрыть потенциал самых быстрых процессоров, но не переплачивать при этом понапрасну.

Вопрос о переплате абсолютно уместен, так как только «обычные» производители (вроде, скажем, Samsung и Hynix) продают соответствующие стандартам JEDEC модули, в характеристиках которых и указать-то нечего, кроме максимальной частоты, на которой они могут работать. Зато производители «элитной» памяти (Corsair, OCZ, GeIL и пр.) легко перекрывают заданные стандартом потолки и по частотам, и по напряжению питания (как правило, конечно, одновременно), за что вполне резонно хотят получить дополнительных денег. Более того, многие варианты платформ под процессоры Intel предполагают использование DDR3, а эта память, помимо того, что все еще дороже, чем DDR2, также провоцирует покупку «элитных» модулей, только теперь с совсем уж запредельными скоростными характеристиками. Кстати, такая память скорее всего не будет иметь перспектив при апгрейде, так как для процессоров на базе Nehalem есть официальная рекомендация производителя не поднимать напряжение модулей DDR3 выше 1,65 В.

Для исследования мы возьмем системные платы на двух топовых чипсетах: Intel X48 и NVIDIA nForce 790i Ultra SLI. Оба они обеспечивают максимальные возможные конфигурации для Core 2: полноценную поддержку PCI Express 2.0, поддержку всех стандартов памяти DDR3 (по крайней мере, при использовании модулей с расширением SPD — EPP 2.0 или XMP), поддержку частоты процессорной шины 400(1600) МГц. Сразу возникает вопрос: насколько актуальна последняя характеристика для обычных покупателей с учетом того факта, что до сих пор с частотой FSB 1600 МГц выпущен один-единственный процессор? Ответ: действительно, неактуальна, но исследование этого режима поможет нам выстроить более ясную общую картину, а кроме того, такой режим можно рассматривать как частный случай разгона, чтобы делать прикидки, какой памятью следует запасаться при желании разогнать процессор.

Исследование производительности

Тестовый стенд:

Программное обеспечение:

Предваряя тестирование

Оба примененных чипсета, как уже было сказано выше, рассчитаны на память типа DDR3. К счастью, на базе чипсета Intel выпущено достаточное количество системных плат, предполагающих использование DDR2 или комбинированных, как примененная нами модель MSI.

Какие же конфигурации мы будем проверять? Здесь надо сделать традиционное вынужденное отступление и пояснить, что скорости операций с памятью ограничены собственно частотой и таймингами работы памяти, а также характеристиками процессорной шины, поскольку именно ее пропускная способность может лимитировать максимальную скорость перекачки данных из памяти и обратно. Действительно, начиная с момента использования двухканального доступа к DDR, пропускная способность памяти не уступает ПС системной шины, а со времен внедрения DDR2 — и значительно превосходит ее (для частоты FSB 1066 МГц, например, ПС шины составляет ~8533 МБ/с, что соответствует ПС двухканальной DDR2-533).

Но достаточно ли будет установить в плату два модуля DDR2-533 одновременно с процессором с FSB 1066 МГц? Однозначности ответа мешает еще как минимум такой параметр, как тайминги памяти. Из общих соображений понятно, что чем выше частота работы микросхемы памяти, тем больше должны быть относительные (выраженные в количестве тактов) задержки доступа к ней (просто потому, что время такта сократится). Однако на практике иногда, с одной стороны, удается обеспечить сохранение таймингов при повышении частоты (за счет того, что абсолютная задержка доступа может точнее уложиться в заданное количество тактов), а с другой стороны, в зависимости от организации микросхем и прочих параметров, при снижении частоты относительная задержка уже не может быть уменьшена, так как достигла предела рабочих характеристик. Таким образом, скажем, система с FSB 1066 МГц и двумя модулями DDR2-533, работающими при CL=4, должна, по идее, показать производительность чуть ниже, чем та же система с двумя модулями DDR2-667, работающими при той же задержке CL=4.

В нашем исследовании мы постарались обеспечить некоторое сочетание различных частот FSB, а также частоты и таймингов памяти, дополняя или проверяя результаты на двух чипсетах.

Результаты тестов при FSB 1066 МГц

Первым установим на тестовые стенды процессор с частотой FSB 1066 МГц. Как мы уже указали выше, с точки зрения величины пропускной способности при этой частоте шины достаточно использовать двухканальную DDR2-533. Впрочем, мы не включили в тестирование такую конфигурацию памяти, потому что DDR2-533 на рынке уже практически не представлена, так что ее цена неадекватна ситуации. Модули DDR2-667 и DDR2-800 представлены гораздо шире, но нельзя уверенно сказать, что между ними есть определенная разница по цене. Тем не менее, конфигурацию с двухканальной DDR2-667 мы все-таки рассмотрим — хотя бы из исследовательского интереса.

Мы уже отмечали в прошлых статьях, что при работе в равных режимах чипсет NVIDIA немного опережает решения Intel, а в синтетических тестах это иногда бывает заметно особенно хорошо. Также DDR3 в нынешних системах, как правило, немного медленнее, чем DDR2 (при использовании одинаковых скоростных режимов и таймингов). В дальнейшем не будем уделять внимания этим вопросам, если только разница не проявится в интересующем нас аспекте сравнения конфигураций памяти.

Традиционно начнем с низкоуровневого исследования потенциала памяти при помощи разработанного нашими программистами теста RightMark Memory Analyzer.

По данной диаграмме хорошо заметно, что скорость системы растет во всех случаях при увеличении частоты памяти до 1066 МГц, даже если это сопровождается повышением таймингов — иногда явно непропорциональным (например, абсолютные величины задержек доступа у DDR3-1066@7-7-7-20-1T гораздо хуже, чем у DDR3-800@5-5-5-16-1T). И лишь повышение частоты памяти до 1333 МГц ничего не дает (или, по крайней мере, перекрывается эффектом от повышения таймингов на шаг).

Картина при изучении скорости записи в память абсолютно соответствует описанной в предыдущем случае.

Неудивительно, что и тест латентности чтения из памяти демонстрирует те же соотношения, хотя в данном случае DDR3-1333 все-таки сумела чуть обойти DDR3-1066 по времени случайного доступа.

Теперь проверим, не изменится ли картина при многопоточном доступе в память: возможно, два ядра в конкурирующем режиме сумеют более эффективно использовать пропускную способность шины? Для этой цели используем тест RMMT (RightMark Multi-Threaded Memory Test) из пакета RMMA. (Для операций каждому потоку выделим по 32 МБ, дистанцию предвыборки данных будем подбирать индивидуально, чтобы максимизировать результат.)



Очевидно, что величина цифр несколько изменилась (многопоточное чтение идет чуть быстрее, многопоточная запись — чуть медленнее), однако взаимное расположение участников — нет.

Что ж, теперь проверим полученные данные на паре реальных приложений, а заодно оценим разницу в актуальных величинах.

Вооруженные результатами синтетических тестов, мы и не ожидали иного расклада. Производительность при архивировании (группа реальных тестов, наиболее сильно зависящих от скорости подсистемы памяти) действительно увеличивается с поднятием частоты памяти до 1066 МГц, даже при непропорциональном увеличении таймингов. В то же время, использование DDR3-1333 видимых дивидендов не приносит, хотя практически не снижает производительность, если тайминги при этом не слишком «задираются».

Производительность в играх подчиняется тем же закономерностям — по крайней мере, в тех игровых режимах, где скорость ограничена именно процессором и памятью, а не видеокартой.

Посмотрим на абсолютные величины выигрыша. В 7-Zip применение наиболее быстрой (де-факто) конфигурации на Intel X48 (DDR2-1066@5-5-5-16-2T) ускоряет систему с FSB 1066 МГц на 6,5% относительно базовой (DDR2-667@4-4-4-12-2T). Это не так уж мало: разница примерно соответствует 0,5 множителя частоты процессора, то есть при прочих равных такое ускорение обеспечивает ту же разницу, что и покупка процессора на одну модель старше. В Doom 3 аналогичный эффект равен и вовсе +8,3%. Главный же вывод из данной группы тестов: применение более скоростной памяти, вопреки чисто теоретическим выкладкам, обеспечивает ускорение системы вплоть до применения DDR2/DDR3-1066. Случайно ли, что максимальная эффективная частота памяти совпадает с частотой FSB? Попробуем найти ответ в следующих разделах.

Результаты тестов при FSB 1333 МГц

Теперь установим на тестовые стенды процессор с частотой FSB 1333 МГц. Опять-таки, с точки зрения величины пропускной способности при этой частоте шины достаточно использовать двухканальную DDR2-667. Поскольку штатные варианты DDR2 не могут даже приблизиться к этой частоте FSB, сосредоточимся мы на DDR3.

Скорость чтения из памяти по-прежнему уверенно растет при повышении частоты ее работы вплоть до 1333 МГц, даже в тех случаях, когда тайминги повышаются непропорционально (CL7 у DDR3-1333 в сравнении с CL5 у DDR3-1066). А вот частота памяти 1600 МГц прироста производительности не дает, и снижение абсолютной величины таймингов не помогает.

Впрочем, по скорости записи в память сравнительные результаты получаются чуть иными, но лишь в последнем пункте: здесь есть прирост и от повышения частоты памяти до 1600 МГц.

Результаты теста латентности чтения ближе к теоретическим выкладкам по подсчету таймингов: здесь выигрыш имеют те режимы, которые обеспечивают меньшие значения таймингов в абсолютных величинах. В итоге память с большей частотой всегда выигрывает но лишь поскольку (и насколько) имеет тайминги пониже.



Многопоточное чтение по-прежнему идет чуть быстрее, а многопоточная запись — чуть медленнее, а результаты в той же степени соответствуют результатам при однопоточном доступе в память.



Вряд ли кого-нибудь удивит практическое подтверждение синтетических тестов; по большому счету, интрига заключалась только в вопросе, сумеет ли DDR3-1600 при более низких таймингах опередить DDR3-1333. Практика деликатно уклонилась от прямого ответа на этот вопрос, предоставив нам самостоятельно оценивать статистическую погрешность тестирования. Что ж вполне можно признать эти режимы равными по скорости.

Теперь конкретные цифры разницы в реальных приложениях. 7-Zip уверенно отдает предпочтение чипсету NVIDIA, так что у нас есть два варианта сравнения: Intel X48 с DDR3 в лучшем случае выигрывает около 5,5% относительно режима с DDR2-667@4-4-4-12-2T, а NVIDIA nForce 790i Ultra — примерно столько же, но в сравнении с самым медленным режимом DDR3. Если бы мы рассматривали неофициальные скоростные вариации DDR2 (а производители такие модули предлагают), то, очевидно, могли бы получить и больший прирост на Intel X48, так как DDR2 на нем работает быстрее, а частота памяти задается независимо от ее типа. В случае Doom 3 максимальный прирост (из возможных штатных) на X48 составил почти 7%, у чипсета NVIDIA он скромнее, но и минимальный режим более скоростной.

В этом разделе тестов мы подтверждаем вывод о пользе применения более скоростной памяти, и лишь верхнюю границу однозначно определить затрудняемся: 1333 МГц достаточно, но хоть падения скорости от покупки DDR3-1600 с нормальными таймингами можно не ожидать.

Результаты тестов при FSB 1600 МГц

Наконец, настал черед единственного в своем роде процессора с частотой FSB 1600 МГц. Штатные возможности контроллера памяти в чипсете Intel не дадут нам создать здесь достаточно интересную непрерывную цепь показателей, так что воспользуемся по полной программе гибкостью контроллера памяти у NVIDIA nForce 790i Ultra. Вообще, такая частота FSB ограничивает минимальную частоту памяти на уровне 1066 МГц (только в случае контроллеров Intel, конечно), то есть штатные модули DDR2 здесь использовать невозможно. Это означает, что наше сравнение из практической плоскости «оправдана ли покупка нестандартной, более дорогой памяти?» переходит в чисто теоретическое «какая нестандартная память лучше?». Впрочем, не будем забывать и о DDR3 — там эти частоты вполне стандартны.

Что ж, вполне привычная по предыдущим частям сравнения картина: скорость чтения из памяти растет при повышении частоты ее работы вплоть до 1600 МГц, но не дальше, и, опять же, увеличение таймингов не нарушает эту закономерность.

Та же картина и при записи, только здесь еще более подчеркнута бесполезность и даже вредность DDR3-1800.

Впрочем, DDR3-1800 берет реванш в тесте латентности чтения: как ни крути, а абсолютные величины таймингов в этом режиме ниже.

Как мы помним по результатам первого тестирования процессора QX9770 с двухканальной DDR2-800, максимальная скорость многопоточного чтения достигается при конкурентной работе двух потоков, выполняющихся на физически разных ядрах, а максимальная скорость многопоточной записи — при конкурентной работе двух потоков, выполняющихся на ядрах, относящихся к физически единому ядру (разделяющих общий кэш L2). Дополнив прежнюю конфигурацию тестовых стендов чипсетом NVIDIA и куда более скоростными модулями памяти, мы получили следующие интересные наблюдения:

  1. на NVIDIA nForce 790i Ultra SLI скорость чтения практически одинакова при работе двух потоков, выполняющихся на физически разных ядрах и на ядрах, относящихся к физически единому ядру (а четырехпоточное чтение существенно медленнее);
  2. скорость чтения с предвыборкой происходит на NVIDIA nForce 790i Ultra SLI существенно быстрее в случае чтения в два потока с ядер, относящихся к физически единому ядру (а четырехпоточный вариант вновь заметно медленнее остальных);
  3. зато максимальная скорость записи на NVIDIA nForce 790i Ultra SLI выше именно при работе двух потоков на физически разных ядрах, запись в 4 потока занимает промежуточное положение по скорости.

Для наших целей возьмем именно максимальные показатели, полученные, таким образом, при немного отличающихся условиях тестирования многопоточных чтения и записи.



В случае чипсета Intel преимущества от использования DDR3-1600 очевидны; у чипсета NVIDIA разница между разными режимами отнюдь не так впечатляет, но общий итог прежний: более быстрая (но не быстрее FSB) память дает некоторый выигрыш в скорости.



Тем важнее практическая проверка, и ее результаты не столь оптимистичны: различия между режимами с памятью разной частоты укладываются в 2-3%, что вряд ли можно считать серьезным стимулом для покупки топовых модулей памяти.

Таким образом, «полусинтетический» раздел тестов позволил нам подтвердить вывод о принципиальной пользе применения более скоростной памяти, с небольшим максимумом в районе DDR3-1600, но реально измеримого превосходства в производительности относительно базовой DDR3-1066 можно не ждать. Еще раз напомним, что этот вывод относится не только к крайне немногочисленным обладателям QX9770, но и ко всем оверклокерам, серьезно увеличивающим частоту FSB для разгона процессора.

Выводы

Здесь нам остается только свести воедино результаты, полученные при тестировании в трех группах конфигураций, и соотнести их с изначальным вопросом статьи.

Итак, в случае распространенных процессоров семейства Core 2 с частотой FSB 1066/1333 МГц, вопреки чисто теоретическим выкладкам, имеет некоторый смысл использовать двухканальную память, существенно превосходящую по пропускной способности штатную системную шину. Если взять за опорную точку конфигурацию с DDR2-667 (как наиболее дешевый из реально представленных на рынке вариантов), то применением быстрой DDR2 или DDR3 можно выиграть 6-7-8% в реальных приложениях. Еще раз повторим, что это не так уж мало: разница примерно соответствует 0,5 множителя частоты процессора, то есть при прочих равных такое ускорение обеспечивает ту же разницу, что и покупка процессора на одну модель старше. Но, конечно, на ускорение в разы рассчитывать не стóит.

Память при этом оптимально подбирать такую, которая способна работать «псевдосинхронно» с FSB (их опорные частоты должны совпадать), не слишком задирая при этом тайминги (в абсолютных величинах, конечно). Будет ли такая покупка оправдана по большому счету? Почти всегда нет, так как разница в стоимости модулей «оверклокерской» и «обычной» памяти легко может составлять несколько раз (давая выигрыш, напомним, на 6–8%) — хотя вывод, безусловно, будет зависеть и от стоимости системы в сборе. Однако будут и ситуации, когда такая покупка явится наиболее рациональным способом улучшения системы — например, при намерении купить топовый или околотоповый процессор в линейке.

Сделанные выводы останутся справедливыми и для варианта разгона процессора, но тогда платы на наиболее популярных чипсетах (Intel) просто физически не позволят использовать память с низкой частотой работы, а значит, опорная точка в любом случае сместится в сторону более дорогих и производительных модулей. В итоге выигрыш от применения, скажем, DDR3-1600/1800 будет существенно меньше (в районе 2-3%), хотя и разница в цене модулей памяти несколько нивелируется.






RSS лента ВСЕГО блога с комментариями RSS лента ВСЕГО блога БЕЗ комментариев RSS лента этой КАТЕГОРИИ с комментариями RSS лента этой КАТЕГОРИИ и БЕЗ комментариев RSS лента ЭТОГО ПОСТА с комментариями к нему

Прыг: 01

Рейтинг популярности - на эти заметки чаще всего ссылаются:


Система авторегистрации в каталогах, статьи про раскрутку сайтов, web дизайн, flash, photoshop, 
        хостинг, рассылки; форум, баннерная сеть, каталог сайтов, услуги продвижения и рекламы сайтов

Самые Главные

Анонсы статей:

Оглавление категорий:

   Сервисы :


 
сентябрь, 2010
пн вт ср чт пт сб вс
    1 2 3 4 5
6 7 8 9 10 11 12
13 14 15 16 17 18 19
20 21 22 23 24 25 26
27 28 29 30      
    Полезные сайты:
    Специалист не нужен, удаленная перезагрузка сервера - экономьте деньги.
    www.geolan.ru
    Комиссионный магазин швейцарских часов, купить часы girard perregaux.
    www.wlombard.ru


Компьютерный мир

На верх страницы .
Created in 0,05972 seconds Copyright © 2009 Компьютерный мир Design by Amalgams