ATI RADEON HD 4670 512MB PCI-E (RV730) (original) (raw)
Почти половина от 4870 плюс 128bit шина, что получится? –
Новый супершустряк в 3D-графике, если в кармане мало денег.
СОДЕРЖАНИЕ
- Часть 1 — Теория и архитектура
- Часть 2 — Практическое знакомство
- Особенности видеокарт
- Конфигурация стенда, список тестовых инструментов
- Результаты синтетических тестов
- Результаты игровых тестов (производительность)
Часть 1: Теория и архитектура
Давненько у нас не было базовых обзоров low-end решений с рекомендуемой ценой менее $100… Длительное время low-end видеокарты считаются плохо подходящими для современных игр, так как зачастую они не обеспечивают приемлемой производительности в игровых приложениях даже не на максимальных настройках качества. Но время идёт, и всё меняется. Конкурентная борьба чуть раньше сделала возможным выпуск мощных решений нижнего среднего ценового диапазона (например, Radeon HD 3850 и Geforce 9600 GT), а теперь, похоже, пришло время и для нижнего ценового сектора.
Важно понимать, что не только постепенное увеличение производительности видеокарт всех ценовых диапазонов даёт такой эффект. Это — естественный процесс развития индустрии. Весьма сильное влияние на игровые проекты сейчас оказывают консоли, и большинство выходящих игр являются мультиплатформенными, они проектируются одновременно и для персональных компьютеров, и для двух основных игровых консолей текущего поколения: Microsoft Xbox 360 и Sony PlayStation 3.
Естественно, мощности и ресурсы консолей ограничены единственной конфигурацией, по сравнению с персональными компьютерами, и уже через пару лет после их выпуска, по 3D-производительности они начинают отставать даже от сравнительно недорогих ПК конфигураций. И выходящие для компьютеров видеокарты даже из нижнего ценового диапазона вполне способны обеспечить ту необходимую мощность, которая требуется мультиплатформенными играми. Большая производительность дорогих 3D-видеокарт часто расходуется на сверхвысокие разрешения, большие уровни сглаживания и лучшую текстурную фильтрацию. И редкие эксклюзивные для ПК проекты, вроде Crysis и S.T.A.L.K.E.R.: Clear Sky.
Сегодня мы рассматриваем новые решения для нижнего ценового диапазона от компании AMD, которые вполне могут стать теми low-end видеокартами, способными на вполне приемлемую игровую производительность в большинстве проектов за относительно небольшие деньги. Все представляемые сегодня решения и видеочипы основаны на архитектуре RV7xx, на которой базируются и весьма удачные решения серии RADEON HD 4800, получившие очень хорошие оценки в обзорах и у пользователей. Пока что в практической части нашей статьи будет только самый быстрый вариант на основе чипа RV730, но мы приведём и характеристики менее производительных видеокарт.
Перед прочтением данного материала мы рекомендуем внимательно ознакомиться с базовыми теоретическими материалами DX Current, DX Next и Longhorn, описывающими различные аспекты современных аппаратных ускорителей графики и архитектурные особенности предыдущей продукции Nvidia и AMD.
- [06.06.05] Longhorn — ускорители и шейдеры для DirectX 10
- [01.03.05] DirectX.Update — Ускорители 3D-графики: полшага вперед
- [09.04.04] DX.Next: ближайшее и ближнее будущее аппаратного ускорения 3D-графики
Эти материалы достаточно точно спрогнозировали текущую ситуацию с архитектурами видеочипов, оправдались многие предположения о будущих решениях. Подробную информацию об унифицированных архитектурах AMD R6xx, RV6xx и RV7xx на примере предыдущих решений, можно найти в следующих статьях:
- [14.05.07] Долгожданное появление DirectX 10-семейства от AMD/ATI
- [04.07.07] ATI RADEON HD 2400-2600-серии: новые решения от AMD для среднего и бюджетного секторов с поддержкой DirectX 10
- [19.11.07] ATI RADEON 3850/3870 (RV670): 320 шейдерных процессора с 256-битной шиной памяти
- [30.06.08] ATI RADEON HD 4850 (RV770): Число шейдерных процессоров выросло в 2.5 раза!
- [08.07.08] ATI RADEON HD 4870 512MB PCI-E: закрепляет успех AMD!
Итак, давайте рассмотрим подробные характеристики новых видеоплат серий RADEON HD 4600 и 4500, основанных на новых чипах RV730 и RV710.
Графические ускорители серии RADEON HD 4600
- кодовое имя чипа RV730;
- технология 55 нм;
- 514 миллионов транзисторов;
- унифицированная архитектура с массивом общих процессоров для потоковой обработки вершин и пикселей, а также других видов данных;
- аппаратная поддержка DirectX 10.1, в том числе и новой шейдерной модели — Shader Model 4.1, генерации геометрии и записи промежуточных данных из шейдеров (stream output);
- 128-битная шина памяти: два контроллера шириной по 64 бита с поддержкой памяти DDR2/DDR3/GDDR2/GDDR3;
- частота ядра 600-750 МГц;
- 8 SIMD ядер, включающих 320 скалярных ALU для расчётов с плавающей точкой (целочисленные и плавающие форматы, поддержка FP32 и FP64 точности в рамках стандарта IEEE 754);
- 8 укрупненных текстурных блоков, с поддержкой FP16 и FP32 форматов;
- 32 блока текстурной адресации;
- 128 блоков текстурной выборки;
- 32 блока билинейной фильтрации с возможностью фильтрации FP16 текстур на полной скорости и поддержкой трилинейной и анизотропной фильтрации для всех текстурных форматов;
- возможность динамических ветвлений в пиксельных и вершинных шейдерах;
- 8 блоков ROP с поддержкой режимов антиалиасинга с возможностью программируемой выборки более чем 16 сэмплов на пиксель, в том числе при FP16 или FP32 формате буфера кадра. Пиковая производительность до 8 отсчетов за такт (в т.ч. и для режимов MSAA 2x/4x, в том числе для буферов формата FP16), в режиме без цвета (Z only) — 32 отсчета за такт;
- запись результатов до 8 буферов кадра одновременно (MRT);
- интегрированная поддержка двух RAMDAC, двух портов Dual Link DVI, HDMI, HDTV, DisplayPort.
Спецификации карты RADEON HD 4670
- частота ядра 750 МГц;
- количество универсальных процессоров 320;
- количество текстурных блоков — 32, блоков блендинга — 8;
- эффективная частота памяти 2000 МГц (2*1000 МГц)/1800 МГц (2*900 МГц);
- тип памяти GDDR3/DDR3;
- объем памяти 512 МБ/1 ГБ;
- пропускная способность памяти 32,0/28,8 ГБ/с;
- теоретическая максимальная скорость закраски 6,0 гигапикселей в с;
- теоретическая скорость выборки текстур 24,0 гигатекселей в с;
- два CrossFireX разъема;
- шина PCI Express 2.0 x16;
- два DVI-I Dual Link разъема, поддерживается вывод в разрешениях до 2560х1600;
- TV-Out, HDTV-Out, поддержка HDCP, HDMI, DisplayPort;
- энергопотребление менее 75 Вт (без дополнительных разъёмов);
- однослотовый дизайн;
- рекомендуемая цена $79.
Спецификации карты RADEON HD 4650
- частота ядра 600 МГц;
- количество универсальных процессоров 320;
- количество текстурных блоков — 32, блоков блендинга — 8;
- эффективная частота памяти 1000 МГц (2*500 МГц);
- тип памяти DDR2;
- объем памяти 512 МБ;
- пропускная способность памяти 16.0 ГБ/с;
- теоретическая максимальная скорость закраски 4,8 гигапикселей в с;
- теоретическая скорость выборки текстур 19,2 гигатекселей в с;
- два CrossFireX разъема;
- шина PCI Express 2.0 x16;
- два DVI-I Dual Link разъема, поддерживается вывод в разрешениях до 2560х1600;
- TV-Out, HDTV-Out, поддержка HDCP, HDMI, DisplayPort;
- энергопотребление менее 60 Вт (без дополнительных разъёмов);
- однослотовый дизайн;
- рекомендуемая цена $69.
Графические ускорители серии RADEON HD 4500
- кодовое имя чипа RV710;
- технология 55 нм;
- 242 миллиона транзисторов;
- унифицированная архитектура с массивом общих процессоров для потоковой обработки вершин и пикселей, а также других видов данных;
- аппаратная поддержка DirectX 10.1, в том числе и новой шейдерной модели — Shader Model 4.1, генерации геометрии и записи промежуточных данных из шейдеров (stream output);
- 64-битная шина памяти: один контроллер шириной 64 бита с поддержкой памяти DDR2/DDR3/GDDR2/GDDR3;
- частота ядра 600 МГц;
- 2 SIMD ядра, включающих 80 скалярных ALU для расчётов с плавающей точкой (целочисленные и плавающие форматы, поддержка FP32 и FP64 точности в рамках стандарта IEEE 754);
- 2 укрупненных текстурных блока, с поддержкой FP16 и FP32 форматов;
- 8 блоков текстурной адресации;
- 32 блоков текстурной выборки;
- 8 блока билинейной фильтрации с возможностью фильтрации FP16 текстур на полной скорости и поддержкой трилинейной и анизотропной фильтрации для всех текстурных форматов;
- возможность динамических ветвлений в пиксельных и вершинных шейдерах;
- 4 блока ROP с поддержкой режимов антиалиасинга с возможностью программируемой выборки более чем 16 сэмплов на пиксель, в том числе при FP16 или FP32 формате буфера кадра. Пиковая производительность до 4 отсчетов за такт (в том числе и для режимов MSAA 2x/4x, в том числе для буферов формата FP16), в режиме без цвета (Z only) — 16 отсчетов за такт;
- запись результатов до 8 буферов кадра одновременно (MRT);
- интегрированная поддержка двух RAMDAC, двух портов Dual Link DVI, HDMI, HDTV, DisplayPort.
Спецификации карты RADEON HD 4550
- частота ядра 600 МГц;
- количество универсальных процессоров 80;
- количество текстурных блоков — 8, блоков блендинга — 4;
- эффективная частота памяти 1600 МГц (2*800 МГц);
- тип памяти DDR3;
- объем памяти 256/512 МБ;
- пропускная способность памяти 14,4 ГБ/с;
- теоретическая максимальная скорость закраски 2,4 гигапикселей в с;
- теоретическая скорость выборки текстур 4,8 гигатекселей в с;
- шина PCI Express 2.0 x16;
- два DVI-I Dual Link разъема, поддерживается вывод в разрешениях до 2560х1600;
- TV-Out, HDTV-Out, поддержка HDCP, HDMI, DisplayPort;
- энергопотребление менее 25 Вт (без дополнительных разъёмов);
- однослотовый дизайн, пассивное охлаждение;
- рекомендуемая цена $29-35.
Компания AMD продолжает выпуск графических решений по 55 нм технологическим нормам, теперь пришло время и для low-end чипов семейства RV7xx. По сравнению с до сих пор широко используемой Nvidia технологией 65 нм, этот более совершенный технологический процесс даёт следующие преимущества: меньшую площадь ядра, увеличенный частотный потенциал и процент выхода годных чипов на требуемых тактовых частотах. Всё это влечёт за собой и меньшую себестоимость. Как и предыдущие решения на RV770, новые чипы весьма эффективны энергетически и с точки зрения производительности на площадь чипов.
Маркировка решений осталась в стиле предыдущей серии HD 3000, поменялась только первая цифра. Позиционирование HD 4650 совпадает с положением HD 3650 во время их выпуска, а новые решения HD 4670 и HD 4550 будут занимать промежуточные положения в линейке. Так как чипы RV730 и RV710 создавались для замены предыдущих семейств AMD, серия HD 3000 будет постепенно вытесняться ими в продаже.
Варианты HD 4670 и 4650, как обычно у AMD, отличаются тактовыми частотами, и видеочипа и памяти. Но это не единственное отличие между моделями карт — на старшей установлена память типа GDDR3 или новая DDR3 большего объёма, а на младшей — DDR2. Из других отличий старшего варианта — большее энергопотребление и лишь чуть-чуть меньшая рекомендованная цена. Впрочем, посмотрим ещё на реальные розничные цены…
Объём видеопамяти у low-end карт всегда очень сильно зависит от её типа. В случае недорогой DDR2 и DDR3 памяти, обычно её ставят больше. У HD 4600 минимальным объёмом является 512 МБ, что очень хорошо, так как современные игры очень требовательны к объёму видеопамяти и используют обычно 500-600 МБ, а в редких случаях и более. Объём памяти в 512 МБ на данный момент является оптимальным количеством памяти для видеокарт нижнего и среднего уровня. И лишь самая дешёвая модель HD 4550 предлагает, в том числе, и вариант с 256 МБ DDR3 памяти, для карты такого уровня это решение оправдано.
Архитектура чипов RV730 и RV710
По сути, всю теорию о новой архитектуре AMD можно получить из нашей базовой статьи по RV770. GPU для решений нижних ценовых диапазонов, которые мы сегодня рассматриваем, отличаются от RV770 лишь количественно (впрочем, небольшие нюансы есть и здесь). Текущая архитектура хорошо масштабируется в обе стороны, что мы и видим сейчас на примере low-end решений. Схемы чипов RV730 и RV710 выглядят так:
По схеме видно, что RV730 отличается от RV760 количеством разнообразных исполнительных блоков: ALU, ROP, TMU, во всем остальном повторяя старшее решение. У RV710 отличий несколько больше, они не только количественные (блоков ALU, ROP и TMU ещё меньше), но есть и одно качественное — кэш первого уровня совмещает кэширование вершинных и пиксельных данных, в отличие от раздельных у старших решений. Основные количественные изменения: число шейдерных процессоров в RV730 снижено до 64 (320 ALU) а в RV710 до 16 (80 ALU), число блоков текстурирования до 32 и 8, соответственно. Но в этот раз блоков ROP у младших чипов разное количество — 8 и 4 для RV730 и RV710, соответственно. Кстати, из других отличий RV730/RV710 от RV770 — разное количество как SIMD ядер, так и количества потоковых процессоров внутри каждого ядра (восемь ALU вместо шестнадцати).
Естественно, все эти изменения сделаны для снижения количества транзисторов и площади чипов, что понятным образом скажется на производительности относительно быстрейшего GPU линейки. Обо всех остальных архитектурных особенностях RV7xx вы можете узнать из базового материала, ссылка на который приведена выше. Также, у младших чипов вместо 256-битной шины сделана поддержка 128-битной и 64-битной для RV730 и RV710, соответственно, а всё остальное, написанное в основном материале, относится и к ним тоже.
Наиболее важное изменение новых GPU заключается в том, что в отличие от RV770, соотношение между количеством блоков TMU и ALU здесь иное. Хотя каждое SIMD ядро имеет по четыре выделенных текстурных модуля, число ALU внутри SIMD отличается, и соотношение между ALU и TMU теперь стало не 4:1, а 2:1. То есть, число текстурных модулей в RV730, по сравнению с RV770, снизилось незначительно (с 40 до 32), а число ALU сильнее — с 800 до 320. Получается, что в AMD сделали ещё один шаг в обратную от архитектуры R6xx и RV6xx сторону. И хотя каждый из 32 и 8 блоков текстурирования в RV730 и RV710 несколько слабее, чем в RV6xx, их увеличенное количество и эффективность должны дать прирост скорости текстурных выборок.
Поговорим немного о применении нового для видеокарт типа памяти на решениях серий HD 4600 и HD 4500. Для так называемых mainstream-видеокарт компанией AMD впервые использованы микросхемы памяти DDR3 (не путать с GDDR3!). Несмотря на то, что она обеспечивает ту же производительность, что и GDDR3 (на равных частотах, естественно), предполагается, что в ближайшем будущем стоимость DDR3-памяти сравняется со стоимостью микросхем DDR2, которые сейчас крайне дёшевы. Соответственно, за счёт этого у производителей видеокарт будет возможность комплектации видеокарт большими объемами сравнительно быстрой видеопамяти.
DirectX 10.1
Уже в который раз компания AMD упирает на поддержку всеми видеокартами серий HD 4000 (а также и HD 3000) обновленной версии основного графического API от Microsoft — DirectX 10.1. Эта версия расширяет некоторые ограничения предыдущей, и упрощает использование некоторых техник и алгоритмов. Следует упомянуть и улучшенные возможности сглаживания, позволяющие повысить качество изображения в некоторых случаях. Но основным преимуществом этой версии API в ближайшем будущем станет увеличение производительности некоторых алгоритмов за счёт снижения количества необходимых проходов рендеринга. И, скорее всего, первые DirectX 10.1 игры будут отличаться в основном этим, а не какими-то видимыми качественными улучшениями. Подробнее о возможностях этого API вы можете прочитать в базовом обзоре RV670.
Первыми играми с поддержкой DirectX 10.1 предполагаются проекты от Electronic Arts и Phenomic Studio, SEGA и NHN Games. Это онлайновая RTS Battleforge, футуристическая RTS Stormrise, и RPG под названием Cloud 9. Заявлено, что все эти проекты используют возможности DirectX 10.1 для увеличения производительности рендеринга и качества картинки. Сроки выхода данных игр пока не называются — вероятнее всего, проекты выйдут уже в 2009 году.
Технология ATI Avivo
Как и в старший чип серии, в RV730 и RV710 встроен модуль обработки видеоданных Unified Video Decoder второго поколения (UVD 2). Он появился в решениях серии Radeon HD 3000 и позднее был без существенных изменений перенесен в HD 4000. UVD2 аппаратно декодирует видеоданные во всех наиболее распространённых форматах: H.264, VC-1 и MPEG-2. В новых решениях серии HD 4000 видеопроцессор был модифицирован для поддержки одновременного декодирования двух полноформатных (1080p) потоков видео для обеспечения возможностей, которые иногда встречаются на дисках Blu-ray. Также добавились улучшенные возможности по постобработке видео, такие как масштабирование DVD-видео до HD-разрешений, а также динамическая регулировка контрастности.
Улучшенное масштабирование
Технология ATI Avivo в серии Radeon HD 4000 включает в себя высококачественное масштабирование видеоданных из низкого разрешения (например, DVD) в более высокие HD (720p, 1080p). Таким образом, стандартные DVD с разрешением 720x480 или 720x576 при выводе на HD устройства вывода с разрешением 1920x1080 или 1920x1200 с ATI Avivo HD масштабированием обеспечат лучшее качество, чем с обычно применяемым программным масштабированием плееров. Вот пример, который приводит в презентациях компания AMD:
В целом, хорошо видно, что чёткость на левой части картинки выше, чем на правой, как по вертикали, так и по горизонтали. В будущих исследованиях скорости и качества декодирования видео при помощи GPU, мы постараемся рассмотреть этот вопрос более подробно.
Динамическая регулировка контрастности
Контрастность сильно влияет на восприятие визуальных данных. Изображения с низкой контрастностью обычно выглядят тусклыми и менее чёткими, когда мелкие детали в некоторых участках изображения плохо различимы. И хотя большинство плееров позволяют подстраивать контрастность, эти настройки не меняются от сцены к сцене, хотя оптимальные настройки контрастности для разных сцен будут разными.
В ATI Avivo HD есть возможность динамического изменения контрастности видеопотока. При помощи специальных алгоритмов постобработки, контрастность изображения автоматически подстраивается, постоянно адаптируясь к изменению параметров изображения. Это обеспечивает улучшенное восприятие видео человеком, в результате, давая большее количество деталей и чёткость (слева — фрагмент картинки с включенной обработкой):
Управление питанием PowerPlay
Новыми чипами поддерживается второе поколение технологии ATI PowerPlay. Эта технология динамического управления питанием получила дальнейшие усовершенствования, её суть в том, что специальная управляющая схема в чипе отслеживает загрузку работой и определяет оптимальный рабочий режим, управляя рабочей частотой чипа, памяти, напряжением питания и другими параметрами, оптимизируя энергопотребление и тепловыделение.
В режиме низкой нагрузки при выводе 2D-картинки и невысокой загрузке GPU, его напряжение и частоты будут максимально снижены, как и частота вращения вентилятора, в режиме средней 3D-нагрузки все параметры установятся на средние значения, а при максимальной работе видеочипа частоты с напряжением будут выставлены максимальными. Таким образом, за счёт обновленной технологии управления питанием была значительно увеличена энергетическая эффективность чипов серии RV7xx, по сравнению с предыдущим поколением видеокарт.
Итак, мы познакомились с теоретическими особенностями новых low-end чипов на основе архитектуры RV7xx, в следующей части статьи вас ждёт практическая часть исследования, в которой мы узнаем, как производительность новых решений на их основе соотносится со скоростью предыдущих решений компании AMD и конкурирующих видеокарт Nvidia в нашем обычном наборе синтетических тестов.