Каталог
ZV
ездный б-р, 19
+7 (495) 974-3333 +7 (495) 974-3333 Выбрать город: Москва
Подождите...
Получить токен
Соединиться
X
Сюда
Туда
x
Не выбрано товаров для сравнения
x
Корзина пуста
Итого: 
Оформить заказ
Сохранить заказ
Открыть корзину
Калькуляция
Очистить корзину
x
Главная
Магазины
Каталог
Мои заказы
Корзина
Магазины Доставка по РФ
Город
Область
Ваш город - ?
От выбранного города зависят цены, наличие товара и
способы доставки

Среда, 2 июля 2008 00:00

Radeon HD 4850 и 4870: AMD выигрывает в двух ценовых категориях.

короткая ссылка на новость:

Архитектура RV770



Потоковый процессор (Stream Processing Unit)
Потоковый процессор AMD очень напоминает процессор NVIDIA G80/G92/GT200. Обратите внимание, что 3 представленных на рисунке ALU (арифметико-логических устройства) - это очень упрощенная схема (на самом деле это модули FP MUL + ADD). В потоковом процессоре AMD используется 4 таких потоковых процессорных блока, обозначаемых как x, y, z и w.

Существует еще и пятый процессорный блок, обозначаемый t (transcendental - обрабатывающий трансцендентные операции).

t-unit
Процессор t выполняет те же операции, что и процессоры x,y,z и w, и вдобавок трансцендентные операции, представленные на диаграмме блоком SFU (Special Function Unit - блоком обработки специальных функций). Каждый из блоков x,y,z,w и t рассматривается AMD как потоковый процессорный блок; RV770 имеет 800 таких блоков (у RV670 их 320).

AMD группирует 4 потоковых процессорных блока (x,y,z и w) с t-блоком и получается потоковый процессор (Streaming Processor - SP):

Streaming Processor

Потоковым процессором является закрашенная красным область. В отличие от потокового процессора NVIDIA, процессор AMD может обрабатывать до 5 инструкций одновременно.

Затем AMD группирует 16 таких потоковых процессоров в ядро SIMD.

Ядро AMD SIMD Потоковый мультипроцессор (Streaming Multiprocessor - SM) NVIDIA
Ядро AMD SIMD Streaming Multiprocessor NVIDIA

Ядро SIMD очень похоже на потоковый мультипроцессор NVIDIA со следующими исключениями.

  1. В ядре AMD SIMD больше потоковых процессоров (16 против 8).
  2. Максимальное число обрабатываемых потоковым процессором AMD инструкций в 5 раз выше, чем у потокового процессора NVIDIA.
  3. Кэши инструкций и данных не включены в ядро SIMD.
  4. AMD располагает текстурные блоки и кэш текстур вместе с потоковыми процессорами в ядре SIMD.
  5. Видите 2 SFU (Special Function Unit - блоки обработки специальных функций) в потоковом процессоре NVIDIA? NVIDIA разместила 2 очень быстрых SFU в потоковом мультипроцессоре, AMD встраивает в каждый потоковый процессорный блок свой собственный SFU. Пока непонятно, какой из подходов является оптимальным для скорости вычислений, т.к. мы не знаем задержек при обработке инструкций или пропускной способности SFU от AMD и NVIDIA.

Обратите внимание, что по рассмотренным до данного момента параметрам RV770 не отличается от RV670 (который используется в Radeon HD 3870). На следующем шаге AMD и NVIDIA расходятся: в NVIDIA GT200 по 3 потоковых мультипроцессора объединяются в кластер обработки текстур TPC (Texture Processing Cluster), а 10 TPC объединяются в чип; AMD просто объединяет 10 ядер SIMD.

AMD RV670
AMD's RV670
AMD RV770
10 ядер SIMD в AMD RV670
NVIDIA GT200 Streaming Processor Array (SPA)
Массив потоковых процессоров (Streaming Processor Array - SPA) NVIDIA GT200; вычислительных модулей меньше, но изощреннее "обвязка" вокруг них; большое внимание уделяется управлению потоками.

Число вычислительных блоков у RV770 с 10 ядрами SIMD в 2.5 раза больше, чем у RV670. И даже теоретическая вычислительная мощность RV770 выше, чем у NVIDIA GT200. Рассмотрим, например, число одновременно выполняемых инструкций - 800 у RV770 и 240 (+ 60 SFU) у GT200 - разница значительная.

NVIDIA GT200AMD RV770AMD RV670
Число одновременно обрабатываемых потоковым процессором инструкций155
Кол-во потоковых процессоров24016064
Кол-во одновременно обрабатываемых графическим процессором инструкций в самом неблагоприятном случае24016064
Максимальное кол-во обрабатываемых процессором скалярных инструкций480*800320
*60 SFU у NVIDIA иногда могут "помочь" в обработке скалярных инструкций.

Уже сейчас мы можем сделать вывод, что архитектуры графических процессоров AMD и NVIDIA рассчитаны на разные типы нагрузки. Графический процессор NVIDIA лучше справляется со множеством простых потоков (по 1 потоку на потоковый процессор), процессор AMD - с насыщенными инструкциями потоками (т.к. может одновременно обрабатывать по 5 инструкций из потока).

NVIDIA GeForce GTX 280
NVIDIA GeForce GTX 280


AMD Radeon HD 4870
AMD Radeon HD 4870
  1. Обратите внимание на кэши инструкций (Instruction Cache) и данных (Constant Cache). NVIDIA размещает их в потоковых мультипроцессорах, а AMD - вне кластеров ядер SIMD.
  2. RV770 имеет только 4 64-битных контроллера памяти, в отличие от 8 у GT200.
  3. Программируемый тесселятор (занимающийся разделением полигонов на правильные (выпуклые) полигоны или на треугольники) унаследован от графического процессора Xbox 360 (и R600/RV670); к сожалению, большинство разработчиков его не использует, т.к. он до сих пор не имеет поддержки DirectX.
  4. AMD имеет отдельные аппаратные интерполяторы; у NVIDIA интерполяторы являются разделяемыми с SFU (блоками обработки специальных функций).

Если отбросить перечисленные выше различия, архитектура AMD в целом похожа на архитектуру NVIDIA; они отличаются лишь несколькими опциями в дизайне. NVIDIA развила архитектуру G80/G92; AMD сделала то же самое для RV770 - взяла RV670 и увеличила его вычислительные ресурсы более чем в 2 раза.

Образно говоря, шаг AMD от RV670 к RV770 больше, чем у NVIDIA от G80/G92 к GT200, но AMD из соображений конкуренции необходимо было сделать этот шаг.

[N4-Соотношение Вычисления : Обработка текстур]

В графическом процессоре GT200 NVIDIA увеличила вычислительную мощность примерно на 90%, а скорость обработки текстур - лишь на 25%, подчеркивая тенденцию увеличения вычислительной мощности графических процессоров.

Textures G200

Каждый из 10 TPC имеет 8 адресов и 8 фильтров. Теперь посмотрим на RV770:

Textures RV770

4 адреса и 4 фильтра; отношение кол-ва адресов к кол-ву фильтров то же, что и у NVIDIA - 1:1; отношение Вычисления : Обработка текстур у RV770 существенно выше.

AMD RV770AMD RV670NVIDIA GT200NVIDIA G92
Кол-во потоковых процессоров16064240128
Кол-во блоков обработки адресов текстур/Фильтров40 / 4016 / 1680 / 8064 / 64
Отношение Вычисления : Обработка текстур4:14:13:12:1

Из таблицы видно, что NVIDIA при переходе от G92 к GT200 увеличила отношение Вычисления : Обработка текстур от 2:1 до 3:1. AMD переплюнула NVIDIA уже в RV670 с соотношением 4 : 1, и у нее не было необходимости улучшать результат. Это означает, что для игр с бОльшим количеством текстур лучше походит NVIDIA, а для игр, требующих большой вычислительной мощности графического процессора - RV770.

AMD также внесла некоторые усовершенствования в модули обработки текстур. Способом, который AMD не разглашает, производительность на квадратный миллиметр была увеличена на 70%. Пропускная способность кэша текстур также была удвоена и составляет 480 Гб/сек, в то время как пропускная способность шины между каждым блоком кэша L1 и памятью L2 составляет 384 Гб/сек.

[N12-Конфигурация тестовых стендов]
Test Setup
ПроцессорIntel Core 2 Extreme QX9770 @ 3.20 ГГц
Мат. платаEVGA nForce 790i SLI
Intel DX48BT2
ВидеокартыATI Radeon HD 4870
ATI Radeon HD 4850
ATI Radeon HD 3870X2
ATI Radeon HD 3870
EVGA GeForce 9800 GTX KO
NVIDIA GeForce 9800 GTX+
NVIDIA GeForce 9800 GTX
NVIDIA GeForce 9800 GX2
NVIDIA GeForce 8800 GTX
NVIDIA GeForce 8800 GT
NVIDIA GeForce GTX 280
NVIDIA GeForce GTX 260
ВидеодрайверыCatalyst Press Driver (8.7 beta)
Catalyst 8.5
ForceWare 177.34 (для GT200)
ForceWare 177.39 (для 9800 GTX/9800 GTX+)
ForceWare 175.16 (все остальное)
Жесткий дискSeagate 7200.9 120GB 8MB 7200RPM
Оперативная память4 x 1GB Corsair DDR3-1333 7-7-7-20
Операционная системаWindows Vista Ultimate 64-bit SP1
Блок питанияPC Power & Cooling Turbo Cool 1200W
[N13-Crysis]

Crysis - игра, которая может оказаться "не по зубам" любой видеокарте. При настройках "high", а для шейдеров - "very high" даже для разрешения 1680x1050 всего 8 карт смогли обеспечить 30fps. В частности, с Crysis при указанных настройках не могут справиться карты серии HD3000, и только HD3870 X2 показала приемлемые результаты без обращения к Crossfire.

Crysis

Crysis - no AA

Результаты 4870 выглядят обнадеживающе. Эта карта на 7% обскакала на $100 более дорогую GTX 260 и обеспечивает приемлемую скорость смены кадров. Прирост в цене в 50% по сравнению с 4850 дал прирост в производительности всего в 20%. Конечно, такой результат не стал неожиданностью, он вполне согласуется с данными о производительности обработки шейдеров этими двумя картами, а тест является шейдеро-зависимым; но удивительно то, что изменение пропускной способности видеопамяти не привело к существенной разнице результатов даже при самом "неиграбельном" разрешении 1900x1200.

При разрешениях выше 1680x1050 HD4000 не может достичь 30fps; в этом случае придется либо понизить настройки, либо раскошелиться на одну из более дорогих видеокарт NVIDIA или решение Crossfire/SLI. В любом случае, с появлением серии HD4000 выбор видеокарты для Crysis теперь уже не ограничен только решениями от NVIDIA.

[N14-Call of Duty 4]

В Call of Duty 4 Radeon HD 4870 обгоняет на $100 более дорогую Geforce GTX 260. Интересно, что хотя в разрешении 1920 x 1200 Radeon HD 4870 почти на 11% быстрее GTX 260, обе карты показывают одинаковый результат в 2560 x 1600. И дело не в полосе пропускания памяти - у 4870 она достаточна; вероятно, причина в каком-то ограничении вычислительной мощности.

4870 наступает на пятки GeForce GTX 280, но до производительности GeForce 8800 GT в режиме SLI ему далеко из-за прекрасного масштабирования SLI в этой игре. Radeon HD 4850 превосходит не только GeForce 9800 GTX, но и 55-нанометровый GeForce 9800 GTX+.

Call of Duty 4

Call of Duty 4 - 4x AA
[N15-Enemy Territory: Quake Wars]

Quake Wars снова показывает превосходство 4870 над GTX 260; более того, 4870 в данном тесте приближается к GTX 280 при цене, составляющей половину от стоимости GTX 280. Radeon HD 4850 также существенно обгоняет линейку 9800.

Enemy Territory: Quake Wars

Enemy Territory: Quake Wars - 4x AA
[N16-Assassin's Creed]

Скорость смены кадров у Assassin's Creed ограничена чуть выше отметки 60 fps, поэтому большинство карт в тесте приближаются к этой отметке, но не превосходят её существенно. Производительность Radeon HD 4870 достаточна, но из-за указанного ограничения мы не можем проверить, может ли и насколько GTX 280 обогнать 4870. При использующемся сейчас геймплее 4870 и GTX 280 выглядят равносильными.

Assassin s Creed

Assassin s Creed - no AA
[N17-The Witcher] The Witcher показывает превосходство 4870 над 9800GTX+ с большим отрывом; по своим результатам 4870 приближается к более дорогой GTX 260. 4870 превосходит 4850 на 39% благодаря расширенной полосе пропускания памяти и повышенной частоте ядра. Хотя обе карты обеспечивают играбельную частоту смены кадров в разрешении 1920x1200, 4870 позволит играть с бОльшим комфортом, например, применять сглаживание (anti-aliasing) выше 2x.

В завершение заметим, что 4870 и 3870 X2 показывают одинаковые результаты до разрешения 2560x1600, при котором 3870 X2 вырывается вперед. Результат неожиданный. Кажется, карты серии HD4000 обладают худшим масштабированием, чем платы NVIDIA или серия HD3000.

The Witcher

The Witcher - 2x AA
[N18-Bioshock]

Результаты графического процессора AMD RV770 в Bioshock превосходны; Radeon HD 4850 практически догоняет GTX 280, а 4870 приближается к GeForce 9800 GX2.

Bioshock

Bioshock - no AA
[N19-Oblivion]

4870 догоняет GeForce GTX 260, HD 4850 выступает на уровне GeForce 9800 GTX. Неплохо, но совсем не похоже на результаты в Bioshock, что еще раз подтверждает, что производительность в играх существенно зависит от типа приложения.

Oblivion

Oblivion - 4x AA и 16x AF
[N20-Производительность Multi-GPU конфигураций в Crysis, Call of Duty 4, Enemy Territory: Quake Wars] Crysis

Производительность собственных решений NVIDIA multi-GPU превосходила производительность GeForce GTX 280 на момент ее выпуска, поэтому неудивительно, что НИКС - Компьютерный Супермаркет

подписаться   |   обсудить в ВК   |