Каталог
ZV
ездный б-р, 19
+7 (495) 974-3333 +7 (495) 974-3333 Выбрать город: Москва
Подождите...
Получить токен
Соединиться
X
Сюда
Туда
x
Не выбрано товаров для сравнения
x
Корзина пуста
Итого: 
Оформить заказ
Сохранить заказ
Открыть корзину
Калькуляция
Очистить корзину
x
Главная
Магазины
Каталог
Мои заказы
Корзина
Магазины Доставка по РФ
Город
Область
Ваш город - ?
От выбранного города зависят цены, наличие товара и
способы доставки

Пятница, 26 августа 2005 01:00

Обзор архитектуры NVIDIA G70 на примере MSI GeForce NX7800GTX

короткая ссылка на новость:
     Обзор архитектуры NVIDIA G70 на примере MSI GeForce NX7800GTX      Обеспечение своевременного (и в достаточном количестве) появления новинок на рынке всегда было “визитной карточкой” NVIDIA и ее партнеров. Однако в прошлом новинка обычно появлялась в розничной продаже спустя, как минимум, месяц после анонса, а в отдельных случаях, как, например, в случае с GeForce FX 5800, даже позже. В случае же с GeForce 7800 GTX, карты поступили в продажу в день анонса – подвиг, практически не имеющий аналогов среди разработчиков графических чипов.
     Поначалу установленную NVIDIA цену за новинку (600$) сочли чрезмерно высокой, но с появлением таких решений под 7800 GTX, как версия Dell стоимостью менее 500$, обсуждение данной темы постепенно сошло на нет. Кроме того, успешной продаже 7800 GTX способствовало также отсутствие конкурентов. ATI вновь отложила выпуск своего нового чипа, предоставив 7800 GTX возможность еще по крайне мере в течение нескольких месяцев наслаждаться никем не оспариваемым лидерством на рынке чипов класса high-end.
     Принимая во внимание перечисленные выше факты, партнеры NVIDIA один за другим представляли свои версии видеокарт на чипсете 7800 GTX, а особо нетерпеливые “болельщики” NVIDIA охотно их раскупали.
     Проблема состояла в том, что все ранние версии видеокарт под 7800 GTX строго следовали рекомендованной NVIDIA референсной спецификации. В результате, карты мало, чем отличались друг от друга, что в свою очередь породило гонку среди производителей за возможность максимально быстро выпустить свою версию карты на рынок.
     MSI выпустила свою версию видеокарты (NX7800 GTX-VT2D256E) одной из первых.

Архитектура G70. Беглый взгляд


     Переход с NV30 на NV40 ознаменовал собой смену архитектурной философии NVIDIA. За основу была принята концепция, ранее успешно реализованная ATI в чипсетах Radeon 9700. NV30 обладал глубокой, 4-конвейерной архитектурой с многочисленными ALU (Arithmetic Logic Units) и объединяющим блоком в каждом пиксельном конвейере; в NV40 глубина архитектуры конвейера была сокращена до двух ALU, один из которых выполнял, в том числе и обработку текстурных координат. Результатом изменения глубины конвейера стал переход с 4 пиксельных конвейеров (один квад) на 16-конвейерную архитектуру (четыре квада). В G70 идеи параллелизма были еще более усовершенствованы.      Архитектура G70
    Согласно приведенной схеме, в G70 число пиксельных конвейеров выросло до 24 (6 квадов), но число растровых конвейеров (ROP – Raster Operations Pipes), осталось прежним –16. Это означает, что максимальное число обрабатываемых за такт точек-семплов составит 16 значений цвета или 32 значения глубины и буфера шаблонов. Данный тип организации довольно сильно напоминает архитектуру NV43 (GeForce 6600) с той лишь разницей, что G70 обладает значительно большим количеством конвейеров. Стоит заметить, что соотношение числа пиксельных и растровых конвейеров 1:1 постепенно теряет свою актуальность, поскольку основная ответственность возлагается на качество шейдерной обработки. В результате, основная нагрузка приходится на пиксельные и вершинные процессоры (конвейеры), а запись семплов в буфер кадра далеко не всегда является самой частой операцией. Кроме того, 256-битная шина памяти G70 вряд ли позволит получить значительный прирост в производительности от дальнейшего увеличения числа растровых конвейеров. Поэтому, более целесообразно потратить выделенные для этого средства на что-нибудь другое. Наряду с пиксельными процессорами, было также увеличено число вершинных процессоров – в G70 их 8.

Изменения в архитектуре


     Несмотря на то, что NVIDIA называет G70 совершенно новой архитектурой, в действительности это не совсем так. Отсутствие изменений в API и заимствованная у NV40 поддержка шейдеров версии 3.0 (Shader Model 3.0) говорят о том, что NVIDIA предпочла не вносить кардинальных изменений в архитектуру, на практике доказавшей свою исключительную эффективность. Поэтому, организация конвейеров и функциональных блоков в архитектуре G70 не слишком сильно отличается от NV40, и о том, что между выпуском двух чипов прошло более года, говорят лишь небольшие отличия, призванные повысить уровень производительности каждого отдельного конвейера G70.
     8 вершинных процессоров G70 объединяются в массив MIMD (Multiple Instruction, Multiple Data – Много потоков команд – много потоков данных). Подобно архитектуре NV40, каждый элемент включает векторный и скалярный ALU, что позволяет выполнять за один такт две операции (одну – с 4 элементами данных и другую – с 1 элементом), и, как утверждают представители NVIDIA, способен выполнять операцию ветвления без потерь в производительности. Каждый вершинный процессор оснащен текстурным блоком, отвечающим за выборку текстур. В выборке могут участвовать одновременно до 4 текстур. Поэтому для того, чтобы скрыть задержки, которые могут возникать в процессе выборки, обработка данных осуществляется в потоковом режиме. Следует также отметить, что каждый вершинный процессор обладает возможностью выполнения однотактовой MADD операции (тогда как вершинные процессоры в архитектуре NV40 не обладали такой возможностью), а также то, что в G70 была увеличена производительность в операциях со скалярными величинами и, по словам представителей NVIDIA, предприняты попытки ускорить процесс на этапах отсечения вершин и установки треугольников.      Изменения в архитектуре
     Наиболее значительным изменениям в архитектуре G70 подверглись пиксельные конвейеры. За основу были взяты принципы, опробованные в NV40. В частности, в G70 перекочевала идея двух ALU, поддерживающих попарный запуск команд, один из которых выполняет, в том числе и обработку текстурных координат. В архитектуре G70 она получила развитие в русле увеличения числа выполняемых за один такт операций. Специалисты NVIDIA проанализировали 1300 шейдеров, используемых в уже продаваемых и готовящихся к выпуску играх, и пришли к выводу, что наиболее часто выполняемой операцией является операция MADD (Mult + ADD – Умножение + сложение). В архитектуре NV40 число ALU в каждом пиксельном конвейере уже было сокращено до двух, но они выполняли разные операции: один выполнял операции MADD, а другой – операции MULL. В G70 NVIDIA добавила функцию выполнения операций MADD и MULL в каждый ALU. В результате, ALU стали функционально дублировать друг друга, хотя второй элемент по-прежнему не выполняет обработку текстурных координат. Таким образом, G70 использует 48 ALU с одинаковыми функциональными возможностями, один из которых в каждой паре выполняет обработку текстурных координат.
     Пиксельные конвейеры объединяются в массив SIMD (Single Instruction, Multiple Data – Один поток команд – много потоков данных) и работают над одним фрагментом изображения.
     Подобно архитектуре NV40, в G70 ALU обрабатывают данные в формате FP32, и каждая пара оснащена дополнительным независимым блоком FP16 для нормализации векторов. Каждый ALU (на схеме – FP32 Shader Unit) представляет собой одновекторный элемент, который, несмотря на это способен выполнять 2 операции с 4 или менее компонентам данных. Возможно следующее распределение нагрузки: 3+1 (одна операция выполняется для трех компонентов, другая – для одного), 2+2, 2+1, 1+2, 1+1. Текстурные блоки способны выполнять билинейную фильтрацию за один такт. Анизотропная фильтрация в сочетании с билинейной или трилинейной выполняется за несколько тактов в режиме до 16x. Фильтрация возможна как с целочисленным форматом семплов, так и с форматом FP16, которая выполняется также за один такт.
     По словам представителей NVIDIA, в G70 была оптимизирована работа с большими текстурами. И хотя об этом не было сказано напрямую, тем не менее, в регистрационных журналах Far Cry был зафиксирован факт автоматического включения движком формата сжатия карт нормалей 3Dc, что свидетельствует о поддержке со стороны драйверов G70 текстур формата FOURCC.

Пиксельный конвейер ROP
Пиксельный конвейер ROP

     Растровые конвейеры ROP (Raster Operation Pipes) не претерпели серьезных изменений. Подобно архитектуре NV40, они способны обрабатывать одно значение цвета и одно значение глубины/ буфера шаблонов или два значения глубины/буфера шаблонов за один такт, а также выполнять смешивание значений на объектах рендеринга формата FP16. Механизм FSAA (Full Screen Anti-Aliasing) также заимствован у архитектуры NV40: расчет цвета пиксела выполняется на основе анализа максимум 4 точек-семплов, расположенных в изображении на виртуальных линиях развернутой по диагонали решетки (2 набора точек-семплов за такт). Однако, использование данного метода на объектах смешивания цветов одного из форматов с плавающей запятой по-прежнему невозможно. По словам NVIDIA, в G70 была увеличена скорость расчета в режиме FSAA, а также добавлен новый метод обработки альфа-текстур (Transparency Anti-Aliasing), позволяющий получать более реалистичное изображение без потерь в скорости (более подробно данный метод описан в разделе “Качество изображения”), хотя мы склонны полагать, что новый метод скорее относится к шейдерной технологии, чем к работе растровых конвейеров. Растровые конвейеры поддерживают гамма-корректируемый MSAA (Gamma Adjusted MSAA), но режим необходимо включать вручную из панели управления драйвера.
     С момента представления технологии смешивания значений цвета и фильтрации в форматах с плавающей запятой, многие производители внедрили ее в свои решения. Реализация данной технологии в архитектуре NV40 оказалась не самой удачной. Поэтому в G70 оптимизация структуры конвейера проводилась главным образом в русле повышения эффективности операций с плавающей запятой.
     Контроллер памяти остался без изменений: так же, как и в архитектуре NV40, 256-битный интерфейс поделен на 4 64-битных канала.

Чип


     G70 является, пожалуй, самым амбициозным проектом на сегодня в области 3D графики. Ниже перечислены его базовые характеристики.
    
Кодовое имя G70
Технология 110nm (TSMC)
Число транзисторов 300 млн.
Размер кристалла 334 мм²
(18.65 мм (Ш) x 17.9 мм (В))
Корпус Flip-chip
Конфигурация конвейеров 24/16/32
(Текстуры/Пикселов/Значений глубины за такт)
Интерфейс памяти 256 бит (4 64-битных канала)
DDR, GDDR-2, GDDR-3
Поддержка DirectX DX 9.0 – VS 3.0, PS 3.0
RAMDAC 2 × 400 МГц
Шина PCI Express 16х

     Чип
     Конфигурация чипа и технология его производства соответствуют предполагаемым характеристикам NV47, слухи о которых ходили в ожидании появления новинки от NVIDIA. Техпроцесс стал более тонким (110nm); возросшее число транзисторов (свыше 300 миллионов) привело к увеличению площади кристалла и, неизбежно, к сокращению числа кристаллов на пластине.
     В соответствии с установившейся тенденцией на рынке графических чипов класса high-end, для подключения карты будет использоваться интерфейс PCI Express. И хотя NVIDIA пока не объявляла возможной конфигурации под AGP интерфейс, можно предположить, что для обеспечения работы нового процессора с шиной AGP, будет вероятнее всего использоваться HSI мост, что имело место, например, в решениях под NV45.


Возможности G70:

  • Архитектура CineFX 4.0
    • Полная поддержка Full DirectX9
    • Поддержка DirectX9 Shader Model 3.0
    • Vertex Shader 3.0
      • Вершинные шейдеры версии 3.0
      • Пиксельные шейдеры версии 3.0
      • Операции с плавающей запятой для компонент формата FP32
    • Неограниченная длина шейдерных программ
    • Обработка до 16 текстур за один такт
    • Поддержка текстур с форматом компонент FP16
    • Возможность фильтрации текстур с форматом компонент FP16
    • Поддержка текстур с форматом компонент FP32, без возможности фильтрации
    • Одновременный рендеринг нескольких объектов
  • Технология NVIDIA High Precision Dynamic Range
    • Поддержка операций с плавающей запятой для компонент формата FP16 на протяжении всего конвейера рендеринга
    • Поддержка операций с плавающей запятой для компонент формата FP16 в буфере кадров
  • Intellisample 4.0
    • Сглаживание (AA) в режиме до 4X, гамма-корректируемое, в режиме FSAA с расчетом по “диагональной решетке”, в режиме SSAA и Transparent MultiSampling
    • Сжатие цветовых, текстурных данных и данных Z-буфера без потерь
    • Анизотропная фильтрация в режиме до 16x
  • UltraShadow Technology
  • Поддержка технологии NVIDIA SLI
  • Технология NVIDIA Pure Video
    • Адаптируемый, программируемый видеопроцессор
    • Высокая скорость и точность декодирования MPEG2 и WMV9
    • Spatial Temporal de-interlacing
    • Inverse Telecine
    • Microsoft Video Mixing Renderer (VMR)
    • Интегрированный интерфейс HDTV Out
  • Advanced Display options
    • Специализированный, встроенный в чип видеопроцессор
    • Технология nView Multi Display
    • Digital Vibrance Control 3.0

Карта

     NX7800GTX
     Подобно первому поколению карт на чипсете 7800 GTX, второе поколение в точности следует референсной спецификации. Единственное их отличие состоит в обновлении охлаждающих элементов.
     Учитывая тот факт, что MSI всегда была сторонником медных систем охлаждения и активно применяла их на своих картах, можно было с уверенностью предположить, что и на карте под 7800 GTX мы увидим медную систему охлаждения.
     По своим характеристикам NX7800GTX ничем не отличается от референсной спецификации NVIDIA.
    
Чип GeForce 7800 GTX
Частота ядра 430 МГц
Число пиксельных конвейеров 24
Скорость закраски 6880 млн. пикселов/сек.
Скорость выборки текстур 10320 млн. текселов/сек.
Вершинные процессоры 8 вершинных процессоров объединенных в массив MIMD
Установка треугольников 860 млн. треугольников/сек.
Частота работы памяти 600 МГц
Пропускная способность памяти 38.4 Гбайт/сек.
Емкость буфера кадров 256 Мбайт
Шина PCI Express 16х

     Одной из бросающихся в глаза деталей является более компактный по сравнению с картами под 6800 Ultra дизайн: карта занимает лишь один слот, и ее система охлаждения спроектирована таким образом, чтобы не мешать установке в соседний слот другой видеокарты. Довольно крупный медный радиатор с системой теплоотвода и вентилятором, который выводит нагретый воздух в направлении противоположном от планки с разъемами. Обращают на себя внимание также размеры карты – длина PCB составляет 229 мм, что приблизительно на 14 мм длиннее NX 6800 Ultra. Интерфейс PCI Express способен обеспечить питание мощностью максимум 75 Ватт. Поэтому для того, чтобы обеспечить обе платы питанием достаточной мощности, необходим дополнительный встроенный разъем питания PCI Express. NVIDIA особенно подчеркивает, что система управления питанием G70 была серьезно переработана. В частности, была добавлена возможность перевода неиспользуемых частей кристалла в режим экономичного энергопотребления. Таким образом, несмотря на более высокую производительность, 7800 GTX потребляет меньше энергии, чем 6800 Ultra.
     Расположение микросхем памяти аналогично картам на чипе NV40, с той лишь разницей, что на этот раз микросхемы установлены через одну: одна на лицевой стороне, другая – на обратной (а не по принципу “если есть на лицевой стороне, то на обратной стороне – нет”), что в будущем даст возможность выпускать версии с объемом памяти 512 Мбайт. Например, мы уже видели чипы Samsung 512Mb 700MHz GDDR3, которые отличаются более ярко выраженной прямоугольной формой, по сравнению с традиционными решениями. Поэтому, можно предположить, что такой способ размещения модулей памяти выбран с расчетом на то, чтобы в дальнейшем облегчить установку дополнительных, даже нестандартных по форме, модулей для получения большего объема памяти за счет более плотного расположения меньшего количества модулей.
     Подобно всем видеокартам на чипсетах GeForce 6-ой серии с поддержкой SLI, MSI NX7800GTX оснащена разъемом SLI, а также двумя DVI выходами.
     Карта оснащена разъемами Video In/Video Out, двумя разъемами DVI и продается с полным набором аксессуаров, который Вы обычно ожидаете увидеть в комплекте поставки видеокарты класса high-end (два DVI адаптера, кабель S-Video, кабель питания, кабель с одним разъемом видеовхода и несколькими компонентными разъемами видеовыхода, который позволяет подключить карту к аппаратуре HDTV, а также DVD с копией Chronicles of Riddick).

MSI Dynamic Overclocking Technology Express


     Для того, чтобы выделить свою карту среди во многом подобных карт других производителей, MSI снабдила карту поддержкой своей технологии динамического разгона – Dynamic Overclocking Technology Express (D.O.T. Express). Данная технология позволяет разогнать карту в одном из 6 режимов в зависимости от текущей температуры процессора: Private (увеличивает тактовую частоту процессора на 2%), Sergeant (4%), Captain (6%), Colonel (8%) General (9%) или Commander (10%).
     Если Вам не нравится идея динамического увеличения тактовой частоты процессора, Вы можете вручную выбрать любой из шести режимов разгона или вручную изменить тактовую частоту процессора или частоту памяти.
     Единственным недостатком D.O.T. Express является то, что данная технология работает только с “родными” драйверами MSI и не работает с драйверами NVIDIA. Большинство пользователей предпочитает использовать драйверы NVIDIA, а не драйверы для конкретной видеокарты, поскольку NVIDIA обновляет свои драйверы значительно чаще. Например, последнее обновление драйвера ForceWare (версия 77.77) на сайте nvidia.com датировано 11 августом 2005, тогда как последнее обновление ForceWare (версия 77.50) на сайте MSI – 6 июля 2005.

Конфигурация стенда



Процессор AMD Athlon 64 FX-55
Материнская плата ASUS A8N-SLI Deluxe
Память 1GB OCZ DDR400 SDRAM
Тестируемые видеокарты EVGA e-GeForce 7800 GT
MSI NX7800GTX
MSI NX7800 GTX SLI
NVIDIA GeForce 7800 GTX
NVIDIA GeForce 6800 Ultra
Версия драйвера 77.77
Жесткий диск 250GB Maxtor Hard Drive Maxline III SATA Hard Drive w/16MB Cache
Операционная система Windows XP Professional SP1
DirectX Runtime DirectX 9.0c


Тесты


     Pacific Fighters
     IL-2 Sturmovik: Forgotten Battles
     Far Cry 1.31
     Half-Life 2
     Battlefield 2
     F.E.A.R. Beta
     Splinter Cell

Pacific Fighters - OpenGL

Pacific Fighters - OpenGL 1
























Pacific Fighters - OpenGL 2























Pacific Fighters - OpenGL 3























Pacific Fighters - OpenGL 4























Far Cry – Direct3D

Far Cry – Direct3D 1
























Far Cry – Direct3D 2























Far Cry – Direct3D 3























Far Cry – Direct3D 4























IL-2: FB – OpenGL

IL-2: FB – OpenGL 1
























IL-2: FB – OpenGL 2























IL-2: FB – OpenGL 3























IL-2: FB – OpenGL 4























Splinter Cell: Chaos Theory – Direct3D

Splinter Cell: Chaos Theory – Direct3D 1
























Splinter Cell: Chaos Theory – Direct3D 2























Splinter Cell: Chaos Theory – Direct3D 3























Splinter Cell: Chaos Theory – Direct3D 4























Half-Life 2 – Direct3D

Half-Life 2 – Direct3D 1
























Half-Life 2 – Direct3D 2























Half-Life 2 – Direct3D 3























Half-Life 2 – Direct3D 4























Battlefield 2 – Direct3D

Battlefield 2 – Direct3D 1
























Battlefield 2 – Direct3D 2























Battlefield 2 – Direct3D 3























Battlefield 2 – Direct3D 4























F.E.A.R. Performance
F.E.A.R. Beta – Direct3D

F.E.A.R. Performance 1
























F.E.A.R. Performance 2























F.E.A.R. Performance 3























F.E.A.R. Performance























F.E.A.R. 4xAA/16xAF
F.E.A.R. Beta – Direct3D

F.E.A.R. 4xAA/16xAF 1
























F.E.A.R. 4xAA/16xAF 2























F.E.A.R. 4xAA/16xAF 3























Overclocking
Battlefield 2 – Direct3D

Overclocking  Battlefield 2 – Direct3D 1




















Overclocking  Battlefield 2 – Direct3D 2



















Overclocking  Battlefield 2 – Direct3D 3



















Overclocking
Half-Life 2 – Direct3D

Overclocking  Half-Life 2 – Direct3D 1




















Overclocking  Half-Life 2 – Direct3D 2



















Overclocking  Half-Life 2 – Direct3D 3



















Overclocking  Half-Life 2 – Direct3D 4



















Плюсы


Графический процессор GeForce 7800 GTX: 24 конвейера, частота ядра 430 МГц и 256 МГц памяти GDDR3, работающей с частотой 600 МГц делают G70 самым мощным графическим чипсетом на рынке.
     Chronicles of Riddick: MSI включила в комплект поставки своей карты копию Starbreeze Studios Chronicles of Riddick: Escape from Butcher Bay. Chronicles of Riddick – прекрасная игра, заслужившая положительные отзывы, как критиков, так и конечных пользователей и способная создать достойную нагрузку NX7800GTX (особенно при включении функции “soft shadows”).
     Если Вы хотите приобрести именно NX7800GTX имейте в виду, что есть два типа комплектации карты. Один тип комплекта поставки включает полную версию Chronicles of Riddick, а другой – только демо-версию. Карта с сокращенным комплектом поставки продается по более низкой цене, что делает ее популярной среди Интернет-магазинов, пытающихся привлечь покупателя максимально низкими ценами. Поэтому прежде, чем сделать покупку, убедитесь, что Вы приобретаете именно ту карту, которая Вас интересует.
     Стоимость/доступность: как уже было сказано выше, MSI продает NX7800GTX с разными комплектами поставки. Карта, в комплект поставки которой входит только демо-версия Chronicles of Riddick, продается по более низкой цене, чем карта, в комплект поставки которой входит полная версия данной игры. Например, на сайте Newegg.com MSI NX7800GTX с сокращенным комплектом поставки предлагают приобрести за $479, что на $199 ниже цены, рекомендованной производителем ($600).
    

Минусы


     Точное следование референсной спецификации: в отличие от многих других производителей, которые предпочли выпустить разогнанную версию 7800 GTX, MSI NX7800GTX в точности повторяет референсную спецификацию: тактовая частота процессора и памяти соответствует частотам на референсной NVIDIA 7800 GTX, а система охлаждения спроектирована таким образом, чтобы не мешать установке в соседний слот другой видеокарты.

Источник: НИКС - Компьютерный Супермаркет

подписаться   |   обсудить в ВК   |