Каталог
ZV
ездный б-р, 19
+7 (495) 974-3333 +7 (495) 974-3333 Выбрать город: Москва
Подождите...
Получить токен
Соединиться
X
Сюда
Туда
x
Не выбрано товаров для сравнения
x
Корзина пуста
Итого: 
Оформить заказ
Сохранить заказ
Открыть корзину
Калькуляция
Очистить корзину
x
Главная
Магазины
Каталог
Мои заказы
Корзина
Магазины Доставка по РФ
Город
Область
Ваш город - ?
От выбранного города зависят цены, наличие товара и
способы доставки

Среда, 14 октября 2009 00:00

AMD Radeon 5870: новое поколение видеокарт ATI на чипе RV870

короткая ссылка на новость:

Знакомство с Radeon HD 5870



   Как было упомянуто выше, в сегодняшнем тестировании примет участие только старшая карта из двух представленных на сегодняшний момент – Radeon HD 5870 на базе RV870 Cypress.
Radeon HD 5870

   По сравнению с Radeon HD 4870, в дизайне платы заметны некоторые изменения. Теперь AMD использует кожух кулера, полностью закрывающий PCB с лицевой стороны. Такое решение было применено NVIDIA впервые еще на 9800GTX. С обратной стороны также крепится металлическая пластина, которая служит радиатором и к тому же предохраняет мелкие хрупкие элементы, например, обвязки ядра, от механических повреждений. Длина платы составляет 26.7 см, что на 2.5 см длиннее 4890 и примерно равно Radeon HD 4870X2 или старшим картам 200 линейки GTX от NVIDIA.

   Из-за увеличившихся размеров были перемещены и PCIe коннекторы питания с торца на бок платы. Таким образом, был облегчен доступ к ним и, соответственно, обеспечено подключение дополнительного питания к плате. Что касается требований по питанию, то для обеспечения стабильного функционирования карты должны быть задействованы два шестиштырьковых разъема. Это может стать хорошей новостью для владельцев не слишком новых блоков питания, мощности которых для карты хватает с избытком, но, если бы использовалась пара 8+6 пин, пришлось бы пользоваться дополнительными переходниками (как, скажем, в случае с HD 4890 и GTX 285). Однако не стоит забывать, что и потребляемые картой 188 Вт создают существенную нагрузку на 12В линии БП, а значит, следует озаботиться проблемой качества питания карты и не подключать столь мощное устройство к старым или маломощным блокам.
Radeon HD 5870

   В свою очередь, HD 5850 несколько короче – его длина составляет 24.1 см. Конструкция системы охлаждения схожа со старшим HD 5870, однако разъемы питания размещены уже на торце платы.

   Интересно дело обстоит с разъемами подключения внешних дисплеев. Впервые на референсной карте (на данный момент все предлагаемые на базе RV870 платы являются референсными, фирменные модели производителей с собственным дизайном ждать еще долго) установлен полноразмерный DisplayPort. Помимо этого разъема присутствуют еще три порта – 2x DVI и 1x HDMI.

   Расположить целых 4 разъема на одной карте – задача нетривиальная, и в AMD ее решили довольно творчески. Вместо того, чтобы поместить пару DVI на одном уровне, как это сделано у большинства выпускающихся сегодня плат, цифровые интерфейсы были размещены параллельно друг другу. При этом DisplayPort и HDMI занимают оставшееся слева от DVI место на «нижнем ярусе». К сожалению, одновременно подключить четыре монитора, несмотря на наличие необходимых физических разъемов, не представляется возможным. DisplayPort работает отдельно и независим от прочих разъемов, однако на три оставшихся порта в чипе присутствует лишь 2 блока TMDS, таким образом, вы можете использовать или 2x DVI + 1x DP, или 1x DVI + 1x HDMI + 1x DP, но не 3x DVI и 1x DP. Плюс такого решения в том, что можно получить как 3x DVI при использовании переходника с DisplayPort на DVI, так и даже подключить через DVI на VGA старые мониторы с аналоговыми интерфейсами, но при этом для важного в HTPC HDMI порта отведено особое место, и никаких переходников для него не требуется. Согласитесь – в AMD могли бы пойти более простым путем, разместив попросту 1x DVI вместо двух, но компания представила более сложную и функциональную схему.

   Казалось бы, негативным побочным эффектом от такого действия могло бы стать ухудшение качества охлаждения. Ведь обычно на двухслотовых картах решетка, через которую горячий воздух выбрасывается из корпуса, занимает всю доступную ширину. В случае же с HD 5870 из-за довольно широкого верхнего DVI остается доступна лишь половинчатая ширина. Как показали наши тесты, опасение такого рода не подтвердилось, и проблем с охлаждением у нового Radeon нет. Так, под нагрузкой максимальная зафиксированная нами на HD 5870 температура соответствовала таковой у 4870 и 4850, достигая 89C. Это довольно удивительно, ведь TDP платы на 28 Вт больше, чем у 4870. Наверное, стоит благодарить массивный медный радиатор с четырьмя теплотрубками за качественный и быстрый отвод тепла от горячего чипа.
Radeon HD 5870

   Как следствие вышеописанных изменений, заметна и разница в уровне шума 5870 относительно 4870. Казалось бы, 27 Вт энергопотребления карты в покое должны дать возможность сделать HD 5870 практически бесшумным в таком режиме, но, по нашим наблюдениям и замерам, карты нового и старого поколения генерировали примерно одинаковый уровень шума порядка 46.6 дБ (естественно, речь идет обо всем системном блоке). Под нагрузкой же 5870 вполне ожидаемо оказался даже немного громче 4870, на уровне 64 дБ. Тем не менее, акустический режим карты довольно комфортен, характер звука вентилятора не раздражающий, каких-либо выбивающихся из спектра частот не замечено. Конечно же, у всех разные представления о приемлемом уровне шума, но, по нашему мнению, пусть карта и не самая тихая, шумит она совершенно адекватно своему уровню производительности. Ведь с использованием классических полупроводниковых технологий невозможно создать мощный чип, потребляющий много энергии, и при этом не позаботиться о качественном охлаждении. В случае с HD 5870 AMD нашла удачный компромисс между производительностью, шумом, и температурой кристалла. К тому же хочется отдельно отметить, что, хотя VRM многих современных карт (всех GTX 200 от NVIDIA и большинство HD 4800 от ATI) под серьезной нагрузкой начинает заметно пищать или потрескивать, с 5870 ничего подобного ни в одном из тестов нами замечено не было.

   Наконец, так как Radeon HD 5870 является базовой платой для всего нового 5000 семейства, стоит обратить внимание на ситуацию с локальной видеопамятью. Как вы могли заметить, данные в таблице говорят о двукратном росте количества исполнительных блоков GPU, память же при этом на новой карте всего на треть быстрее, чем раньше (переход от 900 МГц GDDR5 к 1.2 ГГц). Если с объемом все ясно (всем играм сегодняшнего и ближайшего завтрашнего дней достаточно 1 Гб видеопамяти), то со скоростью ее работы возникают вопросы.

   Дело в том, что, с учетом удвоения вычислительных блоков в ядре RV870 относительно RV770, логично было бы ожидать и двукратного прироста производительности, ведь по опыту предыдущего поколения Radeon можно говорить о практически линейной зависимости производительности от количества потоковых процессоров при равной частоте ядра и без недостатков ПСП. Однако ни в одном нашем тесте Cypress не был способен опередить HD 4870 ровно вдвое. Где-то HD 5870 подбирался к этой цели ближе, где-то дальше, но достичь ее ни разу не смог. Естественно – нам ум сразу же приходит гипотеза о недостаточной пропускной способности памяти. Тем не менее, при более тщательном рассмотрении проблемы оказывается, что проблема кроется скорее в недоработанности ранних версий драйверов (вспомните – второй релиз Catalyst для 4000 серии давал до 40-60% прироста 4870 и 4850 относительно первой тестовой версии), чем в узости шины памяти или недостаточно высоких частотах ее работы. Ведь в случае с HD 4850 использовался контроллер памяти типа GDDR3 с соответствующими чипами, а при той же самой 256-битной шине ПСП была чуть ли не в два раза ниже, чем у Radeon 4870. Тем не менее, результаты плат различались отнюдь не в два раза, и практика показывала, что разгоном чипа на HD 4850 можно достичь номинального уровня HD 4870 довольно легко. То есть, фактически, для HD 4870/4890 доступная пропускная способность, обеспеченная высокочастотной GDDR5 была даже излишней; AMD создала некий задел на будущее. Который отлично использовала, развив RV770 до уровня RV870 по функциональным блокам. Таким образом, если и стоит искать где-либо проблемы в производительности карты, начинать надо не с набортной видеопамяти, хотя, казалось бы, это самая логичная причина. Как уже было сказано, скорее причина отсутствия двукратного прироста относительно HD 4870 в программных недоработках, которые будут устранены в следующих версиях драйверов, или же на низком уровне архитектуры (неоптимальные внутренние тайминги чипа, недостаточные для 320 потоковых процессоров буферы и кэши и т.п.). [N4-Знакомство с остальными решениями Evergreen]    Похоже, что где-то по пути к Cypress AMD несколько отклонилась от пути создания кристаллов небольшой площади.
AMD

   Cypress занимает 334 кв. мм, что существенно больше 260 кв. мм RV770, с учетом того, что последний производится по 55 нм нормам, а RV870 – по 40 нм. Причина заключается в том, что в новом чипе использовано целых 2.15 миллиарда транзисторов против 956 миллионов у RV770. А ведь еще совсем недавно 1.4 млрд у GT200 казались огромным числом... Естественно, это не могло не привести к увеличению энергопотребления (188 Вт против 160 Вт) карты. И, что менее приятно, к ее подорожанию. Так, если на старте рекомендованные цены на HD 4870 и HD 4850 составляли €299 и €199 соответственно, в случае с HD 5870 и HD 5850 они выросли до €379 и €259. Естественно, чип новый и очень сложный, необходимо окупить затраты на разработку и «снять сливки», пока первый чип класса Fermi от NVIDIA только готовится к выходу, и в будущем цены будут снижаться, но сам факт такого удорожания настораживает. К тому же, AMD называла 256 кв. мм оптимальной площадью для GPU, а Cypress серьезно превосходит эту величину. Более того, уже сейчас понятно, что следующая архитектура AMD должна будет нести не столько количественные, сколько качественные изменения. Ведь фактически, как и в случае с GT200 у NVIDIA (который, не смотря на множество мелких отличий и усовершенствований, по сути, был увеличенным G80), RV870 является последователем RV770. С выпуском GTX серии NVIDIA поняла, что дальше изменять G80 невозможно, и принялась за разработку новой архитектуры, которая и будет впервые реализована в GF100. Для того чтобы сохранить конкурентное преимущество и не оказаться снова в ситуации, схожей с выпуском R600 или Phenom первого поколения, AMD/ATI стоит уже сейчас задуматься о своем следующем шаге. Ведь очевидно, что очередного удвоения исполнительных блоков будет недостаточно для эффективной конкуренции с NVIDIA на следующем витке борьбы, да и уже сейчас соотношение производительности и количества транзисторов не выглядит таким впечатляющим, как при выводе на рынок RV770.

   Кроме того, из-за большой площади RV870 во избежание пробелов в своей линейке для более дешевых карт AMD планирует выпуск еще одного чипа в семействе Evergreen.
Cypress

   Ситуация с топовыми картами понятна. Как и раньше, наиболее быстрые одиночные платы AMD будут использовать внутренний Crossfire (возможно, наконец-то заработает Sideport) и состоять из двух полноценных чипов RV870. Точной информации о Hemlock пока что нет, хотя в Сети уже проскакивали первые фотографии. Пока что известно, что AMD оперативно решает проблему высокого энергопотребления плат (еще бы – ведь и 4870X2 был очень горячим и громким, как поведут себя два RV870 на одной PCB представить довольно сложно). Из-за этого ходят различные слухи, что, возможно, 5870X2 представлен не будет вообще, а свет увидит лишь 5850X2. По аналогии – NVIDIA не решилась использовать в GTX 295 два полноценных GT200b, так что GTX 285 представляет собой не удвоенный GTX 285, а скорее GTX 275. Так же может поступить и AMD в этом поколении. Но пока что все это предположения, не подкрепленные фактами. Какой уровень производительности покажет 5800X2, и как он будет соотноситься с Fermi, мы узнаем совсем скоро. Пока же нас интересуют не 300 Вт монстры (ведь две HD 5870 потребляют до 376 Вт в Crossfire), а более дешевые платы, которые попадут в нишу до двухсот евро, которую в прошлом поколении занимал HD 4850.

   Именно здесь, похоже, и стоит ожидать появления еще одного чипа семейства Evergreen под именем Juniper. Хотя его анонс и намечен на Ноябрь, сейчас нет точных данных о характеристиках этого ускорителя. Ясно, что для того, чтобы вписать его в требуемые ценовые рамки, AMD придется уменьшить количество исполнительных блоков в чипе. По нашим расчетам стоит ожидать 14 SIMD блоков с соответствующим числом ROP, возможно, даже 192-битную шину памяти. Вопрос только в том, как собирается AMD выходить из такой ситуации при отсутствии компактного чипа. В случае с процессорами компания зачастую блокирует в полнофункциональных кристаллах ядра или кэш-память, но вряд ли на такое пойдут в случае с видеокартой ценой до 200 евро. Ведь даже в HD 5850 присутствуют деактивированные блоки. Тем не менее, не нам решать, что экономически выгоднее – использовать отбраковки производства RV870, назвав чип RV870LE, или же использовать новый кристалл, в котором изначально будет присутствовать меньшее число функциональных блоков.
Redwood

   С картами нижнего ценового диапазона таких проблем возникнуть не должно. Чипы Redwood и Cedar будут выпущены в первом квартале следующего года и станут заменой сегодняшних RV710 и RV730. Хотя они и будут построены на базе RV870, высокого уровня производительности ждать от таких карт не приходится. Подытоживая все вышесказанное, хочется отдельно отметить, что в ближайшие 6 месяцев AMD собирается выпустить 4 новых чипа, наделив всю свою линейку от самых бюджетных до топовых карт поддержкой DirectX 11. Уложиться в такой небольшой срок – сложная задача. Посмотрим, насколько успешно ATI сможет осуществить задуманное.

   Тем временем, перед тем как перейти к непосредственному тестированию новинки, необходимо разобраться в теоретических аспектах новой архитектуры. А для того, что бы лучше понять, чем в сущности является Cypress, освежим в памяти структуру его предшественника – RV770. [N5-Об архитектуре RV770 вкратце]    Итак, центральная часть чипа RV770 – Stream Processing Unit (SPU), арифметико-логическая единица наиболее низкого уровня. Именно количество SPU обычно указывается в характеристиках чипа, однако более правильно было бы говорить о потоковых процессорах, Streaming Processor (SP), каждый из которых включает в себя 5 SPU. Помимо них у каждого потокового процессора имеется свой регистровый файл и блок предсказания ветвлений. Таким образом, хотя формально расчетами занимаются непосредственно SPU, корректней было бы говорить именно об SP, как об основных блочных составляющих чипа. Ведь именно будучи объединенными с необходимыми блоками логики пятерки SPU в составе SP способны работать эффективно, обрабатывая как стандартные функции для классических ALU, так и трансцендентные функции.
SP

   Имеющиеся в чипе потоковые процессоры сгруппированы по 16 штук, к ним добавлены текстурные модули, кэш L1, разделяемая память и управляющая логика. Такой укрупненный блок в терминологии AMD обозначается SIMD модулем, и RV770 состоит главным образом из десяти таких модулей, именно их количество определяет общую вычислительную мощь ядра, хотя в самом чипе, естественно, трудится еще множество разных составных частей, таких блоки растеризации, L2 кэши, аппаратные тесселяторы и т.д.
RV770

   Однако все это великолепие не так-то просто использовать, как может показаться. Для того, что бы все доступные SP эффективно работали, нити инструкций передаются в них подготовленные специальным образом. Если говорить точнее, нити группируются во фронты, и в каждом таком фронте может находиться до 64 нитей. Таким образом, максимально эффективно чип может быть задействован только при исполнении команд с высоким уровнем параллелизма (Instruction Level Parallelism – ILP), так, чтобы все 5 SPU в каждом SP были загружены работой. А это, как вы понимаете, задача довольно сложная.

   Естественно, если SPU не загружены работой, общая производительность чипа падает, так как исполнительные модули попросту простаивают. Разработанная AMD архитектура обладает прекрасными теоретическими возможностями по вычислениям, но их грамотное использование – задача непростая.
Instruction Level Parallelism
[N6-Архитектура RV870 – что нового?]    Вспомнив, как функционирует RV770, посмотрим, что же нового добавили инженеры AMD в Cypress.

   Начиная с самого низкого уровня SPU, добавились несколько новых аппаратных инструкций, и увеличилась скорость исполнения старых. Это было сделано как для повышения производительности, так и для соответствия чипа стандартам различных API последних версий. Ускорение работы достигнуто за счет того, что некоторые инструкции, требующие ранее несколько циклов для исполнения, отныне могут быть рассчитаны за один заход. Поддержка необходимых для DirectX 11 команд, таких как count, insert и extract, была добавлена именно на этом уровне. Отдельное внимание было уделено обсчетом поднормалей, которые теперь производятся без потери скорости.
Cypress

   Наверное, одной из самых интересных добавленных инструкций стала сумма модулей разности – Sum of Absolute Differences (SAD). Она особенно часто применяется при кодировании видео и анализе графических данных, так как в геометрическом плане с ее помощью легко оценивать движение. В случае с RV770 аппаратная поддержка SAD попросту отсутствовала, а для ее эмуляции требовалась цепочка из, по меньшей мере, 12 инструкций. С добавлением SAD в SPU исполнение инструкции занимает один единственный такт, и, по словам AMD, это должно более чем в два раза убыстрить кодирование видео силами GPU.

   Несколько удручает, что SAD не является обязательной частью DirectX 11 или OpenCL, а это значит, что написанные под DX программы не могут вызывать ее, то же справедливо и для OpenCL, но для этого API хотя бы существует необходимая библиотека. С другой стороны, эти API не ограничивают жестко поведение GPU, поэтому динамический компилятор AMD может на лету распознать возможности оптимизаций (например – упомянутую выше цепь из 12 инструкций) и заменить необходимые части общего кода на более эффективные для данной конкретной архитектуры. То есть, даже если программист и не вызывал какие-либо нужные функции вручную, интеллектуальные алгоритмы смогут компенсировать это упущение самостоятельно.

   Так выглядит список инструкций, который блок SP Cypress может исполнять за один-единственный такт:
  • 4x 32-битных FP MAD
  • 2x 64-битных FP MUL или ADD
  • 1x 64-битный FP MAD
  • 4x 24-битных Int MUL или ADD
  • SFU: 1x 32-битный FP MAD
   Следуя дальше по иерархии, переходим к SIMD блокам. Помимо улучшений в SP, текстурный кэш L1, расположенный здесь, получил внушительную прибавку к производительности. Хотя его размер не изменился (у каждого SIMD в наличии по 16 Кб L1), скорость работы с данными возросла до впечатляющих 1 Тб/с. Помимо этого, в дополнение к имеющемуся текстурному кэшу было добавлено 8 Кб для хранения промежуточных вычислений SIMD. Наконец, вдвое возросло (до 32 Кб) локальное хранилище данных, подключенное к каждому модулю.
rv870

   Текстурные модули были также переработаны. Первое из внесенных изменений – добавленная возможность чтения сжатых AA цветовых буферов для более рационального использования пропускной способности. Второе – в AMD задались целью повысить скорость интерполяции, и реализовали это довольно интересным способом. Текстурные модули попросту лишили этой способности, перенеся ее в обязанности SP (это часть спецификаций DirectX 11). Это позволило значительно увеличить быстроту выполнения операций данного типа. Вследствие этого текстурные модули в Cypress имеют более высокую скорость закраски (филрейта), чем в RV770. Данное обстоятельство будет хорошо отражено в синтетических тестах. AMD утверждает, что чип способен в совокупности достигать показателя в 68 миллиардов билинейно отфильтрованных текселей в секунду, что является результатом переброски интерполяции на SP и проделанных оптимизаций для более рационального расходования пропускной способности.

   Наконец, снова делая шаг вверх по лестнице архитектурных уровней, мы добрались до основной причины превосходства в производительности RV870 над своим предшественником. AMD удвоила количество SIMD блоков с 10 до 20 штук. Это означает двукратное количественное превосходство по всему, начиная от SP и кончая текстурными модулями. Это довольно банальное изменение, в отличие от добавления новых низкоуровневых команд или переработки кэшей, зато наиболее действенное.
Cypress

 &

Источник: www.anandtech.com/

подписаться   |   обсудить в ВК   |