С тех пор как производство по нормам ниже 28 нм стало доступным и коммерчески оправданным для таких крупных микросхем, как дискретные графические процессоры, и AMD, и NVIDIA заменили свою прошлую продукцию чипами нового поколения, предлагающими совершенно иное соотношение быстродействия и мощности. Однако если NVIDIA не потребовалось много времени, чтобы заполнить все эшелоны производительности ускорителями на базе архитектуры Pascal и превзойти рекорды производительности, установленные в эпоху Maxwell, то AMD сосредоточила усилия на продуктах средней и начальной ценовой категории, фактически устранившись от конкуренции в сегменте высокопроизводительной графики.
Видеокарты на основе GPU семейства Polaris хорошо проявили себя как доступный массовый продукт и помогли графическому подразделению AMD вернуть рыночные позиции, упущенные картами Radeon 300-й серии. Тем не менее, AMD изначально дала понять, что Polaris, в отличие от предшествующих архитектур, не будет развиваться в сторону больших чипов, какими были ядра Hawaii и затем Fiji в эпоху 28 нм.
Действительно, хотя Polaris выиграла в энергоэффективности от перехода на норму 14 нм FinFET, она все еще имеет много общих черт со старыми продуктами AMD (Tonga и Fiji), которые помешали столь же эффективно распорядиться преимуществами прогрессивного техпроцесса. И хотя AMD исправила положение путем оптимизации производства и схемотехники GPU во втором поколении Polaris, карты Radeon RX 500-й серии по-прежнему ограничены в потенциале тактовых частот и лишены архитектурных преимуществ, которые могли бы нарастить быстродействие в инструкциях за такт. Как микроархитектура GCN, лежащая в основе чипов AMD, так и организация блоков внутри графического процессора требовали пересмотра, и эта задача легла на грядущее семейство Vega.
Чтобы не было сомнений в том, что AMD еще вернется на рынок GPU для энтузиастов, компания заранее рассказала довольно много о том, что представляет собой Vega, а в июле выпустила ускоритель Radeon RX Vega Frontier Edition. Сегодня же мы, наконец, можем изучить массовый геймерский продукт AMD на основе кремния нового поколения — Radeon RX Vega 64.
⇡#Архитектура AMD Vega
NCU — Next-generation Compute Unit
Основным строительным блоком в архитектуре Graphics Core Next является Compute Unit, который в данном случае обозначается аббревиатурой NCU (Next-generation Compute Unit). Со времен первой реализации GCN более пяти лет тому назад AMD не вносила кардинальных изменений в структуру CU. Как и в предыдущих итерациях, NCU в составе Vega по-прежнему содержит 64 шейдерных ALU, которые способны выполнить 128 операций одинарной точности (FP32) за такт. Объем кэша первого уровня и разделяемой памяти внутри NCU также остался неизменным со времен GCN 1.0. Тем не менее, если в GCN версии 1.3, к которой относятся чипы Polaris, CU лишь претерпел оптимизации, способствующие увеличению удельной производительности по сравнению с CU в GCN 1.2 (Tonga и Fiji), и две версии архитектуры даже остались совместимы на уровне ISA, разработчики Vega внедрили массу новых инструкций и форматов данных, за счет которых GCN пятого поколения можно расценивать как наиболее глубокое преобразование шейдерной микроархитектуры Graphics Core Next на сегодняшний день.
Как и Polaris, Vega может выполнять операции над вещественными и целыми числами с половинной точностью (FP16), но в Vega дополнительно появилась поддержка целочисленных операций с точностью 8, 16 и 32 бит. Что касается целочисленных форматов данных со сниженной разрядностью, то у них уже сейчас есть масса применений. К примеру, формат INT8 используется для обработки данных с помощью предварительно натренированных сетей машинного обучения (inference), а INT32 — для расчета хэшей в криптографических алгоритмах (включая майнинг криптовалют). С другой стороны, востребованность операций над вещественными числами с половинной точностью не столь очевидна. Формат FP16 широко используется для обработки шейдеров в мобильной графике, но уницифированная шейдерная модель десктопных API изначально сделала выбор в пользу FP32. Тем не менее, FP16 может со временем найти применение и в десктопной графике для тех задач, которые не требуют полной точности для сохранения качества изображения — таких как векторы нормали, значения освещенности и HDR.
Но самое главное — это то, что NCU в составе Vega способен комбинировать операции сниженной разрядности, таким образом кратно увеличивая пропускную способность. К примеру, вместо 128 операций за такт над числами FP32, которые выполняет отдельно взятый NCU, может быть выполнено 256 операций FP16 или 512 операций FP8. Единственным из прочих GPU, который наделен такой функций, на сегодняшний день является GP100 от NVIDIA. Таким образом, Vega, помимо высокопроизводительной игровой архитектуры, представляет собой универсальное решение для расчетов широкого назначения — во всем, кроме двойной точности, т.к. пропускная способность FP64 ограничена значением 1/16 от FP32.
Тайловый рендеринг и поддержка Direct3D feature level 12_1
Следующая область, в которой Vega сделала большой шаг вперед, — это пропускная способность в пикселах. Вслед за NVIDIA, AMD использует в Vega тайловый рендеринг — технологию, которая широко используется в мобильной графике и позволяет сократить количество обращений к данным, находящимся за пределами кеш-памяти GPU. Аналогично работает и механизм Draw-Stream Binning Rasterizer (DSBR) в составе Vega.
Классический тайловый рендеринг, широко распространенный в мобильных GPU, подразумевает обработку кадра в два прохода. Сначала драйвер разделяет экранное пространство на тайлы (участки с типичным размером 16 × 16 или 32 × 32 пиксела) и составляет индекс полигонов, находящихся в проекции каждого тайла. Затем последовательно в пределах каждого тайла целиком выполняется процедура рендеринга — от трансформации и пересечения полигонов до заполнения текстур и исполнения шейдеров — и конечный результат всех тайлов сшивается в единую картинку. Преимущество такого метода состоит в том, что любые промежуточные операции в пределах тайла оперируют единым массивом данных, который целиком помещается в кеш GPU, а следовательно, сокращается частота обращений к оперативной памяти.
Тем не менее, необходимость в двух проходах обработки геометрии сцены сама по себе расходует пропускную способность RAM, поскольку GPU необходимо сначала записать во внешнюю память информацию о полигонах, попадающих в тот или иной тайл, а затем, выполняя рендеринг от тайла к тайлу, извлекать ее обратно. Как следствие, эффективность тайлового рендеринга в конечном счете зависит от того, перевешивает ли экономия ПСП на скорости заполнения пикселов ее потери на двухпроходную проекцию геометрии. В мобильных приложениях, отличающихся простой геометрией, тайловый рендеринг оправдывает себя, но для современных десктопных игр лучше подходит стандартный метод мгновенного (immediate) рендеринга, при котором в едином экранном пространстве происходит последовательная растеризация одного полигона за другим.
Реализация тайлового рендеринга в чипах Maxwell/Pascal и Vega отличается. У NVIDIA отсутствует этап сортировки полигонов, т. к. трансформация геометрии происходит единым проходом. AMD, напротив, производит сортировку, но расход тактов на эту операцию снижается путем динамического выбора размера тайла и партии (batch) примитивов в зависимости от сложности конкретной сцены.
Кроме того, сортировка и группировка примитивов в партии позволяет наиболее эффективно предотвращать наложение пиксельных шейдеров на невидимые пикселы, перекрытые полигонами, ближайшими к плоскости экрана. Отдельные выборки пикселов Vega помещает в очередь, которая показывает, на какой глубине от экрана они находятся, а т.к. эта очередь имеет конечный размер, целесообразно использовать тайловый рендеринг, чтобы в пределах отдельно взятого тайла уложиться в ее пределы.
Тайловый рендеринг в чипах Vega не требует специальной поддержки со стороны приложений и активируется на уровне драйвера видеокарты. По данным внутреннего тестирования AMD, DSBR увеличивает среднюю частоту кадров в современных играх вплоть до 10%, снижает расход пропускной способности шины памяти вплоть до 33% и при этом никак не отражается на энергопотреблении GPU. В профессиональных CAD-приложениях прирост частоты смены кадров за счет DSBR может быть и двукратным.
Vega может похвастаться поддержкой возможностей, предусмотренных Direct3D уровня 12_1. Фактически, среди современных GPU Vega имеет наиболее полный набор функций, включая ряд опциональных.
Оптимизированный front-end
Чипы Polaris не испытывают острой нехватки быстродействия на ранних этапах рендеринга, однако по сравнению с конкурирующей архитектурой AMD было над чем поработать и в этой области. Vega по-прежнему содержит по одному блоку обработки геометрии на каждый Shader Engine (наиболее крупную структуру в схеме GPU, которая объединяет все стадии конвейера рендеринга), но разработчики нашли возможность увеличить предельную пропускную способность front-end’а с четырех до 17 примитивов за такт.
Для этого AMD представила альтернативный режим работы геометрического движка, в котором некоторые из стадий фиксированной функциональности были замещены программируемыми «шейдерами примитивов» — точно так же, как в чипах NVIDIA Pascal конвейер геометрии является частично программируемым. Помимо того, что шейдеры примитивов сами по себе исполняются более экономно по сравнению с аналогичными стадиями фиксированного конвейера, они позволяют отсекать невидимые примитивы на более ранних стадиях. Шейдеры примитивов в будущем можно будет задействовать для тесселяции и многих других функций, включая одновременную проекцию сцены с различных точек обзора и в различном разрешении. Пока, однако, непонятно, нужно ли для того, чтобы активировать программируемый конвейер геометрии Vega какое-либо участие со стороны движка приложений или эту функцию берет на себя драйвер.
В дополнение к непосредственной оптимизации геометрического конвейера AMD приняла меры для того, чтобы гарантировать полную загрузку движков в пределах GPU. Допонительный блок под названием Intelligent Workload Distributor (IWD) обеспечивает балансировку нагрузки между несколькими геометрическими движками, планировку операций с целью минимизировать смену контекста и группировку нескольких инстанций мелкого примитива в единой SIMD-инструкции.
High-Bandwidth Cache Controller
В составе Vega AMD представила инновационную организацию памяти, в рамках которой GPU оперирует примерно таким образом, как центральный процессор ПК. В стандартной архитектуре GPU рассматривает содержимое локальной оперативной памяти как совокупность структур, отвечающих данным различного типа, будь то текстуры, массивы вершин и т.д. Как следствие, поскольку эти структуры могут иметь большой размер, их перемещение из системой памяти в локальную память существенно снижает скорость рендеринга. Как правило, разработчики приложений стремятся зарезервировать как можно больший объем локальной памяти и держать все необходимые данные поближе к GPU, хотя есть и такие методы, как Tiled Resources, с помощью которых данные можно подгружать из системной памяти небольшими порциями (наподобие того, как работает технология Mega Texture в движках id Software).
AMD предлагает универсальный механизм работы с адресным пространством, который издавна применяется в центральных процессорах. В нем содержимое локальной и удаленной памяти вне зависимости от типа ресурса делится на «страницы» небольшого размера, которые могут быть по отдельности затребованы конвейером рендринга, перемещены или скопированы поближе или подальше от GPU. В таком случае локальная оперативная память работает как новый уровень кеша в дополнение к кешу L2.
Помимо экономии RAM, технология HBCC позволит более эффективно распоряжаться объемом Flash-памяти в ускорителях Radeon Pro и адресовать вплоть до 512 Тбайт виртуального пространства. Для потребительских устройств эта функциональность избыточна, но будет востребована в виртуализированной среде. Остается открытым и такой вопрос, может ли страничный доступ к памяти работать на уровне драйвера (сама функция активируется в Radeon Settings) или, напротив, приложение должно самостоятельно управлять движением ресурсов.
Кстати, AMD ввела дополнительные функции виртуализации, обеспечив доступ гостевых ОС (вплоть до 16 сессий) к аппаратным блокам кодирования и декодирования видеопотока. Планировкой нагрузки между тремя движками (графика/вычисления, кодирование и декодирование видео) занимается отдельный аппаратный блок.
⇡#GPU Vega 10
Единственный GPU семейства Vega, который на данный момент выпустила AMD, по конфигурации вычислительных блоков соответствует процессору Fiji: 4096 шейдерных ALU, 256 блоков наложения текстур и 64 ROP. Тем не менее, число транзисторов в чипе увеличилось с 8,9 до 12,5 млрд. В тоже время благодаря техпроцессу 14 нм FinFET площадь кристалла удалось сократить с 596 до 486 мм2. Таким образом, Vega 10 — на 72% более плотный чип, нежели Fiji, и даже по сравнению с Polaris площадь используется на 5% более эффективно.
Часть транзисторного бюджета, которым Vega 10 отличается от Fiji, израсходована на удвоенный объем кеш-памяти второго уровня (4 против 2 Мбайт в Fiji) на новые функции рендеринга, описанные выше, но львиная доля элементов, распределенных в схеме GPU, служит основой для дополнительных стадий конвейера, которые AMD пришлось внедрить, чтобы обеспечить стабильную работу на повышенных тактовых частотах. Однако разработчики заверили, что дополнительные стадии появились только на тех участках, где польза от высокой частоты перевешивает возросшую латентность. В противном случае использовались более изощренные методы, включая уменьшение длины внутренних соединений или полную переработку тех или иных функциональных блоков.
Регистры внутренней памяти Vega построены с применением статической памяти, изначально созданной для процессоров Ryzen, которая, согласно данным AMD, обеспечивает экономию площади в объеме 18%, снижение мощности на 43% и латентности на 8% по сравнению со стандартными решениями.
Кстати, ROP внутри Vega теперь являются клиентами кеша второго уровня, а не контроллера памяти. Это увеличит производительность движков отложенного рендеринга, поскольку результат отдельного прохода будет записан непосредственно в L2 вместо оперативной памяти и будет немедленно доступен текстурным модулям для следующих операций.
Для коммуникаций внутри чипа между собственно GPU и uncore-компонентами (контроллером RAM, шины PCI Express, мультимедийным блоком и т. д.) Vega использует интерфейс Infinity Fabric, который также является частью процессоров архитектуры Zen. Благодаря ей AMD в будущем сможет с легкостью интегрировать ядро Vega в APU нового поколения.
Блок декодирования видеопотока в составе Vega не приобрел новых функций по сравнению с Polaris. Он по-прежнему выполняет расшифровку форматов H.264 и H.265 при разрешении вплоть до 3840 × 2160 с кадровой частотой 120 Гц, однако AMD внесла ясность в вопрос аппаратной поддержки кодека VP9, которая впервые была заявлена для Polaris, но не реализована в драйвере вплоть до сегодняшнего дня. Оказывается, Vega использует гибридный метод, комбинируя ресурсы выделенного блока, шейдерных ALU и центрального процессора.
А вот блок кодирования в Vega приобрел возможность записывать видео в формате H.264 в 4К-разрешении с частотой 60 Гц, в то время как Polaris был ограничен частотой 30 Гц.
В Vega вновь используется память типа HBM, но поскольку вторая версия технологии позволяет выпускать сборки объемом вплоть до 8 Гбайт, AMD одновременно получила возможность увеличить объем локальной памяти GPU и упростить конструкцию за счет меньшего числа микросхем и упрощенной разводки соединений. Кремниевая подложка Vega 10 объединяет кристалл GPU с двумя сборками HBM2 по 4 Гбайт 2048-битной шиной, но за счет практически удвоенной частоты HBM2 процессор сохранил «сырую» пропускную способность памяти, сопоставимую с характеристиками Fiji.
⇡#Технические характеристики, комплект поставки, цена
AMD представила три ускорителя на основе Vega 10, не считая Radeon RX Vega Frontier Edition. Топовой моделью в семействе является Radeon RX Vega 64, доступная в вариантах с воздушным кулером и системой жидкостного охлаждения. Число в названии указывает на 64 активных NCU в составе полностью разблокированного чипа. Поскольку Radeon R9 Fury X обладает такой же конфигурацией, дополнительную производительность RX Vega, помимо оптимизации конвейера, извлекает из более высоких тактовых частот.
Базовая частота GPU в Radeon RX Vega 64 с воздушным охлаждением составляет 1247 МГц, и это не очень воодушевляет, если сравнивать с базовой частотой GeForce GTX 1080 Ti (который основан на GPU сопоставимого размера и даже на 500 млн транзисторов меньше). Тем не менее, boost-частоты у двух видеокарт вполне сопоставимы — 1546 и 1582 МГц соответственно. К тому же, в случае Vega AMD вкладывает иной смысл в понятие boost clock. Вместо максимальной частоты, которая разрешена для GPU число означает максимальную частоту, которой ядро может гарантированно достигнуть в играх, но истинный предел лежит еще выше. Таким образом, AMD и NVIDIA теперь оперируют похожими показателями, что облегчает сравнение видеокарт по их спецификациям, хотя NVIDIA все-таки подразумевает под boost clock некое среднее, а не пиковое значение, которое наблюдается в играх.
Radeon RX Vega 64 Liquid Cooled Edition по заявленным частотам уже вполне соответствует GeForce GTX 1080 Ti, но давайте посмотрим на энергопотребление новинок: если даже «воздушная» версия Radeon RX Vega 64 превышает по мощности типичные для топовых потребительских видеокарт 250 Вт, то мощности Liquid Cooled Edition достигает совершенно безумных с позиции одночипового ускорителя 345 Вт.
Принимая во внимание масштаб оптимизаций, которые содержит Vega 10, размеры чипа и его мощность, было бы логично ожидать от Radeon RX Vega 64 производительности на уровне GeForce GTX 1080 Ti или выше. По крайней мере, по теоретической пропускной способности операций FP32 Radeon RX Vega 64 опережает топовый ускоритель конкурента. Но судя по ценам, AMD не столь уверена в потенциале своего флагмана. Действительно, версия с воздушным охлаждением поступит в продажу по рекомендованной цене $499 — аналогично GeForce GTX 1080. Рекомендованная цена Radeon RX Vega 64 Liquid Cooled Edition — $699, что соответствует текущей цене GeForce GTX 1080 Ti.
Производитель | AMD | |||||
Модель | Radeon R9 Fury X | Radeon RX 580 | Radeon RX Vega 64 Frontier Edition | Radeon RX Vega 56 | Radeon RX Vega 64 | Radeon RX Vega 64 Liquid Cooled Edition |
Графический процессор | ||||||
Название | Fiji XT | Polaris 20 XTX | Vega 10 XT | Vega 10 XL | Vega 10 XT | Vega 10 XT |
Микроархитектура | GCN 1.2 | GCN 1.3 | GCN 1.4 | GCN 1.4 | GCN 1.4 | GCN 1.4 |
Техпроцесс, нм | 28 нм | 14 нм FinFET | 14 нм FinFET | 14 нм FinFET | 14 нм FinFET | 14 нм FinFET |
Число транзисторов, млн | 8900 | 5700 | 12 500 | 12 500 | 12 500 | 12 500 |
Тактовая частота, МГц: Base Clock / Boost Clock | —/1050 | 1257/1340 | 1382/1600 | 1156/1471 | 1247/1546 | 1406/1677 |
Число шейдерных ALU | 4096 | 2304 | 4096 | 3584 | 4096 | 4096 |
Число блоков наложения текстур | 256 | 144 | 256 | 256 | 256 | 256 |
Число ROP | 64 | 32 | 64 | 64 | 64 | 64 |
Оперативная память | ||||||
Разрядность шины, бит | 4096 | 256 | 2048 | 2048 | 2048 | 2048 |
Тип микросхем | HBM | GDDR5 SDRAM | HBM2 | HBM2 | HBM2 | HBM2 |
Тактовая частота, МГц (пропускная способность на контакт, Мбит/с) | 500 (1000) | 2000 (8000) | 945 (1890) | 800 (1600) | 945 (1890) | 945 (1890) |
Объем, Мбайт | 4096 | 4096/8192 | 8096 | 8096 | 8096 | 8096 |
Шина ввода/вывода | PCI Express 3.0 x16 | PCI Express 3.0 x16 | PCI Express 3.0 x16 | PCI Express 3.0 x16 | PCI Express 3.0 x16 | PCI Express 3.0 x16 |
Производительность | ||||||
Пиковая производительность FP32, GFLOPS (из расчета максимальной указанной частоты) | 8602 | 6175 | 13107 | 10544 | 12665 | 13738 |
Производительность FP32/FP64 | 1/16 | 1/16 | 1/16 | 1/16 | 1/16 | 1/16 |
Пропускная способность оперативной памяти, Гбайт/с | 512 | 256 | 484 | 410 | 484 | 484 |
Вывод изображения | ||||||
Интерфейсы вывода изображения | HDMI 1.4a, DisplayPort 1.2 | HDMI 2.0, DisplayPort 1.3/1.4 | HDMI 2.0, DisplayPort 1.4 | HDMI 2.0, DisplayPort 1.4 | HDMI 2.0, DisplayPort 1.4 | HDMI 2.0, DisplayPort 1.4 |
TDP, Вт | 275 | 185 | <300 | 210 | 295 | 345 |
Розничная цена (США, без налога), $ | 649 (рекомендованная на момент выхода) | 199/229 (рекомендованная на момент выхода) | 999/1499 (рекомендованная на момент выхода) | 399 (рекомендованная на момент выхода) | 499 (рекомендованная на момент выхода) | 699 (рекомендованная на момент выхода) |
Розничная цена (Россия), руб. | НД | 13 449 / 15 299 (рекомендованная на момент выхода) | НД | НД | НД | НД |
Дизайн и особенности видеокарты
Внешний вид не претерпел никаких изменений: перед нами абсолютная копия AMDRadeon RX VEGA 56 STRIX OC.
Отличия можно наблюдать лишь в наклейке на задней укрепительной пластине: в названии изменено число 56 на 64, указан другой серийный номер, а наклейка располагается справа налево, снизу — вверх.
Толщина видеокарты выходит за пределы двух слотов, что нисколько не удивляет. В качестве источников дополнительного питания фигурируют те же два восьмиконтактныхразъема.
Интерфейсная панель имеет небольшую перфорацию, которая будет способствовать «покиданию» из системного блока нагретого воздуха. На ней расположены два видеовыхода HDMI 2.0b, два DP 1.4 и один разъем Dual-Link DVI.
⇡#Тестовый стенд, методика тестирования
Конфигурация тестовых стендов | |
CPU | Intel Core i7-5960X @ 4 ГГц (100 МГц × 40), постоянная частота |
Материнская плата | ASUS RAMPAGE V EXTREME |
Оперативная память | Corsair Vengeance LPX, 2133 МГц, 4 × 4 Гбайт |
ПЗУ | Intel SSD 520 240 Гбайт + Crucial M550 512 Гбайт |
Блок питания | Corsair AX1200i, 1200 Вт |
Система охлаждения CPU | Thermalright Archon |
Корпус | CoolerMaster Test Bench V1.0 |
Монитор | NEC EA244UHD |
Операционная система | Windows 10 Pro x64 |
ПО для GPU AMD | |
Все видеокарты | Radeon R9 Fury X, Radeon R9 580: Radeon Software Crimson ReLive Edition 17.6.2 Radeon RX Vega 64: 17.30.1051-Beta6a (Tesselation: Use application settings) |
ПО для GPU NVIDIA | |
Все видеокарты | GeForce Game Ready Driver 384.94 |
Бенчмарки: синтетические | |||
Тест | API | Разрешение | Полноэкранное сглаживание |
3DMark Fire Strike | DirectX 11 (feature level 11_0) | 1920 × 1080 | Выкл. |
3DMark Fire Strike Extreme | 2560 × 1440 | ||
3DMark Fire Strike Ultra | 3840 × 2160 | ||
3DMark Time Spy | DirectX 12 (feature level 11_0) | 2560 × 1440 |
Бенчмарки: игры | ||||
Игра (в порядке даты выхода) | API | Настройки | Полноэкранное сглаживание | |
1920 × 1080 / 2560 × 1440 | 3840 × 2160 | |||
Crysis 3 + FRAPS | DirectX 11 | Макс. качество. Начало миссии Swamp | MSAA 4x | Выкл. |
Metro: Last Light Redux, встроенный бенчмарк | Макс. качество | SSAA 4x | ||
GTA V, встроенный бенчмарк | Макс. качество | MSAA 4x + FXAA + Reflection MSAA 4x | ||
DiRT Rally, встроенный бенчмарк | Макс. качество | MSAA 4x | ||
Rise of the Tomb Raider, встроенный бенчмарк | DirectX 12 | Макс. качество, VXAO выкл. | SSAA 4x | |
Tom Clancy’s The Division, встроенный бенчмарк | Макс. Качество, HFTS выкл. | SMAA 1x Ultra + TAA: Supersampling | TAA: Stabilization | |
Ashes of the Singularity, встроенный бенчмарк | Макс. качество | MSAA 4x + TAA 4x | Выкл. | |
DOOM | Vulkan | Макс. качество. Миссия Foundry | TSSAA 8TX | |
Total War: WARHAMMER встроенный бенчмарк | DirectX 12 | Макс. качество | MSAA 4x | |
Deus Ex: Mankind Divided, встроенный бенчмарк | Макс. качество | MSAA 4x | ||
Battlefield 1 + OCAT | Макс. качество. Начало миссии Over the Top | TAA |
Бенчмарки: декодирование видео, вычисления | |
Программа | Настройки |
DXVA Checker, Decode Benchmark, H.264 | Файлы 1920 × 1080p (High Profile, L4.1), 3840 × 2160p (High Profile, L5.1). Microsoft H264 Video Decoder |
DXVA Checker, Decode Benchmark, H.265 | Файлы 1920 × 1080p (Main Profile, L4.0), 3840 × 2160p (Main Profile, L5.0). Microsoft H265 Video Decoder |
LuxMark 3.1 x64 | Сцена Hotel Lobby (Complex Benchmark) |
Sony Vegas Pro 13 | Бенчмарк Sony для Vegas Pro 11, продолжительность — 65 с, рендеринг в XDCAM EX, 1920 × 1080p 24 Гц |
SiSoftware Sandra 2016 SP1, GPGPU Scientific Analysis | Open CL, FP32/FP64 |
CompuBench CL Desktop Edition X64, Ocean Surface Simulation | — |
CompuBench CL Desktop Edition X64, Particle Simulation— 64K | — |
Тестирование Radeon RX Vega 64. Сравнение с GeForce GTX 1080 в DirectX 11 и DirectX 12
После многочисленных анонсов и презентаций новые топовые видеокарты AMD все же вышли на рынок. Ранее мы рассматривали архитектурные и технологические особенности Radeon RX Vega. Настало время для практического знакомства и игровых тестов. Напомним, что старшая модель Radeon RX Vega 64 выходит в двух версиях — с воздушным и водяным охлаждением. При этом видеокарта с СВО еще и работает при повышенных частотах, предлагая максимально возможную производительность на базе GPU Vega 10. В данном обзоре мы рассмотрим обычную версию Radeon RX Vega 64 со стандартным охлаждением и частотами. Посмотрим, каковы температурные характеристики видеокарты, испытаем ее разгонные возможности и сравним с основным конкурентом в лице GeForce GTX 1080.
AMD Radeon RX Vega 64
Тестовые образцы Radeon RX Vega 64 поставляются в небольших черных коробках.
Внутри находится только видеокарта без каких-то дополнительных аксессуаров.
Radeon RX Vega 64 выглядит очень знакомо, внешне напоминает референсные карты серии Radeon RX 480 — такой же черный корпус с псевдоперфорацией и большим логотипом сбоку. Но солидный вес сразу дает понять, что это продукт топового уровня.
Длина видеокарты составляет неполные 27 см. Никаких явных идентификаторов с названием модели на референсной версии нет.
Вся обратная сторона накрыта пластиной, а над графическим чипом присутствует дополнительная крестообразная пластина. В углу есть несколько светодиодов (GPU Tach), которые являются индикатором загрузки. Соседние переключатели позволяют менять цвет свечения.
На боковой грани есть крупная подсвечиваемая надпись Radeon. В этой же зоне на краю платы присутствует маленький переключатель BIOS. У видеокарты две прошивки, которые отличаются лимитами мощности. Это влияет на производительность и рабочие температуры. Реальную разницу мы увидим по итогам тестирования.
У Radeon RX Vega 64 три полноформатных разъема Display Port и один HDMI. От DVI избавились подобно GeForce GTX 1080 Ti — это оставляет больше места для отверстий и улучшает выдув горячего воздуха.
Даже для простой «воздушной» версии Radeon RX Vega 64 заявлен внушительный TDP в 295 Вт. Чтобы качественно охладить такой видеоадаптер, необходима хорошая система охлаждения. С виду это привычный кулер турбинного типа. Его металлическое основание является радиатором для всех важных элементов на плате. В данном случае множество термопрокладок на черном основании предназначены для контакта с транзисторами и дросселями питающей цепи. Кристалл GPU оснащен блоками памяти HBM2, с ними контактирует медная площадка.
Металлическое основание предусматривает специальное посадочное место под главный радиатор с окошком для медной площадки. Радиатор для GPU нельзя назвать очень большим, но по визуальной оценке он крупнее радиатора в топовых видеокартах GeForce.
Сбоку расположен крупный радиальный вентилятор с диаметром крыльчатки 75 мм. Специальная стенка создает изолированную камеру и вместе с пластиковой крышкой создается направленный воздушный канал, внутри которого расположен радиатор.
Последний набран из ряда тонких пластин с большой медной испарительной камерой. Это типовая конструкция для систем турбинного типа. Выпирающая медная площадка служит для контакта с поверхностью графического чипа.
В свое время единая компоновка графического чипа и памяти HBM позволила минимизировать размеры платы Radeon R9 Fury X. Новые графические ускорители Radeon RX Vega используют большую плату. Много электронных элементов вынесено на обратную сторону PCB, много SMD-элементов в обвязке чипа. Внешнее питание подключается через два 8-контактных разъема.
Процессор запитан от 12-фазной системы питания (шесть каналов с удвоением фаз на контроллере IR 35217).
Видеоадаптеры Radeon RX Vega вслед за Radeon R9 Fury являются единственными продуктами, которые предлагают единую компоновку GPU и памяти на одной подложке. В данном случае присутствует два банка памяти HBM2 общим объемом 8 ГБ. Боковая грань такого единого кремниевого устройства из трех микросхем почти 3 см.
Рабочие характеристики Radeon RX Vega 64 и разгон
AMD немного изменила систему частотных характеристик. Теперь указывается базовое значение и среднеигровое значение Boost-частоты. Для Radeon RX Vega 64 это 1274 и 1546 МГц соответственно. Максимально возможное значение достигает 1630 МГц, и именно это значение отображается в утилите GPU-Z. Тактовая частота банков памяти 945 МГц при эффективной DDR-частоте 1890 МГц.
Напомним, что есть еще Radeon RX Vega 64 Liquid Cooled с водяным охлаждением и повышенными частотами: базовое значение 1406 МГц при Boost-частоте 1677 МГц.
Теперь поговорим о температурных характеристиках и частотах в игровой нагрузке. Все испытания проводились на открытом стенде при температуре внутри помещения 23–24 °C. В данных условиях реальные частоты GPU были ниже уровня 1500 МГц. В тесте Superposition benchmark (Extreme-режим) основной диапазон частот ядра был на уровне 1490–1510 МГц, в тесте Tom Clancy’s The Division (2560×1440 Ultra) это 1450–1500 МГц, что проиллюстрировано ниже.
Частоты определяются достижением ограничений по мощности или температурного лимита. Поэтому повышение нагрузки или серьезный нагрев могут снижать частоты. В частности, при переходе к режиму 4K заметно небольшое падение среднего уровня частот в Tom Clancy’s The Division на 10–20 МГц.
Максимальные температуры ядра при игровой нагрузке на уровне 79–80 °C, а скорость вращения вентилятора до 2400 об/мин. Это весьма неплохие показатели, поскольку референсные GeForce GTX 1080 имеют ограничение по температуре около 82 °C. А благодаря изменчивой скорости вентиляторов реальный уровень шума можно оценить как умеренный.
В программных настройках есть возможность переключиться в экономичный или Turbo-режим. Эти профили предусматривают разные ограничения по мощности, что влияет на итоговые частоты. Также есть второй BIOS, в котором прошиты сниженные лимиты мощности. И можно сказать, что вторая прошивка предусматривает более экономичные режимы работы. Посмотрим, как работает видеокарта с таким BIOS.
В Tom Clancy’s The Division при разрешении 2560×1440 средние частоты падают примерно до 1430–1450 МГц, в разрешении 3840×2160 это уже 1380–1410 МГц.
Попутно мы видим снижение нагрева до 73 °C. В реальности пиковые температуры могут быть выше. Для наглядности сравним видеокарты на двух BIOS в непрерывном тесте Superposition benchmark при Extreme-установках. Левый нижний скриншот показывает характеристики по итогам 13-минутного теста с основным BIOS, правый скриншот показывает работу на втором BIOS с более экономичными параметрами.
Примечательно, что снижение Boost-частот у ядра небольшое, а пиковая температура падает с 80 °C до 76 °C. Есть и небольшое снижение скорости вентиляторов, хотя максимальные значения остаются на прежнем уровне в 2400 об/мин. Ниже мы сравним производительность видеокарты в этих двух режимах, чтобы увидеть реальные различия в быстродействии. Пока же можно сделать выводы о том, что карта Radeon RX Vega 64 не так горяча в работе, как можно было бы ожидать. Хотя в кристалле есть дополнительный термодатчик Hot Spot, данные с которого можно снимать через GPU-Z. И при тяжелой нагрузке в этой точке пиковая температуре может превосходить основное значение на несколько градусов.
Для наглядности приведем еще таблицу с официальными данными по лимитам мощности в разных режимах и при разных прошивках. Попутно в ней указаны и данные для топовой версии Liquid Cooled.
Разница между двумя версиями BIOS около 20 Вт. Судя по данным, указаны некие средние значения при игровой нагрузке (помним о заявленном максимуме в 295 Вт).
Температурно-шумовые характеристики определяются параметрами, которые доступны для ручной регулировки. Все тонкие настройки присутствуют в приложении AMD Radeon Settings по следующему пути: Игры — Глобальные настройки — Глобальный WattMan (Global WattMan).
В верхней части вкладки есть общий регулятор, который ограничивает мощность и этим влияет на частоты в Boost-режиме, понижая или повышая производительность. Начальные установки соответствуют сбалансированному режиму, есть экономичный режим и режим Turbo. Последний в русской версии не переведен и обозначен просто как «Режим». Также на этой вкладке есть панель мониторинга, где в режиме реального времени можно следить за всеми основными параметрами без использования сторонних программных средств.
Внизу панели есть раздел температурных настроек, управление лимитом мощности и скоростью вентиляторов. На скриншоте отражены его значения при стандартных установках.
В настройках есть целевая скорость вентилятора на уровне 2400 об/мин, и в нагрузке видеокарта работает именно при таком значении. Целевая температура указана в 75 °C, но с более «быстрым» BIOS она не выдерживается. Максимальная температура на уровне 85 °C. Целевые значения являются ключевыми, видеокарта работает в режиме баланса между ними, пытаясь не выйти за указанные рамки. Хотя в случае Radeon RX Vega 64 основным фактором, определяющим частоты и производительность, является лимит мощности. Если вам мало стандартных режимов, можно попытаться более гибко настроить видеокарту под себя, используя все эти параметры. Однако ручные настройки нужно производить крайне осторожно.
С еще большей осторожностью нужно подходить к вопросу разгона. Global WattMan дает широкие возможности для управления частотами ядра и памяти, позволяет контролировать их напряжения. Однако любой разгон требует повышения лимита мощности, что вместе с повышением частот приводит к резкому увеличению нагрева. В настройках Global WattMan доступна регулировка частоты GPU и частоты памяти HBM2. По умолчанию напряжения управляются автоматически, хотя есть возможность и ручного контроля. При наших экспериментах оказалось, что любое небольшое повышение частоты ядра приводит к снижению стабильности. И если видеокарта выдерживала тест в одной игре, то система могла зависнуть на другом тесте. И все зависело от времени работы и скорости прогрева GPU. В какой-то момент казалось, что придется отказаться от любого разгона и просто ограничиться повышением лимита мощности.
Решение было найдено благодаря ограничению напряжений. При разблокировке управления напряжения GPU для двух состояний ядра по умолчанию указаны напряжения 1,15 и 1,2 В. Мы ограничили их на уровне 1,14 и 1,175 В. Результат оказался мгновенным, удалось более-менее стабилизировать разгон ядра на уровне +2,5% в сочетании с ускорением памяти до 1050 (2100) МГц. Все это сопровождалось повышением лимита мощности до максимума при максимальной скорости вентиляторов в нагрузке.
При таких установках видеокарта работала на пределе возможностей стандартного охлаждения. Пройти тесты удалось лишь благодаря паузам между бенчмарками. К примеру, семь повторов теста Tom Clancy’s The Division видеокарта не выдерживала, но если их разбить на два этапа с паузой между ними, то проблем не возникало. Конечно, нельзя говорить о пригодности такого разгона для постоянной эксплуатации, но нам интересно увидеть максимальные возможности Radeon RX Vega 64. Также разгон позволит оценить потенциал Radeon RX Vega 64 Liquid Cooled.
При наших установках пиковое значение частоты выросло до 1672 МГц. Реальная частота в Boost-режиме держалась на уровне 1620–1630 МГц практически во всех тестах. То есть итоговый прирост по частоте будет не 2,5%, а на уровне 8–10% относительно частот в номинале.
В итоге мы имеем три рабочие конфигурации видеокарты: стандартные установки (Balanced) на двух версиях BIOS и разгон. Сравним Radeon RX Vega 64 в этих режимах с референсной видеокартой GeForce GTX 1080, которая протестирована в номинале и в разгоне.
Характеристики тестируемых видеокарт
В таблице указаны официальные спецификации видеокарт. Для графиков указан полный диапазон частот ядра, включая базовое и максимальное значение. Реальные значения Boost укладываются в указанный диапазон, а общая динамика частот зависит от параметров видеокарты в разных режимах, в частности, от лимита мощности.
Видеоадаптер | Radeon RX Vega 64 | GeForce GTX 1080 |
Ядро | Vega 10 | GP104 |
Количество транзисторов, млн. шт | 12500 | 7200 |
Техпроцесс, нм | 14 | 16 |
Площадь ядра, кв. мм | 486 | 314 |
Количество потоковых процессоров | 4096 | 2560 |
Количество текстурных блоков | 256 | 160 |
Количество блоков рендеринга | 64 | 64 |
Частота ядра, МГц: Base-Boost | 1274–1546 | 1607–1733 |
Шина памяти, бит | 2048 | 256 |
Тип памяти | HBM2 | GDDR5X |
Частота памяти, МГц | 1890 | 10010 |
Объём памяти, ГБ | 8 | 8 |
Поддерживаемая версия DirectX | 12_1 | 12.1 |
Интерфейс | PCI-E 3.0 | PCI-E 3.0 |
Мощность, Вт | 295 | 180 |
Тестовый стенд
Конфигурация тестового стенда следующая:
- процессор: Intel Core i7-6950X (3,[email protected],1 ГГц);
- кулер: Noctua NH-D15 (два вентилятора NF-A15 PWM, 140 мм, 1300 об/мин);
- материнская плата: MSI X99S MPower (Intel X99);
- память: G.Skill F4-3200C14Q-32GTZ (4×8 ГБ, DDR4-3200, CL14-14-14-35);
- системный диск: Intel SSD 520 Series 240GB (240 ГБ, SATA 6Gb/s);
- дополнительный диск: Hitachi HDS721010CLA332 (1 ТБ, SATA 3Gb/s, 7200 об/мин);
- блок питания: Seasonic SS-750KM (750 Вт);
- монитор: ASUS PB278Q (2560х1440, 27″);
- операционная система: Windows 10 Pro x64;
- драйвер AMD Crimson Edition 17.9.1;
- драйвер NVIDIA GeForce 385.41.
Тестирование проводилось в разрешениях 2560×1440 при максимальных настройках графики. Игровые приложения выстроены в список по алфавиту, тесты в специализированных бенчмарках вынесены в конец списка.
Методика тестирования
Battlefield 4
Тестирование проводилось в первой миссии после подрыва стены. Повторялась пробежка по небольшому участку с густой растительностью перед спуском на крупную строительную площадку. Частота кадров измерялась при помощи Fraps.
Все параметры графики на Ultra, мультисемплинг MSAA в режиме 4x.
Battlefield 1
Подобрана новая тестовая сцена. Обычно мы используем игровой эпизод в начале задания «Мыс Геллес», но он воссоздает экстремальную нагрузку. Поэтому подобрана тестовая сцена попроще, но на большой карте со сложным ландшафтом. Это начало второй миссии сюжетной кампании «Вперед, Савойя!». Выполнялась одинаковая последовательность действий со стрельбой и бросанием гранат. Длительность тестового эпизода 52 секунды. Не менее семи повторов.
Выбрано Ultra-качество. Тестирование проведено в DirectX 11 при помощи Fraps и в DirectX 12 при помощи утилиты Mirillis Action!
Deus Ex: Mankind Divided
Для тестирования использовался встроенный бечнмарк, который прогонялся не менее семи раз.
Выбран стандартный профиль Ultra-качества. Тестирование проведено в двух режимах: при рендеринге в DirectX 11 и DirectX 12.
Fallout 4
Тестирование проводилось при помощи Fraps сразу после выхода из убежища в начале игры. Совершалась небольшая прогулка по окрестностям с обилием растительности и насыщенными лучами света. Сцены с таким окружением приводят к наиболее заметным снижениям производительности. Порядок действий отражен ниже.
Выбран профиль максимального качества графики, дополнительно задействовано затенение HBAO+. Снято ограничение частоты кадров.
For Honor
Для тестирования задействован встроенный игровой бенчмарк, который запускался не менее семи раз на каждой видеокарте. Для корректного учета минимального fps дополнительно использовался Fraps.
Выбран стандартный профиль максимального качества Very High, который предусматривает использование сглаживания TAA.
Gears of War 4
Использовался встроенный игровой бенчмарк, который прогонялся по 6–7 раз.
Выбрано максимальное качество графики Ultra, активны дополнительные функции DirectX 12 (Async Compute и т.д.).
Grand Theft Auto 5
Для тестирования использовался встроенный бенчмарк. Пять повторов. Для комплексной оценки рассчитывался средний fps по итогам всех тестовых сцен. Минимальный fps измерялся при помощи Fraps по итогам полного прохода бечнмарка.
Все основные настройки графики на максимуме, включено сглаживание MSAA 4x. Активны дополнительные параметры — дальность подгрузки детализированных объектов (Extended Distance Scaling) и пункт «длина теней» (Extended Shadows Distance) +100% к базовому уровню.
Mass Effect: Andromeda
Совершалась небольшая пробежка во время самой первой высадки на планету. Частота кадров измерялась Fraps.
Выбраны предустановки Ultra-качества, активны эффекты зернистости и хроматической аберрации.
Prey (2017)
Производительность измерялась Fraps при переигрывании определенной последовательности действий в рамках начального игрового этапа, когда герой должен разбить стекло. Семь повторов.
Выбран профиль максимального качества графики Very High.
The Witcher 3: Wild Hunt
Тестирование проводилось при помощи Fraps. Измерялся fps во время поездки по дороге в селение Белый Сад.
Задействованы максимальные установки графики, активны все эффекты постобработки и затенение HBAO+, включена технология HairWorks.
Tom Clancy’s Ghost Recon: Wildlands
Для тестирования задействован встроенный игровой бенчмарк, который прогонялся по семь раз.
Выбраны предустановки максимального Ultra-качества.
Tom Clancy’s The Division
Встроенный тест производительности прогонялся не менее семи раз для каждого режима.
Выбран профиль максимального качества. Дополнительно повышены до максимума те параметры, которые не выставлены на этот уровень изначально (качество отражений, фоновое затенение HBAO+, детализация). Тестирование проведено в двух режимах: при рендеринге в DirectX 11 и DirectX 12.
Warhammer 40000: Dawn of War III
Новая игра в наших тестах. Имеет встроенный бенчмарк, который и задействован для сравнения производительности. Дополнительно использовалась утилита Fraps.
Выбрано максимальное качество графики, включены все эффекты.
Superposition Benchmark
Новый бенчмарк от Unigine. Запускался по 3–4 раза при настройках Extreme в разрешении 1920×1080.
3DMark Fire Strike
Тест Fire Strike из последнего тестового пакета 3DMark. Тестирование проведено в режимах Extreme (2560×1440) и Ultra (3840×2160).
3DMark Time Spy
Новый бенчмарк под DirectX 12, запускался с настройками по умолчанию.
Энергопотребление
Приведены результаты по итогам измерений в семи приложениях:
- Deus Ex: Mankind Divided DX12;
- Gears of War 4;
- Grand Theft Auto 5;
- Tom Clancy’s Ghost Recon: Wildlands;
- Tom Clancy’s The Division DX12;
- Warhammer 40000: Dawn of War III;
- Superposition Benchmark.
В расчет брались пиковые значения во время каждого прогона, на основе которых рассчитывалось среднее значение по итогам тестирования в обоих разрешениях, а потом вычислялось общее среднее значение. Данные снимались при помощи прибора Cost Control 3000.
Результаты тестирования
На итоговых диаграммах производительности все результаты Radeon RX 64 сгруппированы вместе. Нижние данные отвечают показателям со вторым BIOS, средние данные отвечают показателям при основном BIOS, верхние результаты — разгон.
Battlefield 4
Начнем изучение результатов со старого Battlefield 4. Игра зачастую показывает лучшие результаты на видеоадаптерах NVIDIA, и Radeon RX Vega 64 вписывается в эту картину, проигрывая GeForce GTX 1080. Разрыв с конкурентом большой, но общая производительность все равно высокая. Переключение на экономичный BIOS или разгон незначительно сказываются на результатах Radeon.
Battlefield 1
Вначале взглянем на результаты в DirectX 11.
В Battlefield 1 мы видим идентичные результаты у Radeon RX Vega 64 с экономичным BIOS и у референсного GeForce GTX 1080. С основным BIOS герой обзора быстрее примерно на 2%, разгон придает ускорение еще 6–8%. Соперник с повышенными частотами чуть быстрее, но разница минимальная.
Переключение к DirectX 12 меняет картину. Radeon RX Vega 64 показывает почти идентичные результаты в разных версиях DirectX, в новом API даже проявляется тенденция к росту среднего fps, но разница совсем мизерная. GeForce GTX 1080 от переключения к DirectX 12 лишь теряет в производительности, и даже в разгоне этот видеоадаптер слабее Radeon RX Vega 64 в экономичной конфигурации.
Deus Ex: Mankind Divided
Сравним показатели в Mankind Divided при разных версиях DirectX.
В данном случае переход с DirectX 11 на DirectX 12 обеспечивает ускорение 3–5% для Radeon RX Vega 64, а GeForce GTX 1080 теряет в производительности около 1%. В обоих режимах Radeon RX Vega 64 в экономичной конфигурации быстрее GeForce GTX 1080 в номинале. Во втором режиме флагман AMD изначально показывает производительность уровня GeForce GTX 1080 в разгоне.
Fallout 4
Средние показатели у соперников примерно на одном уровне, но у Radeon заметны явные перепады производительности. В итоге Radeon RX Vega 64 проигрывает конкуренту в Fallout 4 по минимальному fps.
For Honor
Резкие перепады производительности заметны и в стандартном бенчмарке For Honor. По этой причине пришлось даже прибегнуть к Fraps для фиксации какого-то усредненного минимального fps на Radeon. И этот параметр на Vega 64 фактически не меняется при переключении BIOS и при разгоне. Общая ситуация такова, что в номинале по всем параметрам быстрее GeForce GTX 1080. Достичь аналогичного уровня среднего fps флагману AMD удается при разгоне. Сам разгон обеспечивает ускорение в 6%.
Gears of War 4
Близкие показатели у Radeon RX Vega 64 и GeForce GTX 1080 в Gears of War 4. Лишь со вторым «экономичным» BIOS новинка явно проигрывает конкуренту. При этом разница в производительности между двумя прошивками до 6%. Разгон придает ускорение 7–9%.
Grand Theft Auto 5
В GTA 5 новый Radeon серьезно уступает конкуренту. Разгон и изменение любых других параметров минимально сказывается на понижении или росте производительности Radeon RX Vega 64.
Mass Effect: Andromeda
Radeon RX Vega 64 уступает GeForce GTX 1080 около 5% в Andromeda. Более экономичный режим обеспечивает снижение быстродействия на 1–2%. Ускорение от разгона более 9%.
Prey (2017)
В новом шутере Prey флагман AMD снова проигрывает конкуренту NVIDIA. Отставание на уровне 7–10%, в зависимости от активного BIOS видеокарты AMD. Разгон повышает результаты на 9%.
The Witcher 3: Wild Hunt
Radeon RX Vega 64 радует в The Witcher 3, обгоняя GeForce GTX 1080 на 3–5%. И небольшое преимущество сохраняется даже после разгона обоих участников. Сам разгон обеспечивает ускорение около 9%, а переключение на второй BIOS дает снижение производительности более 4%.
Tom Clancy’s Ghost Recon: Wildlands
В Ghost Recon: Wildlands флагман AMD почти не уступает GeForce GTX 1080, разница заметна в основном по минимальному fps. В разгоне преимущество соперника более явное. У Radeon RX Vega 64 масштабируемость производительности слабее, разгон ускоряет видеоадаптер на 6%.
Tom Clancy’s The Division
Еще одна игра, которая поддерживает разные DirectX, и мы провели тестирование в старом и новом API.
По итогам можно констатировать полный триумф Radeon RX Vega 64 в The Division. И если в DirectX 11 преимущество над GeForce GTX 1080 на уровне 5–7%, то при активации DirectX 12 разрыв уже 9–20%. Видеоадаптер NVIDIA при переходе на новый API получает минимальное ускорение, а Vega выигрывает 5–15%, демонстрируя максимальный прирост по минимальному fps.
Warhammer 40000: Dawn of War III
Еще одна уверенная победа Radeon RX Vega 64. Новичок AMD показывает недостижимый для конкурента уровень производительности. Даже в экономичном режиме со вторым BIOS новичок быстрее GeForce GTX 1080 с максимальным частотами. Общие показатели высокие у обоих участников, так что пользователь любого видеоадаптера сможет комфортно играть в разрешении 2560×1440.
Superposition Benchmark
Новый бенчмарк на движке Unigine. Из доступных API выбран более быстрый DirectX 11 при стандартном профиле настроек Full HD Extreme. Для наглядности приведены итоговые данные в виде общего балла и в виде fps.
Superposition показывает равенство Radeon RX Vega 64 в более экономичной конфигурации и референсной версии GeForce GTX 1080. При начальных заводских установках Radeon чуть быстрее. Крошечное преимущество остается и при разгоне.
3DMark Fire Strike
В обоих тестовых режимах Radeon RX Vega 64 оказывается быстрее GeForce GTX 1080. Среднее преимущество около 6%, если рассматривать Radeon с основным BIOS.
3DMark Time Spy
Чуть иная ситуация в этом бенчмарке. Со вторым BIOS новичок AMD слабее конкурента, но при начальных установках лучше на 1%.
Сравнение геймплея
Дополним приведенные данные и выводы сравнением Radeon RX Vega 64 и GeForce GTX 1080 в видеоформате.
В ролике напрямую сравниваются одинаковые геймплейные эпизоды в разрешении 2560×1440, что позволит сравнить соотношение между соперниками в динамике. Видеокарты функционировали в номинальных режимах.
Энергопотребление
Разница в потребляемой мощности существенная. У Radeon RX Vega 64 чрезвычайно высокие показатели с любой версией BIOS. Рост потребления при разгоне тоже внушительный. Причем на графике вы видите среднее значение по итогам нескольких контрольных приложений, в отдельных играх показания превышали 600 Вт.
Выводы
Radeon RX Vega 64 является самым прогрессивным графическим ускорителем от AMD и преемником Radeon R9 Fury X. Это единственный видеоадаптер игрового уровня с памятью HBM2. Также он имеет ряд технологических инноваций, среди которых новая система организации памяти, позволяющая работать с внешним ОЗУ, используя доступные 8 ГБ в качестве кэша. Подробнее об этой и других технологических особенностях в специальной статье.
По уровню игровой производительности Radeon RX Vega 64 претендует на статус конкурента для GeForce GTX 1080 и явно не сможет тягаться силами с GeForce GTX 1080 Ti. По итогам сравнительного тестирования Radeon RX Vega 64 обгоняет GeForce GTX 1080 в 7 тестовых приложениях из 16. Это уверенная победа в Deus Ex: Mankind Divided, Warhammer 40000: Dawn of War III, The Division, 3DMark Fire Strike, скромный перевес в The Witcher 3: Wild Hunt и Time Spy, победа в Battlefield 1 при DirectX 12. GeForce GTX 1080 в целом сильнее в девяти приложениях, но преимущество порою минимальное. Radeon RX Vega 64 демонстрирует лучшие результаты в большинстве игр под DirectX 12, получая стабильный рост производительности при переходе к этому режиму. GeForce GTX 1080 в тех же играх при переключении с DirectX 11 на DirectX 12 получает минимальное ускорение или даже показывает падение результатов. В этом плане особенно показательны результаты в том же Battlefield 1. Причем Radeon RX Vega 64 является первой видеокартой, которая в наших тестах не продемонстрировала падения производительности в этой игре под DirectX 12.
К минусам Radeon RX Vega 64 относится чрезвычайно высокое энергопотребление. Оно не просто высокое на фоне топовых решений NVIDIA, оно рекордно высокое для одночиповой видеокарты в целом. Это вызывало опасения по поводу повышенного нагрева и шума. Но тут стандартная версия Vega 64 нас приятно удивила. Ее температурно-шумовые характеристики отвечают уровню других топовых видеокарт. Конечно, многое будет зависеть от правильной организации охлаждения внутри корпуса. При нормальной вентиляции вы сможете играть на Radeon RX Vega 64 при стандартной скорости вентилятора в 2400 об/мин.
При явных недостатках в виде высокого энергопотребления и тепловыделения инженерам AMD удалось неплохо сбалансировать конечный продукт. Радует много возможностей для выбора более экономичных режимов. Есть программные экономичные профили и дополнительный BIOS с пониженным лимитом мощности. Если необходимо снизить нагрев видеокарты, то вариант переключения на второй BIOS является оптимальным решением — он обеспечит реальное снижение нагрева при скромных потерях в производительности на уровне 2–5%.
Набор программных инструментов AMD Radeon Settings дает широкие возможности для тонкой настройки. Это позволяет опытному пользователю подобрать свои оптимальные установки. И все это является частью функциональности стандартного программного обеспечения для AMD Radeon. Вместо снижения параметров можно и разогнать видеокарту. Но это крайне опасное занятие с обычной версией, которая оснащена воздушным охлаждением. Мы не рекомендуем разгонять такие Radeon RX Vega 64. Видеокарта изначально работает на пределе возможностей, и любой разгон критически скажется на нагреве и стабильности. Но если ограничить максимальное напряжение и расширить лимит мощности, то можно получить определенное ускорение. Это интересно для экспериментов, но не подходит для практического использования.
По итогам нашего тестирования в разгоне можно получить примерное представление о производительности Radeon RX Vega 64 Liquid Cooled. Показатели топовой модификации будут близки нашим показателям в разгоне или чуть ниже. Такая видеокарта со своей производительностью выглядит еще привлекательнее на фоне GeForce GTX 1080, а наличие СВО нейтрализует проблему шума и нагрева. К сожалению, это не избавит от высокого энергопотребления. Но основной проблемой пока остается завышенная стоимость. После нормализации цен новые Radeon RX Vega имеют шансы занять прочные позиции на рынке.
Данный обзор является первым в цикле статей по Radeon RX Vega. В скором времени выйдет расширенная версия тестирования, где будет еще больше тестовых приложений и режимов. Оставайтесь с нами!
⇡#Производительность: 3DMark
3DMark (Graphics Score) | |||||||
Разрешение | AMD Radeon RX Vega 64 (1546/1890 МГц, 8 Гбайт) | AMD Radeon RX 580 (1340/8000 МГц, 8 Гбайт) | AMD Radeon R9 Fury X (1050/1000 МГц, 4 Гбайт) | NVIDIA GeForce GTX TITAN X (1000/7012 МГц, 12 Гбайт) | NVIDIA GeForce GTX 1080 (1607/10008 МГц, 8 Гбайт) | NVIDIA GeForce GTX 1080 Ti (1480/11010 МГц, 11 Гбайт) | |
Fire Strike | 1920 × 1080 | 22 503 | 13 631 | 16 105 | 17 115 | 21 694 | 27 877 |
Fire Strike Extreme | 2560 × 1440 | 10 711 | 6 090 | 7 559 | 7 928 | 10 264 | 13 681 |
Fire Strike Ultra | 3840 × 2160 | 5 400 | 3 051 | 3 821 | 4 042 | 5 001 | 6 728 |
Time Spy | 2560 × 1440 | 7 079 | 4 238 | 5 192 | 5 106 | 7 111 | 9 525 |
Макс. | −39% | −27% | −24% | +0% | +35% | ||
Средн. | −42% | −28% | −26% | −4% | +28% | ||
Мин. | −44% | −29% | −28% | −7% | +24% |
AMD Radeon RX Vega 64 — теория
К моменту запуска компания AMD представляет свою новую серию GPU топового уровня в трех вариантах. У нас на тестовых испытаниях побывала RX Vega 64 с классическим воздушным охлаждением. Стоимость карты находится на отметке 35 000 рублей.
Кроме того, будет доступен еще и разогнанный приблизительно на 10 процентов вариант с жидкостной системой охлаждения. Почти на 7 000 рублей более доступная RX Vega 56 с упрощенными характеристиками дополняет стартовый модельный ряд серии Vega.
Протестированный нами образец «пришел» прямо с завода AMD и выступает в качестве так называемого «эталонного дизайна», на который смогут ориентироваться такие партнеры, как Sapphire, Gigabyte или Asus. GPU, внутри AMD получивший название Vega 10 и изготовленный на базе архитектуры GCN 5, содержит более 4096 шейдерных блоков, которые должны быть собраны в целом в 64 CU (Compute Units).
Кроме того, здесь будет 256 текстурных блоков (TMU) и 64 рендерных единицы (ROP). Также карта предлагает 8 Гбайт очень быстрой HBM2-памяти, которая будет соединена с графическим чипом интерфесом шириной 2048 бит.
Тактовые частоты соответствуют ожидаемой производительности. Базовая тактовая частота равняется 1247 МГц, в Boost-режиме, по мере необходимости, карта поднимает этот показатель до максимальных 1546 МГц — это без ручного разгона.
Вариант RX Vega 64 с водяным охлаждением рассчитан на еще более высокие частоты. Так называемый «Typical Board Power», параметр, описывающий типичный для игрового режима уровень энергопотребления, находится на уровне 295 Вт. Для сравнения: TDP, то есть максимальное потребление, у Nvidia GeForce GTX 1080 составляет 180 Вт.
Мы уже успели прогнать через «полосу препятствий» в виде бенчмарков референсную модель AMD Radeon RX Vega 64 с воздушным охлаждением. Однако, во время тестовых испытаний наша стандартная для таких процедур материнская плата «приказала долго жить», и мы вынуждены были в кратчайшее время искать ей замену.
Из-за этого все результаты назвать сопоставимыми с другими на 100% нельзя, поэтому мы решили пока что не включать новую AMD-карту в наш соответствующий рейтинг. Но так как взятая на замену материнская плата очень близка по своим характеристикам к «оригинальной», в этой статье мы все-таки приведем результаты сравнения с GTX 1080.
Radeon RX Vega 64: топовая спецификация на старте
Разумеется, мы так скоро, насколько это будет возможно, повторим тестовые испытания с нашей стандартной материнской платой, и после этого обязательно расположим новую графическую карту от AMD в рейтинге соответствующим образом.
⇡#Производительность: игры (1920 × 1080, 2560 × 1440)
1920 × 1080 | |||||||
Полноэкранное сглаживание | AMD Radeon RX Vega 64 (1546/1890 МГц, 8 Гбайт) | AMD Radeon RX 580 (1340/8000 МГц, 8 Гбайт) | AMD Radeon R9 Fury X (1050/1000 МГц, 4 Гбайт) | NVIDIA GeForce GTX TITAN X (1000/7012 МГц, 12 Гбайт) | NVIDIA GeForce GTX 1080 (1607/10008 МГц, 8 Гбайт) | NVIDIA GeForce GTX 1080 Ti (1480/11010 МГц, 11 Гбайт) | |
Ashes of the Singularity | MSAA 4x + TAA 4x | 37 | 24 | 32 | 31 | 45 | 58 |
Battlefield 1 | TAA | 131 | 82 | 91 | 85 | 115 | 141 |
Crysis 3 | MSAA 4x | 65 | 44 | 61 | 66 | 79 | 115 |
Deus Ex: Mankind Divided | MSAA 4x | 38 | 25 | 33 | 30 | 38 | 54 |
DiRT Rally | MSAA 4x | 85 | 57 | 65 | 84 | 101 | 129 |
DOOM | TSSAA 8TX | 200 | 138 | 166 | 151 | 200 | 200 |
GTA V | MSAA 4x + FXAA + Reflection MSAA 4x | 64 | 45 | 55 | 67 | 84 | 93 |
Metro: Last Light Redux | SSAA 4x | 87 | 51 | 69 | 74 | 92 | 124 |
Rise of the Tomb Raider | SSAA 4x | 57 | 35 | 42 | 47 | 63 | 86 |
Tom Clancy’s The Division | SMAA 1x Ultra + TAA: Supersampling | 81 | 51 | 61 | 54 | 82 | 113 |
Total War: WARHAMMER | MSAA 4x | 71 | 39 | 54 | 59 | 71 | 85 |
Макс. | −30% | −6% | +4% | +30% | +77% | ||
Средн. | −36% | −19% | −16% | +9% | +39% | ||
Мин. | −45% | −31% | −35% | −12% | +0% |
2560 × 1440 | |||||||
Полноэкранное сглаживание | AMD Radeon RX Vega 64 (1546/1890 МГц, 8 Гбайт) | AMD Radeon RX 580 (1340/8000 МГц, 8 Гбайт) | AMD Radeon R9 Fury X (1050/1000 МГц, 4 Гбайт) | NVIDIA GeForce GTX TITAN X (1000/7012 МГц, 12 Гбайт) | NVIDIA GeForce GTX 1080 (1607/10008 МГц, 8 Гбайт) | NVIDIA GeForce GTX 1080 Ti (1480/11010 МГц, 11 Гбайт) | |
Ashes of the Singularity | MSAA 4x + TAA 4x | 28 | 19 | 26 | 25 | 34 | 47 |
Battlefield 1 | TAA | 97 | 59 | 62 | 62 | 82 | 102 |
Crysis 3 | MSAA 4x | 41 | 27 | 39 | 41 | 53 | 73 |
Deus Ex: Mankind Divided | MSAA 4x | 24 | 16 | 19 | 19 | 25 | 35 |
DiRT Rally | MSAA 4x | 64 | 41 | 49 | 61 | 73 | 96 |
DOOM | TSSAA 8TX | 147 | 89 | 110 | 100 | 136 | 178 |
GTA V | MSAA 4x + FXAA + Reflection MSAA 4x | 48 | 31 | 39 | 48 | 63 | 81 |
Metro: Last Light Redux | SSAA 4x | 50 | 28 | 41 | 44 | 52 | 73 |
Rise of the Tomb Raider | SSAA 4x | 36 | 22 | 27 | 29 | 38 | 53 |
Tom Clancy’s The Division | SMAA 1x Ultra + TAA: Supersampling | 59 | 36 | 44 | 39 | 56 | 80 |
Total War: WARHAMMER | MSAA 4x | 47 | 26 | 38 | 40 | 49 | 64 |
Макс. | −32% | −5% | +1% | +32% | +78% | ||
Средн. | −38% | −20% | −17% | +8% | +46% | ||
Мин. | −45% | −36% | −36% | −15% | +5% |
⇡#Производительность: игры (3840 × 2160)
3840 × 2160 | |||||||
Полноэкранное сглаживание | AMD Radeon RX Vega 64 (1546/1890 МГц, 8 Гбайт) | AMD Radeon RX 580 (1340/8000 МГц, 8 Гбайт) | AMD Radeon R9 Fury X (1050/1000 МГц, 4 Гбайт) | NVIDIA GeForce GTX TITAN X (1000/7012 МГц, 12 Гбайт) | NVIDIA GeForce GTX 1080 (1607/10008 МГц, 8 Гбайт) | NVIDIA GeForce GTX 1080 Ti (1480/11010 МГц, 11 Гбайт) | |
Ashes of the Singularity | Выкл. | 45 | 28 | 37 | 31 | 44 | 59 |
Battlefield 1 | 55 | 34 | 41 | 37 | 50 | 67 | |
Crysis 3 | 32 | 20 | 28 | 31 | 36 | 50 | |
Deus Ex: Mankind Divided | 28 | 17 | 15 | 21 | 28 | 38 | |
DiRT Rally | 43 | 27 | 33 | 41 | 50 | 66 | |
DOOM | 75 | 45 | 59 | 54 | 75 | 97 | |
GTA V | 47 | 29 | 37 | 41 | 52 | 71 | |
Metro: Last Light Redux | 43 | 26 | 37 | 39 | 47 | 65 | |
Rise of the Tomb Raider | 42 | 26 | 30 | 35 | 44 | 62 | |
Tom Clancy’s The Division | TAA: Stabilization | 34 | 21 | 2 | 23 | 32 | 46 |
Total War: WARHAMMER | Выкл. | 39 | 24 | 32 | 31 | 39 | 52 |
Макс. | −37% | −13% | −3% | +16% | +56% | ||
Средн. | −38% | −29% | −20% | +3% | +41% | ||
Мин. | −40% | −94% | −33% | −9% | +22% |
AMD Radeon RX Vega 64 — практика
Как и следовало ожидать, RX Vega 64 демонстрирует высокие показатели производительности. Для сравнения мы взяли MSI GeForce GTX 1080, которая в версии Founders Edition ближе всего к референсному дизайну.
В синтетических бенчмарках карты практически равносильны друг другу. Так, представитель AMD в 3DMark Cloud Gate получает 34967 баллов (GTX 1080: 34265 баллов) и 5267 баллов в Fire Strike Ultra (GTX 1080: 5029 баллов). Подводя итоги, можно сказать, что Radeon получается чуточку лучше, чем Geforce.
На практике мы наблюдаем аналогичную картину, причем — в зависимости от бенчмарка — небольшое преимущество имеет то одна карта, то другая. В «GTA V» Vega 64 работает на 101,70 fps в разрешении Full-HD и на 46,49 fps в 4К. Geforce выступает значительно лучше: 142,1 fps (Full HD) и 55,4 fps (4K).
Обратная картина наблюдается в «Metro Last Light»: в то время, как Radeon выдает целых 150,46 fps (Full-HD) и 57,12 FpS (4K), результаты GTX 1080 оказываются хуже на 5-10 процентов. Таким образом, становится очевидно: Radeon RX Vega 64 и Geforce GTX 1080 в плане производительности находятся приблизительно на одном уровне.
Только в том случае, если игра оптимизирована под определенного производителя GPU, разница становится более заметной. Интересный факт: в OpenCL-бенчмарке LuxMark карта Radeon получает 5275 баллов и тем самым нокаутирует GTX 1080 (2805 баллов).
Так как множество утилит для майнинга криптовалют используют программный интерфейс OpenCL, RX Vega 64 может стать объектом вожделения майнеров, а из-за этого цены на новинку могут взлететь до небес.
Radeon RX Vega 64: экстремальное энергопотребление
Так в конце концов, являются ли Geforce и Radeon равными друг другу в топовом сегменте? К сожалению, нет, поскольку AMD допускает один серьезный прокол, который наши тестеры обнаружили с большим удивлением, и тем самым заново открывает мрачную главу в истории GPU-производителя, которую мы считали уже закрытой со времен Polaris.
Под полной нагрузкой наша тестовая система с картой Vega потребляла в зависимости от сценария эксплуатации от 100 до 200 Вт больше, чем с Geforce GTX 1080. Для нас является совершенно непонятно, почему AMD выпустила такого «обжору», который не компенсирует этот недостаток какими-либо особыми преимуществами.
Также нельзя забывать о том, что Geforce GTX 1080 находится на рынке уже целый год, и этот факт тоже не дает плюсов новинке при сравнении уровней производительности. А так как у Nvidia в модельном ряду есть еще и GeForce GTX 1080 Ti, то корона царства графических карт по-прежнему остается на голове у «зеленых».
⇡#Производительность: вычисления
⇡#Тактовые частоты, энергопотребление, температура
Обновленная версия утилиты WattMan для Radeon RX Vega содержит три предустановленных профиля мощности, с помощью которых можно либо сократить энергопотребление, либо увеличить его относительно номинальных 100%. Все тесты быстродействия Radeon RX Vega 64 мы провели в режиме Turbo, который расширяет энергетический пакет GPU на 15%. В таких условиях максимальная частота Vega 10, которую мы наблюдали в играх, составила 1662 МГц, что даже выше заявленного в спецификациях уровня boost clock — 1546 МГц. Тем не менее, в большинстве приложений стабильные частоты оказываются намного ниже. К примеру, в игре Crysis 3, которую мы используем для измерения мощности, частота GPU колеблется вокруг отметки 1478 МГц.
Печатная плата
Разборка видеокарты дает понять, что отличий сAMDRadeon RX VEGA 56 STRIX OCнет никаких. Чтобы не повторяться и не писать очевидные вещи, рассмотрим, в чем же основные отличия героини прошлого обзора от рассматриваемой сегодня.
И открывается оно после снятия массивной системы охлаждения.
В обзореASUS Radeon RX VEGA 56 STRIX OCнам встретилась корейская корпусировка графического процессора с памятью SK hynix. Героиня обзора может похвастаться тайваньскими корнями в сердце, использованием HBM2 производства компанией Samsung, атакже заливкойкомпаундом.
Последнее сказалось на внешнем виде и теплоотводе.
Графический процессор оказывается на одном уровне с HBM2, что обеспечивает лучшийконтакт с основанием системы охлаждения.
⇡#Выводы
Благодаря колоссальной работе инженеров над архитектурой Vega, AMD смогла вернуться на рынок высокопроизводительной дискретной графики. По многим параметрам — размеру кристалла, тактовым частотам и энергопотреблению — графический процессор Vega 10 выглядит как полноправный конкурент GP102 от NVIDIA, и эти ожидания вполне оправдались в тестах вычислений общего назначения. Тем не менее, в игровых приложениях новый флагман AMD может потягаться лишь с GeForce GTX 1080. Более того, несмотря на все отличия архитектуры Vega от Polaris, Radeon RX Vega 64 занял такую же позицию по отношению к GTX 1080, как Radeon RX 480 когда-то — по отношению к GeForce GTX 1060. А именно, в ультравысоком разрешении (4К) можно признать паритет между двумя видеокартами, но в менее требовательных режимах позиции Vega не столь устойчивы, и хотя соперники обменялись ударами в тестах, благосклонных к той или иной графической архитектуре, в нашей подборке игр класса ААА есть несколько проектов, в которых Vega работает столь неэффективно, что чаша весов склоняется в пользу GeForce GTX 1080.
P.S. В связи с чрезвычайно сжатыми сроками подготовки обзора (Radeon RX Vega 64 досталась нам за 24 часа до момента публикации) мы вынуждены были провести сокращенное тестирование и, в частности, не коснулись такой темы, как разгон, но обещаем в ближайшем будущем наверстать упущенное.
Для поклонников AMD: Sapphire Radeon RX 580 Pulse 8GBG)
Radeon RX 580 — это превосходная графическая карта среднего уровня для геймеров, которые хотят играть в разрешении Full-HD или QHD.
Разумеется, Ethereum-майнеры пронюхали о хорошей Compute-производительности и полностью опустошили рынок.
Первоначально стоимость RX 580 составляла около 18 000 рублей, теперь же за неё придется выложить от 25 000 до 28 000 рублей. Тем не менее, мы надеемся, что эти космические цены в скором времени снова опустятся, так как RX 580 — это топовая альтернатива для экономных геймеров.