В итоге вы получаете GeForce RTX 3090 или "BFGPU", как назвал его генеральный директор NVIDIA Дженсен Хуанг во время его официального представления.
Как бы вы ни называли GeForce RTX 3090, одно можно сказать наверняка. На данный момент GeForce RTX 3090 - самая мощная видеокарта, которую можно (почти) купить за деньги. В настоящее время этот продукт находится на вершине стека продуктов NVIDIA и по словам компании, он обеспечивает изображение формате 8K и обработку больших рабочих нагрузок по созданию контента, отчасти благодаря 24 ГБ встроенной памяти GDDR6X.
Однако, как оказалось видеокарта GeForce RTX 3090 не каждый может себе позволить. Хотя его запрашиваемая цена примерно на 1000 долларов ниже, чем у предыдущего поколения, основанного на Тьюринге типа Titan RTX, и этот аналог по-прежнему недоступен для большинства пользователей. А характеристики производительности GeForce RTX 3090, вероятно сделают его ценное предложение интересным только избранной группе энтузиастов и создателей. А пока давайте посмотрим на характеристики и осмотрим этого большого красивого зверя ...
Технические характеристики и особенности:
GeForce RTX 3090 по сути является заменой Titan RTX предыдущего поколения. По словам NVIDIA, спрос на различные Titans был выше чем ожидалось, поэтому с этим поколением помимо прямой продажи, NVIDIA работает и с партнерами по продажам этих плат, чтобы расширить доступность, поэтому и в этом случае без их помощи не обойтись они также будут предлагать карты серии GeForce RTX 3090.
Прежде чем мы углубимся в тему, нам нужно обратить ваше внимание на несколько предыдущих статей. Мы уже рассмотрели большую часть технологии, лежащей в основе GeForce RTX 3090, поэтому мы не будем делать это снова. Однако если вам нужна предыстория, мы рекомендуем ознакомиться с нашим обзором первых Анонс серии GeForce RTX 30 , более подробное описание ее новых функций и архитектуры Ampere , а также обзоры GeForce RTX 3080 на прошлой неделе . Как только вы все это усвоите, вы поймете многое из того, что такое GeForce RTX 3090.
Скорость и потоки NVIDIA GeForce RTX 3090
Как вы уже заметили в подробном описании характеристик и сравнении в таблице выше, новая GeForce RTX 3090 на базе GA102 мощнее чем Titan RTX предыдущего поколения, почти во всех отношениях, за исключением двух особенностей. GeForce RTX 3090 имеет более низкую тактовую частоту по умолчанию и меньше ядер Tensor. Но новая архитектура GA102 и дополнительные ресурсы более чем компенсируют более низкую частоту по умолчанию, а тензорные ядра Ampere 3-го поколения более чем вдвое превышают пропускную способность предыдущего поколения. Что касается скорости заполнения пикселей и текстур, пропускной способности памяти и производительности вычислений, GeForce RTX 3090 значительно мощнее, чем Titan RTX на основе Тьюринга.
Графический процессор GA102 имеет размер кристалла 628,4 мм 2 и состоит примерно из 28 миллиардов транзисторов. Чипы также производятся по более новому, индивидуальному 8-нм техпроцессу Samsung (8N), чем их аналоги предыдущего поколения, основанные на Тьюринге, в которых использовался 12-нм процесс FinFET для TSMC . Обратите внимание: несмотря на то, что в GA102 помещено почти на 10 миллиардов транзисторов больше, размер кристалла примерно на 126 мм 2 меньше, благодаря этому более продвинутому процессу.
Как мы упоминали в нашей предыдущей серии GeForce RTX 30 , все эти дополнительные транзисторы используются для включения новых функций, таких как поддержка PCIe Gen 4, для повышения производительности Ampere практически для всех рабочих нагрузок, связанных с графическим процессором. Ядра Ampere 2-го поколения RT (трассировка лучей) были оптимизированы для повышения производительности. 82 ядра RT в GeForce RTX 3090 (по сравнению с 72 в Titan RTX) обеспечивают производительность вычислений до 35,6 терафлопс на разных уровнях точности (против 16,3 - 32,6 терафлопс по Тьюрингу), а тензорные ядра 3-го поколения предлагают до 35,6 терафлопс. 284 TFLOPS производительности Int8 против 261 у Titan RTX (вдвое больше для Int4).
Передовая память и технология охлаждения
Как и GeForce RTX 3080, GeForce RTX 3090 оснащена новейшей в плане технологии памяти Micron GDDR6X (будущая GeForce RTX 3070 будет использовать стандартную GDDR6), которая предлагает гораздо более высокую пропускную способность. GDDR6X ,которая может передавать вдвое больше данных за такт, эффективно удваивая пропускную способность за такт. Первая волна флагманских процессоров GeForces на базе Ampere будет использовать память GDDR6X со скоростью передачи данных до 19,5 Гбит / с. В частности, на GeForce RTX 3090, который имеет 24 ГБ встроенной памяти, подключенной к графическому процессору через 384-битный интерфейс памяти, что соответствует пиковой пропускной способности 936 ГБ / с по сравнению с 672 ГБ / с на Titan RTX. Кроме того, пропускная способность намного выше, чем у GeForce RTX 3080 с 760 ГБ / с.
Графический процессор GA102 имеет новый интерфейс NVLink 3-го поколения, который включает четыре канала x4, каждый из которых обеспечивает до 14,0625 ГБ / с двунаправленной полосы пропускания, что в сумме составляет 56,25 ГБ / с для двунаправленной полосы пропускания или 112,5 ГБ / с в целом. совокупная пропускная способность между двумя графическими процессорами. GeForce RTX 3090 в настоящее время является единственной картой серии RTX 30 с такими данными. Две видеокарты GeForce RTX 3090 могут быть связаны для работы в режимах SLI, но конфигурации 3-Way и 4-Way SLI не поддерживаются. Кроме того, NVIDIA сообщила, что в будущем разработка SLI перейдет к разработчикам игр вместо профилей на основе драйверов.
NVIDIA также внесли несколько изменений , чтобы повысить общую эффективность. Например, в архитектурах предыдущего поколения у NVIDIA была одна шина питания для ядер графического процессора и контроллера памяти. В Ampere NVIDIA разделила шины питания ядра и памяти на отдельные каналы, чтобы они могли работать независимо. Двойные шины питания должны обеспечивать более точное управление и экономию энергии, что в конечном итоге означает улучшение энергетических и тепловых характеристик.
Кулер GeForce RTX 3090 оснащен двумя осевыми вентиляторами и разделенным радиатором, который тише, чем решения предыдущего поколения, но при этом способен рассеивать на 90 Вт энергии больше.
Как и RTX 3080, GeForce RTX 3090 имеет три полноразмерные DisplayPort (1.4a) и один выход HDMI. Разъем USB-C на высокопроизводительных картах Turing, который должен был использоваться с гарнитурами VR, использовался нечасто, поэтому в серии RTX 30 NVIDIA отказалась от этих разъёмов. Следует отметить, что порт HDMI соответствует стандарту 2.1, который позволяет использовать 4K120P с G-Sync на некоторых из последних моделей OLED-телевизоров и дисплеев, а также разрешение 8K .
Графический процессор GA102 оснащен тем же механизмом кодирования NVENC 7-го поколения, что и Turing, но имеет более новый механизм NVDEC 5-го поколения. Новый декодер 5-го поколения поддерживает декодирование с аппаратным ускорением кодеков MPEG-2, VC-1, H.264 (AVCHD), H.265 (HEVC), VP8, VP9 и совершенно новых кодеков AV1. И есть еще много чего, что нужно упомянуть, например RTX IO, технология уменьшения задержки NVIDIA Reflex, приложение для микширования с искусственным интеллектом Omniverse Machinima и плагин для улучшения звука и видео NVIDIA Broadcast для стримеров и авторов. Мы рассмотрели все это в наших обзорах RTX 3080 и в статье об архитектуре Ampere. Перейдите по этому URL-адресу, если вам нужны эти подробности.
А теперь перейдем к некоторым цифрам ...
Тестирование NVIDIA GeForce RTX 3090
Как мы настраивали наши тестовые системы: мы тестировали графические карты, представленные в этой статье, наматеринской плате ASUS Prime X299 Deluxe с 18-ядерным / 36-поточным процессором Core i9-10980XE и32 ГБ оперативной памяти HyperX DDR4 на частоте 2933 МГц. Первое, что мы сделали при настройке тестовой системы, - это вошли в UEFI и установили для всех значений на "высокопроизводительные", затем мы отключили все интегрированные периферийные устройства, которые не могли использоваться. Частоты памяти были настроены на оптимальные параметры производительности с использованием профиля XMP, затем твердотельный накопитель был отформатирован, а Windows 10 Professional x64 была установлена и полностью обновлена. Когда установка Windows была завершена, мы установили все драйверы, игры, приложения и инструменты тестирования, необходимые для выполнения наших тестов.
SiSoft SANDRA 2020 - Тесты OpenCL
Тест SANDRA GPGPU Image Processing использует множество фильтров для справочных данных и предлагает совокупную оценку, полученную на основе множества индивидуальных результатов. Тест "Научный анализ" запускается через массив операций общего матричного умножения (GEMM), моделирования N-тел (NBDY) и быстрого преобразования Фурье и сообщает общую скорость в FLOP. В этих тестах доступны пути кода CUDA и OpenCL, но мы использовали OpenCL на всех картах, чтобы сохранить общий уровень тестов . Раньше использование CUDA с графическими процессорами NVIDIA приводило к лучшей производительности, но теперь OpenCL фактически превосходит его в этих тестах.
Мы видим , что в тесте обработки изображений SANDRA GPGPU GeForce RTX 3090 начинает с огромного отрывом , опережая RTX 3080 на 21% и более чем вдвое превышая производительность Titan RTX и 2080 Ti.
Тест Scientific Analysis показывают, что GeForce RTX 3090 опережает GeForce RTX 3080 и Titan RTX, но его преимущества в производительности несколько меньше. RTX 3090 все еще обгоняет Titan RTX, и опережает RTX 3080 примерно на 7–18% в зависимости от теста.
IndigoBench - Производительность рендеринга GPU
IndigoBench основан на усовершенствованном движке рендеринга Indigo 4 и предлагает режимы рендеринга CPU и GPU для двух своих встроенных моделей. Автономный тест доступен для Windows, MacOS и Linux и выдает результаты в M / Samples в секунду.
И тут GeForce RTX 3090 лидирует, но с относительно небольшим отрывом. Здесь новый флагман NVIDIA примерно на 16,6% быстрее, чем RTX 3080, и примерно на 31% быстрее, чем Titan RTX.
Blender - 3D визуализация
Blender - это бесплатный инструмент для создания 3D-контента с открытым исходным кодом, который может обрабатывать все, от моделирования, оснастки, анимации, моделирования, рендеринга, композитинга и отслеживания движения. Разработчики создали удобный автономный инструмент для тестирования производительности, который будет отслеживать время, необходимое для рендеринга нескольких моделей с использованием различных путей кода. Мы использовали несколько общедоступных моделей для общедоступного теста, но также выполнили более сложную рабочую нагрузку, чтобы выделить одну из сильных сторон GeForce RTX 3090.
На двух диаграммах ниже мы видим результаты из BlenderBench с использованием моделей Classroom и BMW, с использованием CUDA или OPTIX. CUDA, очевидно, использует ядра CUDA GeForce , в то время как OPTIX включает движок RT. Здесь GeForce RTX 3090 примерно на 16% быстрее, чем RTX 3080 при использовании CUDA. При использовании OPTIX это преимущество сокращается до менее 5%. Однако обе карты намного быстрее Titan RTX.
Переход к более крупной и более сложной модели и одновременное выполнение вьюпорта и финального рендеринга с помощью Blender - это совершенно другая история. С этой рабочей нагрузкой вступают в игру дополнительные вычислительные ресурсы GeForce RTX 3090 и буфер 24 ГБ, и в итоге он оказывается примерно в 3–4 раза быстрее, чем GeForce RTX 3080 или Titan RTX.
Тесты: Unigine, UL и CryTek Benchmarks
Superposition - это относительно новый тест от Unigine , работающий на движке UNIGINE 2 Engine. Он предлагает множество режимов тестирования, ориентированных на игровые рабочие нагрузки, а также на виртуальную реальность, с DirectX и OpenGL. Unigine Superposition использует уникальную технологию динамического освещения SSRTGI (Screen-Space Ray-Traced Global Illumination), а также высококачественные текстуры и модели для создания потрясающих визуальных эффектов.
Мы запускали Superposition в трех режимах, используя DirectX - 1080p Extreme, VR Future и 8K Optimized - для сравнения производительности всех представленных здесь видеокарт.
Тест Unigine Superposition 1080P Extreme показал, что GeForce RTX 3090 превосходит RTX 3080 чуть более чем на 16%, а Titan RTX почти на 40%.
Общая тенденция к производительности остается такой же с тестом Superposition VR Future, но различия между картами несколько сокращаются. Здесь GeForce RTX 3090 всего примерно на 14,5% быстрее, чем RTX 3080, и по-прежнему намного быстрее чем Titan RTX.
Если мы увеличим разрешение до 8K (по крайней мере, виртуально - в тесте используется масштабирование разрешения для оценки 8K вместо монитора, способного отображать разрешение), GeForce RTX 3090 опережает RTX 3080 и Titan RTX снова вверх. до более 19% и 37% соответственно.
Тест UL VRMark
VRMark от UL предназначен для проверки готовности ПК к работе с гарнитурами виртуальной реальности HTC Vive и Oculus Rift . Однако для теста не требуется, чтобы одна из гарнитур была подключена к ПК для работы, он использует собственный графический движок и контент для обеспечения сопоставимых результатов между различными платформами. Здесь мы провели тест VRMark с настройками по умолчанию, который в настоящее время является самым сложным тестом, из предлагаемых инструментов.
То же самое мы наблюдали в тесте VRMark "Blue Room", где GeForce RTX 3090 опередила 3080 на 17% и Titan RTX почти на 29%.
UL 3DMark Time Spy - Производительность Direct X 12
3DMark Time Spy - это синтетический тест производительности DirectX от Futuremark. Он оснащен движком DirectX 12, созданным с нуля для поддержки передовых функций, таких как асинхронные вычисления, явная мультиадаптерная и многопоточность. Time Spy разработан для тестирования производительности DirectX 12 новейших видеокарт с использованием различных методов и различных визуальных последовательностей. Этот тест был разработан при участии AMD, Intel, Microsoft, NVIDIA и других участников программы разработки тестов Futuremark Benchmark Development Program, чтобы продемонстрировать производительность и визуальный потенциал видеокарт и других системных ресурсов.
В стандартном тесте 3DMark Time Spy, основанном на DX12 , GeForce RTX 3080 и RTX 3090 фактически связаны с процессором, и только на 1,1% разделяют эти две карты. Titan RTX становится жертвой GeForce RTX 3090 примерно на 18,5%.
UL 3DMark Fire Strike - Синтетические игры DirectX
3DMark Fire Strike имеет несколько тестовых режимов: нормальный режим работает с разрешением 1920x1080, экстремальный режим - 2560x1440, а режим Ultra работает с разрешением 4K. Целевое использование памяти графического процессора для нормального режима составляет 1 ГБ, и в тесте используются тесселяция, окружающая окклюзия, объемное освещение и фильтр глубины резкости среднего качества. Более требовательный экстремальный режим ориентирован на 1,5 ГБ памяти и повышает уровень детализации по всем направлениям. Режим Ultra специально разработан для систем CrossFire / SLI и еще больше повышает качество. GT 1 фокусируется на геометрии и освещении. GT2 делает упор на моделирование.
По нашим результатам в тесте Fire Strike на основе DX11 GeForce RTX 3090 снова выходит в лидеры с показателями на 13% и 34% лучше, чем GeForce RTX 3080 и Titan RTX, соответственно, и почти вдвое превосходит Radeon RX 5700 XT.
Crytek Neon Noir - Тест на отслеживание трассировки лучей API Agnostic
Демо-версия Crytek Neon Noir была создана с использованием усовершенствованной версии технологии CRYENGINE Total Illumination, которая будет использоваться в предстоящем Crysis Remastered для улучшения визуальных эффектов игры. Neon Noir был разработан на основе настроенной версии CRYENGINE 5.5. И не зависит от API и оборудования. Он позволяет запускать трассировку лучей практически на любом современном графическом процессоре, однако будущая интеграция технологии будет оптимизирована для новейших графических процессоров и API, таких как Vulkan и DX12.
Отметьте еще одну явную победу GeForce RTX 3090, которая лидирует с 16.6% (GeForce RTX 3080) до 192% (AMD Radeon RX 5700 XT).
Тесты игр DirectX и Vulkan
Metro Exodus основан на серии романов о Metro Дмитрия Глуховского, которые начались с Metro 2033 еще в 2005 году. За этой первой частью последовали такие сюжеты , как Metro Last Light, а затем Last Light Redux. Как и другие серии этой игры, Metro Exodus следует постапокалиптической сюжетной линии, действие которой происходит на территории бывшей Российской Федерации. Игра отличается улучшенной графикой и визуальными эффектами, а также поддерживает технологии NVIDIA RTX и DLSS .
Использование предустановки качества Ultra и запуск этой игры с разрешением 4K показывает, что GeForce RTX 3090 опережает GeForce RTX 3080 чуть более чем на 14%, по крайней мере, с точки зрения средней частоты кадров. Минимальная частота кадров 3090 тоже была намного лучше, и обе карты превзошли Titan RTX.
Переключение на RTX и DLSS для дальнейшего повышения визуальной четкости и введения некоторых эффектов трассировки лучей немного снижает частоту кадров по всем направлениям и сокращает преимущество GeForce RTX 3090 над GeForce RTX 3080 до чуть более 13%.
Red Dead Redemption 2 - Игровой блокбастер
Red Dead Redemption 2 от Rockstar - третья игра в серии Red Dead. Сюжет игры разворачивается в 1899 году и следует за преступником Артуром Морганом из банды Ван дер Линде в вымышленном стиле Дикого Запада. Игра отличается богатой, детализированной графикой, которая может оказаться непосильной для высокопроизводительных графических процессоров при максимальном качестве изображения.
Дельта, разделяющая новые GeForce RTX 3090 и GeForce RTX 3080, в этой игре относительно мала - порядка 9%. Однако RTX 3090 был примерно на 34% быстрее, чем Tian RTX.
Тесты игры Wolfenstein: Youngblood (Vulkan)
Wolfenstein: Youngblood позволяет игрокам играть за одного из близнецов Бласковиц - Джесс или Соф. Сюжетная линия следует за близнецами, которые пытаются разыскать своего отца, Би Джея, в Париже в 80-х годах. Игра имеет темную графику и является одной из немногих игр на ПК, в которых в настоящее время используется API Vulkan.
GeForce RTX 3090 сохранила аналогичное преимущество над GeForce RTX 3080 и Titan RTX .
NVIDIA GeForce 3090: разгон, мощность, шум и заключение
Несмотря на то, что это самый быстрый графический процессор который мы тестировали, мы всё же потратили некоторое время на разгон GeForce RTX 3090, чтобы увидеть, какую дополнительную производительность мы можем выжать из этой карты.
Разгон GeForce RTX 3090
Карты серии GeForce RTX 30 на базе Ampere, в нашем случае GeForce RTX 3090, и графические процессоры на базе Pascal и Turing предыдущего поколения, которые были до него, поддерживают разгон графического процессора. GPU Boost регулирует частоты и напряжения в зависимости от рабочей нагрузки графического процессора и характеристик используемых приложений. При достижении предела температуры или мощности весь алгоритм разгона графического процессора падает до более низкого уровня частоты / напряжения , пытаясь постепенно снизить мощность и температуру, и при этом не вызывая значительных колебаний производительности. Тем не менее, максимальную частоту можно настроить и в ручную, чтобы добиться большей производительности.
Как мы уже упоминали в некоторых из наших предыдущих статей , NVIDIA сегментировала шины питания ядра и памяти и оптимизировала интерфейсы на картах серии RTX 30. Тем не менее, как и карты на базе Turing предыдущего поколения, серия GeForce RTX 30 на базе Ampere функционально ограничена по мощности, чтобы предотвратить повреждение и обеспечить долговечность видеокарт.
Однако на GeForce RTX 3090 значение мощности может быть увеличено до 9%, и максимальное значение температуры может быть увеличено с 83 ° C до 91 ° C, а напряжение графического процессора может быть увеличено до 0,1 В.
При разгоне нашего образца RTX 3090 мы не усложняли задачу. Мы использовали смещения частоты и напряжения, а также ползунки значений мощности и температуры, доступные в последней версии EVGA Precision X1, чтобы вывести карту за пределы стандартной конфигурации. Сначала мы увеличили значения температуры, мощности и напряжения, а затем увеличили смещения тактовой частоты графического процессора и памяти до тех пор, пока тестовая система не перестанет работать стабильно.
В конечном итоге графический процессор нашей карты достиг максимальной частоты более 2,1 ГГц с эффективной скоростью передачи данных памяти 19,7 Гбит / с.
Потребляемая мощность GPU
На протяжении всего нашего бенчмаркинга и тестирования мы отслеживали выходной уровень шума и отслеживали, сколько энергии потребляли графические процессоры с помощью устройства NVIDIA PCAT. Наша цель состояла в том, чтобы дать вам представление о том, сколько энергии использует каждый графический процессор в режиме ожидания, а также при большой рабочей нагрузке. Эти значения мощности были получены в течение прогона в 3DMark Fire Strike.
GeForce RTX 3090 потребляет больше всего энергии по всем направлениям. Энергопотребление в холостом режиме, средняя и пиковая мощность были выше, чем у GeForce RTX 3080, чего и следовало ожидать, учитывая более высокую производительность более мощного RTX 3090, дополнительные ресурсы графического процессора и памяти, а также тот факт, что обе карты используют одну и ту же технологию.
Однако вся эта мощность не приводит и к более высоким температурам. На протяжении всего нашего тестирования, будь то штатное или разогнанное, GeForce RTX 3090 колебалась в диапазоне от 60 ° C до 70 ° C.
Акустика GPU - измерение шума
Энергопотребление GeForce RTX 3090 на базе Ampere конечно выше, чем у его предшественников, но с его относительно низкими рабочими температурами шум не будет проблемой для большинства пользователей, по крайней мере с картой Founder's Edition, которую мы тестировали.
Ни одна из утилит настройки графического процессора, доступных на момент публикации, пока не позволяет вручную изменять скорость вращения вентилятора GeForce RTX 3090 (EVGA Precision X1 работала с 3080). Однако это не мешает вентиляторам GeForce RTX 3090 работать тихо. В нашем тестовом стенде, с кулером CPU (Coolermaster), корпусом (NZXT) и блоком питания (Corsair HX), GeForce RTX 3090 оказалась самой тихой видеокартой из всех. Массивный радиатор карты и большие вентиляторы имеют большое значение для поддержания охлаждения и тишины.
Вердикт
GeForce RTX 3090 - это единственный самый быстрый графический процессор на рынке в настоящее время, без исключений. Однако здесь есть нюанс, который следует учитывать. Преимущества более мощного RTX 3090 по сравнению с 3080 составляют всего от 4% до 20%. По сравнению с Titan RTX преимущества GeForce RTX 3090 увеличиваются примерно до 6–40%.
Очевидно, что GeForce RTX 3090 Founder's Edition за 1499 долларов не будет столь востребованной для подавляющего большинства пользователей. Если вы геймер, то графический процессор, GeForce RTX 3080 менее чем за половину цены - гораздо лучшая покупка. По сравнению с Titan RTX за 2500 долларов или GeForce RTX 2080 Ti за 1300-1500 долларов, GeForce RTX 3090 - значительно лучший выбор. В любом случае покупка GeForce RTX 3090 в конечном итоге будет зависеть от вашего конкретного варианта использования. Если ваш бюджет позволяет то конечно стоит брать RTX 3090. Тем не менее, те кто ранее использовал Titan RTX, может всё же не выдержать и купить RTX 3090.
GeForce RTX 3090 будет доступна в ограниченных количествах - об этом NVIDIA заявила неоднократно. Будем наблюдать, как все изменится в ближайшие недели, а так же будем ждать, когда AMD сделает свои объявления о RDNA2 в следующем месяце. И давайте не будем забывать, что у нас все еще есть GeForce RTX 3070, который будет иметь чрезвычайно широкую популярность, если заявления NVIDIA о производительности останутся в силе. Видеокарта ZOTAC GAMING GeForce RTX 3090 Trinity 24GB