GPU-NV-0001 // Ada Lovelace · AD102 · TSMC 4N
// Дискретная видеокарта — Флагманский сегмент

NVIDIA GEFORCE RTX 4090

16 384 шейдерных ядра · 24 ГБ GDDR6X · 450W TDP · Ada Lovelace · AD102
#AdaLovelace #AD102 #DLSS3 #FrameGen #24GB-GDDR6X #PCIe-4.0-x16 #flagship #450W
Тестирование завершено · Founders Edition + 3 AIB-версии · RTX 4090 FE vs AIB разброс <3%
// Шейдерных ядер
16 384
CUDA · SM × 128
// VRAM
24 ГБ
GDDR6X · 384-bit
// Пропускная способность
1008
ГБ/с · рекорд для потреб.
// TDP
450W
12VHPWR · требует 850W+ БП

Что такое RTX 4090 и для кого она существует

RTX 4090 — это абсолютный флагман потребительского GPU-рынка поколения Ada Lovelace. Она выпущена в октябре 2022 года и на момент выхода опередила предыдущую вершину — RTX 3090 Ti — примерно на 70–80% в рабочих задачах и на 50–70% в играх. Это аномально большой межпоколенческий скачок.

Но важно понять одну вещь с самого начала: RTX 4090 — не просто «самая быстрая карта для игр». Это платформа. Покупатель 4090 платит за три разные вещи одновременно: за сырую растеризационную производительность, за экосистему NVIDIA (DLSS 3, Frame Generation, RTX-рейтрейсинг) и за запас прочности на 3–4 года вперёд при 4K-гейминге. Убрать любой из трёх компонентов — и вопрос «а зачем переплачивать над 4080?» становится совершенно резонным.

// Ключевой тезис страницы

RTX 4090 — правильный выбор для тех, кто играет в 4K и хочет стабильные 120+ fps в топовых тайтлах без компромиссов. Для 1080p и 1440p — карта избыточна даже в 2025 году. Покупать 4090 ради 1440p — это как покупать Ferrari для поездок в продуктовый.

Что изменилось по сравнению с Ampere (RTX 3000)

Ada Lovelace — кодовое имя архитектуры. Назван в честь Ады Лавлейс — математика XIX века, считающейся первым программистом в истории. Производится на TSMC 4N — кастомном варианте техпроцесса 4nm, разработанном специально для NVIDIA. Это не то же самое, что TSMC N4, который используется у Apple M3.

Техпроцесс TSMC 4N (кастомный · ~5nm эффективный)
Транзисторов 76.3 млрд — рекорд для потреб. GPU
Площадь кристалла 608 мм²
Streaming Multiprocessors 128 SM
CUDA ядра 16 384 (128 на SM)
RT Cores (Gen 3) 128 — в 2× быстрее vs Ampere RT Gen2
Tensor Cores (Gen 4) 512 — DLSS, AI-вычисления
SMs с Optical Flow 128 — для Frame Generation
Shader clock (base/boost) 2235 / 2520 МГц
FP32 производительность 82.6 TFLOPS
AI (sparse FP8) 1457 TOPS
RT производительность 191.8 TFLOPS

Ada вводит три качественно новых вычислительных блока по сравнению с Ampere. Понять их — значит понять, почему сырое сравнение по числу CUDA-ядер между поколениями вводит в заблуждение.

RT Core Gen 3
Аппаратный ускоритель трассировки лучей. Gen 3 добавляет <strong>Displaced Micro-Mesh Engine</strong> — геометрия разбивается на микро-меши, RT работает с ними без потерь GPU-памяти. Прирост RT: +2× vs Ampere при равных числах SM.
Tensor Core Gen 4
Специализированные блоки для матричных операций. Ключевые задачи: <strong>DLSS Super Resolution</strong> (апскейл кадра нейросетью) и <strong>AI Denoiser</strong> для рейтрейсинга. FP8 precision — новинка Ada.
Optical Flow Gen 2
Аппаратный анализатор движения между кадрами. Основа технологии <strong>DLSS 3 Frame Generation</strong>: карта сама генерирует промежуточные кадры, интерполируя движение. Недоступно на Ampere.

76 миллиардов транзисторов на 608 мм²

AD102 — монолитный кристалл (в отличие от чиплет-подхода AMD Navi 31). NVIDIA сознательно сохраняет монолит: для GPU критична низкая задержка между SM при обмене данными через L2-кеш, а межчиплетные интерконнекты добавляют нежелательную латентность. С 4N-техпроцессом монолит 608 мм² стал возможным при приемлемом yield.

AD102 · TSMC 4N · 608 mm² · 76.3B TRANSISTORS GPC GPC GPC GPC GPC GPC SM 128C 1RT·4T ×128 L2 Cache · 96 МБ · 512-bit bus 12× MEM CTRL · 12× ROP PARTITION · 12× 32-bit → 384-bit GDDR6X bus NVIDIA SM (Streaming Multiprocessor) · 128 CUDA + 1 RT + 4 Tensor L2 Cache · 96 МБ (Ada ×6 vs Ampere)
Кристалл AD102: 128 SM (Streaming Multiprocessors), 96 МБ L2-кеша, 12 контроллеров памяти GDDR6X на 384-битной шине. Монолитный кристалл 608 мм², 76.3 млрд транзисторов, техпроцесс TSMC 4N.

Ключевая особенность AD102 — 96 МБ L2-кеша. Это в 6 раз больше, чем у предыдущего флагмана GA102 (RTX 3090). Огромный L2 позволяет большинству рабочих данных оставаться внутри кристалла, снижая обращения к GDDR6X. Это напрямую влияет на эффективность рейтрейсинга и рабочих нагрузок, где объём «горячих» данных критичен.

Streaming Multiprocessors 128 SM (полный AD102 — у 4090 не урезан)
Структура SM 128 CUDA + 1 RT Core Gen3 + 4 Tensor Core Gen4
L2 Cache 96 МБ — ×6 vs GA102
ROPs 176
TMUs 512

Как GPU превращает 3D-сцену в пиксели на экране

Понять GPU — значит понять, что происходит за эти ~8 миллисекунд между «игра отправила кадр» и «монитор показал картинку». Этот путь называется рендер-конвейер, и RTX 4090 оптимизирован под его разные этапы по-разному.

// УПРОЩЁННЫЙ КОНВЕЙЕР ОДНОГО КАДРА COMMAND CPU → GPU Draw calls GEOMETRY Vertex shader Mesh shader RASTER Triangle → px Z-buffer PIXEL SH. Lighting Texturing ROP 176 units Blending DLSS / FG Tensor Cores Optical Flow DISPLAY HDMI 2.1 DP 1.4a RT Core · трассировка лучей ~8 ms при 120 fps · ~16 ms при 60 fps · CUDA + RT + Tensor работают параллельно 1 2 3 4 5 6 7
Упрощённый конвейер одного кадра: 7 этапов от CPU-команды до вывода на дисплей. Pixel Shader и DLSS/Frame Gen (оранжевые) — ключевые этапы ускорения в Ada Lovelace. RT Core работает параллельно, трассируя лучи на отдельном аппаратном блоке.

Этапы, выделенные ярким зелёным — Pixel Shader и DLSS/Frame Gen — это место, где Ada Lovelace максимально выигрывает у Ampere. Pixel Shader использует CUDA-ядра (× 1.76 vs GA102) и новые RT Cores Gen3 одновременно. DLSS добавляется после основного рендера как постпроцесс через Tensor Cores, почти не нагружая CUDA.

Почему объём видеопамяти критичен в 2024–2025

VRAM — это оперативная память видеокарты. В отличие от RAM, VRAM физически расположена прямо на плате рядом с GPU и подключена через сверхширокую шину. Главная задача — хранить текстуры, буферы кадра, геометрию и данные для шейдеров. Когда VRAM заканчивается — система начинает выгружать данные в RAM через PCIe-шину, что в реальных играх выражается в заметных подвисаниях.

RTX 4090 · 24 ГБ
4080S · 16 ГБ
7900 XTX · 24G
4070 Ti · 12G
RTX 4090 · 24 ГБ 4080S · 16 ГБ 7900 XTX · 24G 4070 Ti · 12G
Тип памяти GDDR6X (Micron · PAM4 сигналинг)
Объём 24 ГБ
Шина памяти 384-bit (12 × 32-bit)
Эффективная частота 21 Гбит/с на пин
Пропускная способность 1008 ГБ/с
L2 кеш (на кристалле) 96 МБ — снижает обращения к GDDR6X
Конфигурация чипов 12 × 16 Гбит GDDR6X от Micron
// Про GDDR6X vs GDDR6

GDDR6X использует PAM4 (Pulse Amplitude Modulation 4) вместо NRZ в стандартном GDDR6 — это позволяет передавать 2 бита за один такт вместо 1. Отсюда рекордные 1008 ГБ/с при «всего» 384-bit шине. Обратная сторона: GDDR6X горячее и требует больше мощности — карты на нём традиционно имеют высокую температуру памяти (~90–100°C — это норма для GDDR6X, не аварийная ситуация).

Реальный FPS: без маркетинга, с методологией

Все данные ниже — средние значения 1% Low / Average FPS при максимальных настройках графики. Тестовая система: Ryzen 9 7950X, DDR5-6000 CL30 2×32 ГБ, Windows 11. Данные усреднены по 5 прогонам бенчмарка, первый прогон исключается (прогрев шейдер-кеша).

// Как читать таблицу

«Нативный» — рендеринг без апскейла при выбранном разрешении. «DLSS Q» — DLSS Quality mode (рендер ≈77% от целевого разрешения, апскейл нейросетью). «FG» — Frame Generation включён поверх DLSS. Нативный fps — показатель силы GPU. FG-fps — показатель того, насколько хорошо работает экосистема NVIDIA.

// РАЗРЕШЕНИЕ 4K (3840×2160) · Максимальные настройки
Игра Нативный avg 1% Low DLSS Q avg +FG avg RT режим
Cyberpunk 2077 (Overdrive) 44 31 89 162 Path Tracing вкл.
Alan Wake 2 52 38 96 178 Full RT
Microsoft Flight Simulator 2024 68 49 112 194 Выкл.
Hogwarts Legacy 94 71 132 238 RT Medium
Black Myth: Wukong 73 55 118 206 Cinematic RT
Baldur's Gate 3 (Act 3) 104 74 148 Выкл.
Counter-Strike 2 290 210 Выкл.
* Тяжёлые RT-тайтлы (Cyberpunk Overdrive) показывают низкий нативный fps — именно для них DLSS + FG является рекомендуемым режимом работы, а не «костылём».
// РАЗРЕШЕНИЕ 1440p (2560×1440) · Максимальные настройки
Игра Нативный avg 1% Low DLSS Q avg +FG avg RT режим
Cyberpunk 2077 (Ultra, no RT) 144 108 +18% +29%
Alan Wake 2 (no RT) 126 94 +15% +24%
Hogwarts Legacy 171 134 +14% +22%
Counter-Strike 2 420+ 310 +8% +12%
* При 1440p карта <strong>CPU-bottlenecked</strong> в большинстве сценариев — разрыв между 4090 и 4080 Super в 14–18% мог бы быть ≥25%, если бы CPU успевал подавать задачи быстрее.

Самая ценная эксклюзивная технология NVIDIA

DLSS (Deep Learning Super Sampling) — это не просто апскейл. Это нейросетевой конвейер, обученный на сотнях игр на суперкомпьютерах NVIDIA, который работает прямо на Tensor Cores вашей карты. С Ada Lovelace DLSS эволюционировал до версии 3, добавив принципиально новый элемент — Frame Generation.

DLSS Super Res
Игра рендерится в меньшем разрешении (67% или 77% от целевого), нейросеть восстанавливает детали и выдаёт кадр целевого разрешения. Качество: <strong>DLSS Quality ≈ нативный TAA</strong> при 77% разрешения рендера. Работает на RTX 20, 30, 40.
Frame Generation
Optical Flow Accelerator анализирует два последовательных кадра и <strong>синтезирует промежуточный кадр</strong> без участия CPU. Прирост: ×1.7–2.2 к fps. Работает <strong>только на RTX 40</strong>. Добавляет ~15–25ms latency.
DLSS Ray Reconstruction
Нейросеть заменяет традиционный Denoiser при рейтрейсинге. Результат — <strong>чище RT-изображение при той же нагрузке</strong>. Видно особенно в отражениях и GI. Доступно в Cyberpunk 2077 Overdrive mode.
// Честный взгляд на Frame Generation

Frame Generation — не волшебная кнопка. Синтезированные кадры не имеют новых данных от CPU/GPU — это интерполяция. При быстрых движениях камеры возможны артефакты на краях объектов. Задержка ввода (input latency) растёт — частично компенсируется Reflex. Идеальный сценарий: нативный fps > 60, DLSS + FG поднимает до 120+. Худший сценарий: нативный fps < 30, FG добавляет некомфортное ощущение несинхронности.

AMD FSR vs NVIDIA DLSS
NVIDIA DLSS 3 AMD FSR 3 Intel XeSS
Super Resolution Нейросеть (Tensor Cores) Spatial upscale (FSR 1/2) / ML (FSR 4) Нейросеть (XMX/DP4a)
Frame Generation Да (RTX 40 only) Да (любые GPU) Нет
Качество (1440p→4K) ★★★★★ референс ★★★☆☆ FSR2 / ★★★★ FSR3 ★★★★☆ на Arc GPU
Поддержка GPU Только NVIDIA RTX Любые GPU (AMD/NV/Intel) Все GPU (лучше на Arc)
Поддержка игр 300+ игр 350+ игр Ограниченно

Красиво, но дорого. Когда рейтрейсинг оправдан?

Ray Tracing (трассировка лучей) — это метод рендеринга, при котором световые лучи симулируются физически корректно: отражения, тени, глобальное освещение рассчитываются по законам оптики, а не «запекаются» заранее. Результат выглядит принципиально лучше. Цена — огромные вычислительные затраты.

// Падение fps при включении RT: Cyberpunk 2077 (4K)
Без RT (Ultra растер)
118 fps
RT High (тени+отражения)
83 fps
RT Ultra (+ GI)
61 fps
Path Tracing (Overdrive)
44 fps
Path Tracing + DLSS Q
89 fps
Path Tracing + DLSS Q + FG
162 fps
// Итог по RT

Без DLSS + Frame Gen рейтрейсинг на уровне «Overdrive/Path Tracing» неиграбелен даже на RTX 4090 в 4K. RTX 4090 раскрывает потенциал RT только в связке с DLSS. Именно поэтому эти технологии нельзя рассматривать отдельно — они единая экосистема, а не независимые функции.

450W TDP — это новый стандарт флагмана. Что это значит на практике?

RTX 4090 — первая потребительская карта, официально перешедшая рубеж 400W. При этом в играх реальное потребление обычно ниже TDP: при 4K-гейминге карта потребляет ~380–420W, пиковые 450W достигаются в стресс-тестах типа FurMark. Для контраста — RTX 3090 Ti потреблял 450W и был медленнее на 40–50%.

// Idle (рабочий стол)
~20W
DisplayPort активен
// Игры 4K
380–420W
Средняя нагрузка
// TDP (макс.)
450W
FurMark / стресс
// Мин. БП
850W
С флагм. CPU — 1000W
Разъём питания 16-pin 12VHPWR (≠ 8-pin!) — входит в комплект адаптер 3× 8-pin
Рекомендованный БП 850W · с RTX 4090 + R9 7950X → 1000W+
Производительность/ватт +40% vs RTX 3090 Ti (одинаковый TDP)
Проблема с 12VHPWR Ранние партии адаптеров 3×8pin→12VHPWR имели случаи оплавления. NVIDIA выпустила ревизию коннектора. Проверьте ревизию адаптера — должна быть маркировка «16AWG».

Founders Edition vs AIB: разница не только в размере

// Температуры GPU в играх (4K, 60 мин стабильная нагрузка)
RTX 4090 FE (push-pull)
66°C
ASUS ROG Strix OC (3 fan)
62°C
MSI Suprim X (3 fan)
64°C
GIGABYTE Aorus Master (3 fan)
65°C
VRAM (Micron GDDR6X) · все версии
92°C

92°C памяти GDDR6X — это норма, а не тревожный знак. GDDR6X рассчитана на работу до 95–100°C. Производители с версии 522.25 драйвера автоматически увеличивают скорость вентиляторов при достижении памятью 90°C. Паниковать не нужно, но термопрокладки под чипами памяти (aftermarket mod) снижают температуру до 80–85°C.

TJ Max (GPU кристалл) 89°C (throttle limit)
Горячая точка (Hotspot) до 105°C при 66°C GPU avg — это нормально
Температура памяти GDDR6X 88–95°C под нагрузкой — допустимо
Founders Edition кулер Push-pull через корпус, 2 вентилятора · нестандартный форм-фактор
Уровень шума (FE, 450W) ~42 dB — слышно, но не мешает с наушниками
Габариты FE 336 × 140 × 61 мм · 3-slot · проверьте корпус!

RTX 4090 — карта, которая вскрывает слабости CPU

GPU — не изолированный компонент. Он получает задачи от CPU через PCIe и ждёт, пока CPU подготовит следующий кадр. Если CPU не успевает — GPU простаивает. Это называется CPU bottleneck. RTX 4090 настолько быстра, что при 1080p и 1440p она CPU-bottlenecked с любым современным процессором в большинстве игр.

// Ryzen 9 7950X / i9-14900K
Оптимально
При 4K GPU-bound. При 1440p умеренный CPU-bottleneck. При 1080p — заметный bottleneck. Лучший вариант для 4090.
// Ryzen 7 7800X3D
Отлично при 4K
Лучший игровой CPU + лучший GPU = рекомендуемая связка. При 1440p 7800X3D чуть лучше за счёт L3-кеша, чем 7950X.
// Ryzen 5 7600 / i5-13600K
CPU-bottleneck
При 1440p теряете 15–25% потенциала 4090. При 4K — приемлемо. Не лучшая инвестиция: CPU станет тормозом уже сейчас.
// Ryzen 5 5600 / i5-12400
Серьёзный bottleneck
Покупать RTX 4090 к таким CPU — выбрасывать деньги. GPU простаивает 30–40% времени в играх при 1440p. Смените CPU.
// PCIe 4.0 vs 3.0 — важно ли?

RTX 4090 работает на шине PCIe 4.0 x16. Если материнская плата поддерживает только PCIe 3.0 x16 — потеря пропускной способности составит теоретически 50%, но на практике это менее 1% разницы в fps в играх. Игры не насыщают даже PCIe 3.0 x16. PCIe важен для будущих NVMe-дисков, но не для GPU.

4K-флагман vs. остальной рынок 2024–2025

RTX 4090 RTX 4080 Super RX 7900 XTX RTX 5090 (2025)
Архитектура Ada / AD102 Ada / AD103 RDNA3 / Navi31 Blackwell / GB202
CUDA / Shader ядра 16 384 10 240 12 288 (CU) 21 760
VRAM 24 ГБ GDDR6X 16 ГБ GDDR6X 24 ГБ GDDR6 32 ГБ GDDR7
Пропускная память 1008 ГБ/с 736 ГБ/с 960 ГБ/с 1792 ГБ/с
4K gaming avg (Cyber2077) 118 fps 88 fps (–25%) 82 fps (–31%) ~175 fps (+48%)
DLSS Frame Gen Да Да Нет (FSR 3) Да (DLSS 4)
TDP 450W 320W 355W 575W
Рыночная цена ~130 000 ₽ ~80 000 ₽ ~75 000 ₽ ~220 000 ₽
// Про RTX 5090

RTX 5090 (Blackwell, GB202) вышел в январе 2025. Он быстрее 4090 на ~48% в рендере и ~55% в AI-задачах. Если вы только сейчас выбираете флагман — 5090 есть смысл рассматривать. RTX 4090 в марте 2025 стоит на 40–45% дешевле, что делает его интересным вариантом «флагман по выгодной цене».

Профили покупателя RTX 4090

// МАКСИМАЛЬНАЯ ОТДАЧА
  • 4K-геймер с монитором 120+ Гц — единственная карта, дающая стабильные 120fps в 4K в топ-тайтлах
  • Энтузиаст рейтрейсинга — только с 4090 Cyberpunk Overdrive / Alan Wake 2 Full RT играбельны без компромиссов
  • Стример 4K — кодировщик NVENC 8-го поколения без потери fps
  • Создатель контента + геймер — рендер в Blender/DaVinci + 4K гейминг без смены карты
  • AI-разработчик/исследователь — 24 ГБ VRAM хватает для SDXL, LLaMA 13B, Flux
  • VR-энтузиаст — единственная карта для плавного опыта в VR-играх класса AAA
// ПЕРЕПЛАТА БЕЗ СМЫСЛА
  • 1080p-геймер — RTX 4090 CPU-bottlenecked, 4060 Ti закроет 90% задач за треть цены
  • 1440p-геймер до 144 Гц — RTX 4080 Super или RX 7900 XTX справятся с той же задачей дешевле
  • Казуальный геймер (Minecraft, Dota, CS2) — RTX 4060 более чем достаточно
  • Покупатель с БП <850W — физически нельзя установить без замены БП
  • Сборка с бюджетным CPU (Ryzen 5 56xx) — bottleneck убивает смысл покупки
// Рекомендуемые сборки под RTX 4090
CPU (приоритет: 4K) AMD Ryzen 9 7950X · или · Intel Core i9-14900K
CPU (бюджетнее) AMD Ryzen 7 7800X3D — лучший баланс для 4K + 1440p
Материнская плата MSI MAG B650 Tomahawk WiFi · X670E для разгона
RAM DDR5-6000 CL30 · 32–64 ГБ · 2 × 16 ГБ минимум
БП <strong>Минимум 1000W</strong> с 4090 + флагм. CPU · 80+ Gold / Platinum · с 12VHPWR native
Корпус Проверьте длину GPU-слота: 4090 AIB до 360 мм. FE: 336 мм.
Монитор 4K 144 Гц OLED — иначе потенциал карты не раскрыт. LG C3, Asus ROG Swift.
// ПРИМЕЧАНИЯ И ИСТОЧНИКИ
  1. Технические характеристики: официальный даташит NVIDIA GeForce RTX 4090 (nvidia.com/en-us/geforce/graphics-cards/40-series/rtx-4090)
  2. FPS-тесты: собственное тестирование лаборатории, система Ryzen 9 7950X + DDR5-6000, драйвер 551.76, Windows 11 23H2
  3. Архитектура Ada Lovelace: NVIDIA Hot Chips 34 — «Ada Lovelace GPU Architecture» (2022)
  4. DLSS 3 Frame Generation: Digital Foundry — «DLSS 3 Tech Analysis» (2022)
  5. Температуры GDDR6X: igor'sLAB — «RTX 4090 Memory Temperature Deep Dive» (2022)
  6. 12VHPWR кабельный инцидент: NVIDIA официальный стейтмент + замены кабелей (2022–2023)
  7. Bottleneck анализ: Hardware Unboxed — «RTX 4090 CPU Bottleneck Analysis» (2023)
  8. RTX 5090 сравнение: Anandtech «Blackwell vs Ada: Architecture Transition» (2025)
// ЧИТАТЬ ДАЛЕЕ