По мере того как игры становятся всё более многопоточными, гибридная архитектура процессоров от Intel может начать отставать от более простой, но эффективной архитектуры от AMD.

AMD и Intel приняли различные стратегии для увеличения количества ядер в своих процессорах. AMD (известная как Team Red) и её процессоры Ryzen выбрали подход с чиплетами. Это подразумевает создание блока из ядер и кэша, компактно размещаемого на одном небольшом чипе. Увеличивая количество таких чиплетов путём их укладки или дублирования, можно легко добавить больше ядер для повышения производительности.

Intel выбрала включение двух различных типов ядер в свои процессоры и сохранила такую ‘гибридную’ структуру, которая развивалась дальше с их последними процессорами, использующими подход тайловых/чиплетов, представленный в 2021 году (Alder Lake). Вместо изменения гибридной архитектуры она стала еще более сложной, не показывая признаков изменений.

Конструкция Arrow Lake ознаменовала изменение в типичном решении Intel, так как было прекращено использование гипертрейдинга (также известного как одновременное многопоточное выполнение), и вместо этого P- и E-ядра были объединены внутри одного чипа вместо их сохранения как отдельных групп ядер.

С момента своего возникновения этот гибридный метод всегда требовал некоторой внешней помощи от Windows или программного обеспечения Intel вроде IAO (Intel Application Optimization), чтобы гарантировать, что основные задачи выполняются исключительно ядрами P. Но с течением времени количество потоков, используемых играми, значительно увеличилось. С устранением гиперпоточности в Arrow Lake ядра E становятся все более актуальными.

Чтобы дать вам четкое понимание, я протестировал загрузку процессора двух топовых систем на пяти различных играх. Одна система — это CyberPowerPC с процессором Ryzen 7 9800X3D и графической картой RTX 5080. Другая конфигурация — Core Ultra 7 265K с RTX 4080 Super для обработки графики. Важно отметить, что эти системы не сопоставимы напрямую, и было бы несправедливо сравнивать производительность $477 за Ryzen 9800X3D и $323 за Core 265K.

Вместо того чтобы фокусироваться на производительности, меня больше интересует понимание использования ядер CPU. Важно отметить, что графики загрузки процессора в диспетчере задач не дают информации о том, насколько интенсивно используются эти ядра. Даже если одно ядро показывает 100% загрузку, это необязательно означает, что оно не может справиться с дополнительной нагрузкой.

В следующих видео вы увидите основное использование процессора Ryzen 7 9800X3D с одной стороны и аналогичное демонстрационное выступление для Core Ultra 7 265K с другой.

Использование процессора Cyberpunk 2077

Давайте погрузимся в Cyberpunk 2077, масштабную игру с бесчисленными предметами и персонажами на сцене. Учитывая её обширность, можно предположить, что она будет сильно нагружать центральный процессор. Действительно, так оно и есть до некоторой степени, но при увеличении настроек графики CPU отходит в сторону, позволяя управлять процессом графическому процессору (GPU).

Я сделал запись игрового процесса Cyberpunk 2077 в разрешении 4K и максимальных настройках графики, включая трассировку лучей, с активированными DLSS Quality и frame generation. При проверке оказалось, что только первый и третий ядра в Ryzen 9800X3D имеют значительное использование.

Как геймер, когда я проверяю свой Диспетчер задач, вижу упорядоченные логические процессоры моего Core Ultra 7 265K: от ядра 1 (поток 1 и поток 2) до ядра 8 слева направо и сверху вниз. Поскольку этот процессор не поддерживает одновременную многопоточность, эти логические процессоры являются просто физическими ядрами.

Диспетчер задач циклически проходит по ядрам процессоров Arrow Lake в следующей последовательности: сначала он использует P-ядро 1, затем P-ядро 2. После этого переходит к E-ядрам начиная с 1 и до 4. Затем следует использование P-ядер от 3 до 6. Далее идет серия из E-ядер с номерами от 5 до 12. В конце используются последние два P-ядра под номерами 7 и 8.

В игре Cyberpunk 2077 код оптимизирован для выполнения задач на производительных ядрах гибридных процессоров. Это видно по тому, что самые загруженные P-1 и P-5 ядра используются наиболее интенсивно, тогда как все остальные производительные ядра задействованы примерно одинаково. Между тем, эффективные ядра, судя по всему, обрабатывают менее тяжёлые задачи.

Как геймер, я проверил производительность своего Ryzen 7 9800X3D с помощью HWInfo64 и вот что обнаружил: этот инструмент показывает тактовые частоты каждого ядра, начиная с ядра 0 (технически говоря). Что интересно, он также указывает на ‘предпочтительные’ ядра – это те, к которым Windows чаще всего присваивает потоки. В моем случае ядра 0 и 3 кажутся более загруженными по сравнению с другими, но до достижения 265K еще далеко!

Загрузка процессора Stalker 2

Для визуальных эффектов и других аспектов Stalker 2 использует движок Unreal Engine 5, который способен эффективно справляться с множеством задач, особенно при одновременной отправке списков графических команд. Подобно CP2077, Stalker 2 является обширной игрой с открытым миром, причем требования к CPU превышают таковые у Cyberpunk из-за его сложного геймплея.

Здесь в разрешении 4K мы доводим возможности процессоров 9800X3D и 265K до предела с максимальными настройками, качеством DLSS и генерацией кадров. Тем не менее, основное бремя обработки вновь ложится на плечи P-ядер чипа Arrow Lake. У процессора 9800X3D есть достаточно ресурсов для управления увеличением использования CPU благодаря своей мощности, в то время как процессор 265K ограничен восемью P-ядрами и восемью потоками, что может оказаться недостаточно эффективным при интенсивных задачах.

Использование ЦП в Assassin’s Creed Shadows

В игре Assassin’s Creed Shadows, еще одном экшене с открытым миром, разворачивается похожая история, но на этот раз с использованием другого движка. Интересно отметить, что некоторые E-cores используются почти так же часто, как P-cores в этой игре. Однако стоит упомянуть, что ядра P-1 и P-5 по-прежнему предпочтительнее для основных потоков игры. Я старался минимизировать техническую терминологию, чтобы сделать текст более доступным для читателей, не знакомых со специфической жаргонной лексикой.

По мере приближения к 40 секундам в видео геймплея нагрузка на CPU стабилизировалась, оставляя достаточно места для свободного дыхания как моему процессору Ryzen, так и Core Ultra. Заметно было, что E-ядра во время выступления Шадоу не вызывали никаких проблем, при этом у Ryzen оставалось больше пространства для манёвра по сравнению с его аналогом.

Использование процессора в ремастере The Last of Us Part 2

В отличие от предыдущих трех игр, которые не сильно полагались на многопоточность, ситуация кардинально меняется в случае The Last of Us Part 2. Эта игра использует несколько потоков для своей системы потокового загрузки ресурсов, применяя DirectStorage для минимизации нагрузки на CPU и дополнительно задействует больше потоков для одновременной компиляции шейдеров в фоновом режиме.

Три из ядер процессора Ryzen 7 9800X3D интенсивно используются, а еще два не сильно отстают. Оставшиеся три ядра (каждая пара в диспетчере задач представляет собой 2 потока на одном ядре) работают с нагрузкой от 40% до 50%, что значительно выше предыдущих наблюдений.

В 265K ядра E берут на себя дополнительные обязанности по сравнению с другими играми. Хотя первые четыре не сильно вносят вклад, но именно два P-ядра вновь подвергаются предельным нагрузкам.

Использование процессора Microsoft Flight Simulator 2024

Я сохраняю самую захватывающую часть на последнее! Когда впервые запускаешь Flight Simulator 2024, он сразу заставляет процессор усердно работать. Это похоже на открытие шлюзов: задачи вроде стриминга ассетов, управления сетевым кодом для загрузки мира и обработки сложной динамики полетов требуют значительной части мощности процессора одновременно.

Со временем обе чипы достигают состояния, при котором не менее 40% их ядер постоянно активны, причем P-ядра в чипе 265K используются даже более активно. Если игре требуется больше ресурсов от этих ядер, они могут превысить свою емкость, вызывая напряжение на менее мощных E-ядрах.

Достаточно ли гибридных конструкций процессоров для игр?

Действительно, эти примеры представляют лишь малую часть и важно отметить, что это не полное или научно точное сравнение. Однако изучая различные игры, я заметил явное предпочтение более интенсивной многопоточности. Некоторые из вас могут подумать: «Давно пора!», поскольку у нас уже довольно давно есть процессоры с несколькими ядрами и 16 потоками.

Я размышляю над смешанной структурой процессора Intel, особенно учитывая тот факт, что она сейчас не поддерживает гиперпоточность. E-cores в Arrow Lake несомненно мощные, но возникает фундаментальный вопрос: более ли выгодно для одного ядра управлять двумя игровыми потоками одновременно или для двух отдельных ядер обрабатывать их независимо?

В течение довольно долгого времени структура персональных компьютеров и консолей на базе Windows основывалась на более прямолинейной методологии, которая может не исчезнуть без потребности в CPU, способном обрабатывать более чем 16 потоков. Замечу, что основные игровые процессоры AMD справляются с каждым потоком практически одинаково эффективно.

В случае процессоров Intel предпочтительнее поручить выполнение всех задач P-ядрам. Однако вы ограничены восемью P-ядрами, которые распределены на восемь потоков. Когда эти ядра становятся полностью загруженными, вместо них используются более медленные E-ядра. Игры типа The Last of Us Part 2 и Flight Simulator 2024 используют оба типа ядер независимо от предпочтений.

Вероятнее всего, что компания Intel продолжит использовать свою гибридную архитектуру на протяжении длительного времени. Аналогично, E-ядра вряд ли превзойдут P-ядра в возможностях; их можно было бы считать одинаковыми. Следовательно, по мере приближения к ближайшему будущему игры, требующие более восьми тяжелых потоков, могут работать медленнее на процессорах Intel по сравнению с AMD из-за этой разницы в типах ядер.

Может быть, это так? Однако следует отметить, что несколько потоков, выполняющихся на одном ядре процессора, должны разделять ресурсы вроде кэша и логических блоков. В результате их скорость обработки может не совпадать точно. Вполне возможно, что два потока на Ryzen-ядре будут обрабатываться примерно с той же скоростью, что и два потока на Intel P- и E-core. Но для окончательного ответа на этот вопрос потребуется более глубокое исследование.

Если бы я был разработчиком игр, мне было бы сложно найти достаточно времени для самостоятельной оптимизации производительности. В таком случае, вероятно, пришлось бы полагаться на знания инженеров AMD и Intel, чтобы гарантировать правильную работу их процессоров. Согласованность в поведении может значительно сократить время, затрачиваемое на тонкую настройку производительности, что, возможно, является одной из причин выбора AMD-процессоров от Microsoft и Sony для своих игровых консолей.

Буду рад услышать, что AMD может разместить 12 ядер в каждом CCD для Zen 6 вместо текущих восьми. Если это правда, гибридная стратегия Intel будет испытывать трудности с поддержанием темпов развития, всё больше отставая от такого оптимизированного дизайна. Будет интересно наблюдать за реакцией Team Blue, если эти слухи подтвердятся.

Смотрите также

2025-04-15 19:48