Улучшенный графический процессор AMD RDNA 3.5 ориентирован исключительно на повышение производительности мобильных игр.

Улучшенный графический процессор AMD RDNA 3.5 ориентирован исключительно на повышение производительности мобильных игр.

Как давний геймер и энтузиаст технологий, я видел немало обновлений архитектуры графического процессора за эти годы. Недавнее представление AMD RDNA 3.5 для мобильных приложений вызвало у меня интерес, но как человеку, который в основном использует интегрированные графические процессоры в маломощных ноутбуках и портативных игровых ПК, мне было любопытно посмотреть, как это обновление повлияет на производительность.

На прошлой неделе в Лос-Анджелесе компания AMD представила более глубокий взгляд на усовершенствования архитектуры процессора Zen 5 во время мероприятия. Также они коснулись незначительных обновлений RDNA 3.5, которые по сути являются оптимизацией для обработки мобильной графики, улучшающей производительность рендеринга.

Я был очень рад узнать о недавнем пересмотре конструкции, проведенном Марком Пейпермастером, техническим руководителем AMD. Он начал презентацию, подчеркнув сотрудничество между AMD и Samsung как катализатор этих улучшений. Компания Samsung, являющаяся лицензиатом графической технологии AMD для линейки процессоров Exynos для смартфонов и планшетов, сыграла важную роль в реализации этих усовершенствований дизайна.

Он отметил, что многие методы идеально подходят для использования в тетрадях. Они предлагают такую ​​же впечатляющую графическую производительность Radeon, но со значительно меньшим энергопотреблением и большей эффективностью.

Проще говоря, RDNA 3.5 — это обновление, специально разработанное для повышения производительности встроенных графических процессоров AMD, которые обычно используются в устройствах с низким энергопотреблением, таких как ноутбуки и портативные игровые компьютеры. Это улучшение направлено на устранение определенных узких мест, которые могут повлиять на общую производительность в таких конфигурациях. Однако не ждите существенных изменений или радикальных преобразований с этим обновлением, о чем свидетельствует его кодовое название.

С моей точки зрения как фаната, графические процессоры меньшего размера часто потребляют около 15 Вт. Хотя они могут обрабатывать больше, это все еще далеко от минимальных требований к мощности дискретных графических процессоров начального уровня. Например, Radeon RX 6400 потребляет до 54 Вт, что почти вдвое превышает энергопотребление графического процессора Asus ROG Ally.

Имея в своем распоряжении ограниченное количество ComputeUnits (CU), некоторые задачи рендеринга, которые обычно не влияют на производительность графического процессора (GPU) настольного компьютера, вместо этого могут существенно влиять на общую скорость. По словам Papermaster, первым узким местом, с которым он столкнулся, была частота дискретизации текстур.

В RDNA 3 каждый вычислительный блок (CU) содержит четыре блока обработки текстур. Каждое устройство может билинейно извлекать и фильтровать один тексел за такт. AMD увеличила это число до восьми единиц в RDNA 3.5. Однако вам может быть интересно узнать причину этого. Мобильные графические процессоры, которые потребляют меньше энергии и интегрированы в системы, работают не так быстро, как дискретные графические чипы для настольных компьютеров. Кроме того, для текстурирования они используют системную память вместо выделенной видеопамяти, что делает этот процесс относительно медленным.

Увеличение количества выборок, извлекаемых за такт, за счет удвоения счетчика выборок текселей позволяет чипу собирать вдвое больше пикселей данных. Это компенсирует более медленную тактовую частоту ядра. Ограниченная пропускная способность видеопамяти не является серьезной проблемой из-за значительных задержек, связанных с выборкой текстур.

Улучшенный графический процессор AMD RDNA 3.5 ориентирован исключительно на повышение производительности мобильных игр.

Улучшенный графический процессор AMD RDNA 3.5 ориентирован исключительно на повышение производительности мобильных игр.

Улучшенный графический процессор AMD RDNA 3.5 ориентирован исключительно на повышение производительности мобильных игр.

Улучшенный графический процессор AMD RDNA 3.5 ориентирован исключительно на повышение производительности мобильных игр.

Хотя слайды AMD в PowerPoint показывают, что количество текстурных блоков действительно увеличивается вдвое, важно отметить, что это относится только к «выбранной группе частых операций выборки текстур». Это может быть не так просто, как увеличение количества текстурных блоков; вместо этого основной причиной могут быть улучшения в обработке определенных инструкций изображений векторной памяти. Я с нетерпением жду возможности изучить подробности, когда получу графический процессор RDNA 3.5.

Производительность векторно-интенсивных операций, включающих интерполяцию или сравнение значений, увеличилась вдвое. Эти задачи требуют многократного доступа к данным из файлов векторных регистров. Поскольку тактовые частоты влияют на выполнение этих процедур, повышение их эффективности представляется разумным. Я не совсем уверен, являются ли такие процедуры основным ограничением для интегрированных графических процессоров AMD, но они, очевидно, считают, что это так.

В RDNA 3.5 присутствуют многочисленные модификации, направленные на улучшение управления памятью. Учитывая, что iGPU не обладают такой роскошью, как высокий бюджет мощности для тактовой частоты или огромный объем кэш-памяти, каждый сэкономленный цикл операций с памятью имеет большое значение на мобильном рынке.

Как геймер, я могу сказать вам, что RDNA 3.5 поднимает мой игровой опыт на новый уровень, поскольку он тщательно разработан для оптимизации как памяти, так и выполнения шейдеров. Это означает более плавный игровой процесс, более быструю загрузку и более четкую графику, сохраняя при этом знакомое ощущение Radeon, которое полюбилось таким геймерам, как я.

Была добавлена ​​новая инструкция, которая определяет наличие операции одиночной записи и позволяет ее пропустить, позволяя графическому процессору продолжить выполнение следующей инструкции. Запись данных, особенно в ОЗУ, занимает значительное время, но многократное умножение векторов можно выполнить всего за несколько циклов.

Метод пакетной обработки примитивов (наборов вершин, образующих фигуры) был оптимизирован для более эффективного использования пространственной локальности. Поскольку примитивные данные по своей природе кластеризованы в кэше или оперативной памяти, вполне вероятно, что следующий запрошенный адрес памяти также будет относиться к тому же примитиву из-за этой пространственной локальности. Улучшение управления этим процессом приводит к меньшему количеству обращений к системной памяти и необходимых операций с адресами.

RDNA 3.5 оснащен улучшенными методами сжатия памяти и улучшенным контроллером памяти LPDDR5 в iGPU. Это важно, поскольку LPDDR5 является предпочтительной оперативной памятью для портативных игровых ПК и растущего числа ноутбуков. Доступ к системной памяти для графических операций может быть медленным и энергозатратным по сравнению с использованием кэша.

Ryzen AI 9 HX 370 с графическим процессором RDNA 3.5 и Ryzen 7 8840U с графическим процессором RDNA 3. Оба процессора потребляли всего 15 Вт мощности. По сути, AMD продемонстрировала, как первый процессор может показывать лучшие результаты, несмотря на то, что он потребляет ту же или даже меньшую энергию, чем второй.

Последний графический процессор примерно на 32% быстрее в тесте 3DMark Time Spy и на 19% быстрее в тесте Night Raid по сравнению со своим предшественником. На первый взгляд эти цифры кажутся впечатляющими. Однако важно отметить, что новая модель HX 370 может похвастаться увеличением количества вычислительных блоков (CU) на 33% по сравнению с 8840U. Хотя у нас нет информации о тактовых частотах обоих графических процессоров, наличие значительно большего количества шейдерных блоков является примечательным фактором, который нельзя игнорировать.

Основываясь на моем опыте технического энтузиаста и сборщика ПК, я считаю, что полезно рассматривать оценки чипа Strix Point как целостную оценку его возможностей. Недавно я протестировал ROG Ally с помощью тестов Time Spy и Night Raid, оба работают с энергопотреблением 15 Вт. Результаты составили 2915 для Time Spy и 19 994 для Night Raid, что означает на 16% и 52% медленнее по сравнению с Ryzen AI 9 HX 370.

В настоящее время я не верю, что обновления RDNA 3.5 будут иметь большое значение в играх по сравнению с добавлением большего количества ядер ЦП и шейдеров.

Смотрите также

2024-07-18 17:48