AMD оприлюднила основні специфікації прискорювача ШІ Instinct MI355X CDNA4

Автор Назар Грановський окт 12, 2024 Технології 0Коментарі

AMD Instinct MI325X офіційно представлено, поставка запланована на другу половину 2025 року.
Сьогодні AMD надала більше деталей про свій майбутній прискорювач штучного інтелекту Instinct MI350 CDNA4 і графічний процесор центру обробки даних, офіційно анонсувавши Instinct MI355X. Він також надав додаткові відомості про MI325X, який зараз поставляється, який, очевидно, отримав невелике скорочення обсягу пам’яті з моменту останнього обговорення AMD.

Постачання MI355X заплановано на другу половину 2025 року, тому це ще далеко. Однак AMD спостерігає масове впровадження своїх прискорювачів штучного інтелекту в останні роки, причому серія MI300 є найшвидшим розвитком продуктів в історії AMD, тому, як і Nvidia, зараз вона щороку випускає продукти.

Почнемо з нового Instinct MI355X. Вся серія MI350 виглядає трохи дивно з точки зору брендингу, враховуючи, що CDNA використовувався з MI100, потім CDNA2 у серії MI200, а CDNA3 використовувався в серії MI300 протягом останнього року або близько того. І тепер у нас є CDNA4, що живить ... MI350. чому Ми запитали, і ми побачимо, чи буде хороша відповідь. Уже є серія MI400 у розробці, яка наразі запланована на 2026 рік, і, можливо, це вже було в процесі розробки до того, як AMD вирішила додати деякі додаткові продукти.

Незалежно від назви продукту, CDNA4 представляє нову архітектуру. На нашому брифінгу AMD сказала, що це був «новий редизайн», хоча це, можливо, трохи перебільшено. MI355X використовуватиме найновіший технологічний вузол N3 від TSMC, який потребує фундаментальної переробки порівняно з N5, але основна конструкція, ймовірно, залишається дуже схожою на CDNA3. Новим є підтримка типів даних FP4 і FP6.

AMD представляє MI355X як «попередній перегляд» того, що буде, і, як ми обговоримо нижче, це означає, що деякі остаточні характеристики можуть змінитися. Він підтримуватиме до 288 ГБ пам’яті HBM3E, імовірно, у восьми стеках. AMD заявила, що в ньому буде 10 «обчислювальних елементів» на графічний процесор, що насправді мало говорить нам про потенціал саме по собі, але AMD надала деякі інші початкові специфікації.

Наразі MI300X пропонує 1,3 петафлопс обчислень FP16 і 2,61 петафлопс FP8. Для порівняння MI355X збільшить їх до 2,3 і 4,6 петафлопс для FP16 і FP8. Це на 77% покращення порівняно з попереднім поколінням — і також зауважте, що MI325X має таку саму обчислювальну потужність, як і MI300X, лише на 33% більше пам’яті HBM3E і вищий TDP.

Однак MI355X не просто має більше сирих обчислень. Введення числових форматів FP4 і FP6 знову подвоює потенційні обчислення порівняно з FP8, так що один MI355X пропонує до 9,2 петафлопс обчислень FP4. Це цікава цифра, оскільки Nvidia Blackwell B200 також пропонує 9 петафлопс щільних обчислень FP4, а реалізація GB200 з більшою потужністю пропонує 10 петафлопс FP4 на GPU.

Виходячи лише з цієї специфікації, AMD потенційно забезпечить приблизно таку ж обчислювальну потужність ШІ з MI355X, яку Nvidia матиме з Blackwell. Однак AMD також запропонує до 288 ГБ пам’яті HBM3E, що на 50% більше, ніж зараз пропонує Nvidia з Blackwell. І Blackwell, і MI355X матимуть пропускну здатність 8 ТБ/с на GPU.

Звичайно, штучний інтелект – це не тільки обчислення, об’єм пам’яті та пропускна здатність. Масштабування до більшої кількості графічних процесорів часто стає обмежуючим фактором після певного моменту, і ми не маємо жодної інформації про те, чи вносить AMD якісь зміни у взаємозв’язки між графічним процесором. Це те, про що Nvidia досить багато говорила під час свого анонсу Blackwell, тому на це варто звернути увагу, коли продукти почнуть поставлятися.

Інша частина сьогоднішнього оголошення AMD Instinct полягає в тому, що MI325X офіційно запущено та починає повне виробництво в цьому кварталі. Однак разом із оголошенням приходить цікавий момент: AMD скоротила максимальний обсяг підтримуваної пам’яті з 288 ГБ (саме це було заявлено раніше) до 256 ГБ на GPU.

Основною зміною від MI300X до MI325X був обсяг пам’яті на GPU, причому MI300X пропонує до 192 ГБ. Отже, спочатку AMD розраховувала на 50% збільшення з MI325X, але тепер вона скоротила це збільшення до 33%.

AMD продемонструвала кілька показників продуктивності, порівнюючи MI325X з Nvidia H200, з невеликою перевагою в продуктивності одного графічного процесора та паритетом для восьми графічних процесорів. Раніше ми згадували, що масштабування може бути критичним фактором для платформ ШІ, і це вказує на те, що Nvidia все ще має певні переваги в цій області.

AMD не вникала в ціни на свої прискорювачі штучного інтелекту, але на запитання сказала, що метою є надання переваги TCO (загальна вартість володіння). Це може відбутися або за рахунок кращої продуктивності за ту саму ціну, або за нижчої ціни за ту саму продуктивність, або будь-де в цьому спектрі. Або, як сказала AMD: «Ми відповідальні бізнесмени, і ми будемо приймати відповідальні рішення» — що стосується ціноутворення.

Залишається з’ясувати, як новітні компоненти AMD зрівняються з H100 і H200 від Nvidia в різних робочих навантаженнях, не кажучи вже про майбутнє сімейство Blackwell B200. Зрозуміло, що ШІ останнім часом став головним фінансовим благом для Nvidia та AMD, і поки це не зміниться, ми можемо очікувати швидких темпів розвитку та вдосконалення центрів обробки даних.

Нижче наведено повну колоду слайдів із презентації, а більшість слайдів, що залишилися, містять довідкову інформацію про ринок прискорювачів ШІ та партнерів AMD.

Tags: AMD