Учасники можуть створювати власні проекти для графічних процесорів Blackwell.
Архітектура центру обробки даних Blackwell з відкритим кодом Nvidia. Nvidia внесла свої проекти стійки GB200 NVL72 і обчислювальної панелі/лотка комутатора до Open Compute Project (OCP), дозволяючи членам OCP створювати свої проекти на основі графічних процесорів Nvidia Blackwell. Компанія ділиться ключовими елементами дизайну своєї високопродуктивної серверної платформи, щоб прискорити розробку відкритих платформ центрів обробки даних, які можуть підтримувати енергоємні графічні процесори нового покоління Nvidia з мережею Nvidia.
Система GB200 NVL72 із графічними процесорами GB100 або GB200 до 72 є основою цього внеску. Nvidia ділиться важливими електромеханічними конструкціями, включаючи подробиці про архітектуру стійки, систему охолодження та компоненти обчислювальної панелі. Система GB200 NVL72 має модульну конструкцію на основі архітектури Nvidia MGX, яка об’єднує 36 процесорів Grace і 72 графічних процесора Blackwell у конфігурацію стелажного масштабу. Ця конфігурація забезпечує домен NVLink із 72 GPU, що дозволяє системі працювати як один масивний GPU.
На заході OCP Nvidia представила новий спільний еталонний дизайн GB200 NVL72. Він був розроблений спільно з Vertiv, провідним рішенням для живлення та охолодження, відомим своїм досвідом у обчислювальних центрах обробки даних з високою щільністю. Цей новий еталонний дизайн скорочує час розгортання для постачальників хмарних послуг (CSP) і центрів обробки даних, які використовують платформу Nvidia Blackwell.
Використовуючи цю еталонну архітектуру, центрам обробки даних більше не потрібно створювати спеціальні схеми живлення, охолодження чи розподілу, характерні для GB200 NVL72. Натомість вони можуть покластися на передові рішення Vertiv для економії місця та енергоефективного охолодження. Цей підхід дозволяє центрам обробки даних швидше розгортати кластери GB200 NVL72 потужністю 7 МВт у всьому світі, скорочуючи час впровадження на цілих 50%.
«Nvidia протягом багатьох років робить значний внесок у відкриті обчислювальні стандарти, включаючи їхню високопродуктивну обчислювальну платформу, яка була основою нашого сервера Grand Teton протягом останніх двох років», — сказав Йі Цзюн Сонг, віце-президент з розробки Meta. «У міру досягнення зростаючих обчислювальних вимог великомасштабного штучного інтелекту останні внески Nvidia у дизайн стійки та модульну архітектуру допоможуть пришвидшити розробку та впровадження інфраструктури штучного інтелекту в галузі».
На додаток до апаратного забезпечення, Nvidia розширює підтримку стандартів OCP за допомогою своєї мережевої платформи Spectrum-X Ethernet. Дотримуючись специфікацій, розроблених спільнотою OCP, Nvidia прискорює підключення центрів обробки даних AI, одночасно дозволяючи організаціям підтримувати узгодженість програмного забезпечення, щоб зберегти попередні інвестиції.
Мережні досягнення Nvidia включають ConnectX-8 SuperNIC, який буде доступний для OCP 3.0 наступного року. Ці SuperNIC підтримують швидкість передачі даних до 800 Гбіт/с, а їх програмована обробка пакетів оптимізована для великих навантажень штучного інтелекту, що, як очікується, допоможе організаціям будувати більш гнучкі мережі, оптимізовані для штучного інтелекту.
Понад 40 виробників електроніки співпрацюють з Nvidia над створенням платформи Blackwell. Meta, засновник OCP, є одним із відомих партнерів. Meta планує внести в OCP свою стійкову архітектуру Catalina AI, засновану на системі GB200 NVL72.
Тісно співпрацюючи зі спільнотою OCP, Nvidia працює над тим, щоб її проекти та специфікації були доступними широкому колу розробників центрів обробки даних. В результаті Nvidia зможе продавати свої графічні процесори Blackwell і ConnectX-8 SuperNIC компаніям, які покладаються на стандарти OCP.
«Спираючись на десятиріччя співпраці з OCP, Nvidia працює разом з лідерами галузі над формуванням специфікацій і дизайну, які можна широко застосовувати в усьому центрі обробки даних», — сказав Дженсен Хуанг, засновник і генеральний директор Nvidia. «Просуваючи відкриті стандарти, ми допомагаємо організаціям у всьому світі скористатися всім потенціалом прискорених обчислень і створити фабрики ШІ майбутнього».
Nvidia вносить свій внесок у дизайн платформи Blackwell для Open Compute Project
Автор Назар Грановський окт 16, 2024 Технології 0Коментарі
