На выставке, посвящённой конференции SC19, очень богато была представлена тема искусственного интеллекта и машинного обучения. Не только гиганты индустрии, но и молодые компании демонстрировали весьма интересные и заслуживающие внимания новинки.

Одной из таких новинок стал процессор MN-Core, разработанный силами японской компании Preferred Networks (PFN), основанной в 2014 году на средства корпорации Toyota. Этот чип является результатом усилий, сконцентрированных на создании ИИ-процессора для систем с низкой латентностью, включая комплексы IoT.

Суперкомпьютер Preferred Networks MN-2

В создании MN-Core принимал участие профессор Токийского университета Кей Хираки (Kei Hiraki). Он рассказал, что компания PFN создала семейство частных суперкомпьютеров для того, чтобы ускорить собственные разработки в области глубокого машинного обучения. Первая такая система, MN-1, была запущена в 2017 году и показала мощность свыше 19 Петафлопс, заняв первое место в рейтинге японских суперкомпьютеров.

PFN MN-Core: 4 кристалла, 756 квадратных миллиметров, 500 Ватт тепловыделения

Первые системы PFN были классическим сочетанием процессоров общего назначения и ускорителей на базе GPU NVIDIA, но уже следующая машина должна будет использовать новый чип MN-Core, который, если верить обещаниям, превзойдет в энергоэффективности существующие решения. Разработчики замахнулись на процессор с теплопакетом 500 Ватт!

PFN MN-Core: основные технические характеристики

Производиться MN-Core будет с использованием 12-нм технологических норм на мощностях TSMC. Он не будет монолитным ‒ уже показанный на выставке образец даёт понять, что речь идёт о сборке из четырёх кристаллов в общем корпусе. Маркировка GRAPE-DR указывает на преемственность архитектуры, берущей своё начало в разработанном PFN ранее сопроцессоре физических вычислений. 

Чип довольно крупный, 85 × 85 миллиметров, общая площадь кристаллов составляет 756,7 мм2, проектная вычислительная мощность — 524 Тфлопс на вычислениях половинной точности (FP16), что даёт удельную производительность порядка 1 Тфлопс на ватт. 

PFN MN-Core: четыре блока вычислений + блок матричной арифметики в каждом ядре

Несмотря на то, что базовым режимом является FP16, доступны будут и более точные вычисления в форматах FP32/64 — ценой совместной работы вычислительных блоков и соответствующего снижения производительности. Ускоритель на базе MN-Core представляет собой классическую полноразмерную плату расширения с разъёмом PCI Express 3.0, которая, помимо процессора, будет нести на борту и 32 Гбайт памяти. Тип памяти и показатели ПСП пока неизвестны.

Дизайн будущих ускорителей MN-Core включает мощнейшую систему охлаждения

По словам профессора Хираки, главной проблемой разработчиков был высокий уровень тепловыделения, но им удалось создать воздушную систему охлаждения, способную справиться с энергопотреблением в районе 600 ватт. Каждый серверный узел будущего суперкомпьютера MN-3 будет иметь высоту 7U и включать в себя четыре ускорителя MN-Core. Это позволит достичь производительности почти 2,1 петафлопса на сервер.

Заявлено наличие двух разъёмов для ЦП общего назначения с теплопакетом до 200 Ватт. Вероятнее всего, речь идёт об Intel Xeon Scalable. Каждый сервер получит до 24 дисковых отсеков, из которых как минимум два будут поддерживать протокол NVMe.

Сервер PFN: строительный блок будущего суперкомпьютера

Проектируемый сейчас суперкомпьютер MN-3 будет состоять из 4800 чипов MN-Core, но пока неясно, сколько стоек для этого потребуется; сама компания называет цифры в районе 300 единиц. Планируется достичь производительности свыше 2 Экзафлопс (1018 операций в секунду) при потреблении электроэнергии порядка 3,36 МВт. Для сравнения, суперкомпьютер Summit развивает 1,88 Экзафлопса, потребляя 13 МВт.

Примерные габариты MN-3. Видны 4 сервера с новыми ускорителями в каждой стойке

Компания планирует ввести MN-3 в строй уже в 2020 году, причём система будет использоваться исключительно для обеспечения вычислительными мощностями новых разработок Preferred Networks. Поставлять MN-Core другим разработчикам или производителям серверного оборудования PFN не планирует. Тем самым она идёт по стопам таких гигантов, как Google и Amazon, также разрабатывающих собственные ИИ-процессоры для своих облачных систем и кластеров.