Сегодня NVIDIA — это уже далеко не просто производитель игровых видеокарт. Её продукты используются в самых разных областях, а благодаря росту спроса на машинное обучение и облачные вычисления ускорители компании стали активно использоваться и в серверах в последние годы. На днях NVIDIA рассказала о шести новых рекордах по скорости вычислений в задачах, связанных с ИИ — поставлены они были благодаря выходу первого в индустрии широкого набора бенчмарков MLPerf для задач искусственного интеллекта.

MLPerf, в создании которого принимают участие компании Google, Baidu, Intel, NVIDIA и десятки других лидеров индустрии, измеряет широкий спектр нагрузок в задачах глубинного обучения. Первый в индустрии пакет, как считается, выдаёт объективную оценку скорости вычислений в таких областях ИИ, как машинное зрение, языковой перевод, персональные рекомендации и обучение с подкреплением.

Продукты NVIDIA показали наилучшую производительность в шести тестах MLPerf, охватывающих различные нагрузки и масштаб систем: от 16 GPU на узел до 640 GPU на 80 узлов. Речь идёт о следующих шести категориях: классификация изображений, сегментация объектов, распознавание объектов, нерекуррентный перевод, рекуррентный перевод и системы рекомендаций. Ключевым бенчмарком, в котором технологии NVIDIA показали особенно хороший результат, стала категория языкового перевода — на обучение нейросети Transformer ушло всего 6,2 минуты.

Эти результаты NVIDIA получила на системах DGX, включая DGX-2, которая основана на 16 соединённых между собой ускорителях V100, оснащённых тензорными ядрами, и является сегодня едва ли не самой мощной системой для задач искусственного интеллекта.

NVIDIA подчеркнула, что выступает единственной компанией, которой удалось отличиться сразу в шести категориях — это показывает универсальность графических ускорителей V100 в широком спектре задач для ИИ. В седьмой категории тестового пакета (обучение с подкреплением) пока не используются преимущества GPU-ускорения, так что NVIDIA просто не могла победить.

Для высокой производительности в сложных и разнообразных вычислительных задачах нужны не только ускорители с продвинутыми возможностями ускорителя, но и целая инфраструктура. У NVIDIA она есть и включает тензорные ядра, NVLink, NVSwitch, системы DGX, CUDA, cuDNN, NCCL, оптимизированные контейнеры фреймворков глубинного обучения и наборы программных инструментов NVIDIA. С выходом видеокарт семейства Turing (RTX) ускоренные вычисления с тензорными ядрами стали доступны и в настольных ПК.