На этой неделе в калифорнийском городе Сан-Хосе стартовала ежегодная конференция NVIDIA по GPU-технологиям. В этом году мероприятие собрало 7 000 участников, 600 технических сессий, 150 стендов, 310 сессий по искусственному интеллекту и 67 лабораторий по технологиям глубокого обучения. В ходе открытия конференции генеральный директор NVIDIA Дженсен Хуанг представил новую архитектуру графических процессоров NVIDIA Volta и серию аппаратно-программных решений, призванных ускорить и упростить работу с искусственным интеллектом.

NVIDIA

Архитектура NVIDIA Volta

NVIDIA Volta является самой мощной в мире архитектурой графических процессоров, призванная стать катализатором новой волны достижений в области искусственного интеллекта и высокопроизводительных вычислений. Первым процессором на базе Volta стал GPU для дата-центров Tesla V100, обеспечивающий высокую скорость и масштабируемость обучения и инференса глубоких нейронных сетей, а также ускорение высокопроизводительных и графических вычислений.

В основе седьмого поколения графических архитектур NVIDIA Volta находится 21 миллиард транзисторов, обеспечивающих производительность глубокого обучения, эквивалентную 100 центральным процессорам. Пиковая производительность Volta в 5 раз выше мощности архитектуры Pascal — текущей графической архитектуры NVIDIA, и в 15 раз выше Maxwell, представленной два года назад. Это вчетверо больше того, что предсказывал закон Мура. Благодаря объединению ядер CUDA и нового ядра Volta Tensor в унифицированной архитектуре, один сервер на базе GPU Tesla V100 сможет заменить сотни центральных процессоров в высокопроизводительных вычислениях.

NVIDIA

Ключевые технологии GPU Tesla V100, позволившие преодолеть рубеж 100 Тфлопс в задачах глубокого обучения:

  • специализированные ядра Tensor, созданные для ускорения работы искусственного интеллекта: оснащённый 640 ядрами Tensor процессор Tesla V100 обеспечивает производительность в размере 120 Тфлопс в глубоком обучении, что эквивалентно производительности 100 центральных процессоров;
  • новая архитектура GPU с более чем 21 миллиардом транзисторов: она объединяет ядра CUDA и Tensor в рамках унифицированной архитектуры, обеспечивая производительность суперкомпьютера для ИИ в одном GPU;
  • NVLink поднимает высокоскоростной интерфейс между графическими процессорами и между графическим и центральным процессорами на новый уровень, вдвое увеличивая пропускную способность по сравнению с предыдущим поколением NVLink;
  • память HBM2 DRAM со скоростью передачи данных 900 ГБ/с, разработанная совместно с Samsung, увеличивает полосу пропускания на 50% по сравнению с предыдущим поколением;
  • оптимизированное под Volta программное обеспечение, включая CUDA, cuDNN и TensorRT, доступное сторонним разработчикам.

 

Новые DGX системы на базе Volta

Также была анонсирована новая линейка суперкомпьютеров с искусственным интеллектом NVIDIA DGX AI. Системы построены на GPU NVIDIA Tesla V100 на базе новой архитектуры Volta и используют полностью оптимизированное для задач ИИ программное обеспечение. Производительность такой системы втрое выше, чем у предыдущего поколения DGX, и соответствует мощности примерно 800 центральных процессоров в рамках одной системы.

 

Платформа NVIDIA GPU Cloud

Новая облачная платформа NVIDIA GPU Cloud предоставляет разработчикам удобный доступ с помощью ПК, системы DGX или облака к полноценному программному набору инструментов внедрения ИИ. Благодаря NGC разработчикам будет проще получить доступ к новейшим оптимизированным фреймворкам и передовым ускорителям.

 

Сотрудничество с Toyota

Toyota объявила о внедрении автомобильной вычислительной платформы с поддержкой искусственного интеллекта NVIDIA DRIVE PX в системы автономного вождения, запланированные к выводу на рынок в течение ближайших лет. Команды инженеров обеих компаний уже работают над созданием ПО на высокопроизводительной ИИ-платформе NVIDIA, которое позволит лучше понимать огромные объёмы данных, получаемых с автомобильных датчиков, и автономно справляться с широким спектром ситуаций на дороге.

NVIDIA

Для того чтобы справляться с задачами подобного уровня вычислительной сложности, в прототипах автомобилей зачастую используются мощные компьютеры, которые занимают весь багажник. Платформа NVIDIA DRIVE PX на базе процессора нового поколения Xavier помещается в руке, обеспечивая при этом 30 миллиардов операций глубокого обучения в секунду.

SAP Brand Impact

Проект SAP Brand Impact на базе решений NVIDIA для глубокого обучения измеряет атрибуты бренда, вроде логотипов, практически в реальном времени. Эффективный анализ видеоконтента стал возможен благодаря использованию для анализа глубоких нейросетей, обученных на NVIDIA DGX-1 и TensorRT.

 

Isaac Robotics Simulator

NVIDIA также представила новый имитатор роботов Isaac. В нём применяются сложные игровые и графические технологии, чтобы быстро и эффективно обучать машины в имитированных условиях реального мира. NVIDIA также представила набор референсных платформ на базе NVIDIA Jetson, позволяющих ускорить процесс создания умных машин.

NVIDIA

 

ИИ для трассировки лучей

С помощью искусственного интеллекта NVIDIA ускоряет трассировку лучей и получает высокодетализированные изображения. Метод трассировки лучей генерирует изображение фотореалистичного качества, но требует больших вычислительных ресурсов, при этом на изображении может появляться шум. Благодаря использованию алгоритмов глубокого обучения в NVIDIA Iray, шумоподавление работает в режиме реального времени.

 

Project Holodeck

Ещё одним интересным анонсом стал Project Holodeck — фотореалистичное окружение виртуальной реальности для совместной работы, позволяющее видеть, слышать и осязать виртуализированные объекты. Среда Holodeck позволяет создателям импортировать модели высокой чёткости и высокого разрешения в виртуальную реальность для совместной работы над ними.

Источник: 4pda.ru