NVIDIA Tesla V100s

Серверный ускоритель Tesla V100, предназначен для высокопроизводительных вычислений (HPC), и самообучающихся систем с искусственным интеллектом (AI), построен он на урезанном графическом процессоре GV100 (Volta).
Новая архитектура графических процессоров, призванная внедрить искусственный интеллект во все отрасли. Архитектура Volta повышает скорость обучений нейронных сетей в 12 раз по сравнению с решениями на базе архитектуры прошлого поколения nVidia Pascal. По сравнению с ускорителем Tesla P100, использующим GPU Pascal, производительность новинки в HPC выросла в 1.5 раза, а в задачах по машинному обучению (training) и принятию решения (inferences) в 12 и 6 раз, соответственно.
В Tesla V100 реализован высокоскоростной интерфейс NVLink второго поколения со скоростью до 300 Гб/с для связи между несколькими графическими процессорами. Этот интерфейс распределяет нагрузку между GPU, увеличивая пропускную способность до 10 раз по сравнению с интерфейсом PCIe 3.0 x16, и позволяет связать до восьми GPU Tesla V100.
Графические процессоры GV100 выполнены на базе архитектуры Volta и содержат до 21,1 млрд транзисторов, что почти в 1.5 раза больше нежели у предыдущего поколения GPU GP100 с архитектурой Pascal.
Применение искусственного интеллекта не ограничивается одной отраслью. Он используется в сфере супервычислений, здравоохранения, финансовых услуг, анализа больших данных и играх. Это будущее всех индустрий и рынков, так как каждая компания испытывает потребность в технологиях искусственного интеллекта. А их вычислительной основой являются графические процессоры NVIDIA.
NVIDIA Volta – это новая движущая сила искусственного интеллекта. Основанная на пяти прогрессивных технологиях, архитектура Volta поспособствует прорыву во всех отраслях. Такие серьезные достижения для человека, как искоренение рака и революция в сфере перевозок за счет появления беспилотных транспортных средств, уже в пределах досягаемости.
Все индустрии испытывают потребность в технологиях искусственного интеллекта, а благодаря огромному росту производительности вычислительных платформ, искусственный интеллект теперь можно внедрить везде. У графического процессора Volta 43 тыс. ядер Tensor, что обеспечивает производительность задач глубокого обучения более 100 Терфлопс в секунду. Это превышает производительность архитектуры предыдущего поколения Pascal более чем в 5 раз.
Решение самых сложных проблем человечества потребует использования самых мощных решений как для проведения вычислений, так и для анализа данных. 21 миллиард транзисторов делает Volta самой мощной архитектурой GPU в мире. Она объединяет ядра CUDA и Tensor, чтобы обеспечить производительность одного GPU на уровне суперкомпьютера.
Volta использует второе поколение высокоскоростной технологии внутренего соединения NVIDIA NVLink. NVLink2 ускоряет обмен данных в 2 раза по сравнению с интерфейсом NVLink первого поколения. Это обеспечивает расширенные возможности распараллеливания данных для достижения максимальной производительности приложений.
Специалисты по обработке и анализу данных часто вынуждены идти на компромисс, выбирая между точностью моделей и продолжительностью симуляции. Благодаря оптимизированному под Volta программному обеспечениею CUDA, cuDNN и TensorRT, ведущие в отрасли фреймворки и приложения могут воспользоваться возможностями архитектуры Volta. А это значит, что ученые и исследователи смогут совершать открытия быстрее, чем когда-либо.

Характеристики NVIDIA Tesla V100s:
Построена на чипсете: GV100, 12нм техпроцесс FFN (TSMC), 21.1 миллиарда транзисторов, площадь 815 мм2.
Тактовые частоты графических процессоров и памяти оптимизированы для бесперебойной работы в режиме 24/7. И составляют: 1601 МГц.
80 блоков SM. 5120 FP32 CUDA ядер и 2560 FP64 CUDA ядер. И 640 ядер Tensor Cores.
Число блоков растеризации (ROP): 64.
Число текстурных блоков (TMU): 320.
Кэш память второго уровня (L2): 6Мбайт, взаимодействующего с чипом с производительностью до 80 Тб/с.
Производительность с двойной точностью (FP64): 8.2Тфлопс, с одинарной точностью (FP32): 16.4Тфлопс и 32,8 Тфлопс для вычислений с половинной точностью (FP16).
Производительность в операциях машинного и глубокого обучения указана равной 130 TFLOPS.
Скорость заполнения текстур: 99.6 Гтекс/с.
Максимальная скорость закраски: 65 Гпикс/с.
32 Гбайта памяти HBM2 работает на частоте 1106 МГц и имеет пропускную способность 1134 Гбайт/с. Память типа HBM2, размещёна в одном корпусе с GPU по технологии CoWoS (Chip-On-Wafer-On-Substrate).
4096-битный интерфейс памяти, позволяет передавать данные GPU со скоростью 1,4 Гтрансфера/с.
Система компрессии памяти, на 25% улучшает ее пропускную способность.
Интерфейс: PCI Express 3.0 x16.
Поддержка: 64x anti-aliasing.
Поддержка: DirectX 12 + Shader Model 5.0.
Оптимизация и поддержка OpenGL 4.5.
Поддержка: NVLink и связки из 8х графических ускорителей.
Поддержка: NVIDIA CUDA / DirectCompute / OpenCL API.
NVIDIA NVENC 3.0 - поддержка нового встроенного аппаратного H.265 (HEVC) видео кодера в NVIDIA Tesla V100s, который ускоряет работу до 4х раз. Поддержка разрешений до 4096х4096 и профилей: H.264 Base, Main, и High Profile Level 4.1.
Поддержка технологии Dynamic Super Resolution (DSR) — это снижение разрешения картинки 4K до родного разрешения монитора с максимально возможным сохранением качества.
Поддержка MVC (Multiview Video Coding) для стерео видео и для Blu-ray 3D.
Поддержка операционных систем: Microsoft Windows 10.
Пассивная система охлаждения.
Максимальная температура чипсета: 98С.
Уровень TDP: 250 Вт (в режиме ожидания 15Вт).
Поддержка стандарта EnergyStar.
Фазы питания: 6+2+1 (GPU/MEM/PLL).
Новость с сайта: www.nvidia.ru.