NVIDIA Tesla M40
Серверный ускоритель NVIDIA Tesla M40 с неурезанным чипом GM200 (Maxwell) выполнен в виде двухслотовой полноразмерной карте расширения.
Вместе с Tesla M40 представлен инструментарий Deep Learning Toolkit, позволяющий обрабатывать потоки данных. Глубокое обучение переопределяет границы возможного. Для большинства Интернет-компаний, начиная от стартапов и заканчивая крупными провайдерами web-сервиса, глубокое обучение стало основой для обеспечения отличных решений конечным пользователям.
Сегодня обучение ведущих моделей глубокого обучения занимает от нескольких дней до недель. Это заставляет специалистов по обработке и анализу данных искать компромиссы между точностью моделей и временем их обучения. Графический ускоритель NVIDIA Tesla M40 - это самый быстрый в мире ускоритель тренировки алгоритмов глубокого обучения, специально созданный для сокращения сроков обучения.
Программные пакеты Caffe и Torch на Tesla M40 позволяют за несколько часов создавать те же самые модели, на которые уходит несколько дней на вычислительных системах на базе CPU.
Обучение нейронных сетей требует большого объема памяти GPU. Ускоритель Tesla M40 создан для работы с большими объемами данных для точного распознавания речи, изображений, видео и текстов на родном языке.
Графический ускоритель Tesla M40 создан специально для тренировки алгоритмов глубокого обучения. Он является самым быстрым ускорителем глубокого обучения в дата-центрах. В основе Tesla M40 лежит архитектура NVIDIA Maxwell. Серверы на основе Tesla M40 в превосходят по производительности серверы на базе CPU в 13 раз.
Тактовые частоты графических процессоров и памяти оптимизированы для бесперебойной работы в режиме 24/7.
Обеспечивает максимальное время работоспособности в дата-центрах.
Если опираться только на возможности CPU, то дата-центр потратит на данную задачу порядка 60% доступных вычислительных ресурсов, потребив 10,8 МВт мощности. В системах на Tesla M40 потребление составит всего 1,2 МВт. Нагрузка на CPU составит всего 5%, а на доступные GPU – всего 20%, что дает потенциал дальнейшего увеличения нагрузки в будущем.
Продукты NVIDIA Tesla призваны удовлетворить растущий спрос на доступный видео контент благодаря вычислениям Hyperscale. Большинство пользователей YouTube, Twitch, Facebook или Periscope обычно не знают о том, какую вычислительную нагрузку они задействуют. NVIDIA представила несколько цифр, которые позволяют прикинуть масштаб проблемы.
10 миллионов пользователей Periscope «заливают» в день такое количество видеороликов, которое можно было бы просматривать 40 лет. На YouTube в минуту «заливается» 300 часов видео. Сервисом Twitch пользуются 1,7 млн. пользователей, и средний пользователь просматривает 1,5 часа видео в день. На своей презентации NVIDIA назвала и много других цифр. Но важно здесь то, что контент не просто «заливается» на сервер, а потом воспроизводится. Видео требуется перекодировать, зачастую требуется анализ данных и обработка. Все это выполняется серверами Google, Twitch, Netflix или другими поставщиками вычислительных услуг, причем совершенно прозрачно для пользователя.
Характеристики ускорителя
NVIDIA Tesla M40:
Построен на чипсете:
GM200-895-A1, 8 миллиардов транзисторов, площадь 601 мм2.
Ядро и шейдерный блок работают на частоте: 948 МГц (тактовая частота с ускорением за счет использования GPU Boost 2.0: 1114 МГц).
FP32: 3072 потоковых CUDA процессоров, 24 блока SMM.
FP64: 96 потоковых CUDA процессоров.
Число блоков растеризации (ROP): 96.
Число текстурных блоков (TMU): 192.
Кэш память второго уровня (L2): 3 Мбайта.
Производительность: 7 Тфлопс (одинарная точность, FP32, GPU Boost Clocks), 213 Гфлопс (двойная точность, FP64).
Скорость заполнения текстур: 182 Гтекс/с.
Максимальная скорость закраски: 91 Гпикс/с.
24Гбайта GDDR5 памяти на ядро работают на частоте 6ГГц, 384-битная шина памяти.
Полоса пропускания памяти: 288 Гб/с.
Система компрессии памяти, на 25% улучшает ее пропускную способность.
Интерфейс: PCI Express 3.0 x16.
Порты: нет.
Поддержка: DirectX 12 + Shader Model 5.0.
Оптимизация и поддержка OpenGL 4.4.
Поддержка: NVIDIA CUDA / DirectCompute / OpenCL API.
Поддержка операционных систем: Microsoft Windows 10, Microsoft Windows 8, Microsoft Windows 7, Microsoft Windows Vista.
Максимальная температура чипсета: 95С.
Уровень TDP: 250 Вт (в режиме ожидания 15Вт).
Поддержка стандарта EnergyStar.
Фазы питания: 6+2+1 (GPU/MEM/PLL).
Требования к блоку питания: 500Вт (минимальный ток 42А по линии 12В). Два 8-штырьковых (150Вт) силовых разъёма питания PCIe.
Двухслотовая пассивная система охлаждения.
Номера модели компании PNY Technologies:
TCSM40M-PB.
Размеры: 111 х 267 мм. Вес: 0.9 кг.
3 года гарантии.
Новость с сайта: www.nvidia.ru.