NVIDIA Tesla K40

NVIDIA Tesla K40

Компания NVIDIA представила GPU-ускоритель Tesla K40, созданного для решения самых сложных задач в двух областях высокопроизводительных вычислений: в обработке сейсмических данных при поиске залежей нефти и газа и в обработке сигналов и изображений в оборонной промышленности.
С появлением графических ускорителей Tesla K40 вы можете работать с крупными научными моделями в графической памяти объемом 12 ГБ, которая способна обрабатывать до двух раз больше наборов данных и идеально подходит для анализа данных большого объема. Он также превосходит производительность CPU до 10 раз благодаря технологии GPUBoost, которая позволяет повышать производительность под управлением пользователя.
Tesla K40 основан на новой вычислительной архитектуре NVIDIA Kepler, которая является самой быстрой, эффективной и производительной архитектурой на сегодняшний день.
Многопроцессорная потоковая технология SMX обеспечивает втрое большую производительность на Ватт.
Технологии Dynamic Parallelism и Hyper-Q GPU упрощают параллельное программирование и повышают производительность.
Поддержка технологии NVIDIA Maximus второго поколения.
Производительность по DGEMM: Tesla M2090 (Fermi) = 330 gigaflops, Tesla K20X (expected) > 1000 gigaflops.
Поддержка CUDA 6 Parallel Programming Platform.
NVIDIA разработала набор инновационных архитектурных технологий, которые делают графические процессоры Kepler суперпроизводительными и экономичными, а также незаменимыми для широкого круга разработчиков и применений. Основные инновации:
- SMX потоковый мультипроцессор – будучи основным строительным материалом каждого GPU, SMX потоковый мультипроцессор был создан с нуля для высокой производительности и экономичности. Он обеспечивает производительность на Ватт до 3 раз выше по сравнению с потоковым мультипроцессором Fermi. Экономичность SMX была достигнута за счет вчетверо большего числа ядер CUDA при сокращении частоты каждого ядра, отключения питания частей GPU, находящихся в простое, и увеличения площади GPU, предназначенной для ядер для параллельных расчетов вместо управляющей логики.
- Динамический параллелизм – эта функция позволяет потокам GPU динамически генерировать новые потоки, чтобы динамически адаптироваться к данным. Новая технология существенно упрощает параллельное программирование за счет применения GPU-ускорения к широкому спектру распространенных алгоритмов, таких как адаптивное уточнение сеток, быстрые мультипольные и мультисеточные методы.
- Hyper-Q эта функция позволяет нескольким ядрам CPU одновременно использовать ядра CUDA на одном GPU Kepler. Нагрузка на GPU значительно вырастает, уменьшается простой CPU и улучшается программируемость. Hyper-Q – это идеальное решение для кластерных задач, использующих MPI.
Компания Eurotech станет использовать в суперкомпьютерах Aurora новые процессоры NVIDIA Tesla Tesla K40. Договор будет включать совместные инженерные усилия по развитию индустрии суперкомпьютерных кластеров Aurora Tigon высокой плотности с поддержкой до 256 процессоров NVIDIA Tesla K40. Ожидается, что новые системы достигнут производительности более чем 500 Тфлопс на стойку. С помощью графических процессоров NVIDIA Fermi текущего поколения суперкомпьютер Aurora обеспечивает производительность в диапазоне 2,5 Гфлопс на ватт. Как только в конце этого года будут доступны графические процессоры NVIDIA Tesla K40, основанные на архитектуре NVIDIA Kepler, ожидается, что система Aurora обеспечит 3,6 Гфлопс на ватт.
Характеристики:
Ускоритель Tesla K40 построен на одном 28нм GK110 Kepler GPU чипсете с 7.1 миллиардов транзисторов.
Двухслотовая система охлаждения изделия подразумевает участие в процессе рассеивания тепла мощностей серверного шасси (т.е. имеет пассивное охлаждение).
2880 унифицированных SMX шейдеров (CUDA процессоров). 15х полиморфных движков (PolyMorph Engine 2.0).
Ядро работает на частоте 745МГц (в реэиме Boost до 875МГц). Поддержка технологии GPU Boost - она динамически управляет частотой графического процессора.
Пиковая производительность: 4.29 Терафлопса (одинарная точность) и 1.43 Терафлопса (двойная точность, 1/3).
12 Гб памяти GDDR5 памяти с поддержкой кодов коррекции ошибок (ECC) работает на частоте 6ГГц.
384-битная шина памяти.
Полоса пропускания памяти (без ECC): 288 Гб/с.
Интерфейс: PCI Express 3.0 x16 (совместимый с 2.0/1.1).
Уровень TDP = 235Вт.
Максимальная температура ядра: 98С.
Два PCIe силовых разъема: 8-pin и 6-pin.
Минимально рекомендуемый блок питания мощностью 700Вт.
Поддержка операционных систем: Windows Server 2008 и 2008 R2 (все издания) 64-bit, Linux 32-bit и 64-bit, RHEL 5.4 Server, Ubuntu 9.10 Server, RHEL 4.8 Server, SLES 11.
Поддержка включения движка Mercury Playback Engine GPU Acceleration (CUDA) в программе видеомонтажа Adobe Premiere Pro CC 2021.
Поддержка технологии аппаратного кодирования и декодирования в версии программы Adobe Premiere Pro CC 2021 (v15.0) и выше.
Цена: $5499.
Новость с сайта: www.nvidia.com.