Baidu X-MAN un Clúster de 8x NVIDIA Tesla V100 + FPGAs con Refrigeración Líquida capaz de Procesar 100 Petabytes por Día

Según un artículo del sitio ServeTheHome en el GTC 2018 (GPU Technology Conference) la Compañía Baidu presentó un hardware realmente sorprendente. el X-MAN contiene 8x NVIDIA Tesla Volta V100 GPU, todo refrigerado por agua y orientado a procesos de cálculo complejos e inteligencia artificial. Compañías como facebook ya han mostrado sus propios sistemas de IA y ahora Baidu está abriendo las puertas y mostrando sus diseños.

Baidu-X-MAN-Overview

Baidu X-MAN es capaz de procesar 100PB (Petabytes = 1015 bytes) de datos por día por tanto requiere de un cluster de GPUs y FPGAs (Field Programmable Gate Array) que manejen esta super carga.

Baidu-X-MAN-SXM2-Watercooling-2.jpg

Como vemos en la imagen, los tubos rojos y azules es por donde pasa el líquido refrigerante usando cuatro caminos paralelos. Cada uno de los waterblock o bloques de agua tiene impreso el nombre de la compañía, Baidu. A diferencia de servidores NVIDIA DXG-1 y DXG-2, Baidu X-MAN utiliza NVIDIA NVLink para acelerar la comunicación entre las GPU.

Infraestructura de Baidu:

Baidu-Cloud-ABC-GPU-Compute-Architecture

En esta imagen podemos ver el esquema de la infraestructura de Cloud que utiliza la compañía en su X-MAN. Se puede ver que utiliza un modo de Conmutador PCIe de fábrica para que el sistema entregue una muy baja latencia entre los clúster de GPU (cada clúster tiene 8x GPU y FPGAs).

Fuente: servethehome.com

Responder

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Cerrar sesión /  Cambiar )

Google+ photo

Estás comentando usando tu cuenta de Google+. Cerrar sesión /  Cambiar )

Imagen de Twitter

Estás comentando usando tu cuenta de Twitter. Cerrar sesión /  Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Cerrar sesión /  Cambiar )

w

Conectando a %s