La supercomputadora más potente del mundo, el primer sistema de AI exaoperaciones, usa 27.648 GPU de NVIDIA para que los mejores científicos tomen la delantera.
Por IanBuck
Se podría decir que es la herramienta científica más potente que se haya construido. Se podría decir que es un nuevo paradigma de computación. Pero no se puede decir que es lenta, según los números. Summit, que se presentó el viernes en el Laboratorio Nacional de Oak Ridge, es extremadamente rápida.
Esta enorme máquina, con la tecnología de 27.648 GPU Volta, puede realizar más de tres exaoperaciones, o tres trillones de cálculos por segundo. Esto representa un salto de 100 veces en comparación con Titan, la anterior supercomputadora más rápida de EE. UU., que se completó hace tan solo cinco años. El 95 % de la potencia de computación proviene de las GPU.
Esta máquina se diseñó para el Departamento de Energía de EE. UU., con el objetivo de resolver los problemas más importantes de nuestro tiempo. Acelerará el trabajo de los mejores científicos del mundo en el campo de la física de alta energía, descubrimiento de materiales, atención de la salud y mucho más, ya que tiene la capacidad de lograr 200 petaflops de potencia de computación para las simulaciones científicas de alta precisión.
“Summit lleva la computación por GPU al siguiente nivel, con más potencia de computación, más memoria, un enorme sistema de archivos de alto rendimiento y rutas de datos rápidas para combinar todo”, dice James Hack, director del Centro Nacional de Ciencias de la Computación de ORNL. “Esto significa que los investigadores podrán explorar fenómenos más complejos con niveles más altos de fidelidad en menos tiempo, en comparación con los sistemas de supercomputadoras anteriores.”
Es, literalmente, una máquina del tiempo científica.
La historia detrás de la historia: El equipo de Oak Ridge fue el primero en el país en darse cuenta, hace casi una década, que se necesitaba un nuevo tipo de computación. El anterior paradigma de apilar un transistor sobre otro no lograba la eficacia que necesitábamos.
En 2012, decidieron correr un riesgo y construir Titan, la supercomputadora más rápida del mundo, con una GPU en cada nodo. La apuesta salió bien. Ahora, más de 550 aplicaciones de computación de alto rendimiento (HPC), y 15 de las aplicaciones más usadas, se aceleran con GPU. Su trabajo rediseñó la supercomputación.
El próximo capítulo de la computación
Summit es el próximo capítulo. No solo para ORNL, sino para la computación en general. Nuestro equipo de investigadores ha estado trabajando con el Departamento de Energía por más de 11 años en tecnologías avanzadas, como las GPU de Volta y la tecnología de interconexión de alta velocidad NVLink, en el corazón de Summit. En lugar de tener una GPU por nodo, Summit tiene seis GPU con núcleos Tensor, que proporcionan un rendimiento de simulación 10 veces superior al de Titan.
Así como Titan impulsó la aceleración de simulaciones en todo el mundo, Summit impulsará a que los científicos de todo el mundo aprovechen la AI para lograr descubrimientos de la mano con la simulación. La tecnología de Summit ya acelera el trabajo de los científicos en todo diferentes equipos, como PC; servidores, estaciones de trabajo y sistemas de computación en la nube.
Combinar AI y la computación de alto rendimiento
Si bien Summit comparte en ADN con una nueva generación de máquinas diseñadas para AI, su velocidad será incomparable. Los investigadores podrán usar los cálculos simplificados, conocidos como de media precisión, o FP16, para potenciar el rendimiento de Summit 15 veces y llegar a niveles de exaescalabilidad, es decir, más de un trillón de operaciones por segundo.
Es increíble. Si cada procesamiento se representara como un grano de arena, se podría llenar el Estadio NNR con arena 350 veces en un solo segundo.
Los aportes de Summit a la ciencia
Esta velocidad permitirá que los científicos de esta generación logren avances fabulosos. El Laboratorio Nacional de Oak Ridge es un escenario donde tiene lugar la ciencia de vanguardia. Su campus concentra a muchos científicos dispuestos a aprovechar las máquinas para lograr su mejor trabajo.
Es por eso que Summit tiene la agenda ocupada, ya que trabaja para acelerar este tipo de estudios:
- Investigación sobre el cáncer: El Departamento de Energía y el Instituto Nacional del Cáncer trabajan en un programa llamado Entorno de aprendizaje profundo distribuido sobre el cáncer (CANDLE, por sus siglas en inglés). El objetivo es desarrollar herramientas que puedan extraer, analizar y ordenar automáticamente los datos existentes sobre la salud para detectar relaciones ocultas entre los factos de la enfermedad, como los genes, los marcadores biológicos y el entorno.
- Energía de fusión: La fusión, la fuente de energía del Sol se ha promocionado desde hace tiempo como una promesa de energía limpia y abundante. Summit podrá modelar un reactor de fusión y su plasma confinado magnéticamente, para acelerar el desarrollo comercial.
- Enfermedades y adicciones:Los investigadores usarán la inteligencia artificial para identificar patrones en el funcionamiento y la evolución de las proteínas humanas y sistemas celulares. Estos patrones nos permiten comprender mejor el Alzheimer, las enfermedades coronarias o las adicciones, e informar el proceso para descubrir drogas.
El próximo paso gigante para la humanidad
Mediante técnicas como el aprendizaje de máquinas y el aprendizaje de máquinas a una escala masiva, los científicos podrán lograr descubrimientos revolucionarios en Summit que potenciarán nuestra economía, mejorarán la atención de la salud y ayudarán a generar energía ilimitada. Esto podría salvar el planeta. Es por eso que necesitamos supercomputadoras más rápidas.
Y es por eso que el próximo desafío de computación ya está claro: desarrollar la primera supercomputadora acelerada por exaescalabilidad del mundo. Ya estamos trabajando en ello, para que los científicos e investigadores del mundo puedan continuar con su trabajo.
BOX: 5 hechos sobre la supercomputadora más rápida del mundo
- A 200 petaflops: si cada persona de la tierra hiciera 1 cálculo por segundo, tomaría 1 año en lograr lo que Summit hace en 1 segundo.
- A 3 exaoperaciones de AI: si cada persona de la tierra hiciera 1 cálculo por segundo, tomaría 15 años en lograr lo que Summit hace en 1 segundo.
- En una de las primeras pruebas, un equipo de genética resolvió un problema en una hora que, en una PC; hubiese tomado 30 años.
- Los 520 metros cuadrados de superficie equivalen a 2 canchas de tenis.
- Summit pesa aproximadamente lo mismo que un jet comercial.