#129 HPC OnDemand

Subscribe to get the latest

on Mon Mar 20 2023 17:00:00 GMT-0700 (Pacific Daylight Time)

with Darren W Pulsipher, Alan Chalker,

En este episodio, Darren entrevista a Alan Chalker, director del programa estratégico en el Centro de Supercomputación de Ohio, sobre Open OnDemand para clústeres de HPC en todo el mundo.


Keywords

#hpc #technology #compute #openondemand #ohiosupercomputercenter #osc


En este episodio de podcast, Darren Pulsipher, el arquitecto principal de soluciones del sector público en Intel, entrevista a Alan Chalker del Ohio Supercomputer Center sobre cómo derribar barreras para la informática de alto rendimiento (HPC, por sus siglas en inglés). Alan es el director de programas estratégicos del Ohio Supercomputer y ha estado trabajando en un proyecto financiado por la NSF llamado Open OnDemand durante más de una década. El proyecto tiene como objetivo hacer que la informática de alto rendimiento sea más accesible para los consumidores habituales de actividades en línea, como la banca y las compras en línea. Open OnDemand simplifica el proceso de uso de HPC al eliminar la necesidad de ingresar comandos en la línea de comandos. La formación de Alan incluye obtener su licenciatura en ingeniería eléctrica e informática en la Universidad Estatal de Ohio y luego obtener su doctorado en ingeniería biomédica en la Universidad de Carolina del Norte en Chapel Hill.

Historia de Open OnDemand

En 2006 y 2007, se desarrolló una interfaz web con el Instituto de Soldadura Edison en colaboración con algunos técnicos, quienes luego la llamaron Open OnDemand. Comenzó como una simulación en línea de soldadura y se expandió para incluir una de polímeros y una de propósito general. Al exhibirlo en varias conferencias, otras instituciones de investigación expresaron interés en implementarlo en sus sistemas. Para convertirlo en código abierto, la Fundación Nacional de Ciencia les otorgó un programa de tres años y $300,000 que hizo que el prototipo fuera más sólido. El éxito de Open OnDemand condujo a otro programa de cinco años por valor de $3 millones. Hoy en día, se implementa en todos los continentes excepto la Antártida, sirviendo a más de 400 instituciones de investigación informática.

Expansión de la influencia de HPC

Las supercomputadoras se han expandido más allá de campos tradicionales como ciencias de la computación e ingeniería. En OSC, estudiantes de antropología y ciencias políticas están utilizando la supercomputadora para sus investigaciones, así como estudiantes de horticultura y cursos de ciencias de cultivos. La demanda de la supercomputadora está aumentando, con más de 8,500 personas utilizando las supercomputadoras de OSC de todo el mundo durante el último año fiscal. Además, durante la pandemia, muchas universidades pudieron continuar enseñando e investigando de forma remota a través de escritorios virtuales proporcionados por la supercomputadora.

Comparando los modelos de precios de CSP y HPC

Los modelos de precios para la supercomputadora se basan en horas de núcleo y meses de terabyte, y el mandato gubernamental permite precios subvencionados para entidades académicas con sede en Ohio. Los proveedores de servicios en la nube cobran por el tiempo real en el reloj, no por horas de núcleo, y ordenan según el costo de almacenamiento de datos y egress de la red. Los clientes de la industria comercial están comenzando a utilizar supercomputadoras para cargas de trabajo de simulación HPC tradicionales, lo que les permite ahorrar dinero en comparación con ejecutarlas en las nubes públicas minoristas.

Ejemplos de uso comercial

El día anterior a que Darren y Alan se sentaron y hablaron, hubo tornados en la zona de Columbus, Ohio. La predicción del clima es importante para muchas industrias y las supercomputadoras son ideales para ello. El centro genera pronósticos meteorológicos cada 4 a 6 horas para clientes como compañías navieras y aerolíneas. Si bien las cargas de trabajo tradicionales de computación de alto rendimiento siguen siendo habituales, las emergentes incluyen el análisis de los tweets de los miembros del Congreso en relación con el COVID-19, la antropología, la horticultura y las ciencias de los cultivos. Cualquier cosa que esté limitada por tiempo o implique demasiados datos puede beneficiarse de las capacidades de computación de alto rendimiento. Se espera que la demanda de estas capacidades aumente debido a una mayor accesibilidad. Hacer que la computación de alto rendimiento sea más fácil de utilizar es similar a lo que la nube hizo en su momento con la computación en rejilla.

Capacidad de la OSC

La capacidad masiva de OSC para su sistema de computación de alto rendimiento está en constante expansión para satisfacer la demanda. En el momento de la grabación, tenían 55,000 núcleos, principalmente de Intel, con 400 aceleradores distribuidos en 1600 nodos. Anticipan una nueva adquisición que les llevaría a tener entre 75,000 y 80,000 asientos debido a la creciente demanda en campos biomédicos. El sistema puede manejar grandes cantidades de datos, con 20 petabytes de almacenamiento de disco real y conectividad de red a una velocidad de lectura/escritura de 350 gigabits por segundo. Uno de los beneficios significativos de OSC es la falta de costos de salida para sus clientes debido a la creación de la organización a través de una subvención de la Fundación Nacional de Ciencias.

Abrir OnDemand

Muchas universidades y centros de HPC están aprovechando Open OnDemand como una interfaz web sencilla para hacer que el HPC esté más disponible para los investigadores que necesitan aprender o comprender las complejidades de programar trabajos, descomponer conjuntos de problemas y gestionar datos en un clúster. Incluso los proveedores de servicios en la nube tienen interfaces de Open OnDemand para su oferta de HPC.

Podcast Transcript