El investigador del CSIC Álvaro López aboga en la UIMP por las Hybrid Data Clouds en pro de la ciencia

Santander.- Tras explicar los conceptos más especializados sobre computación en la nube (cloud computing), el investigador postdoctoral del Consejo Superior de Investigaciones Científicas (CSIC), Álvaro López, ha subrayado la necesidad de “enriquecer el ecosistema de la ciencia” mediante la implementación de los servicios avanzados en Hybrid Data clouds. Un análisis completo que ha hecho en el marco del seminario New challenges in Data Science: Big Data and Deep Learning on Data Clouds de la Universidad Internacional Menéndez Pelayo (UIMP).

La computación en la nube, ha indicado, es el modelo que permite el acceso a “una red bajo demanda de un conjunto de servicios informáticos configurables”, en concreto, infraestructura, aplicaciones y almacenamiento. Recientemente, este modelo ha permitido a las empresas tener presencia en la Web o adquirir servicios informáticos a un precio razonable sin requerir especial inversión en equipos.

En su ponencia, bajo el título Deploying advanced services on Hybrid Data Clouds, López ha explicado, para los “no expertos”, que “la nube es un modelo en capas desde abajo hacia arriba y depende de las capacidades del usuario”. En concreto son los conceptos de Infraestructura como Servicio (IaaS, Infrastructure as a Service) -uno de los tres modelos fundamentales en el campo del cloud computing-, junto con el de Plataforma como Servicio (PaaS, Platform as a Service) y el de Software como Servicio (SaaS, Software as a Service).

Respecto a donde se ejecuta el software de la nube, el investigador ha señalado los modelos de implementación: la nube pública (public cloud), la nube privada (private cloud), la nube privada cerrada para un grupo de usuarios (community cloud) y la nube híbrida (hybrid cloud).

Tras explicar estos conceptos, López ha subrayado que, aunque los científicos “tienen acceso a un amplio conjunto de modelos informáticos”, las tecnologías subyacentes y su modelo de acceso y flexibilidad suponen “un desafío para los usuarios no cualificados”. Otras problemáticas a las que se enfrentan son las dificultades para administrar los recursos de IaaS, los requisitos especiales en términos de provisión de hardware o recursos, la interoperabilidad y la portabilidad.

Desde su punto de vista, hay que tratar de “enriquecer el ecosistema de la ciencia” mediante la implementación “real” de los servicios avanzados en clouds de datos. “Los científicos no deben concentrarse en la tecnología, a menos que lo deseen”, para lo cual se necesita reducir la barrera de entrada para científicos no especializados, así como construir y promover el uso de servicios de computación intensivos por diferentes comunidades de investigación y áreas.

En este sentido, el investigador del CSIC, ha expuesto el proyecto DEEP Hybrid DataCloud, que abordan en la actualidad, y que está basado en la necesidad de admitir técnicas de computación intensivas que requieren hardware HPC especializado, como GPU o interconexiones de baja latencia, para explorar conjuntos de datos de gran tamaño. El enfoque de la nube híbrida permite el acceso a dichos recursos que los investigadores o científicos no pueden alcanzar fácilmente en la escala necesaria en la infraestructura electrónica actual de la UE.

Asimismo, este proyecto propone desplegar bajo la etiqueta común de "DEEP as a Service" un conjunto de bloques de construcción que permiten el fácil desarrollo de aplicaciones y que requieren técnicas como el procesamiento posterior paralelo de datos muy grandes o el análisis de flujos masivos de datos en línea. Estos servicios se implementarán en el banco de pruebas del proyecto y se ofrecerán a las comunidades de investigación vinculadas al mismo a través de aplicaciones piloto. Y, de cara al futuro, se integrarán en el marco de la European Open Science Cloud (EOSC).

 

Fotografía: UIMP 2018 | Juan Manuel Serrano