Santander.- El seminario New challenges in Data Science: Big Data and Deep Learning on Data Clouds, que se desarrolla durante esta semana en la Universidad Internacional Menéndez Pelayo (UIMP), ha abierto su segunda sesión con la intervención de Francisco Pando, investigador en el Consejo Nacional de Investigación del CSIC y en el Real Jardín Botánico.
En su ponencia Extreme Data Cloud Challenges in Ecosystems and Biodiversity, Pando ha detallado las distintas técnicas de recolección y medición de datos en el medio ambiente que se llevan a cabo en la actualidad. Asimismo, ha expuesto las deficiencias de estos métodos y sus problemas derivados, los que ha planteado como retos que están en vías de solución.
“Los datos relativos a la biodiversidad son raramente puros y nunca complejos”, ha destacado el investigador. Pando ha establecido como principal problema en la recolección de datos, la complejidad inherente a este campo de estudio, dado que las muestras se ven influidas por el ecosistema de manera constante.
Además de la complejidad del campo de estudio, Pando ha señalado como ineficiente el actual archivo de información recogida. Para mostrarlo de manera práctica, el investigador ha puesto en contraste dos de las páginas web más reseñables donde encontrar datos sobre biodiversidad: GBIF y NEON.
El especialista ha descrito GBIF como una infraestructura que da información sobre las especies en un plano internacional. Esta web da acceso global y gratuito a gran cantidad de datos. Sin embargo, “las fuentes de esa información son, en gran medida, estudios realizados en base a observación ciudadana como método principal”, ha recordado, por lo que la calidad de la información es “pobre”. Por su parte, Pando ha contrapuesto la web NEON, una base de datos muy amplia y fiable, dado que “la información que ofrece se recoge por vías estandarizadas de recolección”, ha asegurado. La desventaja de esta web es que se centra exclusivamente en Estados Unidos.
El científico ha recalcado también la falta de precisión y veracidad de algunos estudios publicados, ya que la falta de coordinación entre países y organizaciones provoca errores y confusiones en el resultado final de un análisis. El investigador lo ha ejemplificado con un estudio que no especifica cómo y dónde se recogieron las muestras para el análisis final, y en el que se concluye que en Europa hay una cantidad elevada de leones. “El estudio no distingue entre especies que se encuentren en zoos”, ha añadido.
Pando ha concluido su charla con los avances que están en desarrollo para combatir las deficiencias actuales. La propuesta del especialista es la creación de una red que identifique mediante códigos las muestras recogidas, además de considerar imprescindible que el acceso a esa red sea libre y que dicha la clasificación de los datos siga criterios de globalidad, persistencia y unicidad.
Fotografía: UIMP 2018 | Juan Manuel Serrano