CIRCULAR-LAB
Juan Escayola - CTO Circular-LAB.
Tengo 45 años y vivo en una urbanización cerca de Barcelona. Mi vida siempre ha estado ligada a la innovación, siempre inquieto con 8 años mi madre compró una televisión en color y decidí desmontarlo para ver los lápices que usaba, no fue una buena idea.
¿En qué proyectos has estado implicado?
Mayoritariamente en proyectos de salud, comencé en 1992 con una empresa de eMarketing – Farmavet que ya entonces realizábamos algo muy innovador en España para esa época – “Webs”. Seguramente algún adolescente se llevará las manos a la cabeza.
Con el tiempo fui desarrollando mis propios proyectos, comenzando con un sistema de autenticación por códigos QR que bajo el liderazgo de un amigo matemático de la infancia desarrollamos y que denominamos Quarking por la onomatopeya del croar de la rana en alemán.
¿Y en la actualidad?
En la actualidad estoy llevando un proyecto que me ilusiona enormemente dado el impacto social que está teniendo en el mundo, lo llamamos CIRCULAR-LAB.
Este proyecto nació a finales del 2019 cuando María Fe (médico Biólogo), me propuso participar en una idea que habían tenido que se trataba de recoger historias clínicas oncológicas anonimizadas para hacer Machine Learning de los datos obtenidos (el proyecto se llama CircularLab).
En el momento que surgió el COVID pivotamos nuestros esfuerzos por un sentimiento de responsabilidad social.
Como CTO de Circular-LAB, ¿qué nos puede explicar de Inteligencia Artificial?
En la actual crisis que vivimos se hace necesario más que nunca la Inteligencia Artificial para conocer el problema al que nos enfrentamos.
Big Data no se trata solamente de tener una gran disposición de datos, eso por si solo no es Big Data. Big Data es disponer de datos tanto estructurados como no estructurados de forma continua, para con algoritmos de Machine Learning podamos obtener datos predictivos que nos permitan tomar decisiones.
En ese aspecto, esto es justamente lo que pretende Circular-LAB. No queremos que los datos obtenidos de un test queden solo en eso, queremos obtener todos los datos epidemiológicos con el objetivo de sacar conclusiones que nos ayuden en el futuro a capear posibles rebrotes.
¿Cómo ves recoger datos de ubicación de las personas?
Inicialmente pensé que podría estar bien, pero leyendo un artículo que recomiendo (COVID-19: Estimating spread in Spain solving an inverse problem with a probabilistic model) decía que existían dos problemas en geolocalizar los datos de los individuos. El primero es archiconocido en Europa y es el tema de privacidad (un bien que debemos intentar proteger como individuos), pero el segundo es que no existen modelos de salida confiables, por lo que podríamos acabar teniendo resultados erróneos.
¿Cómo ve a España en esta crisis?
España tiene una situación más complicada que otros países, por su diversidad demográfica y cultural. No se puede tratar de la misma manera el problema si tienes realidades tan distintas.
En mi opinión, cada comunidad tiene más conocimiento de sus casuísticas y las acciones no deberían estar tan centralizadas.
Hay tanto que hacer que si cada comunidad trabajara en sus propios datos y decisiones y el estado se dedicara a orquestar los datos para trabajar con los mismos protocolos, entre todos podríamos tener datos veraces para aplicar Machine Learning y como en la saga de libros de Isaac Asimov - la Fundación, predecir el futuro para que no nos pille sin estar preparados.
El problema que vivimos es que los datos que estamos analizando, los que entrega el gobierno, son poco veraces, porque sin un test a todos los individuos, un virus con síntomas tan distintos (como podría ser una otitis), complica realmente este análisis, y no hay peor estadística que una estadística con datos inconsistentes.
Es por ello qué deberíamos centrarnos en los datos que sí conocemos para hacer unas probabilidades que se acerquen más a la realidad como podrían ser los datos epidemiológicos, datos de la población o datos biológicos y con datos reales dar paso a los algoritmos matemáticos de probabilidad para sacar conclusiones más reales.
¿Qué necesitamos para ello?
No atarnos tanto al pasado. Muchas empresas siguen creyendo que lo que hacen es moderno, solo porque tienen una web.
Las empresas siguen siendo muy reacias al cambio real, sobre todo las que llevan decenas de años existiendo.
Debemos tener en cuenta que el tiempo hace de la variable una variable que no para. Es lo que se llama proceso estocástico.
Es mejor restringirse en los datos que conoces que en datos que estén posiblemente bien y los que nos ofrecen los gobiernos son datos dudosos. ¿Quién se los cree?
Si no tienes datos confiables no puedes predecir.
Es importante disponer de herramientas de monitorización de resultados de individuos en el tiempo, y trazabilidad de resultados, para poder hacer estudios longitudinales, epidemiológicos y la tan hablada seroprevalencia. Pero también para vigilancia de inmunidad.
Creo que es importante ver cómo las empresas tecnológicas marcan nuevas maneras de hacer las cosas, permitiendo mediante API acceder a algunos de sus datos, pero teniendo en cuenta:
Que compartir es aprender, compartir es crecer y por lo tanto compartir es vencer.