Borrar
El catedrático de la UPCT Mathieu Kessler. :: a. gil / agm
«La estadística trabaja al servicio de todos los tipos de ciencia»

«La estadística trabaja al servicio de todos los tipos de ciencia»

Mathieu Kessler Catedrático de Matemática Aplicada y Estadística de la Universidad Politécnica de Cartagena

M. J. MORENO

Viernes, 17 de junio 2016, 17:59

Necesitas ser suscriptor para acceder a esta funcionalidad.

Compartir

En la ciencia, todo lo que se observa son datos: pueden ser el resultado de experimentos, como por ejemplo la concentración de colesterol en un paciente sometido a un tratamiento experimental, o pueden ser lo que se registre en un fenómeno natural, como por ejemplo la temperatura en el contexto del calentamiento global. En base a estos datos los científicos, como Mathieu Kessler, idean teorías o diseñan productos que nos pueden cambiar la vida. Podríamos decir que los datos son las palabras que interpreta el científico para entender la realidad, de ahí la importancia de que se traten de manera adecuada.

-¿Qué papel juega la estadística en el desarrollo de investigaciones científicas?

-Por una parte, la estadística ayuda a transformar la información bruta de los datos en conocimiento. Permite distinguir lo que es ruido de lo que es significativo y que podría suponer un progreso. En la fase de prueba de un medicamento, por ejemplo, es la estadística la que permite comprobar si el efecto observado en los pacientes es significativo o solamente debido al azar o otras causas (efecto placebo, por ejemplo). Por otra parte, una contribución muy importante de la estadística a la ciencia es que explica cómo hay que diseñar un experimento para evitar que confundamos el efecto observado con otras causas colaterales: si queremos recabar la percepción de consumidores sobre distintos diseños de un producto comercial, tendremos que asegurarnos que los distintos grupos que consideremos para la comparativa tengan una composición parecida en edad, sexo, nivel socio económico etc... Es la estadística que llamó la atención de manera clara sobre estas precauciones básicas que nos pueden parecer muy naturales 'a posteriori'.

-Se trata, por tanto, de una rama complementaria a cualquier tipo de ciencia.

-Efectivamente, la estadística trabaja al servicio de todos los distintos tipos de ciencia: desde la astrofísica, donde los telescopios modernos generan cantidades inimaginables de datos, hasta la literatura, donde interviene por ejemplo en la identificación de autores de textos anónimos, basándose en características del lenguaje empleado. Y pasando por supuesto por la medicina, la agricultura, las energías renovables, etc.

-¿Hablar de datos o de estadística es hacerlo de métodos 100% objetivos, o cabe la interpretación?

-La estadística es una ciencia también, las conclusiones a las que llega siempre requieren de interpretación: el experto es el que debe dar sentido a lo observado. En la presentación de los resultados, es necesario adoptar una actitud objetiva, pero no siempre es fácil. Es tentador enfatizar tal resultado u otro, para conseguir un mayor impacto. Cuando lo que se presenta es el resultado de meses de arduo trabajo de un equipo y de una gran inversión de dinero, es duro reconocer que los resultados no están a la altura de lo esperado. Por ello, existe en la actualidad un debate en ciencia sobre la necesaria reproductibilidad de los resultados publicados: los científicos deben facilitar que otros reproduzcan sus análisis, y en primer lugar, sus análisis estadísticos, al poner a disposición de todos los datos obtenidos en sus experimentos.

-En ocasiones es necesario trabajar con datos personales, ¿es posible una total protección del anonimato?

-Los estudios serios cumplen con los requisitos de la Ley de Protección de Datos, por lo que se debe garantizar el anonimato de las personas implicadas, y existen mecanismos para ello. Otro problema distinto es el asociado a la publicación de microdatos: el Instituto Nacional de Estadística, (INE), al igual que muchos otros institutos similares en otros países, pone a disposición de todos, los microdatos asociados a muchas de sus grandes encuestas. Son los datos individuales de una estadística, convenientemente anonimizados, con el fin de preservar la confidencialidad de la información. Es una iniciativa fantástica porque permite a grupos de investigación aprovecharlos para otros estudios, multiplicándose los posibles beneficios. Pero requiere de una cierta precaución, porque es posible que al llegar al detalle del individuo, en grupos muy pequeños, se haga factible la identificación del sujeto, basándose en sus respuestas en la encuesta.

-¿Cuánto tiempo lleva desarrollar un análisis de datos de calidad?

-Es difícil contestar a esta pregunta, porque puede darse una gran variedad de situaciones. En primer lugar, para que el análisis de datos sea de calidad, es necesario que los datos en sí sean de calidad: por una parte, que el experimento esté bien diseñado de manera que se pueda extraer la información deseada a partir de los resultados (evitando las posibles confusión con efectos colaterales etc.), y por otra parte, que no haya demasiados datos faltantes. En segundo lugar, el análisis de los datos es un proceso iterativo, que progresa a base de la interacción entre el estadístico y el científico responsable: el estadístico empieza por explorar los datos, se lo presenta al científico que sugiere otra pista para sacar información, vuelve a intentarlo el estadístico y así sucesivamente. Puede llevar su tiempo, pero es lo auténticamente enriquecedor para el estadístico, ese diálogo e interacción.

-¿Cómo han influido los avances en computación a este respecto?

-La recogida de datos ha experimentado una auténtica revolución, llegando a cantidades absolutamente inimaginables. El cambio de nuestro modo de vivir, con la adopción generalizada de internet, las redes sociales, etc. ha supuesto que la sociedad digital en la que vivimos genere auténticas montañas de datos. El 'Internet de las cosas' en el que los objetos que nos rodeen estarán conectados a la Red supondrá probablemente otra vuelta de tuerca en el fenómeno del 'Big Data'. La estadística se está adaptando a marcha forzada a este nuevo paradigma, y una de las facetas más importantes en este sentido es el progreso en las posibilidades de computación. Ya es muy normal que los análisis estadísticos se realicen en la nube, aprovechando la capacidad de cálculo de grandes servidores, pero a la vez que se puedan lanzar desde un móvil.

-No se tratan igual los datos relacionados con política que con la medicina u otras disciplinas, ¿con qué dificultades se encuentran a la hora de trabajar para obtener resultados óptimos?

-El primer paso fundamental es asegurarse que el diseño del experimento permitirá generar datos con los que podremos contestar a las preguntas que nos hacemos. Este paso implica dimensionar la fase de recogida de datos, que también debe tener en cuenta los recursos y el coste implicados. En alguna disciplina, esta fase puede ser muy laboriosa y costosa según el proyecto, lo que puede suponer una real dificultad. Cuando los datos se recogen de manera automática aprovechando sensores, como es el caso a menudo en ingeniería, puede ser menos laborioso, pero puede darse el caso de que haya fallado el proceso de recogida y que tengamos muchos datos faltantes en el resultado.

-¿Existe algún sector en el que les resulte más complicado investigar o en el que directamente sea imposible hacerlo?

-Existen sectores en los que es muy difícil obtener datos fiables, por ejemplo, los asociados al crimen. Los estudios sobre la trata de personas se enfrentan a la dificultad evidente de entrevistar a los implicados. Sin embargo, son estudios de una enorme importancia para tomar decisiones sobre cómo combatirla, y los científicos recurren a técnicas de extrapolación para ampliar las conclusiones que sacan a partir de las muestras conseguidas. De la misma manera, es difícil obtener datos sobre inmigración irregular, economía sumergida...

Publicidad

Publicidad

Publicidad

Publicidad

Reporta un error en esta noticia

* Campos obligatorios