Datos abiertos para la educación científica

Datos abiertos es la idea de que los datos científicos deben ser de libre acceso para todos, sin restricciones, en repositorios en línea. El movimiento de datos abiertos está ganando impulso en la comunidad científica debido a su promesa de habilitar la replicación más frecuente de los estudios y para acelerar el ritmo de la investigación. El mayor beneficio de la educación científica es igualmente atractivo.

Los estudiantes de ciencias pueden beneficiarse enormemente de los materiales educativos que los exponen a los fenómenos y los datos del mundo real. A diferencia de aprender a partir de generalizaciones y los laboratorios prefabricados, el examen y el trabajo con datos reales puede aumentar el interés y preparar mejor a los estudiantes para carreras en la ciencia. Como los estados comienzan a adoptar los Estándares de Ciencias de la próxima generación, que hacen hincapié en prácticas tales como el análisis e interpretación de datos, y el pensamiento matemático y computacional, editores de materiales curriculares de ciencias para educación primaria y secundaria buscan cada vez más formas de incorporar los datos científicos en sus lecciones y evaluaciones.

Sin embargo, existen barreras que impiden a los educadores la utilización eficaz de muchos de los datos que los científicos producen. Incluso con acceso libre a artículos de revistas, aunque valioso, a menudo no es suficiente para los propósitos educadores. Los datos de artículos de revistas tienen, por lo general, la forma de unos pocos gráficos. Estos gráficos suelen estar congelados en PDFs como parte de un documento que expresa la interpretación de los resultados en el contexto del particular estudio de los autores. Y las opciones de presentación de datos fueron realizadas con una audiencia en mente: expertos en el campo.

La utilización los datos tal como se presenta en casi nunca es pedagógicamente sólida a nivel de la escuela media o secundaria, mucho debe ser cambiado en la presentación. La jerga y siglas podrían tener que ser retirados de los títulos de eje, puede ser necesario separar conjuntos de datos individuales si se colocan en capas en una sola figura, o tal vez una sección del gráfico que describe los fenómenos fuera del alcance de la lección y que tendría que ser eliminada. Hacer este tipo de adaptaciones educativas necesarias, manteniendo la precisión científica, a menudo requiere el acceso a las bases de datos originales completos.

Lamentablemente, los mayor parte de los datos científicos no se archivan ni están disponibles en línea. Los educadores tienen que ponerse en contacto con los autores del estudio y ver si están dispuestos y son capaces de pasárselo. Al igual que en artículos de revistas, este “escribir al autor” para salir del paso es tremendamente ineficiente. Los autores del estudio a menudo no pueden o no responderán a las solicitudes de datos originales por una variedad de razones. A veces están simplemente fuera de la ciudad y no consultan el correo electrónico. A veces quieren publicar más artículos y tienen miedo de perder la exclusividad. Y a veces, sobre todo en los estudios más antiguos, no pueden encontrar sus datos.

En 2002 una encuesta de genetistas, de aquellos que reconocieron haber negado al menos una petición de un colega sobre datos publicados, la razón más común que se dio fue el “esfuerzo requerido para producir la información” (80 por ciento de los encuestados). Como Todd Vision, un biólogo de la UNC y colaborador de los datos Dryad repositorio de datos abierta, se explica en BioScience :

Los datos sin archivar a menudo se encuentran fuera de lugar, dañados, o el software en el que fueron producidos se convierte en obsoleto. Los recuerdos se desvanecen.

Los editores de materiales educativos de ciencia necesitan tener acceso completo a los datos con el fin de determinar sus fortalezas y debilidades pedagógicas. Este proceso a menudo implica la investigación de muchos conjuntos de datos diferentes hasta decidirse por los que van a abordar mejor los objetivos de aprendizaje para su proyecto particular. El seguimiento de cientos de documentos individuales no es factible para una pequeña organización sin fines de lucro o un maestro solitario tratando de innovar en una escuela que se resiste. Esto deja grandes cantidades de de datos potencialmente más útiles a nivel educativo sin explotar.

Sandra Porter, presidente de Digital World Biology, y uno de sus proyectos de colaboración, Bio-ITEST, involucrada en la elaboración de materiales curriculares de bioinformática para estudiantes de secundaria, comenta su experiencia en la obtención de daros para la elaboración de materiales curriculares. En genética y bioinformática, que se centran inherentemente en datos, los requisitos de archivo de datos son más comunes y Sandra y sus colegas fueron capaces de tomar ventaja de los recursos de datos abiertos, como el Centro Nacional de Información Biotecnológica (NCBI) y los Sistemas de Código de Barras de Datos de la Vida (BOLD). Sin embargo, incluso en estos campos, el acceso a los datos en crudo -del tipo que los científicos prácticos encontrarían en sus carreras- puede ser difícil de obtener. Sandra comentó:

Los datos en bruto fueron útiles para nosotros porque necesitábamos saber a que se parecen de modo que podríamos resolver los problemas de análisis con antelación. Estos tipos de archivos de datos no son propensos a estar disponibles en muchos lugares, ya que estos datos crudos se procesan y se analizan a través de muchos pasos antes de que sean enviados a una base de datos.

Hay muchas razones dignas para apoyar el movimiento de la ciencia abierta, pero el argumento en favor de la educación científica tiene lo suyo entre ellos. Nunca ha sido más fácil de adaptar los datos científicos reales en las aulas, y los beneficios para los jóvenes científicos en formación son claros. Sería una vergüenza para todos que el potencial educativo languidezca en los discos duros antiguos.

 

Sci-Ed