Planificación de la gestión de datos en BiSC
En esta publicación os queremos contar con detalle la gestión de los datos del Proyecto BiSC. Cualquier proyecto de análisis de datos empieza con su recogida, seguido por la validación y limpieza. Una vez se tiene la seguridad que toda la información es veraz ya se puede proseguir con el análisis estadístico para intentar extraer conclusiones significativas.
En el caso del Proyecto BiSC, la recogida y procesamiento de datos es la etapa más larga e importante. Como ya sabéis éste proyecto requiere la recogida de datos a gran escala, provenientes de fuentes y temáticas muy diversas de una ventana temporal que incluye tanto el seguimiento del embarazo como el seguimiento después del nacimiento. No sólo se recolectan datos sobre el desarrollo del bebé sino también otros aspectos así como la caracterización del estilo de vida, la exposición a contaminación del aire y al ruido, o la presencia de zonas verdes en la ciudad. Tratar con datos de naturaleza muy diversa aumenta la complexidad del análisis, y por ello necesitamos contar con diferentes grupos de expertos/as en la revisión de la información (obstetras, biólogos, expertos en sistemas geoespaciales, genetistas, psicólogos, expertos en actividad física, expertos en ruido, etc.).
La buena calidad de los datos es fundamental para garantizar que las conclusiones obtenidas en el análisis sean precisas y fiables. Ésta se puede asegurar a través de la revisión de las fuentes donde se recogen los datos, el uso de métodos estadísticos para analizar los datos, y comprobando que los datos son completos, consistentes y coherentes. Sin una validación adecuada, las conclusiones del estudio podrían ser erróneas o falsas, conduciendo a decisiones equivocadas o un malbaratamiento de recursos. ¡Es por eso que le dedicamos mucho tiempo y esfuerzos!
A parte, como en el Proyecto BiSC se recogen muchos datos personales, es necesario establecer protocolos que garanticen la privacidad de las participantes. Estas medidas incluyen la utilización del anonimato o la pseudoanomización de los datos, así como la implementación de medidas de seguridad físicas y digitales para evitar la pérdida o el escape de datos. Esto garantiza que los datos personales estén protegidos y que no se compartan sin el consentimiento de las participantes.
En el caso de centros o grupos de investigación colaboradores, si para proceder con algún análisis epidemiológico o de muestras relacionados con nuestro proyecto tienen que utilizar datos recogidos en el Proyecto BiSC, se elabora lo que llamamos un acuerdo DTA (del inglés «Data Transfer Agreement» o Acuerdo de Transferencia de Datos) donde se especifica qué datos se van a ceder, con qué permisos y todo el componente legal de esta transferencia de información. Estos acuerdos se signan entre instituciones y son muy estrictos para garantizar la seguridad de los datos.
Por lo que refiere al estado actual del análisis de datos, en líneas generales hay que destacar que aun se están recogiendo datos en las visitas de seguimiento, pero nuestro equipo de gestión de datos está trabajando a toda marcha. Para los datos que hacen referencia a la etapa prenatal, se prevé que toda la parte de validación y limpieza finalice en las próximas semanas, de forma que ya se pueda empezar el análisis estadístico, del que ya se ha diseñado su protocolo. Este no solo consistirá en el análisis descriptivo de la información ya tratada, si no que también se llevará a cabo una selección de los factores más importantes, el estudio de las asociaciones de la exposición de la madre a contaminantes durante el embarazo y finalmente la comprobación que este impacto no esté sesgado por otros factores de confusión.
Las hipótesis planteadas en esta parte han estado claramente definidos y se estudiaran de forma rigorosa mediante el uso de estadísticas adecuadas. Se prevé que los primeros resultados y conclusiones de esta parte en relación al periodo de embarazo lleguen antes del verano.
Ejemplo de estructura y planificación de uno de los proyectos de BiSC, FRONTIER. «WP» hace referencia a los «paquetes de trabajo» o áreas de estudio, en el caso de Frontier la caracterización del estilo de vida (WP2), la exposición a contaminación del aire (WP3), la exposición a ruido (WP4), espacios verdes (WP5). Todos ellos forman parte del análisis estadístico (WP6).
Esta noticia ha sido redactada por Toni Galmés, data manager del Proyecto BiSC.