Planificació de la gestió de dades a BiSC
En aquesta publicació us volem explicar els detalls de la gestió de les dades del Projecte BiSC. Qualsevol projecte d’anàlisi de dades comença amb la seva recollida, seguit de la validació i neteja. Un cop es té la seguretat de que tota la informació és veraç ja es pot prosseguir amb l’anàlisi estadístic per intentar extreure conclusions significatives.
En el cas del Projecte BiSC, la recollida i processament de dades és l’etapa més llarga i important. Com ja sabeu aquest projecte requereix la recollida de dades a gran escala, provinents de fonts i temàtiques molt diverses d’una finestra temporal que inclou tant el seguiment de l’embaràs com el seguiment posterior al naixement. No només es recol·lecten dades sobre el desenvolupament del nadó, sinó també d’altres aspectes tals com la caracterització de l’estil de vida, exposició a la contaminació de l’aire i al soroll, o la presència de les zones verdes a la ciutat. Tractar amb dades de naturalesa molt diversa augmenta la complexitat de l’anàlisi, i per això necessitem la participació de diferents grups d’experts/es en la revisió de la informació (obstetres, biòlegs, experts en sistemes geoespaials, genetistes, psicòlegs, experts en activitat física, experts en soroll, etc.).
La bona qualitat de les dades és fonamental per garantir que les conclusions obtingudes en anàlisis posteriors siguin precises i fiables. Aquesta es pot assegurar a través de la revisió de les fonts d’on es recullen les dades, l’ús de mètodes estadístics per analitzar les dades, i comprovant que les dades són completes, consistents i coherents. Sense una validació adequada, les conclusions de l’estudi podrien ser errònies o falses, conduïnt a decisions equivocades o a un malbaratament de recursos. És per això que hi dediquem molt temps i molts esforços!
A part, com que en el Projecte BiSC es recullen moltes dades personals, és necessari establir protocols que garanteixin la privacitat de les participants. Aquestes mesures inclouen la utilització de l’anonimat o la pseudonimització de les dades, així com la implementació de mesures de seguretat físiques i digitals per evitar la pèrdua o fuita de les dades. Això garanteix que les dades personals estiguin protegides i que no es compartiran sense el consentiment de les participants.
En el cas de centres o grups de recerca col·laboradors, si per procedir amb algun anàlisi epidemiològic o de mostres relacionats amb el nostre projecte han de fer ús de dades recollides al Projecte BiSC, s’elabora el que anomenem un acord DTA (de l’anglès “Data Transfer Agreement” o Acord de Transferència de Dades) on s’especifica quines dades es cediran, amb quins permisos, i tot el component legal d’aquesta transferència d’informació. Aquests acords es signen entre institucions i son molt estrictes per tal de garantir la seguretat de les dades.
Pel que fa l’estat actual de l’anàlisi de les dades, en línies generals cal destacar que encara s’estan recollint dades a les visites de seguiment, però el nostre equip de gestió de dades està treballant a tota marxa. Per les dades que fan referència a l’etapa de prenatal, es preveu que tota la part de validació i neteja finalitzi en les properes setmanes, de manera que ja es pugui passar al anàlisi estadístic, del qual ja s’ha dissenyat el seu protocol. Aquest no només consistirà en l’anàlisi descriptiu de la informació ja tractada, sinó que també es durà a terme una selecció del factors més rellevants, l’estudi de les associacions de l’exposició de la mare a contaminants durant l’embaràs i finalment la comprovació que aquest impacte no estigui esbiaixat per altres factors de confusió.
Les hipòtesis plantejades en aquesta part han estat clarament definides i s’estudiaran de manera rigorosa mitjançant l’ús d’estadístiques apropiades. Es preveu que els primers resultats i conclusions d’aquesta darrera part per l’etapa de prenatal arribin abans de l’estiu.
Exemple d’estructura i planificació d’un dels projectes de BiSC, FRONTIER. “WP” fa referència als “paquets de treball” o àrees d’estudi, en el cas de Frontier la caracterització de l’estil de vida (WP2), l’exposició a contaminació de l’aire (WP3), l’exposició a soroll (WP4), espais verds (WP5). Tots ells formen part de l’anàlisi estadístic (WP6).
Aquesta notícia ha sigut redactada per el Toni Galmés, data manager del Projecte BiSC.