A Infraestrutura Nacional de Xenómica (NGI) de Suecia desenvolveu unha liña de análise de datos xenómicos e de secuenciación. A organización que a engloba, SciLifeLab, ten unha política de software libre.

A súa intención é contribuír aos proxectos de software libre existentes e desenvolver os seus propios para compartilos.

O NGI de Estocolmo é un centro de investigación no campo da xenómica. Como parte do SciLifeLab (Science for Life Laboratory, Suecia), seguen unha estrita política de software libre. Un dos seus proxectos de código aberto máis destacados é Sarek, un fluxo de traballo para detectar variacións no xenoma de calquera especie. Os xenomas identificados tamén están dispoñibles como datos públicos.

SciLifeLab é un recurso nacional de coñecementos e investigadores en áreas de biomedicina, ecoloxía e evolución. O NGI ocúpase principalmente da tecnoloxía para a secuenciación paralela masiva e o xenotipado e apoia aos investigadores en Suecia con apoio bioinformático.

A xenómica é o estudo de todos os xenes dunha persoa (o xenoma), incluídas as interaccións deses xenes entre si e coa contorna da persoa.

Segundo a política de software libre de SciLifeLab, os servidores funcionan con código aberto e o software debe ser liberado baixo unha licenza que fomente a transparencia e a cooperación na sociedade académica. Un dos programas informáticos que desenvolveu o IGN é Sarek. Anteriormente coñecíase co nome de “Cancer Analysis Workflow” (CAW).

Sarek baséase en NextFlow, que permite os fluxos de traballo científicos mediante o uso de contedores de software. Sarek detecta variantes en xenomas completos ou outros datos de secuenciación, tanto na célula que forma o óvulo, o esperma e o óvulo fecundado como nas células somáticas. Realiza un preprocesamento baseado nas mellores prácticas do Genome Analysis Toolkit (GATK), logo identifica as variantes e despois resume a información nun informe MultiQC. MultiQC é unha ferramenta de visualización que resume todos os datos nun informe HTML.

Do mesmo xeito que as políticas de software libre sobre o software, os datos de investigación procesados polo pipeline de Sarek deben ser tratados como dominio público:
Na era de FAIR (Findable, Accessible, Interoperable and Reusable) e da ciencia aberta, os conxuntos de datos deben poñerse ao dispor do público, por exemplo, enviando os seus datos a un repositorio público.

Máis información

Pin It on Pinterest

Share This