martes, 23 de octubre de 2012

Hilando datos: árboles que dejan ver el bosque

Cada día se publican cientos de datos científicos nuevos y  extraer información útil de ellos no siempre es fácil sin la organización debida y el soporte informático adecuados. Sin embargo, cada día se encuentran nuevas maneras de plantear y contar la ciencia: como ejemplo los threads (hilos) del proyecto ENCODE y el proyecto Open Tree of Life con el explorador Onezoom.


Cuando el Proyecto Genoma Humanosecuenció nuestro genoma e identificó las secuencias codificantes, los genes,  la tarea de conocer nuestro material genético sólo acababa de comenzar: apenas sabíamos lo que significaba el 1% de nuestro genoma. En este punto tomó las riendas el proyecto ENCODE (ENCyclopedia Of DNA Elements), formado por un consorcio internacional que desde 2003 ha buscado rellenar los huecos e identificar los elementos funcionales, aquellas secuencias con significado regulatorio, en el hasta ahora desierto intergénico. En 2012 podemos decir que lo han conseguido: se ha asignado algún tipo de función al 80% del genoma, es decir, el ADN basura es prácticamente inexistente, lo que cambia de manera radical la visión que se tenía hasta ahora de nuestro material genético. 



Para lograr este objetivo los científicos implicados en el proyecto han generado miles de datos, de mapas, de secuencias, que impresas ocuparían kilómetros y que forman parte de 30 artículos publicados en distintas revistas. Para que podamos acceder a los datos más fácilmente sin perdernos nada del tema que nos interesa, la información se ha organizado en 13 hilos, una especie de libros que reúnen los párrafos más interesantes, las figuras relevantes y las tablas de cada tema.  Se trata de una manera nueva de mostrar los datos para poder hilar la información.

Una situación similar se da en el proyecto Open Tree of Life, que pretende construir un árbol relacionando por parentesco las distintas especies de seres vivos, que son más de 2 millones. No hay papel suficientemente largo para representar el árbol de la vida, pero los bioinformáticos Rosindell y Harmon han dado con la solución: imitar el sistema de los mapas de Google, que como todo el mundo sabe se basa en ampliar la zona de interés para obtener con cada clic un mayor grado de detalle.  Por el momento han publicado su explorador OneZoomen Plos Biology, aplicado hasta ahora al árbol filogenético de los mamíferos, con más de 5000 especies.  Según vamos haciendo zoom en el árbol podemos ver las distintas ramas que nos guían hasta las hojas, representando cada una una especie. Mediante un código de colores se indica el grado de conservación de la especie y también se nos informa sobre el momento en el que apareció, el nombre popular y el nombre científico. Además accedemos a un enlace que nos conecta con la entrada correspondiente en Wikipedia. El próximo paso es el árbol de los anfibios y en 2014 se espera tener el árbol de la vida al completo, un árbol dinámico que podrá ser actualizado por los científicos. Por otro lado, los planes para el futuro incluyen añadir fotografías y más información sobre cada especie, diseñar una aplicación para el móvil, incluir juegos interactivos para museos y otros centros educativos y además incluir animales domésticos, que hasta ahora no aparecen reflejados.

El árbol de los mamíferos
No hay duda de que el futuro traerá más y más datos. Organizarlos debidamente y de forma fácil e intuitiva será lo que nos permita aprovecharlos, por eso, si aún no tiene ningún amigo bioinformático, empiece a buscarlo.

Sigue el blog y otras noticias curiosas sobre ciencia en Facebook.
En twitter: @xcienciainfusa

Aprovecho para pedirte que, si quieres que la ciencia siga siendo una prioridad para la Unión Europea en sus próximos presupuestos, firmes esta petición coordinada por Initiative for Science in Europe.

No hay comentarios:

Publicar un comentario