Hauries d´instal.lar el plug-in del flash... Descarregar plug-in de Flash

Reportajes

reportajes

Bioinformática

Disminuir Aumentar

Datos biológicos, de Babel a BIANA

Una nueva plataforma integra diferentes bases de datos hasta ahora dispersas

El desbarajuste de datos biológicos, hasta ahora dispersas en diferentes bases de datos, llega a su fin. Un nuevo programa de acceso libre, BIANA, se ha puesto en la piel de los investigadores y las ha reunido para facilitarles la búsqueda. Con esta nueva herramienta, de sello catalán, los científicos tendrán a su disposición una gran cantidad de información, podrán encontrar nuevas relaciones entre diferentes elementos biológicos, hacer predicciones e identificar nuevas dianas terapéuticas.

Patricia Morén | 22 de febrero de 2010

La investigación con datos biológicos será más fácil y ágil a partir de ahora. Una nueva plataforma, BIANA (acrónimo de Biologic Interactions and Network Analysis), lo ha hecho posible, tras reunir una cantidad ingente de datos dispersas en diversas fuentes y almacenadas con diferentes formatos. Los investigadores que consulten la nueva plataforma tendrán a su alcance todas las bases de datos integradas. Podrán manipularlas en función de su interés de investigación, inferir nuevas interacciones entre proteínas y encontrar nuevas dianas terapéuticas, entre otros usos. La revista
BMC Bioinformatics ha descrito el nuevo software.

La nueva herramienta ha sido íntegramente desarrollada por el Laboratorio de Bioinformática Estructural, dirigido por Baldomero Oliva, en el Grupo de Investigación en Informática Biomédica (GRIB), de la Universidad Pompeu Fabra y el Institut Municipal d’Investigació Mèdica (UPF-IMIM). El proyecto nace de una plataforma anterior del mismo grupo, PIANA (Proteins Interactions and Analysis), pero con más aplicaciones. Es accesible a todos los investigadores, de fácil uso y disponible bajo licencia GNU GLP (General Public License) en la web de la plataforma. Un valor añadido de BIANA es que utiliza la interfaz gráfica Cytoscape, para gestionar de manera fácil e interactiva los datos.

"Se trata de un sistema abierto a cualquier usuario, que puede insertar los datos biológicos que desee en el sistema e integrarlas a las de otras bases de datos, en lugar de utilizar tantas bases concretas", explica Javier García, un los investigadores del GRIB. Con Emre Güney, también del grupo, ha estado implicado directamente en el desarrollo del software. Pero ¿dónde radica la importancia de este desarrollo bioinformático? Miremos atrás.

Contexto de partida

Hasta ahora, el almacenamiento de datos biológicos se ha llevado a cabo en tres núcleos principales del mundo: en Japón; en Estados Unidos, a través del National Institutes of Health (NIH); y en Europa, a través del European Molecular Biology Laboratory (EMBL), de Heidelberg (Alemania), y su nodo, el European Bioinformatic Institute (EBI), situado en Hinxton (Gran Bretaña). Todos ellos disponen de bases de datos diferenciadas.

En los años 80-90 comenzaron a proliferar los trabajos científicos de secuenciación de genes y proteínas. Los resultados se fueron almacenando de diferentes maneras y en diferentes lugares. En Europa, Swiss-Prot (Suiza) fue la primera base de datos bien organizada, hasta que le tomó el relevo Universal Protein Resource (UniProt), que fusionó los datos de la base de datos suiza y otros. Y en todo el mundo surgieron más, como BioGRID, de Canadá; Database of Interacting Proteins (DIP) i GenBank, de Estados Unidos; Human Protein Reference Database (HPRD), de la India; o el Munich Information Center for Proteins Sequencing (MIPS), de Alemania. Y la lista no se acaba aquí.

Las diferentes bases de datos contienen gran cantidad de información, pero en diferentes códigos y formatos Todas reúnen una gran cantidad de información de elementos biológicos. El estudio de la estructura de las proteínas es una tarea ardua que puede llevar entre uno y dos años, mientras que su secuenciación es cada vez más rápida. Por este motivo, estas bases de datos contienen información de la estructura de cerca de 50.000 proteínas, de más de 500.000 secuencias con su función (en UniProt) y de más de 10 millones de secuencias de ADN de organismos vegetales, animales y humanos, informa Oliva. El problema es que esta gran cantidad de información se ha guardado en diferentes códigos y formatos, además de en diversas bases de datos. Todo ello parece la Babel de los datos biológicos.

Aportaciones de BIANA

BIANA unifica protocolos y criterios de análisis de información de los datos biológicos hasta ahora dispersas. En concreto, uno de sus rasgos diferenciales respecto a las bases de datos mencionadas es que permite crear redes de interacción para todas las proteínas almacenadas, una tarea que ya llevaba a cabo PIANA. Además, explica Oliva, abre la puerta a la exploración de todo tipo de reacciones, como la relación entre una enzima y otra que pertenecen a la misma ruta metabólica.

La herramienta también permite hacer predicciones basadas en dominios conocidos de proteínas. Esto es posible porque la base de datos UniProt, así como otras, no se ha limitado a almacenar secuencias enteras de proteínas; también han acumulado dominios, es decir, partes de proteínas que forman un conjunto propio, con una función propia y presentes en muchas especies, porque se mantienen a lo largo de la evolución. Por tanto, cuando no se dispone de una proteína entera, ésta se puede inferir a partir de las funciones de los dominios. "Con una simple integración de la información de estas bases de datos podemos hacer predicciones basadas en dominios", enfatiza Oliva.

BIANA también puede identificar y corregir errores de la información almacenada en las anteriores bases de datos. Incluso permite que el usuario la rastree hasta llegar al experimento real con el que se encontró un determinado gen.

Hacia el ranking de dianas

La nueva herramienta se está utilizando para estudiar enfermedades como el Alzheimer, la diabetes, los aneurismas y el cáncer. En el caso de los tumores, la herramienta puede ser especialmente útil, dado que las bases de datos contienen mucha información que se puede cruzar. Gracias a esta plataforma ya se han encontrado proteínas relacionadas con la enfermedad de Alzheimer, que interaccionan con proteínas de la enfermedad de la diabetes y que pueden ser dianas potenciales de tratamientos farmacológicos.

De hecho, una de las principales utilidades de este programa es que en un futuro permitirá encontrar nuevas dianas terapéuticas. Por este motivo, los investigadores trabajan hoy en la construcción de otro programa, NETSCORE, que permita hacer rankings de dianas. Así, una vez se identifiquen los candidatos (imaginemos 1.000), el sistema les asignaría una probabilidad y los ordenaría de más a menos probable. Así, los investigadores irán más orientados en su investigación y, en lugar de estudiar mil candidatos, sólo tendrán que analizar unos cuantos.

Respecto al impacto de BIANA en la investigación, Oliva cree que, con esta herramienta, "Fleming no ha terminado". Por supuesto, los hallazgos by serendipity se seguirán produciendo. Sin embargo, el software permitirá ahora que los resultados 'se disparen' cuando esto ocurra, dado que permite tratar la información que se encuentra y señalar un camino adecuado el investigador.

Comentarios

       
0 comentarios
 
Global Global Global Global
RSS