Capturando el i nteractoma : creación y análisis de bases de datos de interacciones moleculares

  • Upload
    tender

  • View
    41

  • Download
    0

Embed Size (px)

DESCRIPTION

Capturando el i nteractoma : creación y análisis de bases de datos de interacciones moleculares. Pablo Porras Millán , scientific curator [email protected]. ¿ Por qué estudiar el interactoma ?. Lazebnik , Biochemistry ( Mosc ). 2004, PMID : 15627398. Really Important Component. - PowerPoint PPT Presentation

Citation preview

PowerPoint-Prsentation

Pablo Porras Milln, scientific [email protected] el interactoma: creacin y anlisis de bases de datos de interacciones molecularesEMBL-EBIEMBL-EBI1

Lazebnik, Biochemistry (Mosc). 2004, PMID: 15627398Por qu estudiar el interactoma?EMBL-EBIEMBL-EBI

EMBL-EBIEMBL-EBI

Serendipitiously Recovered ComponentMost Important ComponentReally Important ComponentUndoubtedly Most Important ComponentEMBL-EBIEMBL-EBI

Un modelo que se ajusta a la realidad

El modelo del bilogoEMBL-EBIEMBL-EBI

European Institute of Bioinformatics

EMBL-EBIEMBL-EBI

GenomasSecuencias de nucletidosExpresin gnicaProteomasFamilias, motivos y dominios proteicosEstructura de protenasInteracciones protena-protenaSustancias qumicasRutas biolgicasSistemasBibliografaSecuencias de protenasTipos de datos registrados en el EBI

EMBL-EBIEMBL-EBIUn par de definicionesInteracciones protena-protena (IPPs): contactos fsicos y selectivos que ocurren entre pares de protenas en determinadas regiones moleculares y en un contexto biolgico definido. Interactoma: Conjunto de interacciones protena-protena que tienen lugar en la clula / en un organismo / en un contexto biolgico determinado Red de interacciones protena-protena: Representacin grfica de un conjunto de IPPs en la que las protenas se representan en forma de nodos y las interacciones en forma de aristas.

EMBL-EBIEMBL-EBI

Por qu estudiar interacciones protena-protena (IPPs)?Para predecir la funcin biolgica de la protenaculpable por asociacinProtenas con funciones similares deberan agruparse

Para mejorar la caracterizacin de complejos proteicos y vas biolgicasLas redes de interaccin funcionan como un mapa-borrador en el que ensamblar los elementos que forman las vas biolgicas

Nivel genADNARNNivel protena1 protena = 1 funcin

1 protena = n funciones=n redes

MAL!EMBL-EBIEMBL-EBI9

Culpable por asociacinHistona metiltransferasaPapel en desarrollo temprano y hematopoyesisProto-oncognFactor de transcripcinKinasa ciclina-dependienteRegulacin de la transcripcinMediador de la actividad de la ARN-polimerasaRegulacin de la transcripcinModulador transcripcionalRegulacin de la transcripcindependiente de kinasasModulador transcripcional activado por receptorModulacin de la transcripcin, transduccin de seales, activado por kinasasPapel en la inhibicin de la curacin de heridasPosible oncoprotenaActivacin de la transcripcinPosible oncoprotenaImplicado en la regulacin de la transcripcinCiclinaRegulacin de ciclina-kinasa, regulacin transcripcin y ciclo celularAlgo que ver con transcripcin y control del ciclo celularEMBL-EBIEMBL-EBI11Interacciones binarias Dos participantesColocalizacin Proximidad de dos o ms participantesInts. n-arias (asociaciones) Purificacin de complejosInts. funcionales / directas Ej. Ints. enzimticasTipos de interacciones protena-protenaEMBL-EBI12

Interacciones binariasEMBL-EBI13

ColocalizacinEMBL-EBI14

Interacciones n-arias (asociaciones)

Schleiff et al., Nat Rev Mol Cell Biol. 2011. PMID: 211396380EMBL-EBI

Interacciones funcionales / directas Generalmente ensayos in vitroLos participantes suelen conocerse por adelantado (predeterminados)Ejs.- ensayos enzimticos, SPR, cristalografa, mtodos que usan protenas purificadas

Imgenes tomadas de Wikipedia: http://en.wikipedia.org/wiki/X-ray_crystallographyhttp://en.wikipedia.org/wiki/Surface_plasmon_resonancehttp://en.wikipedia.org/wiki/Protein_adsorption_in_the_food_industryEMBL-EBIEMBL-EBIDoble hbrido (Y2H)

Alto rendimiento

Difraccin de rayos XBajo rendimientoPurificacin por afinidad en tndem + espectrometra de masas (TAP-MS)

Mtodos de deteccin de PPIsNingn mtodo puede reproducir una verdadera interaccin binaria observada en condiciones fisiolgicas todas las interacciones detectadas experimentalmente son esencialmente artefactosEMBL-EBIThere are multiple types of experimental methods used to detect protein-protein interactions. Two methods are important due to their use in high-throughput studies: these are the yeast two hybrid complementation assay (Y2H) and tandem-affinity purification followed by mass spectrometry (TAP-MS). Y2H is a fast, inexpensive and scalable method to detect binary interactions. TAP-MS will detect of multi-protein (n-ary) interactions. Other approaches that are less amenable to high-throughput setups are used in small-scale studies and provide more detailed structural and chemical information about the interaction.

Credits for structure model:Cullin-complex model from Kleiger et al., Cell 139, 957-968, 2009.

16

Dominios de interaccinSolapamiento de rangos en la secuencia:Representando IPPs: dominios de interaccinEMBL-EBIEMBL-EBI17We can specifically describe interacting domains down to the residue level.The domain can be represented as the specific range of the underlying amino acid sequence.Including required PTMThese ranges are remapped whenever UniProtKB updates their protein sequences.Algunos metodos experimentales generan datos de tipo complejo: Ej. Purificacin por afinidad en tndem (TAP)

Cuando se debe convertir esta informacin en datos binarios, hay 2 algoritmos disponibles:

Representando IPPs: El problema de los complejosEMBL-EBIEMBL-EBI18Computational tool to aid searches, Transforms n-ary interaction into binary,Both are somewhat wrong, spoke is said to generated 3 times less false positive (Bader et al.).

De Las Rivas & Fontanillo, PLoS Computational biology, PMID: 20589078. Bases de datos de interacciones: tipos

EMBL-EBIEMBL-EBIBases de datos primarias: niveles de curacinCURACIN A FONDOCURACIN SUPERFICIAL

Curacin superficialBioGRID curacin activa, nmero limitado de organismos modeloHPRD curacin activa, centrada en humanos, prediccin de interaccionesMPIDB curacin activa, interacciones en microbiosInnateDB curacin activa interacciones relacionadas con inmunidad innata

Curacin a fondoIntAct curacin activa, amplia cobertura de especies, todo tipo de molculasMINT curacin activa, amplia cobertura de especies, slo IPPsDIP curacin activa, amplia cobertura de especies, slo IPPsMPACT actualmente sin curacin, cobertura de especies limitada, slo IPPsMatrixDB curacin activa, slo molculas de la matriz extracelularBIND detuvo la curaccin en 2006/7, amplia cobertura de especias, todo tipo de molculas la informacin est quedando desfasadaI2D curacin activa IPPs implicadas en cncerEMBL-EBIEMBL-EBIBases de datos primarias: cobertura

De Las Rivas & Fontanillo, PLoS Computational biology, PMID: 20589078. Cobertura de IPPs humanas en las principales bases de datos pblicasEMBL-EBIEMBL-EBIUn estndar para la representacin de interacciones: el consorcio iMEX

www.imexconsortium.orgOrchard et al., Nature Methods, PMID: 22453911. EMBL-EBIEMBL-EBI22Cliente de consulta unificada: PSICQUIC

www.ebi.ac.uk/Tools/webservices/psicquic/view/main.xhtml

PSICQUIC Consulta

MIQLEntradaInteraccionesPSI-MISalidaPSICQUICRegistro

PSICQUICServicio APSICQUICServicio BPSICQUICServicio C

EMBL-EBIEMBL-EBI23EntradaPublicacinExperimento 1Interaccin 1Participante 1CaractersticasParticipante 2CaractersticasInteraccin 2Experimento 2Interaccin 3Interaccin 4

[A] Nivel publicacin (entrada)[B] Nivel experimento[C] Nivel interaccin[D] Nivel participante[E] Nivel caractersticaIntAct: Esquema de almacenamiento de datos

EMBL-EBIREADY TO GO

This is a schema of how interaction data is stored in IntAct. Each entry in the database corresponds to a publication [A], that is, a scientific article that is curated by the IntAct team. The information in the paper is analyzed and those experiments that contain molecular interactions are represented in the database (experiment level, [B]). Each experiment corresponds to one or more interactions identified in the same organism using the same techniques. The interactions in each experiment are then listed in the interaction level [C], adding information such as kinetic binding parameters, if they were given by the authors. Each participant is identified using cross-references to existing resources such as UniProt or CheBI, if possible, and represented in the participant level [D]. Finally, features of each participant such as binding sites, tags, mutations affecting the interaction or post-translational modifications can be depicted in detail in the feature level [E]. 24

IntAct: Uso de la ontologa PSI-MI

EMBL-EBIEMBL-EBI

CURACIN

PROPUESTAS DIRECTAS

DATOS DE INTERACCIONES MOLECULARES PUBLICADOS

PAQUETES DE DATOS DE PROYECTOS DE DETECCIN DE INTERACCIONES A GRAN ESCALA

IntAct: El trabajo del curator(curador)

EMBL-EBIEMBL-EBIREFERENCIAS CRUZADAS

FAMILIAS Y DOMINIOSInterProMOLCULAS PEQUEASChEBIFUNCINGene OntologySECUENCIAS GENOMAEnsemblUniProtKBSECUENCIASPROTENAPAQUETES DE DATOS DE PROYECTOS DE DETECCIN DE INTERACCIONES A GRAN ESCALA

DATOS DE INTERACCIONES MOLECULARES PUBLICADOS

CURACIN

PROPUESTAS DIRECTASOtrosESTRUCTURA,ORGANISMO,TEJIDO, ETC

EMBL-EBI

copia y pegawww.ebi.ac.uk/intactBsqueda web en IntAct

EMBL-EBISearching for interactions in IntAct is very simple: just paste the name or accession of your molecule(s) of interest in the search bar and press "Search". In this example, we use a list of proteins and we give their UniProtKB accessions.28

Detalles de la interaccinEnlace a UniProtKB o a Dasty

Resultados de la bsquedaEMBL-EBI29This view is based on the standard MITAB columns (minus confidence)Describes a binary interactions(!) a binary interaction collapses multiple experiment evidences into a single line(!) the order of interactor A and B is non deterministic(!) whenever the data originates from an n-ary interaction, it is expanded using the spoke modelThe next version is going to show an other XX columns including the method of expansion, so one can filter outNext slide shows all MITAB columns

IntAct: Representando interacciones

EMBL-EBIEMBL-EBI30

IntAct: el visualizador Dasty

EMBL-EBI31READY TO GO!

Dasty is an EBI web client that integrates protein annotated information coming from services such as IntAct, PDB, UniProt, InterPro or PRIDE. In the Dasty visualization multiple annotations referred to a given protein are summarized, allowing us to access information regarding the sequence features, protein structure or any other annotations that might have been added through the services linked by Dasty.

Podemos hacer consultas complejas usando el Molecular Interaction Query Language (MIQL).Lista de campos usados para hacer consultas:IntAct: Bsquedas con MIQL

EMBL-EBIEMBL-EBI32

IntAct: Visualizando interacciones con networkView

EMBL-EBIEMBL-EBI33

www.ebi.ac.uk/training/online/course/intact-molecular-interactions-ebiMs informacin sobre IntAct: cursos on-line en el EBI

EMBL-EBIEMBL-EBI

Blisson et al., 2011, Nature Biotechnology, PMID: 21706016. Desafos en representacin e integracin de datos en las redes de IPPs

EMBL-EBIEMBL-EBIMas informacin sobre el anlisis del interactomaNuestro grupo ha escrito un tutorial dentro de un programa de la Human Protein Organization (HUPO) tratando la importancia del anlisis de las redes de interacciones moleculares y que presenta un ejemplo de anlisis guiado para el lector: Koh, Porras, Aranda, Hermjakob, & Orchard, 2012, Journal of Proteome Research, PMID: 22385417. Una buena revisin general acerca de conceptos bsicos en el estudio del interactoma: De Las Rivas & Fontanillo, 2010, PLoS Computational Biology, PMID: 20589078. Otra revisin general, centrada en el estudio del interactoma en relacin a enfermedades humanas: Vidal, Cusick, & Barabsi, 2011, Cell, PMID: 21414488.Una revisin reciente sobre biologa de redes diferencial, el estudio de las diferencias entre situaciones biolgicas distintas en contraste con el interactoma esttico: Ideker & Krogan, 2012, Molecular Systems Biology, PMID: 22252388. Asignar puntuaciones en funcin de la confianza a interacciones moleculares requiere usar estrategias paralelas y complementarias. En este artculo de evala la fiabilidad de distintos mtodos de deteccin experimental con respecto a un set de interacciones de referencia: Braun et al., 2008, Nature Methods, PMID: 19060903.Para terminar, un buen ejemplo de anlisis usando datos que proceden de bases de datos primarias. Los autores construyen una red de alta calidad usando datos de interacciones binarias en las que hay informacin acerca de las superficies de interaccin a resolucin atmica, integran informacin relativa a mutaciones causantes de enfermedad y encuentran que existe una correlacin entre la posicin de dichas mutaciones en las superficies de interaccin y su predisposicin a causar enfermedad: X. Wang et al., 2012, Nature Biotechnology, PMID: 22252508. EMBL-EBIEMBL-EBI

Agradecimientos

Henning HermjakobJefe de grupo

Rafael JimnezMarine DumousseauNoemdel ToroJohn GmezEquipo de desarrolladores

Sandra Orchard

Margaret Duesbury

Jyoti KhadakeEquipo de curacinCoordinadoraEMBL-EBI