4
A continuación realice el BLAST de la siguiente secuencia proteica. La siguiente secuencia corresponde a un tipo de hemoglobinas truncada (trHbs) que forman una familia de proteínas con grupo hemo de unión oxígeno y se encuentran en cianobacterias, eubacterias,eucariotes unicelulares y plantas. >gi|10835657|pdb|1DLY|A Chain A, X-Ray Crysta !tr"#t"r$ %& '$()g)bin *r)( +h$ r$$n ni#$"ar Aga Cha(yd)()nas ."ga($t)s //R+ LR+LR2C RA 2 R2!+!A+AAAA+A2A2AR4C2!!L*A4L R.A .AA D4*Y 4 AD2 + !+Y*! +D/4 R!4 *A*LAYAL A!. 4 4D/R+A'4DL 2'L!D '* A AR'L!D+L+.L 2 2.D +DA/A A!+R+. L /2 Pegue el esquema de dominios conserados que aparece en la parte superior de sus resultados. !eise los residuos clae en la proteína. 1 ((rt rt rp#ira p rpstsataa aatapapar9 #pss&a9g gr$a $aa d 61 9&yn9i adp t sty&sntd (9 rs9 &a &ayaggas $:9g9d(rta h9d phsd 1;1 h& a arh sdtt$g p p$ditda(a astrt$ n (p "iga a qu# s$per familia g#nica pertenece. !eise los alineamientos y conteste, qu# residuosde las hemoglobinas truncadas forman el t$nel de ligando con el grupo hemo (residuos %&%'% de nuestra secuencia, busque % de identidad). *+u l es la función del grupo hemo- l transporte de oxígeno.

BIOINFORMÁTICA_EJERCICIOS (2)

Embed Size (px)

DESCRIPTION

tarea 2

Citation preview

1

A continuacin realice el BLAST de la siguiente secuencia proteica.La siguiente secuencia corresponde a un tipo de hemoglobinas truncadas (trHbs) que forman una familia de protenas con grupo hemo de unin a oxgeno y se encuentran en cianobacterias, eubacterias, eucariotes unicelulares y plantas.

>gi|10835657|pdb|1DLY|A Chain A, X-Ray Crystal Structure Of Hemoglobin From The Green Unicellular Alga Chlamydomonas EugametosMMRTVQLRTLRPCIRAQQQPVRPSTSATAAAATAPAPARKCPSSLFAKLGGREAVEAAVDKFYNKIVADPTVSTYFSNTDMKVQRSKQFAFLAYALGGASEWKGKDMRTAHKDLVPHLSDVHFQAVARHLSDTLTELGVPPEDITDAMAVVASTRTEVLNMPQQ

Pegue el esquema de dominios conservados que aparece en la parte superior de sus resultados.

Revise los residuos clave en la protena.1 mmrtvqlrtl rpciraqqqp vrpstsataa aatapapark cpsslfaklg greaveaavd 61 kfynkivadp tvstyfsntd mkvqrskqfa flayalggas ewkgkdmrta hkdlvphlsd 121 vhfqavarhl sdtltelgvp peditdamav vastrtevln mpqq

Diga a qu sper familia gnica pertenece.

Revise los alineamientos y conteste, qu residuos de las hemoglobinas truncadas forman el tnel de ligando con el grupo hemo (residuos 1-121 de nuestra secuencia, busque 100% de identidad).

Cul es la funcin del grupo hemo?El transporte de oxgeno.Alinee la secuencia proteica de clamidomonas con el archivo NP_000549.1

A qu secuencia y a qu organismo corresponde esta secuencia, cuntos residuos alinean?, qu porcentaje de homologa presentan?R.- Corresponde al gen HBA1 de la hemoglobina alfa-1 en Homo sapiens.

Con el cursor sitese en el nombre de la secuencia y ver que es una secuencia muy conservada en diferentes especies. O en alineamientos, despliegue see more titles. Qu otras especies ve.Ahora, alinee la secuencia NP_000549.1 vs NP_000509.1, qu es lo que est comparando?Ahora, haga el BLAST de las siguientes secuencias nucleotdicas: NM_000558.3 vs NM_000559.2 (seleccione el programa de megablast).A qu corresponden, y en qu regiones cromosmicas se ubican estas secuencias?Qu similitud encontr?.Si hacemos lo mismo, pero ahora con las secuencias de los genes correspondientes (NG_000006.1 vs NG_000007.3), qu es lo que obtiene.En el 1er alineamiento, revise Graphics (a un lado de Genbank) y vea el orden de los genes en este cluster del cromosoma 11 de humano.Por ltimo, hagamos lo mismo, pero con las secuencias proteicas: NP_000550.2 vs NP_000549.1Qu conclusin puede sacar de estas comparaciones entre protenas, mRNAs y genes. Revise los porcentajes de homologa, en cul es mayor y porqu.La familia de las globinas est altamente conservada a lo largo de la evolucin desde bacterias, plantas hasta humanos.

Visite la pgina de GENE en NCBI.Busque el gen Pax6 del ratn. Pax6 paired box 6 [ Mus musculus (house mouse) ] En qu cromosoma se localiza, en qu hebra es codificado, cuntos transcritos posee, en qu rutas participa su producto. Mencione dos protenas con las que interacciona la protena resultante.En homologene, Cul es el homlogo del gen Pax6 del ratn en la mosca de la fruta D. melanogaster y en el gusano C. elegans? Estas protenas poseen dos dominios, cules sonVisite los alineamientos mltiples y vea que la mosca presenta la protena Pax6 ms larga. Cul es la ms corta, a qu especie corresponde?. Ahora consulte los pairwise alignments y compare la secuencia del ratn con la de las otras diez especies. Pegue el cuadro, diga qu especies son.Visite OMIM, y vea cules son los fenotipos en el humano cuando muta PAX6.Visite la pgina de PFAM. (http://pfam.sanger.ac.uk/) Lea para qu le sirve:Busque la familia de las histonas (View a PFAM family: histone, PF00125). En el men de la izquierda seleccione HMM logo (algoritmo matemtico que describe una distribucin de probabilidad sobre un nmero de secuencias, Hidden Markov Model). Revise de los 72 aminocidos de estas protenas, cules el residuo ms conservado (la letra de mayor tamao):En el men de la izquierda, seleccione Especies y vea la representacin grfica de la distribucin de la familia de las histonas a travs de las especies.

Por ltimo en dbSNP de NCBI, analice el SNP rs34637584. En qu gen se localiza, cul es el cambio a nivel de protena, cul es el fenotipo con el que se asocia esta mutacin.En polyphen (http://genetics.bwh.harvard.edu/pph2/) vea la prediccin del efecto funcional in silico para este cambio en la protena. Inserte el identificador de la protena correspondiente: Q5S007. En base a la informacin de dbSNP, llene qu aminocido cambia por cul y en qu posicin de la protena. D click en refresh hasta que aparezca view en resultados.En los resultados, se predice que la mutacin sea: En alineamientos mltiples, despliegue y vea qu tan conservado est el residuo en las protenas homlogas

Glosario: Motivos: patrones locales. Pueden ser sitios activos de protenas, dominios funcionales, regiones reconocibles de DNA, etc. Dominios: los segmentos funcionales en las protenas (que son relativamente modulares). Un dominio suele estar caracterizado por un motivo. Familia: una familia de protenas comparte la mayora de sus dominios; puede haber variaciones. Y dentro de superfamilias de protenas, ms variacin an. Polyphen.- es una herramienta de prediccin de efectos funcionales de SNP no sinnimos en el genoma humano. GENBANK: es la base de datos de secuencias gnicas de los NIH, es una coleccin anotada de todas las secuencias de DNA disponibles pblicamente (Nucleic Acids Research, 2013 Jan; 41(D1):D36-42). GenBank es parte de la colaboracin de base de datos de secuencias de nucletidos Internacional, que comprende el Banco de Datos de DNA de Japn (DDBJ), el Laboratorio Europeo de Biologa Molecular (EMBL) y GenBank en NCBI. Estas tres organizaciones intercambian datos en una base diariamente.