25
Profesores: Jose F. Sanchez (Dept. Gené+ca, Micro. y Estadís+ca) [email protected] Josep Tarragó (Dept. Bioq y Biomed. Molecular) [email protected]

Bioinformatics Practicas UB Sesión 4

Embed Size (px)

Citation preview

Profesores:    Jose  F.  Sanchez  (Dept.  Gené+ca,  Micro.  y  Estadís+ca)  -­‐-­‐  [email protected]    Josep  Tarragó      (Dept.  Bioq  y  Biomed.  Molecular)                -­‐-­‐  [email protected]  

 

Bloque  II  

Bloque  II  

Big  Data  

Ley  de  Moore:    Gordon  Moore  en  1965  an+cipaba  que  la  complejidad  de  los  circuitos  integrados  se  duplicaría  cada  dos  años  con  una  reducción  de  costo  conmensurable.    

Big  Data  Coste  de  secuenciación  

Big  Data  Data  stored  at  European  Bioinforma+cs  Ins++tute  (EBI)  doubles  size  every  year  

Bases  de  datos  

Bases  de  datos  

Bases  de  datos  

•  Es  necesario  tener  estructurada  la  información  y  un  acceso  rápido  

•  Structure  Query  Languages  (SQL)  – Tablas  de  la  base  de  datos  – Filtro  – Datos  a  recuperar  

ENSMART  Estructura  

2.1.2  Cercant  dades  a  EnsMart  

ENSMART  -­‐  Definir  la  base  de  dades  -­‐  Ac+var  els  diferents  filtres  -­‐  Escollir  els  Camps  a  Recuperar  -­‐  Combinar  cerques  amb  una  

segona  DB    

2.1.2  Cercant  dades  a  EnsMart  

ENSMART  

2.1.2  Cercant  dades  a  EnsMart  

-­‐  Definir  la  base  de  dades  -­‐  AcEvar  els  diferents  filtres  -­‐  Escollir  els  Camps  a  Recuperar  -­‐  Combinar  cerques  amb  una  

segona  DB    

ENSMART  

2.1.2  Cercant  dades  a  EnsMart  

-­‐  Definir  la  base  de  dades  -­‐  Ac+var  els  diferents  filtres  -­‐  Escollir  els  Camps  a  Recuperar  -­‐  Combinar  cerques  amb  una  

segona  DB    

ENSMART  

2.1.2  Cercant  dades  a  EnsMart  

-­‐  Definir  la  base  de  dades  -­‐  Ac+var  els  diferents  filtres  -­‐  Escollir  els  Camps  a  Recuperar  -­‐  Combinar  cerques  amb  una  

segona  DB    

2.1.3  Exercicis  amb  BIOMART  1.  Feu  una  taula  amb  el  nombre  de  gens  que  codifiquen  per  proteïnes,  

pels  cromosomes  autosòmics  del  genoma  de  Mus  musculus    

2.1.3  Exercicis  amb  BIOMART  1.  Feu  una  taula  amb  el  nombre  de  gens  que  codifiquen  per  proteïnes,  

pels  cromosomes  autosòmics  del  genoma  de  Mus  musculus     Cromosomes  

autosòmics  Nº  de  gens  

(protein_coding)  

1   1182  

2   1835  

3   1003  

4   1328  

5   1259  

6   1115  

7   2019  

8   1038  

9   1215  

10   1015  

11   1636  

12   673  

13   854  

14   909  

15   783  

16   667  

17   1057  

18   524  

19   717  

TOTAL   22237  

2.1.3  Exercicis  amb  BIOMART  2.  Hem  de  recuperar  les  seqüències  de  nucleò+ds  dels  exons  codificants  

(CDS)  dels  gens  localitzats  al  cromosoma  4  de  Drosophila  melanogaster.  La  capçalera  de  les  seqüències  haurà  d'incloure  l'iden+ficador  de  l'exó,  el  del  trànscrit  i  el  del  gen,  així  com  les  coordenades  sobre  el  cromosoma.  

 

…  

2.1.3  Exercicis  amb  BIOMART  2.  Hem  de  recuperar  les  seqüències  de  nucleò+ds  dels  exons  codificants  

(CDS)  dels  gens  localitzats  al  cromosoma  4  de  Drosophila  melanogaster.  La  capçalera  de  les  seqüències  haurà  d'incloure  l'iden+ficador  de  l'exó,  el  del  trànscrit  i  el  del  gen,  així  com  les  coordenades  sobre  el  cromosoma.  

 

…  

2.1.3  Exercicis  amb  BIOMART  3.  Buscar  gens  que  puguin  estar  relacionats  amb  malalEes  al  voltant  del  

gen  MECP2  (cromosoma  X,  banda  Xq28).  També  trobar  quin  és  el  codi  ENSEMBL  pel  gen  MECP2.  

 

2.1.3  Exercicis  amb  BIOMART  3.  Buscar  gens  que  puguin  estar  relacionats  amb  malalEes  al  voltant  del  

gen  MECP2  (cromosoma  X,  banda  Xq28).  També  trobar  quin  és  el  codi  ENSEMBL  pel  gen  MECP2.  

 

…  

2.1.3  Exercicis  amb  BIOMART  3.  Buscar  gens  que  puguin  estar  relacionats  amb  malalEes  al  voltant  del  

gen  MECP2  (cromosoma  X,  banda  Xq28).  També  trobar  quin  és  el  codi  ENSEMBL  pel  gen  MECP2.  

 

2.1.3  Exercicis  amb  BIOMART  4.  Con+nuant  amb  l'exemple  anterior,  volem  recuperar  tots  els  SNPs  

que  caiguin  en  tots  els  exons  de  totes  les  isoformes  d'splicing  per  aquest  gen  (MECP2).  Quants  estan  suportats  per  un  feno+p?  Quins  al·∙lels  presenten?  Podem  recuperar  altres  dades  relacionades  amb  aquests  polimorfismes?  

 

2.1.3  Exercicis  amb  BIOMART  4.  Con+nuant  amb  l'exemple  anterior,  volem  recuperar  tots  els  SNPs  

que  caiguin  en  tots  els  exons  de  totes  les  isoformes  d'splicing  per  aquest  gen  (MECP2).  Quants  estan  suportats  per  un  feno+p?  Quins  al·∙lels  presenten?  Podem  recuperar  altres  dades  relacionades  amb  aquests  polimorfismes?  

 

2.1.3  Exercicis  amb  BIOMART  4.  Con+nuant  amb  l'exemple  anterior,  volem  recuperar  tots  els  SNPs  

que  caiguin  en  tots  els  exons  de  totes  les  isoformes  d'splicing  per  aquest  gen  (MECP2).  Quants  estan  suportats  per  un  feno+p?  Quins  al·∙lels  presenten?  Podem  recuperar  altres  dades  relacionades  amb  aquests  polimorfismes?  

 

…  

2.1.3  Exercicis  amb  BIOMART  

5.  Gens  ortòlegs  entre  mosques  i  abelles  en  el  cromosoma  3R  de  Drosophila,  entre  coordenadas  1-­‐5000000  bp?