Online Datenbanken für Bioinformatiker Einführung Bioinformatik Einführung Bioinformatik Oktober...

Preview:

Citation preview

Online Datenbanken für Bioinformatiker

Einführung BioinformatikEinführung Bioinformatik Oktober 2003

Inhaltsverzeichnis2.1. Datenbanken für Nukleotidsequenzen

2.2. Proteindatenbanken

2.3. Enzym - und Metabolismusdatenbanken

2.4. Datenbanken für Protein - Raumstrukturen

2.5. Chemische Faktendatenbanken

2.6. Bibliographische Datenbanken

2.1. Datenbanken für Nukleotidsequenzen

• Annotation: verbale Kommentierung von Sequenz-Daten

• Gemeinschaftsprojekt von:• National Center for Biotechnology Information

(NCBI, Bethesda bei Washington), • European Bioinformatics Institute

(EBI, Hinxton bei Cambridge), Teil des EMBL • National Institute of Genetics (in Mishima, Japan)

2.1. Datenbanken für Nukleotidsequenzen (2)

• Datenbanken enthalten DNA- und RNA- (d.h. cDNA)-Sequenzen, vollständige Genome, einzelne Gene und ESTs

• Neue Einträge in Reihenfolge:

Ohne Annotation vorläufiger Eintrag

ungeprüfter Eintrag Standard

2.1. Datenbanken für Nukleotidsequenzen (3)

• GenBank (USA)• http://www.ncbi.nlm.nih.gov/Genbank/GenbankSearch.html

2.1. Datenbanken für Nukleotidsequenzen (4)

• EMBL (Europa)• http://www.ebi.ac.uk/embl/

2.1. Datenbanken für Nukleotidsequenzen (5)

• DDBJ = DNA Data Bank of Japan• http://www.nig.ac.jp/index-e.html

Textdateien mit genau festgelegtem Format.

Identifier

Aspergillus niger phosphofructokinase

4658 Basenpaare

Fungi

In EMBL: Jede Zeile beginnt mit 2 Großbuchstaben.ID ANPFKA standard; DNA; FUN; 4658 BP.

Genom von H. influenzae:

ID L42023 standard; circular DNA; CON; 1830138 BP...SQ Sequence 1830138 BP; 567623 A; 350723 C; 347436 G; 564241 T; 115 other;

tatggcaatt aaaattggta tcaatggttt tggtcgtatc ggccgtatcg tattccgtgc 60 agcacaacac cgtgatgaca ttgaagttgt aggtattaac gacttaatcg acgttgaata 120 catggcttat atgttgaaat atgattcaac tcacggtcgt ttcgacggca ctgttgaagt 180 gaaagatggt aacttagtgg ttaatggtaa aactatccgt gtaactgcag aacgtgatcc 240 agcaaactta aactggggtg caatcggtgt tgatatcgct gttgaagcga ctggtttatt 300 cttaactgat gaaactgctc gtaaacatat cactgcaggc gcaaaaaaag ttgtattaac 360 tggcccatct aaagatgcaa cccctatgtt cgttcgtggt gtaaacttca acgcatacgc 420......................

Bakterien haben ringförmige DNA!

ggattaaaat gggatgcttt tatcacatca atcatcgact gattttnctc ttttgcagcc 47640

Nicht identifizierte Nukleotide („n“)

Sequence Retrieval System (SRS)

http://srs.ebi.ac.uk

Suche mit Booleschen Operatoren & [und], | [oder] und ! [nicht]

Mit „Quick search“ sehr viele, unspezifische Treffer.Besser „Standard search“.

Unterhalten am EBI. Man kann auch in anderen Datenbankenals EMBL suchen.

?? Zuerst auf „Start a temporary project“ klicken.

2.1. Datenbanken für Nukleotidsequenzen (9)

• Sequence Retrieval System (SRS)

2.1. Datenbanken für Nukleotidsequenzen (10)

• Suchmaske

2.1. Datenbanken für Nukleotidsequenzen (11)

• Standard Search

2.1. Datenbanken für Nukleotidsequenzen (12)

• Suchergebnis

Spezielle Genomdatenbanken

• Entrez Genome (NCBI)• http://www.ncbi.nlm.nih.gov/entrez/query.fcgi?db=Genome

Spezielle Genomdatenbanken (2)

• TIGR-Genom-Datenbank• http://www.tigr.org/tdb/

Gen - Namen

Phosphoglucoisomerase: g6p, Isoformen g6p1, g6p2, g6pA, ...

Phosphofruktokinase: k6p (früher pfk), Isoformen k6p1, k6P2,...

Transaldolase: tal

2.2. Proteindatenbanken

• Swiss-Prot - am Schweizer Institut für Bioinformatik (SIB)

• http://us.expasy.org/sprot

2.2. Proteindatenbanken (2)

• PROSITE• http://www.expasy.org/prosite/

2.2. Proteindatenbanken (3)

• TrEMBL• http://www.ebi.ac.uk/trembl/index.html

2.2. Proteindatenbanken (4)

• Entrez Protein ( am NCBI )• http://www.ncbi.nlm.nih.gov/entrez/query.fcgi?db=Protein

2.3. Enzym - und Metabolismus - Datenbanken

• ENZYME ( Teil von Swiss-Prot )• http://www.expasy.org/enzyme/

2.3. Enzym - und Metabolismus - Datenbanken (2)

• BRENDA

2.3. Enzym - und Metabolismus - Datenbanken (3)

• KEGG ( Kyoto Encyclopedia of Genes and Genomes )

• http://www.genome.ad.jp/kegg/kegg2.html

2.3. Enzym - und Metabolismus - Datenbanken (3b)

• Anzeige zu Citrate Cycle

2.3. Enzym - und Metabolismus - Datenbanken (4)

• WIT ( What Is There )• http://www-unix.mcs.anl.gov/compbio/

2.3. Enzym - und Metabolismus - Datenbanken (5)

• BioCyc• http://biocyc.org/

2.4. Datenbanken für Protein - Raumstrukturen

• PDB= Protein Data Bank

• http://www.rcsb.org/pdb

2.4. Datenbanken für Protein - Raumstrukturen (2)

• Ergebnis der Suche nach :Deoxy Human Hemoglobin

2.4. Datenbanken für Protein - Raumstrukturen (3)

2.4. Datenbanken für Protein - Raumstrukturen (4)

• Entrez Structure• http://www.ncbi.nlm.nih.gov/entrez/query.fcgi?db=Structure•

2.4. Datenbanken für Protein - Raumstrukturen (5)

• SWISS -3DIMAGE• http://www.expasy.org/sw3d/

2.5. Chemische Faktendatenbanken

• BEILSTEIN

Beilstein (2)

Beilstein (3)

2.5. Chemische Faktendatenbanken (2)

• REGISTRY

Registry (2)

• Suche

Registry (3)

• Kurzeintrag aus

SciFinder Scholar

Registry (4)

• Dokument

aus Registry

Registry (5)

• Vollanzeige

2.6. Bibliographische Datenbanken

• Web of Science

• Chemical Abstracts und Medline in SciFinder Scholar

• weitere Datenbanken

Web of Science

die Datenbank ist auch unter dem Namen

Science Citation Index bekannt

Titelanzeige im Web of Science

• Bibliographische Angaben, Abstract

Chemical Abstracts und Medline in SciFinder Scholar

Zugang zu SciFinder Scholar an der FSU Jena

• Direktzugang

• alphabetische oder systematische Liste der ThULB

SciFinder Scholar für Bioinformatiker

• SciFinder Scholar im Fachinformationsportal

Internetanleitung zu SciFinder Scholar

• Weitere Materialien

Chemical Abstracts

• http://www.cas.org/

CA in SciFinder Scholar

CA in SciFinder Scholar (2)

CA in SciFinder Scholar (3)

Medline

http://www.dimdi.de/de/db/gui/gui-freeinfo.htm

Medline beim DIMDI

Medline in SciFinder Scholar

Medline in SciFinder Scholar (2)

Medline in SciFinder Scholar (3)

Medline bei PubMed

http://www4.ncbi.nlm.nih.gov/PubMed/

Recommended