25
Bioinformatyczna analiza danych Wykład 1 Dr Wioleta Drobik-Czwarno Katedra Genetyki i Ogólnej Hodowli Zwierząt

Bioinformatyczna analiza danychkgohz.sggw.pl/wp-content/uploads/2017/03/Bioinf-wykład-1-Wprowadzenie... · analiza danych z mikromacierzy SNP analiza stratyfikacji populacji (analiza

  • Upload
    others

  • View
    6

  • Download
    0

Embed Size (px)

Citation preview

Page 1: Bioinformatyczna analiza danychkgohz.sggw.pl/wp-content/uploads/2017/03/Bioinf-wykład-1-Wprowadzenie... · analiza danych z mikromacierzy SNP analiza stratyfikacji populacji (analiza

Bioinformatyczna analiza danych

Wykład 1

Dr Wioleta Drobik-Czwarno

Katedra Genetyki i Ogólnej Hodowli Zwierząt

Page 2: Bioinformatyczna analiza danychkgohz.sggw.pl/wp-content/uploads/2017/03/Bioinf-wykład-1-Wprowadzenie... · analiza danych z mikromacierzy SNP analiza stratyfikacji populacji (analiza

• Prowadzący przedmiot:

▫ Dr Wioleta Drobik-Czwarno – koordynator przedmiotu, wykłady, ćwiczenia

Pokój:35 (Katedra Genetyki i Ogólnej Hodowli Zwierząt)

Telefon: 22 59 36582

Email: [email protected]; [email protected]

Konsultacje: wtorek 9-11 (lub inny termin po wcześniejszym umówieniu się)

▫ Dr Zuzanna Nowak – 1 blok ćwiczeniowy – ekspresja genów

Pokój 28, email: [email protected]

▫ Mgr inż. Marlena Wojciechowska – 1 blok ćwiczeniowy – mikromacierze SNP

Pokój 29, email: [email protected]

▫ Mgr inż. Agnieszka Szostak – 1 blok ćwiczeniowy – ekspresja genów

Pokój 29, email: [email protected]

Sprawy organizacyjne

Page 3: Bioinformatyczna analiza danychkgohz.sggw.pl/wp-content/uploads/2017/03/Bioinf-wykład-1-Wprowadzenie... · analiza danych z mikromacierzy SNP analiza stratyfikacji populacji (analiza

Sprawy organizacyjne

• Organizacja przedmiotu

▫ ECTS: 3 pkt

▫ 10 h wykładów – 1 h wykładu w tygodniu

▫ 30 h ćwiczeń – 3 h ćwiczeń w tygodniu

▫ Planowane zakończenie zajęć: druga połowa maja

Page 4: Bioinformatyczna analiza danychkgohz.sggw.pl/wp-content/uploads/2017/03/Bioinf-wykład-1-Wprowadzenie... · analiza danych z mikromacierzy SNP analiza stratyfikacji populacji (analiza

Zasady zaliczenia przedmiotu

• Egzamin – 40%

▫ Pytania z części wykładowej i ćwiczeniowej

▫ Pytania otwarte – odpowiedź na kilka zdań, uzupełnianie, uszeregowanie

• Przykładowe pytania:

▫ Wymień znane ci rodzaje mikromacierzy

▫ W jakim celu wykonujemy analizę PCA przed GWAS?

▫ Wypisz etapy analizy bioinformatycznej mającej na celu wykrywanie polimorfizmów typu SNP na podstawie NGS.

Page 5: Bioinformatyczna analiza danychkgohz.sggw.pl/wp-content/uploads/2017/03/Bioinf-wykład-1-Wprowadzenie... · analiza danych z mikromacierzy SNP analiza stratyfikacji populacji (analiza

Zasady zaliczenia części ćwiczeniowej

• Projekt ~ 40% oceny ▫ Prowadzący dostarcza: publikacje do opracowania, dane, zarys

problemu badawczego ▫ Należy przygotować prezentację w której znajdą się:

1. Omówienie publikacji 2. Omówienie problemu badawczego

1. Wstęp 2. Materiał i metody 3. Wyniki 4. Podsumowanie i wnioski

• Czas na prezentację projektu: 15-20 minut • Grupy od 2 do 4 osób, istnieje możliwość przygotowania projektu

samodzielnie.

Page 6: Bioinformatyczna analiza danychkgohz.sggw.pl/wp-content/uploads/2017/03/Bioinf-wykład-1-Wprowadzenie... · analiza danych z mikromacierzy SNP analiza stratyfikacji populacji (analiza

• Praca na zajęciach ~ 20% oceny

▫ Jak wyżej, czyli zaangażowanie w ćwiczenia, wykonanie przewidzianych analiz – oceniane na koniec ćwiczeń

▫ Po danym bloku tematycznym (co ~2 tygodnie) każdy ma obowiązek nadesłać pytanie drogą mailową Czas - do czwartku w następnym tygodniu zajęć

Pytanie może dotyczyć wykładu lub ćwiczeń. Nie może być to pytanie, o coś na co odpowiedz była już podana. Pytamy o to czego nie zrozumieliśmy, co nas zaintrygowało, w stosunku do czego mamy wątpliwości.

Zasady zaliczenia części ćwiczeniowej

Page 7: Bioinformatyczna analiza danychkgohz.sggw.pl/wp-content/uploads/2017/03/Bioinf-wykład-1-Wprowadzenie... · analiza danych z mikromacierzy SNP analiza stratyfikacji populacji (analiza

Czym będziemy zajmowali się na

zajęciach

• Analizy bioinformatyczne:

▫ analiza danych z mikromacierzy SNP

▫ analiza stratyfikacji populacji (analiza głównych składowych PCA, ang. Principal Component Analysis)

▫ analiza asocjacyjna w skali genomu (GWAS, and. Genome-Wide Association Studies)

▫ sekwencjonowanie nowej generacji (NGS, ang. Next Generation Sequencing)

▫ analiza ekspresji genów

• Podstawy obsługi command line w systemie linux

• Zastosowanie środowiska R w bioinformatyce

Page 8: Bioinformatyczna analiza danychkgohz.sggw.pl/wp-content/uploads/2017/03/Bioinf-wykład-1-Wprowadzenie... · analiza danych z mikromacierzy SNP analiza stratyfikacji populacji (analiza

Mikromacierze DNA

Page 9: Bioinformatyczna analiza danychkgohz.sggw.pl/wp-content/uploads/2017/03/Bioinf-wykład-1-Wprowadzenie... · analiza danych z mikromacierzy SNP analiza stratyfikacji populacji (analiza

Wybrane techniki wykrywania

polimorfizmu DNA

• RFLP - polimorfizm długości fragmentów restrykcyjnych

• AFLP - polimorfizm długości amplifikowanych fragmentów

• SSCP - Polimorfizm konformacyjny jednoniciowych fragmentów

• RAPD - Polimorfizm losowo amplifikowanych fragmentów

• Polimorfizm sekwencji powtarzających się tandemowo

• Sekwencje mikrosatelitarne (STR)

▫ Sekwencje minisatelitarne (VNTR)

▫ Zmienność liczby kopii (CNV)

• Mikromacierze SNP

• Sekwencjonowanie

Page 10: Bioinformatyczna analiza danychkgohz.sggw.pl/wp-content/uploads/2017/03/Bioinf-wykład-1-Wprowadzenie... · analiza danych z mikromacierzy SNP analiza stratyfikacji populacji (analiza

• Działanie opiera się na hybrydyzacji jednoniciowych kwasów nukleinowych w struktury dwuniciowe

• Płytka zawiera sondy DNA o znanej sekwencji nukleotydowej

▫ Jedna płytka może zawierać setki tysięcy sond

• Badanie polega na naniesieniu materiału biologicznego na płytkę i odczytaniu sygnału

Mikromacierze DNA

Page 11: Bioinformatyczna analiza danychkgohz.sggw.pl/wp-content/uploads/2017/03/Bioinf-wykład-1-Wprowadzenie... · analiza danych z mikromacierzy SNP analiza stratyfikacji populacji (analiza

Mikromacierze DNA

• Główne typy mikromacierzy w zależności od rodzaju sond: ▫ Mikromacierze cDNA

▫ Mikromacierze oligonukleotydowe

• Inne przykłady wykorzystania mikromacierzy w naukach biologicznych: ▫ Mikromacierze tkankowe (TMA)

▫ Porównawcza hybrydyzacja genomowa do mikromacierzy (aCGH; ang. Agilent Comparative Genomic Hybridization) – analiza struktury genomu

Page 12: Bioinformatyczna analiza danychkgohz.sggw.pl/wp-content/uploads/2017/03/Bioinf-wykład-1-Wprowadzenie... · analiza danych z mikromacierzy SNP analiza stratyfikacji populacji (analiza

Etapy analizy

1. Opracowanie celu badawczego

2. Przygotowanie mikromacierzy (lub zakup komercyjnie dostępnego produktu)

3. Przygotowanie prób: izolacja materiału genetycznego, oczyszczanie, odwrotna transkrypcja (przy mRNA), znakowanie, fragmentacja

4. Hybrydyzacja znakowanych sond na mikromacierzy

5. Detekcja i wizualizacja wyników

6. Analiza bioinformatyczna i interpretacja wyników

Page 13: Bioinformatyczna analiza danychkgohz.sggw.pl/wp-content/uploads/2017/03/Bioinf-wykład-1-Wprowadzenie... · analiza danych z mikromacierzy SNP analiza stratyfikacji populacji (analiza

Mikromacierze cDNA

• Rolę sond pełnią fragmenty cDNA o długości 0,5 do 2,0 kbp będące produktami amplifikacji PCR

• Umożliwia porównanie ekspresji genów w próbie eksperymentalnej i kontrolnej poprzez wyznakowanie prób dwoma różnymi barwnikami

• Łatwiejsze do przygotowania niż mikromacierze oligonukleotydowe. Zwykle przygotowywane na potrzeby danego eksperymentu

Page 14: Bioinformatyczna analiza danychkgohz.sggw.pl/wp-content/uploads/2017/03/Bioinf-wykład-1-Wprowadzenie... · analiza danych z mikromacierzy SNP analiza stratyfikacji populacji (analiza

• Etapy analizy: 1. Izolacja RNA 2. Odwrotna transkrypcja -

przepisanie RNA na komplementarny DNA (cDNA)

3. Znakowanie - Dołączanie znakowanych nukleotydów do powstających cząsteczek cDNA

4. Odczyt i interpretacja wyników – natężenie fluorescencji jest proporcjonalna do ilości wyznakowanych cząsteczek

5. Analiza bioinformatyczna wyników

Veronique Vermeeren and Luc Michiels (2011) Evolution towards the implementation of point-of-care biosensors. ISBN 978-953-307-443-6

Mikromacierze

ekspresyjne

Page 15: Bioinformatyczna analiza danychkgohz.sggw.pl/wp-content/uploads/2017/03/Bioinf-wykład-1-Wprowadzenie... · analiza danych z mikromacierzy SNP analiza stratyfikacji populacji (analiza

Mikromacierze oligonukleotydowe (chipy DNA, macierze genotypowe)

• Sondy: krótkie oligonukleotydy o długości 10-25 bp (są stosowane również długie sondy o długości 50 – 70 bp)

• Służą m.in. do badania ekspresji genów, wykrywania polimofizmów typu SNP

• Największe firmy biotechnologiczne zajmujące się produkcją chipów DNA dla ludzi i zwierząt:

• Affymetrix - statyczne chipy DNA, sondy syntetyzowane są bezpośrednio na płytce w technice fitolitografii

• Illumina - sondy zakotwiczone są na powierzchni silikonowych ziaren (ang. beads), każde ziarno to setki tysięcy kopii jednej sondy

Page 16: Bioinformatyczna analiza danychkgohz.sggw.pl/wp-content/uploads/2017/03/Bioinf-wykład-1-Wprowadzenie... · analiza danych z mikromacierzy SNP analiza stratyfikacji populacji (analiza

1. Izolacja DNA (lub RNA) z materiału biologicznego, powielenie DNA w procesie amplifikacji oraz fragmentacja

2. Wytrącanie DNA i zawieszenie w buforze do hybrydyzacji

3. Naniesienie na powierzchnię mikromacierzy; Hybrydyzacja jednoniciowych fragmentów DNA z sondami o komplementarnej sekwencji

4. Dobudowanie nukleotydu do sondy zgodnie z sekwencją badanej próby DNA oraz wybarwianie

5. Skanowanie; Odczyt i interpretacja wyników

Źródło: Affymetrix

Mikromacierze oligonukleotydowe

Page 17: Bioinformatyczna analiza danychkgohz.sggw.pl/wp-content/uploads/2017/03/Bioinf-wykład-1-Wprowadzenie... · analiza danych z mikromacierzy SNP analiza stratyfikacji populacji (analiza

Zastosowanie mikromacierzy SNP

• Nauki o zwierzętach: ▫ Badania asocjacyjne prowadzone na całym genomie (GWAS)

▫ Selekcja genomowa

▫ Kontrola pochodzenia

▫ Genetyka populacyjna

• Medycyna: ▫ GWAS

▫ Diagnostyka chorób genetycznych i chorób zakaźnych

▫ Wykrywanie aberracji chromosomowych

▫ Identyfikacja genów np. odporności na antybiotyki

Page 18: Bioinformatyczna analiza danychkgohz.sggw.pl/wp-content/uploads/2017/03/Bioinf-wykład-1-Wprowadzenie... · analiza danych z mikromacierzy SNP analiza stratyfikacji populacji (analiza

Programy do analizy surowych

danych z mikromacierzy SNP

Illumina Genome Studio – demonstracja na ćwiczeniach

Axiom Analysis Suite

Page 19: Bioinformatyczna analiza danychkgohz.sggw.pl/wp-content/uploads/2017/03/Bioinf-wykład-1-Wprowadzenie... · analiza danych z mikromacierzy SNP analiza stratyfikacji populacji (analiza

Axiom Analysis Suite

• Umożliwia przeprowadzenie pełnej analizy w jednym programie ▫ Import plików

▫ Konfiguracja ustawień

▫ Ustawienia filtrów QC (ang. Quality Control)

▫ Domyślne ustawienia dla gatunków di- oraz poliploidalnych

▫ Wizualizacja wyników Np. Axiom CNV Summary Tool

Page 20: Bioinformatyczna analiza danychkgohz.sggw.pl/wp-content/uploads/2017/03/Bioinf-wykład-1-Wprowadzenie... · analiza danych z mikromacierzy SNP analiza stratyfikacji populacji (analiza
Page 21: Bioinformatyczna analiza danychkgohz.sggw.pl/wp-content/uploads/2017/03/Bioinf-wykład-1-Wprowadzenie... · analiza danych z mikromacierzy SNP analiza stratyfikacji populacji (analiza

A. Pliki .CEL

• Format .CEL przechowuje informację o poziomie intensywności fluorescencji każdej z sond mikromacierzowych

B. Ustawienia analizy

• Przygotowanie plików do dalszych analiz

• Ustawienia projektu

• Wstępna kontrola jakości próbki

C. Kontrola jakości

• Sample QC – jakość płytki, procent próbek, które przechodzą kontrolę jakości

• SNP QC – parametry jakości dotyczące markerów SNP

Page 22: Bioinformatyczna analiza danychkgohz.sggw.pl/wp-content/uploads/2017/03/Bioinf-wykład-1-Wprowadzenie... · analiza danych z mikromacierzy SNP analiza stratyfikacji populacji (analiza

Wyniki

• Kodowanie genotypów (Call code): AB , 012, ACTG

Page 23: Bioinformatyczna analiza danychkgohz.sggw.pl/wp-content/uploads/2017/03/Bioinf-wykład-1-Wprowadzenie... · analiza danych z mikromacierzy SNP analiza stratyfikacji populacji (analiza

SNP Cluster Graph Generowane dla każdego markera

Kontrola jakości

Page 24: Bioinformatyczna analiza danychkgohz.sggw.pl/wp-content/uploads/2017/03/Bioinf-wykład-1-Wprowadzenie... · analiza danych z mikromacierzy SNP analiza stratyfikacji populacji (analiza

Cluster Plot

• Oś Y: Size (lub strength) – siła sygnału, liczona jako:

[Log2(A_signal) + Log2(B_signal)]/2

• Oś X: Contrast (lub log ratio)– Główna informacja dla rozróżnienia genotypów, liczony jako:

Log2(A_signal/B_signal)

Page 25: Bioinformatyczna analiza danychkgohz.sggw.pl/wp-content/uploads/2017/03/Bioinf-wykład-1-Wprowadzenie... · analiza danych z mikromacierzy SNP analiza stratyfikacji populacji (analiza

Literatura • Charon K., Świtoński M. 2012. Genetyka i Genomika Zwierząt. PWN.

• Wojciechowska M., Olech W. 2013. Wykorzystanie mikromacierzy DNA w badaniach dzikich zwierząt. Studia i Materiały CEPL w Rogowie. R. 15. Zeszyt 36 / 3 / 2013.

• Platforma Affymetrix: http://www.affymetrix.com/

• Platforma Illumina: https://www.illumina.com/