Upload
others
View
6
Download
0
Embed Size (px)
Citation preview
Bioinformatyczna analiza danych
Wykład 1
Dr Wioleta Drobik-Czwarno
Katedra Genetyki i Ogólnej Hodowli Zwierząt
• Prowadzący przedmiot:
▫ Dr Wioleta Drobik-Czwarno – koordynator przedmiotu, wykłady, ćwiczenia
Pokój:35 (Katedra Genetyki i Ogólnej Hodowli Zwierząt)
Telefon: 22 59 36582
Email: [email protected]; [email protected]
Konsultacje: wtorek 9-11 (lub inny termin po wcześniejszym umówieniu się)
▫ Dr Zuzanna Nowak – 1 blok ćwiczeniowy – ekspresja genów
Pokój 28, email: [email protected]
▫ Mgr inż. Marlena Wojciechowska – 1 blok ćwiczeniowy – mikromacierze SNP
Pokój 29, email: [email protected]
▫ Mgr inż. Agnieszka Szostak – 1 blok ćwiczeniowy – ekspresja genów
Pokój 29, email: [email protected]
Sprawy organizacyjne
Sprawy organizacyjne
• Organizacja przedmiotu
▫ ECTS: 3 pkt
▫ 10 h wykładów – 1 h wykładu w tygodniu
▫ 30 h ćwiczeń – 3 h ćwiczeń w tygodniu
▫ Planowane zakończenie zajęć: druga połowa maja
Zasady zaliczenia przedmiotu
• Egzamin – 40%
▫ Pytania z części wykładowej i ćwiczeniowej
▫ Pytania otwarte – odpowiedź na kilka zdań, uzupełnianie, uszeregowanie
• Przykładowe pytania:
▫ Wymień znane ci rodzaje mikromacierzy
▫ W jakim celu wykonujemy analizę PCA przed GWAS?
▫ Wypisz etapy analizy bioinformatycznej mającej na celu wykrywanie polimorfizmów typu SNP na podstawie NGS.
Zasady zaliczenia części ćwiczeniowej
• Projekt ~ 40% oceny ▫ Prowadzący dostarcza: publikacje do opracowania, dane, zarys
problemu badawczego ▫ Należy przygotować prezentację w której znajdą się:
1. Omówienie publikacji 2. Omówienie problemu badawczego
1. Wstęp 2. Materiał i metody 3. Wyniki 4. Podsumowanie i wnioski
• Czas na prezentację projektu: 15-20 minut • Grupy od 2 do 4 osób, istnieje możliwość przygotowania projektu
samodzielnie.
• Praca na zajęciach ~ 20% oceny
▫ Jak wyżej, czyli zaangażowanie w ćwiczenia, wykonanie przewidzianych analiz – oceniane na koniec ćwiczeń
▫ Po danym bloku tematycznym (co ~2 tygodnie) każdy ma obowiązek nadesłać pytanie drogą mailową Czas - do czwartku w następnym tygodniu zajęć
Pytanie może dotyczyć wykładu lub ćwiczeń. Nie może być to pytanie, o coś na co odpowiedz była już podana. Pytamy o to czego nie zrozumieliśmy, co nas zaintrygowało, w stosunku do czego mamy wątpliwości.
Zasady zaliczenia części ćwiczeniowej
Czym będziemy zajmowali się na
zajęciach
• Analizy bioinformatyczne:
▫ analiza danych z mikromacierzy SNP
▫ analiza stratyfikacji populacji (analiza głównych składowych PCA, ang. Principal Component Analysis)
▫ analiza asocjacyjna w skali genomu (GWAS, and. Genome-Wide Association Studies)
▫ sekwencjonowanie nowej generacji (NGS, ang. Next Generation Sequencing)
▫ analiza ekspresji genów
• Podstawy obsługi command line w systemie linux
• Zastosowanie środowiska R w bioinformatyce
Mikromacierze DNA
Wybrane techniki wykrywania
polimorfizmu DNA
• RFLP - polimorfizm długości fragmentów restrykcyjnych
• AFLP - polimorfizm długości amplifikowanych fragmentów
• SSCP - Polimorfizm konformacyjny jednoniciowych fragmentów
• RAPD - Polimorfizm losowo amplifikowanych fragmentów
• Polimorfizm sekwencji powtarzających się tandemowo
• Sekwencje mikrosatelitarne (STR)
▫ Sekwencje minisatelitarne (VNTR)
▫ Zmienność liczby kopii (CNV)
• Mikromacierze SNP
• Sekwencjonowanie
• Działanie opiera się na hybrydyzacji jednoniciowych kwasów nukleinowych w struktury dwuniciowe
• Płytka zawiera sondy DNA o znanej sekwencji nukleotydowej
▫ Jedna płytka może zawierać setki tysięcy sond
• Badanie polega na naniesieniu materiału biologicznego na płytkę i odczytaniu sygnału
Mikromacierze DNA
Mikromacierze DNA
• Główne typy mikromacierzy w zależności od rodzaju sond: ▫ Mikromacierze cDNA
▫ Mikromacierze oligonukleotydowe
• Inne przykłady wykorzystania mikromacierzy w naukach biologicznych: ▫ Mikromacierze tkankowe (TMA)
▫ Porównawcza hybrydyzacja genomowa do mikromacierzy (aCGH; ang. Agilent Comparative Genomic Hybridization) – analiza struktury genomu
Etapy analizy
1. Opracowanie celu badawczego
2. Przygotowanie mikromacierzy (lub zakup komercyjnie dostępnego produktu)
3. Przygotowanie prób: izolacja materiału genetycznego, oczyszczanie, odwrotna transkrypcja (przy mRNA), znakowanie, fragmentacja
4. Hybrydyzacja znakowanych sond na mikromacierzy
5. Detekcja i wizualizacja wyników
6. Analiza bioinformatyczna i interpretacja wyników
Mikromacierze cDNA
• Rolę sond pełnią fragmenty cDNA o długości 0,5 do 2,0 kbp będące produktami amplifikacji PCR
• Umożliwia porównanie ekspresji genów w próbie eksperymentalnej i kontrolnej poprzez wyznakowanie prób dwoma różnymi barwnikami
• Łatwiejsze do przygotowania niż mikromacierze oligonukleotydowe. Zwykle przygotowywane na potrzeby danego eksperymentu
• Etapy analizy: 1. Izolacja RNA 2. Odwrotna transkrypcja -
przepisanie RNA na komplementarny DNA (cDNA)
3. Znakowanie - Dołączanie znakowanych nukleotydów do powstających cząsteczek cDNA
4. Odczyt i interpretacja wyników – natężenie fluorescencji jest proporcjonalna do ilości wyznakowanych cząsteczek
5. Analiza bioinformatyczna wyników
Veronique Vermeeren and Luc Michiels (2011) Evolution towards the implementation of point-of-care biosensors. ISBN 978-953-307-443-6
Mikromacierze
ekspresyjne
Mikromacierze oligonukleotydowe (chipy DNA, macierze genotypowe)
• Sondy: krótkie oligonukleotydy o długości 10-25 bp (są stosowane również długie sondy o długości 50 – 70 bp)
• Służą m.in. do badania ekspresji genów, wykrywania polimofizmów typu SNP
• Największe firmy biotechnologiczne zajmujące się produkcją chipów DNA dla ludzi i zwierząt:
• Affymetrix - statyczne chipy DNA, sondy syntetyzowane są bezpośrednio na płytce w technice fitolitografii
• Illumina - sondy zakotwiczone są na powierzchni silikonowych ziaren (ang. beads), każde ziarno to setki tysięcy kopii jednej sondy
1. Izolacja DNA (lub RNA) z materiału biologicznego, powielenie DNA w procesie amplifikacji oraz fragmentacja
2. Wytrącanie DNA i zawieszenie w buforze do hybrydyzacji
3. Naniesienie na powierzchnię mikromacierzy; Hybrydyzacja jednoniciowych fragmentów DNA z sondami o komplementarnej sekwencji
4. Dobudowanie nukleotydu do sondy zgodnie z sekwencją badanej próby DNA oraz wybarwianie
5. Skanowanie; Odczyt i interpretacja wyników
Źródło: Affymetrix
Mikromacierze oligonukleotydowe
Zastosowanie mikromacierzy SNP
• Nauki o zwierzętach: ▫ Badania asocjacyjne prowadzone na całym genomie (GWAS)
▫ Selekcja genomowa
▫ Kontrola pochodzenia
▫ Genetyka populacyjna
• Medycyna: ▫ GWAS
▫ Diagnostyka chorób genetycznych i chorób zakaźnych
▫ Wykrywanie aberracji chromosomowych
▫ Identyfikacja genów np. odporności na antybiotyki
Programy do analizy surowych
danych z mikromacierzy SNP
Illumina Genome Studio – demonstracja na ćwiczeniach
Axiom Analysis Suite
Axiom Analysis Suite
• Umożliwia przeprowadzenie pełnej analizy w jednym programie ▫ Import plików
▫ Konfiguracja ustawień
▫ Ustawienia filtrów QC (ang. Quality Control)
▫ Domyślne ustawienia dla gatunków di- oraz poliploidalnych
▫ Wizualizacja wyników Np. Axiom CNV Summary Tool
A. Pliki .CEL
• Format .CEL przechowuje informację o poziomie intensywności fluorescencji każdej z sond mikromacierzowych
B. Ustawienia analizy
• Przygotowanie plików do dalszych analiz
• Ustawienia projektu
• Wstępna kontrola jakości próbki
C. Kontrola jakości
• Sample QC – jakość płytki, procent próbek, które przechodzą kontrolę jakości
• SNP QC – parametry jakości dotyczące markerów SNP
Wyniki
• Kodowanie genotypów (Call code): AB , 012, ACTG
SNP Cluster Graph Generowane dla każdego markera
Kontrola jakości
Cluster Plot
• Oś Y: Size (lub strength) – siła sygnału, liczona jako:
[Log2(A_signal) + Log2(B_signal)]/2
• Oś X: Contrast (lub log ratio)– Główna informacja dla rozróżnienia genotypów, liczony jako:
Log2(A_signal/B_signal)
Literatura • Charon K., Świtoński M. 2012. Genetyka i Genomika Zwierząt. PWN.
• Wojciechowska M., Olech W. 2013. Wykorzystanie mikromacierzy DNA w badaniach dzikich zwierząt. Studia i Materiały CEPL w Rogowie. R. 15. Zeszyt 36 / 3 / 2013.
• Platforma Affymetrix: http://www.affymetrix.com/
• Platforma Illumina: https://www.illumina.com/