Dari Mana Data DNA Diperoleh ?1. Melakukan sekuensing DNA (hasil PCR - amplifikasi DNA template dengan spesifik primer- i.e ITS etc), Cloning produk PCR dalam plasmid dan melakukan sekuensing DNA dengan mesin sekuenser)
2. Mendapatkan sekuensing DNA lain yang mirip/dekat (related sequences) dengan sekuensing DNA yang dimiliki & Mendapatkan related sequences melalui NCBI gen bank (Go to BLAST site)
BLAST
Pilih BLASTN (nucleotide-
nucleotide BLAST)
http://www.ncbi.nlm.nih.gov/
HASIL BLAST
Score (Bits) = nilai tertinggi & E (expectation) value =
mendekati 0.0 (nol)
Urutan DNA/protein yg ingin dicari kemiripannya
DISPLAY FASTA FORMAT
Contoh format FASTA, diawali dengan tanda
bracket (>)
HASIL ENTREZ (ALL DATABASES)
Input keyword gen
Output jumlah gen linamarase
yg terdapat pada gen bank
Output ditampilkan
dalam bentuk format FASTA
Pilih file TXT
SEQUENCE ALIGNMENT
1. Is the process of aligning two sequences and its the basis of database similarity searching
2. Evolutionary Basis : DNA and proteins are products of evolution
3. Molecules (DNA & protein) can be considered molecular fossils that encode the history of millions if years of evolution
4. Comparing sequences through alignment, patterns of conservation and variation can be identified.
5. The degree of sequence conservation in the alignment reveals evolutionary relatedness of different sequences.
6. The variation between sequences reflects the changes that have occurred during evolution in the form of substitutions, insertions, and deletions
Bagaimana membangun pohon filogenetika ?
• Data2 sekuensing yang diperoleh dilakukan align the sequences ( penjajaran urutan DNA) – pairwise/multiple alignment, mengunakan program CLUSTAL X. Hasil multiple alignment kadang-kadang masih diperlukan eyes correction (Fine-Tuning alignment)
• Hasil alignment di pakai untuk membangun pohon filogenetika dengan PAUP, Phylip or MrBayes program
• Visualisasi pohon filogenetika dengan TreeView program
Bagaimana Membangun Multiple Alignment ?
• Dua atau lebih sekuensing DNA dilakukan alignmnent• Di dalam melakukan multiple alignment akan
memunculkan gap (spaces). • Adanya gap (spaces) diasumsikan adanya insersi or
delesi pada urutan DNA tsb• Banyak dan sedikitnya gap dalam alignment
menentukan kualitas dari hasil alignmnet • Gap penalty =scoring system yang dipakai (jika match
diberi scoring positif dan tidak match diberi scoring negatif (match residue =1 dan mismatch residue =0).
• Program ClustalX salah satu tools terbaik/direkomendasi untuk membangun multiple alignment
Bagaimana membangun file input• Clustal X membutuhkan data memiliki format data (file input) yang
dikenali.• File input harus memiliki urutan2 DNA yang akan dilakukan
alignment• Clustal akan mengenali beberapa format urutan DNA (contoh FASTA
format). Fasta format mudah dikenali karena pada baris pertama dimulai dengan “>” karakter (> species ACTGTGTGTGTGTGTCC)
• File input harus di save sebagai plain text (TXT)or ASCII format. Clustal X tidak mengenali microsoft word format
File input yang
memiliki format FASTA
Plain Text dgn
Notepad (window)
PROGRAM CLUSTAL X
Setting the Alignment Parameters• Clustal X membutuhkan pengaturan
penalti gap (Gap Opening dan Gap Extension).
• Gap opening penalti =10 dan gap extension penalti =0.10.
• Decreasing the gap penalties will allow the introduction of more gaps and will thus produce fewer mismatches in the alignment
• Increasing the gap penalties will have the opposite effect
• Perubahan alignment parameters diperlukan untuk meningkatkan hasil alignment
Weight Matrix Parameters• Terdiri dari Protein or DNA Weight Matrix • DNA weight matrix = maximize score untuk matching residue
(A,C,TG); low or zero scores untuk mismatching residues.• IUB DNA Weight matrix : score matches =1.9 dan mismatches
=0• Protein weight matrix lebih kompleks karena asam amino
memiliki propertis physicochemical yang berbeda untuk setiap residue.
• Amino acids scoring matrices : PAM, BLOSUM, Gonnet matrices.
Protein WM
DNA WM
Output Format• Format File output dari
ClustalX dapat dibaca oleh Phylip, PAUP, MrBayes.
• Pilihan format tergantung dari program apa yang akan untuk analisis lebih lanjut (Methode untuk konstruksi pohon antara lain Distance/Neighbor Joining, Maximum Parsimony, Max Likelihood, Bayesian
Klik Nexus Format untuk penggunaan program PAUP &
MrBayes
Membangun Alignment• Dimulai dengan load
sequences dari file input yang dapat dikenali oleh Clustalx (farmat FASTA or TXT)
Do Complete Alignment
Refining & Improving the Alignment
• No matter how unrelated the sequencess are ClustalX will always generate an alignment
• Fine Tuning Alignment :– Eliminate truncated sequences (N
terminal & c terminus region)– Delete nonhomologous region from the
sequences– Change the gap penalties
Fine-Tuning Alignment
• Quality of sequence alignment is important
• ClustalX menawarkan beberapa tool untuk membantu refine dan peningkatan alignment
• ClustalX tools : is the histogram displayed below the alignment. (tinggi setiap bar menunjukkan similarity karakter residues
Terima Kasih