Download ppt - HANDLING DATA DNA & CLUSTAL X

HANDLING DATA DNA & CLUSTAL X

Adi Pancoro

([email protected])

Dari Mana Data DNA Diperoleh ?1. Melakukan sekuensing DNA (hasil PCR - amplifikasi DNA template dengan spesifik primer- i.e ITS etc), Cloning produk PCR dalam plasmid dan melakukan sekuensing DNA dengan mesin sekuenser)

2. Mendapatkan sekuensing DNA lain yang mirip/dekat (related sequences) dengan sekuensing DNA yang dimiliki & Mendapatkan related sequences melalui NCBI gen bank (Go to BLAST site)

BLAST

Pilih BLASTN (nucleotide-

nucleotide BLAST)

http://www.ncbi.nlm.nih.gov/

HASIL BLAST

Score (Bits) = nilai tertinggi & E (expectation) value =

mendekati 0.0 (nol)

Urutan DNA/protein yg ingin dicari kemiripannya

DISPLAY FASTA FORMAT

Contoh format FASTA, diawali dengan tanda

bracket (>)

HASIL ENTREZ (ALL DATABASES)

Input keyword gen

Output jumlah gen linamarase

yg terdapat pada gen bank

Output ditampilkan

dalam bentuk format FASTA

Pilih file TXT

SEQUENCE ALIGNMENT

1. Is the process of aligning two sequences and its the basis of database similarity searching

2. Evolutionary Basis : DNA and proteins are products of evolution

3. Molecules (DNA & protein) can be considered molecular fossils that encode the history of millions if years of evolution

4. Comparing sequences through alignment, patterns of conservation and variation can be identified.

5. The degree of sequence conservation in the alignment reveals evolutionary relatedness of different sequences.

6. The variation between sequences reflects the changes that have occurred during evolution in the form of substitutions, insertions, and deletions

Bagaimana membangun pohon filogenetika ?

• Data2 sekuensing yang diperoleh dilakukan align the sequences ( penjajaran urutan DNA) – pairwise/multiple alignment, mengunakan program CLUSTAL X. Hasil multiple alignment kadang-kadang masih diperlukan eyes correction (Fine-Tuning alignment)

• Hasil alignment di pakai untuk membangun pohon filogenetika dengan PAUP, Phylip or MrBayes program

• Visualisasi pohon filogenetika dengan TreeView program

Bagaimana Membangun Multiple Alignment ?

• Dua atau lebih sekuensing DNA dilakukan alignmnent• Di dalam melakukan multiple alignment akan

memunculkan gap (spaces). • Adanya gap (spaces) diasumsikan adanya insersi or

delesi pada urutan DNA tsb• Banyak dan sedikitnya gap dalam alignment

menentukan kualitas dari hasil alignmnet • Gap penalty =scoring system yang dipakai (jika match

diberi scoring positif dan tidak match diberi scoring negatif (match residue =1 dan mismatch residue =0).

• Program ClustalX salah satu tools terbaik/direkomendasi untuk membangun multiple alignment

Bagaimana membangun file input• Clustal X membutuhkan data memiliki format data (file input) yang

dikenali.• File input harus memiliki urutan2 DNA yang akan dilakukan

alignment• Clustal akan mengenali beberapa format urutan DNA (contoh FASTA

format). Fasta format mudah dikenali karena pada baris pertama dimulai dengan “>” karakter (> species ACTGTGTGTGTGTGTCC)

• File input harus di save sebagai plain text (TXT)or ASCII format. Clustal X tidak mengenali microsoft word format

File input yang

memiliki format FASTA

Plain Text dgn

Notepad (window)

PROGRAM CLUSTAL X

Setting the Alignment Parameters• Clustal X membutuhkan pengaturan

penalti gap (Gap Opening dan Gap Extension).

• Gap opening penalti =10 dan gap extension penalti =0.10.

• Decreasing the gap penalties will allow the introduction of more gaps and will thus produce fewer mismatches in the alignment

• Increasing the gap penalties will have the opposite effect

• Perubahan alignment parameters diperlukan untuk meningkatkan hasil alignment

Weight Matrix Parameters• Terdiri dari Protein or DNA Weight Matrix • DNA weight matrix = maximize score untuk matching residue

(A,C,TG); low or zero scores untuk mismatching residues.• IUB DNA Weight matrix : score matches =1.9 dan mismatches

=0• Protein weight matrix lebih kompleks karena asam amino

memiliki propertis physicochemical yang berbeda untuk setiap residue.

• Amino acids scoring matrices : PAM, BLOSUM, Gonnet matrices.

Protein WM

DNA WM

Output Format• Format File output dari

ClustalX dapat dibaca oleh Phylip, PAUP, MrBayes.

• Pilihan format tergantung dari program apa yang akan untuk analisis lebih lanjut (Methode untuk konstruksi pohon antara lain Distance/Neighbor Joining, Maximum Parsimony, Max Likelihood, Bayesian

Klik Nexus Format untuk penggunaan program PAUP &

MrBayes

Membangun Alignment• Dimulai dengan load

sequences dari file input yang dapat dikenali oleh Clustalx (farmat FASTA or TXT)

Do Complete Alignment

Refining & Improving the Alignment

• No matter how unrelated the sequencess are ClustalX will always generate an alignment

• Fine Tuning Alignment :– Eliminate truncated sequences (N

terminal & c terminus region)– Delete nonhomologous region from the

sequences– Change the gap penalties

Fine-Tuning Alignment

• Quality of sequence alignment is important

• ClustalX menawarkan beberapa tool untuk membantu refine dan peningkatan alignment

• ClustalX tools : is the histogram displayed below the alignment. (tinggi setiap bar menunjukkan similarity karakter residues

Terima Kasih