67
Pengertian dan Ruang Lingkup Bioinformatik

Pengertian dan Ruang Lingkup Bioinformatik - …staff.unand.ac.id/jamsari/wp-content/uploads/sites/145/2017/05/... · Pengertian dan Ruang Lingkup Bioinformatik. ... •Berbagai kondisi

Embed Size (px)

Citation preview

Pengertian dan Ruang Lingkup

Bioinformatik

Pengertian:

• Aplikasi teknologi informasi dalam bidang biologi molekuler

• Istilah Bioinformatik pertama kali dikemukakan oleh: Paulien Hogeweg (1979).

• Digunakan dalam bidang genomik dan genetika khususnya aplikasi untuk analisis sekuens DNA dalam jumlah besar

Ruang lingkup:

• Saat ini mencakup juga aktifitas

pembuatan dan pemutakhiran

database, algorithme,

komputasional dan teknik statistik,

dan teori untuk memecahkan

persoala-persoalan manajemen

data-data percobaan biologis.

Aktifitas Bioinformatik

• Mapping (pemetaan) DNA dan

kromosom

• Analisis sekeuens DNA dan Protein

• Alligning (penjajaran) sekuens DNA

dan protein yang berbeda untuk

membandingkannya

• Pembuatan dan visualisasi model 3

dimensi struktur protein

Tujuan Utama

• Meningkatkan pemahaman kita

tentang proses-proses biologis

Fokus Kegiatan

Pengembangan dan aplikasi teknik-

teknik komputasional:

pattern recognition (pengenalan

pola), data mining (penambangan

data), machine learning

algorithms, and visualization

(visualisasi)

Aktifitas penelitian Bioinformatik

• sequence alignment (penjajaran sekuens),

• gene finding (pencarian gen),

• genome assembly (assembling genom),

• protein structure alignment(penjajaran struktur protein),

• protein structure prediction(prediksi struktur protein),

Annotation (Anotasi)

• Perhitungan dalam upaya men-

cari gen untuk menemukan

gen-gen pengkode protein, gen-

gen RNA, and sekuens fungsio-

nal lainnya didalam genom

Tidak semua sekuen nukleotid bersifat

fungsional = Junk DNA

Junk DNA (DNA sampah)

• Sebagian besar DNA di dalam genom tidak memiliki fungsi yang jelas.

• Bioinformatik membantu menjembatani antara genomik dan proteomik dalam penggunaan sekuens DNA untuk identifikasi protein.

Anotasi

• Proses penandaan gen-gen dan

karakteristik biologis lain pada level

sekuens DNA.

• Sistem software pertama: Dr. Owen

White (1995): The Institute for

Genomic Research

• Sekuens pertama: Haemophilus

influenzae

Computational evolutionary biology

• Kajian asal-usul dan keturunan spesies dan perubahannya sepanjang waktu.

• Menjejaki evolusi populasi organisme dengan mengukur perubahan DNA dibandingkan: physical taxonomy or observasi physiologis

• Perbandingan keseluruhan genomes, memungkinkan studi gene duplication, horizontal gene transfer, dan prediksi factor-faktor penting dalam spesiasi,

• Modeling prediksi populasi masa depan

• Pencarian dan pembagian informasi spesies dan organsime berbasis DNA.

Analisis Ekspresi Gen

• Level mRNA melalui berbagai teknik:

• microarrays,

• expressed cDNA sequence tag (EST)

sequencing,

• serial analysis of gene expression

(SAGE) tag sequencing,

• massively parallel signature sequencing

(MPSS), or

• Aplikasi multiplexin-situ hybridization

Analisis Ekspresi Gen

• Bias and Noise

• Bioinformatik memisahkan bias

dan nois

Regulasi Gen

• Regulasi gen adalah kejadian orkestra kompleks yang dimulai dengan sinyal ekstraselluler seperti hormon, nutrisi (ion-ion) yang mengarah kepada peningkatan atau penurunan aktifitas satu atau beberapa protein.

Regulasi Gen

• Promoter analysis: identifikasi dan studi motif sequence di sekitar daerag pengkode suatu gen

• Motif tersebut mempengaruhi ke arah mana proses transkripsi menjadi mRNA.

• Data ekspresi digunakan untuk memperkirakan regulasi gen

• Perbandingan dengan data microarraydapat memperkirakan gen-gen yang terlibat dalam proses regulasi gen.

Regulasi Gen

• Pada organisme sel tungga, dapat digunakan untuk mempelajari siklus sel,

• Berbagai kondisi stress (heat shock, starvation, etc.) dapat dipelajari gen-gen apa saja yang terlibat.

• Data Clustering algorithms dapat memperkirakan gen-gen yang bersifat co-expressi

• Dapat digunakan untuk memperlkiarkan regulatory elements.

Analysis of protein expression

• Protein microarrays (PM) dan high throughput (HT) mass spectrometry(HTMS) dapat memperkirakan protein-protein yang terdapat dalam sampel biologis.

• PM dan HTMS, problem identifikasi yang kompleks, statistik yang rumit, serta ketidaksempurnaan ikatan peptida protein.

Analisis Mutasi Kasus Kanker

• affected cells are rearranged in complex or even unpredictable ways.

• Massive sekuensing data are produced

• Kompleksitas analisis dan manajemen data

• oligonucleotide microarrays to identify chromosomal gains and losses (called comparative genomic hybridization), and single nucleotide polymorphism arrays to detect known point mutations

• Ratusan ribu sisi sepenjaang genome harus dianalisis, menghasilkan terabytes data per experiment.

Prediksi struktur protein

• Struktur primer protein (primary structure) dapat ditentukan dari sekuens asam amino.

• Struktur primer protein akan menentukan fungsi dari protein.

• Homologi bisa dipergunakan untuk memprediksi struktur protein yang belum diketahui, contoh:hemoglobin pada manusia dan hemoglobin in legumes (leghemoglobin) berfungsi dalam transportasi oksigen, keduanya memiliki struktur protein yang sama meskipun sekuens asam aminonya berbeda.

Comparative Genomics

• Korespondensi antara beberapa gen (analisis orthologus) pada organisme berbeda.

• Analisis divergensi dua genome atau lebih

• Level paling bawah point mutations

• Segmen kromosomal: duplication, lateral transfer, inversion, transposition, deletion and insertion

Software dalam Bioinformatik

• BLAST, algoritma untuk penentuan similaritas sekuens random dengan sekuens yang lain yang biasanya terdapat dalam database baik DNA ataupun protein.

• BLAST dapat digunakan untuk melakukan allignment sekuens.

• NCBI : National Center for Biotechnology Information.

Allignmen/Penjajaran sekuens

(Sequence allignment)

Sequence alignment: penyusunan

sekuens-sekuens baik, DNA, RNA,

atau protein untuk mengidenti-

fikasi daerah-daerah yang sama

yang kemungkinan memiliki

hubungan fungsional, struktural

ataupun evolusi.

• Sekuens nucleotide atau amino

acid yang dijajarkan dalam

bentuk baris pada suatu

matriks.

• Gaps disisipkan diantara

residues sehingga karakter

yang identik ataupun sama

berada pada kolom yang sama.

Key: Single letters: amino acids.

• Red: small, hydrophobic, aromatic, not Y. Blue:

acidic.

• Magenta: basic.

• Green: hydroxyl, amine, amide, basic.

• Gray: others.

• "*": identical.

• ":": conserved substitutions (same colour group).

".": semi-conserved substitution (similar shapes).

Kode genetik (kodon), asam amino dan

lambang tiga serta satu hurufAla/A GCU, GCC, GCA, GCG Leu/L UUA, UUG, CUU, CUC, CUA,

CUG

Arg/R CGU, CGC, CGA, CGG,

AGA, AGG

Lys/K AAA, AAG

Asn/N AAU, AAC Met/M AUG

Asp/D GAU, GAC Phe/F UUU, UUC

Cys/C UGU, UGC Pro/P CCU, CCC, CCA, CCG

Gln/Q CAA, CAG Ser/S UCU, UCC, UCA, UCG, AGU,

AGC

Glu/E GAA, GAG Thr/T ACU, ACC, ACA, ACG

Gly/G GGU, GGC, GGA, GGG Trp/W UGG

His/H CAU, CAC Tyr/Y UAU, UAC

Ile/I AUU, AUC, AUA Val/V GUU, GUC, GUA, GUG

START AUG STOP UAA, UGA, UAG

Jenis allignment

• Global alignments: penjajaran

antara sekuens yang dimiliki

secara keseluruhan.

• Local alignments: identifikasi

daerah yang sama didalam

sekuens yang panjang yang

biasanya mengalami divergensi.

Global dan lokal allignment

Global allignment

Lebih cocok digunakan untuk:

• Allignment dimana set query

memiliki tingkat kesamaan yang

tinggi

• Memiliki ukuran yang hampir

sama

• Mengunakan:Needleman-Wunsch

algorithm, berbasis dynamic

programming

Local alligment

• Lebih cocok untuk sekuens dimana

memiliki banyak ketidaksamaan,

• Ada daerah tertentu disepanjang

sekuens yang memiliki kesamaan

didalamnya

• Menggunakan Smith-Waterman

algorithm berbasis dynamic

programming

Global dan local allignment

• Jika sekuens yang dianalisis

memiliki tingkat kesamaan yang

tinggi maka tidak ada perbedaan

antara local allignment dan

global allignment.

Multiple sequence alignment

• Perluasan dari pairwise alignment yang memungkinkan analisis lebih dari dua sequences sekaligus.

• Digunakan untuk mengidentifikasi daerah konservatif dari kelompok sekuens yang diduga berkerabat.

• Mengidentifikasi informasi struktural dan mechanistic sisi active dari enzymes.

• Membantu menyusuna hubungan evolutionari dalam penyusunan pohon phylogenetic

Homology

• Kesamaan karakteristik dari

beberapa organisme dikarenakan

asal-usul yang sama.

• Dalam konteks genetika, homologi

mengacu kepada kesamaan sekuens

DNA

Orthologs

• Orthologs/ gen orthologous: gen-gen

pada spesies yang berbeda yang sama

karena berasal dari tetua yang sama

• Ortologus muncul karena ada

divergensi dalam konteks evolusi.

• Divergensi mengarah pada

pembentuka spesies baru

(spesiasi=speciation)

Paralogous

• Paralogous (paralog) homologi

antara dua sekuens gen yang

terbentuk karena peristiwa

duplikasi gen (gene duplication).

• Suatu gen dalam satu organisme

mengalami duplikasi dan

menempati posisi berbeda pada

genom sel yang sama, maka kedua

kedua gen tersebut bersifat paralog.

Gen-gen Paralog

Contoh-contoh gen paralog:

• Myoglobin and hemoglobin

• Empat kelas hemoglobin:

(hemoglobin A, hemoglobin A2,

hemoglobin B, dan hemoglobin F).

• Fungsi: transportasi oksigen,

hemoglobin F pada fetal memiliki

affiniti lebih kuat dibandingkan

kelas lainnya.

Ohnologous

• Ohnologous: gen-gen paralogous

yang berasal dari duplikasi genom

secara keseluruhan (whole-

genome duplication :WGD).

• Istilah ohnologus diberikan

sebagai penghargaan terhadap

Susumu Ohno oleh: Ken Wolfe

Xenologs

• Homologi yang dihasilkan dari

proses transfer gen horizontal

(mikroba) antara dua organisme.

• Xenologs dapat menyebabkan

fungsi kedua gen berbeda, jika

lingkungan organisme akseptor

sangat jauh berbeda.

Kromosom Homolog

• Kromosom Homologous : kromosom non identik yang dapat berpasangan/bersinapsis selama meiosis.

• Kecuali kromosom kelamin, kromosom homolog memiliki kesamaan sekuens yang sangat tinggi disepanjang kromosomnya.

• Mengandung gen-gen yang sama sekuensnya sehingga memungkinkan saat meiosis untuk berpasangan.

Gene Finding

• Kegiatan identifikasi secara

algorithmik terhadap sekuens DNA

(genomic DNA) yang diduga memiliki

fungsi secara biologis.

• Meliputi identifikasi: gen-gen

pengkode protein, dan elemen

fungsional lainnya seperti gen-gen

pengkode RNA (tRNA, rRNA) dan

daerah regulator.

Gene finding

• Penentuan fungsi suatu gen dan

produknya harus dibedakan

dengan penentuan sekuens-

sekuens fungsional.

• Fungsi suatu gen hanya dapat

ditentukan melalui eksperimen in-

Vivo seperti gene knockout atau

metode lainnya.

Beberapa pendekatan

• Pendekatan Ekstrinsik (evidence

based)

Target sekuens dibandingkan dengan

sekuens yang mRNA atau produk

proteinnya telah diketahui.

• Tingkat kesamaan yang tinggi dengan

mRNA atau produk protein indikasi

kuat bahwa sekuen target adalah gen

pengkode protein.

Beberapa pendekatan

• Dibutuhkan informasi sekuens

mRNA yang sangat besar (organisme

kompleks)

• Kelemahan pada organisme yang

kompleks, tidak semua gen

berekspresi pada setiap saat.

• Gen-gen yang hanya berekspresi

pada saat fetus tidak bisa dianalisis

secara bebas dengan alasan etika.

Pendekatan Ekstrinsik

• RefSeq database: mengandung

sekuens transkrip dan protein dari

berbagai species

• Ensembl database memetakan

berbagai data sekuens pada

manusia.

Pendekatan Ab initio

• Sekuens fungsional ditentukan

secara sistematis

• Penentuan terhadap komponen

sinyal sekuens (promoter) atau

Protein coding sekuens (ORF), serta

stop kodon

• Lebih mudah pada sekuens

prokaryot

Pendekatan Ab initio eukaryot lebih

kompleks

• Pertama: sekuens promoter dan

regulator lebih kompleks dan baru

sedikit difahami dibandingkan dengan

prokaryot sehingga sulit dikenali.

• Kedua, mekanisme splicing yang

disebabkan oleh adanya sekuens

exons, dan introns.

Gene finder untuk pro-

eukaryot

• Model untuk pro- eukaryot :

• Kompleks probabilistic models, (hidden

Markov models)

• GLIMMER, GeneMark : prokaryot

• GENSCAN and GENEID: eukaryot

• mSplicer, CONTRAST, atau mGene

• SLAM, SGP and Twinscan/N-SCAN:genome

comparison

• Projector, GeneWise and GeneMapper

A Adenosine W A T (Weak interaction)

C Cytosine B G T C (not A) (B comes after A)

G Guanine D G A T (not C) (D comes after C)

T Thymidine H A C T (not G) (H comes after G)

U Uracil VG C A (not T, not U) (V comes

after U)

R G A (puRine) N A G C T (aNy)

Y T C (pYrimidine) W A T (Weak interaction)

K G T (Ketone) X masked

M A C (aMino group) - gap of indeterminate length

S G C (Strong interaction)

Simbol Nukleotid

Motif sekuens

• Motif sekuens: pola suatu sekuen nukleotida atau asam amino yang dianggap memiliki fungsi biologis penting.

• Motif sekuens motif pada protein harus dibedakan dengan motif struktural yang dibentuk oleh penyusunan tiga dimensi asam amino.

Primer Designing

• Manual

• Software based designing

Primer Designing

Mendisain Primer Manual

Primer yang ideal :

1.Memiliki panjang sekitar 15-35 nukleotid

2.Memiliki titik didih yang relatif tinggi

3.Sekuens primer hanya hadir satu kali pada

templet DNA

4.Tidak berkomplementer dengan primer

pasangannya

5.Tidak membentuk struktur sekunder

dengan primer pasangannya

6.Memiliki proporsi GC dan AT yang

seimbang

7.Primer pasangannya memiliki titik didih

yang relatif sama

Dr. Jamsari, Prog. Studi Pemuliaan Tanaman Jurusan BDP-FPUA

Bioteknologi Tanaman

Tm = ((G+C) x 4°C) + ((A + T) x 2°C).

Suhu Annealing

CATAAGTCTGATACTTGCTG

Contoh:

suhu annealing sekitar 54-58°C

PCR

dimana:

jumlah basa C = 4, G = 4, A = 5, T = 7,

maka besarnya Tm adalah:

Tm = ((4+4)x4) + ((5+7)x2) = 32 + 24 = 56°C

Software based designing

• Oligos V. 3.0

• Universitas di Helsinki,

Finlandia (Kalendar, 2002 )

Oligos ©

http://www.ncbi.nlm.nih.gov/tools/primer-blast/

http://biotools.umassmed.edu/bioapps/primer3_www.cgi

Primer3: WWW primer tool