34. Memanfaatkan Database

Embed Size (px)

Citation preview

  • 34

    Memanfaatkan database Nukleotida

    untuk Analisa Genetika Identifikasi sekuens basa nukleotida di database DNA (genebank)

    Perkembangan yang cepat sedang terjadi dalam pendataan sekuen DNA dari berbagai spesies, yang diakumulasi dalam 3 pusat database DNA yaitu; GenBank, DDBJ dan EMBL. Jumlah total basa nukleotida yang masuk ke dalam tiga pusat data sampai bulan Februari 2004 adalah 36.804.145.885 base pair dari 3.188.754 entries dengan rata-rata peningkatan per tahun masing-masing adalah 54% dan 42%. Jumlah basa nukleotida yang masuk ke dalam pusat data DNA menunjukkan nilai peningkatan yang lebih besar dibandingkan jumlah entries karena terdapat perbaikan metode dalam melakukan analisa basa nukleotida menjadi lebih efisien dalam perhitungan waktu dan biaya. Selain itu, analisa basa nukleotida gen pada akhir dekade ini lebih ditekankan pada usaha untuk memetakan genom secara lengkap (genome project) karena terdapat keterkaitan satu jenis gen dengan gen yang lain untuk membentuk suatu jaringan fungsi

    yang komplek di dalam tubuh mahkluk hidup. Kemajuan dan peningkatan jumlah data yang telah diidentifikasi oleh para peneliti selalu meningkat dari waktu ke waktu. Hal ini disebabkan adanya perbaikan metode, teknologi dan alat yang digunakan dalam melakukan analisa biologi sehingga analisa penelitian biologi molekuler di tingkat laboratorium menjadi lebih efektif dan efisien. Perbaikan-perbaikan ini ditunjukkan dengan semakin sedikit waktu dan biaya yang diperlukan untuk melakukan identifikasi gen pada suatu organisme. Sebagai contoh salah satu

    Ditulis bersama A. Yunan Arifin, untuk pelatihan di PAU Hayati IPB

  • perusahaan bioteknologi di Amerika mampu melakukan identifikasi gen secara lengkap pada suatu jenis bakteri dalam waktu satu minggu. Selain itu terdapat penurunan biaya yang diperlukan dalam identifikasi sekuen basa nukleotida dimana pada tahun 1976 diperlukan biaya $100 untuk mengidentifikasikan 1 sekuen basa nukleotida sedangkan pada saat ini biaya rata-rata yang diperlukan hanya $0,1.

    Genbank merupakan salah satu wadah bagi para peneliti untuk mempublikasikan sekuen basa nukleotida dan protein sebagai hasil proses translasi basa nukleotida yang ditemukan melalui kerja di laboratorium. Genbank saling bekerjasama memberikan informasi sekuen terbaru dengan dua pusat database yang lain yaitu European Molecular Biology Laboratory (EMBL) yang didirikan oleh European Bioinformatics Institute (EBI) dan the DNA Data Bank of Japan (DDBJ). Berdasarkan jenis dan asal sekuen basa yang didapatkan oleh para peneliti, data-data di GenBank dikelompokkan menjadi 17 pengelompokan data. Tabel 1 menunjukkan pengelompokaan data dan jumlah basa nukleotida per 20 Juni 2004.

    Tabel 2. Pengelompokan dan jumlah data di GenBank per 20 Juni 2004.

    Jenis Data Jumlah Entries Jumlah Basa Nukleotida

    Expressed Sequence Tags (EST)

    22.165.266 (51,4%)

    10.888.534.362(25,95%)

    Genome Survey Sequence(GSS)

    8.479.437 (19,66%)

    3.858.048.792 (9,19%)

    Patent sequence entries (PAT)

    2.111.478 (4,89%)

    1.179.198.283 (2,81%)

    Sequence tagged site (STS)

    305 (0,00%) 137.895.352 (0,0032%)

    High throughput genomic(HTG)

    125.876 (0,0029%)

    11.914.387.988 (28,4%)

    High throughput cDNA (HTC)

    139.454 (0,00323%)

    225.384.985 (0,0053%)

    Sekuen Unannotated (UNA)

    1.275 (0,000295%)

    556.739 (0,00%)

    Bakteria (BCT) 170.323 (0,00394%)

    809.545.993 (1,92%)

    Invertebrata (INV) 211.467 686.397.566 (1,63%)

  • (0,0049%)

    Mamalia (MAM) 59.260 (0,000137%)

    81.257.081 (0,0019%)

    Bakteriophage (PHG) 2.496 (0,00%) 12.447.866 (0,0002%)

    Tumbuhan, jamur & alga(PLN)

    413.476 (0,0095%)

    1.140.673.897 (2,71%)

    Primata (PRI) 310.459 (0,0071%)

    4.297.938.783 (1,024%)

    Rodensia (ROD) 45.679 (0,001%) 1.983.452.869 (4,72%)

    Vertebrata (VRT) 446.795 (0,01%) 856.893.977 (2,04%)

    Sekuen Sintetik (SYN) 11.469 (0,00026%)

    19.561.755 (0,0004%)

    Total 43.120.634 41.950.675.252

    Pusat database GenBank berisikan sekuen basa nukleotida

    sebagai data utama dengan memberikan data base pendukung untuk memberikan informasi tambahan dari sekuen basa nukleotida tersebut. Gambar 1. menunjukkan pengelompokan database pendukung bagi sekuen basa nukleotida yang tersimpan di dalam GenBank.

    GenBank

    Database Nukleotida Database Genom Database Taksonomi Database Struktur Database Protein Database Ekspresi

    NUCLEOTIDE EST -MGC GSS -PopSet SNP -RefSeq STS -Trace Archieve HomoloGene -UniGene MGC -UniSTS

    Domains Proteins RefSeq

    Domains 3D Domains MMDB

    Taxonomy Cancer Chromosome

    Gene Genomes LocusLink COGs

    GEO Geo Datasets

    SAGE

    1

    3

    1

    5 6 4 2

    6 5 4 3 2

    1

  • Keterangan: - Pembagian menu dari pengelompokkan masing-masing database

    Gambar 1. Pengelompokan Database Pendukung dan Menu di dalam

    Database bagi Sekuen Basa Nukleotida di GenBank.

    Langkah awal untuk melakukan pencarian sekuen basa

    nukleotida dilakukan dengan membuka salah satu pusat database utama yaitu GenBank via internet. Penelusuran dilakukan melalui situs web www.ncbi.nih.nlm.gov. Gambar 2 menunjukkan tampilan situs GenBank tersebut.

    Gambar 2. Tampilan situs GenBank.

    1 6

  • Langkah kedua dalam melakukan pencarian sekuen basa nukleotida gen dan atau nongen dilakukan dengan memilih nucleotide menu search. Setelah masuk ke dalam menu nucleotide maka dilakukan pengisian kata kunci (keyword) dalam menu tersebut. Pngisian keyword dapat dilakukan berdasarkan:

    Informasi nama gen atau nongen dari jurnal yang ada di GenBank (PubMed)

    Nama gen dan atau nongen

    Nomor akses (accession number) untuk suatu jenis gen atau nongen tertentu

    Nama penemu dari sekuen tersebut

    Menu PubMed diperoleh dengan mengubah pilihan menu pada kotak menu search. Gambar 3 menunjukkan tampilan menu PubMed di layer computer.

    PubMed berisikan tentang artikel-artikel pendukung bagi sekuen basa dan protein yang ada di GenBank sehingga artikel-artikel

  • tersebut dapat digunakan untuk mengetahui atau mengidentifikasi jenis dan nama-nama gen yang ada pada suatu organisme. Contoh: identifikasi jenis dan nama gen yang berpengaruh terhadap produksi daging di ternak sapi maka ketik beef gene in bos Taurus sebagai kata kunci di dalam pencarian artikel dalam PubMed. Hasil pencarian PubMed akan memberikan berbagai alternative artikel yang menyebutkan jenis dan nama gen tertentu yang berpengaruh terhadap produksi daging di ternak sapi. Nama gen tersebut akan digunakan sebagai kata kunci (keyword) dalam pencarian sekuen basa nukleotida di menu nucleotide. Langkah ketiga adalah masuk ke dalam menu nucleotide dengan mengubah menu search sesuai criteria tersebut. Gambar 4 menunjukkan tampilan menu nucleotide di layer computer.

    Gambar 4. Tampilan Menu Nucleotide

    Tahap keempat adalah ketik kata kunci (keyword) ke dalam menu search nucleotide for. Contoh dalam kasus ini adalah gen yang berpengaruh terhadap produksi daging di ternak sapi yaitu growth

  • hormone. Gambar 5 menunjukkan sekuen gen growth hormone di ternak sapi.

    Gambar 5. Tampilan Sekuen Gen

    Identifikasi jenis primer dan ensim restriksi untuk analisa PCR Polymerase Chain Reaction-Restriction Frame Length Polimorfism (PCR-RFLP) merupakan suatu metode penggandaan atau perbanyakan DNA target dalam suatu thermocycler. DNA target ditentukan oleh pengapit yaitu primer forward dan reverse sehingga hanya sekuen diantara kedua primer tersebut yang akan mengalami reaksi penggandaan atau perbanyakan DNA. Setelah DNA mengalami reaksi penggandaan di dalam suatu thermocycler maka dilakukan uji untuk mengetahui keadaan DNA sebagai hasil reaksi PCR. Hal ini perlu dilakukan untuk mengetahui ketepatan penempelan primer diantara DNA target sehingga

  • menghasilkan produk pengandaan DNA yang tepat dan mengetahui keberadaan mutasi dalam DNA target. Uji ini dapat diketahui dengan menggunakan enzim restriksi yang ditambahkan setelah DNA target mengalami reaksi PCR di dalam suatu thermocycler. Enzim restriksi bekerja dengan cara memotong DNA target jika menemukan urutan basa nukleotida tertentu (kira-kira 6 basa) di dalam DNA target tersebut. Hasil pemotongan enzim restriksi menunjukkan ketepatan pemilihan DNA target oleh kedua primer dan menganalisa keberadaan mutasi dari hasil pemotongan enzim testriksi tersebut. Secara umum, komponen-komponen yang dibutuhkan dalam suatu reaksi PCR-RFLP adalah sebagai berikut:

    DNA

    Enzim Tag polymerase DNA

    Deoxynucleoside triphosphat (dNTP)

    Larutan penyangga (buffer)

    Primer forward dan reverse

    Enzim restriksi

    Komponen-komponen PCR tersebut merupakan suatu paket untuk melakukan reaksi PCR tetapi terdapat perkecualian pada primer dan enzim restriksi. Penentuan jenis primer dan enzim restriksi disesuaikan dengan kondisi urutan basa nukleotida diantara dan di dalam DNA target. Hal ini menunjukkan bahwa jika terdapat perbedaan DNA target yang ingin dicapai oleh para peneliti maka jenis primer dan enzim restriksi yang digunakan juga berbeda-beda.

    Desain Primer

    Primer merupakan salah satu bahan yang digunakan dalam proses perbanyakan untai DNA dengan menggunakan metode Polymerase Chain Reaction (PCR). Desain primer dilakukan untuk membuat untaian basa nukleotida yang akan menempel dan mengapit daerah untaian DNA tertentu dari total genom yang ada pada kromosom. Pengapitan daerah untaian DNA diperlukan untuk melakukan perbanyakan (amplifikasi) hanya pada daerah untaian DNA tertentu sehingga lebih mudah dalam melakukan analisis terhadap daerah untai DNA tersebut. Keberhasilan melakukan amplifikasi daerah untai DNA sangat dipengaruhi oleh kecocokan primer terhadap kondisi untai DNA target.

  • Desain primer dilakukan dengan mempertimbangkan kodisi optimum PCR sesuai dengan kondisi target DNA yang akan dituju dan kondisi peralatan yang ada di dalam laboratorium. Desain primer dapat dilakukan dengan menggunakan program Primer3 yang dapat di akses melalui internet. Akses dilakukan melalui situs www.-genome.wi.mit.edu/cgi-bin/primer/primer3.cgi/cgi. Gambar 6 menunjukkan tampilan situs Primer3 di layar computer.

    Gambar 6. Tampilan Program Primer3. Primer3 menyediakan berbagai kotak menu yang berisikan

    berbagai alternative pilihan untuk mengkondisikan primer yang dihasilkan sesuai dengan criteria para peneliti. Dibawah ini terdapat pemilihan criteria yang umum/lazim digunakan oleh beberapa peneliti:

    Minimum suhu annealing (Tm): 50

    Maximum Tm: 60

    Maximum Tm difference: 2

    Minimum GC content: 50

    Maximum GC content: 60 Selain kotak menu diatas, pemilihan alternative pada kotak

    menu dapat diabaikan (tidak dilakukan perubahan sesuai nilai alternative yang ada pada tampilan program Primer3). Hal ini kondisi tersebut sudah berlaku umum sesuai standar di berbagai laboratorium.

    Primer3

    Pick PCR primers from nucleotide sequence (string of ATGCN, upper or lower case; other non-whitespace letters are

    treated as 'N'). This is a local copy of the Primer3 page available at the MIT Whitehead Institute!

    Paste source sequence below:

    Pick Primers Clear Form

    Per-Sequence Inputs

    Included Region:

    Target:

    Excluded Region:

    Global Parameters

  • Setelah sekuen basa nukleotida (DNA target) dimasukkan ke dalam kotak menu dalam program Primer3 maka klik pick primer untuk mendapatkan primer yang akan mengapit DNA target yang akan di analisa oleh peneliti. Gambar 6 menunjukkan hasil primer forward dan reverse yang akan mengapit DNA target.

    Gambar 6. Tampilan Hasil Primer

    Jika program Primer3 tidak dapat memberikan keluaran

    (output) primer maka modifikasi dapat dilakukan dengan menurunkan interval jumlah sekuen pada kotak menu product size sehingga program Primer3 dapat mencari daerah penempelan primer yang baru.

    Desain Enzim Restriksi

  • Identifikasi homologi gen dilakukan dengan membuka situs www.firstmarket.com/cutter/cut2.html. Gambar 7 menunjukkan tampilan program webcutter yang akan digunakan untuk memilih atau mendesign enzim restriksi sesuai dengan DNA target yang akan dianalisa oleh peneliti.

    Gambar 7. Tampilan program Webcutter.

    Webcutter menyediakan beberapa kotak menu yang dapat

    diisi sesuai dengan criteria para peneliti. Kotak-kotak menu tersebut adalah bentuk sekuen DNA target (linier, sirkuler atau silent mutant), jumlah pemotongan enzim yang sama di dalam DNA target (tempat pemotongan satu atau lebih) dan jumlah basa yang dipotong (enzim restriksi memotong sesuai dengan urutan dan jumlah basa tertentu.

  • 4. Identifikasi homologi sekuens basa nukleotida berbasis BASIC LOCAL ALLIGNMENT SEQUENCE TOOLS (BLAST)

    Identifikasi homologi gen dilakukan dengan membuka situs Pusat Bioinformatik pada Universitas Kyoto dengan akses www.GenomeNet.com. Gambar 8 menunjukkan tampilan program BLAST di layer computer.

    Gambar 8. Tampilan program BLAST

    Identifikasi homologi gen dilanjutkan dengan memilih

    BLASTN pada menu comparison for dan memilih GenBank pada menu select the program below or use. Penulisan sekuen gen dilakukan dengan memindahkan sekuen basa nukleotida sesuai dengan jenis intron dan exon yang telah didapatkan dari pusat database ke dalam kotak dialog BLAST, kemudian klik exec. Kemudian sekuen basa yang akan dihomologikan, dimasukkan ke dalam kotak menu

  • sequence below. Gambar 9 menunjukkan berbagai sekuen basa dari organisme lain yang sama dengan sekuen basa yang tersimpan di dalam GenBank.

    Gambar 9. Tampilan Output BLAST

    Program BLAST akan memberikan skor, nilai harapan, dan nilai homologi gen terhadap semua jenis hewan yang memiliki kesamaan sekuen gen dengan urutan basa nukleotida yang dimasukkan dalam program BLAST. Identifikasi homologi gen dilakukan dengan hanya mengamati nilai homologi gen pada ternak sapi, domba, dan kambing. Pustaka Muladno, 2002. Seputar Rekayasa Genetika. Pustaka Wirausaha Muda. Bogor.

  • NCBI. http://www.ncbi.nih.nlm.gov. [29 Juni 2004] Nugrogo, A.S (1999). Bioinformatika dan Pattern Recognition.

    http://www.ilmukomputer.com. [12 Desember 2003] Witarto, A.B. Bionformatika: Mengawinkan teknologi informasi

    dengan bioteknologi. http://www.ilmukomputer.com. [12 Desember 2003]