12
Bioinformatika Pendekatan untuk Identifikasi dan Anotasi RNA Editing Situs Modifikasi pasca-transkripsi urutan nukleotida transkrip dengan mengedit RNA merupakan mekanisme molekuler penting dalam pengaturan fungsi protein dan berhubungan dengan berbagai fenotipe penyakit manusia. Identifikasi mengedit RNA situs adalah langkah dasar untuk mempelajari mengedit RNA. Sumber daya Database dan bioinformatika digunakan untuk membubuhi keterangan dan mengevaluasi sebagai serta mengidentifikasi situs editing RNA. Tidak ada metode yang bebas dari keterbatasan. Benar mendirikan sebuah pipa analitik dan strategis penerapan kedua metode eksperimental dan bioinformatika merupakan langkah pertama dalam menyelidiki mengedit RNA. ulasan ini merangkum pendekatan bioinformatika modern dan sumber daya terkait untuk penelitian mengedit RNA. jurnal Genetika Kedokteran penghapusan editing ( penyisipan atau penghapusan nukleotida ) . Artikel Baru pengembangan -throughput sequencing Tinggi, Generasi berikutnya Teknologi , semakin BANYAK SITUS mengedit RNA Yang CEPAT Yang ditemukan . Artikel Baru demikian , BANYAK Alat -alat bioinformatika Dan Algoritma untuk mengidentifikasi SITUS baru Negara RNA mengedit Dan semantik anno - tasi Bahasa Dari INFORMASI Yang diketahui semakin sering diperkenalkan . Setiap menggunakan metoda , bagaimanapun , tidak prabayar bebas Bahasa Dari keterbatasan . Sebagai Contoh , BANYAK positif Palsu ditemukan di SITUS Yang baru Negara ditemukan . 2-4 )

Bioinformatika Indo

Embed Size (px)

DESCRIPTION

n n

Citation preview

Page 1: Bioinformatika Indo

Bioinformatika Pendekatan untuk Identifikasi danAnotasi RNA Editing Situs

Modifikasi pasca-transkripsi urutan nukleotida transkrip dengan mengedit RNA merupakan mekanisme molekuler penting dalampengaturan fungsi protein dan berhubungan dengan berbagai fenotipe penyakit manusia. Identifikasi mengedit RNAsitus adalah langkah dasar untuk mempelajari mengedit RNA. Sumber daya Database dan bioinformatika digunakan untuk membubuhi keterangan dan mengevaluasi sebagaiserta mengidentifikasi situs editing RNA. Tidak ada metode yang bebas dari keterbatasan. Benar mendirikan sebuah pipa analitik dan strategispenerapan kedua metode eksperimental dan bioinformatika merupakan langkah pertama dalam menyelidiki mengedit RNA. ulasan inimerangkum pendekatan bioinformatika modern dan sumber daya terkait untuk penelitian mengedit RNA.

jurnalGenetika Kedokteranpenghapusan editing ( penyisipan atau penghapusan nukleotida ) . Artikel Barupengembangan -throughput sequencing Tinggi, Generasi berikutnyaTeknologi , semakin BANYAK SITUS mengedit RNA Yang CEPATYang ditemukan . Artikel Baru demikian , BANYAK Alat -alat bioinformatika DanAlgoritma untuk mengidentifikasi SITUS baru Negara RNA mengedit Dan semantik anno-tasi Bahasa Dari INFORMASI Yang diketahui semakin sering diperkenalkan .Setiap menggunakan metoda , bagaimanapun , tidak prabayar bebas Bahasa Dari keterbatasan . Sebagai Contoh ,BANYAK positif Palsu ditemukan di SITUS Yang baru Negara ditemukan .2-4 )Hal inisial sebagian KARENA SAAT keterbatasan Suami TERSEDIA Tinggi,Teknologi throughput sequencing Dan sebagian KARENA DAFTAR ISI CONTENTS DELTA-pleteness menggunakan metoda Analisis bioinformatika .Ulasan inisial merangkum pendekatan bioinformatika Yang moderenSITUS bahwa surat keterangan RNA editing temukan Dan. menggunakan metoda AnalyticBEKERJA SENDIRI tidak semata - mata FUNDS urutan data RNA . Ulasan Suami JUGAmeliputi langkah - langkah Strategis Yang digunakan Dalam, Analisis mengedit RNA ,Sumber Daya terkait bioinformatika Yang berguna Dalam, Analisismengedit RNA Dan menggunakan metoda untuk membandingkan Analisis untuk lebihmeningkatkan HASIL Analisis .Bioinformatika Pendekatan untuk Identifikasi DanAnotasi RNA situs editingSoo Youn Lee Dan Kim Ju Han *Seoul National University Biomedis Informatika ( SNUBI ) Dan Telkomnika Informatika

Page 2: Bioinformatika Indo

Pusat Penelitian Biomedisulasan TaxJ Med Genet 2013 , 10 ( 1 ) : 27 - 32http://dx.doi.org/10.5734/JGM.2013.10.1.27ISSN 1226-1769 (Print ) 2233-9108 (Online )Modifikasi pasca - transkripsi Urutan nukleotida transkrip Artikel Baru mengedit RNA merupakan MEKANISME molekuler Penting Dalam,pengaturan fungsi protein Dan berhubungan Artikel Baru berbagai fenotipe penyakit manusia . Identifikasi mengedit RNASITUS adalah langkah Ditempatkan untuk mempelajari mengedit RNA . Sumber Daya database Dan bioinformatika digunakan untuk membubuhi surat keterangan Dan mengevaluasi sebagaiSerta mengidentifikasi SITUS mengedit RNA . Tidak ADA Yang menggunakan metoda prabayar bebas Bahasa Dari keterbatasan . BENAR mendirikan sebuah pipa analitik Dan Strategispenerapan kedua menggunakan metoda eksperimental Dan bioinformatika merupakan langkah PERTAMA Dalam, menyelidiki mengedit RNA . ulasan Suamimerangkum pendekatan bioinformatika yang modern Dan Sumber Daya terkait untuk penelitian mengedit RNA .Kata kunci :RNA editing , RNA - seq , BioinformatikapengantarMengedit RNA adalah proses penelaahan di mana molekul Urutan nukleotidaperubahan terjadi Dalam, molekul RNA Penghasilan kena pajak ITU telah ditranskripOleh RNA polimerase .1 )Mengedit RNA adalah molekul Peristiwa BACAKAN JARANGDan bentuk UMUM Before pengolahan RNA termasuk splicing , 5 ' -capping Dan Acara 3 ' - polyadenylation biasanya tidak dianggap sebagaiMengedit RNA .SEMENTARA mengedit RNA Luas ( atau pan - editing ) dapat terjadi beberapa FUNDSbiota , BACAKAN JARANG Dan biasanya terdiri Bahasa Dari sejumlah Kecilperubahan FUNDS Urutan molekul Yang terkena dampak Dalam, vertebrata .SEMENTARA mengedit RNA telah diamati Dalam, berbagai bentuk RNAtermasuk tRNA , rRNA , mRNA Dan Mirna FUNDS eukariota Dan merekavirus , belum terlihat di prokariota . Mengedit RNA terjadi FUNDSbeberapa organel seluler seperti mitokondria Dan plastida SertaDalam, inti Dan sitoplasma .Mengedit RNA terutama diklasifikasikan Ke Dalam, doa Kategori ; substitusiediting ( perubahan KIMIA nukleotida individu ) Dan penyisipan / genetika Kedokteranpenghapusan editing (penyisipan atau penghapusan nukleotida). denganpengembangan tinggi-throughput sequencing generasi berikutnyateknologi, semakin banyak situs editing RNA yang cepatyang ditemukan. Dengan demikian, banyak alat-alat bioinformatika dan

Page 3: Bioinformatika Indo

algoritma untuk mengidentifikasi situs baru RNA mengedit dan semantik anno-tasi dari informasi yang diketahui semakin sering diperkenalkan.Setiap metode, bagaimanapun, tidak bebas dari keterbatasan. Sebagai contoh,banyak positif palsu ditemukan di situs yang baru ditemukan.2-4)Hal ini sebagian karena keterbatasan saat ini tersedia tinggiteknologi sequencing throughput dan sebagian karena laporan laba-pleteness metode analisis bioinformatika.Ulasan ini merangkum pendekatan bioinformatika yang modernbahwa situs keterangan RNA editing discover dan. metode Analytictidak bekerja sendiri semata-mata pada data sequencing RNA. Ulasan ini jugameliputi langkah-langkah strategis yang digunakan dalam analisis mengedit RNA,sumber daya terkait bioinformatika yang berguna dalam analisisediting RNA dan metode untuk membandingkan analisis untuk lebihmeningkatkan hasil analisis

mengedit RNARNA Fenomena modifikasi uridin ( U ) penyisipan /penghapusan RNA editing ditemukan di mitokondria mencoba-protista panosomatid pada tahun 1986 .5 )Mengedit RNA dapat dikelompokkan menjadidua editing classes-insertion/deletion dasar dan mengedit substitusi .Sementara mengedit RNA luas ( pan - editing ) mungkin terjadi pada beberapaorganisme , mengedit dalam vertebrata yang langka dan biasanya terdiri darisejumlah kecil perubahan pada urutan molekul yang terkena dampak .A - to- I editing adalah bentuk paling umum dari RNA editing di mam-mals .5 , 6 )Adar ( DeAminases Adenosin bekerja pada RNA ) adalah RNA -mengedit enzim yang terlibat dalam deaminasi hidrolitik dari Ade-tidaksinus untuk inosin ( A -to -I editing )7-9 )pada eukariota lebih tinggi .10 )C -to- U editing , editing lain dengan deaminasi , melibatkan cytidinedeaminase yang deaminates basis cytidine menjadi basis Uridine .Apolipoprotein B pada manusia adalah contoh dari C -to - U editing denganbentuk Apo B100 memiliki urutan CAA yang diedit untukUAA , kodon stop , untuk membuat Apo B48 . Apo B100 , yang diedit

Page 4: Bioinformatika Indo

bentuk , dinyatakan dalam hati dan Apo B48 , diedit oleh APOBECenzim , diekspresikan dalam usus .11 )Editing C -to - U jauhjarang dari A -to -I editing .Situs editing RNA terletak di dalam intron , 5'UTRs , 3'UTRs ,urutan RNA non - coding6 )dan coding daerah .12 )terutama ,ribuan situs editing RNA telah ditemukan di Alu dimRNA manusia.13 , 14 )Mengedit RNA dapat menyebabkan non - identikprotein coding substitusi ,15 )splicing alternatif , perubahandaerah benih Mirna , dan ekspresi gen .6 )Banyak situs editing RNA telah dilaporkan untuk hadir dalamberbagai penyakit manusia seperti epilepsi , iskemia otak , depresidan tumor otak .12 , 16-18 )Secara khusus , beragam RNA terkait kankersitus editing telah diidentifikasi di berbagai onkogen seperti gliomaterkait onkogen 1 (GLI1) .19 )Beberapa situs editing RNA memilikiberdampak pada penemuan obat .20 )Produk gen seperti isoform adalahdibuat oleh RNA editing kegiatan narkoba mempengaruhi .19 )Perkembangan terbaru dari DNA tinggi - throughput dan RNA sequ-teknologi encing telah memberi kontribusi pada identifikasi baruRNA mengedit situs dan mengedit jenis seperti T ke C , T ke A , C ke A ,C ke T , G ke T , C ke G dan G to C.21 )Hasil dari ini teknis baru-pertanyaan menunjukkan bahwa editing RNA sangat terhubung ke manusiafenotipe termasuk beberapa penyakit .22 )Saat ini , salah satu tantangan besar-lenge di RNA editing penelitian adalah identifikasi yang tepat dari RNA

Page 5: Bioinformatika Indo

mengedit situs dari bising Data RNA - Seq oleh RNA benar diskriminatifsitus editing dari Polimorfisme Nukleotida Tunggal ( SNP ) danartefak teknis yang disebabkan oleh sequencing dan analisis kesalahan .23 )Untuk alasan ini, bioinformatika pendekatan untuk data RNA - Seqsitus analisis dan mengidentifikasi RNA editing menjadi lebihpenting . Dengan demikian , bagian berikut membahas data yang RNA - Seqpipa analisis untuk mengidentifikasi situs editing RNA dan memperkenalkanalat bioinformatika dan database

DNA dan RNA-Seq-Seq Data preprocessing untukRNA editing penelitianGambar. 1 menunjukkan langkah-langkah untuk mengidentifikasi situs editing RNA dariRNA-Seq dan urutan DNA (dari exome sequencing atau seluruh sekuensing genom ) data. Ini menunjukkan pipa analisis untukpenemuan situs baru RNA editing dan satu lagi untuk sistematisannotating Data RNA - Seq dengan situs editing dikenal . Berbagaisumber daya bioinformatika , database , metode dan algoritmayang tercantum dalam Tabel 1 yang secara luas digunakan dalam pipa analisishari ini .Identifikasi situs baru RNA editing terdiri dari dua langkah ,baca pemetaan dan panggilan varian . kedua Bowtie24 )dan TopHat25 )adalahUrutan populer membaca alat pemetaan . Bowtie adalah yang cepat , memori -efisien aligner dibaca pendek , menyelaraskan DNA pendek membaca ke manusiagenom pada tingkat lebih dari 25 juta 35 - bp membaca per jam . bowtieindeks genom dengan indeks Burrows - Wheeler untuk memoriefisiensi. TopHat adalah sambatan cepat persimpangan mapper untuk RNA - Seqmembaca . Ini sejalan RNA - Seq dibaca untuk genom mamalia berukuranmenggunakan cepat pendek aligner Bowtie membaca , dan kemudian menganalisaHasil pemetaan untuk mengidentifikasi sambatan persimpangan antara ekson .Sementara TopHat digunakan lebih sering secara langsung membandingkan RNA -Data seq dengan referensi genom saja ,26 )SOAP227 )dan Burrows -Wheeler Aligner ( BWA )23 )digunakan untuk mengidentifikasi situs editing RNA denganmembandingkan DNA dan RNA urutan pasang dari sampel yang sama .BWA sendiri tidak membaca peta lebih intron . Pemetaan RNA - seq

Page 6: Bioinformatika Indo

membaca tanpa metode untuk pemetaan lebih junctions akan menghasilkanekson 'pulau' dan tidak akan memetakan setiap membaca yang span intron .untuklangkah kedua varian menelepon , SAMtools28 )dan GATK29 )sangatdigunakan . File SAM dan BAM file berisi informasi yang sama ,tetapi dalam format yang berbeda . Format SAM adalah format teks untukmenyimpan data sekuens dalam serangkaian tab delimited kolom ASCII .Format BAM menyimpan data yang sama dalam terkompresi , diindeks ,bentuk biner . Saat ini, sebagian format data SAM adalah output darialigners yang membaca file FASTQ dan menetapkan urutan ke posisisehubungan dengan genom referensi diketahui . SAMtools menerimaSAM atau BAM format file dan jenis file BAM . Tabrakan beruntun atau mpileupPerintah ini digunakan untuk mengkonversi diurutkan BAM file ke VCF ( VarianHubungi Format ) Format . kemudian VCFtools30 )melakukan kualitas VCFmemeriksa dan penyaringan . Dalam mengidentifikasi situs editing RNA , penyaringanlangkah-langkah yang sangat penting . Di sebagian besar percobaan , peneliti memeriksa

sumber daya databaseKarena perkembangan DNA throughput tinggi dan RNAsequencing metode, sejumlah besar situs editing baru memilikitelah ditemukan. Sebagian besar sumber daya database (Tabel 1) memberikandikenal RNA editing informasi situs dikuratori dari literatur.dbRES31)adalah web database berorientasi untuk dijelaskan mengedit RNAsitus yang dikumpulkan secara manual dari literatur dengan percobaan terkaithasil dan database bank gen.32)Terkutuk (Database RNAMengedit pada manusia)33, 34)adalah database terbesar RNA manusiamengedit situs dengan sekitar 500.000 situs editing RNA manusiamemberikan akses terpusat untuk data yang dipublikasikan. mengedit RNAlokasi dipetakan pada genom manusia referensi denganInformasi penjelasan termasuk, gen, sumber referensi daerahdan referensi PubMed id. Terkutuk juga mengandung 8.500 RNAperistiwa di Drosophila melanogaster dan Mus musculus editing.33)

Page 7: Bioinformatika Indo

Ini menghasilkan Wikipedia subbagian pada RNA editing untuk entri16 gen dan Alu mengulangi. REDIdb35)dan peneliti ikan36)mengandung RNAmengedit situs dalam mitokondria dan kloroplas urutan-encoded.mir-EdiTar37)mengandung diprediksi A-ke-aku RNA situs pengeditan Mirnadaerah yang mengikat

Discovery of novel RNA editing sites Novel RNA editing sites were discovered from a variety of human samples including B cells from 27 individuals22)

and the Han Chinese population27)

as well as from cell lines.1)

One of the popular methods is to compare RNA and DNA sequences obtained from the same sample, returning RNA-DNA differences (RDDs). After detecting the RDDs, a variety of biological resources like the 1000 genome,38)

HapMap39)

and dbSNP40)

are used to filter known SNPs from the RDDs. DARNED33, 34)

is also used to filter known RNA editing sites.Two methods for identifying RNA editing sites have recently been proposed based on RNA-Seq data from multiple samples of a single species.23)

The first method performs RNA variant calling for each RNA-Seq data after mapping sequence reads to a genomic reference sequence and filtering known SNPs. The second method performs sequence alignments using pooled reads from different RNA-Seq samples to select a higher read coverage. After alignment, it performs RNA variant calling and filters known SNPs. Given the fact that the DNA-RNA paired dataset is very rare, these methods have merits. RddChecker (http://genomics.jhu.edu/software/rddChecker/) is a representative tool for identifying RDDs and novel RNA editing sites using DNA and RNA sequencing data (Table 1). A large number of false positives are the major problem with these methods. Li et al., for example, reported that they found 28,848 RDDs with 12 different RNA-editing types including A to G (I)22)

but many studies have claimed false positives from the same dataset.2-4)

Annotation of RNA-Seq data with known editingsites

Page 8: Bioinformatika Indo

RDDs obtained from the comparison a RNA-Seq with a reference genome sequence are annotated with known RNA editing sites queried from RNA editing databases like DARNED33, 34)

to determine true RDDs. In 2011, Picardi et al. presented Expedit,26)

a web appli-cation that maps data and, given individual sequence reads as input, executes a comparative analysis against DARNED editing sites. It provides a user-friendly web interface for uploading raw RNA-Seq data like FASTQ, BAM and SAM format files and explores RNA editing sites. It annotates each RNA editing site with 10 types of information including location, gene information, source, etc, but with some limitations. It deals with the hg18 reference only. Uploading raw RNA-Seq data cannot be completed within a practical time. For example, it takes about two hours for a 700 Mb BAM file. RCARE (RNA-Seq comparison and annotation for RNA editing; http://www.snubi.org/software/rcare/) is a useful tool for identifying RNA editing sites from a variety of RNA-seq data, providing 22 types of biological information including synonymous/ non-synonymous changes, splicing junctions, non-coding RNAs and gene information. It also provides seven summary plots including the rate of RNA editing type, distribution in each chro-mosome and origin of the samples.

kesimpulanRNA Editing adalah mekanisme pasca-transkripsi yang penting,mengubah urutan transkrip RNA primer dengan menghapus,memasukkan atau memodifikasi residu. Banyak studi melakukaneksperimen untuk menemukan situs editing RNA. Setiap metode untukmengidentifikasi situs editing RNA, bagaimanapun, memiliki keterbatasan. novelRNA editing metode pendeteksian situs menderita positif palsu.Dikenal RNA editing metode penjelasan situs tidak cukup dalammenemukan situs baru RNA editing. Peneliti harus hati-hatimempertimbangkan kondisi eksperimental dan metode analisis. disebabkan olehketerbatasan keadaan saat ini alat-alat seni yang digunakan dalam inve-stigating situs editing RNA, satu harus benchmark dan test drivemetode yang berbeda dan basis pengetahuan untuk mencapai hasil terbaik.Lebih baik bioinformatika alat akan muncul. Kami berharap ulasan ini sug-gests pedoman yang wajar untuk identifikasi mengedit RNAsitus menggunakan DNA dan / atau data sequencing RNA.