Upload
timothy-douglas
View
385
Download
14
Embed Size (px)
Citation preview
الحيوية المعلوماتيةBioinformatics
العلم من جديد عصر
الحيوية المعلوماتية تعريفباستخدام • البيولوجية المعلومات تحليل هي الحيوية المعلوماتية
. الستخدام يسعى الذي العلم وهي !ة اإلحصائي !ات التقني و الكمبيوتروتعزيز لتسهيل !ة الحاسوبي !ات الخوارزمي و البيانات قواعد وتطوير
. !ة البيولوجي األبحاث• Bioinformatics is the analysis of biological information using
computers and statistical techniques. It is the science that seeks to use and develop databases and computer
algorithms to facilitate and enhance biological research.
بذلك • المختص العلم 7عرف الحيوية ي باإلنجليزية بالمعلوماتية المعروف وBioinformatics ) ( الحاسوبية البيولوجيا الحاسوبي األحياء علم computationalأو
biology المعلوماتية التطبيقية، الرياضيات تقنيات أحدث استخدام ، informaticsهو. بيولوجية مشكالت لحل الحاسب علوم و اإلحصاء،
• Competent science knows so bio Informatics and known in English Bioinformatics or computational biology (computational biology) computational biology is the use of the latest techniques applied mathematics, informatics informatics, statistics, and computer science to solve biological problems.
1. البيولوجي والعلوم الطبيعية
2. الرياضيات واإلحصاء
3. المعلوماتية وعلوم الكمبيوتر
لب وهيالثالثة الموضوعات
Biological database البيولوجية البيانات قاعدة
بيولوجية هي • بيانات منظمة قاعدة هيئة عن عبارة ، كبيرةالحاسوبية البرمجيات ترتبط ما وعادة ، الثابتة للمعلومات
عناصر واسترجاع ، واالستفسار ، التحديث بإمكانيات المصممة. النظام داخل المخزنة البيانات من
• Is a large biological database, an organized body of information fixed, usually associated with computer software designed potential update, inquiry, and retrieval of data elements stored within the system.
Biological database البيولوجية البيانات قاعدة
من. • العديد على يحتوي واحد ملف يكون قد البيانات قواعد أشكال أبسط منسجل ، المثال سبيل على المعلومات من المجموعة نفس يضم سجل ،كل السجالت
نوع وصف مع التسلسل إدخال مثل مدخالت علي يحتوي النووي الحمض بتسلسل متعلقالمراجع بعض و ، النووي الحمض منه ع7زل الذي المصدر للكائن العلمي واالسم ، الجزيء
. بالتسلسل المرتبطة .المهمة .Of the simplest forms of databases may be a single file containing many
records, each record includes the same set of information, for example, record related sequence DNA contains entries such as the introduction sequence with a description of the type molecule, and the scientific name for the object source,
who isolate him DNA, and some important references associated sequentially.
Comprehensive Databases• بالبيولوجى وهي متعلق شىء أى عن معلومات .• رئيسة و بيانات قواعد ثالثة هنالك :
1. البيوتكنوجي لمعلومات القومي : المركز• National Center for Biotechnology Information (NCBI)• http://www.ncbi.nih.gov• NCBI is a resource for molecular biology information.
2. الجزيئية للبيولوجيا األوروبي : المعمل• European Molecular Biology Laboratory (EMBL)• http://www.embl.org• EMBL provides biomolecular databases and
bioinformatics tools.الـ 3. بيانات الياباني :DNAبنك
• Data Bank of Japan (DDBJ)• http://www.ddbj.nig.ac.jp• DDBJ is a DNA data bank in Japan.
الـ • في تختلف لكن البيانات في toolsتشترك
Databases in Bioinformatics
المعلوماتية في البيانات قواعدالحيوية
Databases in Bioinformaticsالحيوية المعلوماتية في البيانات قواعد
• Why?• The different types of
databases• Database language: identifiers• Nucleotide sequence
databases• Protein sequence databases• 3D structure databases
لماذا؟ •
قواعد • من المختلفة األنواعالبيانات
• : البيانات قواعد لغةالمعرفات
تسلسل • بيانات قواعدالنكليوتيد
تسلسل • بيانات قواعدالبروتين
ثالثي • للبناء البيانات قواعداألبعاد
Biological databases: Why?لماذا؟ : البيولوجية البيانات قواعد
• Make biological data available to scientists البيولوجي • للعلماء متاحة البيانات جعل
– Consolidation of data (gather data from different sources)–( مختلفة ( مصادر من البيانات جمع البيانات توحيد
– Provide access to large dataset that cannot be published explicitly (genome, …)بشكل – نشرها يمكن ال التي كبيرة البيانات مجموعة إلى الوصول إمكانية توفير
(... الجينوم، ( موسع• Make biological data available in computer-readable format
بالحاسوب • مقروء شكل في البيولوجية البيانات إتاحة– Make data accessible for automated analysis
اآللي – للتحليل البيانات على الحصول إتاحةBioinformatics: “a collective term for data compilation, organisation, analysis
and dissemination”الحيوية : وتنظيمها" المعلوماتية وتحليلها البيانات لتجميع جمعي مصطلح وهو
ونشرها"
The different types of Databases in Bioinformaticsالبيانات قواعد من المختلفة األنواع
)1Data :البيانات Type of data : البيانات أنواع
• nucleotide sequencesالنكليوتيد تسلسل• protein sequencesالبروتين تسلسل• 3D structures
األبعاد الثالثي البناء• gene expression data
الجيني التعبير بيانات• metabolic pathways
األيض مسارات•.…
البيانات ) (Data formatsأشكال
أشكال • عدة في البيولوجية البيانات تتواجدأسلوب ، مختلفة في دخالها إتختلف
(annotation )تقرأها التى . الخ . . .والبرامجال toolsتوجد • بين فيما البيانات شكالألتحويل
شكل الذي BioPerlمثل من formaيحول . آلخر
بالذكر • جدير هو العلم أومما المجتمع يميل ينشكل فورمة ) سريعةألنها XMLالـ إلى وهي
مثل اإللكترونية .(hotmailللملفات
1. FASTA format• الشكل بسيطة “>“ هى ويليه بـ يبدأ للتعريف سطر كتابة يتم ،
السطر امباشرة بقية ثم أقل أو حروف عشرة من يتركب سمالـ . أيمكن تتابع كتابة يتم ثم حروف وأى مسافات يتضمن ن
DNA حامض لكل كرمز واحد حرف صورة في البروتين أوالت السطر في وذلك قواعد . اأمينى من كثير في تستخدم لى
والبرامج . البيانات• :مثال• >sp|O53189|TIG_MYCTU Trigger factor (TF) –
Mycobacterium tuberculosis .• MKSTVEQLSPTRVRINVEVPFAELEPDFQRAYKELAK
QVRLPGFRPGKAPAKLLEARIGREAMLDQIVNDALPSRYGQAVAESDVQPLGRPNIEVTKKEYGQDLQFTAEVDIRPKISPPDLSALTVSVDPIEIGEDDVDAELQSLRTRFGTLTAVDRPVAVGDVVSIDLSATVDGEDIPN
• ما لبروتين األمينية . األحماض
فورمة الفاستا
الكروموسومية : . الخرائط g اوال
الجيني البنك على ندخل
Genomeنختار
Genomeنختار
الكائن نوع ونحددHuman
نضغط Searchثم
لم كمية البشري الجينوم مشاريع انتجتعلم حول المعرفة من مثيل له يسبق
والصحة البشرية الوراثة
لالنسان العلمي االسم
العضيات الجينوم استطالة مشروع القواعد استطالة
الصفحة نهاية فييوجد
وتكبيرها منطقة أي على الضغط يمكنبوضوح لمشاهدتها
معين: جين تتابع تحديد g ثانيا
نتبع معين جين تتابع لتحديداآلتياألولى . الطريقة
جين أي احددجين مثل
الثدي سرطان
نفس فيالصفحة
الثانية الطريقة
البنك على ندخل الجيني
مثل المطلوب الجين نحددعن المسؤول الجين
.الطول
نفس فيالصفحة
نفس فيالصفحة
نفس فيالصفحة
الكمبيوتر طريق عن بالجين التنبؤ1 )BLAST
(http://ncbi.nih.gov/BLAST(مماثل ) تتابع بها األخرى الكائنات ؟( similarهلمعلوم؟ بروتين أو لجين مماثل التتابع وهل
الثالثة الطريقة
صفحة FASTAفيبهذا التتابع يظهرهذا ننسخ الشكل
التتابع...
صفحة نهاية فيFASTA على نضغط
Blast
صفحة BLASTفيونحدد التتابع نلصق
يظهر .. كما الخياراتزر على Blastونضغط
من المماثل الجزء فيظهرالموجود التتابع مع الجينأتعرف . وبذلك البنك في
غير الجينات أحد علىوهذا . dسابقا المعروفة
يدعم أن المفروضالمعملي . بالبحث
HUGO Symbol
Locus Gene product
Associated disease Notes Genecard
ABO Glycosyltransferases
--Determinant of blood type
) (ABO
ALB 4 11- 13q q Serum albumin
--
The most abundant protein in human
blood plasma
GeneCard f or ALB
2BCL 18 21.3q
Apoptosis regulator Bcl-2 / B-cell CLL/lymphoma 2
Several cancers
The prototype anti-apoptotic protein
GeneCard f 2or BCL
5CCR 3 21pchemokine (C-C motif) receptor 5
--
Has an important role in resistance to infection.
GeneCard f 5or CCR
Genes notable for their function
HUGO Symbol
Locus Gene product
Associated disease Notes Genecard
4CD 12 - 12pter p CD4 antigen --
The prototype marker for
T helper cells
GeneCard f 4or CD
8CD 2 12p CD8 antigen --
The prototype marker for
cytotoxic Tcells
GeneCard f 8or CD A
2IL 4 26- 27q q Interleukin2
Various cancers
Strong pro-inflammatory cytokine
GeneCard f 2or IL
10IL 1 31- 32q q Interleukin 10
--anti-inflammatory cytokine
GeneCard f 10or IL
Genes notable for their function
HUGO Symbol
Locus Gene product
Associated disease Notes Genecard
1BRCA 17 21qBreast cancer 1, early onset
Breast cancer
Myriad Genetics
owns a controversial patent on
this gene [1]
GeneCard f 1or BRCA
2BRCA 13 12-13qBreast cancer 2, early onset
Breast cancer
Myriad Genetics
owns a controversial patent on
this gene [2]
GeneCard f 2or BRCA
HUGO Symbol
Locus Gene product
Associated disease Notes Genecard
28CD 2 33q CD28 antigen
--
The target of the drug TGN1412, which had a dramatic outcome of its first clinical trial in 2006.
GeneCard f 28or CD
7ZBTB A 19 13.3p7Zbtb /
POK erythr oid myeloid
ontogenicfactor
Cancer
Originally called POKemon, the gene was renamed after legal threats from
Pokémon USA
[3].
GeneCard f 7or ZBTB A
HUGO Symbol
Locus Gene product
Associated disease Notes Genecard
APP 21 21q Amyloid pr ecursor pr
otein
'Alzheimer s Disease
-- GeneCard for APP
GAST 17 21q Gastrin-Zollinger E llison synd
rome
-- GeneCard for GAST
INS insulin diabetes mellitus
--
LCK 1 35- 34.3p p
Leukocyte-specific protein tyrosine kinase
Leukemia -- GeneCard for LCK
LEP 7 31.3q Leptin Obesity -- GeneCard for LEP
Symbol Locus Gene productAssociated disease Notes Genecard
LEP 7 31.3q Leptin Obesity -- GeneCard for LEP
LIF 22 12.1- 12.2q q Leukemia inhibit ory factor
Leukemia -- GeneCard for LIF
6MCM 2 21qMinichromosom e maintenance d
6eficient
lactose intolerance
-- GeneCard for M6CM
7MYH 14 12q
Myosin ,heavy polypeptide 7, cardiac muscle, beta
Hypertrophic cardiomyopathy
-- GeneCard for MY7H
1MYOD 11 15.4p Myogenic differentiation 1
Rhabdomyosarcoma
-- GeneCard for MY1OD
NPPB 1 36.2p Brain Natriuretic Peptide
Cardiovascular disease
-- GeneCard for NPPB
OSM 22 12.1- 12.2q q Oncostatin M Leukemia -- GeneCard for OSM
PKC 16 11.2- 12.1p qParoxysmal kinesogenic choreoathetosis
Choreoathetosis -- GeneCard for PKC
PIP 7q32-q36Prolactin-induced protein
Fibrocystic breast disease
-- GeneCard for PIP
SLC18A2 10q25Vesicular Monoamine Transporter
Drug induced mood disorders
-- GeneCard for SLC18A2