Upload
shin-kim
View
197
Download
5
Embed Size (px)
Citation preview
생물학적 해석 도구 실습: DAVID, ArrayXPath, BioLattice
유전자 온톨로지와 생물학적 경로 분석
1. 숨겨져 있는 패턴과 경향을 찾는 단계 2. 찾아낸 패턴과 경향을 해석하는 단계
유전자 온톨로지와 생물학적 경로 분석
• Gene Ontology(GO): 유전자정보들이 축적되면서 주석(annotation) 정보 등을 통일된 용어들로 정의.
• biological processes
• cellular components
• molecular functions
• A biological pathway: 세포내에서 분자들의 일련의 반응들로 새로운 지방 혹은 단백질을 만들어내기도 한다.
생물학적 해석 과정
1. 실험 설계 및 수행
2. 자료의 전처리 및 정규화
3. 분석(ex. 차별발현 분석, 클러스터 분석)
4. 유전자군(ex. 차별발현군, 클러스터)
5. 생물학적 해석
DAVID
• Database for Annotation, Visualization and Integrated Discovery
• 주어진 유전자 리스트에 내포된 생물학적 의미를 이해하기 위한 도구
ArrayXPath / BioLattice
ArrayXPath
• 생물학적 패스웨이에 기반한 마이크로어레이 데이터 해석 시스템
• Gene-Cluster, Gene-Disease, Gene-GO, Gene-Biological Pathway간의 정보를 시작화하여 제공
BioLattice
• DAVID와 ArrayXPath는 각각의 클러스터들에 대한 개별적 해석
• BioLattice는 클러스터 간의 상관관계를 보여주고 중요한 클러스터를 찾아줌
실습할 데이터의 정보
직접 실습할 내용
1. 급성림프구성백혈병(Acute Lymphocytic Leukemia) 데이터 준비
2. K-means로 클러스터링
3. 클러스터링 결과를 DAVID / ArrayXPath 입력 파일 형식으로 저장
4. DAVID / ArrayXPath / BioLattice에 파일 입력
5. 결과 받아보기
급성 림프구성 백혈병(Acute Lymphocytec Leukemia) 데이터 준비
1. bioconductor.org/bioLite.R 사용
2. ALL(Acute Lymphoblastic Leukemia) 데이터 읽어들이기(128개)
3. 분자생물학적 지표 확인
4. 이 실습에서는 ALL1/AF4와 BCR/ABL만 추출
K-means로 클러스터링 & 결과를 파일로 저장
1. 통계적으로 유의한(adjust p-value<0.05) 유전자 목록을 추출
2. 프로브(probe): 165개 추출
3. k-means 클러스터 분석을 2번 수행하여 클러스터 10개 생성
4. DAVID와 ArrayXPath 포맷 파일으로 저장