Upload
seung-bae-lee
View
366
Download
6
Embed Size (px)
DESCRIPTION
Wrtten by Seung-Bae,Lee
Citation preview
’13年06月
Contents - 2 -
• 유전체 분석 과정 Basic Ⅰ
• NIPT 원리 및 과정 Ⅱ
• NIPT 상용 서비스개발 과정 및 소요 기간 산출 Ⅲ
• 결론 Ⅳ
• 첨부 – NIPT Provider별 기술 Ⅴ
- 3 -
Ⅰ: 유전체 분석 과정 Basic
전체 과정 요약
Sample Preparation
Sample Preparation 장비 FLOW
- 4 -
샘플 준비-데이터 분석-고도화 분석 과정은 상호 매우 밀접한 관계가 있으며, 진단과 분석 기법 종류에 따라 그에 맞게 세 부분(샘플준비-데이터분석-고도화 분석)을 같이 최적화가 반드시 필요. 따라서,특정 고도화 분석/진단 분야에 일반 Bioinformatics 전문가를 통해 상용 확보하고자 한다면 ,세 부분에 대해 많은 시간과 반복 시도를 통한 보정과 최적화 작업은 기본적으로 필요하며, 또한 , 이런 과정을 거쳤다고 하더라도 정확하고 신속한 상용 수준의 고도화 분석/진단 확보 여부를 보장 할 수 없는 어려운 진입 장벽이 있음.
Ⅰ. 유전체 분석 과정 Basic 1. 전체 과정 요약
1Primer: 대상 DNA의 복제 시작 부분을 표시해 주기 위한 시발체로 DNA Fragment 끝에 붙임. 2dNTP(deoxy-Nucleoside-Tri Phosphate): DNA가 합성될때 필요한 물질로서 dATP, dCTP, dGTP, dTTP 4가지 있음.
샘플 준비 과정
①DNA 추출 ②DNA Library 제작 (DNA에 1Primer 부착) ③증폭
시퀀싱 과정
①Lib에 형광2dNTP결합 ②촬영> 이미지 파일 ③이미지 > 염기문자
데이터 분석
① 염기문자파일upload ② 분석 Pipe-line -매핑/정렬->변이후보 ③ 분석 결과 레포트
고도화 분석 ① 1차 데이터 분석과 외부 통계 DB(질병/변이) 연동. ② 진단/확률 알고리즘 통해 진단/확률 결과 도출
고도화 분석(통계)
외부 통계 DB
변이DB 질병DB ….
진단 / 확률
알고리즘
매핑 정렬 분류
Pipe-line(분석 Tool) NGS-시퀀서
사진 촬영
염기문자 인식
문자 파일 변환
샘플 준비 작업 장비
DNA 추출
정확성 확인/ 보정
증폭 작업
Ⅰ. 유전체 분석 과정 Basic
5
Cluster Generation
군집 증 폭(Sequencer마다 상이)
Library Preparation
Primer를 절개된 DNA Fragment 양쪽부착.
Primer + DNA Fragment = Library하며,
이 형태로 증폭-> Sequencing 처리를 함.
DNA Shearing (DNA 절삭)
① 혈액/타액->DNA만 적출
② 일정한 크기로 절단(DNA Fragment)
약 6시간 소요
약 4시간 소요
2. Sample preparation
Covaris 사의 Acoustic Disruptor를 이용한 DNA shearing 로, 원하는 크기로 균일하게 DNA shearing이 가능
각 Sequencing 종류 별, 별도의 Kit 가 있으며, Primer가 포함되어 있음.
Flowcell이란 기판에 Library를 놓고 기기별 다른 증폭방식으로 증폭. (향후, 시퀀싱 장비로 Flowcell 기판 자체를 Insert)
- 6 -
DNA 절삭-> DNA Library 제작 -> 증폭
극소 정량 DNA 절삭/추출과 primer 결합을 통한 Library를 제작하는 샘플 제작 과정임. (전용기기 이용)
선별된 DNA Library를 증폭(Clustering)하는 과정임.(PCR 장비)
증폭된 최종 DNA Library가 다량 Clustering(군집)을 이루고 있는 시퀀싱 장비에 삽입 용 판넬
3. Sample Preparation 장비 Flow Ⅰ. 유전체 분석 과정 Basic
- 7 -
Ⅱ. NIPT 원리 및 과정
NIPT 정의 및 기존 방식과 비교
NIPT 전체 Flow
Vendor별 알고리즘 비교
전체 기법 분류
- 8 -
NIPT(Non-Invasive Prenatal Testing)은 임신초기(9~10주) 산모의 혈액 속에 있는 태아의 cffDNA(cell free fetal DNA)를 분석해 다운증후군(trisomy 21)· 에드워드 증후군(trisomy 18), 파타우 증후군(trisomy 13), 터너 증후군(monosomy X),클라인펠터 증후군(XXY) 등의 염색체 이상을 판별하는 비 침습 식 산전 유전자 검사.
Ⅱ. NIPT 원리/ 과정 1. NIPT 정의/기존 방식과 비교
침습 식 방식 (기존 방식) 비 침습 식 방식 (NIPT)
검사 유형
CVS(chorionic villous sampling: 융모)
Amniocentesis (양수 검사)
검사가능시기 임신 11-13 주 임신 16-20주 임신 9~10주
검사 위험 성 유산이나 태아 사지 기형 위험도: 0.5~1%
유산 위험도 0.1~1% 없음
소요 시간: (결과 확인 기간)
2~3일 소요 다운,에드워드,파타우 증후군만 확인은 1~2일 소요. 전체 검사 기간 10~14일
10일
정확도 •true positive rate = 100% •false negative rate >0%
•true positive rate = 100% •false negative rate >0%
•True positive rate =99% • false negative rate > 1%
장/단점 정확성이 높음.
검사의 위험성이 존재,
검사 위험요소가 없음. 조기 검진 가능 (First Trimester) 정확성은 침습 식과 유사함
Ⅱ. NIPT 원리/ 과정
9
EDTA Tube에 산모 혈액 5~10mL 체취(임신 9~10주)
혈액체취
Dry ice 밀폐 박스에 혈액 Tube를 냉동 보관하여 연구실로 배송
혈액 배송
병 원 NIPT-실험실
•단기 보관(1주일 내) -영하 20도에 보관. •장기 보관(1주일 이상) -영하 80도에 보관. 기온변화(해동-결빙) X
혈액 보관
영상 4도에서 8시간 이내 즉시 혈장 분별 진행
DNA 체취 시약 •Target 방식 시, -> 타겟 염색체용 Probe 포함됨. • MPSS 방식 시, -> 전체 DNA 체취
DNA체취/절삭 DNA Library 제작
•Lib 제작 시약 -시약 내 포함된 Primer가 DNA에 결합됨. - Quality 점검 .
PCR(증폭)
Sequencing
고도화 분석(통계)
통계 DB
외부 DB
내부 DB
….
진단 / 확률
알고리즘
(업체 마다 상이,
Black Box)
분류 정렬 매핑
Data 분석 Pipe-line
NIPT-Bioinformatics/Static 연구실 회사명/브랜드 지원 가능 진단 /정확도 방식
Sequenom /MaterniT21 PLUS
T13(91.7%),T18(99.9%),T21(99.9%), XY(99.4%)
MPSS/ 정량
Verinata/Verifi T13(87.5%),T18(97.4%),T21(99.9%), XY(97.6%)
MPSS/ 정량
Ariosa/Harmony T18(97.4%),T21(99.86%), Target/ 정량
Natera /Panorama
T13(100%),T18(100%),T21(100%), XY(92%)
Target/ SNP
BGI NIFTY
T13(100%),T18(100%),T21(100%), XY(100%),지중해 빈혈 등
MPSS/ 정량
BerryGenome /BamniTest
T13(99.9%),T18(99.9%),T21(99.9%), XY(99.9%),지중해 빈혈 등
MPSS/ 정량
결과 통보
업체마다 독자 진단/확률 알고리즘이 있으며, 기본 개념은 유사하나 높은 정확도와 빠른 처리가 가능한 고도화 부분은 Blackbox(비공개)이고, 이런 고성능 상용 수준이 가능한 이유는 샘플작업->Data 분석->고도화 분석을 지속적으로 수없이 반복하며 알고리즘을 최적화 한 결과 확보가 가능했음.
2. NIPT 전체 Flow
혈액 분별
▣ Vendor 별 알고리즘 비교
10
알고리즘 or 위험 측정 방식 평가 기준 측정 가능 시기 소요 시간
(Turn around Time)
Sequenom 알고리즘 명 비 공개
Z-Score 방식 Z-score < 3 (정상)
Z-score > 3 (비정상) 임신 9주
7일 (working time)
Verinata 알고리즘 명 비 공개
NCV 방식 (Normalized chromosome value)
NCV < 4 (정상) 2.4 < NCV< 4(의심) NCV > 4 (비정상)
임신 10주 8~10일
(working time)
Ariosa FORTE 알고리즘
High-Low Risk 방식 Low Risk<1%(정상)
HighRisk>99%(비정상) 임신 10주
8~10일 (working time)
Natera
NATUS 알고리즘 태아SNP를 외부SNP DB와 비교
하고, 통계 기법(Bayesian & Maximum Likelihood Estimation)
을 활용한 기법.
해당 염색체 번호의 추정치 이수성과 분석 결과 이수성 일치 율 %
임신 9주 8~10일
(working time)
BGI 알고리즘 명 비 공개
T-Score / L Value 방식 미 공개 임신 10주
8~10일 (working time)
BerryGenomics 비 공개
미 공개 임신 10주
8~10일 (working time)
3. Vendor별 알고리즘 비교 Ⅱ. NIPT 원리/ 과정
4. 전체 기법 분류
MPSS(Massive Parallel Shotgun Sequencing) - 전체 염색체를 모두 Sequencing 하는 방식
Target Sequencing - 특정 염색체만 선택 Sequencing하는 방식
Target Sequencing or DANSR(Digital Analysis SNP Regions) - 특정 염색체만 선택 Sequencing하는 방식
기법 분류
Quantitative read Counting -표준 전체 염색체(산모+태아) 정량과 대상 전체 염색체 정량을 비교하여 이상 유무를 판독하는 기법.
SNP Detection 태아의 SNP와 SNP 통계 DATA를 비교하여 이수성 여부 분석하는 기법.
Sequenom Verinata BGI-Health BerryGenome
Ariosa
Natera
Ⅱ. NIPT 원리/ 과정
- 12 -
Ⅲ. NIPT 상용 서비스개발 과정 및 소요 기간 산출
핵심 영향 요소
상용화 개발 과정
소요기간 산출
전체 기법 분류
- 13 -
1. 핵심 영향 요소 Ⅲ . NIPT 상용 서비스개발 과정 및 소요 기간 산출
샘플 준비
• 다수 혈액 샘플 필수(MPSS/Target)
• ex: BGI: 11만개 이상, Sequenom : 약 300 개.
• Target 시, Target 번호의 염색체만 정확히 체취
하는 숙련 경험 필요. (Quality Control Skill)
• GC Rate의 이상 시, 샘플부터 재 작업이 필요
NIPT 알고리즘 확보
• 일반Data 분석에서 쓰이는 Align/Variant 알고리
즘은 많이 공개되어 공유되는 것과는 달리, NIPT
염색체 이상을 분석하는 고도화 분석 Algorithm
은 비공개로 많은 최적화 작업을 통해 완성된 것
으로 미 확보 시, 단 기간에 개발 불가 함.
정확한 Test 결과로 통계 DATA 축적
• 확보된 다수의 샘플들과 알고리즘 판독의 객관적
정확성을 증명하기 위해 일정기간 동안 처리한
정확한 산술 근거와 TEST 통계 축적이 필수
Performance 고도화
• 타 상용 서비스 비교하여, 분석 처리 기간과
정확도 결과가 동일 이상 수준의 성능 확보
위해 반복된 샘플 작업부터 고도화 분석까지
숙련된 성능 고도화가 필수 필수.
상용화 기술 핵심
영향 요소
- 14 -
2. 상용화 개발 과정
• 방식결정(MPS/Target)
• 전체/단계별 일정 • 샘플검증/확보 방안 - Quality 점검필요 - Probe/Primer 설계
• 목표수준(성능)확정 - 정확도, 처리시간
• 장비 상태 점검 - DNA 절삭/추출 기. - 원심분리/ Lib 제작 기. - PCR/Sequencing - 기본 Pipe-line S/W
계획/준비/설계 Sample 작업 Sequencing 기본 분석 (Align/분류)
NIPT 분석 (고도화 분석)
• 특정번호 염색체 획득 - Target 시, 특정 위치 염색체 획득을 위한 Probe 포함 시약 통해 염색체 고착/구별 시킴.
• DNA 추출/절삭 - 일정 크기 DNA 절삭
• DNA Library 제작 - Primer 포함 시약 통해 Primer + DNA 결합
• DNA Library 증폭 - Sequencing 장비에 맞는 증폭 방식으로 증폭.
• MPSS : 전체 염색체 진행. 약 1천2만 bp Read (염기서열) 산출.
• Target: 특정 염색체,13,18,21, X,Y 등 특정 염색체 서열만 산출.
• MPSS : Mapping(Align) - Reference와 비교/분류
• Target-SNP: - Variant calling 필요 • NIPT 알고리즘 연동
• MPSS: GC Content 확인
염기 서열 정량 분석 ( 알고리즘 구동) • SNP 통계 분석.
• 알고리즘 고도화
• Reporting - 신뢰 수준이 맞는 분석 결과 Reporting.
Ⅲ . NIPT 상용 서비스개발 과정 및 소요 기간 산출
③Sequencing
과정
④기본 분석
과정
⑤고도화 분석
과정 후,
성능 확인
⑥원인 분석
수정 과정
②Sample
Preparation
과정
- 15 -
일반 전문가 최소 8개월 이상
NIPT 전문가와 알고리즘 확보 시, 이 기간 필요 없음.
①계획/준비 과정
NIPT 전문가와 알고리즘 확보 시, 성능 확인<->보정 작업<->통계 Data 축척을 위한 test 진행(목표 Sample 수)으로 약 7개월 소요
3. 소요기간 산출
【 NIPT 알고리즘 확보 후, 상용화 준비 과정 】
일반 전문가(비 NIPT 전문가) 전체, 최소 20개월 이상 필요
【 NIPT 알고리즘 개발 단계】 【 상용 시작 】
알고리즘 설계
Logic 구현
Code Optimize
Debugging 일반전문가 경우,
약 12 개월 반복 작업
◎ 상용 가능 수준 • 진단 범위 - T13,18,21 모두 지원. - 성 염색체(XX,XY) 이상 진단. 정확 성(모든 종류에서) - Sensitivity :99.9% 이상. - Specificity : 99.9% 이상 Turn around Time(처리속도) -10일 이내
※Sensitivity 높음=false negatives적음 Specificity 높음 =false positive 적음
Ⅲ . NIPT 상용 서비스개발 과정 및 소요 기간 산출
END OF DOCUMENT
감사합니다