Upload
thuong-ho
View
384
Download
0
Embed Size (px)
Citation preview
TRƯỜNG ĐẠI HỌC NÔNG NGHIỆP HÀ NỘI
KHOA NÔNG HỌC
CÔNG NGHỆ SINH HỌC
TRONG BỆNH CÂY (Bài giảng)
3 tín chỉ
Biên soạn
TS. Hà Viết Cường
2009
2
Mô tả môn học
Ứng dụng công nghệ sinh học trong nghiên cứu:
1. Sự đa dạng của tác nhân gây bệnh
2. Tương tác giữa tác nhân gây bệnh và cây
3. Chẩn đoán tác nhân gây bệnh
4. Phòng chống tác nhân gây bệnh
Các nhóm tác nhân gây bệnh được lựa chọn là nấm/nấm trứng, vi khuẩn và virus. Các
kiến thức trên sẽ được minh họa dựa trên các tác nhân gây bệnh/cây ký chủ quan trọng (hoặc
là mô hình nghiên cứu phổ biến trên thế giới; hoặc có ý nghĩa kinh tế đối với Việt Nam).
Mục tiêu
Sinh viên có khả năng hiểu và vận dụng các kiến thức của môn học trong nghiên cứu bệnh
cây đặc biệt trong chẩn đoán, nghiên cứu đa dạng và phòng chống.
Học phần tiên quyết
Bệnh cây đại cương (hoặc Bệnh cây Nông nghiệp)
Công nghệ sinh học thực vật
3
MỤC LỤC
Giới thiệu CNSH trong bệnh cây .................................................................................... 8 1.1. Khái niệm về công nghệ sinh học ........................................................................ 8
1.2. Công nghệ sinh học trong bệnh cây ..................................................................... 8
Chương 1. Di truyền quần thể trong bệnh cây ............................................... 9
1. Sinh học quần thể của tác nhân gây bệnh ............................................................ 9
2. Tiến hóa ................................................................................................................ 9
2.1. Tiến hóa.............................................................................................................. 9
2.2. Sinh học tiến hóa: Di truyền quần thể và phả hệ trong bệnh cây .......................... 9
3. Năm lực tiến hóa (Five Evolutionary Forces) .................................................... 10
4. Đột biến ............................................................................................................... 11
4.1. Định nghia ........................................................................................................ 11
4.2. Vai trò .............................................................................................................. 11
4.3. Một mô hình đột biến đơn giản ......................................................................... 11
4.4. Đột biến trong tác nhân gây bệnh cây................................................................ 13
4.5. Đột biến và chiến lược tạo giống kháng ............................................................ 13
5. Trôi dạt di truyền ............................................................................................... 14
5.1. Định nghĩa ........................................................................................................ 14
5.2. Đặc điểm .......................................................................................................... 14
5.3. Nguyên nhân .................................................................................................... 14
5.4. Đo trôi dạt di truyền .......................................................................................... 14
5.5. Trôi dạt di truyền làm giảm đa dạng di truyền và dẫn tới phân chia quần thể ..... 15
5.6. Trôi dạt di truyền trong tác nhân gây bệnh cây .................................................. 16
5.7. Ví dụ trôi dạt di truyền trong bệnh cây .............................................................. 17
6. Giao lưu gene và kiểu gen (Gene and Genotype Flow) ..................................... 17
6.1. Định nghĩa. ....................................................................................................... 17
6.2. Đặc điểm .......................................................................................................... 17
6.3. Giao lưu gen (gene flow) và giao lưu kiểu gen (genotype flow) ........................ 17
6.4. Phân chia quần thể và giao lưu gen ................................................................... 18
6.5. Ví dụ giao lưu gen trong bệnh cây .................................................................... 20
6.6. Mối liên hệ giữa trôi dạt di truyền và giao lưu gen ............................................ 20
6.7. Khái niệm siêu quần thể và tác nhân gây bệnh .................................................. 21
7. Hệ thống sinh sản/ghép cặp (Reproductive/Mating Systems) ........................... 23
7.1. Đánh giá cấu trúc di truyền trong quần thể ........................................................ 23
7.2. Hệ thống sinh sản và ghép cặp của các tác nhân gây bệnh cây........................... 24
7.3. Đa dạng gen và đa dạng kiểu gen ...................................................................... 26
7.3.1 Đa dạng gen .............................................................................................. 26
7.3.2 Đa dạng kiểu gen ...................................................................................... 27
7.3.3 Ví dụ đo đa dạng gen và đa dạng kiểu gen ................................................. 27
8. Chọn lọc tự nhiên ................................................................................................ 29 8.1. Khái niệm ......................................................................................................... 29
8.2. Hai mô hình chọn lọc ........................................................................................ 30
9. Tương tác giữa các lực tiến hóa và cấu trúc di truyền của quần thể tác nhân
gây bệnh ........................................................................................................................... 30
9.1. Tương tác giữa đột biến và chọn lọc ................................................................. 30
9.2. Tương tác giữa tái tổ hợp và chọn lọc ............................................................... 31
9.3. Tương tác giữa trôi dạt di truyền, giao lưu kiểu gen và chọn lọc........................ 31
4
9.4. Tương tác giữa chọn lọc và giao lưu kiểu gen ................................................... 32
9.4.1 Tương tác giữa tái tổ hợp và giao lưu gen.................................................. 32
9.5. Ứng dụng di truyền quần thể để đánh giá các nguy cơ do tiến hóa của tác nhân
gây bệnh 34
Chương 2. Lựa chọn vùng gen của tác nhân gây bệnh................................. 38
1. Bộ gen của tác nhân gây bệnh ............................................................................ 38
1.1. Bộ gen viroid .................................................................................................... 38
1.2. Bộ gen virus ..................................................................................................... 38
1.3. Bộ gen vi khuẩn và phytoplasma....................................................................... 39
1.4. Bộ gen nấm ...................................................................................................... 40
2. Chọn vùng gen nghiên cứu ................................................................................. 40 2.1. Chọn vùng gen virus ......................................................................................... 40
2.2. DNA ribosome ................................................................................................. 41
2.2.1 Cấu trúc và chức năng RNA ribosome ...................................................... 41
2.2.2 Vai trò của rDNA trong phân loại và nghiên cứu đa dạng và chẩn đoán..... 42
2.3. Gen mã hóa ...................................................................................................... 43
2.4. Các chuỗi lặp .................................................................................................... 43
2.4.1 Các chuỗi lặp liền kề (tandem repetitive sequences) .................................. 43
2.4.2 Các chuỗi lặp phân bố rải rác (Dispersed repetitive sequences) ................. 44
2.5. DNA ti thể (mitochondrial DNA) ...................................................................... 44
Chương 3. Các kỹ thuật CNSH trong nghiên cứu bệnh cây ........................ 45
1. Các marker di truyền ......................................................................................... 45
1.1. Định nghĩa ........................................................................................................ 45
1.2. Phân loại ........................................................................................................... 45
2. Các loại marker phân tử .................................................................................... 45
3. Kỹ thuật dựa trên lai phân tử: RFLP ................................................................ 46
3.1. RFLP: các chú ý về kỹ thuật ............................................................................. 46
3.1.1 RFLP: Các ưu điểm chính ......................................................................... 47
3.1.2 RFLP: Các hạn chế chính .......................................................................... 47
4. Các kỹ thuật dựa trên PCR ................................................................................ 48
5. Các kỹ thuật dựa trên PCR dùng mồi tùy ý: RAPD, AP-PCR và DAF ........... 48 5.1. RAPD ............................................................................................................... 48
5.1.1 RAPD: nhược điểm ................................................................................... 49
5.2. DAF ................................................................................................................. 49
5.3. AP-PCR ............................................................................................................ 49
6. Kỹ thuật dựa trên PCR dùng mồi tùy ý: AFLP ................................................ 49
6.1. AFLP: các bước ................................................................................................ 49
6.2. AFLP: ưu điểm ................................................................................................. 50
6.3. AFLP: nhược điểm ........................................................................................... 50
7. Kỹ thuật dựa trên PCR dùng mồi tùy ý: ISSR .................................................. 50
8. Kỹ thuật dựa trên PCR dùng mồi đặc hiêu: SSR (=Microsatellites) ................ 51 8.1. Phân loại microsatellite ..................................................................................... 51
8.2. Đặc điểm di truyền của microsatellite ............................................................... 51
8.3. Cơ chế tạo đột biến của microsatellite ............................................................... 52
8.4. Phân bố của microsatellite ................................................................................ 53
8.5. Trình tự phân tích microsatellite ....................................................................... 53
8.6. Microsattelite: ưu điểm chính............................................................................ 56
8.7. Microsattelite: nhược điểm chính ...................................................................... 56
9. Marker EST (expressed sequence tags) ............................................................. 56
10. Kỹ thuật CAPS ................................................................................................... 57
5
11. Kỹ thuật SNP ...................................................................................................... 57
12. Kỹ thuật rep-PCR ............................................................................................... 58
13. Tóm tắt các kỹ thuật ........................................................................................... 59
Chương 4. Phân tích kết quả dựa vào số liệu băng điện di .......................... 61
1. Giới thiệu ............................................................................................................ 61
2. Các bước chính trong phân tích đa dạng dựa trên băng điện di ...................... 62 2.1. Mô tả sự đa dạng .............................................................................................. 62
2.2. Tính toán mối quan hệ giữa các đơn vị được phân tích ở bước trên ................... 62
2.3. Biểu diễn mỗi quan hệ ...................................................................................... 62
3. Lượng hóa mức đa dạng: đo đa dạng trong quần thể ....................................... 63 3.1. Dựa trên số lượng biến dị .................................................................................. 63
3.1.1 Mức đa hình hay tỷ lệ đa hình (Pj) ............................................................ 63
3.1.2 Tỷ lệ các locus đa hình (P) ........................................................................ 63
3.1.3 Số allele trung bình trên locus ................................................................... 63
3.2. Dựa vào tần số biến dị ...................................................................................... 64
3.2.1 Số lượng allele hiệu quả (Ae) .................................................................... 64
3.2.2 Mức dị hợp tử kỳ vọng trung bình (H = mức đa dạng di truyền Nei (D) .... 64
3.3. Ví dụ tính đa dạng di truyền trong quần thể dùng 1 marker đồng trội ................ 65
3.4. Ví dụ ................................................................................................................ 65
3.4.1 Các bước tính (bảng dưới) ......................................................................... 66
3.5. Ví dụ tính đa dạng di truyền trong quần thể dùng 1 marker trội ......................... 67
3.5.1 Ví dụ ......................................................................................................... 67
3.5.2 Các bước tính (bảng dưới) ......................................................................... 67
4. Lượng hóa mối quan hệ di truyền: khoảng cách di truyền (nghĩa rộng) ......... 68 4.1. Đánh giá các mối quan hệ dựa theo khoảng cách hình học ................................ 69
4.1.1 Các phương pháp phổ biến tính hệ số tương đồng S (similarity) dựa trên
biến nhị thức (0, 1) ........................................................................................................ 69
5. Phần mềm ........................................................................................................... 70
Chương 5. Phân tích đa dạng, phân loại dựa trên trình tự DNA ................ 71
1. Các thuật ngữ/khái niệm .................................................................................... 71
2. Giải trình tự chuỗi DNA (sequencing) ............................................................... 71 2.1. Giới thiệu ......................................................................................................... 71
2.2. Sequencing dùng BigDye Terminator ............................................................... 71
3. Tìm kiếm chuỗi có quan hệ gần trên ngân hàng gen ......................................... 72 3.1. Ngân hàng gen (Genbank) và NCBI .................................................................. 72
3.2. Tìm kiếm chuỗi DNA trên GenBank bằng phần mềm BLAST .......................... 72
4. So sánh trình tự .................................................................................................. 73
4.1. Căn trình tự đa chuỗi bằng phần mềm ClustalX ................................................ 76
4.2. Xác định mức đồng nhất (sequence identity) bằng phần mềm Bioedit ............... 76
4.3. Xác định khoảng cách di truyền (genetic distance) ............................................ 77
4.3.1 Khái niệm khoảng cách di truyền phân tử .................................................. 77
4.3.2 Mô hình thay thế nucleotide (subtituation model). ..................................... 77
4.3.3 Ví dụ tính khoảng cách di truyền dựa trên 5 chuỗi 16S RNA vi khuẩn dùng
phần mềm MEGA ......................................................................................................... 79
5. Xây dựng cây phả hệ .......................................................................................... 80
5.1. Maximum parsimony ........................................................................................ 80
5.2. Maximum likelyhood ........................................................................................ 82
5.3. Phương pháp khoảng cách (Distance) ............................................................... 82
5.4. Ví dụ xây dựng cây phả hệ của chuỗi các chuỗi 16S RNA vi khuẩn dùng phần
mềm MEGA .................................................................................................................... 85
6
Chương 6. Công nghệ microarray (chip gen) ............................................... 87
1. Giới thiệu ............................................................................................................ 87
2. Các loại microarray DNA................................................................................... 88 2.1. Microarray với các dò oligonucleotide ngắn ...................................................... 88
2.2. Microarrays với dò oligonucleotide dài ............................................................. 88
2.3. Microarrays với dò cDNA ................................................................................ 88
3. Các phương pháp cố định dò trong microarray DNA ...................................... 88
3.1. Tổng hợp trực tiếp ngay trên giá đỡ (in situ) ..................................................... 88
3.2. Tạo microarray bằng spotting ........................................................................... 88
4. Gán nhãn dò........................................................................................................ 89 4.1. Gán nhãn trực tiếp ............................................................................................ 89
4.2. Gán nhãn gián tiếp ............................................................................................ 89
4.3. Gãn nhãn dùng dendrimer ................................................................................. 90
5. Vật liệu để cố định dò ......................................................................................... 90
6. Các phương pháp gắn dò vào lam kính ............................................................. 90
7. Ứng dụng microarray DNA ............................................................................... 91 7.1. Nghiên cứu biểu hiện gen ―gene expression profiling‖ ...................................... 91
8. Chẩn đoán và nghiên cứu kiểu gen (genome typing) ......................................... 91
Chương 7. Công nghệ RNA interference ...................................................... 93
1. Lịch sử phát hiện ................................................................................................ 93
1.1. Hiện tượng đồng ức chế .................................................................................... 93
1.2. Hiện tượng chế ngự (quelling) .......................................................................... 93
1.3. Hiện tượng câm gen cảm ứng bởi virus ............................................................. 93
1.4. RNA Interferrence ............................................................................................ 93
2. Small interfering RNA (siRNA) và microRNA (miRNA) ................................. 94 2.1. miRNAs - khám phá ......................................................................................... 94
2.2. miRNAs - định nghĩa ........................................................................................ 94
2.3. miRNAs – nguồn gốc ....................................................................................... 94
2.4. miRNAs – sinh tổng hợp................................................................................... 94
2.5. siRNAs - khám phá ........................................................................................... 95
2.6. siRNAs - định nghĩa ......................................................................................... 95
2.7. siRNAs – nguồn gốc ......................................................................................... 95
2.8. siRNAs – sinh tổng hợp .................................................................................... 95
3. So sánh miRNA và siRNA .................................................................................. 95 3.1. Giống nhau ....................................................................................................... 95
3.1.1 Khác nhau ................................................................................................. 96
4. Công nghệ RNAi trong tạo giống kháng bệnh virus ......................................... 96
4.1. Giới thiệu ......................................................................................................... 96
4.2. Các đặc điểm chính trong công nghệ RNAi dựa trên siRNA ............................. 97
4.2.1 Thiết kế cấu trúc chuyển gen ..................................................................... 97
4.2.2 Chọn chuỗi gen virus ................................................................................ 97
5. Ví dụ công nghệ RNAi kháng bệnh virus .......................................................... 98 5.1. Tạo cây chuyển gen kháng PVY thông qua RNA silencing ............................... 98
5.1.1 Giới thiệu. ................................................................................................. 98
5.1.2 Thiết kế cấu trúc chuyển gen (hình) và chuẩn bị dòng vi khuẩn chuyển gen
98
5.1.3 Biến nạp cấu trúc chuyển gen vào cây khoai tây ........................................ 99
5.1.4 Các phân tích chính cây chuyển gen .......................................................... 99
5.2. Tạo cây chuyển gen kháng TYLCV thông qua RNA silencing ........................ 100
5.2.1 Giới thiệu. ............................................................................................... 100
7
5.2.2 Thiết kế cấu trúc chuyển gen (hình) và chuẩn bị dòng vi khuẩn chuyển gen
101
5.2.3 Biến nạp cấu trúc chuyển gen vào cây khoai tây ...................................... 102
5.2.4 Các phân tích chính cây chuyển gen ........................................................ 103
6. Sử dụng công nghệ microRNA trong phòng chống bệnh virus ...................... 103
6.1. Dùng công nghệ miRNA tạo tính kháng CMV ................................................ 104
6.1.1 Giới thiệu ................................................................................................ 104
6.1.2 Thiết kế cấu trúc miRNA chuyển gen ...................................................... 104
6.1.3 Chuyển gen vào cây thuốc lá ................................................................... 105
6.1.4 Lây nhiễm nhân tạo ................................................................................. 106
6.1.5 Đánh giá cây chuyển gen được lây nhiễm CMV dựa trên triệu chứng ..... 106
6.1.6 Phân tích miRNA trên cây chuyển gen .................................................... 106
6.1.7 Phân tích RNA của CMV trên cây lây nhiễm .......................................... 106
6.1.8 Phân tích virion CMV trên cây lây nhiễm ................................................ 107
Chương 8. PCR trong chẩn đoán tác nhân gây bệnh ................................. 108
1. Tóm tắt kỹ thuật ............................................................................................... 108
2. Thiết kế và lựa chọn mồi (primer) ................................................................... 108
2.1. Tự thiết kế mồi ............................................................................................... 108
2.1.1 Các chú ý khi thiết kế mồi ....................................................................... 109
2.1.2 Thiết kế mồi chung (degenerate primer) .................................................. 110
2.1.3 Phần mềm ............................................................................................... 110
2.2. Ví dụ mồi chung ............................................................................................. 110
Chương 9. Công nghệ huyết thanh học trong chẩn đoán ........................... 112
1. Cơ sở của phản ứng huyết thanh học ............................................................... 112
2.3. Các khái niệm ................................................................................................. 112
2.3.1 Kháng nguyên (antigen): ......................................................................... 112
2.3.2 Nhóm quyết định kháng nguyên (epitope) ............................................... 112
2.3.3 Kháng nguyên của tác nhân gây bệnh cây ............................................... 112
2.3.4 Kháng thể (antibody) .............................................................................. 112
2.4. Kháng thể đơn dòng và kháng thể đa dòng ...................................................... 113
3. Sản xuất kháng thể đơn dòng ........................................................................... 114 3.1. Các bước chính để sản xuất kháng thể đơn dòng gồm ..................................... 114
3.2. Qui trình tạo kháng thể đơn dòng .................................................................... 115
3.2.1 Gây miễn dịch trên thỏ ............................................................................ 115
3.2.2 Dung hợp (lai) ......................................................................................... 115
3.2.3 Sản xuất .................................................................................................. 116
4. Kỹ thuật chẩn đoán bằng ELISA ..................................................................... 117 4.1. Vật liệu chính cho ELISA ............................................................................... 117
4.2. Các kỹ thuật ELISA. ....................................................................................... 117
4.2.1 Kỹ thuật ELISA trực tiếp kiểu kẹp kép kháng thể (DAS-ELISA) ............ 118
4.2.2 Phản ứng ELISA gián tiếp kiểu bẫy kháng nguyên trước (PTA-ELISA) .. 118
8
Giới thiệu CNSH trong bệnh cây
1.1. Khái niệm về công nghệ sinh học
Có rất nhiều định nghĩa về công nghệ sinh học (biotechnology) nhưng nhìn chung CNSH
có thể được hiểu theo 2 nghĩa. Theo nghĩa rộng, điển hình như định nghĩa trong Công ước về
Đa dạng Sinh học của Liên hiệp quốc (1992) thì CNSH là ―Bất kỳ ứng dụng công nghệ sử
dụng các hệ thống sinh học, các sinh vật sống hoặc các thành phần của chúng nhằm tạo ra
hoặc biến đổi các sản phẩm hoặc qui trình cho một mục đích đặc biệt‖ ―any technological
application that uses biological systems, living organisms, or derivatives thereof, to make or
modify products or processes for specific use‖. Một cách đơn giản, CNSH là công nghệ được
áp dụng trên một đối tượng sinh vật.
Hiện nay, CNSH thường được hiểu theo nghĩa hẹp hơn nhiều. Nó thường được xem như
các công nghệ liên quan đến sinh học phân tử chẳng hạn công nghệ AND, công nghệ chuyển
gen, công nghệ nuôi cấy mô và tế bào...Theo định nghĩa của FAO: CNSH là kiến thức liên
quan đến khía cạnh phân tử của sinh vật và tế bào của chúng.
1.2. Công nghệ sinh học trong bệnh cây
Bệnh cây học (phytopathology = plant patho logy) nghiên cứu 4 lĩnh vực chính:
1. Tác nhân gây bệnh (pathogens): nghiên cứu đặc điểm hình thái, sinh học, phân loại, di
truyền, tiến hóa của tác nhân gây bệnh.
2. Tương tác giữa tác nhân gây bệnh và cây ký chủ (plant-pathogen interaction): nghiên
cứu cơ chế tấn công của tác nhân gây bệnh và cơ chế phòng thủ của cây, hậu quả của mối
tương tác này đối với cây (các biến đổi cấu trúc và chức năng của tế bào và mô cây bị
bệnh).
3. Dịch bệnh học (phytopathological epidemiology): nghiên cứu động thái phát triển của
bệnh cây theo không gian và thời gian, các yếu tố của cây ký chủ, môi trường , tác nhân
gây bệnh và con người ảnh hưởng đến sự hình thành và phát triển của bệnh.
4. Phòng chống: nghiên cứu các nguyên lý phòng chống, các biện pháp phòng chống.
Công nghệ sinh học trong bệnh cây, do vậy, cũng nhằm vào 4 lĩnh vực trên.
Các nghiên cứu đa dạng, tiến hóa của các nhóm tác nhân gây bệnh chủ yếu dựa vào các
phân tích phân tử. Nhiều nhóm tác nhân gây bệnh, chẳng hạn virus, viroid, phytoplasma, chỉ
có thể được xác định, phân loại chính xác khi phân tích bộ gen của chúng. Xác định đầy đủ
thành phần, nguồn gốc, mức độ đa dạng của tác nhân gây bệnh luôn là thông tin đầu tiên và
quan trọng đối với bất kỳ chiến lược phòng chống nào.
Sự tương tác giữa tác nhân gây bệnh và cây thường rất phức tạp với sự tham gia của
nhiều gen ở cả 2 phía. Hiện nay, một công nghệ dựa trên lai phân tử gọi là công nghệ
microarray (chip gen) có thể xác đinh sự biểu hiện đồng thời của hàng chục nghìn gen chỉ trên
một lam kính.
Trong lĩnh vực phòng chống bệnh, có vô số ví dụ cho thấy vai trò của CNSH. Các giống
kháng bệnh có thể đươc tạo ra dùng 2 chiến lược chính: (i) dùng gen kháng có nguồn gốc từ
cây. Đây là chiến lược áp dụng cho mọi đối tượng dịch hại. (ii) dùng gen từ tác nhân gây bệnh
để tạo tính kháng (tính kháng có nguồn gốc từ bệnh). Đây là chiến lược áp dụng cho các bệnh
virus. Vai trò của CNSH thể hiện ở các kỹ thuật phân lập gen kháng, thiết kế các cấu trúc
chuyển gen, chuyển gen, lai tạo với sự trợ giúp của các marker phân tử. Sử dụng VSV đối
kháng hoặc các sản phẩm có nguồn gốc VSV để phòng chống bệnh cũng có thể được xem là
ứng dụng CNSH (theo nghĩa rộng) trong bệnh cây.
9
Chương 1. Di truyền quần thể trong bệnh cây
Mục tiêu của chương này là cung cấp các khái niệm cơ bản trong di truyền quần thể. Các
khái niệm này sẽ rất cần thiết giúp sinh viên có khả năng phân tích kết quả sau khi thực hiện
các thí nghiệm dựa trên công cụ CNSH khi đánh giá đa dạng của tác nhân gây bệnh cây.
1. Sinh học quần thể của tác nhân gây bệnh
Sinh học quần thể nghiên cứu các quá trình sinh học ảnh hưởng tới quần thể sinh vật.
Sinh học quần thể, do vậy, cũng là một lĩnh vực nghiên cứu của bệnh cây học vì bệnh cây chỉ
hình thành dưới tác động của 1 quần thể tác nhân gây bệnh. Một vết bệnh trên lá sẽ không có
ý nghĩa về mặt kinh tế lẫn sinh thái. Một vụ dịch gây thiệt hại kinh tế lớn thường do vô số các
sự kiện xâm nhiễm gây bệnh liên quan đến toàn thể quần thể ký sinh và ký chủ. Để phòng
chống bệnh, người ta phải xây dựng các biện pháp phòng chống nhằm vào toàn bộ quần thể
tác nhân gây bệnh. Như vậy, hiểu được sinh học quần thể tác nhân gây bệnh là bước quan
trọng nhằm phát triển các chiến lược phòng chống bệnh hiệu quả.
Một quần thể là một tập hợp các cá thể cùng loài chiếm một không gian địa lý nhất định
và thể hiện sự liên tục về mặt sinh sản từ thế hệ này sang thế hệ khác. Mối tương tác sinh thái
và sinh sản của các cá thể trong cùng quần thể, do vậy, phổ biến hơn so với mối tương tác của
các cá thể thuộc các quần thể khác nhau.
Di truyền quần thể tập trung vào quá trình dẫn tới trao đổi di truyền hay tiến hóa trong
quần thể theo thời gian và không gian. Phần lớn các nghiên cứu di truyền quần thể dựa trên
qui mô thời gian dài (ví dụ qua nhiều mùa vụ hoặc qua nhiều thế hệ tác nhân gây bệnh) và
không gian lớn (ví dụ qui mô toàn cầu cho các đối tượng bệnh có thể phát tán xa). Di truyền
quần thể giải quyết chủ yếu các các quá trình di truyền như đột biến, trôi dạt di truyền, giao
lưu gen, hệ thống sinh sản/ghép cặp và chọn lọc tự nhiên.
2. Tiến hóa
2.1. Tiến hóa
Tiến hóa là một quá trình thay đổi vật liệu di truyền từ thế hệ này sang thế hệ khác và
gồm 2 bước. Đầu tiên là quá trình đột biến gen hoặc tái tổ hợp di truyền xảy ra và tạo nên sự
đa dạng di truyền trong quần thể. Tiếp theo, các quá trình như chọn lọc hoặc trôi dạt di truyền
sẽ tác động làm thay đổi tần số allele trong quần thể.
Tiến hóa, như vậy, hình thành từ sự thay đổi tần số allele trong quần thể. Ví dụ, khi một
quần thể cây ký chủ trải qua một sự gia tăng trong tần số các allele kháng hình thành từ sự
chọn lọc các cá thể kháng thì quần thể cây này đã tiến hóa lên một mức độ kháng cao hơn.
Tương tự, khi một quần thể tác nhân gây bệnh không độc trải qua một sự gia tăng trong tần số
allele độc nhờ quá trình chọn lọc các cá thể độc có khả năng thoát khỏi sự nhận biết của các
allele kháng của cây ký chủ kháng bệnh thì người ta gọi quần thể tác nhân gây bệnh này đã
tiến hóa tới một mức độ độc cao hơn.
2.2. Sinh học tiến hóa: Di truyền quần thể và phả hệ học trong bệnh cây
Sinh học tiến hóa là một ngành nghiên cứu quá trình dẫn tới thay đổi di truyền hoặc tiến
hóa của quần thể hoặc của loài. Di truyền quần thể và phả hệ học là 2 ngành phụ trong sinh
học tiến hóa. Di truyền quần thể nghiên cứu các quá trình vi tiến hóa (microevolution) xảy ra
trong loài nhằm giải thích sự phân bố biến dị di truyền bên trong các quần thể hoặc giữa các
quần thể của cùng loài. Phả hệ học nghiên cứu các quá trình đại tiến hóa (macroevolution)
xảy ra trong loài nhằm giải thích mối quan hệ phả hệ (quan hệ tổ tiên – con cháu) dẫn tới sự
phân bố của loài hiện tại theo không gian và thời gian.
10
Hình 1. Mối quan hệ giữa phả hệ học và di truyền quần thể trong quá trình biệt hóa loài
Bệnh cây học nghiên cứu sinh học tiến hóa vì (1) quần thể tác nhân gây bệnh thường tiến
hóa nhằm phản ứng lại các biện pháp phòng chống và (2) người ta thường không rõ liệu một
quần thể tác nhân gây bệnh mới hình thành và thay thế một quần thể đang tồn tại trước đó là
một quần thể chuyển ký chủ hay là một loài mới hoàn toàn. Phân tích phả hệ sẽ phân biệt
được các loài dựa trên mối quan hệ tổ tiên – con cháu từ các tổ tiên chung; trong khi đó di
truyền quần thể xác định mối quan hệ giữa các quần thể của cùng một loài. Ranh giới giữa di
truyền quần thể và phả hệ học là sự biệt hóa loài (speciation) tức là quá trình hình thành loài
mới. Sự biệt hóa loài có thể xảy ra trong cùng một vùng địa lý, hoặc tại các vùng địa lý cách
xa nhau hoặc tại các vùng địa lý lân cận. Sự biệt hóa loài có thể xuất hiện nhanh hơn đối với
tác nhân gây bệnh cây so với các sinh vật khác do hậu quả của sự đồng tiến hóa.
Phả hệ học và di truyền quần thể sử dụng các các công cụ phân tích di truyền khác nhau.
Phân tích phả hệ sử dụng các đặc điểm đặc trưng cho loài nhằm xác định các đơn vị phân loại
dựa trên 2 phương pháp là phương pháp phân nhánh (cladistics) và phương pháp kiểu hình
(phenetics). Di truyền quần thể sử dụng các tần số allele tại các vị trí đa hình (polymorphic
loci) nhằm xác định cấu trúc di truyền và ranh giới quần thể. Cả 2 lĩnh vực nghiên cứu trên
đều nhằm làm sáng tỏ quá trình dẫn tới thành phần quần thể và loài hiện tại.
Trong quá trình xác định nguồn gốc của các loài tác nhân gây bệnh mới, người ta có tể
phải sử dụng các công cụ nghiên cứu của cả phả hệ học và di truyền quần thể.
3. Năm lực tiến hóa (Five Evolutionary Forces)
Trong hệ sinh thái nông nghiệp, chúng ta quan tâm liệu một biện pháp phòng chống
(chẳng hạn dùng một gen kháng, phun một loại thuốc hóa học, áp dụng một chương trình
kiểm dịch mới, luân canh cây trồng…) sẽ ảnh hưởng tới di truyền quần thể hay tiến hóa của
một quần thể tác nhân gây nào đó như thế nào.
Trong di truyền quần thể, nhìn chung, người ta xét 5 lực tiến hóa có ảnh hưởng tới quần
thể tác nhân gây bệnh. Các lực này là:
Đột biến (mutation)
Trôi dạt di truyền (genetic drift)
Giao lưu gen/kiểu gen (gene/genotype flow)
Hệ thống sinh sản/ghép cặp (reproductive/mating type systems)
Phả hệ học (Phylogenetics)
(Đại tiến hóa = macroevolution)
Biệt hóa loài (Speciation)
Di truyền quần thể (Population genetics)
(Vi tiến hóa = microevolution)
Sinh
học
tiến
hóa
11
Chọn lọc tự nhiên (natural selection)
Nếu không có đột biến, trôi dạt di truyền, giao lưu gen/kiểu gen và chọn lọc tự nhiên thì
quần thể sẽ đạt tới trạng thái cân bằng theo định luật Hardy-Wenberg.
Để đơn giản, chúng ta sẽ xét chỉ một lực tiến hóa tại một thời điểm mặc dù trong tự
nhiên, tất cả các lực này thường xảy ra đồng thời và tương tác với nhau để định hình cấu trúc
di truyền của quần thể.
4. Đột biến
4.1. Định nghia
Đột biến là 1 thay đổi trong DNA ở một locus nào đó của sinh vật.
4.2. Vai trò
Đột biến là một lực tiến hóa yếu để có thể làm thay đổi tần số allele nhưng là một lực
tiến hóa mạnh để tạo ra một allele mới. Đột biến là nguồn chủ yếu để tạo thành các allele
mới trong quần thể tác nhân gây bệnh. Do vậy, đột biến cũng cũng là nguồn chủ yếu để tạo
thành các allele mới có khả năng tạo ra các kiểu gen mới của một tác nhân gây bệnh (chẳng
hạn chủng mới, dạng chuyên hóa mới).
Đột biến đóng một vai trò quan trọng trong tiến hóa. Nguồn chủ yếu các biến dị di
truyền là đôt biến. Đột biến quan trọng vì là bước đầu tiên của tiến hóa khi nó tạo ra các trình
tự DNA mới cho môt gene (tức tạo ra các allele mới). Cần chú ý là tái tổ hợp (recombination)
cũng có vai trò tương tự. Đột biến có vai trò như là một lực tiến hóa vì nó có khả năng gây ra
những thay đổi đáng kể trong tần số allele qua một thời gian rất lâu. Nhưng nếu đột biến là
lực tiến hóa duy nhất tác động lên quần thể tác nhân gây bênh thì tốc độ tiến hóa thấp tới mức
chúng ta không thể quan sát thấy được.
Trong bệnh cây, chúng ta thường quan tâm nhất tới các đột biến ảnh hưởng tới tính độc
của tác nhân gây bệnh hoặc tính mẫn cảm đối với thuốc hóa học. Đối với tác nhân gây bênh
có mối quan hệ gene-đối-gene đối với cây thì chúng ta đặc biệt quan tâm tới các đột biến làm
tác nhân gây bệnh chuyển từ tính không độc sang tính độc vì đây là các đột biến dẫn tới mất
tính kháng di truyền của cây ở cả hệ sinh thái nông nhiệp và hệ sinh thái tự nhiên. Tuy nhiên
các đột biến làm tác nhân gây bệnh chuyển từ trạng thái mẫn cảm thuốc sang trạng thái kháng
thuốc cũng quan trọng trong hệ sinh thái nông nghiệp vì chúng ảnh hưởng tới tính thích nghi
của tác nhân gây bệnh.
4.3. Một mô hình đột biến đơn giản
Nhằm chứng minh đột biến có thể dẫn tới thay đổi tần số allele như thế nào, hãy xét một
mô hình đột biến đơn giản. Giả sử chúng ta có 2 allele ở một locus gọi là A1 và A2, trong đó
A1 có thể đột biến thuận thành A2 và A2 có thể đột biến ngược thành A1. Tiếp theo, giả sử
A1 đột biến thành A2 với tần số u trên một thế hệ (u là tốc độ đột biến thuận), A2 đột biến
ngịch thành A1 với tần số v trên 1 thế hệ (v là tốc độ đột biến nghịch). Ở thời điểm t, tần số
của allele A1 là pt và tần số allele A2 là qt. Ở mọi thế hệ, có một tỷ lệ allele A1 bị đột biến
thành A2. Tỷ lệ này sẽ bằng tốc độ đột biến thuận u nhân với tần số allele A1 = up. Tương tự,
ỏ mọi thế hệ cũng có một tỷ lệ allele A2 đột biến nghịch thành allele A1 và tỷ lệ này = vq.
12
f(A1) = pt f(A2) = qt
A1 = avirulence allele, A2= virulence allele
Thuận (u)
A1
A2
Nghịch (v)
up
A1 A2
A1 A2
vq
q = upt - vqt thêm mất
Điều gì sẽ xảy ra với tần số allele A2 với điều kiện trên? Ở mọi thế hệ, tần số allele A2 sẽ
tăng lên (up) do đột biến thuận nhưng cũng đồng thời bị giảm (vq) do đột biến nghịch. Như
vậy, ở mỗi thế hệ, tổng thay đổi tần số allele A2 (q) = up – vq. Có thể suy ra tần số allele A2
ở thế hệ t +1 sẽ là
q(t+1) = qt + q
q(t+1) = qt + (upt - vqt)
Ví dụ
Giả sử u = 1 x 10-5
và v = 1 x 10-6
/ thế hệ (đây là tốc độ đột biến thuận và nghịch điển
hình). Giả sử tần số allele A1 (p) = 0.99 và tần số A2 (q) = 0.01. Vậy tần số mới của A2 là bao
nhiêu sau một thế hệ đột biến?
Tần số mới của allele A2 = 0.01 + [(10-5
)(0.99) - (10-6
)(0.01)] = 0.01 + 9.89 x 10-6
=
0.01001.
Chúng ta có thể thấy rằng sự thay đổi tần số allele A2 là không đáng kể qua mỗi thế hệ.
Nhìn chung, sau t thế hệ, tần số của allele A1 (wild-type) sẽ là:
pt = p0(1-u)t
Để tính số thế hệ cần nhằm thay đổi tần số allele với một số cho trước:
t = log(pt/p0)/log(1-u)
Chúng ta có thể dùng công thức trên để tính số thế hệ cần để thay đổi các tần số allele với
điều kiện đột biến là lực tiến hóa duy nhất tác động lên quần thể. Để thay đổi tần số allele 1%
(0.01) sẽ cần một thời gian dài. Giả sử u = 10-5
/ thế hệ (đây là một tốc độ đột biến cao). Để
chuyển tần số allele A1 từ 1.00 lên 0.99 (thay đổi 1%) sẽ cần 2000 thế hệ. Để chuyển tần số
này từ 0.10 lên 0.09 (thay đổi 1%) sẽ cần 10,000 thế hệ. Nhìn chung, khi tần số của allele
hoang dại giảm thì nó sẽ cần thời gian lâu hơn để tạo ra cùng số lượng đột biến.
Mô hình này chứng tỏ rằng đột biến là lực tiến hóa rất yếu để có thể thay đổi tần số
allele.
Tuy nhiên, đột biến lại quan trọng trong khi tạo ra các allele mới trong quần thể. Số
lượng allelle trong quần thể biến đổi theo kích thước quần thể. Tốc độ đột biến được tính theo
thế hệ. Một tốc độ đột biến = 1 x 10-6
có thể có ý nghĩa là một đột biến ở một cặp gen sẽ xuất
hiện một lần / 1 triệu tế bào / thế hệ hoặc cũng có thể có ý nghĩa là đột biến ở một cặp gen sẽ
xuất hiện một lần / 1 triệu cặp base / thế hệ. Các đột biến chỉ có thể truyền sang thế hệ con
cháu nếu xuất hiện ở các tế bào sinh sản như bào tử nấm, trứng + tinh trùng (của tuyến trùng,
côn trùng), tế bào vi khuẩn hoặc phân tử virus. Một đột biến = 1 x 10-6
cũng ngụ ý rằng đột
13
biến xuất hiện ở tần số 1 / 1 triệu cá thể của quần thể. Tốc độ đột biến they đổi theo gen và
loại sinh vật, nhưng nhìn chung chúng thường thấp và có thể được xem là sự kiện hiếm trong
hầu hết các trường hợp.
Giả sử một đột biến có tốc độ 1 x 10-6
. Điều này có nghĩa trung bình, trong 1 quần thể 1
triệu cá thể (bào tử nấm, tế bào vi khuẩn, phân tử virus), người ta có thể hy vọng tìm được 1
đột biến trên bất kỳ một locus gen/thế hệ. Tương tự, trong 1 quần thể 10 triệu cá thể, người ta
có thể hy vọng tìm thấy 10 đột biến.
4.4. Đột biến trong tác nhân gây bệnh cây
Lấy 1 ví dụ là nấm phấn trắng lúa miến (barley) Blumeria graminis f. sp. hordei. Một vết
bệnh phấn trắng thành thục tạo ~104 bào tử /ngày. Nếu chỉ số bệnh (= % diện tích lá bị bệnh)
trên một cánh đồng là 10 % thì sẽ có khqảng 105 vết bệnh / m
2 và số lượng bào tử hình thành
là khoảng 109 bào tử/ m
2 / ngày hay 10
13 bào tử/ ha/ ngày. Với một tốc độ đột biến = 10
-6 tại
một locus qui định tính không độc thì sẽ có khoảng 107 bào tử mang đột biến độc được tạo ra
/ha/ngày. Các đột biến độc này phát tán sang các ruộng trồng giống kháng trồng cạnh đó và
nhiễm trên các cây mang gen kháng và tạo ra một thế hệ con cháu mang gen độc. Quá trình
này xảy ra khá phổ biến đối với nấm sương mai và gỉ sắt, và cuối cùng dẫn tới cái gọi là chu
trình ―đỉnh – và – đáy‖ (boom – and – bust). Trong chu trình này, đột biến là giai đoạn đầu
tiên chủ chốt để tạo ra ―đáy‖.
Nhìn chung, quần thể tác nhân gây bệnh lớn thường có nhiều allele hơn quần thể nhỏ vì
có nhiều đột biến là nguyên liệu cho chọn lọc hoặc trôi dạt di truyền. Đây là một lý do người
ta nên giữ quần thể tác nhân gây bệnh ở kích thước càng nhỏ càng tốt. Về lý thuyết, nếu kích
thước quần thể là <106, người ta khó có thể tìm được nhiều allele đột biến cho bất kỳ gene
nào, kể cả gene độc.
Ngoài ra, kích thước quân thể lớn thường chứa nhiều allele hơn do chúng trải qua trôi dạt
di truyền ít hơn. Như trình bày ở phần..., trôi dạt di truyền làm giảm số lượng allele của quần
thể.
Cuối cùng, sự đa dạng của các allele tại một locus sẽ bị ảnh hưởng bởi độ dài thời gian
mà quần thể chiếm một vùng địa lý nào đó. Quan hàng ngàn thế hệ, nhiều đột biến sẽ được
hình thành trong quần thể và một số trong các đột biến này có thể gia tăng tần số ở mức có thể
phát hiện được do hậu quả của chọn lọc và trôi dạt di truyền. Cả 2 quá trình này có thể phải
diễn ra trong một thời gian rất lâu để có thể tạo ra một sự gia tăng về mức độ đa dạng allele có
thể lượng hóa được. Khái niệm «trung tâm đa dạng di truyền » thường được dùng để xác định
trung tâm khởi nguyên của của một cây ký chủ và ký sinh của nó. Trung tâm đa dạng di
truyền thường là trung tâm khởi nguyên của cả ký sinh và ký chủ và là nơi quá trình đồng tiến
hóa đã xảy ra trong khoảng thời gian lâu nhất. Vì hậu quả của quá trình đồng tiến hóa, trung
tâm khởi nguyên sẽ có sự đa dạng lớn nhất các allele kháng (của ký chủ) cũng như các allele
độc và không độc của ký sinh.
4.5. Đột biến và chiến lược tạo giống kháng
Xét các ảnh hưởng của việc qui tụ các gene kháng. Nếu 2 gene kháng được đưa vào đồng
thời trên một cây ký chủ thì tác nhân gây bệnh sẽ phải cần đồng thời 2 đột biến từ trạng thái
không độc sang độc. Nếu giả sử tốc độ đột biến điển hình = 10-6
, thì xác xuất để 2 đột biến
này cùng xuất hiện trong một chủng là 10-6
x 10-6
= 10-12
. Như vậy, lấy lại ví dụ về bệnh phấn
trắng lúa miến ở trên, sẽ chỉ khoảng 10 đột biến kép có thể xảy ra mỗi ngày/ha. Nếu người ta
đưa vào 3 gene kháng, thì xác suất tạo 3 đột biến đồng thời là 10-18
và sẽ chỉ có 1 cá thể mang
3 đột biến đồng thời / 105 ha cây ký chủ. Đây là lý do tại sao các nhà chọn giống thích đưa
nhiều gen kháng vào một giống. Vì diện tích 106 ha là diện tích canh tác cây cốc khá phổ biến
ở nhiều nơi trên thế giới (?) và thường chỉ có thể cho 2-3 gene kháng nên người ta có thể hỏi
14
tại sao tính kháng không bị bẻ gẫy nhanh chóng. Lý do là không phải tất cả các cá thể (bào tử)
mang nhiều đột biến đông thời để bẻ gây tính kháng đa gene có cơ hội nhiễm trên cây kháng.
Phần lớn trong số chúng sẽ rơi xuống đất, biến mất trên không khí, rơi trên cây ký chủ không
phù hợp, và thậm chí nếu rơi trên cây ký chủ thích hợp thì lại gặp phải điều kiện môi trường
không phù hợp cho sự nhiễm bệnh.
5. Trôi dạt di truyền
5.1. Định nghĩa
Trôi dạt di truyền là 1 quá trình trong đó tần số allele của một quần thể bị thay đổi qua
các thế hệ một cách hoàn toàn ngẫu nhiên.
5.2. Đặc điểm
Trôi dạt di truyền là một quá trình ngẫu nhiên có thể dẫn tới các thay đổi lớn về cấu trúc
di truyền của quần thể trong thời gian ngắn.
Trôi dạt di truyền dẫn tới cố định allele hay kiểu gene trong quần thể, làm tăng hệ số giao
phối và tăng mức đồng hợp tử (homozygosity) do hâu quả của việc loại bỏ các allele.
Trôi dạt di truyền có lẽ phổ biến trong các quần thể trải qua chu kỳ tuyệt chủng
(extinction) và tái xuất hiện (recolonization). Điều này đặc biệt quan trọng trong hệ sinh thái
tự nhiên nơi cả ký sinh và ký chủ phân bố không đều với mỗi phần là 1 quần thể nhỏ.
Vì trong trôi dạt di truyền, tần số allele không thay đổi theo bất kỳ hướng xác định trước
nào nên người ta còn gọi trôi dạt di truyền là trôi dạt ngẫu nhiên hay trôi dạt di truyền ngẫu
nhiên.
5.3. Nguyên nhân
Trôi dạt di truyền có thể xảy ra do 3 nguyên nhân và chúng ta sẽ xét các nguyên nhân này
theo mối quan hệ tam giác bệnh (cây ký chủ – tác nhân gây bệnh – môi trường).
(1). Sự xuất hiện lại các quần thể có kích thước nhỏ. Kích thước nhỏ của quần thể tác
nhân gây bệnh hình thành lại khi không có nhiều cây ký chủ trên vùng nhiễm bệnh, hoặc khi
môi trường không thích hợp cho sự nhiễm bệnh.
(2). Hiện tượng “thắt cổ chai” (hay là sự suy giảm mạnh kích thước quần thể). Một
hiện tượng thắt cổ chai xuất hiện khi quần thể cây ký chủ bị loại bỏ (ví dụ do thu hoạch), hoặc
khi môi trường thay đổi đã ngăn sự nhiễm bệnh trên cây hoặc tiêu diệt trực tiếp tác nhân gây
bệnh (ví dụ thời tiết khô, nóng, băng giá…)
(3). Hiệu ứng nền. Một hiệu ứng nền xuất hiện khi một số lượng nhỏ các cá thể, đại diện
chỉ một phần nhỏ của tổng vốn gene của loài, bắt đầu một quần thể mới. Chẳng hạn, một hiệu
ứng nền sẽ xuất hiện khi một vài cây mang mầm bệnh thoát khỏi sự kiểm tra của cơ quan
kiểm dịch và hình thành một bệnh tại một nơi vốn trước đây không có bệnh.
5.4. Đo trôi dạt di truyền
Đối với một quần thể, mức độ trôi dạt di truyền phụ thuộc Ne . Ne là kích thước quần thể
hiệu quả (effective population size) và là một quần thể lý tưởng có kích thước xác định. Quần
thể lý tưởng là quần thể trong đó tất cả bố mẹ có cơ hội bằng nhau để là bố mẹ của bất kỳ con
cháu nào (không có chọn lọc). Ne hiếm khi là số lượng cá thể thực sự của quần thể (N, còn gọi
là kích thước dân số). Ne là một số lý thuyết trình bày số lượng cá thể khác biệt về mặt di
truyền đóng góp vào sự hình thành giao tử cho thế hệ kế tiếp. Ne cũng còn được gọi là số cá
thể giao phối khác biệt về di truyền của quần thể. Ne không dễ xác định vì nó bị ảnh hưởng
15
bởi phương thức giao phối và sinh sản (tự thụ, giao phối chéo, sinh sản vô tính) và phụ thuộc
vùng địa lý mà quần thể được lấy mẫu. Ne không dễ xác định đối với các tác nhân gây bệnh
nấm có kiểu sinh sản vô tính và hữu tính hỗn hợp vì số lượng cá thể có thể rất lớn nhưng số
kiểu gene khác nhau có trải qua tái tổ hợp hữu tính có thể tương đối nhỏ. Ví dụ một nghiên
cứu về nấm Mycosphaerella graminicola gây bệnh trên lúa mỳ cho thấy Ne của nấm ít nhất
gồm 70 chủng (strains) / m2 (Zhan et al., 2001).
Nếu biết kích thước quần thể hiệu quả Ne, chúng ta có thể biết trôi dạt di truyền tới mức
nào. Sự biến động (biểu diễn bằng phương sai Var) trong tần số allele (p) của một quần thể
có trôi dạt di truyền được tính theo công thức:
Var (p) = Ne
pq
2 sau 1 thế hệ trôi dạt di truyền đối với sinh vật lưỡng bội
Sau nhiều thế hệ trôi dạt di truyền, một cân bằng hình thành và tại điểm cân bằng, chúng
ta có:
Var (p) = p0q0
Trong đó p0 và q0 là tần số ban đầu của 2 alllele tại một locus.
Nếu p0=q0=0.5 và Ne = 50 thì Var (p) = 0.0025
Độ lệch chuẩn SD của (p) = (0.0025)0.5
= 0.05.
Độ lệch chuẩn là trung bình giá trị tuyệt đối của sai khác được kỳ vọng trong quần thể sau
1 thế hệ trôi dạt di truyền và xấp xỉ bằng thay đổi được kỳ vọng trong tần số allele ( p) trong
một quần thể. Do vậy trong một quần thể có 50 cá thể với 2 allele có tần số ban đầu bằng
nhau thì chúng ta có thể dự đoán tần số các allele này sẽ thay đổi khoảng 5 % qua mỗi thế hệ.
Mức độ thay đổi sẽ tăng khi kích thước quần thể giảm. Ví dụ
Nếu p0=q0=0.5 và Ne = 5 thì Var (p) = 0.05
Độ lệch chuẩn SD của (p) = (0.05)0.5
= 0.22
Trong trường hợp này, quần thể với 5 cá thể trải qua trôi dạt di truyền sẽ có sự thay đổi
tần số allele khoảng 22% qua mỗi thế hệ.
5.5. Trôi dạt di truyền làm giảm đa dạng di truyền và dẫn tới phân chia quần thể
Cơ hội để cố định (fix) một allele tại một locus do trôi dạt di truyền phụ thuộc kích thước
quần thể hiệu quả Ne và tần số của allele đó. Một allele được cố định có nghĩa allele này có
tần số = 1 (tức là tất cả các thể của quần thể có cùng allele này). Trong một quần thể có kích
thước quần thể hiệu quả lớn và các allele có tần số ngang bằng thì cơ hội cho một allele trở
nên được cố đinh sẽ giảm. Các allele có tần số thấp sẽ ở vị trí bất lợi trong quá trình trôi dạt di
truyền vì nguy cơ bị biến mất cao hơn so với các allele có tần số cao.
.Trong điều kiện trôi dạt thuần túy, xác suất cố định của một allele trong một quần thể là
tần số ban đầu của nó. Nếu giả sử tần số ban đầu của một allele là 0.01 thì sẽ có 1% cơ hội để
allele này được cố định trong quần thể.
16
Hình. Xác xuất 1 allele sẽ biến mất do trôi dạt di truyền khi giả sử quần thể có 2 allele với
các tần số ban đầu khác nhau và kích thước quần thể hiệu quả khác nhau.
Trôi dạt di truyền có thể dẫn tới nhiều hậu quả:
Dẫn tới thay đổi tần số allele
Dẫn tới cố định allele do mất allele hoặc kiểu gen
Dẫn tới cố định hay mất toàn bộ kiểu gen của một sinh vật sinh sản vô tính
Dẫn tới tăng tính đồng hợp tử đối với sinh vật lưỡng bội và tăng hệ số tự thụ
Dẫn tới tăng sự sai khác di truyền giữa các quần thể nếu không có sự giao lưu gen
(gene flow) giữa chúng
Trôi dạt di truyền cũng có 2 hậu quả quan trọng về mặt tiến hóa qua thời gian dài.
Tạo điều kiện cho sự biệt hóa loài (tạo loài mới) bằng cách cho phép tích lũy các các
đột biến không thích nghi dẫn tới tạo điều kiện phân chia quần thể
Tạo điều kiện cho sự di chuyển của một quần thể từ mặt bằng thích nghi thấp lên mặt
bằng thích nghi cao hơn theo lý thuyế chuyển dịch cân bằng Sewall Wright.
Sự phân chia quần thể do trôi dạt di truyền sẽ tăng do các allele có trong các quần thể
khác nhau sẽ bị mất một cách ngẫu nhiên. Ngoài ra, thay đổi tần số allele một cách ngẫu
nhiên trong quần thể cũng sẽ xảy ra trong các quần thể khác nhau và các thay đổi ngẫu nhiên
này làm các quần thể trở nên biệt hóa. Cuối cùng, nếu trôi dạt di truyền xảy ra ở các quần thể
có kích thước quần thể hiệu quả nhỏ thì xác suất giao phối chéo giữa các họ hang gần gũi có
xu hướng tăng dẫn tới tăng tự thụ và tiếp theo làm giảm mức dị hợp tử (heterozygosity)
5.6. Trôi dạt di truyền trong tác nhân gây bệnh cây
Trong hệ sinh thái nông nghiệp, các quần thể tác nhân gây bệnh thường trở nên rất lớn do
hậu quả tính đồng nhất di truyền cao của quần thể cây ký chủ. Do vậy, trôi dạt di truyền có
thể không đóng một vai trò quan trọng trong quá trình tiến hóa của tác nhân gây bệnh trong
phạm vi một diện tích canh tác nhỏ (chẳng hạn một cánh đồng của nông dân).
Tuy nhiên đã có rất nhiều bằng chứng về hiệu ứng nền trong hệ sinh thái nông nghiệp.
Một ví dụ điển hình là Úc. Đây là một lục địa độc lập. Trong quá trình khai phá, người châu
Âu đã mang cây trồng cũng như bệnh của chúng vào lục địa này.
17
Trong hệ sinh thái tự nhiên, trôi dạt di truyền có lẽ đóng vai trò lớn hơn trong tiến hóa của
tác nhân gây bệnh vì ngoài tự nhiên, quần thể cây ký chủ đa dạng về di truyền hơn, thường có
phân bố không đều nên kích thước quần thể tác nhân gây bệnh không quá lớn. Hiện tượng
thắt cổ chai thường xuất hiện trong quần thể tự nhiên nhiều hơn so với hệ sinh thái nông
nghiệp. (Xem thêm khái niệm siêu quần thể)
5.7. Ví dụ trôi dạt di truyền trong bệnh cây
Một ví dụ về trôi dạt di truyền trong bệnh cây là trường hợp nấm Puccina striiformis gây
bệnh gỉ sắt dạng sọc lúa mỳ ở Úc. Thông qua các phân tích phân tử, các nhà khoa học phát
hiện thấy rằng nấm này đã tới Úc vào năm 1979 bằng 1 clone từ châu Âu vì trong 2 năm
1979-1980, chỉ 1 race của nấm này được phát hiện tại Úc và giống với 1 race của Châu Âu
(Steele et al. 2001).
6. Giao lưu gene và kiểu gen (Gene and Genotype Flow)
6.1. Định nghĩa.
Giao lưu gene/kiểu gen (hay di cư gen/kiểu gen) là quá trình chuyển vật liệu di truyền
(dưới dạng gen/kiểu gen) từ quần thể này sang quần thể khác của cùng loài.
6.2. Đặc điểm
Giao lưu gen là một lực ngăn cản sự đa dạng của các quần thể. Giao lưu gen phá vỡ rào
cản địa lý hoặc các rào cản khác gây ra sự biệt lập quần thể. Các quần thể biệt lập, do không
có trao đổi di truyền nên sẽ trở nên đa dạng do trôi dạt di truyền và chọn lọc các allele thích
nghi nhất đối với ổ sinh thái của quần thể đó. Nhưng nếu giao lưu gene xuất hiện ở mức độ đủ
lớn và hiệu quả thì các quần thể biệt lập sẽ trở nên không còn đa dạng về di truyền; nói cách
khác chúng trở nên giống nhau và tiến hóa như một đơn vị tiến hóa duy nhất.
Giao lưu gen đặc biệt quan trọng đối với tác nhân gây bệnh cây trong hệ sinh thái nông
nghiệp vì nó là quá trình đưa các gen mới vào một vùng địa lý cách xa điểm xuất hiện đầu
tiên của gen đó. Nó là quá trình đưa các allele độc vào một quần thể mới. Giao lưu gene do
vậy có thể đưa các allele mới thay thế các allele cũ nếu các allele mới thích nghi hơn trên cây
ký chủ hiện tại
6.3. Giao lưu gen (gene flow) và giao lưu kiểu gen (genotype flow)
Trong các quần thể tác nhân gây bệnh chỉ bao gồm một hoặc một vài dòng (chủng) đồng
nhất, có thể xảy ra trường hợp giao lưu gene đặc biệt, trong đó, mỗi dòng (có kiểu gene đồng
nhất) sẽ có nhiều đột biến làm nó khác với dòng ban đầu. Thực tế là nhiều gene di chuyển
cùng với nhau trong các dòng vô tính nên người ta cũng quan tâm tới giao lưu kiểu gene. Giao
lưu kiểu gene là sự di chuyển của toàn bộ kiểu gen từ quần thể này sang quần thể khác. Giao
lưu kiểu gene chỉ xuất hiện đối với các sinh vật có kiểu sinh sản vô tính chiếm ưu thế trong
vòng đời hay hoàn toàn sinh sản vô tính. Ví dụ: giao lưu kiểu gen xuất hiện khi 1 kiểu gen
(clone) của nấm Fusarium oxysporum f. sp. melonis (gây bệnh héo Fusarium trên cây dưa) di
chuyển từ Bắc Mỹ tới Israel qua ủng dính đất mang mầm bệnh của một nhà khoa học. Trong
trường hợp này, vì nấm F. oxysporum không sinh sản hữu tính nên toàn bộ kiểu gen của nó đã
được đưa vào một quần thể nấm mới. Nếu clone này có mức độ thích nghi cao, nó sẽ tồn tại
được ở một vị trí mới.
Đối với vi khuẩn và virus, mặc dù tái tổ hợp có thể xảy ra, nhưng do chúng sinh sản hoàn
toàn vô tính nên giao lưu kiểu gene phổ biến hơn giao lưu gen. Trong khi đó, đối với nấm, do
có cả sinh sản hữu tính và vô tính nên chúng có cả giao lưu gen và giao lưu kiểu gen
18
6.4. Phân chia quần thể và giao lưu gen
Sự phân chia quần thể do trôi dạt di chuyền có thể bị khắc phục nhờ giao lưu gen. Mô
hình dễ nhất để xem quá trình này diễn ra thế nào là mô hình Lục địa – Đảo do Sewall
Wright, một nhà di truyền quần thể, đề xuất.
Hình. Mô hình lục địa – đảo về giao lưu gen
Diễn giải mô hình
Mô hình giả thiết giao lưu gen chỉ xảy ra một chiều từ quần thể cho (lục địa) sang quần
thể nhận (đảo).
Giả sử a là một allele mang đột biến độc xuất hiện tại một locus (A là allele không độc
tương ứng). Giả sử tần số của allele a là f(a) = q và tần số tương ứng của A là f(A) = p.
m = là tỷ lệ quần thể di cư ra đảo
1-m = tỷ lệ quần thể bản địa có sẵn trên đảo
Q = Tần số allele a của quần thể di cư ra đảo
qo = Tần số allele a của quần thể bản địa tiếp nhận allele a từ quần thể di cư
Sau một chu kỳ giao lưu gen chúng ta có:
q1 = (1-m)qo + mQ
q = -m(qo - Q)
Trong đó q = q1-q0
Công thức này có thể được dùng để tính tốc độ thay đổi tần số allele do giao lưu gen.
Ví dụ: xét sự di chuyển giả định của một allele độc (a) của nấm gỉ sắt hại lá lúa mỳ từ Anh
sang Pháp
f(a) = 0.50, quần thể nấm ở Anh có tần số cao về allele độc vì hầu hết các giống lúa mỳ ở
Anh có gen kháng Lr13.
qo = 0.00,
m = 0.05, tốc độ di cư là cao vì một số lượng lớn bào tử đã bay từ Anh sang Pháp qua một
trận bão.
q = -0.05(0.00-0.50) = 0.025
q1 = 0.025 => ~3% của quần thể nấm tại Pháp bây giờ chứa gen độc (avrLr13)
19
Tại điểm cân bằng (sau nhiều chu trình giao lưu gen do bào tử liên tục bay từ Anh sang
Pháp), tần số allele của quần thể cho (Anh) bằng tần số allele của quần thể nhận (Pháp) qo =
Q. Như vậy, tần số của allele độc (avrLr13) sẽ đạt tới 0.50 ở Pháp mặc dù các nhà chọn giống
Pháp không dùng gen kháng Lr13 trong tạo giống kháng bệnh. Đây là một ví dụ giải thích tần
số cao bất thường của các allele độc trong các quần thể của một số tác nhân gây bệnh khi ký
chủ của nó thiếu gen kháng tương ứng.
Nhiều loại mô hình đã được đề xuất phù hợp với nhiều hệ sinh thái nông nghiệp và tự
nhiên khác nhau (Hình)
Hình . Minh họa các mô hình giao lưu gen. A) Mô hình lục địa – đảo (Continent-island); B)
Mô hình toàn đảo (Full island); C) Mô hình bắc cầu một hướng (One-dimensional stepping
stone); và D) mô hình bắc cầu hai hướng (two-dimensional stepping stone).
Kết quả cuối cùng của giao lưu gen là làm cho các quần thể trở nên giống nhau về mặt di
truyền. Hình dưới cho thấy, các quần thể biệt lập về mặt địa lý có thể nhanh chóng hội tụ về
cùng tần số allele khi các quần thể chứa 10% các các thể di cư từ nơi khác.
Hình . Thay đổi tần số allele nhanh chóng qua các thế hệ của 5 quần thể có tốc độ di cư
m=0.1 / thế hệ.
20
6.5. Ví dụ giao lưu gen trong bệnh cây
Có rất nhiều ví dụ về giao lưu gen trong quần thể tác nhân gây bênh qua khoảng cách xa ở
qui mô vùng hoặc toàn cầu.
Giao lưu gen ở qui mô toàn cầu đối với nấm mốc sương khoat tây (Phytophthora
infestans). Dựa vào các kỹ thuật DNA fingerprints, Goodwin et al. (1992, 1994, 1997) đã
cung cấp bằng chứng rõ ràng về sự giao lưu gen của nấm. Vụ dịch toàn cầu vào những năm
1840 làm khoảng 1.5 triệu người chết đói ở Bắc Âu là do sự di cư của một dòng nấm từ
Mexico (là trung tâm khởi nguyên và đa dạng của nấm). Sau khi di chuyển tới Bắc Mỹ, nấm
di chuyển tiếp sang châu Âu qua củ khoai tây bị nhiễm và tiếp theo phát tán khắp toàn cầu
qua hàng hóa thương mại (khoai tây). Nấm yêu cầu 2 kiểu ghép cặp (A1 và A2) để sinh sản
hữu tính. Vì chỉ có một dòng nấm thoát khỏi Mexico nên tất cả các quần thể nấm, được xác
định cho tới gần đây, đều sinh sản vô tính. Bắt đầu cuối những năm 1970, các dòng nấm khác,
kể cả kiểu ghép cặp còn lại ―thoát khỏi‖ Mexico nên hiện nay mức độ đa dạng của nấm ngày
càng tăng (cả về tính gây bệnh và tính kháng thuốc metalaxyl) do sinh sản hữu tính. Kiểu
ghép cặp A2 đầu tiên được phát hiện thấy bên ngoài Mexico là tại Thụy Sĩ vào năm 1980.
Hình Các sự kiện di cư của nấm bắt đầu từ một dòng nấm Phytophora infestans ban đầu
(Goodwin 1997).
6.6. Mối liên hệ giữa trôi dạt di truyền và giao lưu gen
Các biến động di truyền do trôi dạt có thể được khắc phục nhờ giao lưu gen. Nếu có đủ số
lượng cá thể được trao đổi giữa 2 quần thể đang trôi dạt di truyền độc lập thì các quần thể
đang trôi dạt sẽ liên kết về di truyền và sự phân chia quần thể sẽ không xảy ra.
Mối liên hệ này có thể được giải thích nhờ tham số Nem. Ne là kích thước quần thể hiệu
quả (một phép đo của trôi dạt di truyền) và m là phần trăm của quần thể tiếp nhận nhưng chỉ
bao gồm các cá thể nhập cư. Như vậy tích của 2 tham số = Nem là giá trị trung bình của các
các thể nhập cư được trao đổi trong quần thể của mỗi thế hệ. Giá trị của Nem có thể được xác
định dùng phép đo của phân chia quần thể gọi là FST, hay dùng các allele riêng (là các allele
chỉ phát hiện trong một quần thể).
Nếu Nem = 0, không có cá thể di cư nào trao đổi giữa các quần thể. Kết quả là các allele
khác nhau có thể bị cố định do trôi dạt di truyền. Các quần thể trở nên khác nhau và xuất hiện
phân chia quần thể.
Nếu Nem >1, trung bình có 1 hoặc nhiều cá thể trao đổi giữa các quần thể qua mỗi thế hệ,
do vậy quần thể sẽ không phân hóa bởi trôi dạt di truyền và chúng sẽ dần trở nên giống nhau.
Rất ít giao lưu gen cần để chống lại trôi dạt di truyền
21
Nếu Nem = 1, các ảnh hưởng của trôi dạt bị cân bằng lại chính xác bằng ảnh hưởng của
giao lưu gen, quần thể sẽ không phân hóa cũng như không hội tụ
Có thể minh họa nguyên lý trên qua ví dụ sau:
Giả sử p = q = 0.5 (có nghĩa 2 allele tại một locus có mặt ở tần số bằng nhau).
Với Ne = 10, ảnh hưởng của trôi dạt lớn: Var(p) = 0.0125 (s.e. 0.11). Trong quần thể này,
một cá thể nhập cư (Nem = 1) tương ứng m = 0.10; Do vậy, 10 % quần thể là gồm các cá thể
nhập cư. Để chống lại Ne nhỏ thì m phải tương đối lớn.
Với Ne = 10,000, ảnh hưởng của trôi dạt là nhỏ: Var(p) = 0.0000125 (s.e. 0.0035). Trong
quần thể này, một cá thể nhập cư (Nem = 1) tương ứng với m = 0.0001; do vậy 1 % quần thể
là bao gồm các cá thể nhập cư. Để chống lại một Ne lớn thì chỉ cần m nhỏ.
6.7. Khái niệm siêu quần thể và tác nhân gây bệnh
Một siêu quần thể (metapopulation) là 1 tập hợp các quần thể địa phương liên hệ với nhau
bởi sự di cư của các cá thể. Các quần thể địa phương có thể trải qua các chu trình diệt vong và
tái phục hồi; trái lại siêu quần thể có thể tương đối ổn định. Một siêu quần thể là một quần thể
của các quần thể.
Để hiểu được siêu quần thể, cần nhớ rằng các quần thể thực sự chưa bao giờ cân bằng
(ngoại trừ trong các mô hình toán). Do vậy chúng ta có thể xem một loài là một tập hợp các
quần thể nhỏ chưa bao giờ cân bằng.
Các mô hình siêu quần thể có thể giúp giải thích các tác nhân gây bệnh đã tiến hóa như
thế nào trong hệ sinh thái nông nghiệp, đặc biệt đối với các tác nhân gây bệnh nhóm biotroph
– nhóm chỉ gây hại và tồn tại trên mô ký chủ sống. Trong hệ sinh thái nông nghiệp, một ổ
sinh thái mới có thể hình thành đối với một tác nhân gây bệnh khi cánh đồng được trồng với
một cây ký chủ mẫn cảm. Hiệu ứng nền xảy ra khi tác nhân gây bệnh gặp cây ký chủ mẫn
cảm và phát triển số lượng. Ổ sinh thái này bị loại bỏ khi cây được thu hoạch. Sau khi cây ký
chủ bị loại bỏ, tác nhân gây bệnh có thể bị diệt vong (tuyệt chủng) hoặc trải qua quá trình thắt
cổ chai.
Mô hình siêu quần thể nhìn chung không áp dụng cho các nhóm tác nhân gây bệnh luôn
tạo ra các cấu trúc (dạng bảo tồn) lâu dài, có thể tồn tại qua đông hoặc chuyển vụ ngay tại
chỗ.
Một ví dụ rất tốt về mô hình siêu quần thể là mô hình bệnh gỉ sắt cây cốc (lúa mỳ, lúa
miến và yến mạch (wheat, barley, and oats) hàng năm theo đường hướng Puccinia "Puccinia
pathway" ở Bắc Mỹ.
22
Hình. Minh họa đường hướng puccinia của nấm gỉ sắt cây cốc ở Bắc Mỹ. Bào tử nấm gỉ sắt di
chuyển lên phía bắc vào mùa xuân và mùa hè (mũi tên đen) và di chuyển lại xuống phía nam
vào mùa thu (mũi tên đỏ) theo hướng gió
Do việc loại bỏ cây ký chủ phụ là barberry nên giai đoạn qua đông chuyển vụ của nấm gỉ
sắt thân lúa mỳ (Puccinia graminis f. sp. tritici ) không tồn tại trong vùng. Nhiều loài nấm gỉ
sắt lại qua đông ở các bang miền nam như Texas hoặc ở Mexico. Bào tử sẽ theo gió di chuyển
lên phía Bắc theo sự phát triển của cây cốc và tới Canada vào mùa hè - đúng lúc để xâm
nhiễm trên cây cốc đã được trồng vào mùa xuân.
Vào mùa thu, khi cây cốc được thu hoạch ở Canada và các bang Bắc mỹ thì bào từ nấm lại
di chuyển xuống phương nam nhờ gió và nhiễm trên tàn dư cây cốc trên đồng ruộng. Mùa
đông lạnh ở phương Bắc đảm bảo chắc chắn rằng không một bào tử nấm nào có thể tồn tại để
bắt đầu một vụ dịch mới trong năm tiếp theo. Như vậy quần thể nấm địa phương miền bắc sẽ
tuyệt chủng trong mùa đông nhưng cây cốc vụ tới vẫn bị xâm nhiễm bởi các bào tử di cư từ
miền nam tới trong mùa hè.
Hình dung một loạt các cánh đồng cây cốc của nông dân dọc theo ―Puccinia pathway‖.
Cây cốc trên các cánh đồng này bị nhiễm bởi bào tử hạ của nấm. Các bào tử này có thể tới từ
các cánh đồng cách xa (chẳng hạn từ miền nam USA hoặc Mexico) hay từ các cánh đồng lân
cận. Trên mỗi cánh đồng, quần thể nấm địa phương có thể tuyệt chủng do: thu hoạch,
phun thuốc hóa học, luân canh với cây – phi ký chủ, trồng giống kháng, điều kiện khắc nghiệt
của một mùa đông lạnh.
Sau khi sự tuyệt chủng xuất hiện, các cánh đồng này lại tái nhiễm khi nông dân trồng một
vụ lua mỳ mới. Nguồn bệnh sơ cấp khởi đầu một sự nhiễm bệnh mới trên mỗi cánh đồng có
thể tới từ các cánh đồng cách rất xa hoặc từ các cánh đồng lân cận.
Như vậy các quần thể nấm địa phương dọc đường hướng này luôn trải qua qua trình diệt
vong và tái xuất hiện nhưng toàn bộ quần thể nấm ở vùng Bắc Mỹ (siêu quần thể) vẫn ổn
định.
23
7. Hệ thống sinh sản/ghép cặp (Reproductive/Mating Systems)
7.1. Đánh giá cấu trúc di truyền trong quần thể
Trôi dạt di truyền, đột biến, di cư (giao lưu), chọn lọc và các lực khác làm thay đổi tần số
gen của một quần thể phụ và ảnh hưởng tới cấu trúc di truyền của toàn quần thể.
Để đánh giá cấu trúc di truyền của quần thể, người ta thường sử dụng chỉ số sai khác di
truyền (index of genetic differenciation) hay còn gọi là chỉ số cố định F (fixation index). Chỉ
số này cũng được ký hiệu là FST. Có nhiều cách diễn giải chỉ số sai khác di truyền thông qua
các công thức tính.
Cách diễn giải 1. Về mặt toán học, FST là xác suất mà 2 allele của một cặp gen trong một
cá thể lưỡng bội giống nhau, có nghĩa chúng có nguồn gốc từ một tổ tiên chung trong các thế
hệ trước. FST là phép đo sự sai khác (differentiation) của quần thể dựa trên các số liệu đa hình
di truyền (genetic polymorphism), chẳng hạn như đa hình nucleotid đơn (Single nucleotide
polymorphisms (SNPs) hay đa hình microsatellites. Nó là một trường hợp đặc biệt của thống
kê F. Thống kê F so sánh sự sai khác di truyền bên trong quần thể và giữa các quần thể. FST
được tính như sau:
Trong đó ΠBetween và ΠWithin trình bày số sai khác trung bình giữa 2 cá thể được lấy từ các
quần thể khác nhau (ΠBetween) hay được lấy từ cùng quần thể (ΠWithin). Số sai khác trung bình
giữa 2 cá thể trong cùng quần thể là tổng số sai khác giữa từng cặp cá thể chia cho tổng số cặp
so sánh. Chú ý là giá thị ΠWithin nên được tính cho mỗi quần thể sau đó lấy trung bình.
Cách diễn giải 2. FST là tỷ lệ lượng dị hợp tử (HS) kỳ vọng trong các quần thể phụ trên
lượng dị hợp tử kỳ vọng của toàn quần thể (HT) và được tính theo công thức
FST = (HT – HS ) / HT = 1 – (HS / HT)
Trong công thức này,
HT là số lượng dị hợp tử (Heterozygote) kỳ vọng của toàn thể quần thể (Total
population).
HS là số lượng dị hợp tử (Heterozygote) kỳ vọng trong các quần thể phụ
(Subpopulation).
Có thể minh họa cách diễn giải này bằng hình sau.
24
Chú ý: trong cách diễn giải 1 và 2, FST nhận giá trị từ 0 đến 1
Cách diễn giải 3. Cách diễn 3 có công thức tính như sau:
F = 1 – (Hobs / Hexp)
Trong công thức này, Hobs là mức dị hợp tử trung bình quan sát thấy (observated) / locus
và Hexp là tỷ lệ dị hợp tử kỳ vọng khi giả thiết quần thể giao phối ngẫu nhiên (Hexp tương tự
như mức đa dạng gen của Nei, xem phần )
Dưới điều kiện tự thụ hoàn toàn, Hobs sẽ ~ 0 và F sẽ ~ 1. Dưới điều kiện giao phối ngẫu
nhiên, Hobs sẽ ~ Hexp và F sẽ ~ 0. Giá trị F nằm giữa 0 và 1 cho biết các mức tự thụ khác
nhau. Giá trị F <0 cho biết các cá thể dị hợp tử chiếm ưu thế do giao phối không tương hợp di
truyền hoặc do sự chiếm ưu thế của các dòng dị hợp tử đặc biệt thích nghi.
7.2. Hệ thống sinh sản và ghép cặp của các tác nhân gây bệnh cây
Tác nhân gây bệnh có thể sinh sản vô tính (bằng nguyên nhiễm) hoặc hữu tính (bằng
giảm nhiễm) hoặc hỗn hợp cả sinh sản vô tính lẫn hữu tính.
Vi khuẩn và virus có kiểu sinh sản vô tính. Nấm và VSV giống nấm có kiểu sinh sản hoặc
vô tính, hoặc hữu tính hoặc hỗn hợp cả hai.
Hệ thống ghép cặp (mating systems) chỉ thích hợp đối với các sinh vật có trải qua sinh sản
hữu tính. Hệ thống ghép cặp có thể nằm trong phạm vi từ 100% tự thụ tới 100% giao phối
chéo. Ví dụ nấm Phytophthora có sinh sản hữu tính, tuy nhiên có loài lại sinh sản hữu tính
kiểu tự thụ (đồng tản), có loài lại sinh sản hữu tính kiểu giao phối chéo (dị tản) (bảng ).
Hệ thống ghép cặp và sinh sản có ảnh hưởng đến cách các allele của cá thể kết hợp với
nhau. Các sinh vật giao phối chéo tạo ra các tổ hợp gen mới một cách nhanh chóng dẫn tới có
nhiều kiểu gen trong quần thể và cũng tạo ra mức độ đa dạng kiểu gen cao; hậu quả chúng có
khả năng thích ứng tốt với sự thay đổi môi trường. Nếu một sinh vật có kiêu giao phối chéo
bắt buộc thì việc tái tổ hợp thường xuyên có thể phá vỡ các tổ hợp allele đã cùng thích nghi.
Điều này có thể là bất lợi đối với tác nhân gây bệnh nếu môi trường ổn định.
Tác nhân gây bệnh tự thụ hoặc trải qua sinh sản vô tính có xu hướng giữ lại các tổ hợp
gen cũ dẫn tới mức đa dạng di truyền giảm. Nếu một kiểu gen đã thích nghi tốt (chứa 1 tổ hợp
Quần thể
(HT)
Quần thể
phụ 2
HS<HT
Quần thể
phụ 1
HS<HT
Quần thể
phụ 4
HS<HT
Quần thể
phụ 3
HS<HT
25
các allele đã đồng thích nghi) thì tác nhân gây bệnh tự thụ hoặc sinh sản vô tính có xu hướng
giữ lại các tổ hợp này trong thời gian lâu. Tuy nhiên, nếu môi trường thay đổi nhanh thì các
sinh vật này phải mất thời gian lâu hơn để có được các tổ hợp allele mới cho phép chúng thích
ứng với điều kiện môi trường mới.
Các tác nhân có kiểu sinh sản/ghép căp hỗn hợp chứa cả ưu và nhược điểm của mỗi kiểu.
Nấm đặc biệt mềm dẻo khi xét tới các kiểu sinh ghép cặp và sinh sản. Vi khuẩn và virus
có thể tái tổ hợp không cần giảm nhiễm nhưng hệ thống sinh sản của chúng hoàn là vô tính
Hệ thống ghép căp (Mating systems) thường được định nghĩa là lượng tự phối xuất hiện
trong quần thể các sinh vật sinh sản hữu tính và được đánh giá bằng hệ số tự phối (inbreeding
coefficient) thường được viết tắt là F (hay chỉ số cố định Fixation index = F)
Hình . Phạm vi sinh sản của tác nhân gây bệnh và ảnh hưởng có thể của kiểu sinh sản đến
mức độ thuần nhất/đa dạng di truyền trong quần thể
Khi F = 1, chúng ta có kiểu ghép cặp tương hợp di truyền (genetic assortative mating).
Các sinh vật có kiểu ghép cặp tương hợp di truyền có xu hướng ghép cặp giữa các cá thể có
các allele giống nhau, như các họ hàng gần. Ví dụ về kiểu ghép cặp cực kỳ tương hợp di
truyền là sự tự phối ở nhiều loài cây tự thụ. Đối với các cây tự phối nghiêm ngặt, F=1.
Một số tác nhân gây bệnh cũng có kiểu ghép cặp tương hợp di truyền. Một ví dụ là các
loài nấm Phytophthoa nhóm đồng tản có nghĩa là tự thụ (bảng ). Kết quả của sự ghép cặp
tương hợp di truyền là một quần thể có cấu trúc di truyền được đặc trưng bởi sự chiếm ưu thế
của các cá thể đồng hợp tử và có mức đa dạng kiểu gen thấp. Nhiều chu kỳ tự phối sẽ tạo ra
các dòng thuần nhất (clonal lines) trong các quần thể này.
Ngược với kiểu ghép cặp tương hợp di truyền là kiểu ghép cặp không tương hợp di truyền.
Các sinh vật có kiểu ghép cặp không tương hợp di truyền có xu hướng ghép cặp giữa các cá
thể không có các allele giống nhau, có nghĩa chúng không có tổ tiên chung. Một ví dụ về kiểu
ghép cặp cực kỳ không tương hợp di truyền là sự giao phối chéo bắt buộc ở các cây giao phấn
và nhiều loài nấm. Ví dụ, môt số nấm đảm như Armillaria spp. có hệ thống ghép cặp tứ cực
(tetrapolar) không cho phép chúng tự thụ. Hậu quả của sự ghép cặp không tương hợp di
truyền là tạo ra các quần thể có cấu trúc di truyền gồm các các thể di hợp tử chiếm ưu thế và
mức độ đa dạng kiểu gen cao.
Ở dạng trung gian, chúng ta có kiểu ghép cặp ngẫu nhiên (random mating). Các sinh vật
có kiểu ghép cặp ngẫu nhiên có xu hướng ghép cặp ngẫu nhiên với các cá thể khác trong quần
thể. Kết quả của ghép cặp ngẫu nhiên là cân bằng di truyền theo định luật Hardy-Weinberg.
Tần số đồng hợp tử và dị hợp tử quan sát thấy đối với bất kỳ locus cũng phù hợp với tần số
tiên đoán với giả thiết là giao tử kết hợp một cách ngẫu nhiên để thành hợp tử. Hậu quả nữa
của ghép cặp ngẫu nhiên là sư kết hợp ngẫu nhiên trong số các allele tại các locus khác nhau ở
các sinh vật đơn bội, một trạng thái được gọi là cân bằng giao tử (gametic equilibrium).
F = 1 F = 0 F = -1
Sinh sản vô tính
Hữu tính: tự thụ
Đa dạng kiểu gen thấp
Chủ yếu các dòng
Sinh sản hữu tính
Giao phối (không
tương hợp)
Đa dạng kiểu gen cao
Không có các dòng
riêng biệt
Sinh sản hỗn hợp
Đa dạng kiểu gen
trung gian
26
Hệ thống ghép cặp đã được nghiên cứu đối với nhiều tác nhân gây bệnh nấm. Đối với các
loại nấm lưỡng bội như nấm Phytophthora, hệ thống ghép cặp xắp xếp từ tự phối (các loài
đồng tản) tới giao phối chéo (các loài dị tản) với chỉ số cố định F nằm trong phạm vi từ 1.0 tới
-0.82 (Bảng). Đối với các tác nhân gây bệnh đơn bội, người ta không thể áp dụng định luật
Hardy-Weinberg để đo cân bằng mà phải áp dụng cân bằng giao tử (gametic equilibrium).
Nhiều loại nấm túi (ví dụ nấm đạo ôn Pyricularia oryzae) thuộc nhóm này.
Các quần thể ghép cặp ngẫu nhiên thường có mức độ đa dạng kiểu gen cao. Tuy nhiên,
nếu mức độ đa dạng gen trong quần thể thấp (chẳng hạn như đối với các quần thể bắt đầu từ
một số lượng nhỏ cá thể = hiệu ứng nền) thì đa dạng kiểu gen cũng vẫn có thể thấp.
Bảng. Chỉ số cố định của các loài Phytophthora (Goodwin, 1997)
Loài Kích thước
mẫu Số locus
Lượng dị hợp tử F
Quan sát Kỳ vọng
Các loài đồng tản
P. boehmeriae 11 12 0.015 0.32 0.95
P. cactorum 47 18 0.056 0.037 -0.51
P. citricola 125 14 0.007 0.279 0.97
P. heveae 14 17 0.05 0.16 0.69
P. katsurae 16 17 0.00 0.11 1.0
P. sojae 48 15 0.00 — 1.0
Các loài dị tản
P. botryosa 10 18 0.006 0.08 0.93
P. cambivora 25 18 0.060 0.071 0.15
P. capsici 84 18 0.019 0.20 0.91
P. cinnamomi
Worldwide 81 18 0.098 0.134 0.27
Australia 165 20 0.010 0.049 0.80
Australia 280 19 0.051 0.115 0.56
PNG 18 20 0.058 0.088 0.34
P. citrophthora 43 18 0.107 0.20 0.47
P. infestans
Tại Mexico 50 15 0.037 0.046 0.20
Bên ngoài 46 15 0.120 0.066 -0.82
P. meadii 33 18 0.066 0.12 0.45
P. megakarya 15 17 0.078 0.19 0.59
P. palmivora
Worldwide 106 17 0.111 0.08 -0.39
East Asia 62 17 0.135 0.122 -0.11
P. parasitica 60 19 0.079 0.11 0.28
7.3. Đa dạng gen và đa dạng kiểu gen
Đa dạng di truyền gồm 2 thành phần là đa dạng gen và đa dạng kiểu gen.
7.3.1 Đa dạng gen
Đa dạng gen ám chỉ sự đa dạng về các allele của 1 gen hoặc locus nào đó trên 1 nhiễm sắc
thể. Đa dạng gen có được là do sự khác nhau về trình tự DNA. Để đo đa dạng gen, tốt nhất là
27
dùng các marker di truyền trung tính đa allele như isozymes, RFLPs, microsatellites, hoặc
single nucleotide polymorphisms (SNPs). Tuy nhiên, đa dạng gen cũng có thể được đánh giá
dùng các marker trội như AFLP.
Lượng hóa đa dạng gen được dựa trên số lượng và tần số allele của một locus. Mức độ đa
dạng sẽ tăng khi số lượng allele (tại 1 locus) tăng và khi tần số các allele phân bố đồng đều.
Đa dạng gen bị ảnh hưởng của marker di truyền dùng để kiểm tra (các marker trung tính sẽ
cho mức độ đa dạng cao hơn các marker chọn lọc), kích thước quần thể (quần thể càng lớn
càng ít bị trôi dạt di truyền và có nhiều allele hơn), và tuổi quần thể (quần thể càng già càng
có nhiều thời gian cho đột biến xảy ra và cho trôi dạt di truyền gia tăng tần số các đột biến
trung tính).
Phép đo đa dạng gen phổ biến nhất là do Nei (1973) đề xuất với công thức sau:
h = 1- xj2
Trong đó, h là mức đa dạng gen tại một locus và xj là tần số allele thứ j tại locus đó.
Đối với quần thể lưỡng bội đạt được cân bằng Hardy-Weinberg thì mức độ đa dạng gen
bằng tần số dị hợp tử tại một locus kỳ vọng đạt được. Do vậy, mức độ đa dạng gen của quần
thể lưỡng bội còn được gọi là mức dị hợp tử (heterozygosity).
Mức độ đa dạng gen của Nei là xác suất để 2 phiên bản (copy) của cùng một gen được
chọn ngẫu nhiên trong quần thể là 2 allele khác nhau. Hai copy này nên được chọn từ cùng cá
thể lưỡng bội (trường hợp này là đo heterozygosity) hay từ 2 cá thể đơn bội khác nhau
(trường hợp này là đo đa dạng gen).
7.3.2 Đa dạng kiểu gen
Đa dạng kiểu gen ám chỉ sự đa dạng về sự kết hợp của nhiều allele xuất hiện ở tất cả các
locus được thử. Nói cách khác, đa dạng kiểu gen dựa trên số các cá thể khác biệt về di truyền
trong 1 quần thể và tần số của nó. Đo đa dạng kiểu gen là vô nghĩa đối với các sinh vật chỉ có
giao phối ngẫu nhiên (ví dụ như loài người) vì mỗi cá thể của chúng (ngoại trừ trường hợp
sinh đôi) hoàn toàn khác nhau về di truyền, do đó đa dạng kiểu gen luôn luôn ở mức tối đa.
Tuy nhiên, đa dạng kiểu gen lại rất quan trọng đối với tác nhân gây bệnh sinh sản vô tính hoặc
sinh sản hỗn hợp. Đa dạng kiểu gen thường được đo dùng các kỹ thuật DNA fingerprinting
(như AFLP) hoặc dùng các marker đa locus (như rep-PCR, RFLP dùng dò đa locus) đối với
mỗi cá thể trong quần thể.
Mức độ đa dạng kiểu gen được đo dựa trên số lượng và tần số các kiểu gen trong quần
thể. Mức độ đa dạng tăng khi số lượng kiểu gen tăng và tần số kiểu gen phân bố đồng đều
trong quần thể. Đa dạng kiểu gen bị ảnh hưởng bởi hệ thống ghép cặp (quần thể tự thụ có mức
độ đa dạng kiểu gen thấp hơn quần thể giao phối), hệ thống sinh sản (sinh vật sinh sản hữu
tính có mức độ đa dạng kiểu gen cao hơn sinh vật sinh sản vô tính) và chọn lọc. Nếu 1 hoặc 2
dòng tác nhân gây bệnh gia tăng tần số so với các dòng khác trên 1 cánh đồng do chọn lọc thì
mức đa dạng kiểu gen chung trong quần thể sẽ giảm.
Như vậy kiểu ghép cặp và sinh sản có tác động đáng kể đến đa dạng kiểu gen nhưng
không nhất thiết có tác động lên đa dạng gen. Điều này có thể được minh họa qua 1 ví dụ
dưới đây.
7.3.3 Ví dụ đo đa dạng gen và đa dạng kiểu gen
Đo đa dạng gen và đa dạng kiểu gen nên dựa trên kích thước mẫu gồm ít nhất 30 cá thể /
quần thể.
Để đơn giản hóa, ví dụ dưới đây chỉ gồm 8 cá thể /quần thể với 3 loci.
28
Xét 2 quần thể đơn bội (điển hình cho phần lớn nấm, vi khuẩn gây bệnh cây) với 3 locus,
mỗi locus gồm 2 allele. Locus A có 2 allele, A1 và A2. Locus B có 2 allele, B1 và B2. Locus
C có 2 allele C1 và C2.
Pop. 1 Pop. 2
A1 B1 C1 A1 B1 C2 A1 B2 C1 A1 B2 C2 A2 B1 C1 A2 B1 C2
A2 B2 C1 A2 B2 C2
A2 B1 C2 A2 B1 C2 A2 B1 C2 A2 B1 C2 A1 B2 C1 A1 B2 C1
A1 B2 C1 A1 B2 C1
8 genotypes 2 genotypes
f(A1) = f(A2) = 0.5 f(B1) = f(B2) = 0.5 f(C1) = f(C2) = 0.5
f(A1) = f(A2) = 0.5 f(B1) = f(B2) = 0.5 f(C1) = f(C2) = 0.5
Trong trường hợp này, 2 quần thể đồng nhất về đa dạng gen vì mỗi quần thể có cùng số
lượng allele với cùng tần xuất. Dùng công thức của Nei, chúng ta tính được đa dạng gen là 0.5
cho tất cả 3 locus ở cả 2 quần thể. Tuy nhiên đa dạng kiểu gen khác nhau đáng kể giữa 2 quần
thể vì quần thể 1 có tổng số 8 kiểu gen và quần thể 2 có tổng số 2 kiểu gen.
Các quần thể tác nhân gây bệnh sinh sản hữu tính thường xuyên xắp sếp lại kiểu gen của
chúng dẫn tới các allele độc và các allele kháng thuốc có thể kết hợp lại với nhau nhanh
chóng hơn (như ở quần thể 1).
Các quần thể tác nhân gây bệnh sinh sản vô tính có thể có mức độ đa dạng gen cao như ở
quần thể hữu tính nhưng mức độ đa dạng của các allele được phân bố trong các dòng vô tính
của chúng thay vì trong các cá thể. Nói cách khác, chúng có mức độ đa dạng kiểu gen thấp
hơn (như ở quần thể 2).
Các marker di truyền trội dựa trên PCR như AFLP và RAPD (chỉ có 2 allele /locus) có
mức đa dạng gen tối đa = 0.50 khi cả 2 allele có tần số tươg đương. Do vậy, sẽ không thích
hợp khi so sánh đa dạng di truyền của các tác nhân gây bệnh khác nhau nếu phương pháp
đánh giá khác nhau (vd RFLPs và AFLPs). Lợi thế của các kỹ thuật đánh giá đa allele như
RFLPs, microsatellites, hoặc SNPs là ở chỗ chúng có thể tiến gần tới giá trị đa dạng gen tối đa
lý thuyết =1 (bảng) và có thể cung cấp các thông tin bổ sung về đa dạng gen vì sự có mặt của
các allele hiếm (rare allele) hoặc các allele riêng (private allele). Các allele hiếm và allele
riêng có thể được sử dụng để xác định trung tâm đa dạng của tác nhân gây bệnh và để đánh
giá sự di chuyển của các quần thể tác nhân gây bệnh theo không gian và thời gian. Tuy nhiên,
các allele hiếm chỉ có thể đóng góp ít vào mức đa dạng gen chung (bảng).,
29
Bảng Đa dạng gene theo tần số của 2 hay 3 allele. Chú ý h đạt tối đa với 3 allele = 0.67;
h giảm mạnh khi allele chung nhất có tần số = 90% (vd allele 2)
Quần thể Tần số allele 1 Tần số allele 2 Tần số allele 3 Nei's h
1 0.50 0.50 0.00 0.50
2 0.40 0.60 0.00 0.48
3 0.30 0.70 0.00 0.42
4 0.20 0.80 0.00 0.32
5 0.10 0.90 0.00 0.18
6 0.01 0.99 0.00 0.02
7 0.02 0.96 0.02 0.08
8 0.05 0.90 0.05 0.19
9 0.33 0.34 0.33 0.67
8. Chọn lọc tự nhiên
8.1. Khái niệm
Chọn lọc là một quá trình có định hướng dẫn tới tăng hoặc giảm tần số gen hay tần số kiểu
gen. Chọn lọc xuất hiện nhằm phản ứng lại một yếu tố môi trường đặc biệt nào đó. Hậu quả
của chọn lọc lên cấu trúc và tiến hóa của sinh vật là phức tạp.
Chọn lọc có thể làm giảm biến dị di truyền trong quần thể sinh vật bằng giữ lại hoặc loại
bỏ 1 gen hoặc 1 tổ hợp gen đặc biệt nào đó (chọn lọc có định hướng).
Chọn lọc có thể làm tăng biến dị di truyền trong quần thể nhờ giữ lại nhiều gen hoặc tổ
hợp gen đặc biệt nào đó và loại bỏ các dạng trung gian (chọn lọc ngắt quãng, chọn lọc cân
bằng).
Chọn lọc có thể dẫn tới biệt hóa loài nhờ tích lũy các biến dị di truyền thích nghi trong
quần thể biệt lập về sinh sản.
Chọn lọc có thể ngăn sự biệt hóa loài bằng cách đồng nhất cấu trúc di truyền của các quần
thể tại các địa điểm khác nhau.
Chọn lọc trong bệnh cây chủ yếu được xét trong phạm vi quá trình đồng tiến hóa gen-đối
gen. Nó là quá trình làm tăng tần số allene kháng trong hệ sinh thái tự nhiên thông qua quá
Bảng Thay đổi mức đa dạng gen (h) theo số allele
Số alleles h tối đa
2 0.50
3 0.67
4 0.75
5 0.80
6 0.83
7 0.86
30
trình đồng tiến hóa, làm tăng tần số allele độc trong hệ sinh thái nông nghiệp qua chu trình
―đỉnh – đáy‖
8.2. Hai mô hình chọn lọc
Một câu hỏi quan trọng trong di truyền quần thể là biến dị di truyền lớn tới mức nào để có
thể tồn tại trong 1 quần thể hay 1 loài. Có 2 mô hình chọn lọc các biến dị di truyền có thể trả
lời câu hỏi này là mô hình cân bằng và mô hình trung tính.
Mô hình cân bằng. Theo mô hình này, không có 1 allele nào là tốt nhất tại bất kỳ một
locus nào mà thay vào đó bể gen của quần thể chứa một số lượng lớn các các allele khác nhau
và có tần số khác nhau tại một locus. Do không có một allele nào tốt nhất nên các cá thể dị
hơp tử trong 1 quần thể sẽ có ưu thế thích nghi hơn các cá thể đồng hợp tử. Đặc điểm này
được gọi là siêu trội (overdominance). Theo mô hình cân bằng, quần thể sẽ có nhiều biến dị di
truyền, và hầu hết cá thể là dị hợp tử tại một số lượng lớn loci. Tiến hóa trong các quần thể
này xảy ra do sự thay đổi dần dần tần số allele hay tổ hợp allele thích nghi với điều kiện môi
trường.
Mô hình trung tính. Theo mô hình này, phần lớn các biến dị di truyền không có ảnh
hưởng lên sự thích nghi. Đa số các đột biến là gây chết và nhanh chóng bị loại bỏ bởi chọn
lọc nhưng các đột biến còn lại là trung tính hoặc gần trung tính nên tồn tại được trong bể gen
của quần thể. Đột biến trung tính sẽ dẫn tới sự đa dạng mà ta có thể quan sát thấy ở mức
protein hay DNA.
Như vậy, mô hình trung tính tương phản với mô hình cân bằng ở chỗ mô hình cân bằng
cho rằng mức độ biến dị di truyền cao, nhìn chung, sẽ làm tăng tính thích nghi của quần thể
có lẽ do nó tạo ra một khả năng đêm (buffering) cho quần thể trước những thay đổi đột ngột
của môi trường hay do nó tạo ra sự siêu trội (dị hợp tử có lợi thế thích nghi cao hơn đồng hợp
tử).
9. Tương tác giữa các lực tiến hóa và cấu trúc di truyền của quần thể tác
nhân gây bệnh
Hậu quả cuối cùng của sự tương tác giữa các lực tiến hóa là cấu trúc di truyền của quần
thể tác nhân gây bệnh. Cấu trúc di truyền có thể được xem như số lượng và phân bố của biến
di di truyền bên trong và giữa các quần thể được hình thành do tổng ảnh hưởng (có sự tương
tác) của tất cả các lực tiến hóa tác động lên quần thể theo thời gian. Các tương tác giữa các
lực tiến hóa bao gồm
Tương tác giữa đột biến và chọn lọc
Tương tác giữa tái tổ hợp và chọn lọc
Tương tác giữa trôi dạt di truyền, giao lưu gen và chọn lọc
Tương tác giữa chọn lọc và giao lưu gen
Tương tác giữa tái tổ hợp và giao lưu gen
9.1. Tương tác giữa đột biến và chọn lọc
Mặc dù nhiều lực có thể tương tác để xác định sự tiến hóa của quần thể thì tương tác
giữa đột biến và chọn lọc được xem là quan trọng nhất nhằm giải thích sự tiến hóa của các
tác nhân gây bệnh cây trải qua các chu trình ―đỉnh – và – đáy, boom – and – bust‖, trong đó
mối quan hệ của cây ký chủ và tác nhân gây bệnh tuân theo quan hệ gen – đối - gen. Trong
chu trình đỉnh và đáy, khi một giống cây với một gen kháng chủ (allele kháng 1) chống một
tác nhân gây bênh nào đó được đưa vào trồng, nếu giống kháng này có các tính trạng nông
31
học tốt và kháng bệnh tốt thì nó sẽ được nông dân trồng trên diện tích lớn. Đây là pha đỉnh
(boom) của allele kháng 1. Tiếp theo, trong quần thể tác nhân gây bệnh, một đột biến từ
không độc sang độc sẽ hình thành và tạo ra một chủng độc (chứa alellele độc 1) thoát khỏi sự
nhận biết của ký chủ. Chọn lọc do tác động của giống kháng sẽ làm tăng tần số của chủng độc
(chứa allele độc 1), thường ―chậm‖ hơn so với sự gia tăng tần số của allle kháng 1 của ký chủ.
Do chủng độc dần chiếm ưu thế (bởi giao lưu gen hay giao lưu kiểu gen) dẫn tới tính kháng
dần dần mất hiêu quả hay nói cách kháng tính kháng bị bẻ gẫy. Hậu quả là nông dân không
trồng giống kháng này nữa và tần số allele kháng 1 lại giảm dần. Đây là pha đáy ―bust‖ của
allele kháng 1. Chu trình lại tiếp tục bằng cách đưa giống chứa allele kháng 2 vào trồng.
Hình. Đồ thị minh họa chu trình ― đỉnh – và – đáy‖. Theo thời gian, tần số allele độc luôn
―chậm‖ hơn tần số allele kháng do tác động chọn lọc của giống kháng.
9.2. Tương tác giữa tái tổ hợp và chọn lọc
Ảnh hưởng của tái tổ hợp và chọn lọc lên sự đa dạng của 1 tác nhân gây bệnh có thể được
minh họa qua trường hợp nấm gỉ sắt Puccinia graminis f. sp. tritici trên lúa mỳ ở Bắc Mỹ.
Trước khi áp dụng một chương trình nhằm loại bỏ cây ký chủ phụ của nấm là cây barberry (~
500 triệu cây đã bị loại bỏ trong vòng 50 năm), thì nấm đã tồn tại dưới dạng vô số (hàng trăm
tới hàng ngàn) các kiểu gây bệnh (pathotypes) khác nhau. Sự đa dạng này có được là do nấm
đã tái tổ hợp trên cây barberry (nấm gỉ sắt P. graminis f.sp. triciti là nấm gỉ săt chu trình lớn,
dị chủ và chỉ sinh sản hữu tính trên cây ký chủ phụ là cây barberry). Việc loại bỏ cây ký chủ
phụ đã dẫn tới nấm không còn khả năng tái tổ hợp và hậu quả là sự đa dạng di truyền của nấm
cũng giảm theo. Sự chọn lọc, thông qua việc sử dụng các giống kháng đã dẫn tới nấm chỉ tồn
tại dưới dạng một số các dòng khá thuần nhất và nguồn tạo ra sự đa dạng của nấm chỉ là do sự
đột biến trong mỗi dòng nấm.
9.3. Tương tác giữa trôi dạt di truyền, giao lưu kiểu gen và chọn lọc
Mối tương tác này có thể được minh họa đối với quần thể nấm gỉ sắt lúa mỳ (Puccinia
graminis f. sp. Tritici) ở Australia. Nấm đã được đưa vào Úc do người nhập cư châu Âu vào
những năm 1780s. Lúc đầu, chỉ có một ít chủng nấm được đưa vào Úc dẫn tới hiệu ứng nền.
Ở Úc không có cây barberry nên sự đa dạng do tái tổ hợp hữu tính không xảy ra. Hậu quả là
nấm tồn tại dưới dạng các dòng thuần nhất mà sự tiến hóa của mỗi dòng chỉ do đột biến trong
nội bộ mỗi dòng. Một dòng thuần (gọi là race 126) chiếm ưu thế trên các cánh đồng lúa mỳ
của Úc từ 1921 – 1954. Năm 1954, một race mới xuất hiện (gọi là race 21) và thay thế hoàn
toàn race 126. Race 21 đã tới Úc từ Tây Phi nhờ jet steam (một luồng không khí ở độ cao
khoảng 10 km, di chuyển qua khoảng cách xa 1000-4000 km, với vận tôc ~ 100 km/giờ).
Race 21 này có các allele độc mới, marker isozyme mới, đa hình DNA mới. Sự xuất hiện của
Race 21 điển hình cho giao lưu kiểu gen, trong đó, các kiểu gen mới, thích nghi hơn thay thế
cho kiểu gen cũ do hậu quả của chọn lọc có định hướng.
32
9.4. Tương tác giữa chọn lọc và giao lưu kiểu gen
Sự tương tác giữa chọn lọc và giao lưu kiểu gen có thể được minh họa dựa trên ví dụ
bệnh héo Fusarium (Fusarium oxysporum). F. oxysporum là một loài nấm truyền qua đất rất
đa dang, gây bệnh héo trên nhiều cây trồng khắp nơi. Quần thể tự nhiên nấm tấn công vỏ rễ
nhưng thường không gây bệnh. Dạng hoang dại (wild-type) là nấm hoại sinh thực sự. Các
quần thể có tính gây bệnh cho cây dường như sinh sản vô tính nghiêm ngặt. Các dạng chuyên
hóa (Formae speciales, số nhiều) của nấm (gây bệnh trên một loài cây) xuất hiện khi trồng
độc canh một loài cây nào đó. Việc trồng độc canh, chẳng hạn cà chua, dưa, chuối đã tạo điều
kiện cho các đột biến gây bệnh hình thành các dạng chuyên hóa là F. oxysporum f.sp.
lycopercisi, Foc f.sp. melonis và Foc f.sp. cubense.
Nấm F. oxysporum trong cùng một dạng chuyên hóa có thể phân biệt thành các chủng
(race, pathotype) khác nhau dựa theo phản ứng với các gen kháng chủ của cây. Các dòng
(clone) nấm lại có thể được phân biệt dùng các nhóm tương hợp vô tính (vegetative
compatibility groups (VCGs), isozymes, hoặc các marker DNA. Người ta đã quan sát thấy
nhiều lần rằng cùng một race nấm có thể có nền di truyền khác nhau. Điều này có nghĩa các
dòng nấm của cùng môt race đã tiến hóa hoàn toàn độc lập (Gordon and Martyn 1997). Trái
lại, cũng có nhiều ví dụ cho thấy các race khác nhau lại có cùng nền di truyền có nghĩa là
chọn lọc đã cho phép hình thành các thể đột biến mới từ không độc sang độc ở trong cùng
một dòng nấm
Một diễn giải về các quan sát trên là: một dạng chuyên hóa mới hình thành do áp lực chọn
lọc cao của trồng độc canh một loài cây trong một hệ sinh thái, nơi mức độ đồng nhất cao của
ký chủ đã tạo ra một nich sinh thái mới cho phép các thể đột biến (hiếm) có thể gây bệnh hình
thành từ quần thể hoang dại hoại sinh vốn rất đa dạng trong đất. Các dạng chuyên hóa có khả
năng gây bệnh di chuyển sang các cánh đồng mới, thậm chí qua các khoảng cách xa khắp thế
giới qua cây hay đất nhiễm nấm gây bệnh. Các dạng chuyên hóa có thể có nguồn gốc độc lập
từ các hệ sinh thái khác nhau tạo ra các chủng gây héo có nền di truyền độc lập (khác) nhau.
Một ví dụ là dạng chuyên hóa F. oxysporum f. sp. cubense (gây bệnh héo Panama trên chuối).
Dạng này có bản chất đa nguồn gốc (polyphyletic). Hai dòng nấm có nguồn gốc độc lập đã di
chuyển khắp thế giới (Koenig et al. 1997).
Sự giải thích trên cũng phù hợp với các quan sát về nhiều dạng chuyên hóa của nấm F.
oxysporum khác như các dạng chuyên hóa gây hại trên cẩm chướng, coca, cọ dầu, cà chua,
lily, đậu…
Như vậy, các dạng chuyên hóa nấm nấm F. oxysporum gây bệnh héo hình thành một cách
tự phát trên các cây trồng độc canh và là vật liệu cho giao lưu kiểu gen.
9.4.1 Tương tác giữa tái tổ hợp và giao lưu gen
Tương tác giữa tái tổ hợp và giao lưu gen có thể được minh họa đối với nấm
Mycosphaerella graminicola (giai đoạn vô tính là Septoria tritici) gây bệnh đốm lá lúa mỳ.
Các phân tích RFLP cho thấy quần thể nấm khắp thế giới có mức độ đa dạng kiểu gen cao
(trong tổng số 1673 mẫu nấm thử/15 quần thể khắp thế giới, có tới 1327 kiểu gen khác nhau)
chứng tỏ có vai trò của tái tổ hợp thông qua sinh sản hữu tính. Minh họa về mức độ đa dạng
kiểu gen có thể thấy ở hình….
Các marker RFLP trung tính cho thấy mức độ tương đồng cao trong số các quần thể nấm
khắp thế giới chứng tỏ đã có giao lưu gen trong các quần thể (hình).
Người ta đã chứng minh rằng có sự cân bằng giữa sinh sản hữu tính và di cư đối với nấm
này. Khi bắt đầu vụ trồng, mức độ đa dạng chủ yếu do các bào tử phát tán từ nơi khác tới (di
cư). Vào cuối vụ trồng, sự đa dạng lại chủ yếu từ tái tổ hợp do sinh sản hữu tính từ các isolate
trong cùng ruộng (Zhan et al. 1998).
33
Hình. DNA fingerprints của nấm các isolate nấm Mycosphaerella graminicola được lấy mẫu
tại 5 vị trí (site) cách nhau 10 m trên một cánh đồng. Kết quả cho thấy nấm rất đa dạng về
kiểu gen. Các kiểu gen đồng nhất (mũi tên) chỉ phát hiện thấy trong một vài trường hợp (ví dụ
2 dòng nấm phân lập từ 2 quả cành khác nhau nhưng trên cùng 1 vết bệnh (site C); hoặc 2
dòng nấm phân lập từ 2 lá khác nhau nhưng trong cùng 1 ví trí cách nhau vài mét (site E)).
34
Hình. Phân tích RFLP tại 4 locus: A) Locus pSTL10, B) Locus pSTL31 và C) Locus
pSTS14. D) Locus pSTS192A của nấm Mycosphaerella graminicola. Sự xuất hiện của các
băng AFLP giống nhau ở các quần thể khác nhau chứng tỏ có sự giao lưu gen giữa các quần
thể (Zhang et al. 2003)
9.5. Ứng dụng di truyền quần thể để đánh giá các nguy cơ do tiến hóa của tác nhân gây
bệnh
Các nhà bệnh cây nghiên cứu tiến hóa của tác nhân gây bệnh vì chúng tiến hóa để khắc
phục gen kháng của ký chủ hay trở nên kháng với thuốc trừ bệnh. Tác nhân gây bệnh tiến hóa
nhanh nhất sẽ có nguy cơ nhất trong việc khắc phục các gen kháng chủ hoặc chống lại các
biện pháp phòng chống hóa học.
Các tác nhân gây bệnh có tốc độ đột biến cao có nguy cơ lớn hơn các tác nhân gây bệnh
có tốc độ đột biến thấp vì tốc độ đột biến cao làm tăng xác suất đột biến từ không độc sang
độc hoặc từ tính mẫn cảm thuốc sang tính kháng thuốc. Nhìn chung, tốc độ đột biến là thấp dù
chúng có thể khác nhau theo loci và theo loại tác nhân gây bệnh. Quần thể tác nhân gây bệnh
có yếu tố di động (transposable elements) hoạt động sẽ có nguy cơ hơn quần thể không có
yếu tố di động hoạt động. Cần chú ý rằng một đột biến hình thành nhưng thiếu tác động của
35
các lực tiến hóa khác thì chưa chắc sẽ xuất hiện ở một tốc độ đủ cao để có thể tạo ra những
thay đổi có thể phát hiện được trong tần số allele.
Tác nhân gây bệnh với kích thước quần thể lớn có tiềm năng tiến hóa hơn tác nhân gây
bệnh với kích thước quần thể nhỏ vì chúng có nhiều allele đột biến hơn. Các tác nhân gây
bệnh trải qua sự suy giảm nhanh, đều đặn kích thước quần thể (chẳng hạn do hậu quả của luân
canh hoặc điều kiện thời tiết cực bất thuận) sẽ kém đa dạng hơn do hậu quả của trôi dạt di
truyền và kém thích nghi hơn so với tác nhân gây bệnh duy trì được kích thước quần thể
quanh năm. Hai cách đơn giản để làm giảm kích thước quần thể tác nhân gây bệnh là luân
canh cây thường xuyên và tránh trồng các cây quá mẫn cảm mà chúng cho phép tác nhân gây
bệnh bùng nổ về kích thước quần thể.
Các tác nhân gây bệnh với khả năng giao lưu gen cao có nguy cơ lớn hơn tác nhân gây
bệnh với khả năng giao lưu gen thấp do 2 lý do: (1) Chúng có kích thước quần thể lớn hơn và
do vậy duy trì nhiều allele hơn. (2) Chúng có khả năng cao hơn trong việc truyền các đột biến
kháng thuốc hoặc đột biến độc qua các khoảng cách địa lý xa hơn. Sự di chuyển của nguồn
bệnh sinh sản vô tính (giao lưu kiểu gen) có nguy cơ cao hơn sự di chuyển của nguồn bệnh
sinh sản hữu tính (giao lưu gen) vì nguồn bệnh sinh sản vô tính chứa toàn bộ các gen đồng
thích nghi (coadapted) đã được chọn lọc từ trước về tính gây bệnh trên cây nơi nó hình thành.
Trái lại các nguồn bệnh sinh sản hữu tính (chẳng hạn các bào tử túi, mặc dù có các tổ hợp
allele mới nhưng chưa được chọn lọc về tính gây bệnh trên cây). Chúng ta không thể kiểm
soát được sự giao lưu gen./kiểu gen do sự phát tán tự nhiên của tác nhân gây bệnh nhờ gió,
nước, côn trùng nhưng chúng ta có thể hạn chế khả năng giao lưu qua qua khoảng cách xa do
con người như mang vật liệu cây, đất, dụng cụ nhiễm bệnh từ quần thể tác nhân gây bệnh này
sang quần thể tác nhân gây bệnh khác vốn biệt lập. Các biện pháp cụ thể là kiểm dịch thực vật
hoặc loại bỏ các ký chủ mẫn cảm đóng vai trò như cầu nối sống giữa các quần thể tác nhân
gây bệnh hoặc trồng các giải cây kháng bệnh có vai trò như rào cản giữa các quần thể ký chủ
mẫn cảm.
Các tác nhân gây bệnh trải qua tái tổ hợp thường xuyên (qua phân bào giảm nhiễm ở nấm,
tuyến trùng, giao nạp – conjugation ở vi khuẩn hoặc tái tổ hợp ở virus do cây bị nhiễm hỗn
hợp, dung hợp sợi nấm (anastomosis) hoặc tái tổ hợp vô tính (parasexual recombination) ở
nấm) đều có có nguy cơ cao hơn các tác nhân gây bênh không hoặc ít tái tổ hợp vì có thể
nhanh chóng tạo ra các tổ hợp allele mới có tính độc cao hơn, chống lại nhiều gen kháng cùng
một lúc. Vì lý do này, thậm chí một chiến lược dựa vào qui tụ gen kháng (gen pyramid) cũng
chưa chắc tạo ra tính kháng bền vững đối với các tác nhân có khả năng tái tổ hợp thường
xuyên.
Các tác nhân gây bệnh có kiểu sinh sản hỗn hợp (cả vô tính và hữu tính) sẽ có nguy cơ
tiến hóa cao hơn vì chúng nhận được lợi thế của cả 2 kiểu sinh sản. Tái tổ hợp qua sinh sản
hữu tính cho phép nhiều tổ hợp allele mới hình thành và được thử về khả năng gây bệnh tại
điều kiện địa phương. Sinh sản vô tính cho phép các kiểu gen thích nghi nhất phát triển thành
các dòng thuần nhất, duy trì các tổ hợp allele thích nghi nhất và phát tán các kiểu gen/tổ hơp
alalle trên diện rộng nếu tác nhân gây bệnh mang chúng có thể di chuyển qua khoảng cách xa.
Các quần thể tác nhân gây bệnh được đặt dưới áp lực chọn lọc có định hướng mạnh qua
nhiều thế hệ có nguy cơ cao hơn các quần thể được đặt dưới áp lực chọn lọc yếu hoặc được
đặt dưới áp lực chọn lọc không liên tục (do phân bố theo không gian và thời gian của lực chọn
lọc). Chọn lọc là lực tiến hóa dễ dàng được kiểm soát bởi con người và do đó là điểm thực
tiễn nhất mà con người có thể can thiệp vào quá trình tiến hóa của tác nhân gây bệnh. Các hệ
sinh thái nông nghiệp dựa trên sử dụng rông rãi các gen kháng chủ, đơn (trồng độc canh, đồng
nhất về di truyền) sẽ tạo ra áp lực chọn lọc có định hướng mạnh lên quần thể tác nhân gây
bệnh. Các hệ sinh thái nông nghiệp trồng hỗn hợp hoặc luân phiên các cây mang gen kháng
36
khác nhau sẽ làm giảm hiệu quả của chọn lọc hoặc tạo ra áp lực chọn lọc ổn định và thấp,
hoặc không liên tục dẫn tới làm giảm tốc độ gia tăng tần số các đột biến độc.
Đóng góp của mỗi lực tiến hóa vào nguy cơ gây bệnh do tiến hóa của tác nhân gây bệnh
có thể được tổng kết ở bảng sau.
Bảng. Mức nguy cơ do tiến hóa của tác nhân gây bệnh nhằm khắc phục các biện pháp
phòng chống
Nguy cơ cao Nguy cơ thấp
Tốc độ đột biến cao,
Các yếu tố di động hoạt động
Tốc độ đột biến thấp,
Không có các yếu tố di động
Kích thước quần thể lớn.
Quần thể qua đông lớn
Quần thể địa phương hiếm khi tuyệt
chủng
Không có trôi dạt di truyền
Không bị mất allele
Kích thước quần thể nhỏ.
Không có quần thể qua đông
Quần thể địa phương thường xuyên tuyệt
chủng
Trôi dạt di truyền đáng kể
Bị mất allele
Giao lưu gen/kiểu gen cao
Nguồn bệnh vô tính phát tán qua
khoảng cách xa (nhờ gió)
Phát tán nhờ con người qua khoảng
cách xa phổ biến
Giao lưu gen/kiểu gen thấp
Nguồn bệnh vô tính thuộc nhóm truyền
qua đất
Kiểm dịch thực vật hiệu quả
Sinh sản kiểu hỗn hợp (vô tính + hữu
tính): Tạo cả nguồn bệnh hữu tính và vô
tính hàng năm
Chỉ sinh sản vô tính: chỉ tạo nguồn bệnh vô
tính
Chọn lọc có định hướng, mạnh
Cây mang gen kháng R được trồng độc
canh, đồng nhất giống, liên tục, trên diên
rộng
Chọn lọc không liên tục.
Cây mang gen kháng R được trồng theo kiểu
hỗn hợp giống, giống nhiều dòng; được trồng
luân canh (thời gian) hoặc xen canh (không
gian)
Dựa vào đánh giá nguy cơ do tến hóa của tác nhân gây bệnh, chúng ta có thể xây dựng
được một sơ đồ cho phép hướng dẫn sử dụng các chiến lược tạo và sử dụng giống kháng dựa
trên hiểu biết về di truyền quần thể của tác nhân gây bệnh
37
Mức đa dạng di
truyền của quần
thể tác nhân gây
bệnh
CAO Sinh sản hữu
tính, hỗn hợp /
giao phối
Giao lưu gen
Giao lưu gen
THẤP
THẤP
CAO
Sinh sản vô
tính / tự phối
TKD
(qui tụ)
TKD
(đơn gen)
TKN
+
TKD (dùng hỗn hợp giống &
giống nhiều dòng)
(pyramid)
CAO THẤP
TKN
+
TKD (theo vùng)
VD: Phytophthora sojae
Rhizoctonia solani
VD: Phytophthora infestans
Blumeria
VD: Nấm gỉ
sắt sinh sản vô
tính (Puccinia
maydis) ở
VN?
VD: Fusarium
oxysporum
Hình Sơ đồ hướng dẫn sử dụng các chiến lược tạo và sử dụng giống kháng dựa trên hiểu
biết về di truyền quần thể của tác nhân gây bệnh. TKN : tính kháng ngang (tuân theo mô
hình gen-đối-gen). TKD: tính kháng dọc.
38
Chương 2. Lựa chọn vùng gen của tác nhân gây bệnh
1. Bộ gen của tác nhân gây bệnh
Tùy theo nhóm tác nhân gây bệnh, kích thước bộ gen cũng như số lượng gen của chúng
thay đổi đáng kể (bảng ).
Bảng . Ví dụ kích thước bộ gen một số sinh vật
Nhóm Ví dụ Kích thước bộ gen
(1000 bp)
Số gen Số NST
Viroid Potato spindle viroid 0.36 0
Vệ tinh virus DNA-β 1.35 1
Virus Begomoviruses (bộ gen đơn) 2.7 6
Virus Papaya ringspot potyvirus 10 10
Virus Rice grassy stunt oryza virus 25 12
Vi khuẩn Ca. Phytoplasma asteris 700 708
Vi khuẩn Xanthomonas oryzae 4900 4400
Vi khuẩn Ralstonia solanacearum 5800 5000
Nấm Pyricularia oryzae 40000 - 6
Nấm Puccinia graminis 80000 - 18
Nấm noãn Phytophthora infestans 240000 - 10
Thực vật Arabidopsis thaliana 157000 39.000 5
Thực vật Oryza sativae (japonica) 420000 40.000 12
Côn trùng Drosophila melanogaster 165000 14.000 4
Tuyến trùng Caenorhabditis elegans 98000 20.000 6
Người Homo sapiens 840000 33.000 24
Một số điểm khi chú ý về bộ gen của tác nhân gây bệnh là:
1.1. Bộ gen viroid
Đây là nhóm tác nhân gây bệnh rất đặc biệt, bộ gen của chúng chỉ là các phân tử RNA sợi
đơn dạng vòng, kích thước cực kỳ nhỏ khoảng 250 - 350 nts (có thể xem là nhóm tác nhân
gây bệnh có kích thước nhỏ nhất). Chúng không mã hóa một protein nào nhưng có thể gây
bệnh cho cây thông qua can thiệp vào hệ thống gene silencing của cây. Việc nghiên cứu đa
dạng cũng như phân loại nhóm tác nhân gây bệnh này dựa vào trình tự toàn bộ bộ gen của
chúng.
1.2. Bộ gen virus
Virus thực vật có bộ gen cũng rất nhỏ, mã hóa ít gen. Mặc dù bộ gen virus rất đơn giản
nhưng cực kỳ đa dạng.
Khoảng 25% số virus thực vật có bộ gen dạng DNA dạng vòng, sợi đơn hoặc kép. Các
gen trên bộ gen virus có thể được mã hóa cùng chiều hay ngược chiều kim đồng hồ.
39
Khoảng 75% các virus thực vật còn lại là các virus RNA. Các virus RNA cũng có thể có
bộ gen sợi đơn hoặc sợi kép. Bộ gen của chúng có thể được gọi là cực (+) nếu được dịch mã
trên sợi virus hoặc cực (-) nếu được dịch mã trên sợi trung gian trong quá trình tái sinh, hoặc
lưỡng cực. Phần lớn virus thực vật có bộ gen RNA sợi đơn, cực +.
Bộ gen của virus có thể phân mảnh hoặc không phân mảnh. Đối với các virus có bộ gen
phân mảnh thì các phân tử genome của chúng có thể được lắp ráp trong cùng một phân tử
hoặc được lắp ráp trong các phân tử khác nhau.
Các gen của virus không chứa intron. Đối với một số virus, protein của chúng có thể có
thể được xử lý hậu dịch mã để hình thành các protein chức năng.
Một số virus RNA trong quá trình tái sinh có thể hình thành các phân tử RNA có kích
thước nhỏ hơn kích thước bộ gen virus gọi là bộ gen phụ (subgenomic). Các phân tử bộ gen
phụ này cũng mã hóa các protein như của bộ gen chính.
Một số virus (cả DNA và RNA) có thể có các phân tử vệ tinh (satellite). Các phân tử vệ
tinh này phải nhờ virus để tái sinh và phát tán.
Một số ví dụ
1. Các begomovirus nhóm bộ gen đơn (gây bệnh xoăn vàng lá cà chua): bộ gen sợi vòng
đơn (gọi là DNA-A), kích thước ~ 2.7 kb; bộ gen gồm 6 gen mã hóa theo 2 chiều ngược nhau.
2. Banana bunchytop virus (BBTV, chi Babuvirus, gây bệnh chùn ngọn chuối): bộ gen
phân mảnh gồm 6 phân tử DNA sợi vòng đơn, mỗi phân tử có kích thước khoảng 1.35 kb. và
được lắp ráp riêng rẽ. Trên mỗi sợi chứa 1 ORF mã hóa 1 protein khác nhau.
3. Cauliflower mosaic virus (CaMV) gây bệnh trên nhiều cây, rice tungro bacilliform
virus (RTBV) gây bệnh tungro trên lúa): Bộ gen là 1 phân tử DNA sợi vòng kép, kích thước
khoảng 8 kb. Bộ gen gồm 4 gen mã hóa theo 1 chiều.
5. Các potyvirus như papaya ringspot virus (PRSV), potatovirus Y (PVY): bộ gen RNA
sợi đơn cực dương, kích thước khoảng 10 kb, chứa 1 đầu 5‘UTR và 1 đầu 3‘UTR. Đầu
3‘UTR tận cùng bằng 1 chuỗi polyadenine. Bộ gen chứa 1 ORF lớn mã hóa 1 polyprotein và
được xử lý sau dịch mã thành 10 protein chức năng.
1.3. Bộ gen vi khuẩn và phytoplasma
Bộ gen của vi khuẩn và phytoplasma có cấu trúc đơn giản. Phần lớn chúng có bộ gen là
một phân tử DNA sợi kép dạng vòng. Gần đây người ta đã chứng minh một số vi khuẩn có bộ
gen dạng sợi thẳng (chẳng hạn phần lớn vi khuẩn thuộc chi Streptomyces). Ngoài DNA
genome, đa số vi khuẩn còn mang một hoặc nhiều phân tử plasmid.
Bộ gen vi khuẩn nhìn chung có kích thước nhỏ (trong phạm vi từ 0.5 tới 10 Mb).
Bộ gen không chứa intron dẫn tới các gen có thể được gọi là các ORF. Một số gen có thể
gối lên nhau. Một số gen có kích thước rất nhỏ (<60 bp).
Ví dụ. Bô gen của Ralstonia solanacearum (gây bệnh héo xanh vi khuẩn nhiều loại cây
trồng). Bộ gen của R. solanacearum gồm 2 phân tử DNA vòng có kích thước lớn. Phân tử thứ
nhất là nhiễm sắc thể của vi khuẩn (có kích thước 3.7 Mb) còn phân tử kia gọi là siêu plasmid
(megaplasmid, có kích thước 2.1 Mb). Phân tử plasmid này cũng mã hóa nhiều gen quan
trọng của vi khuẩn.
40
1.4. Bộ gen nấm
Nấm là các sinh vật nhân thật, các gen cũng được mã hóa trên các nhiễm sắc thể khác
nhau. Phần lớn nấm có kích thước bộ gen nhỏ hơn so với thực vật. Kích thước bộ gen trung
bình của nấm khoảng 14 Mb.
So với thực vật và động vật bậc cao, nấm có tỷ lệ DNA không mã hóa thấp hơn nhiều (chỉ
khoảng 10 – 20 %).
Khoảng 30 % bộ gen nấm chứa các chuỗi lặp. Các chuỗi lặp này có tiềm năng là marker
phân tử vì chúng có số copy cao.
Một điểm rất quan trọng (khi xét đến việc lựa chọn marker phân tử): ngoại trừ nấm đảm
(ví dụ như nấm than đen, gỉ sắt), thì ở các loại nấm khác, giai đoạn đơn bội (haploid) chiếm
ưu thế trong chu kỳ phát triển.
Ngoài ra, bộ nhiễm sắc thể của nấm có thể rất đa dạng. Ở nhiều loài nấm, thậm chí số
lượng và kích thước nhiễm sắc thể có thể khác nhau giữa các isolate (vd như đối với nấm
Colletotrichum type B và Fusarium oxysporum fsp.cubense).
2. Chọn vùng gen nghiên cứu
Về cơ bản, việc chọn vùng gen nghiên cứu đối với tác nhân gây bệnh cây cũng dựa theo
đặc điểm bộ gen của 3 nhóm sinh vật là: virus/viroid, prokaryote (vi khuẩn, phytoplasma) và
eurkaryote (nấm, tuyến trùng…).
2.1. Chọn vùng gen virus
Virus nói chung có kích thước bộ gen rất nhỏ, mã hóa chỉ một số ít gen chịu trách nhiệm
nhiều chức năng sống của virus trong đó có 4 chức năng quan trọng là cấu trúc (lắp ráp phân
tử virus), tái sinh, di chuyển (trong nội bộ tế bào, giữa các tế bào và hệ thống trong cây).
41
Một trong các gen được sử dụng phổ biến nhất trong nghiên cứu đa dạng và phân loại đối
với virus thực vật là gen mã hóa vỏ protein (CP gen). Thông thường, gen CP của virus là một
protein đa chức năng, trong đó chức năng chủ yếu nhất là cấu trúc.
Ví dụ, đối với potyvirus, nhóm virus chiếm tới 20% tổng số virus thực vật, người ta
thường nghiên cứu mức đa dạng dựa trên phân tích chuỗi gen CP.
2.2. DNA ribosome
DNA ribosome (rDNA), đặc biệt là vùng mã hóa các tiểu phần rRNA và các spacers liên
quan của nó, là một trong các vùng DNA được sử dụng phổ biến nhất trong nghiên cứu đa
dạng đối với sinh vật nhân thật (karyote) và tiền nhân (prokaryote).
2.2.1 Cấu trúc và chức năng RNA ribosome
Ribosome.Ribosomes là cơ quan tử cần cho tổng hợp protein. Một tế bào có thể chứa
hàng ngàn ribosome.
Ribosome ở cả sinh vật tiền nhân và nhân thật gồm 2 tiểu phần có kích thước không
ngang bằng (tiểu phần lớn và tiểu phần nhỏ). Mỗi tiểu phần gồm ít nhất một phân tử rRNA
nhiều tiểu phần protein ribosome (rprotein).
Ở sinh vật tiền nhân, ribosome là 70S (tiểu phần lớn là 50S và tiểu phần nhỏ là 30S)
Tiểu phần lớn 50S gồm rRNA 23S (~3000 nts) + rRNA 5S (120 nts0 + khoảng 30
protein ribosome.
Tiểu phần nhỏ 30S gồm rRNA 16S (~1500 nts) + khoảng 20 protein ribosome
Ở sinh vật nhân thật, ribosome là 80S (tiểu phần lớn là 60S và tiểu phần nhỏ là 40S)
Tiểu phần lớn 60S gồm rRNA 28S (~4700 nts) + rRNA 5.8S (160 nts) + khoảng 50
protein ribosome.
Tiểu phần nhỏ 40S gồm rRNA 18S (~1900 nts) + khoảng 35 protein ribosome
RNA ribosome (rRNA)
Các gen không mã hóa protein cũng phải được phiên mã, chẳng hạn phiên mã thành
rRNA. Vùng DNA mã hóa rRNA được gọi là DNA ribosome (rDNA). Các rDNA được tổ
chức thành các đơn vị phiên mã. Mỗi đơn vị phiên mã có thể được lặp lại nhiều lần trên bộ
genome. Số lượng lặp cũng như cấu trúc của các đơn vị phiên mã khác nhau giữa giữa sinh
vật nhân thật và sinh vật tiền nhân (hình)
Ở sinh vật tiền nhân, số đơn vị phiên mã có thể chỉ là 1 hoặc lặp lại rải rác trên bộ gen
(chẳng hạn bằng 7 ở E. coli). Về cấu trúc, mỗi đơn vị phiên mã của prokaryote gồm các gen
xếp theo thứ tự là 16S-23S-5S. Ở 2 đầu của đơn vị phiên mã là các vùng 5‘ và 3‘ ETS
(external transcribed spacer); còn ở 2 đầu của gen 23S là 2 vùng ITS (internal transcribed
spacer). Một đoạn mã hóa tRNA thường nằm ở vùng ITS giữa gen 16S và 23S (và cũng
thường nằm ở vùng 3‘ETS). Chú ý là các đoạn spacer sẽ bị loại bỏ sau khi phiên mã để tạo ra
các RNA chức năng.
Ở sinh vật nhân thật, các đơn vị phiên mã thường lặp lại nhiều lần và kề nhau thành các
cụm đơn vị phiên mã. Số đơn vị lặp trong một cụm thường nhiều (ở nấm men là 100 – 200
lần). Các cụm đơn vị phiên mã cũng lại lặp lại nhiều lần trên các nhiễm sắc thể khác nhau (ở
người có thể tới 5 cụm). Về cấu trúc, một đơn vị phiên mã gồm các gen xếp theo thứ tự là
18S-5.8S-28S. Tương tự như ở prokaryote, xung quanh vùng mã hóa của các gen RNA của
eukaryote cũng là các vùng spacer. Do các đơn vị phiên mã của eukaryote lặp xếp liền kề
nhau nên vùng spacer giữa các đơn vị lặp còn được gọi là vùng IGS (intergenic spacer).
42
2.2.2 Vai trò của rDNA trong phân loại và nghiên cứu đa dạng và chẩn đoán
rDNA là một vùng gen quan trọng trong nghiên cứu đa dạng và phân loại vì
Là một vùng gen có mặt ở tất cả các đối tượng có cấu tạo tế bào.
Các gen nằm trên rDNA có cả cùng bảo thủ lẫn vùng biến động và do vậy có thể được
dùng để so sánh các chi khác nhau.
Các vùng spacer biến động hơn rất nhiều và do vậy có thể dùng để so sánh các loài
khác nhau, và trong một số trường hợp có thể ở mức dạng chuyên hóa.
Về mặt kỹ thuật, trên rDNA của có nhiều vị trí cắt giới hạn, do vậy tạo điều kiện thuận lợi
cho cloning.
Các nghiên cứu đầu tiên đối với rDNA thường áp dụng kỹ thuật RFLP + lai hóa bằng dò +
DNA tổng số được cắt bằng RE
Gần đây hơn (khoảng 1990>+, các kỹ thuật trên được thay thế bằng PCR và có thể được
sử dụng ngay trên mẫu cây nhiễm tác nhân gây bệnh (nấm, vi khuẩn)
Cả vùng ITS và IGS đã được sử dụng để thiết kế các mồi đặc hiệu loài nhằm phát hiện tác
nhân gây bệnh ngay trên cây bị nhiễm.
Hiện nay, người ta quan tâm nhiều hơn đến việc giải trình tự toàn bộ đơn vị phiên mã
rDNA để có được thông tin về tất cả các vùng trong đơn vị. Mặc dù vậy, người ta vẫn có thể
có thông tin hữu ích dựa vào các băng đa hình cắt bằng RE đối với sản phẩm PCR khuyếch
đại từ 1 vùng nào đó của đơn vị phiên mã. Cách này rất đơn giản, thường tạo 1 – 4 băng.
Cần chú ý phân tích RFLP dựa vào rRNA chỉ dựa trên sự sai khác ở chuỗi nhận biết của
RE nên nếu một phân tích (1) tạo ra 2 mô hình RFLP khác nhau cho biêt 2 mẫu là khác nhau
nhưng (2) tạo ra 2 mô hình RFLP giống nhau không có nghĩa các vùng gen còn lại của cụm
rRNA là giống nhaug nhau.
(tham khảo: www.mendel.berkeley.edu/boletus/boletus.html; www.
biology.duke.edu/fungi/).
43
2.3. Gen mã hóa
Có rất nhiều gen mã hóa đã được sử dụng trong nghiên cứu đa dạng của tác nhân gây
bệnh.
Đối với nấm, một số gen phổ biến đã được sử dụng là các gen mã hóa actin, tubulin, yếu
tố qui định kéo dài sự dịch mã (elongation factors), cytochromes, proteases, và nhiều protein
khác. Các gen này nhìn chung bảo thủ cao thậm chí gữa các sinh vật thuốc các đơn vị phân
loại khác nhau. Tuy nhiên, vì chúng chứa các chuỗi intron ngắn rất biến động về số lượng
cũng như vị trí trên gen nên có thể được sử dụng làm marker phân tử nhằm nghiên cứu các
sinh vật có quan hệ gần. Ví dụ: nhiều nấm đã được nghiên cứu dựa trên các gen mã hóa là
Fusarium, Ascochyta, và Phoma.
Đối với vi khuẩn, nhiều loại gen mã hóa có thể được sử dụng. Một số ví dụ là gen virD2
(Agrobacterium), gen mã hóa pectate lyase (pel) (Erwinia carotovora), gen mã hóa protein
không độc avrBS2 (Xanthomonas).
2.4. Các chuỗi lặp
Trên bộ gen của prokaryote và eukaryote có nhiều chuỗi lặp thường được sử dụng trong
phân loại và đánh giá đa dạng.
Đối với karyote, các chuỗi lặp này thường chiếm 1 tỷ lệ rất cao trong bộ gen của các
eukaryote (ví dụ khoảng 50 % DNA của người là các chuỗi lặp).
Các chuỗi lặp có thể được chia thành:
2.4.1 Các chuỗi lặp liền kề (tandem repetitive sequences)
Chuỗi DNA vệ tinh đơn (satellite DNA). Gồm các đoạn 5 – 10 bp, lặp lại khoảng 100 lần
Minisatellites. Gồm các đoạn 15-100 bp, lặp lại khoảng 20-50 lần
44
VNTR (variable number tandem repeat): gồm các đoạn lặp có chiều dài rất thay đổi ( ~ 1-
2000 bp)
Microsatellites: gồm các đoạn lặp 2-4 bp, lặp lại khoảng 20-50 lần. Các microsatellite là
các các chuỗi lặp rất quan trọng, đặc biệt trong nghiên cứu đa dạng của eukaryote nên
được trình bày riêng.
2.4.2 Các chuỗi lặp phân bố rải rác (Dispersed repetitive sequences)
Đây là các chuỗi DNA có kích thước khác nhau và lặp lại nhiều lần nhưng không liền
kề nhau mà phân bố rải rác khắp bộ gen. Một ví dụ điển hình là các yếu tố di động (mobile
elements = gen nhảy).
Đối với eukaryote, các chuỗi lặp phân bố rải rác có thể có kích thước ngắn (Short
interspersed elements, SINES) từ 150 - 300 bp (ví dụ chuỗi lặp Alu ở người có kích thước
300 bp, lặp lại từ 0.5 – 1 triệu lần trong bộ gen, chiếm ~5% tổng DNA). Các chuỗi lặp có thể
có kích thước dài (Long interspersed elements (LINES)) với kích thước 5000 - 7000 bp.
Đối với prokaryote, bộ gen của chúng cũng chứa nhiều loại chuỗi lặp phân bố rải rác.
Một số chuỗi lặp có ý nghĩa trong nghiên cứu đa dạng và phân loại vi khuẩn là:
Các chuỗi lặp đối song (REP, repetitive extragenic palindromic) có kích thước 35 - 40 bp.
Các chuỗi lặp bảo thủ vùng liên gen (ERIC, enterobacterial repetitive intergenic
consensus) có kích thước 124 - 127 bp.
Nguyên tố BOX có kích thước 54-bp.
2.5. DNA ti thể (mitochondrial DNA)
DNA ti thể (mitochondrial DNA = mt DNA) đã được sử dụng nhiều trong nghiên cứu tác
nhân gây bệnh cây (nấm). DNA ti thể là một phân tử DNA vòng di truyền chủ yếu theo dòng
mẹ. Đối với nấm, mtDNA có đặc điểm sau:
- Kích thước từ 17-121 Kb
- Chiếm từ 1 – 20 % DNA của tế bào
- Các vùng không mã hóa chiếm một tỷ lệ cao
- Chứa nhiều các chuỗi lặp và intron. Đặc điểm này làm cho mtDNA của các sinh vật quan
hệ gần có một mức đa dạng đáng kể.
- Số lượng copy trong tế bào có thể khá lớn
- Ở một số loài nấm có thể có sự tái tổ hợp mtDNA
- .Có thể được chuyển (độc lập với bộ gen nhân) sang tế bào khác thông qua dung hợp
- Có thể chứa các chuỗi lặp đối song giàu GC
- Chứa cả các vùng bảo thủ và vùng biến động nên thông tin về trình tự chuỗi có thể rất có
ích trong phân biệt nấm ở nhiều mức phân loại.
- Trong một số trường hợp, các loài có qua hệ gần gũi có thể có bộ gen mt DNA rất khác
nhau. Ví dụ các loài nấm men Saccharomyces có mtDNA biến động từ 24 – 78 kb.
45
Chương 3. Các kỹ thuật CNSH trong nghiên cứu bệnh cây
Chương này nhằm hệ thống lại các kỹ thuật CNSH dựa trên phân tích băng điện di được
sử dụng trong bệnh cây. Hầu hết các kỹ thuật quan trọng đã được mô tả chi tiết trong nhiều tài
liệu CNSH. Vì tác nhân gây bệnh cây rất đa dạng bao gồm các eukaryote, prokaryote, virus và
viroid nên trong tài liệu này, người đọc nên chú ý đến đặc điểm, ưu nhược điểm của mỗi
phương pháp nhằm áp dụng kỹ thuật phù hợp với đối tượng nghiên cứu.
1. Các marker di truyền
1.1. Định nghĩa
Một marker di truyền có thể được định nghĩa theo 1 trong các cách sau:
Một dấu hiệu trên nhiễm sắc thể hoặc allele cho phép xác đinh một vùng DNA đặc biệt.
Một đoạn DNA đặc biệt với vị trí đã biết trên genome
Một gen mà biểu hiện kiểu hình của nó thường được phân biệt dễ dàng, được sử dụng xác
định một cá thể hoặc 1 tế bào mang nó, hoặc như một dò để đánh dấu 1 nhân, nhiễm sắc
thể hay locus (King and Stansfield, 1990).
1.2. Phân loại
Marker di truyền có thể được chia làm 3 nhóm chính:
Các tính trạng hình thái có thể quan sát bằng mắt.
Các marker sinh hóa dựa trên sản phẩm gen (isozyme, allozyme, acit béo…)
Các marker phân tử dựa trên các thử nghiệm liên quan đến DNA. Chú ý là các marker
phân tử không nên được xem là các gen thông thường mà nên được xem như các dấu hiệu
cố định trên genome. Chúng là các chuỗi DNA có thể xác định được, nằm tại một vị trí
đặc biệt trên genome và có thể truyền được sang thế hệ sau.
Vì có quá nhiều kỹ thuật phân tử với nguyên lý khác hẳn nhau nên người nghiên cứu phải
cẩn thân trong việc lựa chọn kỹ thuật phù hợp
2. Các loại marker phân tử
Có rất nhiều các loại marker phân tử khác nhau như liệt kê ở bảng dưới đây
Bảng. Các loại marker phân tử
TT Tên đầy đủ Viết tắt
1 allele specific oligo ASO
2 allele specific polymerase chain reaction AS-PCR
3 amplified fragment length polymorphism AFLP
4 anchored microsatellite primed PCR AMP-PCR
5 arbitrarily primed PCR AP-PCR
6 cleaved amplified polymorphic sequence CAPS
7 degenerate oligonucleotide primed PCR DOP-PCR
8 DNA amplification fingerprinting DAF
9 expressed sequence tags EST
10 inter-simple sequence repeat ISSR
11 inverse PCR IPCR
12 Microsatellite primed PCR MP-PCR
13 multiplexed allele-specific diagnostic assay MASDA
46
14 random amplified microsatellite polymorphisms RAMP
15 random amplified microsatellites RAM
16 Random amplified polymorphic DNA RAPD
17 selective amplification of microsatellite polymorphic loci SAMPL
18 sequence characterized amplified regions SCAR
19 sequence specific amplification polymorphisms SSAP
20 sequence tagged microsatelite site STMS
21 sequence tagged site STS
22 short tandem repeats STR
23 simple sequence length polymorphism SSR
23 single nucleotide polymorphism SNP
25 single primer amplification reactions SPAR
26 Single stranded conformational polymorphism SSCP
27 site-selected insertion PCR SSI
28 strand displacement amplification SDA
29 variable number tandem repeat VNTR
30 Repetitive element based PCR = repetitive sequence primed
PCR = repetitive sequence based PCR
Rep-PCR
Một số loại marker rất giống nhau như ASAP, ASO và AS-PCR. Một số là đồng nghĩa
như ISSR, RAMP, RAM, SPAR, AMP-PCR, MP-PCR và ASSR. Một số là đồng nhất như
SSLP, STMS, STR và SSR.
Các loại marker trên có thể được phân loại theo các nhóm sau:
Kiểu di truyền: gen nhân cả bố và mẹ, gen nhân qua mẹ, cơ quan tử qua mẹ, cơ quan tử
qua bố
Kiểu hoạt động của gen: trội hay đồng trội
Phương pháp phân tích: dựa trên lai phân tử (ví dụ RFLP) hay dựa trên PCR (ví dụ rep-
PCR, SSR)
3. Kỹ thuật dựa trên lai phân tử: RFLP
RFLP (Restriction fragment length polymorphism) là kỹ thuật được sử dụng lần đầu tiên
vào năm 1975 để xác định đa hình DNA nhằm lập bản đồ di truyền của một đột biến mẫn cảm
nhiệt độ của các serotype của adenovirus.
Kỹ thuật dựa trên việc cắt bằng RE toàn bộ bộ gen của vi sinh vât. Mặc dù 2 cá thể cùng
loài nhìn chung có bộ gen đồng nhất thì chúng vẫn khác nhau một số nucleotide do các
nguyên nhân sau: đột biến điểm, thêm/mất, chuyển vị trí, đảo vị trí và lặp (duplication)
nucleotide. Hậu quả là sản phẩm cắt DNA sẽ có số lượng và kích thước thay đổi. Qui trình
RFLP nhìn chung gồm các bước sau:
Cắt DNA mẫu bằng 1 hoặc nhiều RE
Tách sản phẩm cắt bằng điện di agarose
Chuyển các sản phẩm đã tách từ gel agarose sang màng bằng Southern bloting.
Phát hiện các đoạn bằng lai DNA với dò (probe) thích hợp.
Hình ảnh hóa (autoradiography) phụ thuộc nhãn dò (bức xạ hay huỳnh quang)
3.1. RFLP: các chú ý về kỹ thuật
Chất lượng DNA phải rất sạch vì phản ứng cắt băng RE yêu cầu chất lượng DNA cao
47
RE: có thể có đoạn nhận biết 4, 6, 8 bp (vd ECoRI có chuỗi nhận biết là 6
(5‘…GAATTC…3‘). Việc lựa chọn RE phụ thuộc mức độ phân giải. Nếu RE có chuỗi nhận
biết = 4 thì mức độ phân giải cao nhất (số băng hình thành nhiều nhất, kích thước băng nhỏ).
Trái lại nếu dùng RE có chuỗi nhận biết bằng 8 thì sẽ tạo ít băng DNA hơn, kích thước băng
lớn và do vậy phải yêu cầu điều kiện điện di phức tạp. Thông thường, người ta hay dùng RE
có chuỗi nhận biết bằng 6 (sẵn có hơn, rẻ hơn, thường tạo các đoạn DNA có kích thước từ 200
– 20.000 bp nên dễ tách bằng điện di agarose)
Điện di: có thể điện di agarose hoặc polyacrylamide phụ thuộc RE (RE-4 tạo đoạn quá
nhỏ nên phải dùng polyacrylamide. Trái lại RE = 6 không thể tách =polyacrylamide nên phải
dùng agarose)
Dò: dò có thể đặc hiệu loài, đặc hiệu môt locus đơn (single locus RFLP), đặc hiệu nhiều
locus (multiple locus RFLP) (thường dùng các chuỗi lặp làm dò). Dò có thể là các clone DNA
hoặc cDNA. Dò có thể gán nhãn phóng xạ hoặc gán nhãn huỳnh quang
Phần trăm gel để tách các sản phẩm DNA sợi thẳng
Agarose Polyacrylamide
Nồng độ gel (%) Phạm vi tách (bp) Nồng độ gel (%) Phạm vi tách (bp)
0.5 1000 - 30000 3.5 100 – 1000
0.7 800 – 12000 5.0 80 – 500
1.0 500 – 10000 8.0 60 – 400
1.2 400 – 7000 12.0 40 – 200
1.4 200 – 4000 20.0 5 - 100
2.0 50 - 2000
3.1.1 RFLP: Các ưu điểm chính
Có khả năng lặp lại cao (giữa các phòng thí nghiệm)
Xác định được di truyền đồng trội
Marker có tính đặc hiệu locus (nên trình tự bảo thủ của các gen của các sinh vật có quan
hệ gần gũi có thể được xác định)
Không yêu cầu thông tin chuỗi
Dễ ghi điểm do kích thước các băng thường khác nhau đáng kể
3.1.2 RFLP: Các hạn chế chính
Yêu cầu số lượng và chất lượng DNA cao
Việc xây dựng bộ dò khá phức tạp
Không thể tự động hóa được (nên tốn công sức và chi phí)
Mức độ đa hình thấp, chỉ một số ít locus được nghiên cứu trong một lần thử
Tốn thời gian, lao động và đắt
Dò yêu cầu gán nhãn bức xạ nên độc hại (hiện nay thường gán nhãn huỳnh quang an toàn
hơn nhưng đắt)
48
4. Các kỹ thuật dựa trên PCR
Từ khi được phát minh bởi Kary Mullis năm 1983 (đoạt giả Nobel năm 1993), PCR là
một kỹ thuật được sử dụng phổ biến nhất trong sinh học phân tử. Các kỹ thuật dựa trên PCR
có một số lợi thế là
Lượng DNA yêu cầu nhỏ (trong nhiều trường hợp không cần chất lượng cao)
Không cần gán nhãn bức xạ ở phần lớn các kỹ thuật
Khả năng nhân chuỗi DNA từ mô bảo quản
Không yêu cầu trang thiết bị quá phức tạp
Nhiều kỹ thuật không cần biết trước trình tự chuỗi gen cần phân tích (AP-PCR, RAPD,
DAF, AFLP và ISSR.
Mức độ đa hình cao cho phép tạo nhiều marker di truyền trong thời gian ngắn
Khả năng kiểm tra nhiều gen đồng thời
Các lợi thế trên, tuy nhiên, có thể thay đổi tùy kỹ thuật đặc biệt. Phụ thuộc loại mồi sử
dụng, các kỹ thuật dựa trên PCR có thể chia làm 2 nhóm chính
Các kỹ thuật dùng mồi tùy ý (hoặc bán tùy ý). Do mồi tùy ý nên không cần biết trước
thông tin chuỗi của đối tượng nghiên cứu (Vd:AP-PCR, DAF, RAPD, AFLP, ISSR).
Các kỹ thuật dùng mồi đặc hiệu được thiết kế từ các chuỗi đã biết (Vd: EST, CAPS, SSR,
SCAR, STS, Rep-PCR).
5. Các kỹ thuật dựa trên PCR dùng mồi tùy ý: RAPD, AP-PCR và DAF
RAPD (random amplified polymorphic DNA), AP-PCR (arbitrarily primed PCR) và
DAF (DNA amplification fingerprinting) là 3 kỹ thuật phổ biến thường được gọi chung là
MAAP (multiple arbitrary amplicon profiling). Sự khác nhau chủ yếu của các kỹ thuật MAAP
là biến đổi mô hình băng điện di bằng cách thay đổi trình tự và độ dài mồi, Ta, số chu trình
PCR, enzyme DNA polymerase chịu nhiệt và cắt khuôn DNA hay sản phẩm PCR bằng RE;
kỹ thuật tách và nhuộm sản phẩm PCR. Các kỹ thuật này tạo các profile khác nhau đáng kể,
thay đổi từ khá đơn giản (RADP) tới rất phức tạp (DAF). Cả 3 kỹ thuật RAPD, AP-PCR và
DAF sử dụng một mồi tùy ý đê nhân DNA với sản phẩm nhìn chung có kích thước < 3000 bp.
5.1. RAPD
RADP thường dùng 1 mồi có kích thước khoảng 10 bp có nhiệt độ gắn mồi Ta thấp (34 –
37 OC). Mặc dù trình tự mồi là tùy ý nhưng cần đảm bảo 2 chỉ tiêu cơ bản: hàm lượng GC tối
thiểu = 40% (thông thường 50 – 80 %) và phải không chứa các chuỗi đối song (palindromic).
Để đảm bảo sự thống nhất giữa các phòng thí nghiệm, các mồi RADP có thể được mua từ một
số nguồn khác nhau như University of British Colombia
(http://www.michaelsmith.ubc.ca/services/ hoặc từ hãng Operon Biotechnologies
(http://www.operon.com)...
Sản phẩm PCR có thể được điện di trên gel agarose 1.5-2.0 % agarose (nhuộm với
ethidium bromide) hoặc polyacrylamide (nhuộm với AgNO3 hoặc sử dụng mồi gán nhãn
phóng xạ hoặc huỳnh quang). Mặc dù mức độ phân giải thấp nhưng do tính đơn giản, nhanh
và chỉ cần sử dụng điện di gel agarose rẻ hơn nên RADP được sử dụng phổ biến hơn AP-PCR
và DAF
Phần lớn các đoạn RAPD hình thành từ một locus nên 2 loại đa hình sẽ xuất hiện: (1) có
hay không có băng và (2) độ đậm của băng. Vì độ đậm của băng có thể hình thành từ số copy
49
hoặc số lượng của khuôn nên dựa theo độ đậm, người ta có thể phân biệt được cá thể trội
đồng hợp tử với cá thể dị hợp tử. Tuy nhiên điều này không luôn luôn đúng vì độ đậm của
băng còn phụ thuộc vào mức độ mismatch tại vị trí gắn mồi; do vậy nhiều tác giả không tính
mức độ đậm nhạt của băng.
5.1.1 RAPD: nhược điểm
Tính lặp lại thấp. Do kỹ thuật dựa vào PCR nên nhiều yếu tố có thể ảnh hưởng đến kết
quả RADP: chất lượng và số lượng khuôn DNA, nồng độ MgCl2, Ta, nguồn Taq, nguồn
máy PCR. Hậu quả là RADP có thể cho các dấu hiệu (+) giả hoặc (-) giả.
Di truyền trội. Do các marker RAPD là marker của các allele trội nên không thể phân biệt
được các các cá thể đồng hợp tử trội và các cá thể dị hợp tử.
Tính cùng nguồn (homology) đôi khi không rõ. Do kết quả được thường được đánh giá
dựa trên điện di agarose nên các nhược điểm của điện di agarose cũng cần tính đến. Chẳng
hạn, nhìn chung, các băng DNA di chuyển cùng mức trên gel agarose thường được xem là
cùng locus. Tuy nhiên, nhiều nghiên cứu cho thấy ở các loài đa bội, các băng giống nhau
có thể khác locus. Nhược điểm này có thể được khăc phục bằng điện di polyacrylamide
(có mức độ phân biệt cao hơn).
5.2. DAF
DAF chủ yếu khác RAPD ở chỗ nó sử dụng các mồi ngắn hơn (5-8 bp), nồng độ mồi cao
hơn, dùng chu trình nhiệt 2 bước thay vì 3 bước và phát hiện sản phẩm PCR bằng điện di
polyacrylamide + nhuộm AgNO3.
5.3. AP-PCR
AP-PCR khác RAPD và DAF ở chỗ phản ứng PCR được chia làm 3 bước, mỗi bước có
điều kiện phản ứng và điều kiện khác nhau. Nồng độ mồi cao được sử dụng ở các chu trình
đầu tiên. Các mồi, có kích thước >= 20 nts được thiết kế tùy ý.
6. Kỹ thuật dựa trên PCR dùng mồi tùy ý: AFLP
Kỹ thuật AFLP (amplified fragment length polymorphism) được sử dụng lần đầu tiên bởi
Vos et al. vào năm 1995 và hiện nay là một trong các kỹ thuật sinh học phân tử được sử dụng
nhiều nhất trong nghiên cứu đa dạng thực vật, nấm và vi khuẩn. Điều thú vị là mặc dù AFLP
là một trong số các kỹ thuật hiệu quả nhất trong nghiên cứu DNA fingerprinting thì số lượng
các nghiên cứu tương tự dùng kỹ thuật này trên động vật lại ít hơn rất nhiều so với trên thực
vật và vi sinh vật. Lý do là các nhà nghiên cứu động vật đã (1) quen với các kỹ thuật dựa trên
microsattelite và (2) không muốn sử dụng các marker trội vì đã có nhiều báo cáo về tính
không ổn định của RAPD (mặc dù điều này không đúng với AFLP).
AFLP là kỹ thuật kết hợp ưu điểm của RFLP (RE trên toàn bộ bộ gen) và PCR.
Đặc điểm quan trọng nhất của AFLP là khả năng đánh giá mức độ đa hình trên toàn bộ bộ
gen hay nói cách khác là kiểm tra đồng thời một cách ngẫu nhiên các sản phẩm từ nhiều locus
trên.
6.1. AFLP: các bước
Tinh chiết DNA của tác nhân gây bệnh. Vì bước tiếp theo là cắt bằng enzyme cắt giới hạn
nên, giống như đối với kỹ thuật RFLP, chất lượng DNA là yêu cầu quan trong.
Cắt DNA bằng 2 RE, thường 1 ER có chuỗi cắt hiếm (như EcoRI) còn ER kia có chuỗi cắt
phổ biến hơn.
50
Nối sản phẩm cắt với adaptor (chứa chuỗi ER). Sản phẩm nối là khuôn cho phản ứng PCR
tiếp theo. Trình tự adapter và trình tự của RE là trình tự găn mồi của bước tiếp theo.
PCR lần 1 (preselective amplification): sử dụng 2 mồi tiền chọn lọc. Trình tự mồi tiền
chọn lọc là trình tự adapter + trình tự của RE + 1 nucleotid được thêm vào đầu 3‘. Sản
phẩm PCR lần 1 (hòa loãng) được sử dụng làm khuôn cho PCR lần 2. Chú ý: đối với một
số protocol, mồi tiền chọn lọc có thể không chứa 1 nucleotid bổ sung.
PCR lần 2 (selective amplification): sử dụng 2 mồi chọn lọc. Trình tự mồi chọn lọc là
trình tự mồi tiền chọn lọc + 2 nucleotid được thêm vào đầu 3‘. Số lượng nucleotid (1,2,3)
thêm vào đầu 3‘ sẽ tăng mức độ chọn lọc đồng thời giảm số sản phẩm PCR tương ứng từ
4, 16 và 64 lần). Một trong 2 mồi chọn lọc thường được đánh dấu bức xạ hoặc huỳnh
quang nhằm phân tích điện di tự động. Nhiều cặp mồi chọn lọc có thể được được sử dụng
để đánh giá chính xác mức độ đa hình.
Sản phẩm PCR là các băng chung + các băng khác nhau giữa các mẫu. Sản phẩm PCR có
thể được điện di agarose nhưg phổ biến hơn là điện di poyacrylamide (+ nhuộm AgNO3
hoặc đánh dấu bức xạ, huỳnh quang) hoặc điện di dùng sequencer. Các băng khác nhau
này là các DNA đa hình và sẽ được đánh giá dùng phần mềm thích hợp.
6.2. AFLP: ưu điểm
Độ tin cậy và khả năng lặp lại cao
Không cần biết trước về thông tin genome của đối tượng nghiên cứu.
Rất giàu thông tin vì có thể đánh giá đồng thời nhiều locus (có nghĩa có khả năng đánh giá
đa hình trên toàn bộ bộ gen) với chỉ một cặp mồi và trên một lần chạy điện di (lợi thế
quan trọng nhất so với RFLP, RAPD và microsatellite + các kỹ thuật tương tự)
Các sản phẩm cùng kích thước phần lớn là cùng nguồn (homology) và đặc hiệu locus (trừ
ngoại lệ là các loài đa bội)
6.3. AFLP: nhược điểm
Yêu cầu nhiều bước để thực hiện
Giống như đối với kỹ thuật RFLP, chất lượng DNA yêu cầu cao (vì bước đầu tiên sau khi
chiết DNA là cắt bằng RE).
Phát hiện sản phẩm bằng điện di polyacrylamide (+ nhuộm AgNO3 hoặc đánh dấu bức xạ
hoặc đánh dấu huỳnh quang) hoặc điện di bằng sequencer <=> đắt và tốn lao động hơn
Đắt hơn vì phải thêm chi phí RE + adapter.
Giống như đối với RAPD, phần lớn các locus AFLP là trội nên không phân biệt được cá
thể đồng hợp tử trội với cá thể dị hợp tử. Điều này làm giảm tính sát thực (accuracy) trong
phân tích di truyền quần thể, lập bản đồ di truyền và chọn lọc bằng marker phân tử đối với
các loài giao phối bắt buộc.
7. Kỹ thuật dựa trên PCR dùng mồi tùy ý: ISSR
ISSR (inter-simple sequence repeat) là kỹ thuật dùng PCR để nhân đoạn gen nằm giữa 2
vùng microsattelite đồng nhất có hướng ngược nhau (xem phần microsattelite). Kỹ thuật dùng
môt mồi được thiết kế trên vùng microsattelite. Đoạn lặp microsattelite có thể là vùng lặp
2,3,4 hay 5 nts. Mồi có thể không mỏ neo hay phổ biến hơn có mỏ neo với 1 – 4 nts suy biến
cao ở đầu 3‘ hay 5‘. ISSR sử dụng các mồi dài hơn RAPD (15 – 30 nts) nên Ta cao hơn và
51
như vậy đặc hiệu hơn. Sản phẩm PCR thường có kích thước 200 – 2000 bp và được phát hiện
hoặc bằng điện di agarose hay polyacrylamide.
ISSR dùng microsatellite để thiết kế mồi nhưng không cần biết trước trình tự DNA của
đối tượng nghiên cứu.
ISSR là kỹ thuật đơn giản, nhanh và có thể không cần điện di polyacrylamide (mặc dù nếu
dùng thì khả năng phát hiện tốt hơn).
Giống RAPD, kỹ thuật ISSR có tính lặp lại kém, marker trội và không phân biệt được cá
thể đồng hợp tử trội và dị hợp tử; không phân biệt được nguồn gốc các băng có cùng kích
thước.
8. Kỹ thuật dựa trên PCR dùng mồi đặc hiêu: SSR (=Microsatellites)
Bộ gen của vi sinh vật nhân thật chứa 3 loại chuỗi DNA lặp là DNA satellite,
minisatellites và microsatellites. Các chuỗi lặp nằm theo hàng (tandem) và có kích thước rất
khác nhau. Trong số các chuỗi lặp đơn giản này, microsatellite là một marker di truyền quan
trọng, thường được sử dụng trong nghiên cứu đa dạng.
Microsatellite (còn được gọi là các chuỗi lặp đơn giản = simple sequence repeats (SSRs),
các chuỗi lặp liền kề ngắn = short tandem repeats (STRs) hay các đoạn đa hình chuỗi đơn
giản = simple sequence length polymorphisms (SSLPs) là nhóm các chuỗi DNA đơn giản lặp
lại nhỏ nhất. Microsatellite là các chuỗi lặp, tùy theo tác giả, 1-5, 1-6 hoặc 2 - 8 nts.
Các chuỗi lặp thường đơn giản, bao gồm 2, 3, 4 nucleotid (gọi là di-, tri-, and
tetranucleotide repeats). Một ví dụ phổ biến của microsatellite là 1 dãy chuỗi lặp 2
dinucleotide (CA)n, trong đó n là tổng số chuỗi lặp nằm trong phạm vi từ 10 – 100. Các
marker này thường tạo ra mức đa hình cao trong nội bộ loài và giữa các loài, đặc biệt khi số
chuỗi lặp n bằng 10 hoặc lớn hơn.
Microsatelite là một trong các marker phân tử được sử dụng rộng rãi nhất vì nó có một
đặc điểm quan trọng là có tốc độ đột biến cao hơn các phần khác của bộ gene.
8.1. Phân loại microsatellite
Các microsatellite được phân loại theo loại chuỗi lặp như sau:
Microsatellite hoàn hảo: gồm các chuỗi lặp đều đặn chẳng hạn TATATATATATATATA.
Microsatellite không hoàn hảo: có một bp nằm xen giữa các chuỗi lặp (Vd
TATATATACTATATA).
Microsatellite gián đoạn: có các chuỗi nhỏ khác nằm bên trong (Vd
TATATACGTGTATATATATA).
Microsatellite phức: gồm 2 chuỗi lặp khác nhau (Vd TATATATATAGTGTGTGT)
8.2. Đặc điểm di truyền của microsatellite
Ở một locus microsatellite đồng hợp tử, số các chuỗi lặp giống nhau. Ở một locus
microsatellite dị hợp tử, số các chuỗi lặp khác nhau (chẳng hạn 1 microsattellite có 9 chuỗi
lặp còn microsatellite có 10 chuỗi lặp). Nhìn chung tại một locus microsatellite của một quần
thể đa allelle (theo nghĩa alelle của microsatelite) thì microsatellite của mỗi allele sẽ khác
nhau về số chuỗi lặp. Đây là đặc điểm di truyền quan trọng của microsatellite làm cho nó trở
thành một marker cực kỳ hữu hiệu trong việc phân biệt các cá thể của 1 quần thể => được ưa
thích trong nghiên cứu di truyền quần thể và tội phạm học.
52
8.3. Cơ chế tạo đột biến của microsatellite
Tốc độ đột biến của microsatellite cao hơn nhiều so với các vùng khác của bộ gen, nằm
trong phạm vi từ 10-2
đến 10
-6 /locus/thế hệ. Một số các cơ chế gây ra tốc độ đột biến cao của
microsatellite là: lỗi trong quá trình tái tổ hợp, trao đổi chéo không ngang bằng, trượt
(slippage) của DNA polymerase trong quá trình tái sinh và sửa chữa DNA.
Lỗi trong quá trình tái tổ hợp. Đây không phải là cơ chế chủ yếu vì người ta đã phát hiện
tốc độ đột biến microsattelte tương đương nhau ở chủng vi khuẩn E. Coli có hệ thống tái
tổ hợp và chủng không có hệ thống tái tổ hợp.
Trao đổi chéo không ngang bằng. Đây là một cơ chế quan trọng, tạo ra các đột biến mất
đoạn và thêm đoạn lớn. Lý do là trong quá trình tiếp hợp, trên vùng microsatellite của một
nhiễm sắc thể hình thành 1 cấu trúc kẹp tóc (hairpin). Hậu quả là sau khi trao đổi chéo,
một nhiễm sắc thể sẽ có một satellite dài hơn còn nhiễm sắc thể kia sẽ có microsatellite
ngắn hơn.
Trượt (slippage) của DNA polymerase trong quá trình tái sinh và sửa chữa DNA. Đây
cũng là một cơ chế quan trọng. Trong quá trình tái sinh và sửa chữa DNA, một sợi tạm
thời tách khỏi sợi kia và nhanh chóng tái hợp nhưng ở một vị trí khác dẫn tới lỗi ghép cặp
bazơ. Hậu quả là 1 allele sẽ tăng số chuỗi lặp nếu lỗi xuất hiện ở sợi thứ (sợi tương đồng)
hoặc giảm số chuỗi lặp nếu lỗi xuất hiện ở sợi chủ. Mặc dù cơ chế trượt của DNA
polymerase khá phổ biến nhưng hậu quả thường chỉ dẫn tới sự thêm hay giảm số lượng
chuỗi lặp của microsatellite (có nghĩa là đoạn thêm hay giảm ngắn hơn nhiều so với hậu
quả gây ra bởi cơ chế trao đổi chéo không ngang bằng)
Hình. Trao đổi chéo không ngang
bằng. Vùng đen và xám là
microsatellite
53
8.4. Phân bố của microsatellite
Trên một bộ genome, microsatellite phân bố không đều vì
Tần số của chúng khác nhau giữa vùng mã hóa và vùng không mã hóa. Do tốc độ đột biến
cao nên vùng mã hóa có mật độ microsatellite thấp hơn so với vùng không mã hóa. Người
ta đã chứng minh rằng, các microsatellite với chuỗi lặp là 3 hoặc 6 bp tồn tại với mật độ
tương đương ở vùng mã hóa và không mã hóa. Tuy nhiên, các microsatellite với chuỗi lặp
không phải là bội số của 3 thì tồn tại chủ yếu ở vùng không mã hóa.
Vai trò chức năng của microsatellite. Các nghiên cứu trên thực vật cho thấy, áp lực chọn
lọc tác động khác nhau lên vùng 5‘UTR, vùng mã hóa và 3‘UTR.
Tần số thay đổi theo đơn vị phân loại (theo nghĩa số lượng tuyệt đối các loci microsatellite
và motif của chuỗi lặp). Ở thực vật, tần số microsatellite cao ở thực vật có bộ gen nhỏ (vd
0.85% ở cây Arabidopsis) và thấp hơn ở cây có bộ gen lớn (vd 0.37% ở ngô). Tần số =
1.07% ở nhiễm sắc thể 22 của người và 0.21% ở tuyến trùng Caernorhabditis elegans.
8.5. Trình tự phân tích microsatellite
Thực hiện một phân tích microsatellite không đơn giản như đối với các phân tích dùng
mồi ngẫu nhiên hoặc ISSR. Có nhiều kỹ thuật microsatellite khác nhau nhưng phổ biến nhất
là PCR sử dụng 2 mồi F và R được thiết kế ở một locus bảo thủ ở 2 phía của của
microsatellite. Như vậy cặp mồi này có thể được áp dụng cho mọi cá thể của loài và tạo ra sản
phẩm PCR có kích thước khác nhau nếu microsatellite của các cá thể là khác nhau (hình ).
Tuy nhiên để có được bộ mồi thích hợp không hề dễ dàng vì microsatellite phải được phân lập
trước.
Hình Cơ chế ―trượt =
slippage‖ trong quá trình
tái sinh DNA. Giả sử
phân tử DNA gốc có 5
chuỗi lặp (hộp nhọn). Cơ
chế ―trượt‖ có thể dẫn tới
hình thành các allele mới
với 6 hoặc 4 chuỗi lặp
phụ thuộc sợi chứa lỗi
trượt.
54
Các bước chính trong phân tích microsatellite bao gồm
1. Xây dựng thư viện microsatellite
2. Xác định loci microsatellite duy nhất
3. Xác định vùng thích hợp để thiết kế mồi
4. Thử PCR
5. Đánh giá và diễn giải các băng
6. Đánh giá sản phẩm PCR tao sự đa hình.
Xây dựng thư viện microsatellite. Đây là bước phức tạp, tốn công sức nhất. Các bước cụ
thể gồm:
- Tinh chiết DNA genomic
- Cắt sản phẩm DNA genome bằng RE.
- Điện di sản phẩm cắt bằng agarose nồng độ thấp (khoảng 0.7%). Chọn vùng điện di
chứa các băng trong khoảng 300 – 700 bp. Tinh chiết các băng khỏi gel agarose.
- Clone các băng (dùng TA vector hoặc adapter) vào E.coli.
- Chọn lọc các clone (+, có khả năng chứa microsatellite) bằng Southen blot với dò
chứa các chuỗi lặp.
- Giải trình tự các clon +.
Sau khi đã biết trình tự các clone, các mồi đặc hiệu sẽ được thiết kế và thử PCR.
Vì xây dựng thư viện microsatellite theo phương pháp truyền thống rất tốn công sức (có
thể mất 1 tháng để hoàn thành), hơn nữa năng suất lại không cao nên đã có nhiều kỹ thuật
khác được áp dụng. Chẳng hạn, trong một kỹ thuật gọi là PIMA (PCR isolation of
microsatellite arrays), thay vì cắt sản phẩm DNA genome và clone, người ta thực hiện RAPD
dùng mồi ngẫu nhiên. Các sản phẩm RAPD được clone và kiểm tra bằng mồi đặc hiệu chuỗi
lặp và mồi đặc hiệu vector. Kỹ thuật PIMA dựa trên cơ sở là các sản phẩm RAPD thường
chứa nhiều microsatellite hơn các sản phẩm cắt ngẫu nhiên. Kỹ thuật PIMA có thể giảm thời
gian xuống còn 1 tuần.
Hình Phát hiện microsatellites từ DNA genome. Hai mồi F và R (mũi tên
xám) được thiết kế ở 2 bên vùng microsatellite. Nếu không có microsatellite
=> có sản phẩm 100 bp. Giả sử có một microsatellite với chuỗi lặp CA và n =
8 (dài 16 bp) thì sản phẩm PCR có kích thước = 116 bp.
55
Bước tiếp theo là chọn các marker satellite tốt nhất và tối ưu hóa điều kiện phản ứng PCR.
Mục tiêu là để cân bằng giữa giữa yêu cầu đặc hiệu cao và năng suất của sản phẩm PCR.
Ngoài ra còn cần phải xét đến khả năng nhận được sản phẩm từ nhiều loci microsatelitte khác
Hình. Sơ đồ trình bày các bước thiết lập marker microsatellite. Bên trái là sơ đồ truyền thống
và bên phải là sơ đồ PIMA (Zane et al., 2002).
56
nhau với kích thước không trùm (overlap) lên nhau. Hiệu quả của microsatellite phụ thuộc
vào sự phong phú của các chuỗi lặp vì càng nhiều chuỗi lặp khác nhau thì càng dễ chọn lựa
marker thích hợp.
Nhìn chung, các nhà nghiên cứu thích dùng các mồi nhằm vào các đoạn microsatellite với
3 hoặc 4 nts lặp (để tránh hiện tượng hình thành các băng ―stutters‖ thường bắt gặp ở các
microsatellite 2 nts).
8.6. Microsattelite: ưu điểm chính
Là marker đồng trội => cực kỳ tuyệt vời cho phân tích di truyền quần thể đối với các sinh
vật giao phối.
Có thể tự động hóa nếu mồi được gán nhãn huỳnh quang và được phân tích trên máy
sequencer tự động.
Nếu bộ mồi đã được lựa chọn thì việc áp dụng tương đối dễ dàng.
8.7. Microsattelite: nhược điểm chính
Như đã trình bày, việc xây dựng thư viện microsattelite và chọn lựa mồi thích hợp là cực
kỳ tốn kém công sức và tiền bạc.
Các sản phẩm PCR trong phân tích microsatellite thường có kích thước nhỏ (một vài trăm
bp) và chênh lêch kích thước nhiều khi không nhiều dẫn tới phải điện di agarose nồng độ
cao (~3 %) hoặc điện di polyacrylamide hoặc phân tích dùng máy sequencer tự động
(đắt).
9. Marker EST (expressed sequence tags)
Mỗi gen phải được phiên mã sang messenger RNA (mRNA) trước khi dịch mã sang
protein. Tuy nhiên vì mRNA rất không bền bên ngoài tế bào nên các nhà khoa học phải
chuyển nó sang dạng DNA bổ trợ (cDNA = complementary DNA). Ngay sau khi cDNA đã
được phân lập, các nhà khoa học có thể giải trình tự vài trăm nts đầu 5‘ và đầu 3‘ của nó để
tạo ra các nhãn chuỗi biểu hiện 5‘ETS hoặc 3‘ ETS (expressed sequence tags). 3‘ETS thường
nằm trong vùng không mã hóa (intron) hoặc UTR nên có xu hướng kém bảo thủ giữa các loài
hơn.
EST đầu tiên được sử dụng để xác định các transcripts nhưng dần trở thành công cụ để
khám phá gen nhằm có được thông tin về biểu hiện và điều hòa gen và để phát triển các
marker phân tử như EST-based RFLPs, SSRs, SNPs, và CAPS.
ESTs đã được sử dụng để thiết kế các dò cho microarray DNA; phát triển các marker
RFLP đơn hay có số copy thấp. Các marker RFLP xây dựng từ EST đã được sử dụng rộng rãi
để xây dựng các bản đồ liên kết di truyền mật độ cao. Thông thường, các marker RFLP dựa
trên EST cho phép thiết lập bản đồ liên kết có khả năng so sánh giữa các loài vì vùng mã hóa
thường bảo thủ. Do vậy, phát triển một marker cho 1 loài có thể sử dụng sô liệu của loài khác
đã có sẵn.
EST cũng cho phép tính toán để phát triển các marker SSR hay SNP. Các phần mềm tìm
kiếm mô hình (pattern) cho phép xác định các chuỗi lặp SSR trong EST. Thông tin trình tự
nucleotide sẵn có cho phép thiết kế các cặp mồi để kiểm tra tính đa hình của đối tượng nghiên
cứu. Khoảng 1 -5% các EST ở nhiều loài cây có các SSR có độ dài thích hợp (>=20 bp). Có
thể tìm một số lượng lớn SSR của một đối tượng nếu nhiều EST của nó đã được xác định. Ví
dụ Kantety et al. (2002) đã tiềm kiếm các SSR với chuỗi lặp 2,3 và 4 nucleotid với độ dài tối
thiểu 18 nucleotid) từ 262,631 EST của 5 loài cây (ngô, lúa, lúa mỳ, lúa miến và yến mạch)
sẵn có trên cơ sở dữ liệu và phát hiện thấy rằng 3,2% EST chứa SSR. Các SSR dựa trên EST
57
thường liên kết với các vùng phiên mã bảo thủ trong loài hơn là liên kết với các vùng không
phiên mã; do đó, các SSR này có thể áp dụng trên các đối tượng thuộc cùng chi. Các SSR dựa
trên EST cũng có khả năng cao hơn trong đánh giá sự biểu hiện khác nhau của gen so với các
SSR dựa trên genome ngẫu nhiễn khác.
10. Kỹ thuật CAPS
CAPS (cleaved amplified polymorphic sequence) là một kỹ thuật kết hợp giữa PCR và
RFLP nên còn có tên nguyên thủy là PCR-RFLP. Kỹ thuật rất đơn giản và gồm 2 bước: (1)
PCR để nhân một đoạn genome quan tâm và (2) tiếp theo, dùng RE thích hợp để cắt sản phẩm
PCR. Do vậy, CAPS phụ thuộc vào mô hình cắt bằng RE.
Ưu điểm
- Đơn giản: chỉ PCR và cắt bằng RE (không cần phát triển dò và lai phân tử như RFLP)
- Chủ yếu di truyền đồng trội.
Nhược điểm
- Khả năng phát hiện đa hình DNA không cao bằng SSR và AFLP vì mức đa hình chỉ
phụ thuộc vào sự thay đổi trình tự tại vị trí nhận biết của RE trên sản phẩm PCR.
11. Kỹ thuật SNP
Đơn vị cấu trúc nhỏ nhất của bộ genome là nucleotide. Có 4 loại nucleotide là A, G, C, T.
Một đa hình nucleotide đơn (SNP, single nucleotide polymorphism) hình thành ở một vị trí
nucleotide, và một loại nucleotide ở vị trí này được gọi là một allele. Ví dụ, có 2 đoạn DNA
CCACGTT và CCATGTT, trong đó có 2 nucleotide khác nhau ở vị trí thứ tư là C và T; trong
trường hợp này chúng ta gọi SNP có 2 allele. Mặc dù sự đa hình có thể gồm 2, 3 hay 4 allele
các SNP 3 hay 4 allele là cực kỳ hiếm. Do vậy, nhìn chung SNP được xem như là đa hình 2
allele.
Để sai khác trở thành một SNP nó phải có tần số > 1%. Một locus SNP được gọi là đồng
hợp tử khi 2 allele giống nhau và dị hợp tử khi 2 allele khác nhau. Allelle có tần số cao hơn
được gọi là hoang dại (wildtype) còn allele kia được gọi là đột biến.
Vì số lượng SNP khá phong phú và phân bố đều khắp bộ gen của nhiều sinh vật (Vd ở bộ
gen lúa, trung bình cứ 170 bp có 1 SNP) nên SNP đã trở thành 1 công cụ phân tích di truyền
hấp dẫn.
Vì marker SNP chỉ là sự sai khác của 1 bp nên trái với các loại marker khác, người ta
không thể phân biệt được allele trên cơ sở so sánh kích thước băng điện di. Có nhiều phương
pháp genotyping dựa trên SNP và tất cả các phương pháp đều gồm 2 phần: (1) tạo một sản
phẩm đặc hiệu allele và (2) phân tích sản phẩm đó. Phần lớn các phương pháp thuộc 1 trong 4
nhóm sau:
Các kỹ thuật lai trực tiếp đặc hiệu allele. Dựa trên khả năng phân biệt 2 chuỗi DNA khác
nhau chỉ bởi 1 nucleotide bằng lai DNA. Hai dò đặc hiệu allele sẽ được thiết kế, thường với
một nucleotide đa hình ở giữa. Dưới điều kiện lai hóa đã được tối ưu hóa, chỉ các tổ hợp lai
khớp nhau hoàn hảo mới ổn định. Phần lớn các lớn các kỹ thuật lai là Dot Blot trong đó DNA
thử (genome, cDNA hay sản phẩm PCR) được cố đinh trên màng và được lai hóa với dò
(thường là oligonucleotide). Trong kỹ thuật Dot Blot đảo, dò sẽ được cố định trước lên màng.
Nhìn chung, kỹ thuật lai hóa dễ mắc lỗi nên cần phải thiết kế dò cẩn thận và chuẩn điều kiện
lai. Cải tiến mới nhất đối với nhóm kỹ thuật lai là dùng microarray (xem phần).
Các kỹ thuật kéo dài mồi. Có 3 nhóm chính:
58
- Minisequencing. Nucleotide đa hình được xác định bằng cách thêm một
dideoxynucleotid triphosphate (ddNTP).
- Kéo dài mồi đặc hiệu allele. Mồi chỉ được tổng hợp tiếp nếu khớp hoàn hảo với
khuôn (chú ý đầu 3‘ của mồi).
- Pyrosequencing. Là kỹ thuật sequencing dựa trên sự phát hiện pyrophosphate giải
phóng ra trong quá trình sequencing.
Các kỹ thuật nối oligonucleotid. Hai dò oligonucleotid được thiết kế: một dò một dò đặc
hiệu allele (đầu 3‘ của nó là ở vị trí đa hình) và một dò kế tiếp phía hạ lưu. Khi lai hóa 2 dò
lên chuỗi thử, nếu không có mismat ở vị trí đa hình, đầu 3‘ của dò đặc hiệu allele sẽ được nối
với đầu 5‘ của dò thứ 2.
Các kỹ thuật cắt dò. Hai dò oligonucleotide được thiết kế: dò 1 (dò xâm nhập) tương
đồng phần 3‘ tính từ vị trí đa hình của chuỗi thử (đầu 3‘ của dò là 1 nucleotide không khớp
(non-matching) với nucleotide đa hình của của chuỗi thử). Dò 2 là dò đặc hiệu allele, được
thiết kế gối qua vị trí đa hình khoảng vài nucleotide. Khi lai với chuỗi thử, nếu không có
mismatch, hai dò sẽ tạo ra một cấu trúc 3 hướng và 1 cleavase sẽ nhận biết được cấu trúc này
và cắt phần gối của dò đặc hiệu allele. Phần bị cắ này thường được gắn với một nhãn huỳnh
quang và phát huỳnh quang khi được giải phóng khỏi dò.
12. Kỹ thuật rep-PCR
Rep-PCR (repetitive sequence primed PCR) là 1 kỹ thuật PCR fingerprinting rất hiệu quả
để nghiên cứu đa dạng các loài vi khuẩn. Kỹ thuật sử dụng các mồi được thiết kế dựa trên các
chuỗi lặp trên bộ gen vi khuẩn như: Các chuỗi lặp đối song vùng không mã hóa (REP,
repetitive extragenic palindromic) có kích thước 35 - 40 bp, các chuỗi lặp bảo thủ vùng liên
gen (ERIC, enterobacterial repetitive intergenic consensus) có kích thước 124 - 127 bp, chuỗi
BOX có kích thước 54-bp.
Phản ứng PCR sử dụng các mồi này được gọi cụ thể là REP-PCR, ERIC-PCR và BOX-
PCR.
Mặc dù Gillings & olley (1997) đã chứng minh rằng các chuỗi lặp này không có ở bộ gen
eukaryote nhưng kỹ thuật này cũng có thể được áp dụng để nghiên cứu đa dạng nhiều loài
nấm gây bệnh cây. Các mồi rep-PCR trong trường hợp nghiên cứu nấm, như vậy, đóng vai trò
như các mồi ngẫu nhiên giống như trong kỹ thuật RAPD.
Bảng: các mồi được sử dụng trong rep-PCR
Mồi Trình tự Tham khảo
BOX A1R 5'-CTACggCAAggCgACgCTgACg-3' Versalovic et al. 1994
ERIC 1R 5'-ATgTAAgCTCCTggggATTCAC-3' Versalovic et al. 1991
ERIC 2 5'-AAgTAAgTgACTggggTgAgCg-3' Versalovic et al. 1991
REP 1R 5'-IIIICgICgICATCIggC-3' Versalovic et al. 1991
REP 2I 5'-ICgICTTATCIggCCTAC-3' Versalovic et al. 1991
59
13. Tóm tắt các kỹ thuật
Thử thách đối với nhà nghiên cứu là làm sao chọn một hoặc vài kỹ thuật phù hợp với mục
tiêu nghiên cứu của mình. Các đặc điểm mong muốn của một marker phân tử tốt là: một mặt
có tính đa hình cao, di truyền đồng trội (phân biệt được cả đồng hợp tử và dị hợp tử), xuất
hiện thường xuyên và phân bố đồng đều trên bộ gen, chọn lọc trung tính; nhưng mặt khác lại
phải dễ tiếp cận, chi phí thấp, dễ thực hiện, có khả năng áp dụng với kết quả thống nhất giữa
các phòng thí nghiệm. Không có một marker phân tử nào hiện nay có thể đáp ứng được các
yêu cầu này, tuy nhiên người ta vẫn có thể chọn được các kỹ thuật mong muốn tùy đều kiện.
Các yếu tố cần xét khi lựa chọn là
Hệ thống marker sẵn có.
Tính đơn giản và thời gian thực hiện của kỹ thuật.
Mức đa hình yêu cầu của đối tượng nghiên cứu
Chất lượng và số lượng DNA của đối tượng nghiên cứu
Kỹ năng và trang thiết bị
Kinh phí của nghiên cứu.
Tính di truyền của marker trong đối tượng nghiên cứu (trội hay đồng trội)
Loại thông tin di truyền cần biết
Ví dụ, xét về điều kiện kinh tế, các kỹ thuật dựa trên microarray và sequencing (như SNP)
hiện nay có lẽ không dễ thực hiện tại các quốc gia đang phát triển như Việt Nam.
Xét về mức sẵn có của trình tự gen, các marker dựa trên EST như EST-SSR, EST-CAPS
và EST-RFLP chỉ có thể áp dụng cho các loài mà các chuỗi EST đã được xác đinh trước (sẵn
có trên ngân hàng gen)
Nhìn chung các kỹ thuật như RFLP, SSR, RAPD, AFLP, ISSR và rep-PCR có thể được áp
dụng cho nhiều đối tượng trong điều kiện Việt Nam.
Các bảng dưới đây mô tả đặc điểm một số kỹ thuật/marker phổ biến
Mức phân biệt trông nghiên cứu đa dạng và phân loại một số kỹ thuật/marker phân tử
Loại phân tích Mức phân biệt
RAPD Cá thể, nhóm dưới loài
SSR (Microsatellite) Cá thể, nhóm dưới loài, loài gần gũi (một số)
AFLP Cá thể, nhóm dưới loài, loài gần gũi
RFLP dựa trên mtDNA Nhóm dưới loài, loài gần gũi
RFLP dựa trên vùng ITS/IGS Loài gần gũi, nhóm dưới loài
Sequencing vùng ITS Loài gần gũi, nhóm dưới loài (một số)
Sequencing vùng rRNA Ngành (phylum), họ, chi, loài
Các gen mã hóa protein cấu trúc/chức
năng
Ngành (phylum), họ, chi, loài, dưới loài
(một số)
60
Bảng. Đặc điểm một số kỹ thuật/marker phân tử
RFLP Microsatellite RAPD AFLP ISSR
Mức phong phú trên bộ
gen
Cao Trung bình Rất cao Rất cao Trung bình
Phần gen được khảo sat
Các vùng mã hóa có số copy
thấp
Toàn bộ genome
Toàn bô genome
Toàn bộ genome
Toàn bộ genome
Lượng DNA yêu cầu
Cao Thấp Thấp Trung bình Thấp
Chất lượng DNA yêu cầu
Cao Trung bình Trung bình Cao Trung bình
Loại đa hình Các thay đổi, thêm, mất
nucleotide đơn
Các thay đổi độ dài đoạn
lặp
Các thay đổi, thêm, mất
nucleotide đơn
Các thay đổi, thêm, mất
nucleotide đơn
Các thay đổi, thêm, mất
nucleotide đơn
Mức đa hinh* Trung bình Cao Cao Rất cao Cao
Di truyền của marker
Đồng trội Đồng trội Trội Trội Trội
Phát hiện allele
Có Có Không Không Không
Dễ sử dụng Rất nhiều bước
Dễ Dễ Lúc đầu khó Dễ
Khả năng tự động
Thấp Cao Trung bình Trung bình Trung bình
Tính lặp lại (độ tin cậy)
Cao Cao Trung bình Cao Trung bình – Cao
Loại dò/mồi DNA genome có số copy thấp hoặc
clone cDNA
Các chuỗi DNA lặp đặc hiệu
Thường dài 10 nts (ngẫu nhiên)
Các chuỗi đặc hiệu
Các chuỗi DNA lặp đặc hiệu
Cloning
và/hoặc sequencing
Có Có Không Không Không
Phát hiện dùng bức xạ
Có/không Không Không Có/Không Không
Chi phí khởi đầu
Cao Cao Thấp Trung bình Trung bình
Hiện trạng bản quyền
Không Không (một số có)
Có Có Không
61
Chương 4. Phân tích kết quả dựa vào số liệu băng điện di
1. Giới thiệu
Các loại marker phân tử khác nhau sẽ cho các kết quả điện di khác nhau. Ví dụ kỹ thuật
RFLP và một số kỹ thuật fingerprinting khác như microsatellite (SSR) nhìn chung sẽ tạo các
băng điện di đơn, thường từ 1 – 20 băng. Các băng này có thể dễ dàng chuyển sang dạng số
liệu nhị nguyên (có băng = 1, không có băng = 0). Dựa trên số liệu này, người ta có thể tính
toán mức tương đồng di truyền S (xem các công thức tính hệ số tương đồng) và khoảng cách
di truyền D (=1-S), cuối cùng là xây dựng một cây phả hệ thường thông qua phân tích cụm.
Phân tích dựa trên băng điện di giống nhau cho 2 nhóm phân tích.
Nhóm 1 thường tạo ít băng (điển hình RFLP, microsatellite, ISSR)
Nhóm 2 thường tạo rất nhiều băng phức tạp (điển hình AFLP, rep-PCR). Mặc dù các băng
có thể được đánh giá và ghi bằng tay thì thông thường người ta dùng một 1 phần mềm
hình ảnh để scan các băng, điều chỉnh, chọn lựa và chuyển sang dạng số liệu nhị thức.
Vd phần mềm CrossChecker (miễn phí): http://en.bio-soft.net/draw/CrossChecker.html
Vd phần mềm GelcomparII (thương mại): http://www.applied-maths.be/gelcompar/gelcompar.htm
Hình. Biến dị allele trong phân tích microsatellite đối với nấm đạo ôn lúa (Pyricularia
oryzae. (Prondani et al. 2000). Một ví dụ về mô hình băng điện di đơn giản
Hình Đa dạng gen trong phâ tích rep-
PCR đối với vi khuẩn Xanthomonas
oryzae (Cruz et al 1996). Một ví dụ
về mô hình băng điện di phức tạp.
62
2. Các bước chính trong phân tích đa dạng dựa trên băng điện di
2.1. Mô tả sự đa dạng
Việc mô tả sự đa dạng có thể được thực hiện giữa các cá thể trong quần thể, giữa các quần
thể trong một khu vự với nhau, thậm chí giữa các đơn vị quần thể lớn hơn nhiều (ví du gữa
các vùng thuộc các lục địa khác nhau).
Locus Cá thể /quần thể
1 2 3 4 5 6
Số liệu
marker
A 1 0 1 1 0 1
B 1 0 0 0 1 1
C 0 1 1 0 1 0
D 1 0 0 0 1 1
E 0 0 1 1 0 0
F 1 1 1 0 0 0
G 1 0 1 0 1 1
2.2. Tính toán mối quan hệ giữa các đơn vị được phân tích ở bước trên
Bước này chủ yếu tính khoảng cách di truyền giữa các cặp đơn vị phân tích.
Ví dụ. Khoảng cách di truyền giữa các cá thể
1 2 3 4 5 6
1 0
2 0.56 0
3 0.33 0.33 0
4 0.47 0.26 0.50 0
5 0.32 0.43 0.37 0.28 0
6 0.33 0.56 0.56 0.37 0.46 0
2.3. Biểu diễn mỗi quan hệ
Biểu diễn mối quan hệ bằng các phương pháp khác nhau (ví dụ vẽ cây phả hệ…)
Cá thể 5
Cá thể 3
Cá thể 6
Cá thể 4
Cá thể 2
Cá thể 1
Hình. Cây phả hệ
thể hiện mối quan
hệ giữa các cá thể
ở trên.
63
3. Lượng hóa mức đa dạng: đo đa dạng trong quần thể
3.1. Dựa trên số lượng biến dị
3.1.1 Mức đa hình hay tỷ lệ đa hình (Pj)
Một gen được xem là đa hình nếu tần số của một trong các allele của nó ≤ 0.95 hoặc 0.99
Pj = q ≤ 0.95 hoặc Pj = q ≤ 0.99
Trong đó,
Pj = tỷ lệ đa hình
q = tần số allele
Pj chủ yếu được sử dung với các marker đồng trội vì các marker trội có thể bỏ qua các
biến dị hợp tử.
Một gen đa hình thường là gen mà allele phổ biến nhất của nó có tần số ≤ 0.95 . Các allele
hiếm của nó có thể có tần số ≤ 0.005. Đặt giới hạn tần số 0.95 hay 0.99 là tùy ý.
3.1.2 Tỷ lệ các locus đa hình (P)
Tỷ lệ locus đa hình được tính theo công thức đơn giản sau:
ntotal
npjP
Trong đó,
P = tỷ lệ các locus đa hình
npj = số lượng các locus đa hình
ntotal = tổng số locus nghiên cứu
P biểu diễn phần trăm các locus đa hình trong quần thể, được tính toán dựa trên đếm trực
tiếp các locus đa hình và tổng số locus nghiên cứu.
P chủ yếu được sử dụng cho các loại marker đồng trội
3.1.3 Số allele trung bình trên locus
Số allele trung bình trên locus cung cấp thông tin về mức độ đa dạng của quần thể. Nó
được tính bằng công thức đơn giản sau:
K
n
n
K
1i
i
Trong đó,
n = số allele trung bình trên locus
K = tổng số locus
ni = tổng số allele phát hiện thấy ở locus thứ i
Số allele trung bình trên locus được sử dụng với các marker đồng trội vì marker trội
không cho phép phát hiện tất cả các allele.
64
3.2. Dựa vào tần số biến dị
3.2.1 Số lượng allele hiệu quả (Ae)
Số lượng allele hiệu quả cho biết số allele có thể có mặt ở một locus trong quần thể và
được tính theo công thức sau
2
ip
1
h1
1 Ae
Trong đó,
pi = tần số của allele thứ i ở một locus
h = 1 – Σpi2
(mức dị hợp tử (heterozygosity) tại một locus)
Số lượng allele hiệu quả có thể được sử dụng với các marker đồng trội
Giá trị của nó bị ảnh hưởng bởi kích thước mẫu thử, do vậy nó có ý nghĩa trong chọn lựa
cách lấy mẫu. Ví dụ, chúng ta tính Ae trong một mẫu, sau đó ta tính Ae của một mẫu thứ 2
hoặc toàn bộ mẫu. Nếu số liệu lần thứ 2 nhỏ hơn lần thứ nhất thì có lẽ chúng ta phải lấy lại
mẫu.
Ví dụ tính số lượng allele hiệu quả Ae
Locus (A, B, C) Quần thể 1 Quần thể 2
Cá thể 1 A1 A1 B1 B1 C1 C1 A1 A1 B1 B3 C1 C1
Cá thể 2 A1 A2 B1 B2 C2 C2 A1 A1 B2 B3 C1 C1
Cá thể 3 A1 A1 B1 B1 C1 C3 A2 A2 B1 B4 C1 C1
Cá thể 4 A1 A3 B1 B3 C2 C3 A2 A2 B1 B1 C1 C1
Cá thể 5 A3 A3 B3 B3 C3 C3 A1 A2 B4 B4 C1 C1
Số allele 3 3 3 2 4 1
Tần số allele 1 0.60 0.60 0.30 0.50 0.40 0.10
Tần số allele 2 0.10 0.10 0.30 0.50 0.10 0.00
Tần số allele 3 0.30 0.30 0.40 - 0.20 0.00
Tần số allele 4 - - - - 0.30 -
Mức dị hợp tử (h) 0.54 0.54 0.66 0.50 0.70 0.00
Số allele hiệu quả (Ae) 2.17 2.17 2.94 2.00 3.33 1.00
3.2.2 Mức dị hợp tử kỳ vọng trung bình (H = mức đa dạng di truyền Nei (D)
Mức đa dạng di truyền Nei là xác suất để 2 allele bất kỳ tại một locus được lấy ngẫu nhiên
trong quần thể là khác nhau.
Có 3 cách tính :
22
j qp1 h (khi một locus chỉ có 2 allele)
65
2
ij p1 h (khi một locus thứ j có i allele)
L
h
H
L
j
j (khi tính trung bình cho tất cả các locus
Trong đó,
hj = mức dị hợp tử (heterozygosity) trên locus
p và q = các tần số allele
H = mức dị hợp tử (heterozygosity) trung bình trên nhiều locus
L = tổng số locus
H là một ước lượng mức độ biến dị di truyền trong quần thể, được tính bằng cách lấy 1 trừ
tần số đồng hợp tử tại 1 locus. Quá trình được lặp lại cho tất cả các locus và được lấy trung
bình.
H có thể được áp dụng cho cả 2 loại marker (trội và đồng trội).
H có giá trị từ 0 đến 1
H đạt giá trị tối đa khi tất cả các allele có tần số bằng nhau.
Để đảm bảo ý nghĩa thống kê, nên phân tích khoảng 30 locus / 20 cá thể /quần thể.
3.3. Ví dụ tính đa dạng di truyền trong quần thể dùng 1 marker đồng trội
3.4. Ví dụ
Nửa trên của hình là một sơ đồ gel với 30 cá thể được phân tích với môt marker đồng
trội (ví dụ RFLP hoặc SSR). Marker này phát hiện 5 locus là A, B, C, D và E. Trong số các
66
locus này, chỉ có 3 locus là đa hình (A, B và E). Để đơn giản, chúng ta giả sử chỉ có tối đa 2
allele / locus.
Nửa dưới của hình là kết quả ghi điểm các băng cho mỗi cá thể và mỗi locus. Chú ý là các
băng thuộc locus C và D cũng được ghi điểm mặc dù điều này không cần thiết vì chúng
không tạo ra sự đa dạng.
Ví dụ cá thể 1 và 2 sẽ có số liệu sau:
Cá thể 1: 1101101001
Cá thể 2: 0101101011
3.4.1 Các bước tính (bảng dưới)
1. Đầu tiên, chúng ta để ý thấy rằng các locus A, B và E là đa hình vì chúng có tần số allele
nhỏ hơn 0.99. Trái lại, locus C và D là đơn hình (monomorphic) vì chúng có các tần số
allele = 1. Chú ý các chữ viết tắt: exp. = expected value; obs. = observed value.
2. Tỷ lệ các locus đa hình (P) = 3/5 = 0.6 hay 60%.
3. Để tính mức dị hợp tử trung bình quan sát (Ho ), chúng ta:
Đếm số locus dị hợp tử. Ví dụ: cá thể 1 có có 1 locus dị hợp tử (A), cá thể 2 có 1 locus
dị hợp tử (E), cá thể 27 có 2 locus dị hợp tử (A và E),….Tổng số, chúng ta có 16 cá
thể đơn hình (tức là chỉ có 1 băng ở tất cả 5 locus), 13 cá thể có 1 locus dị hợp tử và 1
cá thể có 2 locus dị hợp tử.
Tính mức dị hợp tử trung bình quan sát (Ho = observated heterozygosity): Ho =
[16(0/5) + 13(1/5) + 1(2/5)]/(30) = 0.1
4. Mức đa dạng gen trong nội bộ quần thể (hj) được tính cho mỗi locus theo công thức ở
hàng trên của bảng (như vậy, có thể gọi hj là mức đa dạng gen trong nội bộ locus) . Kết
quả, hj của của locus A = 0.23, của locus B = 0.41 và của locus E = 0.46.
5. Mức đa dạng gen trung bình (Hi) (i = intrapopulation = nội bộ quần thể) được tính theo
công thức là: Hi = (0.23 + 0.41 + 0.46)/5 = 0.22
Bang. Tính một số chỉ số đa dạng quần thể từ ví dụ trên
Locus Số liệu phân tích Tần số allele hj = 1 – p2 –q
2 Hi
A
Kiểu gen A1A1 A1A2 A2A2 Tổng
p q
0.22
Tần số gen (exp.) p2 2pq q2 1
Số cá thể 2 4 24 30
Tần số gen (obs.) P11 = 0.07 P12 = 0.13 P22 = 0.80 1 0.13 0.87 0.23
B
Kiểu gen B1B1 B1B2 B2B2 Tổng
p q Tần số gen (exp.) p2 2pq q2 1
Số cá thể 7 3 20 30
Tần số gen (obs.) P11 = 0.23 P12 = 0.10 P22 = 0.67 1 0.28 0.72 0.41
E
Kiểu gen E1E1 E1E2 E2E2 Tổng
p q Tần số gen (exp.) p2 2pq q2 1
Số cá thể 15 8 7 30
Tần số gen (obs.) P11 = 0.50 P12 = 0.27 P22 = 0.23 1 0.63 0.37 0.46
67
3.5. Ví dụ tính đa dạng di truyền trong quần thể dùng 1 marker trội
3.5.1 Ví dụ
Nửa trên của hình là một sơ đồ gel với 30 cá thể được phân tích với môt marker trội (ví
dụ AFLP hoặc ISSR). Marker này phát hiện 5 locus là A, B, C, D và E. Trong số các locus
này, chỉ có 3 locus là đa hình (A, B và E). Tương tự như ở ví dụ marker đồng trội, để đơn
giản, chúng ta giả sử chỉ có tối đa 2 allele / locus.
Nửa dưới của hình là kết quả ghi điểm các băng cho mỗi cá thể và mỗi locus. Chú ý, vì là
marker trội nên các băng sẽ được ghi điểm là 1 nếu có mặt hoặc 0 nếu không có mặt. Các
băng ở locus C và D (locus đơn hình) có thể không cần ghi điểm hoặc nếu có ghi thì chúng
nhận giá trị 1 cho tất cả các cá thể.
Ví dụ cá thể 1 và 2 sẽ có số liệu sau:
Cá thể 1: 100 (hoặc 10110)
Cá thể 2: 001 (hoặc 00111)
3.5.2 Các bước tính (bảng dưới)
1. Đầu tiên, chúng ta thấy rằng các locus A, B và E là đa hình vì chúng có tần số allele nhỏ
hơn 0.99. Trái lại, locus C và D là đơn hình (monomorphic) vì chúng có các tần số allele =
1. Chú ý các chữ viết tắt: exp. = expected value; obs. = observed value.
2. Tỷ lệ các locus đa hình (P) = 3/5 = 0.6 hay 60%. Mức dị hợp tử trung bình quan sát (Ho)
thể tính được vì các marker trội không phân biệt được giữa các cá thể đồng hợp tử và dị
hợp tử.
3. Tính mức đa dạng gen trong nội bộ locus (hj). Dựa vào công thức trên bảng, chúng ta có
thể tính được hj. Kết quả quả, hj của của locus A = 0.19, của locus B = 0.30 và của locus
E = 0.50.
4. Mức đa dạng gen trung bình (Hi) (i = intrapopulation = nội bộ quần thể) được tính theo
công thức là: Hi = (0.19 + 0.30 + 0.50)/5 = 0.198
68
Bang. Tính một số chỉ số đa dạng quần thể từ ví dụ trên
Locus Số liệu phân tích Tần số allele hj = 1 – p2 –q
2 Hi
A
Kiểu gen AA Aa aa Tổng
p q
0.198
Tần số gen (exp.) p2 2pq q2 1
Số cá thể 6 24 30
Tần số gen (obs.) P1 = 0.20 P2 = 0.80 1 0.11 0.89 0.19
B
Kiểu gen BB Bb bb Tổng
p q Tần số gen (exp.) p2 2pq q2 1
Số cá thể 10 20 30
Tần số gen (obs.) P1 = 0.33 P2 = 0.67 1 0.18 0.82 0.30
E
Kiểu gen EE Ee ee Tổng
p q Tần số gen (exp.) p2 2pq q2 1
Số cá thể 23 7 30
Tần số gen (obs.) P1 = 0.77 P2 = 0.23 1 0.52 0.48 0.50
4. Lượng hóa mối quan hệ di truyền: khoảng cách di truyền (nghĩa rộng)
Khoảng cách di truyền (D) giữa 2 mẫu mô tả tỷ lệ của các yếu tố di truyền (allele, gene,
giao tử, kiểu gen) khác nhau giữa chúng
D = 1 khi và chỉ khi 2 mẫu hoàn toàn không có các yếu tố di truyền giống nhau. Đương
nhiên các yếu tố này là các yếu tố phân tích.
Do quần thể thường tiến hóa theo mô hình không cân bằng, có nghĩa khoảng cách di
truyền sẽ thay đổi theo thời gian nên chúng ta cần phân biệt 2 loại khoảng cách là khoảng
cách hình học (geometric distance) và khoảng cách di truyền (genetic distance).
Khoảng cách hình học
Khoảng cách hình học được sử dụng trong các nghiên cứu đa dạng dựa trên các số liệu
hình thái hoặc các số liệu marker phân tử được thu thập từ các đơn vị phân loại hoạt động
(OUTs, operative taxonomic units). Các OTUs có thể là cá thể hay quần thể. Khoảng cách
hình học có thể được sử dụng với các marker trội hay đồng trội. Vì khoảng cách hình học
được tính chỉ dựa trên tần số allele nên không thể đánh giá được tiến trình tiến hóa theo thời
gian. Kết quả phân tích tạo ra 1 cây phả hệ dưới dạng 1 dendrogram (chỉ cho biết mối quan
hệ giữa các OTU chứ không cho biết tiến trình tiến hóa của các OTU; khoảng cách từ node
ngoài cùng của các OTU tới rễ là bằng nhau). (Trong các phân tích đa dạng dùng marker
phân tử dựa trên băng điện di, khi xây dựng các cây phả hệ dựa trên các chỉ số như Dice và
dùng phân tích UPGMA, thực ra người ta dùng khoảng cách hình học chứ không phải khoảng
cách di truyền)
Khoảng cách di truyền
Hình . Mô hình tiến hóa không cân
bằng. Khoảng cách di truyền sẽ thay
đổi theo thời gian do giao lưu gen/kiểu
gen và trôi dạt di truyền
69
Trái với khoảng cách hình học, khoảng cách di truyền sử dụng tần số allele như đối với
khoảng cách hình học. Tuy nhiên nó cũng yêu cầu một mô hình tiến hóa để phân tích. Từ
khoảng cách di truyền, người ta có thể xây dựng được 1 cây cây phả hệ dưới dạng 1
phylogram (cho biết mối quan hệ giữa các OTU, thông tin về quá trình tiến hóa của các
OUT; khoảng cách giữa 2 OTU bằng tổng khoảng cách các đoạn liên kết giữa chúng).
Khoảng cách di truyền có thể được sử dụng với cả marker trội và đồng trội. Trong trường hợp
sử dụng marker trội, khoảng cách di truyền yêu cầu phân tích 2 thế hệ của cùng quần thể
nhằm đánh giá sự phân ly tại các locus.
4.1. Đánh giá các mối quan hệ dựa theo khoảng cách hình học
Trong phân tích mối quan hệ dựa trên các số liệu marker phân tử, người ta thường sử dụng
khoảng cách hình học (D, distance) mặc dù vẫn thường được gọi là khoảng cách di truyền.
Khoảng cách hình học có thể được đo trực tiếp từ hệ số tương đồng S (similarity index)
theo công thức D = 1 – S.
4.1.1 Các phương pháp phổ biến tính hệ số tương đồng S (similarity) dựa trên biến nhị
thức (0, 1)
Có nhiều cách tính hệ số tương đồng S nhưng dưới đây chỉ trình bày 3 cách phổ biến dùng
cho các số liệu dưới dạng biến nhị thức (0,1). Trong nghiên cứu đa dạng dựa trên điện di gel,
băng xuất hiện nhận giá trị 1 còn băng không xuất hiện nhận giá trị 0. Ba cách tính hệ số
tương đồng dưới đây khác nhau về tính số lượng băng đơn hình và băng đa hình.
Giả sử so sánh hai cá thể thứ i và j. Gọi
Số băng giống nhau của 2 cá thể là a
Số băng chỉ xuất hiện ở cá thể i là b
Số băng chỉ xuất hiện ở cá thể j là c
Số băng không xuất hiện ở cả 2 cá thể (nhưng xuất hiện ở các cá thể khác) là d
Cá thể thứ j
1 0
Cá thể thứ i 1 a b a + b
0 c d c + d
Hệ số Nei & Li (1979) hay còn gọi là hệ số Dice (1945)
Công thức tính là:
cb 2a
2aS
Hệ số Nei & Li tính tất cả các băng có mặt ở 2 cá thể và tính điểm gấp đôi các băng chung
(2a). Vì nó cho rằng các băng thiếu không có ý nghĩa sinh học nên có thể xem hệ số này có ý
nghĩa tương tự so sánh chuỗi DNA.
Hệ số Nei & Li đươc áp dụng cho các marker đồng trội như RFLP và SSR
Hệ số Jaccard (1908):
70
Công thức tính là:
cb a
aS
Hệ số Jaccard không tính các băng thiếu, chỉ tính các băng có mặt đối với cả 2 cá thể. Các
băng thiếu ở cả 2 cá thể được xem là số liệu bị mất.
Hệ số Jaccard có thể được áp dụng với các marker đồng trội.
Hệ số Sokal and Michener (1958) hay còn gọi là hệ số phù hợp đơn giản SMC (simple
matching coefficient)
Công thức tính là
dcb a
daS
Hệ số SMC tính cả băng không có mặt vì cho rằng băng thiếu tương ứng với các allele
đồng hợp tử lặn.
Hệ số SMC có thể được sử dụng với các marker trội như RAPD và AFLP
5. Phần mềm
http://bioinformatics.psb.ugent.be/downloads/psb/Userman/treecon_userman.html
71
Chương 5. Phân tích đa dạng, phân loại dựa trên trình tự DNA
1. Các thuật ngữ/khái niệm
Một số thuật ngữ tiếng Anh sử dụng trong phân tích chuỗi DNA/protein
Homology (cùng nguồn). Đây là 1 thuật cho biết các chuỗi DNA/protein có cùng nguồn
gốc hay không. Đây là một thuật ngữ chất lượng, có nghĩa 2 chuỗi chỉ có thể cùng nguồn gốc
(homologous) hay khác nguồn gốc.
Để cho biết mức độ giống nhau về trình tự giữa các chuỗi, người ta dùng thuật ngữ:
Similarity (tương đồng) cho các trình tự amino acid. Ví dụ khi so sánh 2 chuỗi protein,
người ta có thể có số liệu như ― 2 chuỗi vỏ protein có mức tương đồng 80%‖
Identity (đồng nhất, mặc dù nhiều tài liệu tiếng Việt vẫn dùng là tương đồng) cho các
chuỗi nucleotide. Ví dụ khi so sánh 2 gen, người ta có thể có số liệu ― 2 gen mã hóa vỏ protein
có mức đồng nhất 80 %‖
2. Giải trình tự chuỗi DNA (sequencing)
2.1. Giới thiệu
Giải trình tự gen hiện nay là kỹ thuật rất phổ biến trong nghiên cứu sinh học. Đây là kỹ
thuật được xem là chính xác nhất trong xác định tác nhân gây bệnh cũng như là công cụ tuyệt
vời trong đánh giá mối quan hệ của tác nhân gây bệnh.
Nguyên lý của kỹ thuật sequencing đã được trình bày trong các tài liệu CNSH đại cương
nên không được trình bày chi tiết ở đây.
Tóm tắt, sequencing có thể được thực hiện dựa trên 2 kỹ thuật là
Maxam & Gilbert: sequencing bằng phân hủy hóa học (phổ biến cuối những năm 70,
đầu những năm 80)
Sanger: sequencing bằng enzyme dùng dideoxynucleotides. Kỹ thuật bắt đầu đươc sử
dụng vào 1977 và hiện nay là kỹ thuật phổ biến nhất. Ban đầu, phản ứng sequencing được
thực hiện trên 4 tube riêng biệt. Hiện nay, phản ứng được thực hiện trong một tube dùng hỗn
hợp dNTPs + ddNTP gán nhãn huỳnh quang. Kit phản ứng phổ biến nhất hiện nay là
BigDye® Terminator v3.1 Cycle Sequencing Kit (Applied Biosystems)
2.2. Sequencing dùng BigDye Terminator
Khuôn DNA: plasmid chứa DNA (tốt nhất) hoặc sản phẩm PCR. Chất lượng DNA phải
rất cao nên thường được tinh chiết dùng các kit thương mại
Chạy phản ứng: phản ứng được thực hiện bằng máy PCR (với các chu trình phản ứng
gần tương tự một phản ứng PCR thông thường). Hỗn hợp phản ứng gồm
Đệm phản ứng
Hỗn hợp BigDye (dNTPs + ddNTPs gán nhãn huỳnh quang + DNA polymerase
chịu nhiệt)
Khuôn DNA
Mồi sequencing
72
Đọc phản ứng. Phản ứng sequencing được phân tích (điện di polyacrylamide hoặc mao
dẫn, phát hiện phát xạ mầu, số liệu hóa) bằng máy sequencer tự động. Thường bước này được
thực hiện tại một trung tâm để tiết kiệm.
Biên tập trình tự. Trình tự các chuỗi sẽ được các trung tâm dịch vụ sequencing gửi cho
người nghiên cứu dưới dạng các file thô. Chất lượng trình tự sẽ được kiểm tra bằng phần mềm
thích hợp. Thông thường, một phản ứng chỉ tạo ra khoảng 0.6 kb có chất lượng tốt (các đỉnh
đồ thị trình tự mạnh, rõ ràng, không bị nhiễu).
Hình Một đoạn khoảng 50 nts gen S9 của rice grassy stunt virus (RRSV gây bệnh lùn
xoắn lá tại VN) từ 1 file thô được hiển thị bằng phần mềm BioEdit
3. Tìm kiếm chuỗi có quan hệ gần trên ngân hàng gen
3.1. Ngân hàng gen (Genbank) và NCBI
Genbank là một cơ sở dữ liệu chứa tất cả các chuỗi nucleotide công cộng trên toàn thế
giới. Cho tới 2008, đã có hơn 80 triệu chuỗi gen, đại diện cho hơn 260000 loài sinh vật có tên
trên GenBank. Các chuỗi gen của loài mới được gửi lên GenBank với tốc độ khoảng 1700
loài /tháng.
Genbank là được thành lập, duy trì và quản lý tại Trung tâm Thông tin CNSH Quốc gia
Mỹ (NCBI, National Center for Biotechnology Information).
Thông tin về các chuỗi DNA/protein, nhiều phần mềm CNSH cũng như nhiều bài báo
khoa học có thể truy cập từ website của NCBI (http://www.ncbi.nlm.nih.gov/)
Website của NCBI là một trong các địa chỉ bắt buộc cho các nhà nghiên cứu đang thực
hiện các phân tích chuỗi DNA/RNA/protein.
3.2. Tìm kiếm chuỗi DNA trên GenBank bằng phần mềm BLAST
BLAST là một phần mềm trực tuyến tại NCBI cho phép tìm kiếm các chuỗi DNA/protein
từ cơ sở dữ liệu GenBank. Sau khi đã giải trình tự một chuỗi DNA, chúng ta muốn biết chuỗi
này giống với chuỗi nào trên cơ sở dữ liệu. Cách tìm kiếm như sau:
Mở trang web BLAST tại địa chỉ:
http://blast.ncbi.nlm.nih.gov/Blast.cgi?CMD=Web&PAGE_TYPE=BlastHome
Trên trang web sẽ có các tùy chọn tìm kiếm
Tùy chọn Mục đích
nucleotide blast Tìm cơ sở dữ liệu nucleotide khi dùng chuỗi nucleotide làm
chuỗi hỏi (query)
protein blast Tìm cơ sở dữ liệu protein khi dùng chuỗi protein làm chuỗi hỏi
(query)
Blastx Tìm cơ sở dữ liệu protein khi dùng chuỗi protein được dịch mã
làm chuỗi hỏi (query)
73
Tblastn Tìm cơ sở dữ liệu protein được dịch mã khi dùng chuỗi protein
làm chuỗi hỏi (query)
Tblastx Tìm cơ sở dữ liệu protein được dịch mã khi dùng chuỗi protein
được dịch mã làm chuỗi hỏi (query)
Đối với chuỗi DNA, đầu tiên, chúng ta thường dùng tùy chọn ―nucleotide blast‖
Kích hoạt tùy chọn ―nucleotide blast‖ để mở trang tìm kiếm của tùy chọn này.
Tại cửa sổ ―Enter query sequence = nhập chuỗi hỏi‖; copy và dán chuỗi DNA với format
FASTA (bắt buộc). Format FASTA là một format chuỗi có dấu > ở đầu. Ví dụ
>S9-RRSV-Cần Thơ (967nts)
TTTACAGCTCCTGCTACAGGTACG……………………………ATGTACTCATCTGTGCATATAT
Tại cửa sổ ―choose search set = chọn bộ dữ liệu‖, chọn ―other‖ để tìm kiếm toàn bộ cơ sở
dữ liệu chuỗi nucleotide trên GenBank
Tại cửa sổ ―program selection = chọn chương trình‖, chọn ―highly similar sequences‖ nếu
muốn tìm các chuỗi có mức tương đồng cao, hoặc chọn ―somewhat similar sequences‖ nếu
muốn tìm cả các chuỗi có mức tương đồng thấp.
Cuối cùng, bấm nút ―BLAST‖ để tìm chuỗi.
Kết quả.
Sau vài chục giây (thời gian chờ có thể thay đổi tùy thời điểm và tốc độ đường truyền),
một trang kết quả tìm kiếm sẽ hiển thị. Kết quả tìm kiếm gồm 3 phần chính:
―Graphic summary‖: tóm tắt kết quả tìm kiếm dưới dạng đồ họa. Các chuỗi CSDL tương
đồng nhất với chuỗi hỏi được sắp xếp ở trên cùng. Theo chỉ thị màu từ đen tới đỏ, mức tương
đồng càng cao (biểu diễn bằng điểm Score).
―Descriptions‖: gồm ―accession‖ = mã Genbank, ― description‖ = mô tả danh tính chuỗi,
―max score‖ và ―total score‖ = các điểm tìm kiếm blast (càng cao càng tương đồng), ―query
coverage‖ = phần trăm chiều dài đoạn chuỗi hỏi được tính điểm, ―E value‖ = giá trị kỳ vọng,
là một phép tính thống kê cho biết số các chuỗi trong cơ sở dữ liệu có điểm blast bằng hoặc
cao hơn S xuất hiện ngẫu nhiên trong cơ sở dữ liệu. Giá trị E càng thấp thì điểm S càng có ý
nghĩa.
―Alignment‖: mô tả việc căn trình tự (alignment) theo từng cặp của chuỗi hỏi và các chuỗi
tìm kiếm trên CSDL.
4. So sánh trình tự
Để so sánh mức độ đa dạng của các chuỗi DNA/protein, đầu tiên, người ta phải thực hiện
phép căn trình tự đa chuỗi (multiple sequence alignment). Có nhiều phần mềm tin sinh thực
hiện phép căn trình tự đa chuỗi, trong đó phần mềm tốt nhất hiện nay là Clustal. Phiên bản
mới nhất của phần mềm này là ClustalW. ClustalW có thể được sử dụng như một phần mềm
riêng biệt là ClustalX (sử dụng giao diện window) hoặc được tích hợp trong một số gói phần
mềm phân tích trình tự như BioEdit, MEGA…. Các phần mềm trên có thể tải miễn phí từ các
địa chỉ sau:
. Clustal: http://www.clustal.org/download/current/
BioEdit: http://www.mbio.ncsu.edu/BioEdit/BioEdit.html
MEGA: http://www.megasoftware.net/index.html
Ví dụ so sánh trình tự
74
Giả sử chúng ta có 5 chuỗi DNA đều mã hóa 16S RNA ribosome của 4 vi khuẩn:
Chuỗi 1 (Xo-16S-AP008229): Xanthomonas oryzae gây bệnh bạc lá lúa.
Chuỗi 2 (Xo-16S-X95921): Xanthomonas oryzae gây bệnh bạc lá lúa.
Chuỗi 3 (Xc-16S-AE00892): Xanthomonas citri gây bệnh loét cây có múi
Chuỗi 4: (Rs-16S-CU914168): Ralstonia solanacearum gây bệnh héo xanh nhiều cây
Chuỗi 5: (Dt-16S-AJ864721): Deinococcus geothermalis là vi khuẩn chịu nhiệt
>Xo-16S-AP008229
TTTTAAGTGAAGAGTTTGATCCTGGCTCAGAGTGAACGCTGGCGGCAGGCCTAACACATGCAAGTCGAACGGCAGCACAGTAAGAGCTTGCTCTTATGGGTGGCGAGTGGCGGACGGGTGAGGAATACATC
GGAATCTACTCTTTCGTGGGGGATAACGTAGGGAAACTTACGCTAATACCGCATACGACCTACGGG
TGAAAGCGGAGGACCTTCGGGCTTCGCGCGATTGAATGAGCCGATGTCGGATTAGCTAGTTGGCGG
GGTAAAGGCCCACCAAGGCGACGATCCGTAGCTGGTCTGAGAGGATGATCAGCCACACTGGAACT
GAGACACGGTCCAGACTCCTACGGGAGGCAGCAGTGGGGAATATTGGACAATGGGCGCAAGCCTG
ATCCAGCCATGCCGCGTGGGTGAAGAAGGCCTTCGGGTTGTAAAGCCCTTTTGTTGGGAAAGAAAA
GCAGTCGGTTAATACCCGATTGTTCTGACGGTACCCAAAGAATAAGCACCGGCTAACTTCGTGCCA
GCAGCCGCGGTAATACGAAGGGTGCAAGCGTTACTCGGAATTACTGGGCGTAAAGCGTGCGTAGG
TGGTGGTTTAAGTCTGTTGTGAAAGCCCTGGGCTCAACCTGGGAATTGCAGTGGATACTGGGTCAC
TAGAGTGTGGTAGAGGGTAGCGGAATTCCCGGTGTAGCAGTGAAATGCGTAGAGATCGGGAGGAA
CATCAGTGGCGAAGGCGGCTACCTGGACCAACACTGACACTGAGGCACGAAAGCGTGGGGAGCAAACAGGATTAGATACCCTGGTAGTCCACGCCCTAAACGATGCGAACTGGATGTTGGGTGCAATTTGG
CACGCAGTATCGAAGCTAACGCGTTAAGTTCGCCGCCTGGGGAGTACGGTCGCAAGACTGAAACTC
AAAGGAATTGACGGGGGCCCGCACAAGCGGTGGAGTATGTGGTTTAATTCGATGCAACGCGAAGA
ACCTTACCTGGTCTTGACATCCACGGAACTTTCCAGAGATGGATTGGTGCCTTCGGGAACCGTGAG
ACAGGTGCTGCATGGCTGTCGTCAGCTCGTGTCGTGAGATGTTGGGTTAAGTCCCGCAACGAGCGC
AACCCTTGTCCTTAGTTGCCAGCACGTAATGGTGGGAACTCTAAGGAGACCGCCGGTGACAAACCG
GAGGAAGGTGGGGATGACGTCAAGTCATCATGGCCCTTACGACCAGGGCTACACACGTACTACAA
TGGTAGGGACAGAGGGCTGCAAACCCGCGAGGGCAAGCCAATCCCAGAAACCCTATCTCAGTCCG
GATTGGAGTCTGCAACTCGACTCCATGAAGTCGGAATCGCTAGTAATCGCAGATCAGCATTGCTGC
GGTGAATACGTTCCCGGGCCTTGTACACACCGCCCGTCACACCATGGGAGTTTGTTGCACCAGAAG
CAGGTAGCTTAACCTTCGGGAGGGCGCTTGCCACGGTGTGGCCGATGACTGGGGTGAAGTCGTAAC
AAGGTAGCCGTATCGGAAGGTGCGGCTGGATCACCTCCTTT
>Xo-16S-X95921
AGTGAACGCTGGCGGCAGGCCTAACACATGCAAGTCGAACGGCAGCACAGTAAGAGCTTGCT
CTTATGGGTGGCGAGTGGCGGACGGGTGAGGAATACATCGGAATCTACTCTTTCGTGGGGGATAAC
GTAGGGAAACTTACGCTAATACCGCATACGACCTACGGGTGAAAGCGGAGGACCTTCGGGCTTCG
CGCGATTGAATGAGCCGATGTCGGATTAGCTAGTTGGCGGGGTAAAGGCCCACCAAGGCGACGAT
CCGTAGCTGGTCTGAGAGGATGATCAGCCACACTGGAACTGAGACACGGTCCAGACTCCTACGGG
AGGCAGCAGTGGGGAATATTGGACAATGGGCGCAAGCCTGATCCAGCCATGCCGCGTGGGTGAAGAAGGCCTTCGGGTTGTAAAGCCCTTTTGTTGGGAAAGAAAAGCAGTCGGTTAATACCCGATTGTTC
TGACGGTACCCAAAGAATAAGCACCGGCTAACTTCGTGCCAGCAGCCGCGGTAATACGAAGGGTG
CAAGCGTTACTCGGAATTACTGGGCGTAAAGCGTGCGTAGGTGGTGGTTTAAGTCTGTTGTGAAAG
CCCTGGGCTCAACCTGGGAATTGCAGTGGATACTGGGTCACTAGAGTGTGGTAGAGGGTAGCGGA
ATTCCCGGTGTAGCAGTGAAATGCGTAGAGATCGGGAGGAACATCAGTGGCGAAGGCGGCTACCT
GGACCAACACTGACACTGAGGCACGAAAGCGTGGGGAGCAAACAGGATTAGATACCCTGGTAGTC
CACGCCCTAAACGATGCGAACTGGATGTTGGGTGCAATTTGGCACGCAGTATCGAAGCTAACGCGT
TAAGTTCGCCGCCTGGGGAGTACGGTCGCAAGACTGAAACTCAAAGGAATTGACGGGGGCCCGCA
CAAGCGGTGGAGTATGTGGTTTAATTCGATGCAACGCGAAGAACCTTACCTGGTCTTGACATCCAC
GGAACTTTCCAGAGATGGATTGGTGCCTTCGGGAACCGTGAGACAGGTGCTGCATGGCTGTCGTCA
GCTCGTGTCGTGAGATGTTGGGTTAAGTCCCGCAACGAGCGCAACCCTTGTCCTTAGTTGCCAGCACGTAATGGTGGGAACTCTAAGGAGACCGCCGGTGACAAACCGGAGGAAGGTGGGGATGACGTCAA
GTCATCATGGCCCTTACGACCAGGGCTACACACGTACTACAATGGTAGGGACAGAGGGCTGCAAA
CCCGCGAGGGCAAGCCAATCCCAGAAACCCTATCTCAGTCCGGATTGGAGTCTGCAACTCGACTCC
ATGAAGTCGGAATCGCTAGTAATCGCAGATCAGCATTGCTGCGGTGAATACGTTCCCGGGCCTTGT
ACACACCGCCCGTCACACCATGGGAGTTTGTTGCACCAGAAGCAGGTAGCTTAACCTTCGGGAGGG
CGCTTGCCACGGTGTGGCCGATGACTGGGGTGAAGTCGTAACAAGGTAGCCGTATCGGAAGGTGC
75
>Xc-16S-AE00892
AAAGGAGGTGATCCAGCCGCACCTTCCGATACGGCTACCTTGTTACGACTTCACCCCAGTCATCGGCCACACCGTGGCAAGCGCCCTCCCGAAGGTTAAGCTACCTGCTTCTGGTGCAACAAACTCCCAT
GGTGTGACGGGCGGTGTGTACAAGGCCCGGGAACGTATTCACCGCAGCAATGCTGATCTGCGATTA
CTAGCGATTCCGACTTCATGGAGTCGAGTTGCAGACTCCAATCCGGACTGAGATAGGGTTTCTGGG
ATTGGCTTGCCCTCGCGGGTTTGCAGCCCTCTGTCCCTACCATTGTAGTACGTGTGTAGCCCTGGTC
GTAAGGGCCATGATGACTTGACGTCATCCCCACCTTCCTCCGGTTTGTCACCGGCGGTCTCCTTAGA
GTTCCCACCATTACGTGCTGGCAACTAAGGACAAGGGTTGCGCTCGTTGCGGGACTTAACCCAACA
TCTCACGACACGAGCTGACGACAGCCATGCAGCACCTGTCTCACGGTTCCCGAAGGCACCAATCCA
TCTCTGGAAAGTTCCGTGGATGTCAAGACCAGGTAAGGTTCTTCGCGTTGCATCGAATTAAACCAC
ATACTCCACCGCTTGTGCGGGCCCCCGTCAATTCCTTTGAGTTTCAGTCTTGCGACCGTACTCCCCA
GGCGGCGAACTTAACGCGTTAGCTTCGATACTGCGTGCCAAATTGCACCCAACATCCAGTTCGCAT
CGTTTAGGGCGTGGACTACCAGGGTATCTAATCCTGTTTGCTCCCCACGCTTTCGTGCCTCAGTGTC
AGTGTTGGTCCAGGTAGCCGCCTTCGCCACGGATGTTCCTCCCGATCTCTACGCATTTCACTGCTACACCGGGAATTCCGCTACCCTCTACCACACTCTAGTGACCCAGTATCCACTGCAATTCCCAGGTTGA
GCCCAGGGCTTTCACAACAGACTTAAACCACCACCTACGCACGCTTTACGCCCAGTAATTCCGAGT
AACGCTTGCACCCTTCGTATTACCGCGGCTGCTGGCACGAAGTTAGCCGGTGCTTATTCTTTGGGTA
CCGTCAGAACAATCGGGTATTAACCGACTGCTTTTCTTTCCCAACAAAAGGGCTTTACAACCCGAA
GGCCTTCTTCACCCACGCGGCATGGCTGGATCAGGCTTGCGCCCATTGTCCAATATTCCCCACTGCT
GCCTCCCGTAGGAGTCTGGACCGTGTCTCAGTTCCAGTGTGGCTGATCATCCTCTCAGACCAGCTAC
GGATCGTCGCCTTGGTGGGCCTTTACCCCGCCAACTAGCTAATCCGACATCGGCTCATTCAACCGC
GCGAAGCCCGAAGGTCCTCCGCTTTCACCCGTAGGTCGTATGCGGTATTAGCGTAAGTTTCCCTAC
GTTATCCCCCACGAAAGAGTAGATTCCGATGTATTCCTCACCCGTCCGCCACTCGCCACCCATAAG
AGCAAGCTCTTACTGTGCTGCCGTTCGACTTGCATGTGTTAGGCCTGCCGCCAGCGTTCACTCTGAG
CCAGGATCAAACTCTTCACTTA
>Rs-16S-CU914168
AAGGAGGTGATCCAGCCGCACCTTCCGATACGGCTACCTTGTTACGACTTCACCCCAGTCATGA
ACCCTGCCGTGGTAATCGCCCCCCTTGCGGTTAGGCTAACTACTTCTGGCAAAACCCACTCCCATGG
TGTGACGGGCGGTGTGTACAAGACCCGGGAACGTATTCACCGCGGCATGCTGATCCGCGATTACTA
GCGATTCCAGCTTCACGTAGTCGAGTTGCAGACTACGATCCGGACTACGATGCATTTTCTGGGATT
AGCTCCACCTCGCGGCTTGGCAACCCTCTGTATGCACCATTGTATGACGTGTGAAGCCCTACCCATAAGGGCCATGAGGACTTGACGTCATCCCCACCTTCCTCCGGTTTGTCACCGGCAGTCTCTCTAGAGTG
CCCTTTCGTAGCAACTAGAGACAAGGGTTGCGCTCGTTGCGGGACTTAACCCAACATCTCACGACA
CGAGCTGACGACAGCCATGCAGCACCTGTGTCCACTTTCTCTTTCGAGCACCTAATGCATCTCTGCT
TCGTTAGTGGCATGTCAAGGGTAGGTAAGGTTTTTCGCGTTGCATCGAATTAATCCACATCATCCAC
CGCTTGTGCGGGTCCCCGTCAATTCCTTTGAGTTTTAATCTTGCGACCGTACTCCCCAGGCGGTCAA
CTTCACGCGTTAGCTACGTTACTAAGGAAATGAATCCCCAACAACTAGTTGACATCGTTTAGGGCG
TGGACTACCAGGGTATCTAATCCTGTTTGCTCCCCACGCTTTCGTGCATGAGCGTCAGTGTTATCCC
AGGAGGCTGCCTTCGCCATCGGTATTCCTCCACATCTCTACGCATTTCACTGCTACACGTGGAATTC
TACCTCCCTCTGACACACTCTAGCTGTGCAGTCACCAATGCAATTCCCAGGTTAAGCCCGGGGATTT
CACATCGGTCTTGCACAACCGCCTGCGCACGCTTTACGCCCAGTAATTCCGATTAACGCTTGGACCC
TACGTATTACCGCGGCTGCTGGCACGTAGTTAGCCGGTCCTTATTCTTCCGGTACCGTCATCCACTCCAGGTATTAACCGAAGCGATTTCTTTCCGGACAAAAGTGCTTTACAACCCGAAGGCCTTCTTCACA
CACGCGGCATTGCTGGATCAGGGTTGCCCCCATTGTCCAAAATTCCCCACTGCTGCCTCCCGTAGG
AGTCTGGGCCGTGTCTCAGTCCCAGTGTGGCTGATCGTCCTCTCAGACCAGCTACTGATCGTCGCCT
TGGTGGGCCTTTACCCCACCAACTAGCTAATCAGACATCGGCCGCTCCTATAGCATGAGGCCTTGC
GGTCCCCCACTTTCACCCTCAGGTCGTATGCGGTATTAGCTAGTCTTTCGACTAGTTATCCCCCACT
ACAGGGCACGTTCCGATGTATTACTCACCCGTTCGCCACTCGCCGGCAGGTAGCAAGCTACCCCCG
CTGCCGTTCGACTTGCATGTGTAAGGCATGCCGCCAGCGTTCAATCTGAGCCAGGATCAAACTCTT
CAGTT
>Dt-16S-AJ864721
GGTGAACGCTGGCGGCGTGCTTAAGACATGCAAGTCGAACGATCGTCTTCGGACGGTAGTGGC
GCACGGGTGAGTAACGCGTAACTGACCTGCCCCCAAGACCGAACTAACTCCCCGAAAGGGGAGCT
AATGTGGGATGTGCTGTCCGGCTGTGGCCGGACAGTAAAGGCTGAGGCCGCTTGGGGATGGGGTT
GCGTTCCATCAGCTAGATGGTGGGGTAAAGGCCTACCATGGCGACGACGGATAACCGGCCTGAGA
76
GGGTGGCCGGTCACAGGGGCACTGAGACACGGGCCCCACTCCTACGGGAGGCAGCAGTTAGGAAT
CTTCCCCAATGGGCGCAAGCCTGAGGGAGCGACGCCGCGTGAGGGATGAAGGTCCTCGGATTGTA
AACCTCTGAACGAGTGACGAAAGGCCCCGGATGGGGAGATGACGGTARCTCGGTAATAGCACCGG
CTAACTCCGTGCCAGCAGCCGCGGTAATACGGAGGGTGCAAGCGTTACCCGGAATCACTGGGCGT
AAAGGGCGTGTAGGCGGGAAGCTAAGTCCGACTTTAAAGACCGGGGCTCAACCCCGGGAGTGGGT
TGGAGACTGGCTTTCTGGACCTCTGGAGAGGCAACTGGAATTCCTGGTGTAGCGGTGGAATGCGTA
GATACCAGGAGGAACACCAATGGCGAAGGCAGGTTGCTGGACAGAAGGTGACGCTGAGGCGCGAAAGTGTGGGGAGCGAACCGGATTAGATACCCGGGTAGTCCACACCCTAAACGATGCACGTTGGCC
GAGCGCGGGATGCCGTGCTGGGCGAAGCCAACGCGAGAAACGTGCCGCCTGGGAAGTACGGCCGC
AAGGTTGAAACTCAAAGGAATTGACGGGGGCCCGCACAAGCGGTGGAGCATGTGGTTTAATTCGA
AGCAACGCGAAGAACCTTACCAGGTCTTGACATGCACCGAACCCTGCTGAAAGGTGGGGGTGCCC
TTCGGGGAGCGGTGACACAGGTGCTGCATGGCTGTCGTCAGCTCGTGTCGTGAGATGTTGGGTTAA
GTCCCGCAACGAGCGCAACCCTTGCCCTTCGTTGCCAGCAGTTCGGCTGGGGACTCGAGGGGGACT
GCCGGTGAAAGCCGGAGGAAGGCGGGGATGACGTCTAGTCAGCATGGTCCTTACGACCTGGGCGA
CACACGTGCTACAATGACCAGAACAACGCGCTGCGAACTCGCGAGAGTGAGCCAATCGCTGAAAA
CTGGTCCCAGTTCAGATCGGAGTCTGCAACTCGACTCCGTGAAGGYGGAATCGCTAGTAATCGCGG
GTCAGCATACCGCGGTGAATACGTTCCCGGGCCTTGTACACACCGCCCGTCACACCATGGGAGTGC
ATGGCAGCTGAAACCACCGGGAGCTTGACGGCAGGTGTCTAGGCTGTGGTGCATGACTGGGGTGA
AGTCGTAACAAGGTAACTGTACCGGAAGG
Tất cả các chuỗi trên đều được cất trong 1 file text (ví dụ NotePad) với đuôi .txt. Mỗi
chuỗi đều phải có tên chuỗi với dấu > ở đầu (format FASTA).
4.1. Căn trình tự đa chuỗi bằng phần mềm ClustalX
Mở phần mềm ClustalX
Chọn chế độ ―Multiple alignment mode‖
Trong tùy chọn ―file‖, chọn ―load sequences‖ để nhập file chứa 5 chuỗi trên.
Tiếp theo, trong tùy chọn ―alignment‖ chọn ―do complete alignment‖ : chương trình sẽ
thực hiện việc căn trình tự 5 chuỗi trên và cất kết quả trong một file có đuôi là .aln.
4.2. Xác định mức đồng nhất (sequence identity) bằng phần mềm Bioedit
Mở phần mềm Bioedit
Nhập file có đuôi .aln chứa các chuỗi đã được căn trình tự bằng phần mềm ClustalX. Chú
ý là phần mềm Bioedit cũng có thể thực hiện việc căn trình tự đa chuỗi như ở phần mềm
ClustalX.
Trong tùy chọn « Alignment », chọn « Sequence Identity Matrix ». Chương trình sẽ yêu
cầu đặt tên file chứa kết quả so sánh mức đồng nhất trình tự. Sau khi đặt tên file, bấm
« save » và chương trình sẽ ngay lập tức thực hiện việc xác định mức đồng nhất trình tự
giữa các cặp chuỗi và trình bày trên một cửa sổ text.
Copy kết quả từ cửa sổ text sang 1 file excel để thuận tiện trong việc biên tập và trình bày.
Dưới đây là kết quả xác định mức đồng nhất trình tự DNA của 5 chuỗi 16S RNA ở trên
Xo-16S-
AP008229
Xo-16S-
X95921
Dt-16S-
AJ864721
Xc-16S-
AE00892
Rs-16S-
CU914168
Xo-16S-AP008229 ID 0.969 0.716 0.371 0.371
Xo-16S-X95921 ID 0.739 0.369 0.368
Dt-16S-AJ864721 ID 0.348 0.346
Xc-16S-AE00892 ID 0.833
Rs-16S-CU914168 ID
ID = identical có nghĩa đồng nhất 100%
77
Từ kết quả trên có thể thấy 2 chuỗi 16S RNA của cùng loài vi khuẩn Xanthomonas oryzae
có mức đồng nhất nucleotide rất cao (0.969). Các chuỗi còn lại chia sẻ mức đồng nhất thấp
hơn nhiều.
Chú ý quan trọng: Mặc dù việc so sánh mức đồng nhất chuỗi rất quan trọng, nhưng các
giá trị đồng nhất chỉ được tính toán từ các sai khác hiện tại (chẳng hạn, 2 chuỗi dài 10 nts
được so sánh với nhau và phát hiện thấy có 3 vị trí sai khác thì 2 chuỗi này có mức đồng nhất
0.7 hay 70%). Chính vì vậy, giá trị đồng nhất chuỗi chỉ được sử dụng trong phân loại tác nhân
gây bệnh. Ví dụ ngưỡng phân biệt loài của chi begomovirus là 89% mức đồng nhất trình tự
DNA của phân tử DNA-A genome.
4.3. Xác định khoảng cách di truyền (genetic distance)
4.3.1 Khái niệm khoảng cách di truyền phân tử
Khoảng cách di truyền phân tử giữa 2 chuỗi là số các sự kiện tiến hóa (thường là số lượng
thay thế nucleotide/vị trí) xuất hiện kể từ khi 2 chuỗi phân tách từ một tổ tiên chung.
Có thể định nghĩa đơn giản như sau: khoảng cách di truyền giữa 2 chuỗi là số thay thế
nucleotide trên vị trí.
Như vậy khoảng cách di truyền phân tử có thể lớn hơn 1
Khoảng cách di truyền là cơ sở cho việc xây dựng cây phả hệ (phylogenetic tree) bằng các
phương pháp khoảng cách.
Tính khoảng cách di truyền khi so sánh các chuỗi DNA (và protein) cực kỳ phức tạp và
phải căn cứ vào nhiều yếu tố, đặc biệt là mô hình thay thế nucleotide (cho phân tích chuỗi
DNA) hoặc ma trận thay thế aa (cho phân tích chuỗi protein).
4.3.2 Mô hình thay thế nucleotide (subtituation model).
Có rất nhiều mô hình thay thế nucleotide đã được đề xuất. Dưới đây là 2 mô hình:
Mô hình Jukes-Cantor
Đây là một mô hình thay thế nucleotide đơn giản. Nó có các giả thiết sau:
Tốc độ thay thế nucleotide là giống nhau cho tất cả 4 loại nucleotide (A, T, G, C) (=
)
Tần số các nucleotide là giống nhau.
Công thức tính khoảng cách di truyền (d) giữa 2 chuỗi DNA là theo mô hình Jukes Cantor
trong trường hợp tốc độ thay thế không thay đổi theo vị trí (rate uniformity among sites) là:
Hình Sơ đồ mô hình thay thế
nucleotide Jukes - Cantor
78
)3
41(log
4
3 d pe
Trong đó, p là tỷ lệ các vị trí có nucleotides khác nhau
Công thức tính khoảng cách di truyền (d) giữa 2 chuỗi DNA theo mô hình Jukes Cantor
trong trường hợp tốc độ thay thế có thay đổi theo vị trí (rate variation among sites) là:
]1)3
41[(
4
3 d /1 apa
Trong đó, p là tỷ lệ các vị trí có nucleotides khác nhau, a là tham số của phân bố sác xuất
gamma
Mô hình Kimura 2 tham số (Kimura – 2 paameter model)
Đây là một mô hình thay thế phức tạp hơn (nhưng hiện thực hơn). Nó có các giả thiết sau:
Tốc độ thay thế nucleotide là không giống nhau cho tất cả 4 loại nucleotide (A, T, G,
C). Tốc độ thay thế đồng hoán vị (transition) giữa các purin (A <=> G) hoặc giữa các
pyrimidin (C <=> T) là giống nhau (= ) nhưng khác tốc độ thay thế dị hoán vị
(transvergen) giữa 1 purin và 1 pyrimidin (A hoặc G <=> C hoặc T) (=β).
Tần số các nucleotide là giống nhau.
Công thức tính khoảng cách di truyền (d) giữa 2 chuỗi DNA theo mô hình Kimura 2 tham
số trong trường hợp tốc độ thay thế không thay đổi theo vị trí (rate uniformity among sites) là:
)w(log4
1)w(log
2
1 d 21 ee
Trong đó, W1 = 1- 2P – Q và W2 = 1-2Q, với P tần số các vị trí có thay thế đồng hoán vị
(transition) và Q là tần số các vị trí có thay thế dị hoán vị (transversion).
Công thức tính khoảng cách di truyền (d) giữa 2 chuỗi DNA theo mô hình Kimura 2 tham
số trong trường hợp tốc độ thay thế có thay đổi theo vị trí (rate variation among sites) là:
Hình Sơ đồ mô hình thay
thế nucleotide Kimura 2
tham số
79
a aa
2
3)W(
2
1)W(
2 d /1
2
/1
1
Trong đó, W1 = 1- 2P – Q và W2 = 1-2Q, với P tần số các vị trí có thay thế đồng hoán vị
(transition) và Q là tần số các vị trí có thay thế dị hoán vị (transversion), a là tham số của
phân bố sác xuất gamma.
4.3.3 Ví dụ tính khoảng cách di truyền dựa trên 5 chuỗi 16S RNA vi khuẩn dùng phần
mềm MEGA
Mở phần mềm MEGA
Dùng tùy chọn ―Convert to MEGA format‖ để chuyển số liệu chuỗi DNA của file Clustal
(có đuôi .aln) thành số liệu mà chương trình MEGA có thể đọc được. Trình tự là:
Trong ―File‖, chọn ―Convert to MEGA format‖
Định vị file Clustal (có đuôi .aln) trong folder lưu trữ
Bấm ―OK‖ và chương trình sẽ chuyển các chuỗi trong file sang format MEGA. Bấm
tiếp OK
Chuyển con trỏ xuống cuối file và xóa hết các ký tự không cần thiết gồm 1 ký tự # và
nhiều ký tự * (là các ký tự được tạo ra từ chương trình Clustal X).
Bấm ―save‖ để cất chuỗi. Chương trình sẽ mặc nhận tên file giống như tên file Clustal
nhưng đuôi đã được chuyển thành .meg.
Quay trở lại cửa sổ chính của chương trình MEGA
Trong ―File‖, chọn ―Open‖ để mở file có đuôi .meg
Trong cửa sổ hỏi ―M4: Input Data‖, chọn ―Nucleotide sequences‖ và bấm ―OK‖
Trong cửa sổ hỏi ―Confirm‖, bấm ―No‖ vì các chuỗi 16S rDNA không mã hóa protein.
Chương trình sẽ mở cửa sổ ―M4: Sequence Data Explorer‖: là cửa sổ trình bày các chuỗi
đã được căn trình tự đa chuỗi từ chương trình ClustalX. Đóng cửa sổ này để quay về cửa sổ
chính của chương trình MEGA. Mặc dù đóng cửa sổ này nhưng file MEGA ở trạng thái kích
hoạt (xem ở cuối màn hình) và sẵn sàng cho các phân tích.
Trong cửa sổ chính của chương trình MEGA, chọn ―Distances‖, chọn tiếp ―Computer
pairwire‖ và một cửa sổ ―M4: Analysis Preferences‖ sẽ hiện thị.
Trong cửa sổ ―M4: Analysis Preferences‖, ở cột ―option‖, chọn ―model‖ => ở cột
―selection‖, bấm vào ô xanh lá mạ tương ứng => trong ―nucleotide‖ chọn ‗Kimura 2-
Parameter‖. Các tùy chọn khác để ở chế độ mặc nhận.
Bấm nút ‖Compute‖ để tính khoảng cách. Chương trình sẽ ngay lập tức tính và hiển thị
kết quả khoảng cách di truyền (d) cho từng cặp chuỗi dưới dạng ma trận. Các kết quả này có
thể copy sang một bảng tính Excel để tiện việc biên tập và trình bày.
Dưới đây là kết quả tính toán khoảng cách di truyền. Kết quả này được kết hợp với kết
quả tính mức đồng nhất chuỗi ở trên.
80
Bảng. So sánh trình tự DNA chuỗi 16S rDNA của 5 loài vi khuẩn
Mức đồng nhất chuỗi DNA
Xo-16S-AP008229
Xo-16S-X95921
Dt-16S-AJ864721
Xc-16S-AE00892
Rs-16S-CU914168
Khoảng cách
di truyền (d):
phần phủ đậm
Xo-16S-AP008229 ID 0.969 0.716 0.371 0.371
Xo-16S-X95921 0.000 ID 0.739 0.369 0.368
Dt-16S-AJ864721 0.285 0.285 ID 0.348 0.346
Xc-16S-AE00892 1.277 1.277 1.335 ID 0.833
Rs-16S-CU914168 1.233 1.233 1.328 0.175 ID
Vài bình luận:
Có thể thấy khoảng cách di truyền của 2 mẫu Xo là bằng 0.
Để có được 2 trình tự hiện tại chuỗi Dt và chuỗi Xc đã phải trải qua trung bình 1.335
thay thế (đột biến) / vị trí kể từ khi chúng tiến hóa từ 1 chuỗi tổ tiên chung.
Khoảng cách di truyền không phải = 1- mức đồng nhất (so sánh với công thức D = 1 –
S ở phân tích băng điện di).
5. Xây dựng cây phả hệ
“Chẳng có gì trong sinh học có ý nghĩa ngoại trừ dưới ánh sáng của tiến hóa” -
Dobzhansky (1973). Nhưng tiến hóa cũng có ít ý nghĩa nếu không xây dựng được mối quan
hệ phả hệ.
Nghiên cứu mối quan hệ tiến hóa giữa các sinh vật, các chuỗi gen....có thuật ngữ tiếng
Anh là Phylogenetics (từ này có gốc rễ từ tiếng Hy Lạp: Phylon = tribe/race, genetikos =
relative to birth)
Khi so sánh các chuỗi gen, cần chú ý là các chuỗi gen này có thể cùng nguồn gốc
(homologous) có nghĩa là tiến hóa từ một tổ tiên chung hoặc khác nguồn gốc (analogous) có
nghĩa là tiến hóa từ các tổ tiên khác nhau. Các chuỗi gen cùng nguồn gốc lại được chia làm 2
loại là:
Orthologs là các chuỗi gen hình thành do sự biệt hóa loài dẫn tới chúng xuất hiện ở các
loài khác nhau nhưng có chức năng giống nhau. Loại chuỗi gen này là thích hợp nhất trong
nghiên cứu tiến hóa.
Paralogs là các chuỗi gen tương tự nhau của cùng loài, hình thành do sự lặp lại gen (gene
duplication).
Có 3 phương pháp để xây dựng mối quan hệ phả hệ (phylogenetic) là: maximum
parsimony, maximum likelihood và distance.
5.1. Maximum parsimony
Đây là phương pháp dựa trên đánh giá sai khác nucleotide tại từng vị trí trên chuỗi chứ
không phải dựa trên khoảng cách di truyền Phương pháp sẽ tìm tất cả các cây có thể và đánh
giá các cây này bằng cách cho điểm mỗi cây dựa vào số thay đổi tiến hóa cần có để giải thích
số liệu hiện tại. Cây tốt nhất là cây có tổng số thay đổi tiến hóa (số thay thế nucleotide) ít nhất
đối với tất cả các chuỗi phân tích hiện tại khi tiến hóa từ một tổ tiên chung.
Triết lý: ―cái tốt nhất là cái đơn giản nhất‖
81
Đây là phương pháp phổ biến trong xây dựng cây phả hệ. Phương pháp đặc biệt tốt khi so
sánh các chuỗi có mức tương đồng cao.
Nhược điểm là: (2) phương pháp thường không cho các cây đúng khi so sánh các chuỗi có
mức đa dạng cao; (1) tốc độ phân tích rất chậm.
Vi dụ: Xét 4 chuỗi (1,2,3,4)
Đầu tiên phải thực hiện căn trình tự đa chuỗi
Xác định các vị trí sai khác có ý nghĩa (informative sites). Đây là các vị trí sẽ cho điểm
khác nhau giữa các cây. Cụ thể, chúng ta chỉ xét các vị trí (cột) có ít nhất 2 nucleotide khác
nhau và mỗi nucleotide này xuất hiện ở ít nhất 2 chuỗi. Ví dụ dưới là cột 5 (GGAA), cột 7
(GGCC) và cột 9 (AGAG).
Bốn chuỗi trên sẽ tạo 3 cây không rễ
Xét các cây ở mỗi vị trí sai khác có ý nghĩa (cột 5, 7, 9, hình dưới đặt lại là cột 1, 2, 3) và
cho điểm (số thay thế). Có thể thấy cây số 1, 2 và 3 sẽ có tổng số thay thế nucleotide lần lượt
là 4, 5, 6. Như vậy cây số 1 giải thích tốt nhất mối quan hệ của 4 chuỗi.
82
5.2. Maximum likelyhood
Là một phương pháp thống kê chính xác nhất.
Yêu cầu một mô hình thay thế rõ ràng (giống như phương pháp khoảng cách)
Giống phương pháp parsimony ở chỗ đánh giá cây cũng dựa trên các vị trí nucleotide.
Đối với mỗi một cây, độ dài cành được kiểm định theo mô hình thay thế và các tham số
lựa chọn.
Xác xuất của một cây là tích tỷ lệ đột biến của mỗi nhánh. Cây đúng nhất là cây có xác
xuất lớn nhất (có khả năng nhất).
Phương pháp yêu cầu mức độ tính toán rất cao dẫn tới là một trong các phương pháp xây
dựng cây chậm nhất.
Phương pháp thường chỉ được áp dụng cho các phân tích có số lượng chuỗi ít (và độ dài
chuỗi ngắn) hoặc có thể được sử dụng để kiểm tra một cây phả hệ được xây dựng bằng các
phương pháp khác.
5.3. Phương pháp khoảng cách (Distance)
Phương pháp khoảng cách là phương pháp xây dựng cây dựa vào khoảng cách di truyền
giữa các cặp chuỗi (xem phần tính khoảng cách di truyền).
Có 2 phương pháp khoảng cách phổ biến là phương pháp liên kết lân cân (NJ, Neighbor –
Joining) và phương pháp ghép cặp chuỗi dùng khoảng cách trung bình số học ngang bằng
(UPGMA, Unwaited Pair Group Method using Arithmetic Averages).
Các phương pháp khoảng cách đều dựa trên nguyên lý tiến hóa tối thiểu (minimum
evolution). Cây tốt nhất là cây tiến hóa tối thiểu có nghĩa nó tổng độ dài cành (khoảng cách di
truyền) nhỏ nhất
5.3.1 Phương pháp UPGMA
Là phương pháp đơn giản nhất trong số các phương pháp xây dựng cây phả hệ dựa trên
khoảng cách.
Phương pháp sẽ tạo ra một cây không rễ.
83
Điểm yếu nhất nhất của phương pháp là thuật toán của phương pháp dựa trên giả thiết là
tốc độ tiến hóa của các chuỗi giống nhau (giả thuyết đồng hồ sinh học) mà điều này thường
không đúng đối với các số liệu sinh học. Do vậy trong phân tích chuỗi DNA hay protein,
chúng ta không nên dùng phương pháp UPGMA.
5.3.2 Phương pháp NJ
Phương pháp NJ là phương pháp phổ biến nhất trong xây dựng cây phả hệ dựa trên các
các chuỗi DNA/protein. Phương pháp có các đặc điểm sau:
Không dựa trên giả thuyết đồng hồ sinh học
Tạo ra một cây không rễ
Khoảng cách di truyền có tính cộng (additivity) có nghĩa khoảng cách giữa bất kỳ 2 nodes
bằng tổng chiều dài các cạnh dẫn tới chúng.
Cây được xây dựng bằng cách tìm một cặp chuỗi lân cận mà chúng giảm thiểu độ dài của
cây.
Các bước có thể được minh họa qua ví dụ sau:
Ví dụ cách xây dựng cây dùng phương pháp NJ
Giả sử chúng ta có 4 chuỗi A, B, C, D với khoảng cách di truyền đã được tính trước. Các
bước để xây dựng cây phả hệ gồm:
Bước 1. Tính khoảng cách
n
ij
ij
in
du
2 cho mỗi chuỗi trong đó n là số chuỗi trong ma
trận khoảng cách
Bước 2. Lấy một cặp chuỗi (lá) i và j sao cho khoảng cách của chúng dij – ui – uj là nhỏ
nhất (nếu chúng bằng nhau thì lấy ngẫu nhiên). Trong ví dụ này, chúng ta chọn cặp AB với
giá trị dAB = -21
Bước 3. Nối các lá A và B với 1 node v1. Tính độ dài các cạnh từ A tới v1 và từ B tới v1
A B C D Bước 1: tính ui
A 0 8 7 12 =(8+7+12)/(4-2) = 13,5
B 8 0 9 14 =(8+9+14)/(4-2)=15,5
C 7 9 0 11 =(7+9+11)/(4-2)=13,5
D 12 14 11 0 =(12+14+11)/(4-2)=18,5
A B C D
A 0 8 7 12
B 8-(13,5+15,5)=-21 0 9 14
C 7-(13,5+13,5)=-20 9-(15,5+13,5)= -20 0 11
D 12-(13,5+18,5)=-20 14-(15,5+18,5)=-20 11-(13,5+18,5)=-21 0
84
32
5,155,13
2
8
2
)(
2
BAAB
A
uudv
52
5,135,15
2
8
2
)(
2
ABAB
B
uudv
Bước 4. Tính khoảng cách từ node v1 tới các lá còn lại (C, D)
92
81412
2
)(
42
897
2
)(
),(
),(
ABBDADDAB
ABBCACCAB
dddd
dddd
Bước 5. Xóa A và B khỏi ma trận khoảng cách và thay chúng bằng cụm AB
Bước 6. Lặp lại bước 1
AB C D Bước 1 (lặp lại) = ui
AB 0 4 9 (4+9)/1=13
C 4 0 11 (4+11)/1=15
D 9 11 0 (9+11)/1=20
Bước 7. Lặp lại bước 2. Trong ví dụ này là lá C (lá D cũng được vì chúng đều có giá trị =
-24)
AB C D
AB 0 4 9
C 4-(13+15)=-24 0 11
D 9-(13+20)=-24 11-(15+20)=-24 0
Bước 8. Lặp lại bước 3. Nối lá C và node v1 với một node mới v2. Tính độ dài các cạnh
từ C tới v2 và từ v1 tới v2.
v1
B 5
3 A
85
3
2
1315
2
4
22
12
1513
2
4
2
)(
21
ABCABCC
CABABC
uudv
uudv
Bước 9. Lặp lại bước 4. Tính khoảng cách từ node v2 tới lá D còn lại
82
4119
2
)(),(
ABCCDABD
DABC
dddd
Bước 10. Lặp lại bước 5. Xóa A, B và C khỏi ma trận khoảng cách và thay chúng bằng
cụm ABC.
Bước 11. Vì chỉ còn 2 node còn lại nên ta chỉ việc nối chúng lại và được một cây NJ
5.4. Ví dụ xây dựng cây phả hệ của chuỗi các chuỗi 16S RNA vi khuẩn dùng phần mềm
MEGA
Mở chương trình MEGA
Trong cửa sổ ―open data‖, mở file chứa 5 chuỗi đã được căn trình tự đa chuỗi và đã được
chuyển sang định dạng của chương trình MEGA (file có đuôi .meg)
ABC D
ABC 0 8
D 8 0
v1
B 5
3 A
v2
C
1
3
D 8
v1
B 5
3 A
v2
C
1
3
86
Trong tùy chọn ―phylogeny‖, chọn ―Contruct phylogeny‖ và chọn tiếp ―Neighbor-Joining
(NJ)‖ và một cửa sổ ―M4: Analysis Preferences‖ sẽ hiện thị.
Trong cửa sổ ―M4: Analysis Preferences‖:
Ở cột ―option‖, chọn ―model‖ => ở cột ―selection‖, bấm vào ô xanh lá mạ tương ứng =>
trong ―nucleotide‖ chọn ‗Kimura 2-Parameter‖.
Ở cột ―option‖, chọn ―Test of phylogeny and option‖, bấm vào ô xanh lá mạ tương ứng
=> chọn ―Boostrap‖ với ―replications‖ được chỉnh lên 1000. Chọn các tùy chọn này, chương
trình sẽ tính giá trị boostrap với số lần lặp lại =1000.
Các tùy chọn khác để ở chế độ mặc nhận.
Bấm nút ‖Compute‖ để xây dựng cây phả hệ. Chương trình sẽ ngay lập tức tính và hiển
thị 1 cây phả hệ. Chương trình có rất nhiều tùy chọn để trình bày cây.
Dưới đây là một dạng cây từ kết quả trên.
Hình. Cây phả hệ đối với các chuỗi 16S RNA của 4 loài vi khuẩn. Cây được xây dựng từ
các chuỗi được căn trình tự đa chuỗi bằng phầm mềm Clustal. Khoảng cách di truyền được
tính dựa trên mô hình thay thế Kimura 2 tham số. Cây được xây dựng bằng phương pháp
khoảng cách Neighbor-Joining. Thanh bar trình bày khoảng cách di truyền (số thay thế
nucleotide / vị trí). Các số in đậm là giá trị boostraps tính theo % (1000 lần lặp) và chỉ hiển thị
các giá trị có boostrap >50%.
Xo-16S-AP008229
Xo-16S-X95921
Dt-16S-AJ864721
Xc-16S-AE00892
Rs-16S-CU914168
99
100
0.0000
0.0000
0.1809
0.1030
0.0716
0.1046
0.4925
0.5704
0.1
87
Chương 6. Công nghệ microarray (chip gen)
1. Giới thiệu
Tới nay, một số lượng khổng lồ các gen của nhiều đối tương sinh vật đã được giải trình tự
và chúng ta đang ở thời kỳ hậu genome. Microarray, với khả năng đánh giá đồng thời hàng
chục ngàn gen chỉ trên một lam kính, đang trở thành một công cụ quan trọng trong nghiên cứu
sinh học.
Công nghệ microarray đã được phát triển đầu tiên bởi Schena et al. (1995) nhằm kiểm tra
sự biểu hiện đồng thời của nhiều gen (45 gen) trên cây Arabidopsis.
Nguyên lý của công nghệ microarray khá đơn giản: dựa vào lai hóa DNA:DNA ở mật độ
cao. Microarray DNA (còn gọi là chip gen, chip DNA…) bao gồm một số lượng lớn các phân
tử DNA (gọi là dò) được phân bố thành hàng trên một diện tích rất nhỏ của một giá đỡ
(thường là lam kính). Các chuỗi cần phát hiện như mRNA, virus (gọi là mục tiêu) được gán
nhãn với chất phát huỳnh quang. Sau khi được lai hóa với dò, các chuỗi mục tiêu được phát
hiện và lượng hóa nhờ huỳnh quang được phát xạ bởi tia laser (hình).
Viruses: PVYN, PVS-O,
PVS-A, PVA, PVX
PVY + PVX
cDNA được
gán nhãn Cy3
Cy3 Scan microarray
Cy3 được kích hoạt
bằng tia laser (532 nm)
Tạo dò:
RT-PCR bằng mồi
chung và mồi đặc hiệu Gán nhãn cDNA (mục tiêu)
- Tạo cDNA dùng hỗn hợp
dCTP và Cy3-dCTP
Hybridization
Fluorescence emission
Số liệu:
Cường độ huỳnh
quang Dò
Tạo microarray
- In dò dung robot - Cố định dò bằng UV
- Khóa các vị trí còn lại
- Biến tính dò ở 95OC
Lam kính được
phủ với poly-
lysine
Microarray
Một đốm của microarray
Hình. Sơ đồ chẩn đoán các virus hại khoai tây dùng công nghệ microarray.
Các bước chính được in đậm và gạch chân (Boonham et al., 2003)
88
2. Các loại microarray DNA
Dựa trên độ dài và nguồn gốc dò, người ta chia microarray làm 3 loại:
2.1. Microarray với các dò oligonucleotide ngắn
Loại microarray này sử dụng các dò oligonucleotide ngắn với kích thước khoảng 20
nucleotide. Các dò này thường được tạo ra bằng công nghệ in quang (photolithography). Ví
dụ ―chip gen‖ của công ty Affymetrix chứa trung bình 20 đoạn ngẫu nhiên có chiều dài 25
nucleotide của mỗi gen nghiên cứu.
2.2. Microarrays với dò oligonucleotide dài
. Các dò điển hình có kích thước 40 – 80 nucleotide và thường được sử dụng với
microarray có mật độ dò thấp (chỉ chứa vài trăm dò khác nhau). Microarray loại này dùng kỹ
thuật in phun (spotting) để cố định dò do giá tổng hợp dò khá cao và công ty Afimetrix đang
giữ bản quyền công nghệ cố định dò oligonucleotide ngắn. Ví dụ dò loại này là một
microarray do Wang et al. (2002) thiết kế gồm 1600 dò oligonucleotide, mỗi dò có kích thước
khoảng 70 nucleotide dùng để phát hiện nhiều loại virus trên người.
2.3. Microarrays với dò cDNA
Các dò có kích thước 50-5000 bp (http://www.gene-chips.com/) được tao ra từ các sản
phẩm clon, PCR. Microarray loại này thường dùng kỹ thuật in phun để cố định dò trên giá đỡ.
3. Các phương pháp cố định dò trong microarray DNA
Có 2 phương pháp chế tạo microarray chính
3.1. Tổng hợp trực tiếp ngay trên giá đỡ (in situ)
Phương pháp này chỉ áp dụng để tổng hợp các dò oligonucleotide ngắn và tạo ra các chip
microarray có mật độ dò cao. Phương pháp này kết hợp 2 kỹ thuật là in quang
(photolithography) và tổng hợp DNA trên pha rắn. Các bước, theo Lipshutz et al.(1999) như
sau:
Cố định linker có nhóm bảo vệ ở một đầu vào bề mặt của một giá đỡ (thường là lam kính).
Nhóm bảo vệ có thể bị loại bỏ bằng một phản ứng quang hóa.
Chu trình tổng hợp đầu tiên gồm 2 bước: (1) Loại bỏ nhóm bảo vệ và hoạt hóa các vị trí
chọn lọc bằng ánh sáng. (2) Ủ các deoxynucleotide có nhóm hydroxyl được bảo vệ. Hậu
quả liên kết hóa học giữa linker được loại bỏ nhóm bảo vệ và dNTPs được bảo vệ sẽ xuất
hiện tại các vị trí chọn lọc.
Chu trình sẽ lặp lại để liên kết các dNTPs cũ bị loại bỏ nhóm bảo vệ với các dNTP mới
(được bảo vệ) cho tới khi đạt được kích thước của oligonucleotide. Ví dụ để tạo một chip
với các oligonucleotide có kích thước N thì cần 4xN chu trình.
Phương pháp này có thể tổng hợp khoảng 300000 đốm dò oligonucleotide trên một diện
tích 1.28x1.28 cm. Các chip mới nhất có thể có 450000 đốm dò để phân tích hơn 20000 gen.
Tuy nhiên phương pháp này rất phức tạp về mặt kỹ thuật và do công ty Affimetrix giữ bản
quyền. Do vậy phương pháp này nhìn chung không phổ biến trong các cơ sở nghiên cứu đại
học.
3.2. Tạo microarray bằng spotting
Để tự chế tạo các microarray, người ta có thể sử dụng các thiết bị tự động gọi là arrayer
(tự chế tạo hoặc có bán tại một số hãng như OmniGrid hay TeleChem. Các thiết bị này sử
89
dụng các tube mao dẫn + thiết bị in phun hoặc các kim rắn để cố định (in, chấm) dung dịch dò
lên bề mặt giá đỡ (thường là lam kính) đã được phủ chất gắn kết trước. Phần lớn các thiết bị
tạo chip dùng các kim thép nhọn cõ rãnh để chuyển dịch dò. Ví dụ, Cheung et al (1999) đã sử
dụng một arayer (AECOM arrayer) để tạo chip. AECOM arrayer là một thiết bị điều khiển tự
động bằng máy tính, có 12 kim bằng thép (đường kính 1.6 mm thót nhọn ở đầu với đường
kính khoảng 100µm diameter). Mỗi kim có thể hút 250-500 nl dung dịch dò DNA và cố định
0.25-1 nl /chấm với đường kính 100-150 µm.
Ba loại dung dịch thường dùng để pha dò DNA là 50%DMSO, 3xSSC, hoặc đệm
phosphate. Tuy nhiên DMSO thường được ưa thích hơn vì (1) nó không bị khô trong quá
trình chế tạo chip, thường phải mất nhiều giờ và (2) tạo các chấm dò khá đồng nhất.
4. Gán nhãn dò
Đối với một thử nghiệm microarray điển hình, chuỗi mục tiêu, thường là dạng cDNA, sẽ
được gán nhãn huỳnh quang trước khi lai. Nhiều loại nhãn huỳnh quang đã được được thử
nghiệm nhưng 2 nhãn phổ biến nhất trong công nghệ microarray là Cy3 và Cy5. Đây là 2 chất
cyanin có khả năng hòa tan trong nước. Cặp thuốc nhuộm này được ưa thích hơn các loại
thuốc nhuộm huỳnh quang khác vì (theo Amesharm‘s microarray handbook):
Chúng có tính ổn định quang hóa cao hơn
Chúng sáng hơn, do vậy tạo dấu hiệu huỳnh quang mạnh hơn.
Ít bị ảnh hưởng bởi các yếu tố như pH và sự có mặt của DMSO
Có thể chịu nhiệt độ cao.
Có khả năng tách phổ tốt có nghĩa mỗi thuốc nhuộm phát huỳnh quang ở các bước song
khác nhau (điển hình 532nm đối với Cy3 và 633nm đối với Cy5). Nhờ vậy, sự phát huỳnh
của chúng có thể được phát hiện đồng thời. Đây là đặc tính quan trọng cho phép các thử
nghiệm gán nhãn kép trong nghiên cứu biểu hiện gen.
Có 3 phương pháp gán nhãn DNA mục tiêu
4.1. Gán nhãn trực tiếp
Trong phương pháp này, cDNA được gán nhãn trực tiếp bằng cách bổ sung một lượng
nucleotide liên kết nhãn huỳnh quang (ví dụ Cy3-dCTP, Cy3-dUTP) vào thành phần tổng
hợp cDNA. Hạn chế của kỹ thuật này là nửa thuốc nhuộm của phức hợp nucleotide – thuốc
nhuộm huỳnh quang khá cồng kềnh dẫn tới hiệu quả tổng hợp cDNA kém hơn so với dùng
dNTPs tự nhiên.
4.2. Gán nhãn gián tiếp
Ở phương pháp này, nhãn được gán sau khi tổng hợp cDNA. Trong quá trình tổng hợp
cDNA, người ta bổ sung và hỗn hợp phản ứng một dẫn xuất amin hoạt hóa của dUTP gọi là 5,
(3-aminoallyl)-2‘-deoxyuridine 5‘-triphosphate (cũng được gọi là amino-allyl dUTP). Kết quả
là cDNA hình thành chứa amino-allyl UTPs và tiếp theo được liên kết với Cy3 hoặc C5 dyes
(Manduchi et al., 2002).
Mặc dù hiệu quả gán nhãn của phương pháp gián tiếp cao hơn phương pháp trực tiếp thì
cả 2 phương pháp đều có một nhược điểm là số phân tử thuốc nhuộm được tổng hợp vào
cDNA phụ thuộc trình tự của cDNA; do vậy không thể lượng hóa được số cDNA liên kết vào
dò nếu chỉ dựa vào cường độ phát huỳnh quang (Manduchi et al., 2002).
90
4.3. Gãn nhãn dùng dendrimer
Stears et al., (2000) đã phát triển một kỹ thuật gán nhãn huỳnh quang mới gọi kỹ thuật
gán nhãn dendrimer. Điểm khác của kỹ thuật dendrimer so với 2 kỹ thuật kể trên là: (1)
cDNA được tổng hoàn dùng dNTPs tự nhiên, (2) mồi oligodT dùng để tổng hợp cDNA chứa
một chuỗi ―bẫy‖ ở đầu 5‘ tương đồng với chuỗi dendrimer, và (3) việc phát hiện cDNA liên
kết vào array được thực hiện qua một bước lai bổ sung giữa chuỗi ―bẫy‖ và các phân tử
dendrimer gán nhãn huỳnh quang.
Kỹ thuật dendrimer có nhiều ưu điểm: (1) nhậy hơn vì yêu cầu ít vật liệu RNA khởi đầu
hơn (16 lần) để tổng hợp cDNA, (2) cho phép lượng hóa số lượng cDNA liên kết vào array,
và (3) tạo ―phông‖ thấp hơn cũng như tỷ số dấu hiệu ổn định /‖phông‖ cao hơn.
Tuy nhiên, nhược điểm của kỹ thuật dendrimer là phức tạp và tốn thời gian để tổng hợp
dendrimer – một cấu trúc phân nhánh của olygonucleotide.
5. Vật liệu để cố định dò
Vật liệu ưa thích và phổ biến nhất để tạo microarray là lam kính do nó có nhiều ưu điểm
hơn so với nilon hay các vật liệu khác (Cheung et al., 1999):
Không bị biến dạng nên dễ cố định dò tự động => cho phép tạo các microarray mật độ dò
cao.
Bền, chịu được nhiệt độ cao và nồng độ ion cao (ở các bướ rửa)
Là vật liệu không chứa lỗ (khác với các vật liệu màng dùng trong các kỹ thuật lai phân tử)
nên giảm thể tích dung dich lai và tăng hiệu quả lai.
6. Các phương pháp gắn dò vào lam kính
Trước khi cố định dò vào lam kính, bề mặt lam kính cần phải được phủ một lớp vật liệu
đặc biệt.
Vật liệu phổ biến và kinh tế nhất là poly-L-lysine. Chất này sẽ liên kết phi hóa trị vào bề
mặt lam kính qua các gốc amine của lysine. Các gốc amin cũng cung cấp các nhóm tích điện
dương để tạo các liên kết tĩnh điện với các nhóm chứa phosphate (tích điện âm) của DNA.
Ngoài ra, các gốc amine cũng tạo liên kết hydro với DNA. Một trong các ưu điểm của poly-L-
lysine là nó tao bề mặt ghét nước dẫn tới quá trình cố định (in) dò dễ dàng hơn. Tuy nhiên,
nhược điểm của poly-L-lysin là không bền sau nhiều tháng bảo quản.
Vật liệu phổ biến thứ hai là amine-silane. Chất này liên kết hóa trị vào bề mặt thủy tinh,
và tương tự như polylysine, nó cung cấp nhóm amine tích điện dương ở pH trung tínhcho
phép hình thành các liên kết ion với các nhóm phosphate tích điện âm của DNA. Quá trình cố
định được hỗ trợ bằng xử lý UV hay nhiệt nhằm tạo ra các liên kết hóa trị giữa nhóm amin
của silane và gốc thymine (T) của DNA.
Loại vật liệu thứ ba là aldehyde-silane. Vật liệu này liên kết đồng hóa trị vào bề mặt lam
kính. Phân tử amin bậc một (linker) NH2 của DNA tấn công nhóm aldehyde của silane để
hình thành liên kết đồng hóa trị. Quá trình liên kết được ổn định nhờ phản ứng khử nước (làm
khô ở điều kiện ẩm độ thấp) dẫn tới hình thành Schiff base (-CHN-).
Hiệu quả cố định DNA lên lam được tăng cường nhờ sử dụng hỗn hợp 2 silane 2 silane
(N,N-diethyl-3-amino-propyl) trymethoxysilane (một amine-silane bậc 3) và (3-glycidyl-
oxypropyl) trimethoxysilane (một epoxy-silane) (Chiu et al., 2003). Dùng 2 silane này ở tỷ lệ
1/1 thấy (1) 1% của mỗi silane trong hỗn hợp tạo kết quả cố định tối đa, (2) có ảnh hưởng
cộng hợp của 2 silanes lên quá trình cố định và lai hóa về sau, (3) microarray có thể tái sử
dụng ít nhất 3 lần mà không làm giảm đáng kể hiệu quả lai hóa, (4) không cần xử lý (cross-
91
linking) bằng UV mà chỉ cần ủ ở 42oC / 25 giờ, (5) hiệu quả cố định DNA tốt hơn so với dùng
poly-L-lysine, 3D polymer và chỉ amine-silane, và (6) tạo tỷ lệ dấu hiệu/ nhiễu cao nhất.
7. Ứng dụng microarray DNA
Công nghệ microarray có thể được áp dụng vào 2 lĩnh vực chính:
7.1. Nghiên cứu biểu hiện gen “gene expression profiling”
Nguyên lý đằng sau ―gene expression profiling‖ là ở chỗ một gen thường chỉ phiên mã
(transcribed) đúng nơi (loại tế bào) và đúng lúc mà chức năng của nó yêu cầu. Về mặt kỹ
thuật, mức độ biểu hiện của hàng chục ngàn gen tương ứng với một trạng thái sinh lý của một
sinh vật có thể được phát hiện và lượng hóa chỉ với một lần thử microarray.
Do vậy ―gene expression profiling‖ trong bệnh cây có thể được sử dụng để:
a) Phân tích sự tương tác giữa tác nhân gây bệnh và ký chủ qua thử microarray cả tác nhân
gây bệnh và ký chủ.
b) Phân tích phản ứng phòng thủ cây. Ví dụ, dùng microarray, Schenk et al., (2000) đã
phát hiện thấy thay đổi mức độ phiên mã của 2375 ETS của cây Arabidopsis sau khi được
lây nhiễm với loại nấm không tương hợp là Alternaria brassicicola hoặc sau khi được xử
lý với Salicylic acid (SA), methyl jasmonate (MJ) hay ethylene (các chất cảm ứng tính
kháng tập nhiễm hệ thống SAR). Trong số này, 705 gen có mức độ biểu hiện >= 2.5 lần so
với đối chứng (106 gen chưa hề được mô tả trước đó).
c) Chẩn đoán. Vì một ―gene expression profile‖ phản ánh một trạng thái bệnh lý của cây bị
bệnh do tác nhân sinh vật hoặc môi trường nên ngườ ta có thể dùng hồ sơ biểu hiện gen
để chẩn đoán cả bệnh truyền nhiễm và bệnh không truyền nhiễm.
8. Chẩn đoán và nghiên cứu kiểu gen (genome typing)
Do bản chất đa mục tiêu của microarray kết hợp với một số lượng lớn các tác nhân gây
bệnh đã được giải trình tự toàn bộ hoặc từng phần nên microarray đang trở thành một công cụ
chẩn đoán bệnh tuyệt vời.
Áp dụng ấn tượng nhất trong lĩnh vực chẩn đoán là công trình của Wang et al. (2002) với
đối tượng là các virus gây bệnh trên người. Bộ gen của một họ virus hại người được chia
thành các đoạn dài 70 nucleotides gối lên nhau khoảng 25 nucleotides. Sau khi so sánh chuỗi,
các đoạn đặc hiệu cho họ và chi đã được lựa chọn. Bằng cách này, các tác giả đã thiết kế một
microarray chứa 1600 chuỗi oligonucleotides dài 70 nucleotides được lấy từ khoảng 140 bộ
gen virus riêng biệt bao gồm cả các virus DNA sợi đơn, sợi kép lẫn các virus RNA cực (+),
cực (-). Các virus được phát hiện và xác định entero-, rhino-, adeno-, orthomyxo-, nido-,
retro-, hepadna- and papillomaviruses..
Tương tự, microarrays cũng đã được dùng để phát hiện các virus gây bệnh cây. Một số ví
dụ là microarrays để phát hiện và xác định các virus khoai tây (Boonham et al., 2003) như
potexvirus (PVX) và 3 potyviruses (PVY, PVS, PVA) kể cả 2 chủng PVS (PVS-O, PVS-A)
và 3 chủng PVY (PVYO, PVY
N, PVY
NTN). Các dò này được tạo ra bằng PCR có kích thước
700 - 1200 nucleotides. Kết quả lai hóa với cDNA virus được gán nhãn Cy3 cho thấy
microarray này có thể phát hiện và xác định các virus ở mức loài và chủng (nếu mức tương
đồng đoạn lai hóa nhỏ hơn 80%.
Ví dụ 2 là microarray cũng để phát hiện đồng thời nhiều virus khoai tây là Potato virus A
(PVA), Potato virus S (PVS), Potato virus X (PVX), Potato virus Y (PVY), Potato mop top
virus (PMTV) và Potato leaf roll virus (PLRV). Tuy nhiên, một điểm khác là cả chuỗi dò và
chuỗi đích của một virus đều được tạo ra bằng cùng bộ mồi. Điều này tạo điều kiện để phát
92
hiện PLRV và PMTV vì chúng không có chuỗi poly A ở đaauf 3‘ của bộ gen (Bystricka et al.,
2003)
Tương tự, Lee et al., (2003) đã phát triển một microarray để phát hiện và phân biệt 4
tobamoviruses nhiễm trên cây bầu bí là Cucumber green mottle mosaic virus (CGMMV),
Cucumber fruit mottle mosaic virus (CFMMV), Kyuri green mottle mosaic virus (KGMMV)
and Zucchini green mottle mosaic virus (ZGMMV).
93
Chương 7. Công nghệ RNA interference
1. Lịch sử phát hiện
1.1. Hiện tượng đồng ức chế
Hiện tượng RNAi đã được quan sát thấy đầu tiên trên thực vật vào năm 1990 bởi Napoli
et al. trên cây hoa dã yên thảo (Petunia hybrid, họ cà). Để tăng cường độ đậm của hoa (vốn có
màu tím), các tác giả đã chuyển thêm gen chalcone synthase (chsA), một gen chịu trách nhiệm
tạo sắc tố anthocianine của hoa. Kết quả, thay vì nhận được hoa có màu đậm hơn, các tác giả
chỉ thu được các cây có màu sắc hoa nhạt hơn, từ nhạt từng phần tới hoàn toàn trắng. Các tác
giả đã không thể xác định được nguyên nhân mặc dù phát hiện thấy hàm lượng mRNA của cả
gen chsA được chuyển lẫn gen chsA nội tại đều giảm và gọi hiện tượng này là đồng ức chế
(co-suppression).
1.2. Hiện tượng chế ngự (quelling)
. Ngay sau đó, một hiện tượng ức chế tương tự cũng được quan sát thấy trên nấm
Neurospora crassa (Romano và Macino, 1992). Các tác giả đã chuyển gen albino-3 (al-3) và
albino-1 (al-1) chịu trách nhiệm tổng hợp carotenoid vào nấm N. crassa và đã quan sát thấy
tới 36 % cá thể chuyển gen biểu hiện màu sắc tản nấm là màu trắng (kiểu hình hoang dại có là
màu vàng sáng). Như vậy ở các cá thể màu trắng này, gen al đã không được biểu hiện. Các
tác giả gọi hiện tượng này là chế ngự (quelling).
1.3. Hiện tượng câm gen cảm ứng bởi virus
Trong cùng thời gian, các nhà virus học thực vật đã áp dụng kỹ thuật gọi là tính kháng từ
tác nhân gây bệnh (PDR, pathogen derived resistance) để tạo giống chuyển gen kháng bệnh
virus. Lúc đầu, họ cho rằng tính kháng là do protein virus được biểu hiện trong cây gây ra,
nhưng về sau họ quan sát thấy nếu cây được chuyển các đoạn genvirus ngắn lấy ở vùng không
mã hóa cũng tạo ra tính kháng hay chịu bệnh virus. Các nhà virus học phát hiện thấy RNA
hình thành từ gen chuyển (gen virus) có thể ức chế gen virus xâm nhiễm. Hiện tượng này
được gọi là ―sự câm gen cảm ứng bởi virus‖ (virus-induced gene silencing, VIGS) (Covey và
CS, 1997).
1.4. RNA Interferrence
Năm 1998, Craig Mello và Andrew Fire (và 4 tác giả khác) đã công bố trên tạp chí
Nature một công trình nghiên cứu nhằm tìm hiểu vai trò của RNA đến sự biểu hiện gen. Các
tác giả đã sử dụng một số gen của tuyến trùng Caenorhabditis elegens như unc-22 (mã hóa
protein myofilament có nhiều nhưng không cần thiết), unc-54 (mã hóa protein myosin liên
quan đến co cơ), fem-1(mã hóa protein chứa ankyrin liên quan đến sinh sản), hlh-1 (mã hóa
protein họ myoD cần cho di chuyển và biệt hóa hình dạng), và mex (mã hóa cho 1 protein có
nhiều ở phôi). Ba phát hiện quan trọng từ công trình này là
Các đoạn dsRNA tương ứng với vùng intron hoặc promoter không tạo ra hiện tượng câm
(silencing) của gen tương ứng. Như vây sự can thiệp (interfering) của RNA là ở mức hậu
phiên mã (post-transcriptional level).
Khi tiêm các RNA ở dạng cùng chiều (sense) hay ngược chiều (antisense) vào tuyến trùng
đã không ảnh hưởng tới lượng mRNA của gen tương ứng tức không làm ảnh hưởng tới sự
biểu hiện của gen. Tuy nhiên khi tiêm các RNA ở dạng sợi kép dsRNA (hỗn hợp của
RNA cùng chiều và ngược chiều) đã làm câm (silence) gen tương ứng. Như vậy hiện
tượng câm gen (gene silencing) được thực hiện thông qua trung gian là RNA sợi kép
(dsRNA).
94
Khi tiêm dsRNA vào một vị trí thì hiện tượng câm gen xuất hiện ở các vị trí khác trong cơ
thể tuyến trùng. Như vậy dấu hiệu câm gen có thể di truyển hệ thống.
Hiện tượng câm gen do dsRNA đã được các tác giả đặt tên là RNA interfering (sự can
thiệp của RNA). Vì nghiên cứu này, Craig Mello và Andrew Fire đã được trao giải Nobel y
học năm 2006.
2. Small interfering RNA (siRNA) và microRNA (miRNA)
2.1. miRNAs - khám phá
Năm 1991, Lee và CS đã phát hiện thấy gen lin4 (điều khiển thời điểm lột xác của tuyến
trùng C. elegans) đã không tạo ra protein Lin4 mà hình thành 2 loại phân tử RNA có kích
thước 22 và 61 nts. Phân tử RNA lớn (61 nts) đã gấp lại thành cấu trúc kẹp tóc và là tiền chất
để tạo phân tử RNA nhỏ (22 nts). Phân tử RNA nhỏ 22 nts đã liên kết tại nhiều vị trí trên
vùng 3‘UTR của mRNA của gen lin14 dẫn tới hậu quả là lượng protein lin14 giảm đáng kể
(nhưng lượng mRNA không thay đổi).
Cho tới nay, hàng ngàn phân tử RNA nhỏ có kích thước khoảng 22 nts (21 – 28 nts) đã
được phát hiện thấy ở nhiều sinh vật (thậm chí cả virus) có chức năng điều hòa biểu hiện gen.
Các phân tử này được gọi là các microRNA và miRNA. lin4 là phân tử đầu tiên của nhóm
này. Một cơ sở dữ liệu cho các miRNA đã được phát hiện là:
http://www.sanger.ac.uk/Software/Rfam/mirna/index.shtml).
2.2. miRNAs - định nghĩa
miRNAs là các phân tử RNA sợi đơn nhỏ, kích thước khoảng 22 nts, có chức năng điều
hòa biểu hiện gen, và được hình thành từ một phân tử RNA tiền chất (precursor miRNA).
Phân tử RNA tiền chất có kích thước lớn khoảng 70 nts, có cấu trúc kẹp tóc và được phiên mã
từ vùng không mã hóa của gen.
2.3. miRNAs – nguồn gốc
Ngoại trừ một phần nhỏ gen miRNA (chẳng hạn khoảng ¼ số lượng miRNA của bộ gen
người) nằm ở vùng intron của gen mục tiêu thì phần lớn các gen miRNA nằm ở các vị trí cách
xa gen mục tiêu. Chúng có thể biệt lập hoặc phân bố thành cụm và được phiên mã thành các
đơn vị phiên mã riêng biệt. Như vậy miRNA có nguồn gốc khác với gen mục tiêu.
2.4. miRNAs – sinh tổng hợp
Quá trình tạo ra các phân tử miRNA có thể được tóm tắt qua các bước sau:
Hình thành phân tử phiên mã sơ cấp pri-miRNA (primary transcripts). Đầu tiên, gen mã
hóa miRNA được phiên mã nhờ RNA endonuclepolymerase II (pol II) ở trong nhân thành
các phân tử phiên mã (transcript) có kích thước từ vài trăm tới hàng ngàn nts. Các
transcript này được gọi là các phân tử phiên mã sơ cấp pri-miRNA (primary transcripts)
chứa môt mũ (cap) đầu 5‘ và một chuỗi poly-A đầu 3‘. Pri-miRNA của thực vật thường
dài hơn và phức tạp hơn (chứa nhiều cấu trúc thân – thòng lọng hơn).
Hình thành các phân tử tiền chất pre-miRNA (precusor miRNA). Tiếp theo, các phân tử
pri-miRNA được cắt bởi một RNA endonuclease nhóm III là Dicer (ở động vật là Drosa)
thành các phân tử RNA có kích thước khoảng 70 nts gọi là các phân tử tiền chất pre-
miRNA (precusor miRNA).
Hình thành miRNA thành thục. Có sự khác nhau về vị trí hình thành các phân tử mi thành
thục giữa động vật và thực vật. Ở thực vật, các phân tử pre-miRNA ở trong nhân sẽ được
95
được Dicer cắt thành các phân tử RNA nhỏ sợi kép có kích thước khoảng 22 nts. Do bị cắt
bởi Dicer, các phân tử này có đầu so le với gốc phosphat ở đầu 5‘ và 2-3 phân tử nts đầu
3‘ (overhang). Tiếp theo, phân tử RNA nhỏ sợi kép này được vận chuyển từ nhân ra tế bào
chất. Tại tế bào chất, chúng được tách bởi helicase thành 2 phân tử sợi đơn: một sợi là
phân tử miRNA thành thục (gọi là sợi hướng dẫn) sẽ tham gia hình thành phức hợp RISC;
còn sợi kia sẽ bị phân hủy. Trái lại, ở động vật, các phân tử pre-miRNA sẽ được vân
chuyển ra ngoài tế bào chất để được xử lý tiếp theo thành các phân tử miRNA thành thục.
2.5. siRNAs - khám phá
siRNA đã được khám phá bởi Hamilton và Baulcombe năm 1999. Các tác giả đã chuyển
gen aco, gus vào cây cà chua và thuốc lá. Trên các cây biểu hiện hiện tượng PTGS, các tác
giả đã phát hiện được các phân tử RNA nhỏ, kích thước khoảng 25 nts, đặc hiệu nhưng ngược
chiều với gen chuyển (chứng tỏ không phải là sản phẩm phân hủy của mRNA của các gen
trên). Ngoài ra các tác giả cũng phát phát hiện thấy sau khi lây nhiễm potato virus X (PVX) 4
ngày, trên cây cũng hình thành các phân tử kích thước khoảng 25 nts, đặc hiệu nhưng ngược
nghĩa với PVX.
2.6. siRNAs - định nghĩa
siRNAs là các phân tử RNA sợi kép nhỏ, kích thước khoảng 21-25 nts, được tạo ra bởi
Dicer, một RNA endonuclease nhóm III, là thành phần quan trong của phức hợp RISC gọi là
siRISC có chức năng phân hủy mRNA đồng dạng của nó.
2.7. siRNAs – nguồn gốc
Phần lớn siRNA có nguồn gốc từ mRNAs, các yếu tố di động (transposons), virus hoặc
DNA dị nhiễm sắc thể (heterochromatic DNA). Như vậy siRNA có cùng nguồn gốc với gen
mục tiêu.
2.8. siRNAs – sinh tổng hợp
Quá trình tạo ra các phân tử siRNA có thể được tóm tắt qua các bước sau:
Hình thành phân tử phiên mã sợi kép dài (dsRNA). Đầu tiên là hình thành các sản phẩm
RNA sợi kép. Các sản phẩm sợi kép này có thể là các gen chuyển được thiết kế ngược
chiều nhau, hoặc là các sản phẩm trung gian trong quá trình tái sinh của virus.
Hình thành siRNA thành thục. Các phân tử dsRNA được Dicer cắt thành các phân tử RNA
nhỏ sợi kép có kích thước khoảng 22 nts. Do bị cắt bởi Dicer, các phân tử này có đầu so le
với gốc phosphat ở đầu 5‘ và 2-3 phân tử nts đầu 3‘ (overhang). Tiếp theo, phân tử RNA
nhỏ sợi kép này được được tách bởi helicase thành 2 phân tử sợi đơn. Các phân tử siRNA
thành thục sợi đơn này sẽ tham gia hình thành phức hợp RISC.
3. So sánh miRNA và siRNA
Mặc dù cả 2 loại phân tử can thiệp có kích thước nhỏ này, siRNA và miRNA, được khám
phá riêng rẽ thì chúng đều có quan hệ với nhau về đường hướng hình thành và vai trò sinh
học.
3.1. Giống nhau
Đều là các phân tử RNA sợi kép (hoac don) nhỏ (miRNA = 21-22 bp; siRNA = 21- 25
bp).
96
Đều được tạo ra bởi Dicer (một endonuclease nhóm III). Dicer cắt các sợi dsRNA dài
thành siRNA và cắt tiền chất của miRNA (pre-miRNA) với cấu trúc thân-thòng lọng
không hoàn chỉnh thành miRNA.
Các siRNA và miRNA mới hình thành đều ở dạng sợi kép và trước khi lắp ráp thành
RISC, chúng phải tách ra thành sợi đơn.
Hoạt động của siRNA và miRNA sau khi đã lắp ráp thành phức hợp siRISC và miRISC là
giống nhau: đều nhằm để cắt các RNA sợi đơn mục tiêu.
3.1.1 Khác nhau
Mặc dù giống nhau về tính chất hóa học, sinh hóa và cơ chế hoạt động thì miRNA và
siRNA vẫn có các điểm khác nhau cơ bản về nguồn gốc, đường hướng hình thành, vai trò sinh
học và mức độ bảo thủ về mặt tiến hóa:
miRNAs có nguồn gốc (được mã hóa) tại các vị trí genome khác biệt với gen mục tiêu của
nó. Trái lại, siRNAs có nguồn gốc từ mRNAs, transposons, viruses.
miRNAs được xử lý (cắt) từ các phân tử tiền chất (pre-miRNA) có độ dài và cấu trúc kẹp
tóc khá xác định.. Trái lại, siRNAs được xử lý (cắt) từ các phân tử dsRNA dài hoặc các
cấu trúc kẹp tóc khá dài.
Từ một phân tử pre-miRNA sẽ chỉ tạo một loại phân tử miRNA. Trái lại, một phân tử
dsRNA hoặc một cấu trúc kẹp tóc dsRNA sẽ tạo nhiều phân tử siRNA khác nhau. siRNA
gồm 2 nhóm: (1) nhóm đối xứng với 2 đầu đều có tính ổn định tương đương nên cả 2 sợi
đơn sau khi tách ra đều lắp ráp hiệu quả thành siRISC và (2) nhóm không đối xứng do chỉ
có một đầu ổn định nên chỉ có 1 sợi lắp ráp hiệu quả thành siRISC. Trái lại, phần lớn
miRNA thuộc nhóm không đối xứng => tạo chỉ 1 loại miRISC.
Trình tự miRNA gần như luôn luôn bảo thủ ở các sinh vật có quan hệ với nhau; trái lại
trình tự chuỗi siRNA hiếm khi bảo thủ giữa các sinh vật có quan hệ.
RNA silencing thông qua miRNA là một cơ chế điều hòa gen, đảm bảo sự sinh trưởng và
phát triển của sinh vật. Trái lại RNA silencing thông qua siRNA là (i) một cơ chế phòng
thủ chống virus, (ii) ngăn chặn sự biểu hiện quá mức hoặc không cần thiết của các mRNA,
và (iii) bảo vệ bộ gen khỏi bị gián đoạn bởi transposon
4. Công nghệ RNAi trong tạo giống kháng bệnh virus
4.1. Giới thiệu
Virus là nhóm tác nhân gây bệnh quan trọng ảnh hưởng đến nhiều loại cây trồng khắp hế
giới. Vì virus trong cây không thể bị tiêu diệt trực tiếp bởi các thuốc hóa học nên sử dụng
giống kháng là một trong các chiến lược hiệu quả nhất hiện nay để phòng chống bệnh. Giống
kháng bệnh có thể có được nhờ 2 phương phps chính: (1) tính kháng với nguồn gen kháng từ
cây, và (2) tính kháng từ gen virus.
Tính kháng từ gen virus đã được thử nghiệm từ lâu. Vào năm 1986, Powell-Abel et al. đã
chứng minh rằng biểu hiện gen CP của TMV trên thuốc lá có thể kháng được virus. Ngoài
gene CP, các nhà khoa học đã chuyển nhiều gen virus khác như replicase, vận chuyển,
protease... và đã tạo ra nhiều mức kháng khác nhau (triệu chứng biểu hiện chậm, giảm mức
dữ dội của triệu chứng, miễn dịch).
Đầu tiên, các nhà khoa học cho rằng tính kháng có được là do protein của virus phải được
biểu hiện. Tuy nhiên, nhiều quan sát cho thấy, các cấu trúc chứa gen virus không có khả năng
dịch mã cũng qui định tính kháng (các cấu trúc này vẫn được phiên mã tốt trong nhân nhưng
lượng mRNA của nó ở tế bào chất giảm đáng kể).
97
Như vậy có 2 loại tính kháng nhờ chuyển gen virus là (1) thông qua protein và (2) thông
qua RNA (hay RNAi)
Tạo giống kháng thông qua RNAi có thể đạt được dựa trên siRNA hay miRNA. Đối với
virus thực vật, các nghiên cứu chủ yếu tập trung vào siRNA còn miRNA mới chỉ được chú ý
từ năm 2006.
4.2. Các đặc điểm chính trong công nghệ RNAi dựa trên siRNA
4.2.1 Thiết kế cấu trúc chuyển gen
Đây là bước quan trọng nhất, quyết định thành công của một chương trình tạo giống
kháng thông qua RNAi.
Có 3 cách để thiết kế cấu trúc chuyển gen virus
- Tạo cấu trúc chứa gen đồng nghĩa (sene).
- Tạo cấu trúc chứa gen ngược nghĩa (antisense).
- Tạo cấu trúc chứa gen theo cả 2 chiều đồng nghĩa và ngược nghĩa (cấu trúc tự bắt cặp).
Tất cả các loại cấu trúc trên muốn tạo tính kháng thì đều phải hình thành cấu trúc dsRNA
trong cây chuyển gen. Có nhiều cách để có thể hình thành cấu trúc dsRNA của gen chuyển.
Chẳng hạn, các cấu trúc đồng nghĩa và ngược nghĩa có thể (i) được chuyển đồng thời vào cây,
hoặc (ii) được chuyển riêng biệt để tạo các dòng chứa gen đồng nghĩa hoặc ngược nghĩa. Các
dòng này sẽ được lai để tạo dòng mang cả gen đồng nghĩa và ngược nghĩa, hoặc (iii) trong
trường hợp cây chỉ được chuyển với cấu trúc đồng nghĩa hoặc ngược nghĩa thì RdRp của cây
sẽ tạo ra các phân tử dsRNA từ các transcripts của gen được chuyển.
Tuy nhiên, chỉ loại cấu trúc tự bắt cặp đã được chứng tỏ là hiệu quả hơn cả trong việc tạo
ra tính kháng. Hiện nay, hầu hết các nghiên cứu tạo tính kháng thông qua RNAi trên cây đều
sử dụng các cấu trúc tự bắt cặp (hình).
Đối với cấu trúc tự bắt cặp, nếu 2 chuỗi gen virus bao quanh một chuỗi intron thì hiệu quả
PTGS sẽ tăng lên rất nhiều
4.2.2 Chọn chuỗi gen virus
Không có yêu cầu đặc biệt để chọn chuỗi gen. Các gen được lựa chọn có thể là gen CP,
gen vận chuyển, gen protease..., thâm chí cả phần không dịch mã (ví dụ như phần 3‘UTR của
các potyvirrus).
Hình. Hiệu quả PTGS với các
cấu trúc chuyển gen potato virus Y
(PVY) khác nhau. Hiệu quả được
tính là % cây chuyển gen miễn
nhiễm với PVY. Gen virus (PVY-
pro) là NIa. Chuỗi loop là chuỗi
gen unidA (GUS) dài ~800 nts.
Intron là chuỗi intron của gen Pdk
gene của cây Flaveria. (Smith et
al., 2000).
98
Các gen này thông thường được lựa chọn trên vùng bảo thủ của loài vì RNAi thông qua
siRNA mang tính đặc hiệu rất cao. Ngoài ra vùng gen lựa chọn cũng nên qui định các chức
năng sinh học chủ chốt của virus. Chẳng hạn đối với begomovirus nên chọn vùng đầu N của
gen Rep (vừa bảo thủ vừa chứa nhiều motif quan trọng); đối với potyvirus nên chọn vùng đầu
C của gen CP (bảo thủ cao) .
Độ dài của chuỗi gen thường vài trăm bp. Nghiên cứu với tomatospoted wilt virus
(TSWV) cho thấy độ dài tối thiểu để tạo tính kháng là 59 bp.
5. Ví dụ công nghệ RNAi kháng bệnh virus
5.1. Tạo cây chuyển gen kháng PVY thông qua RNA silencing
(Missiou et al., 2004. Molecular Breeding 14: 185–197, 2004)
5.1.1 Giới thiệu.
Cây khoai tây là cây trồng quân trọng đứng hàng thứ 4 trên thế giới. Cây khoai tây bị
nhiễm rất nhiều loại virus trong đó potato virus Y (PVY) là virus nghiêm trọng nhất.
PVY lan truyên qua củ giống và nhiều loài rệp muội họ Aphidiade theo kiểu không bền
vững. PVY gây hại trên nhiều loại cây trồng, đặc biệt nghiêm trọng trên cây họ cà như khoai
tây, cà chua, thuốc lá, ớt. Triệu chứng bệnh thay đổi theo loài/giống cây, chủng virus và điều
kiện ngoại cảnh.
PVY thuộc chi Potyvirus với đặc điểm bộ gen là: bộ gen RNA sợi đơn, cực (-), kích thước
9,7 kb. Bộ gen (theo chiều từ trái sang phải) gồm: 1 chuỗi 5‘NTR (UTR), một ORF lớn mã
hóa một polyprotein được xử lý sau dịch mã thành 10 protein chức năng, một chuỗi 3‘ NTR
(UTR), tận cùng là một chuỗi poly-A. Dựa trên so sánh chuỗi, hiện nay quần thể PVY gồm 4
chủng PVYO, PVY
N, PVY
NTN và PVY
W.
5.1.2 Thiết kế cấu trúc chuyển gen (hình) và chuẩn bị dòng vi khuẩn chuyển gen
Đoạn gen được lựa chọn là một đoạn dài 605 bp phần đầu 3‘ của gen CP. Đoạn gen được
phân lập bằng RT-PCR dùng cặp mồi
Y9100: 5‘CTGGATCCTGTCTCCTGATTGAAGTTTACAGTC3‘
YREV1: 5‘TTGAATTCAAAGGAACCATATATGCCACGATAT3‘
Hình. Đặc điểm bộ gen và 4
chủng của PVY (DPV, 2004).
P1: protein P1
HcPro: Helper component
protein
P3: protein P3
CI: Crystal Inclusion
NIa: Nuclear Inclusion a
NIb: Nuclear Inclusion b
CP: Coat protein
NTR: non translated region
(=UTR)
99
- Đoạn gen CP được clon vào vector plasmid pT3T7-lac (Stratagene).
- Chèn 1 đoạn spacer dài 1255 bp (vị trí BamHI/SalI) lấy từ bacteriophage vào giữa
đoạn CP đồng nghĩa và CP ngược chiều để tạo cassete pvyPH9100:
CP (đồng nghĩa) – spacer – CP (ngược nghĩa).
- Clone cassete pvyPH9100 vào vector plamid song cực pART7/27 để tạo cấu trúc chuyển
gen pART27HP9100. Cấu trúc này được điều khiển bởi promotor CaMV35S và terminater
ocs (của gen Octopine synthase). Cấu trúc cũng chứa marker nptII (kháng kanamycin)
- Biến nạp cấu trúc pART27HP9100 vào vi khuẩn Agrobacterium tumefaciens (chủng
LBA4404)
Hình. Bản đồ T-DNA của cấu trúc pHP9100 mang các chuỗi lặp đảo (tự ghép cặp) của
PVY. CP: chuỗi gen vỏ protein CP. RB, LB: bờ phải và bờ trái của T-DNA. CaMV35S:
promotor CaMV, OCS 3‘: chuỗi terminator của gen mã hóa Octopine synthase. nptII: kháng
kanamycine.
5.1.3 Biến nạp cấu trúc chuyển gen vào cây khoai tây
Cây khoai tây (giống Spunta) non 1 tháng tuổi được trồng trong nhà kính.
Explant cắt từ lóng cây non được ủ với vi khuẩn A. tumefaciens chứa cấu trúc chuyển gen
pART27PH9100 trong 24 giờ và được đặt trên môi trường tạo callus (môi trường MS
chứa hormone zeatin, 2,4-D và kháng sinh kanamycin, cefotaxime). Tiếp theo, callus
được chuyển sang môi trường tạo chồi (môi trường MS chứa hormone zeatin, GA3 và
kháng sinh như trên). Tiếp theo callus được chuyển sang môi trường tạo rế (môi trường
MS chứa hormone IAA và kháng sinh như trên). Cây explants được trồng trong điều kiện
25 °C ban ngày, 18 °C tối với 16 giờ sáng (ánh sáng huỳnh quang).
5.1.4 Các phân tích chính cây chuyển gen
Southern blot nhằm phát hiện số copy của cấu trúc đã được chuyển vào bộ gen của
Cây chuyển gen 5-6 tháng tuổi được phân tích southern blot
DNA tổng số được chiết từ 0.5 – 1 mg lá tươi.
Phân cắt DNA tổng số = RE
Điện di 10 – 15 g DNA bằng agarose 0,7 %
Chuyển và cố định DNA sang màng lai
Lai với dò là đoạn gen CP 605 bp được gán nhán phóng xạ P32
Northen blot nhằm phát hiện siRNA hình thành từ cây chuyển gen
Cây chưa lây nhiễm ở các tuổi khác nhau (khoảng 2 tháng sau khi chuyển ra nhà lưới)
được sử dụng để phát hiện siRNA
100
Chiết RNA tổng số từ khoảng 1 g lá
Điện di trên gel polyacrylamide acrylamide ở điều kiện biến tính(12% acrylamide, 0.6%
bisacrylamide, 7 M urea) với đệm TBE buffer (50 mM Tris, 41.5 mM boric acid, 0.5 mM
EDTA).
Chuyển và cố định RNA sang màng lai.
Lai với dò là đoạn gen CP 605 bp được gán nhán phóng xạ P32
Lây nhiễm virus trên cây chuyển gen
Cây chuyển gen ở giai đoạn 4 – 5 lá được lây nhiễm nhân tạo bằng tiếp xúc cơ học.
Tất cả 4 chủng PVY và PVX đều được lây nhiễm. Các chủng này được giữ nguồn trên
thuốc lá hoặc khoai tây.
Nghiền lá (khoai tây hoặc thuốc lá) nhiễm virus với đệm phosphate 0.01 M chứa 0.4%
Na2SO3 (sodium sulphite), pH 7.5 theo tỷ lệ 1/10.
Lây nhiễm cơ học bằng bột carborandum
Cây được đánh giá sau lây nhiễm bằng 3 phương pháp ELISA, tisue printing và northen
blot
ELISA nhằm phát hiện sự có mặt của virus (dựa vào protein virus) trong cây chuyển gen
đã lây nhiễm virus
Tisue printing (lai tại chỗ) nhằm phát hiện sự có mặt của virus (dựa vào RNA virus) trong
lá cây chuyển gen đã lây nhiễm virus.
5.2. Tạo cây chuyển gen kháng TYLCV thông qua RNA silencing
5.2.1 Giới thiệu.
TYLCV là một trong nhiều loài begomovirus gây bệnh xoăn vàng lá cà chua. Các
begomovirus lan truyền ngoài tự nhiên nhờ bọ phấn (B. tabaci) theo kiểu bền vững tuần hoàn.
Các begomovirus là các virus thực vật có bộ gen DNA vòng đơn có kích thước khoảng
2.6 – 2.8 kb. Chúng hoặc có bộ gen kép gồm 2 phân tử DNA sợi vòng đơn gọi là DNA-A và
DNA-B hoặc có bộ gen đơn tương đương DNA-A
Đối với các virus có bộ gen đơn thì DNA-A của chúng chứa 6 gen được tổ chức theo 2
chiều ngược nhau.
Trên chiều kim đồng hồ (chiều virus) có 2 gen là (i) V1 mã hóa vỏ protein có chức năng
chính là tạo vỏ phân tử virus, lan truyên qua vector, vận chuyển bộ gen virus vào và ra khỏi
nhân tế bào ký chủ và vận chuyển bộ gen virus giữa các tế bào; và (ii) V2 mã hóa protein V2
có chức năng liên quan đến vận chuyển virus giữa các tế bào.
Trên chiều ngược kim đồng hồ (chiều sợi tương đồng virus) có 4 gen là (i) C1 mã hóa
protein tái sinh hay còn gọi là protein Rep có chức năng chính là cắt - nối bộ gen virus tại một
vị trí đặc biệt ở vùng nguồn gốc tái sinh và tương tác với protein ký chủ để tạo điều kiện
thuận lợi cho tái sinh virus, (ii) C2 mã hóa 1 protein hoạt hóa phiên mã, (iii) C3 mã hóa 1
protein tăng cường tái sinh và (iv) C4 mã hóa protein C4 với chức năng liên quan đén phổ ký
chủ và phát triển triệu chứng.
Giữa 2 vùng gen mã hóa ngược chiều nhau ở trên là một vùng không mã hóa chứa nguồn
gốc tái sinh (ori = origin of replication) gồm (i) các chuỗi lặp đảo (iteron) cần thiết cho sự
nhận biết và gắn kết của protein Rep và (ii) một cấu trúc thân – thòng lọng trong đó chuỗi
101
TAATACTAT trên vùng thòng lọng là giống nhau ở tất cả các begomovirus và vị trí TA cuối
cùng là nơi protein Rep cắt và nối bộ gen begomovirrus trong quá trình tái sinh.
Đối với các begomovirus có bộ gen kép thì DNA-A có tổ chức bộ genome và chức năng
các gen tương tự như DNA-A của các begomovirus có bộ gen đơn (tên các gen được thêm ký
tự A vào đằng trước thành AV1, AV2, AC1, AC2, AC3 và AC4); còn DNA-B của chúng chỉ
chứa 2 gen được sắp xếp theo 2 chiều ngược nhau và mã hóa 2 protein là (i) protein con thoi
có chức năng vận chuyển bộ gen virus vào và ra khỏi nhân tế bào và (ii) protein vận chuyển
có chức năng vận chuyển bộ gen virus giữa các tế bào.
5.2.2 Thiết kế cấu trúc chuyển gen (hình) và chuẩn bị dòng vi khuẩn chuyển gen
Đoạn gen được lựa chọn là C1 (mã hóa protein Rep) với độ dài 727 bp nằm ở đầu 5‘.
Nguồn virus là một plasmid chứa toàn bộ bộ gen virus được clone từ trước.
Đoạn gen ngược nghĩa được phân lập bằng PCR với cặp mồi A và B (bảng). Đoạn PCR
ngược nghĩa được cắt kép với 2 RE là XhoI/BamHI và được nối vào vị trí tương ứng của
vector pBPW8 để tạo ra cấu trúc pBPC1antisense
Đoạn gen đồng nghĩa được phân lập bằng PCR với cặp mồi B và C (bảng). Đoạn PCR
đồng nghĩa được cắt kép với 2 RE là KpnI/BamHI và được nối vào cấu trúc pBPC1antisense
(cũng được cắt kép bằng KpnI/BamHI) để tạo ra cấu trúc pBPC1antisense-C1sene.
Đoạn intron của Castor bean catalase được phân lập bằng cặp mồi D và E (bảng) từ
plasmid pWJKK.IN-2 (của cơ quan CSIRO, Australia).
Xử lý 2 đầu của đoạn intron được tạo ra bằng PCR với RE ClaI. Tương tự, cấu trúc
pBPC1antisense-C1sene cũng được mở bằng RE ClaI.
Nối đoạn intron (đã được cắt bằng ClaI) vào cấu trúc pBPC1antisense-C1sene (đã được mở
bằng ClaI) để tạo cấu trúc pBPC1727
antisen – intron – C1727
sene. Cấu trúc này chứa cấu trúc
kẹp tóc sau:
C1(727nt, antisense) – intron – C1 (727nt, sene)
Một đọan 3.4 kb của cấu trúc pBPC1727
antisen – intron – C1727
sene chứa cả promotor CaMV
35S và terminator tNos được giải phóng bằng HindIII và nối vào vị trí tương ứng của một
vector song cực là pZ200 để tạo ra cấu trúc chuyển gen.
Biến nạp cấu trúc chuyển gen trên vào vi khuẩn Agrobacterium tumefaciens (chủng
LBA4404)
Bảng Các mồi sử dụng trong thiết kế cấu trúc chuyển gen
Mồi Chuỗi mồi RE
A (c) TCTCTCGAGTTACGCCTTATTGGTTTC XhoI
B (v) CGCGGATCCATGCCTCGTTTTATTTAAA BamHI
C (c) CGGGGTACCTTACGCCTTATTGGTTTC KpnI
D CCATCGATCTGCAGGTAAATTTCTAGTTTTTC ClaI
E CCATCGATCTGCAGTTATCATCATCATCATAG ClaI
102
(c) mồi gắn vào chuỗi tương đồng virus; (v) mồi gắn vào chuỗi virus
5.2.3 Biến nạp cấu trúc chuyển gen vào cây khoai tây
Cây khoai tây (giống Spunta) non 1 tháng tuổi được trồng trong nhà kính.
Explant cắt từ lóng cây non được ủ với vi khuẩn A. tumefaciens chứa cấu trúc chuyển gen
pART27PH9100 trong 24 giờ và được đặt trên môi trường tạo callus (môi trường MS
chứa hormone zeatin, 2,4-D và kháng sinh kanamycin, cefotaxime). Tiếp theo, callus
được chuyển sang môi trường tạo chồi (môi trường MS chứa hormone zeatin, GA3 và
kháng sinh như trên). Tiếp theo callus được chuyển sang môi trường tạo rế (môi trường
Hình Cấu trúc chuyển gen kháng TYLCV.
(a) Tổ chức bộ gen của TYLCV
(b) Bản đồ đoạn chứa cấu trúc chuyển gie.CaMV 35S: promoter
Intron: chuỗi intron của Castor bean catalase.
LB, LR: bờ trái và bờ phải.
tNos: chuỗi terminator của nopaline synthase.
nptII: neomycin phosphotransferase II (kháng kanamycine).
pNos: chuỗi promoter của nopaline synthase.
(c) Sơ đồ hairpin RNA so khi intron bị cắt khỏi transcript
103
MS chứa hormone IAA và kháng sinh như trên). Cây explants được trồng trong điều kiện
25 °C ban ngày, 18 °C tối với 16 giờ sáng (ánh sáng huỳnh quang).
5.2.4 Các phân tích chính cây chuyển gen
Southern blot nhằm phát hiện số copy của cấu trúc đã được chuyển vào bộ gen của
Cây chuyển gen 5-6 tháng tuổi được phân tích southern blot
DNA tổng số được chiết từ 0.5 – 1 mg lá tươi.
Phân cắt DNA tổng số = RE
Điện di 10 – 15 g DNA bằng agarose 0,7 %
Chuyển và cố định DNA sang màng lai
Lai với dò là đoạn gen CP 605 bp được gán nhán phóng xạ P32
Northen blot nhằm phát hiện siRNA hình thành từ cây chuyển gen
Cây chưa lây nhiễm ở các tuổi khác nhau (khoảng 2 tháng sau khi chuyển ra nhà lưới)
được sử dụng để phát hiện siRNA
Chiết RNA tổng số từ khoảng 1 g lá
Điện di trên gel polyacrylamide acrylamide ở điều kiện biến tính(12% acrylamide, 0.6%
bisacrylamide, 7 M urea) với đệm TBE buffer (50 mM Tris, 41.5 mM boric acid, 0.5 mM
EDTA).
Chuyển và cố định RNA sang màng lai.
Lai với dò là đoạn gen CP 605 bp được gán nhán phóng xạ P32
Lây nhiễm virus với cây chuyển gen
Cây chuyển gen ở giai đoạn 4 – 5 lá được lây nhiễm nhân tạo bằng tiếp xúc cơ học.
Tất cả 4 chủng PVY và PVX đều được lây nhiễm. Các chủng này được giữ nguồn trên
thuốc lá hoặc khoai tây.
Nghiền lá (khoai tây hoặc thuốc lá) nhiễm virus với đệm phosphate 0.01 M chứa 0.4%
Na2SO3 (sodium sulphite), pH 7.5 theo tỷ lệ 1/10.
Lây nhiễm cơ học bằng bột carborandum
Cây được đánh giá sau lây nhiễm bằng 3 phương pháp ELISA, tisue printing và northen
blot
ELISA nhằm phát hiện sự có mặt của virus (dựa vào protein virus) trong cây chuyển gen
đã lây nhiễm virus.
Tisue printing (lai tại chỗ) nhằm phát hiện sự có mặt của virus (dựa vào DNA virus)
trong cây chuyển gen đã lây nhiễm virus.
6. Sử dụng công nghệ microRNA trong phòng chống bệnh virus
Công nghệ RNAi dùng miRNA mới được nghiên cứu gần đây trong phòng chống bệnh
virus thực vật. Một số ưu điểm dùng miRNA là:
Ít bị hiệu ứng không đặc hiệu (off-target). Đây là hiệu ứng không mong muốn khi RISC
(thông qua liên kết không đặc hiệu của sRNA) cắt các phân tử không phải mRNA mục
tiêu. Hiện nay, việc chọn các miRNA với trình tự không tương đồng với bộ gen ký chủ là
hoàn toàn khả thi nếu bộ gen ký chủ đã được giải trình tự toàn bộ.
104
Mức độ tương thích promoter RNA cao.
An toàn với môi trường (an toàn sinh học) do giảm thiểu khả năng tái tổ hợp giữa virus tự
nhiên và gen virus được chuyển vào trong cây/
6.1. Dùng công nghệ miRNA tạo tính kháng CMV
6.1.1 Giới thiệu
(CPC, 2006)
Cucumber mosaic virus (CMV) là môt trong những virus thực vật quan trọng nhất, gây
hại hơn 800 loài cây 1 và 2 lá mầm thuộc 85 họ thực vật. Virus có thể lan truyền bằng 80 loài
rệp muội theo kiểu không bền vững. Virus có thể và lan truyền bằng tiếp xúc cơ học và có thể
truyền qua hạt giống của nhiều loài cây. Virus phân bố khắp thế giới.
Phân tử virus có hình cầu, khoảng 29 nm (đường kính). CMV là một virus đa thành phần
với bộ gen gồm 3 phân tử RNA gọi là RNA1, RNA2 và RNA 3; mỗi phân tử RNA genome
được lắp ráp thành các phân tử riêng biệt (có vỏ protein riêng). Ngoài ra, CMV còn có 2 phân
tử RNA subgenomic (hình thành trong quá trình tái sinh virus) là RNA4 được lắp ráp cùng
với RNA3 trong cùng một phân tử và RNA4A.
CMV là một virus RNA sợi đơn, mạch thẳng, cực dương. Tất cả 3 phân tử RNA của CMV
đều có đầu 5‘ chứa cap (7-methyl guanosine) và đầu 3‘ có cấu trúc giống tRNA.
RNA1 có kích thước khoảng 3.4 kb, mã hóa 1 protein là 1a có chức năng giống như một
helicase và methyl transferase.
RNA2 mã hóa 2 protein là 2a và 2b. Protein 2a là một polymerase. Protein 2b được biểu
hiện từ RNA4 có chức năng liên quan đến di chuyển hệ thống, biểu hiện triệu chứng và ức
chế PTGS của cây.
RNA3 mã hóa 2 protein là 3a (liên quan đên di chuyển virus) và protein vỏ CP.
Ngoài RNA subgenomic (RNA4 ), phân tử CMV cũng chứa một số phân tử RNA vệ tinh
có kích thước từ 332 – 386 nts và có ảnh hưởng đến tính gây bệnh của virus. Các phân tử vệ
tinh này phụ thuộc CMV để tái sinh.
6.1.2 Thiết kế cấu trúc miRNA chuyển gen
(JOURNAL OF VIROLOGY, June 2007, p. 6690–6699)
Cấu trúc chuyển gen chứa chuỗi miRNA nhằm vào gen b2 của CMV.
Cấu trúc được xây dựng dựa trên bộ khung một chuỗi pre-miRNA ký hiệu là miR171a của
cây A. thaliana. Chuỗi pre-miRNA này nằm trên nhiễm sắc thể sô 2, 3 và 4 của cây A.
thaliana với chuỗi mục tiêu là các mRNA mã hóa các yếu tố phiên mã liên quan đến ra rễ.
Chuỗi pre-miRNA này đã được chứng minh từ trước là có tạo chuỗi miRNA trong cây.
Cấu trúc chuyển gen được xây dựng bằng cách thay thế chuỗi miRNA của miR171a bằng
một chuỗi tương ứng vị trí 178 tới 198 của gen b2 của CMV. Chuỗi này dài 21 nt và có trình
tự (5‘-GUAGAUGGUUCGGAACUGAUA-3‘).
Các bước để xây dựng cấu trúc chuyển gen tạo miRNA nhằm vào gen b2 của CMV bao
gồm :
Thiết kế 2 mồi lớn tương ứng với phần 5‘ (đồng nghĩa) và 3‘ (ngược nghĩa) của chuỗi pre-
miR171a. Mỗi mồi chứa 1 chuỗi 21 nt đặc hiệu gen 2b của CMV (phần in béo và gạch chân)
tại vị trí vốn là trình tự chuỗi miRNA của pre-miR171a. Ngoài ra đầu 5‘ của mỗi mồi cũng
chứa thêm 1 chuỗi chứa vị trí BamHI và SacI để tạo điều kiện cho clone.
5’-CGGGATCCATGAGAGAGTCCCTTTGTAGATGGTACGGAACTTATAGATCTTACCTGACCACACACG-3’
105
5’-GCGAGCTCACGAGAGAGT-ACTGAGTAGATGGTTCGGAACTGATAGATAATCTAGAGAGAATAAT-3’
Dùng 2 mồi trên để chạy PCR với template là một plasmid chứa chuỗi pre-miR171a.
Đoạn PCR hình thành là một cấu trúc lai gồm khung là pre-miR171a còn chuỗi miRNA là của
gen b2 của CMV. Cấu trúc lai này chính là một pre-miRNA và được ký hiệu là miR2bprec
Đoạn PCR được xử lý 2 đầu với BamHI/SacI và được nối vào vị trí tương ứng của vector
pBI221. Vector này có chứa chuỗi promotor CaMV 35S (35Spro) và terminator của nopaline
synthase gene (NOS Ter). Kết quả tạo ra vector pBI-35S-miR2bprec chứa một cassette biểu
hiện : 35S Pro - miR2bprec – NOS Ter.
Cassette biểu hiện được chuyển sang một vector song cực pCAMBIA 1300 để tạo ra
vector p35S-miR2bprec. Chú ý là pCAMBIA 1300 chứa 1 marker chọn lọc là hygromycin
phosphotransferase (hpt) dưới sự điề khiển của CaMV 35S.
Vector p35S-miR2bprec được biến nạp vào vi khuẩn A. tumerfaciens (chủng EH105).
6.1.3 Chuyển gen vào cây thuốc lá
(J. of virology, June 2007, p. 6690–6699)
Vector p35S-miR2bprec được biến nạp vào cây thuốc lá Nicotiana tabacum cv. SR1 bằng
phương pháp đĩa lá dung vi khuẩn A. tumerfaciens để tạo cây thế hệ T0. Các cây To được thử
PCR để kiểm tra sự có mặt của gen chuyển.
Cây T0 được tự thụ và hạt thế hệ T1 được gieo trên môi trường chứa hygromycin để chọn
cây chuyển gen.
cc uu c c cuuaccugaccacacacguag
augagagagu cu gauauuggc ugguuca ucagau a
|||||||||| || ||||||||| ||||||| ||||||
ugcucucuca ga cuauaaccg gccgagu agucua u
-u cu c u uuagaucucucuuauuacaua
Hình Cấu trúc pre-miR171a của A. thaliana (từ cơ sở dữ miRBase)
Hình Các cấu trúc pre-miRNA
Hình trên cùng là sơ đồ cassette biểu
hiện miRNA của gen b2 của CMV:
promoter 35S (35S Pro) – miR2b –
terminator của nopaline synthase (NOS Ter).
Hình giữa: chuỗi kẹp tóc pre-miR171a
của A. thaliana chứa chuỗi miR171
(màu đỏ).
Hình dưới: chuỗi kẹp tóc miR2bpre
chứa chuỗi miRNA là 21 nts của gen b2
của CMV (màu đỏ).
106
6.1.4 Lây nhiễm nhân tạo
Lá cây thuốc lá nhiễm CMV được nghiền trong đệm phosphate với tỷ lệ 1/10 và lây nhiễm
bằng tiếp xúc cơ học trên 2 lá phía trên của cây thuốc lá chuyển gen thế hệ T1 ở giai đoan 5-6
lá.
6.1.5 Đánh giá cây chuyển gen được lây nhiễm CMV dựa trên triệu chứng
Triệu chứng biểu hiện được đánh theo thang phân cấp thứ tự gồm 5 cấp:
Cấp 0: không triệu chứng.
Cấp 1: khảm nhẹ chỉ trên 1 lá ngọn.
Cấp 2: khảm nhẹ, biểu hiện trên hơn 2 lá.
Cấp 3: khảm rõ ràng trên lá già hơn và biến dạng nhẹ trên 2 lá ngọn.
Cấp 4: triệu chứng tương tự cấp 3 nhưng cây còi cọc.
Cấp 5: lá biến dạng rõ ràng và cây còi cọc mạnh.
6.1.6 Phân tích miRNA trên cây chuyển gen
Sự hình thành miRNA trên cây chuyển gen được đánh giá dựa trên kỹ thuật Northen blot.
Các công đoạn tinh chiết, xây dựng dò và phát hiện RNA đều dùng các kít thương mại của
hãng Ambion.
Tinh chiết RNA (dùng kít mirVanaTM
miRNA Isolation Kit).
250 mg mô lá được nghiền trong đệm chiết.
Các phân tử RNA nhỏ (sRNA) được xử lý bằng cồn.
Cố định sRNA qua màng lọc sợi thủy tinh.
Rửa màng và giải hấp (elute) sRNA
Thiết kế dò gán nhãn bức xạ (dùng kít mirVana™ miRNA Probe Construction Kit).
Thiết kế một mồi oligo 5‘-TCAGTTCCGAACCATCTACCCTGTCTC-3‘. Mồi này có
phần 5‘ tương đồng với 19 nts của miR2b và phần 3‘ (8 nt được gạch chân) tương đồng
với phần 3‘ của mồi T7 promotor (mồi T7 có sẵn trong kít).
Mồi oligo và mồi T7 được ủ với enzyme Klenow để tạo sợi dsDNA. Tiếp theo, đoạn
dsDNA được phiên mã trong hỗn hợp phiên mã chứa UTP-P32
dùng T7 RNA
polymerase để tạo dò RNA dài 19 nt gãn nhãn bức xạ.
Phát hiện miRNA (dùng kít mirVana™ miRNA Detection Kit). Kỹ thuật lai hóa ở đây là
lai hóa trong dung dịch.
sRNA được trộn dò RNA gán nhãn bức xạ trong đệm lai hóa. Sau khi biến tính nhiệt, hỗn
hợp được ủ qua đêm ở 42OC.
Tiếp theo, hỗn hợp ủ được xử lý với RNAse A và RNAseT1 để loại bỏ dò thừa và RNA
không lai hóa.
Sản phẩm lai hóa (dạng sợi kép, rất bền) được điện di trên gel polyacrylamide biến tính
15% và kết quả được xác định bằng bức xạ đồ.
6.1.7 Phân tích RNA của CMV trên cây lây nhiễm
Phát hiện và lượng hóa RNA của CMV bằng kỹ thuật Northen blot (lai RNA:RNA) trên
cây sau lây nhiễm nhằm đánh giá tính kháng.
107
Tinh chiết RNA. RNA tổng số từ mô lá được chiết từ cây sau lây nhiễm dùng kit Trizol
của hãng Invitrogen
Chuẩn bị dò gán nhãnbức xạ. Dùng kit mirVana™ miRNA Probe Construction (hãng
Ambion) tương tự như trên nhưng đoạn dò tương đồng với RNA virus là khoảng 200 nt đầu
3‘ của RNA 2 của CMV.
Phát hiện RNA virus bằng kỹ thuật northen blot chuẩn
20 g RNA được điện di qua gel agarose 1.2% chứa 1% formaldehyde.
Chuyển và cố định RNA sang màng Hybond-N (của hãng Amersham).
Kiểm tra băng trên màng bằng nhuộm methylene blue (chú ý sản phẩm RNA 18S
được sử dụng làm đối chứng nhằm kiểm tra lượng RNA điện di).
Lai, rửa và phát hiện bằng bức xạ đồ băng RNA 2 của CMV bằng kỹ thuật northen
blot chuẩn.
6.1.8 Phân tích virion CMV trên cây lây nhiễm
JOURNAL OF VIROLOGY, June 2007, p. 6690–6699
Phát hiện và lượng hóa sự có mặt của CMV trên cây lây nhiễm nhằm đánh giá tính kháng
bằng ELISA. Kỹ thuật ELISA sử dụng là PTA-ELISA
Nghiền lá cây bệnh trong đệm carbonate (pH9.6), nhỏ vào giếng của bản ELISA. Ủ bản
ELISA ở 37OC/4giờ.
Xử lý giếng với kháng thể thỏ đặc hiệu protei CP của CMV. Ủ bản ELISA ở 37OC/4giờ
Xử lý giếng với kháng thể dê (liên kết enzyme HRP = horseradish peroxidase) đặc hiệu
kháng thể thỏ. Ủ bản ELISA ở 37OC/4giờ.
Thực hiện phản ứng tạo màu bằng xử lý giếng với cơ chất TMB (tetramethylbenzidine).
Đánh giá kết quả bằng máy đọc ELISA ở 450 nm.
Tham khảo
1. CMV- compendium of Plant Protection, 2006, CABI
2. Qu, J., Ye, J. and Fang, R. 2007. Artificial MicroRNA-Mediated Virus Resistance in Plants. Journal of virology, Vol.81: 6690–6699.
3. Các kit thương mại để chiết sRNA, tạo dò gán nhãn bức xạ và phát hiện sRNA của hãng Ambion.
http://www.ambion.com/catalog/CatNum.php?1552.
4. Cơ sở dữ liệu miRNA tại website của trung tâm Sangger: http://microrna.sanger.ac.uk/sequences/
108
Chương 8. PCR trong chẩn đoán tác nhân gây bệnh
1. Tóm tắt kỹ thuật
PCR là một trong các phát minh quan trọng nhất của thế kỷ 20 trong sinh học phân tử.
PCR là một kỹ thuật đơn giản nhưng được sử dụng trong hầu hết các nghiên cứu CNSH. Có
vô số tài liệu tiếng Việt và tiếng Anh về kỹ thuật PCR. Dưới đây là tóm tắt kỹ thuật
Tùy thuộc khuôn là DNA hay RNA mà có tên phản ứng là PCR hay RT-PCR
Khuôn là DNA => PCR (polymerase chain reaction)
Khuôn là RNA => RT-PCR (Reverse transcription – PCR)
Các bước cơ bản trong 1 phản ứng PCR gồm 3 bước :
Biến tính. Hỗn hợp phản ứng được đặt ở nhiêt độ cao (92 – 94 ) trong thời gian ngắn
(khoảng 20 – 60 giây). Ỏ nhiệt độ này, khuôn DNA dạng sợi kép tách thành sợi đơn.
Gắn mồi. Hỗn hợp phản ứng được đặt ở nhiêt độ gắn mồi (Ta) trong thời gian ngắn. Ta
được tính toán tùy thuôch đặc điểm mồi, thường trong khoảng 40 – 60 . Ỏ nhiệt độ này, mồi
gắn vào khuôn sợi đơn ở vị trí đặc hiệu.
Tổng hợp sản phẩm PCR. Hỗn hợp phản ứng được tăng tới nhiệt độ tối ưu cho phản ứng
tổng hợp chuỗi (72 hoặc 68 tùy DNA polymerase chịu nhiệt).
Trong trường hợp RT-PCR, trước khi thực hiện PCR, cần phải có thêm một bước chuyển
khuôn RNA thành cDNA bằng enzyme phiên mã ngược (reverse transcriptase). Hai bước RT
và PCR có thể được thực hiện riêng rẽ hay trong cùng một tube phản ứng.
Các bước trong chẩn đoán bệnh cây bằng PCR/RT-PCR
Thiết kế mồi (primer)
Chiết acid nucleic tổng số (DNA hoặc RNA) từ mô cây; dùng các kỹ thuật chiết thông
thường (rẻ) hoặc kit chiết thương mại (đắt)
Chạy PCR hoặc RT-PCR
Kiểm tra và đánh giá kết quả bằng điện di
2. Thiết kế và lựa chọn mồi (primer)
Mồi là một chuỗi oligonucleotide sợi đơn ngắn (kích thước thường từ 18 – 24 nts). Có hai
loại mồi được sử dụng cho chẩn đoán bệnh cây
Mồi chung (universal/degenerate primers): được thiết kế trên các vùng bảo thủ cao, có khả
năng phát hiện các đối tượng khác hẳn nhau (thường các đối tượng của một chi, một họ).
Mồi đặc hiệu (specific primers): được thiết kế trên các vùng có thể phân biệt được loài,
thậm chí dưới loài như chủng/nòi/type sinh học…
Có được các mồi tốt là bước quan trọng nhất trong chẩn đoán bệnh cây. Có 2 cách để có
thể nhận được các mồi tốt.
Tham khảo và lựa chọn từ các nghiên cứu đã được công bố.
Tự thiết kế mồi.
2.1. Tự thiết kế mồi
Để tự thiết kế mồi dựa trên các chuỗi gen sẵn có trên Genbank, người ta cần sử dụng một
phần mềm có khả năng căn trình tự đa chuỗi (multiple sequence alignment), chẳng hạn
109
ClustalX, Bioedit. Ngay sau khi các chuỗi DNA đã được căn trình tự, chúng ta có thể thiết kế
các mồi chung hay mồi đặc hiệu tùy theo yêu cầu.
2.1.1 Các chú ý khi thiết kế mồi
Độ dài mồi. Nên nằm trong khoảng 18-22 nts. Độ dài này đủ dài để đảm bảo tính đặc hiệu
và đủ ngắn để mồi gắn đễ dàng vào khuôn.
Nhiệt độ tách chuỗi (Tm = Melting Temperature). Tm là nhiệt độ mà tại đó 1/2 số sợi
DNA kép tách thành sợi đơn. Tm của mồi nên nằm trong khoảng 52-58 oC.
Nhiệt độ gắn mồi (Ta = annealing temperature). Ta được tính dựa trên Tm. Ta quá cao
làm mồi khó gắn vào khuôn dẫn tới năng xuất PCR thấp. Ta quá thấp làm mồi dễ gắn không
đặc hiệu vào khuôn dẫn tới tạo các sản phẩm không đặc hiệu. Ta của 2 mồi xuôi và ngược
dòng nên tương đương. Có nhiều cách tính Ta
Ta = 0.3 x Tm(mồi) + 0.7 Tm (sản phẩm) – 14.9
Hàm lượng GC. Số các gốc G và C nên nămg trong khoảng 40-60%.
Chuỗi GC đầu 3’. Đầu tận cùng 3 ‗ nên là G hoặc C hoặc GC hoặc CG. Đầu 3‘ không
nên có nhiều hơn 3 gốc liên tục G/C.
Cấu trúc thứ cấp. Cấu trúc thứ cấp có thể hình thành trong cùng một mồi hoặc giữa 2
mồi. Mồi chứa cấu trúc thứ cấp xấu thường dẫn tới năng suất PCR bị giảm, thậm chí không có
sản phẩm. Tính ổn định của cấu trúc thứ cấp được đo bằng ΔG (là năng lượng cần để phá vỡ
cấu trúc thứ cấp, được tính từ các phần mềm thiết kế mồi). Các loại cấu trúc thứ cấp là:
Hairpins. Là cấu trúc thứ cấp hình thành trong nội bộ mồi. Giá trị ΔG của các hairpin đầu
3‘ không nên <-2 kcal/mol và của các hairpin ở giữa không nên <-3 kcal/mol.
Tự mồi (Self Dimer). Là cấu trúc hình thành giưã các phân tử của cùng loại mồi. Giá trị
ΔG của các hairpin đầu 3‘ không nên <-5 kcal/mol và của các hairpin ở giữa không nên <-
6 kcal/mol.
Tự mồi chéo (Cross Dimer). Là cấu trúc hình thành giưã các phân tử của 2 mồi khác nhau
(cặp mồi trong phản ứng PCR). Giá trị ΔG của các hairpin đầu 3‘ không nên <-5 kcal/mol
và của các hairpin ở giữa không nên <-6 kcal/mol.
Các chuỗi lặp. Mồi không nên chứa nhiều chuỗi lặp kép (ví dụ TATATATA) hoặc chuỗi
lặp đơn (ví dụ TTTT) vì có thể gây ra hiện tượng bắt cặp nhầm (misprime). Trong một mồi,
chỉ nên có tối đa 4 chuỗi lặp. Các chuỗi lặp cũng không nên xuất hiện nhiều lần trong 1 mồi
Độ ổn định đầu 3 ‗. Tận cùng đầu 3‘ (khoảng 5 nts) không nên chứa toàn gốc G hoặc C vì
có giá trị ΔG cao dễ dẫn tới bắt cặp không đặc hiệu vào khuôn. Trái lại nếu đầu 3‘ chứa quá
nhiều gốc T hoặc A sẽ khó bắt cặp.
Vùng thiết kế mồi của khuôn. vùng thiết kế mồi của khuôn không nên chứa quá nhiều
cấu trúc thứ cấp. Nếu các cấu trúc thứ cấp này ổn định ở nhiệt độ gắn mồi thì mồi sẽ không
thể bắt cặp được.
110
2.1.2 Thiết kế mồi chung (degenerate primer)
Mồi chung là một mồi được thiết kế trên vùng bảo thủ. Nếu vùng bảo thủ là đồng nhất thì
mồi chung sẽ chỉ là một chuỗi mồi duy nhất. Nếu vùng bảo thủ chứa các vị trí sai khác thì mồi
chung thực chất là một hỗn hợp các mồi, mỗi mồi tương ứng với một sai khác nucleotide.
Trong thiết kế mồi chung, người ta sử dụng các mã suy biến tại các vị trí sai khác, ví dụ R
là A hoặc G (số suy biến = 2); Y là C hoặc T (số suy biến bằng 2); N là A hoặc T hoặc G hoặc
C (số suy biến bằng 4). Số sai khác nucleotide tại mỗi vị trí của mồi được gọi là các số suy
biến. Tổng số mồi trong hỗn hợp sẽ bằng tích của tất cả các số suy biến tại mỗi vị trí. Để làm
giảm số lượng mồi trong hỗn hợp, người ta thường sử dụng một nucleotide đặc biệt là inosine.
Inosine có thể ghép cặp với bất kỳ nucleotide nào trong số 4 nucleotide A, T, G, C.
Bảng Mã suy biến trong thiết kế mồi chung
Viết tắt Nucleotide tương ứng Số suy biến
R A hoặc G 2
Y C hoặc T 2
M A hoặc C 2
K G hoặc T 2
W A hoặc T 2
S C hoặc G 2
B C hoặc G hoặc T 3
D A hoặc G hoặc T 3
H A hoặc C hoặc T 3
V A hoặc C hoặc G 3
N A hoặc C hoặc G hoặc T 4
i Inosine 1
2.1.3 Phần mềm
Các phần mềm thiết kế mồi và phân tích mồi có thể tải hoặc thực hiện trực tuyến tại
website sau: http://primer3.sourceforge.net/webif.php.
2.2. Ví dụ mồi chung
Một ví dụ mồi chung là mồi CIFor được thiết kế trên vùng bảo thủ của gen CI của các
potyvirus. Mồi này có trình tự là: 5‘-GGiVViGTiGGiWSiGGiAARTCiAC-3‘. Mồi CIFor có
khả năng phát hiện hầu hết các virus thuộc chi Potyvirus. Hình dưới minh họa vị trí mồi trên
bộ gen virus, trình tự mồi cũng như trình tự chuỗi gen CI của một số virus đại diện tại vị trí
mồi. Mồi này đã xử dụng inosine tại các vị trí có số suy biến bằng 4, do vậy đã giảm số lượng
mồi đơn trong hỗn hợp mồi từ 524288 xuống còn 32 mồi.
111
Tham khảo
http://www.premierbiosoft.com/tech_notes/PCR_Primer_Design.html
Virus Trình tự nucleotide
Mồi CIFor (5’ – 3’) GGi VVi GTi GGi WSi GGi AAR TCi AC
Zucchini yellow mosaic virus GGA GCA GTG GGT TCT GGA AAA TCA AC
Dasheen mosaic virus GGT GCT GTC GGG TCT GGT AAG TCG AC
Potato virus A GGA GCA GTT GGT TCT GGC AAA TCA AC
Clover yellow vein virus GGG GCT GTT GGA TCA GGA AAA TCG AC
Lily mottle virus GGT GCT GTT GGA TCT GGA AAG TCG AC
Papaya ringspot virus GGA GCT GTT GGT AGT GGT AAA TCA AC
Lettuce mosaic virus GGT GGT GTC GGC TCC GGC AAG TCT AC
Potato virus Y GGA GCT GTT GGG TCT GGA AAG TCA AC
Maize dwarf mosaic virus GGA GCA GTC GGT TCG GGA AAA TCA AC
Sugarcane mosaic virus GGA GCT GTT GGA TCA GGA AAA TGC AC
Johnsongrass mosaic virus GGC AAC GTA GGA TCT GGG AAA TCA AC
Cocksfoot streak virus GGA CCG GTC GGT TCC GGT AAA TCG TC
Số suy biến 3 3 2 2 2
Tổng số mồi trong hỗn hợp
mồi (dùng inosin2) 3 x3 x 2 x 2 x 2 = 54
Tổng số mồi trong hỗn hợp
mồi (nếu không dùng inosin) 4x2x2x4x4x4x2x2x4x4x2x4 = 524288
HcPro VPg 6K1 P1 P3 CI NIb NIa CP 6K2
3‘ UTR 5‘ UTR
poly A
CIFor
112
Chương 9. Công nghệ huyết thanh học trong chẩn đoán
1. Cơ sở của phản ứng huyết thanh học
2.3. Các khái niệm
Cơ sở của phương pháp huyết thanh học là dựa vào sự tương tác đặc hiệu giữa kháng
nguyên và kháng thể đặc hiệu với kháng nguyên đó
2.3.1 Kháng nguyên (antigen):
Kháng nguyên thường là các đại phân tử chứa protein hoặc polysaccharide. Kháng nguyên
phải có hai đặc tính quan trọng: (1) hoạt tính sinh miễn dịch tức khả năng kích thích động vật
máu nóng hình thành kháng thể đặc hiệu và (2) tính đặc hiệu tức khả năng liên kết với kháng
thể đặc hiệu tương ứng. Một số chất có trọng lượng phân tử thấp như các amino acid, một số
loại polysaccharide... không có hoạt tính sinh miễn dich nhưng lại có khả năng liên kết với
kháng thể đặc hiệu với kháng nguyên có chứa các chất này. Các chất đó được gọi là bán
kháng nguyên (hapten).
2.3.2 Nhóm quyết định kháng nguyên (epitope)
Trên bề mặt kháng nguyên có các vùng đặc biệt có chức năng cảm ứng hình thành kháng
thể và là vị trí liên kết kháng thể. Các vùng này được gọi là các nhóm quyết định kháng
nguyên (epitope).
Một nhóm quyết định kháng nguyên chỉ kích thích hệ miễn dịch của động vật máu nóng
hình thành một dòng phân tử kháng thể. Kháng nguyên chứa một nhóm quyết định kháng
nguyên gọi là kháng nguyên đơn giá, chứa nhiều nhóm quyết định kháng nguyên gọi là kháng
nguyên đa giá.
Các epitope có thể được chia thành:
epitope trình tự: chỉ phụ thuộc trình tự amino acid
epitope hình thái: phụ thuộc vào cả cấu trúc không gian
epitope liên tục: là một chuỗi amino acid liên tục
epitope không liên tục: là các amino acid không liền nhau (trên chuỗi cấp 1) nhưng do sự
gấp của protein nên xắp xếp gần nhau dẫn tới cùng nhau tạo thành 1 epitope
2.3.3 Kháng nguyên của tác nhân gây bệnh cây
Virus. Đối với vi rusTrừ một vài ngoại lệ, phần có hoạt tính sinh miễn dich của virus thực
vật là vỏ protein. Các virus thực vật là các kháng nguyên đa giá do vỏ protein của chúng có
chứa nhiều điểm quyết định kháng nguyên.
Vi khuẩn. Tế bào vi khuẩn có thể có nhiều loại kháng nguyên như protein, polysacaride.
Lông roi của vi khuẩn là một loại kháng nguyên tốt gọi là kháng nguyên H. Các chất từ vách
tế bào vi khuẩn có hoạt tính kháng nguyên được gọi là kháng nguyên O.
2.3.4 Kháng thể (antibody)
Sự hình thành kháng thể: Hệ thống miễn dịch của cơ thể động vật máu nóng bao gồm
các cơ quan có thẩm quyền miễn dịch và các tế bào có thẩm quyền miễn dịch. Các cơ quan có
thẩm quyền miễn dịch (tuyến ức, lách, tủy...) là nơi sản sinh, duy trì, biệt hoá và điều khiển sự
hoạt động của các tế bào có thẩm quyền miễn dịch. Các tế bào có thẩm quyền miễn dịch (chủ
yếu gồm 2 loại là lympho bào B và lympho bào C) tham gia vào quá trình đáp ứng miễn dịch
của cơ thể nhằm chống lại các tác nhân lạ xâm nhập. Có 2 kiểu đáp ứng miễn dịch:
113
Kiểu đáp ứng miễn dịch dịch thể: Khi kháng nguyên xâm nhập vào cơ thể, bị đại thực bào
vây bắt, xử lý và trình diện cho lympho bào B. Lympho bào B được biệt hoá thành tế bào
plasma sản xuất ra kháng thể dịch thể. Kháng thể dịch thể tồn tại trong dịch cơ thể (huyết
tương) và sẽ kết hợp đặc hiệu với kháng nguyên.
Kiểu đáp ứng miễn dịch tế bào: Khi kháng nguyên xâm nhập vào cơ thể, bị đại thực bào
vây bắt, xử lý và trình diện cho lympho bào T. Lympho bào T được biệt hoá thành lympho
bào T mẫn cảm kháng nguyên và chính bản thân chúng là kháng thể tế bào. Kháng thể tế
bào tồn tại trên bề mặt tế bào và cũng kết hợp đặc hiệu với kháng nguyên.
Như vậy, theo nghĩa rộng, kháng thể là bất kỳ phân tử nào có khả năng liên kết đặc
hiệu với kháng nguyên. Tuy nhiên, kháng thể sử dụng trong chẩn đoán bằng kỹ thuật
huyết thanh học chính là các kháng thể dịch thể
Kháng thể dịch thể là các globulin miễn dịch (Immunoglobulin-Ig). Có 5 lớp Ig là
IgG, IgM, IgA, IgD và IgE nhưng trong chẩn đoán huyết thanh học, thường chỉ sử dụng
IgG.
Cấu tạo của IgG (xem hình vẽ): gồm 4 phân tử polypeptid (2 chuỗi nặng, 2 chuỗi nhẹ)
liên kết với nhau bằng các cầu nối disulfide. Phân tử IgG có 3 vùng chức năng chính (có
thể tách được bằng một enzym protease là papain)
Hai mảnh Fab (antigen binding fragment) giống nhau về cấu trúc và mang tính chất
kháng thể do chứa vị trí liên kết với kháng nguyên. Các mảnh Fab, khi được tách ra
bằng papain, sẽ vẫn giữ nguyên hoạt tính kháng thể nhưng không thể tạo ra phản ứng
kết tủa hoặc phản ứng ngưng kết.
Một mảnh Fc (cristallizable fragment) không có hoạt tính kháng thể nhưng chứa nhóm
quyết định kháng nguyên của phân tử IgG do vậy khi tiêm phân tử IgG nguyên vẹn
hoặc chỉ cần mảnh Fc từ 1 loài (chẳng hạn thỏ) sang 1 loài khác (chẳng hạn dê) thì loài
thứ 2 sẽ vẫn tạo ra kháng thể đặc hiệu kháng thể của loài thứ nhất (anti-antibody). Đây
là cơ sở cho các kiểu ELISA gián tiếp.
2.4. Kháng thể đơn dòng và kháng thể đa dòng
Kháng thể đơn dòng (Monoclonal antibody (MAb)
Hình. Cấu trúc kháng
thể IgG
114
Là kháng thể được hình thành chỉ từ một dòng lympho bào B
Nhận biết và liên kết với chỉ 1 epitope
Sản xuất phức tạp
Kháng thể đa dòng (Polyclonal antibody (PAb)
Là một hỗn hợp của các kháng thể đơn dòng
Sản xuất đơn giản. Việc sản xuất chỉ bao gồm tiêm kháng nguyên (phân tử virus, protein
virus, protein vi khuẩn, nấm…) vào động vật máu nóng (như thỏ, dê, chuột…) và thu
kháng huyết thanh. Kháng huyết thanh sẽ chứa một hỗn hợp nhiều loại kháng thể, mỗi loại
đặc hiệu cho 1 epitope.
3. Sản xuất kháng thể đơn dòng
3.1. Các bước chính để sản xuất kháng thể đơn dòng gồm
1. Gây miễn dịch trên chuột. Bước này giống như sản xuất kháng thể đa dòng.
2. Dung hợp (lai) tế bào myeloma chuột và tế bào lá lách chuột đã gây miễn dịch.
Nuôi cấy một dòng tế bào myeloma chuột. Tế bào myeloma là một loại tế bào bạch
cầu bị ung thư nên có 2 đặc điểm: (1) không thể sản xuất kháng thể và (2) có thể sinh
trưởng vô hạn định. Ngoài ra, vì chúng bị mất chức năng của gen HGPRT
(hypoxantine guanine phosphoribosyl transferase) nên không thể sống được trên môi
trường HTA (Hypoxanthine Aminopterin Thymidine) vì aminopterin trong môi trường
ức chế một đường hướng sinh hóa liên quan đến biểu hiện gen HGPRT.
Tinh chiết tế bào lá lách của chuột đã gây miễn dịch. Dịch tế bào lá lách sẽ chứa
lympho bào B sản xuất kháng thể. Loại tế bào miễn dịch này có thời gian sống ngắn
và không thể sống được trên môi trường nuôi cấy nhân tạo.
Dung hợp các tế bào lá lách với các tế bào myeloma nhờ PEG (polyethylene glycol)
để tạo ra các tế bào lai (hybridoma). Tế bào lai kết hợp đặc điểm của lympho bào B
(tạo kháng thể) và đặc điểm của tế bào myeloma (sinh trưởng vô hạn định trên môi
trường nhân tạo).
Nuôi cấy tế bào lai trong môi trường chọn lọc. Môi trường chọn lọc chứa HTA
(Hypoxanthine Aminopterin Thymidine) không cho phép sự sinh trưởng của các tế
bào không lai.
3. Kiểm tra sự có mặt của Mabs trong dịch nuôi cấy của từng dòng tế bào lai bằng ELISA
4. Nuôi cấy phục hồi từng dòng tế bào lai có kháng thể mong muốn (ELISA +)
5. Tạo kháng thể từ các dòng tế bào lai có kháng thể mong muốn bằng invitro (trên môi
trường nhân tạo hoặc in vivo (trong cơ thể chuột).
115
3.2. Qui trình tạo kháng thể đơn dòng
(của Đại học Cornell, 2008)
3.2.1 Gây miễn dịch trên thỏ
Sử dụng chuột cái, 8-10 tuần tuổi
Gây miễn dịch trên thỏ 3 lần (ngày 0, 14, 21): tiêm 100 uL dịch protein (1-100 ug kháng
nguyên) + 100 uL adjuvant hoàn toàn (complete adjuvant). Lượng kháng nguyên tiêm lần
đầu gấp đôi lượng kháng nguyên tiêm ở các lần sau.
Lấy máu và thu kháng huyết thanh (~100 uL) trước mỗi lần tiêm.
Kiểm tra sự có mặt của kháng thể trong kháng huyết thanh = ELISA sau ngày 21. Giá trị
ELISA nên tăng trong khoảng 100-1000 sau 21 ngày.
Khi chuột đã hình thành đủ kháng thể (thường sau 3 lần tiêm, đôi khi sau 4 lần), tiêm tiếp
kháng nguyên 3 lần (ngày 28, 29,30) nhưng không hòa với adjuvant.
Thực hiện dung hợp vào ngày 31
3.2.2 Dung hợp (lai)
Làm ấm các môi trường và Polyethylen glycol (PEG) 1500 (hãng Roche) tới 37 OC. Các
môi trường gồm:
o Môi trường HAT (Hypoxanthine Aminopterin Thymidine), hãng Sigma
o Môi trường Hyb-SFM (Hybridsoma Serum-Free Medium). Đây là môi trường chứa
insulin, transferrin và chất kháng sinh đỏ phenol) (hãng Invitrogen)
Hình. Sơ đồ qui trình tạo
kháng thể đơn dòng
116
o Môi trường Hyb-SFM +10 % FBS (foetal bovine serum = huyết thanh bào thai bò).
Môi trường này là môi trường nuôi cấy tế bào (hãng Invitrogen)
Chuẩn bị tế bào myeloma. Tế bào myeloma dòng X63-Ag8.653 được nuôi cấy trong môi
trường Hyb+10% FCS (foetal calf serum) khoảng 1 tuần trước khi dung hợp. Tế bào được
nuôi cấy trong đĩa petri (loại 15 cm) chứa 60 mL môi trường nuôi cấy Hyb+10% FCS
trong tủ ấm.
Thu thập – tinh chiết tế bào lá lách chuột đã gây miễn dịch. Giết chuột và đặt trong cốc
thủy tinh chứa ~200 mL Betadine 80% chứa 20% ethanol 70%. Giải phẫu trong điều kiện
vô trùng để lấy lá lách chuột. Lá lách được chuyển sang đĩa Petri chứa 1 mL môi trường
Hyb SFM + 10%FCS. Cắt lá lách thành các mảnh nhỏ và dùng panh vô trùng ép để giải
phóng tế bào lá lách. Rửa tế bào + tàn dư với 2- 3 mL môi trường (~ 4 lần) và chuyển toàn
bộ sang tube 50 mL. Để tube khoảng 1 phút để lắng tàn dư và hút dịch tế bào sang tube
mới. Ly tâm tube 900-1000 rpm trong 5 phút. Loại bỏ dịch trên tủa và hòa cặn tế bào lá
lách trong 20 mL đệm HYB-SFM + 10% FBS.
Đếm tế bào lá lách (cả hòa loãng 1:10 và không hòa loãng).
Đếm số tế bào myeloma X63 (số lượng yêu cầu = 1/2 số lượng tế bào lá lách).
Trộn trực tiếp tế bào lá lách với tế bào X63
Dung hợp
Ly tâm hỗn hợp tế bào 900-1000 rpm /5 phút.
Rửa tế bào với 25 ml môi trường Hyb-SFM medium. Ly tâm, giữ lại cặn tế bào.
Búng nhẹ ống ly tâm để tách rời tế bào. Cho từ từ1.5ml PEG (cho khoảng 3x108 tế bào
hỗn hợp) vào thành ống, tốc độ khoảng 1 mL/phút (cho từ từ để tế bào khỏi bị phồng).
Sau khi cho PEG xong, trộn đều ống bằng lắc nhẹ.
Ủ ống ở 37 OC / 1 phút.
Dùng pipets cho rất từ từ 20 mL môi trường Hyb-SFM (1mL / phút đầu tiên, 3 mL / phút
thứ 2 và 16 mL/phút thứ 3).
Ly tâm.
Hoà cặn tế bào lai trong môi trường HAT và cho vào các đĩa nuôi cấy tế bào loại 24
giếng. Lượng cho là 2 mL /giếng với nồng độ 106 tế bào / giếng.
Bọc các đĩa với màng Saran và ủ trong tủ định ôn với điều kiện 37°C, 5% CO2.
Dòng hóa
Sau khi ủ khảng 10-14 ngày, các dòng tế bào có thể quan sát thấy bằng mắt và môi trường
ở một số giếng bắt đầu chuyển màu vàng nhạt.
Kiểm tra sự hình thành kháng thể bằng ELISA
Ở các giêngs có phản ứng ELISA (+), chuyển từng dòng tế bào sang giếng của đĩa nuôi
cấy loại 96 giếng chứa 150 uL môi trường
Sau khoảng 3 ngày, thử tiếp ELISA cho từng clone
Các clone + sẽ được nuôi cấy lần lượt trên môi trường HAT => HT => Hyb + 10%FCS.
3.2.3 Sản xuất
Kháng thể có thể được sản xuất bằng 2 cách:
Nuôi cấy các dòng tế bào lai trên môi trường nuôi cấy như Hyb-SFM => tạo số lượng ít
117
Nuôi cấy trong cơ thể chuột bằng cách tiêm tế bào lai vào xoang bụng => tạ số lượng
nhiều
4. Kỹ thuật chẩn đoán bằng ELISA
ELISA (Enzyme Linked Immunosorbent Assay) là một kỹ thuật chẩn đoán quan trọng và
phổ biến nhất hiện nay so với các kỹ thuật huyết thanh học khác. Trong bệnh cây, ELISA
được sử dụng chủ yếu để chẩn đoán virus và một số vi khuẩn. Một trong số các hãng nổi tiếng
có bán các kít ELISA chẩn đoán bệnh cây là Agdia (http://www.agdia.com/).
4.1. Vật liệu chính cho ELISA
Bản ELISA: bằng nhựa (polystyrene), 96 giếng, liên kết không đặc hiệu các loại protein
Các loại dung dich đệm: Đệm nghiền mẫu, đệm pha kháng thể, đệm rửa, đệm pha chất
nền (cơ chất).
Kháng thể các loại
Chất nền: nhiều loại, tùy thuộc enzyme, phổ biến nhất là NPP (nytrophenyl phosphate)
Enzyme: nhiều loại, cần cơ chất tương ứng, phổ biến nhất là alkaline phosphatase (cơ chất
tương ứng là NPP)
Máy đọc ELISA: là một loại thiết bị so màu vi phiến nhằm lượng hóa màu phản ứng.
Dụng cụ nghiền, chiết mẫu cây: chày, cối sứ…
4.2. Các kỹ thuật ELISA.
Có rất nhiều kỹ thuật ELISA khác nhau. Dựa vào quan hệ của kháng thể liên kết enzyme
với kháng nguyên, ELISA có thể được chia làm 2 nhóm (xem hình) là:
Nhóm trực tiếp (direct ELISA): Kháng thể liên kết enzyme là kháng thể phát hiện kháng
nguyên (ví dụ các kỹ thuật I, VIII và IX trong sơ đồ).
Nhóm gián tiếp (indirect ELISA): Kháng thể liên kết enzyme không phải là kháng thể
phát hiện kháng nguyên (ví dụ các kỹ thuật II, III, IV, V, VI, VI trong sơ đồ).
ELISA cũng gồm rất nhiều kiểu khác nhau. Hai ví dụ đang được sử dụng tại BM Bệnh
cây là;
Kẹp kép kháng thể (double antibody sandwich = DAS) (tất cả các kỹ thuật ngoài trừ kỹ
thuật II trong sơ đồ)
Bẫy kháng nguyên trước (plate-trapped antigen = PTA) như kỹ thuật II trong sơ đồ.
Hình Các kỹ thuật ELISA khác nhau.
118
Dưới đây là qui trình thử 2 kiểu phản ứng ELISA đại diện cho mỗi nhóm.
4.2.1 Kỹ thuật ELISA trực tiếp kiểu kẹp kép kháng thể (DAS-ELISA)
Cố định IgG đặc hiệu virus vào bản ELISA: IgG được hoà trong dung dịch đệm phủ
(thường là đệm carbonate) và được cho vào giếng với lượng 100l/giếng. Bản ELISA
được ủ trong hộp ẩm ở 37OC khoảng 2-4 giờ. Bản ELISA, thường cấu tạo bằng
polystirene có khả năng liên kết không đặc hiệu với protein do vậy sẽ liên kết với các
phân tử IgG (là protein miễn dịch). Sau khi ủ, giếng được rửa bằng đêm rửa và nước.
Cố định dịch cây vào bản ELISA: Nghiền mẫu cây đệm chiêt mẫu thành dịch cây. Dịch
cây được cho vào giếng với lượng100l/giếng. Bản ELISA được ủ ở 37OC khoảng 2-4 giờ
hoặc qua đêm ở 4-6OC. Nếu trong dịch cây có chứa virus thì virus sẽ liên kết đặc hiệu với
IgG có sẵn trong giếng còn protein của cây hoặc các virus khác sẽ không liên kết. Sau khi
ủ, bản ELISA được rửa như bước 1.
Cố định IgG liên kết enzim: Hoà IgG liên kết enzim (IgG-E) trong đệm liên kết và cho
vào giếng với lượng 100l/giếng. IgG này giống như IgG của bước 1 nhưng chỉ khác là
nó được liên kết từ trước với 1 enzim là Alkaline Phosphatase (AP). Bản ELISA được ủ
và rửa như bước 1.
Cố định chất nền và đánh giá kết quả: Hoà chất nền trong đệm chất nền theo tỷ lệ
0.6mg/ml) và cho giếng với lượng100l/giếng. Chất nền ở đây là Nitrophenyl phosphate
(NPP). Bản ELISA được ủ ở nhiệt độ phòng trong hộp ẩm trong tối 60 phút. Phản ứng hoá
học ở đây là NPP sẽ bị thuỷ phân thành Nitrophenol phosphate dưới sự xúc tác của enzim
AP. Nitrophenol phosphate là chất có màu vàng, do vậy có thể nhận biết được bằng mắt
hoặc bằng máy đọc ELISA (máy so màu). Hiển nhiên, do nồng độ NPP đều giống nhau ở
các giếng nên giếng nào có màu vàng càng đậm chứng tỏ nồng độ enzim càng cao tức
nồng độ virus trong mẫu thử càng cao. Có thể ngừng phản ứng thuỷ phân bằng cách bổ
sung dung dịch NaOH 3M với lượng 25-50 l/giếng.
4.2.2 Phản ứng ELISA gián tiếp kiểu bẫy kháng nguyên trước (PTA-ELISA)
Cố định dịch cây vào bản ELISA: Nghiền mẫu cây trong đệm phủ và cho 100l/giếng. ủ
bản ELISA qua đêm ở 4-6OC trong hộp ẩm. Sáng hôm sau, rửa 3 lần bằng đệm rửa.
Protein của cây và virus trong dịch cây (nếu có) sẽ liên kết không đặc hiệu vào thành
giếng.
Cố định IgG thỏ đặc hiệu virus vào bản ELISA: Hoà IgG đặc hiệu virus trong đệm huyết
thanh và cho 100l/giếng. ủ bản ELISA ở 25OC 1-2 giờ trong hộp ẩm. Rửa bản ELISA
như bước 1.
Cố định IgG đặc hiệu IgG thỏ liên kết AP vào bản ELISA: Hoà IgG đặc hiệu IgG thỏ
liên kết AP trong đệm liên kết và cho 100l/giếng. ủ bản ở 25OC 1-2 giờ. IgG liên kết AP
thứ 2 này là IgG được tạo ra khi tiêm IgG của thỏ vào 1 loài động vật khác thỏ (chẳng hạn
dê) nên không liên kết với virus mà liên kết với IgG thỏ đặc hiệu virus ở bước 2. Sau khi
ủ, rửa bản như bước 1
Cố định chất nền vào bản ELISA: Thực hiện tương tự như ở DAS-ELISA.