24
426 21.1. C¸c ph-¬ng ph¸p míi ® gióp gia t¨ng tèc ®é gi¶i tr×nh tù c¸c hÖ gen 21.2. C¸c nhµ khoa häc øng dông tin sinh häc ®Ó ph©n tÝch c¸c hÖ gen vµ chøc n¨ng cña chóng 21.3. C¸c hÖ gen kh¸c nhau vÒ kÝch cì, sè gen vµ mËt ®é gen 21.4. Sinh vËt nh©n thËt ®a bµo cã nhiÒu ADN kh«ng m hãa vµ nhiÒu hä ®a gen 21.5. LÆp ®o¹n, t¸i s¾p xÕp vµ ®ét biÕn trong tr×nh tù ADN ®ãng gãp vµo qu¸ tr×nh tiÕn hãa 21.6. So s¸nh c¸c tr×nh tù hÖ gen cung cÊp b»ng chøng vÒ c¸c qu¸ tr×nh tiÕn hãa vµ ph¸t triÓn g-êi phô n÷ trªn Hinh 21.1 vμ con tinh tinh bªn c¹nh c« ®ang c-êi ®ïa víi nhau – cã thËt vËy kh«ng? Hä cã hiÓu nh÷ng “c©u ®ïa giìn” vμ ®¸p l¹i b»ng vÎ mÆt cïng víi c¸c tiÕng ph¸t ©m cña nhau kh«ng? Nhê nh÷ng kü thuËt ®-îc ph¸t triÓn gÇn ®©y trong viÖc gi¶i tr×nh tù nhanh toμn bé c¸c hÖ gen, giê ®©y chóng ta cã thÓ tuyªn bè vÒ c¬ së di truyÒn liªn quan ®Õn c¸c c©u hái hÊp dÉn nh- võa ®-îc nªu. Tinh tinh (Pan troglodytes) lμ loμi cã quan hÖ sèng gÇn chóng ta nhÊt trªn c©y tiÕn hãa cña sù sèng. HÖ gen cña nã ®-îc gi¶i tr×nh tù hoμn toμn vμo n¨m 2005, nghÜa lμ kho¶ng 2 n¨m sau khi viÖc gi¶i tr×nh tù hÖ gen ng-êi hoμn thμnh phÇn lín. Giê ®©y chóng ta ®· cã thÓ so s¸nh hÖ gen cña chóng ta víi hÖ gen cña tinh tinh vμ ®èi chiÕu tõng baz¬ nit¬ nh»m lμm s¸ng tá nh÷ng th«ng tin di truyÒn kh¸c nhau nμo ®· dÉn ®Õn c¸c ®Æc ®iÓm kh¸c biÖt gi÷a hai loμi linh tr-ëng nμy. Ngoμi viÖc ®· x¸c ®Þnh ®-îc tr×nh tù hÖ gen ®Çy ®ñ cña ng-êi vμ tinh tinh, c¸c nhμ nghiªn cøu còng ®· thu ®-îc tr×nh tù hÖ gen ®Çy ®ñ cña vi khuÈn E. coli vμ nhiÒu loμi sinh vËt nh©n s¬ kh¸c, còng nh- cña mét sè loμi sinh vËt nh©n thËt, bao gåm Saccharomyces ceriviseae (nÊm men bia), Caenorhabitis elegans (mét loμi giun trßn), Drosophila melanogaster (ruåi giÊm), Mus musculus (chuét b¹ch) vμ Macaca mulatta (khØ rhezut). ThËm chÝ c¸c ph©n ®o¹n ADN tõ c¸c loμi ®· bÞ tuyÖt chñng, nh- gÊu hang (Ursus spelaneus) hay voi mamót l«ng (Mammuthus primigenius) còng ®· ®-îc gi¶i tr×nh tù. C¸c tr×nh tù hÖ gen ®Çy ®ñ hoÆc tõng phÇn b¶n th©n chóng lμ ®èi t-îng ®-îc quan t©m nghiªn cøu, ®ång thêi chóng cung cÊp nh÷ng th«ng tin s©u h¬n vÒ tiÕn hãa vμ nhiÒu qu¸ tr×nh sinh häc kh¸c. B»ng viÖc më réng so s¸nh hÖ gen ng-êi vμ tinh tinh víi c¸c loμi linh tr-ëng kh¸c còng nh- víi c¸c loμi ®éng vËt cã quan hÖ di truyÒn xa h¬n, chóng ta cã thÓ t×m thÊy tËp hîp c¸c gen quy ®Þnh sù kh¸c biÖt râ rÖt cña mçi nhãm sinh vËt. Xa h¬n mét chót, sù so s¸nh víi c¸c hÖ gen vi khuÈn, vi khuÈn cæ (archaea), nguyªn sinh ®éng vËt vμ c¸c loμi thùc vËt sÏ gióp chóng ta lμm s¸ng tá lÞch sö tiÕn hãa l©u dμi liªn quan ®Õn c¸c gen ®-îc c¸c loμi cïng nhau “chia sΔ cïng víi c¸c s¶n phÈm cña chóng. Víi viÖc hÖ gen cña nhiÒu loμi ®· ®-îc gi¶i tr×nh tù ®Çy ®ñ, c¸c nhμ khoa häc cã thÓ nghiªn cøu c¸c tËp hîp gen hoμn chØnh vμ sù t-¬ng t¸c cña chóng theo mét h-íng nghiªn cøu ®-îc gäi hÖ gen häc (genomics). C¸c nç lùc gi¶i tr×nh tù theo h-íng nghiªn cøu nμy ®· vμ ®ang tiÕp tôc t¹o ra nh÷ng khèi d÷ liÖu khæng lå. Nhu cÇu cÇn xö lý mét l-îng th«ng tin trμn ngËp ®ang t¨ng lªn nhanh chãng ®· dÉn ®Õn sù h×nh thμnh cña lÜnh vùc tin sinh häc (bioinformatics), lÜnh vùc øng dông c¸c ph-¬ng ph¸p khoa häc m¸y tÝnh vμo viÖc l-u gi÷ vμ ph©n tÝch c¸c sè liÖu sinh häc. Chóng ta sÏ b¾t ®Çu ch-¬ng nμy b»ng viÖc th¶o luËn vÒ hai h-íng nghiªn cøu, gåm c¸c kü thuËt gi¶i tr×nh tù hÖ gen vμ mét sè tiÕn bé trong viÖc øng dông tin sinh häc. Sau ®ã chóng ta sÏ s¬ l-îc vÒ nh÷ng hiÓu biÕt thu nhËn ®-îc tõ viÖc gi¶i tr×nh tù c¸c hÖ gen ®· ®-îc tiÕn hμnh ®Õn nay. Sau ®ã chóng ta sÏ m« t¶ vÒ thμnh phÇn hÖ gen ng-êi nh- mét hÖ gen ®¹i diÖn cho c¸c sinh vËt nh©n thËt ®a bμo. Cuèi cïng, chóng ta sÏ cïng t×m hiÓu nh÷ng quan ®iÓm vÒ qu¸ tr×nh tiÕn hãa vμ c¸c c¬ chÕ ph¸t triÓn vèn lμ c¬ së t¹o nªn sù ®a d¹ng vÜ ®¹i cña sù sèng hiÖn cã trªn Tr¸i §Êt. N C¸c kh¸i niÖm chÝnh Tæng quan §äc c¸c l¸ trªn c©y sù sèng H×nh 21.1 Th«ng tin nμo trong hÖ gen ®· t¹o nªn con ng-êi vμ tinh tinh ? C¸c hÖ gen vμ sù tiÕn hãa cña chóng

Các hệ gen và sự tiến hóa của chúng

Embed Size (px)

Citation preview

426

21.1. C¸c ph−¬ng ph¸p míi ®� gióp gia t¨ng tèc ®é gi¶i tr×nh tù c¸c hÖ gen

21.2. C¸c nhµ khoa häc øng dông tin sinh häc ®Ó ph©n tÝch c¸c hÖ gen vµ chøc n¨ng cña chóng

21.3. C¸c hÖ gen kh¸c nhau vÒ kÝch cì, sè gen vµ mËt ®é gen

21.4. Sinh vËt nh©n thËt ®a bµo cã nhiÒu ADN kh«ng m� hãa vµ nhiÒu hä ®a gen

21.5. LÆp ®o¹n, t¸i s¾p xÕp vµ ®ét biÕn trong tr×nh tù ADN ®ãng gãp vµo qu¸ tr×nh tiÕn hãa

21.6. So s¸nh c¸c tr×nh tù hÖ gen cung cÊp b»ng chøng vÒ c¸c qu¸ tr×nh tiÕn hãa vµ ph¸t triÓn

g−êi phô n÷ trªn Hinh 21.1 vµ con tinh tinh bªn c¹nh c« ®ang c−êi ®ïa víi nhau – cã thËt vËy kh«ng? Hä cã hiÓu nh÷ng “c©u ®ïa giìn” vµ ®¸p l¹i b»ng vÎ mÆt cïng

víi c¸c tiÕng ph¸t ©m cña nhau kh«ng? Nhê nh÷ng kü thuËt ®−îc ph¸t triÓn gÇn ®©y trong viÖc gi¶i tr×nh tù nhanh toµn bé c¸c hÖ gen, giê ®©y chóng ta cã thÓ tuyªn bè vÒ c¬ së di truyÒn liªn quan ®Õn c¸c c©u hái hÊp dÉn nh− võa ®−îc nªu. Tinh tinh (Pan troglodytes) lµ loµi cã quan hÖ sèng gÇn

chóng ta nhÊt trªn c©y tiÕn hãa cña sù sèng. HÖ gen cña nã ®−îc gi¶i tr×nh tù hoµn toµn vµo n¨m 2005, nghÜa lµ kho¶ng 2 n¨m sau khi viÖc gi¶i tr×nh tù hÖ gen ng−êi hoµn thµnh phÇn lín. Giê ®©y chóng ta ®· cã thÓ so s¸nh hÖ gen cña chóng ta víi hÖ gen cña tinh tinh vµ ®èi chiÕu tõng baz¬ nit¬ nh»m lµm s¸ng tá nh÷ng th«ng tin di truyÒn kh¸c nhau nµo ®· dÉn ®Õn c¸c ®Æc ®iÓm kh¸c biÖt gi÷a hai loµi linh tr−ëng nµy. Ngoµi viÖc ®· x¸c ®Þnh ®−îc tr×nh tù hÖ gen ®Çy ®ñ cña

ng−êi vµ tinh tinh, c¸c nhµ nghiªn cøu còng ®· thu ®−îc tr×nh tù hÖ gen ®Çy ®ñ cña vi khuÈn E. coli vµ nhiÒu loµi sinh vËt nh©n s¬ kh¸c, còng nh− cña mét sè loµi sinh vËt nh©n thËt, bao

gåm Saccharomyces ceriviseae (nÊm men bia), Caenorhabitis elegans (mét loµi giun trßn), Drosophila melanogaster (ruåi giÊm), Mus musculus (chuét b¹ch) vµ Macaca mulatta (khØ rhezut). ThËm chÝ c¸c ph©n ®o¹n ADN tõ c¸c loµi ®· bÞ tuyÖt chñng, nh− gÊu hang (Ursus spelaneus) hay voi mamót l«ng (Mammuthus primigenius) còng ®· ®−îc gi¶i tr×nh tù. C¸c tr×nh tù hÖ gen ®Çy ®ñ hoÆc tõng phÇn b¶n th©n chóng lµ ®èi t−îng ®−îc quan t©m nghiªn cøu, ®ång thêi chóng cung cÊp nh÷ng th«ng tin s©u h¬n vÒ tiÕn hãa vµ nhiÒu qu¸ tr×nh sinh häc kh¸c. B»ng viÖc më réng so s¸nh hÖ gen ng−êi vµ tinh tinh víi c¸c loµi linh tr−ëng kh¸c còng nh− víi c¸c loµi ®éng vËt cã quan hÖ di truyÒn xa h¬n, chóng ta cã thÓ t×m thÊy tËp hîp c¸c gen quy ®Þnh sù kh¸c biÖt râ rÖt cña mçi nhãm sinh vËt. Xa h¬n mét chót, sù so s¸nh víi c¸c hÖ gen vi khuÈn, vi khuÈn cæ (archaea), nguyªn sinh ®éng vËt vµ c¸c loµi thùc vËt sÏ gióp chóng ta lµm s¸ng tá lÞch sö tiÕn hãa l©u dµi liªn quan ®Õn c¸c gen ®−îc c¸c loµi cïng nhau “chia sΔ cïng víi c¸c s¶n phÈm cña chóng. Víi viÖc hÖ gen cña nhiÒu loµi ®· ®−îc gi¶i tr×nh tù ®Çy ®ñ,

c¸c nhµ khoa häc cã thÓ nghiªn cøu c¸c tËp hîp gen hoµn chØnh vµ sù t−¬ng t¸c cña chóng theo mét h−íng nghiªn cøu ®−îc gäi lµ hÖ gen häc (genomics). C¸c nç lùc gi¶i tr×nh tù theo h−íng nghiªn cøu nµy ®· vµ ®ang tiÕp tôc t¹o ra nh÷ng khèi d÷ liÖu khæng lå. Nhu cÇu cÇn xö lý mét l−îng th«ng tin trµn ngËp ®ang t¨ng lªn nhanh chãng ®· dÉn ®Õn sù h×nh thµnh cña lÜnh vùc tin sinh häc (bioinformatics), lÜnh vùc øng dông c¸c ph−¬ng ph¸p khoa häc m¸y tÝnh vµo viÖc l−u gi÷ vµ ph©n tÝch c¸c sè liÖu sinh häc. Chóng ta sÏ b¾t ®Çu ch−¬ng nµy b»ng viÖc th¶o luËn vÒ hai

h−íng nghiªn cøu, gåm c¸c kü thuËt gi¶i tr×nh tù hÖ gen vµ mét sè tiÕn bé trong viÖc øng dông tin sinh häc. Sau ®ã chóng ta sÏ s¬ l−îc vÒ nh÷ng hiÓu biÕt thu nhËn ®−îc tõ viÖc gi¶i tr×nh tù c¸c hÖ gen ®· ®−îc tiÕn hµnh ®Õn nay. Sau ®ã chóng ta sÏ m« t¶ vÒ thµnh phÇn hÖ gen ng−êi nh− mét hÖ gen ®¹i diÖn cho c¸c sinh vËt nh©n thËt ®a bµo. Cuèi cïng, chóng ta sÏ cïng t×m hiÓu nh÷ng quan ®iÓm vÒ qu¸ tr×nh tiÕn hãa vµ c¸c c¬ chÕ ph¸t triÓn vèn lµ c¬ së t¹o nªn sù ®a d¹ng vÜ ®¹i cña sù sèng hiÖn cã trªn Tr¸i §Êt.

N

C¸c kh¸i niÖm chÝnh

Tæng quan

§äc c¸c l¸ trªn c©y sù sèng

� H×nh 21.1 Th«ng tin nµo trong hÖ gen ®· t¹o nªn con ng−êi vµ tinh tinh ?

C¸c hÖ gen vµ sù tiÕn hãa cña chóng

Ch−¬ng 21 C¸c hÖ gen vµ sù tiÕn hãa cña chóng 427

ViÖc gi¶i tr×nh tù hÖ gen ng−êi, mét dù ¸n tham väng víi tªn gäi Dù ¸n HÖ gen Ng−êi (HGP) ®−îc b¾t ®Çu vµo n¨m 1990. §−îc tæ chøc thµnh mét Tæ hîp (conxoocxi«m) gåm nhiÒu nhµ khoa häc quèc tÕ ®−îc céng ®ång tµi trî, dù ¸n ®· ®−îc triÓn khai ë 20 trung t©m gi¶i tr×nh tù lín thuéc 6 quèc gia bªn c¹nh nhiÒu phßng thÝ nghiÖm nhá thùc hiÖn c¸c nh¸nh cña dù ¸n. Sau khi viÖc gi¶i tr×nh tù hÖ gen ng−êi ®−îc hoµn thµnh

phÇn lín vµo n¨m 2003, tr×nh tù cña mçi nhiÔm s¾c thÓ ®· ®−îc ph©n tÝch kü l−ìng vµ ®−îc m« t¶ trong hµng lo¹t c¸c bµi b¸o khoa häc, trong ®ã bµi b¸o cuèi cïng liªn quan ®Õn tr×nh tù cña nhiÔm s¾c thÓ sè 1 ®−îc c«ng bè vµo n¨m 2006. Víi kÕt qu¶ nµy, c¸c nhµ nghiªn cøu coi viÖc gi¶i tr×nh tù hÖ gen ng−êi ®· “chÝnh thøc hoµn thµnh”. §Ó ®¹t ®−îc nh÷ng cét mèc ®ã, dù ¸n ®· ®−îc triÓn khai qua ba giai ®o¹n víi c¸c ph¸t hiÖn ngµy cµng chi tiÕt h¬n vÒ hÖ gen ng−êi; ba giai ®o¹n ®ã gåm: lËp b¶n ®å liªn kÕt, lËp b¶n ®å vËt lý vµ gi¶i tr×nh tù ADN.

Gi¶i tr×nh tù hÖ gen qua ba giai ®o¹n Tr−íc khi Dù ¸n HÖ gen Ng−êi b¾t ®Çu, c¸c nghiªn cøu tr−íc ®ã ®· ph¸c th¶o ®−îc mét b−íc tranh s¬ bé vÒ tæ chøc hÖ gen cña nhiÒu c¬ thÓ sinh vËt kh¸c nhau. VÝ dô nh−, viÖc ph©n tÝch kiÓu h×nh nhiÔm s¾c thÓ cña nhiÒu loµi ®· cho biÕt sè l−îng nhiÔm s¾c thÓ vµ kiÓu h×nh nhuém b¨ng cña chóng (xem H×nh 13.3). Vµ ®èi víi mét sè gen, vÞ trÝ cña chóng trªn nhiÔm s¾c thÓ ®· ®−îc x¸c ®Þnh bëi ph−¬ng ph¸p lai huúnh quang t¹i chç (FISH), ph−¬ng ph¸p mµ trong ®ã ng−êi ta ®em lai c¸c mÉu dß ph¸t huúnh quang víi c¸c nhiÔm s¾c thÓ nguyªn vÑn ®−îc cè ®Þnh (xem H×nh 15.1). B¶n ®å di truyÒn tÕ bµo ®−îc x©y dùng theo c¸ch nµy ®· cung cÊp nh÷ng th«ng tin khëi ®Çu cho viÖc lËp b¶n ®å chi tiÕt h¬n sau nµy. Khi ®· cã trong tay b¶n ®å di truyÒn tÕ bµo cña c¸c nhiÔm

s¾c thÓ, giai ®o¹n ®Çu tiªn cña tiÕn tr×nh gi¶i tr×nh tù hÖ gen ng−êi lµ x©y dùng mét b¶n ®å liªn kÕt (mét lo¹i b¶n ®å di truyÒn; xem Ch−¬ng 15) cña kho¶ng vµi ngh×n dÊu chuÈn di truyÒn ®−îc ph©n bè kh¾p c¸c nhiÔm s¾c thÓ (Hinh 21.2 giai ®o¹n �). TrËt tù vÞ trÝ cña c¸c dÊu chuÈn vµ kho¶ng c¸ch gi÷a chóng trªn b¶n ®å ®−îc x¸c ®Þnh trªn c¬ së tÇn sè t¸i tæ hîp (xem H×nh 15.11). C¸c dÊu chuÈn di truyÒn cã thÓ lµ c¸c gen hoÆc lµ c¸c ®o¹n tr×nh tù ADN kh¸c cã thÓ x¸c ®Þnh ®−îc, ch¼ng h¹n nh− c¸c RFLP hay c¸c tr×nh tù lÆp l¹i kÕ tiÕp ng¾n (STR) ®· ®−îc ®Ò cËp ë Ch−¬ng 20. TÝnh ®Õn n¨m 1992, c¸c nhµ nghiªn cøu ®· tËp hîp ®−îc mét b¶n ®å liªn kÕt ë ng−êi gåm kho¶ng 5000 dÊu chuÈn kh¸c nhau. Mét b¶n ®å nh− vËy ®· gióp hä x¸c ®Þnh ®−îc vÞ trÝ cña c¸c dÊu chuÈn kh¸c, bao gåm c¶ c¸c gen, b»ng viÖc kiÓm tra tÝnh liªn kÕt di truyÒn cña chóng víi c¸c dÊu chuÈn ®· biÕt tr−íc ®ã. Ngoµi ra, nã cßn cã gi¸ trÞ lµ phÇn cèt lâi cña viÖc lËp b¶n ®å chi tiÕt h¬n t¹i nh÷ng vïng nhÊt ®Þnh trong hÖ gen. Giai ®o¹n tiÕp theo lµ viÖc lËp b¶n ®å vËt lý hÖ gen ng−êi.

Trong b¶n ®å vËt lý, kho¶ng c¸ch gi÷a c¸c dÊu chuÈn ®−îc biÓu diÔn bëi ®¬n vÞ vËt lý, th−êng lµ sè cÆp baz¬ nit¬ (bp) däc theo ph©n tö ADN. §Ó lËp mét b¶n ®å hÖ gen hoµn chØnh, mét b¶n ®å vËt lý ®−îc thiÕt lËp b»ng c¸ch c¾t ph©n tö ADN t−¬ng

øng víi mét nhiÔm s¾c thÓ thµnh mét sè c¸c ph©n ®o¹n giíi h¹n råi x¸c ®Þnh trËt tù cña c¸c ph©n ®o¹n trªn ph©n tö ADN nhiÔm s¾c thÓ gèc. Ch×a khãa ®Ó thùc hiÖn ®iÒu nµy lµ cÇn t¹o ra c¸c ph©n ®o¹n ADN gèi lªn nhau, råi sö dông c¸c mÉu dß hoÆc ph−¬ng ph¸p gi¶i tr×nh tù tù ®éng c¸c tr×nh tù ®Çu cuèi cña nh÷ng ph©n ®o¹n nµy ®Ó t×m ra c¸c tr×nh tù gèi lªn nhau ®ã (H×nh 21.2, giai ®o¹n �). B»ng c¸ch ®ã, cã thÓ ®Æt c¸c ph©n ®o¹n vµo ®óng trËt tù t−¬ng øng cña chóng trªn nhiÔm s¾c thÓ. Nguån cung cÊp c¸c ph©n ®o¹n ADN dïng cho viÖc lËp b¶n

®å vËt lý dùa trªn viÖc nh©n dßng ADN. §Ó gi¶i tr×nh tù c¸c hÖ gen lín, c¸c nhµ khoa häc ph¶i thùc hiÖn lÆp l¹i nhiÒu lÇn c¸c c«ng viÖc c¾t ADN, nh©n dßng vµ lËp b¶n ®å vËt lý. C¸c vect¬ nh©n dßng ®Çu tiªn th−êng ®−îc sö dông lµ nhiÔm s¾c thÓ nh©n t¹o nÊm men (YAC) cho phÐp mang nh÷ng ®o¹n ADN cµi dµi ®Õn hµng triÖu bp, hoÆc nhiÔm s¾c thÓ nh©n t¹o vi khuÈn (BAC) vèn ®iÓn h×nh cã thÓ mang c¸c ®o¹n cµi dµi tõ 100.000 ®Õn 300.000 bp. Sau khi nh÷ng ®o¹n ADN dµi nh− vËy ®· ®−îc x¸c ®Þnh trËt tù trªn nhiÔm s¾c thÓ chÝnh x¸c, chóng sÏ ®−îc c¾t thµnh nh÷ng ph©n ®o¹n nhá h¬n, råi ®−îc nh©n dßng vµo c¸c

21.1 Kh¸i niÖm

C¸c ph−¬ng ph¸p míi ®� gióp gia t¨ng tèc ®é gi¶i tr×nh tù c¸c hÖ gen

� H×nh 21.2 Ph−¬ng ph¸p gi¶i tr×nh tù toµn hÖ gen qua ba giai ®o¹n. B¾t ®Çu tõ mét b¶n ®å di truyÒn tÕ bµo cña mçi nhiÔm s¾c thÓ, c¸c nhµ nghiªn cøu liªn quan ®Õn Dù ¸n HÖ gen Ng−êi ®· tiÕn hµnh c¸c nghiªn cøu qua ba giai ®o¹n ®Ó ®¹t ®−îc môc tiªu cuèi cïng, ®ã lµ gi¶i tr×nh tù toµn bé tõng nucleotide trªn mçi nhiÔm s¾c thÓ.

B¶n ®å di truyÒn tÕ bµo

KiÓu h×nh nhuém b¨ng cña nhiÔm s¾c thÓ vµ vÞ trÝ c¸c gen ®Æc thï ®−îc x¸c ®Þnh b»ng ph−¬ng ph¸p lai insitu (FISH) VÞ trÝ gen ®−îc x¸c

®Þnh b»ng FISH

C¸c b¨ng nhiÔm s¾c thÓ sau khi ®−îc nhuém

B¶n ®å liªn kÕt

X¸c ®Þnh trËt tù cña c¸c dÊu chuÈn di truyÒn nh− RFLP, STR vµ c¸c ®a h×nh di truyÒn kh¸c (kho¶ng 200 dÊu chuÈn trªn mçi nhiÔm s¾c thÓ)

B¶n ®å vËt lý

X¸c ®Þnh trËt tù cña c¸c ph©n ®o¹n lín gèi lªn nhau ®−îc nh©n dßng bëi c¸c vect¬ YAC vµ BAC; sau ®ã lµ trËt tù cña c¸c ®o¹n ng¾n h¬n ®−îc nh©n dßng bëi c¸c vect¬ plasmid vµ phag¬

Gi¶i tr×nh tù ADN

X¸c ®Þnh tr×nh tù cña c¸c nucleotide trªn mçi ®o¹n ng¾n vµ ghÐp nèi c¸c tr×nh tù thµnh phÇn víi nhau thµnh tr×nh tù hÖ gen hoµn chØnh

C¸c dÊu chuÈn di truyÒn

C¸c ®o¹n gèi lªn nhau

428 khèi kiÕn thøc 3 Di truyÒn häc

vect¬ plasmid hoÆc phag¬, tr−íc khi nh÷ng ph©n ®o¹n nhá nµy ®−îc dïng ®Ó gi¶i tr×nh tù chi tiÕt. Môc tiªu cuèi cïng cña viÖc lËp b¶n ®å mét hÖ gen lµ x¸c

®Þnh ®−îc tr×nh tù nucleotide hoµn chØnh cña mçi nhiÔm s¾c thÓ (H×nh 21.2, giai ®o¹n �). §èi víi hÖ gen ng−êi, giai ®o¹n nµy ®−îc thùc hiÖn nhê c¸c m¸y gi¶i tr×nh tù sö dông ph−¬ng ph¸p kÕt thóc chuçi dideoxy ®−îc m« t¶ trªn H×nh 20.12. Ngay c¶ khi ®· ®−îc tù ®éng hãa, viÖc gi¶i tr×nh tù cña toµn bé 3,2 tØ cÆp baz¬ trong bé nhiÔm s¾c thÓ ®¬n béi cña ng−êi vÉn cßn lµ mét th¸ch thøc khñng khiÕp. Trong thùc tÕ, mét ®ét ph¸ chÝnh cña Dù ¸n HÖ gen Ng−êi lµ sù ph¸t triÓn cña c«ng nghÖ gi¶i tr×nh tù nhanh. Nh÷ng c¶i tiÕn kü thuËt ®−îc tÝch lòy qua nhiÒu n¨m ®· “mµi dòa” tõng b−íc cña qui tr×nh kü thuËt vèn tèn nhiÒu thêi gian, vµ nhê vËy tèc ®é gi¶i tr×nh tù ®· ®−îc gia tèc mét c¸ch Ên t−îng. NÕu nh− mét phßng thÝ nghiÖm hiÖu qu¶ cã thÓ gi¶i tr×nh tù ®−îc 1000 bp mçi ngµy vµo nh÷ng n¨m 1980, th× ®Õn n¨m 2000, mçi trung t©m nghiªn cøu thuéc Dù ¸n HÖ gen Ng−êi cã thÓ gi¶i tr×nh tù 1000 bp mçi gi©y trong suèt 24 giê mçi ngµy vµ 7 ngµy mçi tuÇn. C¸c ph−¬ng ph¸p nh− vËy cã thÓ ph©n tÝch rÊt nhanh c¸c vËt liÖu sinh häc vµ t¹o ra c¸c khèi d÷ liÖu khæng lå trong thêi gian ng¾n vµ ®−îc gäi chung lµ c¸c ph−¬ng ph¸p “hiÖu n¨ng cao”. C¸c m¸y gi¶i tr×nh tù tù ®éng lµ mét vÝ dô vÒ c¸c thiÕt bÞ thÝ nghiÖm hiÖu n¨ng cao. Trong thùc tiÔn, ba giai ®o¹n ®−îc m« t¶ trªn H×nh 21.2 gèi

lªn nhau theo mét c¸ch phøc t¹p h¬n m« h×nh gi¶n l−îc võa ®−îc chóng ta ®Ò cËp; tuy vËy, m« h×nh nµy ph¶n ¸nh ®óng chiÕn l−îc nghiªn cøu tæng thÓ ®−îc dïng trong Dù ¸n HÖ gen Ng−êi. Trong qu¸ tr×nh thùc hiÖn dù ¸n, mét chiÕn l−îc kh¸c nh»m gi¶i tr×nh tù hÖ gen ®· xuÊt hiÖn vµ sau ®ã ®−îc ¸p dông réng r·i nhê hiÖu qu¶ cùc kú cao cña nã. PhÇn tiÕp theo, chóng ta ®Ò cËp ®Õn chiÕn l−îc gi¶i tr×nh tù nµy.

Gi¶i tr×nh tù ngÉu nhiªn toµn hÖ gen N¨m 1992, m¹nh d¹n dùa trªn c¸c thµnh tùu míi cña kü thuËt gi¶i tr×nh tù vµ c«ng nghÖ m¸y tÝnh, J. Craig Venter - mét nhµ sinh häc ph©n tö - ®· ph¸t minh ra mét ph−¬ng ph¸p gi¶i tr×nh tù toµn hÖ gen míi. §−îc ®Æt tªn lµ ph−¬ng ph¸p gi¶i tr×nh tù ngÉu nhiªn toµn hÖ gen (hay ph−¬ng ph¸p shotgun), thùc chÊt ph−¬ng ph¸p nµy ®· bá qua c¸c giai ®o¹n lËp b¶n ®å liªn kÕt vµ b¶n ®å vËt lý; thay vµo ®ã, nã b¾t ®Çu ngay b»ng viÖc gi¶i tr×nh tù c¸c ph©n ®o¹n ADN ngÉu nhiªn cña toµn hÖ gen. Sau ®ã, c¸c ch−¬ng tr×nh m¸y tÝnh m¹nh sÏ tiÕn hµnh s¾p xÕp mét sè l−îng lín c¸c ph©n ®o¹n ADN ®· ®−îc gi¶i tr×nh tù, dùa trªn c¸c ®o¹n tr×nh tù ng¾n n»m gèi lªn nhau cña chóng, thµnh mét tr×nh tù liªn tôc duy nhÊt (Hinh 21.3). MÆc dï ban ®Çu bÞ hoµi nghi bëi nhiÒu nhµ khoa häc, gi¸ trÞ

cña ph−¬ng ph¸p Vender trë nªn râ rµng vµo n¨m 1995 khi «ng vµ céng sù c«ng bè hÖ gen cña mét loµi sinh vËt ®−îc gi¶i tr×nh tù hoµn chØnh ®Çu tiªn, ®ã lµ vi khuÈn g©y bÖnh tiªu ch¶y Haemophilus influenza. N¨m 1998, Venter thµnh lËp mét c«ng ty cã tªn lµ Celera Genomics vµ tuyªn bè dù ®Þnh gi¶i tr×nh tù toµn bé hÖ gen ng−êi cña m×nh. N¨m n¨m sau, Cerela Genomics vµ Tæ hîp HGP ®ång thêi th«ng b¸o viÖc gi¶i tr×nh tù hÖ gen ng−êi ®· hoµn thµnh phÇn lín, nghÜa lµ sím h¬n hai n¨m so víi tiÕn ®é dù kiÕn ban ®Çu cña Dù ¸n HÖ gen Ng−êi. C¸c ®¹i diÖn cña Tæ hîp HGP chØ ra r»ng viÖc hoµn thµnh

gi¶i tr×nh tù hÖ gen ng−êi cña Celera ph¶i dùa nhiÒu vµo c¸c b¶n ®å di truyÒn vµ sè liÖu tr×nh tù cña hä, còng nh− c¸c trang thiÕt bÞ mµ hä thiÕt lËp cho dù ¸n ®· hç trî nhiÒu cho c¸c nç lùc

cña Celera. Ng−îc l¹i, Venter còng ®· dïng lý lÏ ®Ó biÖn hé cho hiÖu qu¶ vµ gi¸ thµnh h¹ trong ph−¬ng ph¸p gi¶i tr×nh tù cña Celera, ®ång thêi chØ ra r»ng Tæ hîp HGP còng ®· sö dông c¸c sè liÖu cña hä. Râ rµng c¶ hai ph−¬ng ph¸p ®Òu cã gi¸ trÞ vµ cïng ®ãng gãp vµo viÖc nhanh chãng hoµn thµnh viÖc gi¶i tr×nh tù hÖ gen cña mét sè loµi. HiÖn nay ph−¬ng ph¸p gi¶i tr×nh tù ngÉu nhiªn toµn hÖ gen

®ang ®−îc dïng réng r·i. Theo mét c¸ch ®iÓn h×nh, c¸c ph©n ®o¹n ADN ®−îc nh©n dßng b»ng ba lo¹i vect¬ kh¸c nhau, mçi lo¹i ®−îc cµi mét ph©n ®o¹n x¸c ®Þnh. Kho¶ng c¸ch ®· biÕt gi÷a c¸c ®Çu cña ph©n ®o¹n ADN cµi lµ mét th«ng tin bæ sung gióp m¸y tÝnh cã thÓ s¾p xÕp ®óng c¸c tr×nh tù. Mét nghiªn cøu gÇn ®©y so s¸nh hai chiÕn l−îc gi¶i tr×nh tù ®· chØ ra r»ng ph−¬ng ph¸p shotgun cã thÓ m¾c lçi bá qua mét sè tr×nh tù lÆp l¹i, v× vËy cã thÓ ph¶n ¸nh kh«ng chÝnh x¸c kÝnh th−íc thùc cña hÖ gen vµ cã thÓ bá qua mét sè gen trong nh÷ng vïng nh− vËy trªn nhiÔm s¾c thÓ. C¸c ph−¬ng ph¸p phèi hîp cuèi cïng ®· ®−îc ¸p dông cho hÖ gen ng−êi; trong ®ã ph−¬ng ph¸p shotgun cã tèc ®é nhanh ®−îc hç trî bëi b¶n ®å di truyÒn cña c¸c dßng gen cã lÏ lµ c¸ch h÷u hiÖu nhÊt cho nh÷ng øng dông l©u dµi. §Õn n¨m 2007, vÉn cßn mét phÇn nhá cña hÖ gen ng−êi

ch−a ®−îc gi¶i tr×nh tù. Do sù cã mÆt cña tr×nh tù ADN lÆp l¹i vµ bëi mét sè nguyªn nh©n ch−a biÕt kh¸c, mét sè phÇn nhÊt

C¾t ADN tõ nhiÒu b¶n sao cña mét nhiÔm s¾c thÓ thµnh c¸c ph©n ®o¹n gèi lªn nhau cã chiÒu dµi ®ñ ng¾n ®Ó cã thÓ gi¶i tr×nh tù.

Nh©n dßng mçi ph©n ®o¹n trong c¸c vect¬ plasmid hoÆc phag¬ (xem c¸c H×nh 20.4 vµ 20.5)

Gi¶i tr×nh tù tõng ph©n ®o¹n (xem H×nh 20.12)

Sö dông phÇn mÒm m¸y tÝnh s¾p xÕp c¸c ph©n ®o¹n theo ®óng trËt tù vÞ trÝ cña chóng

� H×nh 21.3 Gi¶i tr×nh tù ngÉu nhiªn toµn hÖ gen. Theo ph−¬ng ph¸p nµy, ®−îc ph¸t triÓn bëi Craig Venter vµ c¸c ®ång nghiÖp t¹i C«ng ty Celera Genomics do chÝnh «ng s¸ng lËp, c¸c ®o¹n ADN ®−îc gi¶i tr×nh tù ngÉu nhiªn, råi sau ®ã chóng ®−îc s¾p xÕp theo ®óng trËt tù vÞ trÝ t−¬ng ®èi víi nhau. H·y so s¸nh ph−¬ng ph¸p nµy víi ph−¬ng ph¸p gi¶i tr×nh tù toµn hÖ gen qua ba giai ®o¹n ®−îc m« t¶ trªn H×nh 21.2.

C¸c ph©n ®o¹n ë giai ®o¹n 2 trªn h×nh nµy ®−îc vÏ n»m r¶i r¸c, trong khi nh÷ng ph©n ®o¹n ë giai ®o¹n 2 trªn H×nh 21.2 ®−îc vÏ n»m theo trËt tù vÞ trÝ. Sù kh¸c biÖt trong c¸ch vÏ nh− vËy ph¶n ¸nh sù kh¸c biÖt gi÷a hai ph−¬ng ph¸p nh− thÕ nµo?.

Ch−¬ng 21 C¸c hÖ gen vµ sù tiÕn hãa cña chóng 429

®Þnh trªn nhiÔm s¾c thÓ cña c¸c c¬ thÓ ®a bµo rÊt khã gi¶i tr×nh tù chi tiÕt bëi c¸c ph−¬ng ph¸p th«ng th−êng. Tho¹t nh×n th× d−êng nh− tr×nh tù hÖ gen cña ng−êi vµ c¸c

sinh vËt kh¸c ®¬n gi¶n chØ lµ nh÷ng tr×nh tù “kh« khèc” cña c¸c nucleotide, nghÜa lµ hµng triÖu c¸c “ch÷ c¸i” A, T, G vµ C s¾p xÕp kÕ tiÕp nhau mét c¸ch “buån ch¸n”. §iÒu cèt yÕu ®Ó l−îng d÷ liÖu khæng lå nµy trë nªn cã nghÜa lµ c¸c ph−¬ng ph¸p ph©n tÝch mµ chóng ta sÏ ®Ò cËp ®Õn ë tiÓu môc tiÕp theo.

Mçi mét trung t©m trong sè kho¶ng 20 trung t©m gi¶i tr×nh tù tham gia dù ¸n HÖ gen Ng−êi ngµy nµy qua ngµy kh¸c ®· t¹o ra mét l−îng khæng lå c¸c tr×nh tù ADN. Khi sè liÖu ngµy cµng ®−îc tÝch lòy, th× nhu cÇu n¶y sinh lµ ph¶i cã c¸ch qu¶n lý vµ theo dâi tÊt c¶ c¸c tr×nh tù ®· ®−îc ph¸t hiÖn. Nhê ®· chuÈn bÞ tõ tr−íc, c¸c nhµ khoa häc vµ c¸c c¬ quan qu¶n lý tham gia Dù ¸n HÖ gen Ng−êi ®· ®Æt ra mét môc tiªu ngay tõ ®Çu lµ thiÕt lËp c¸c ng©n hµng d÷ liÖu, hay cßn gäi lµ c¬ së d÷ liÖu, vµ ngµy cµng hoµn thiÖn c¸c phÇn mÒm ph©n tÝch d÷ liÖu. Nh÷ng c¬ së d÷ liÖu vµ nh÷ng phÇn mÒm nµy sau ®ã ®−îc tËp hîp l¹i vµ cã thÓ dÔ dµng truy cËp vµ sö dông trªn m«i tr−êng Internet. ViÖc hoµn thµnh môc tiªu nµy cña dù ¸n ®· gãp phÇn thóc ®Èy viÖc ph©n tÝch c¸c tr×nh tù ADN nhê t¹o ®iÒu kiÖn cho c¸c céng ®ång khoa häc toµn thÕ giíi cã thÓ tiÕp cËn c¸c tµi nguyªn tin sinh häc, còng nh− thóc ®Èy viÖc truyÒn b¸ vµ trao ®æi c¸c th«ng tin cã liªn quan.

TËp hîp d÷ liÖu ®Ó ph©n tÝch c¸c hÖ gen C¸c c¬ quan ®−îc chÝnh phñ tµi trî thùc hiÖn vai trß thiÕt lËp c¸c c¬ së d÷ liÖu vµ cung cÊp c¸c ph©n mÒm nhê ®ã c¸c nhµ khoa häc cã thÓ ph©n tÝch c¸c d÷ liÖu tr×nh tù hÖ gen. Ch¼ng h¹n, ë Mü, mét ch−¬ng tr×nh hîp t¸c gi÷a Th− viÖn Y häc Quèc gia vµ ViÖn Y häc Quèc gia (NIH) ®· thiÕt lËp nªn Trung t©m Quèc gia vÒ Th«ng tin C«ng nghÖ Sinh häc (NCBI) ®ång thêi duy tr× mét trang Web (www.ncbi.nlm.nih.gov) l−u gi÷ c¸c tµi nguyªn tin sinh häc hÕt søc phong phó. T¹i trang Web nµy, c¸c

®−êng “link” dÉn ®Õn c¸c c¬ së d÷ liÖu, c¸c phÇn mÒm vµ c¸c kho chøa c¸c th«ng tin vÒ c¸c hÖ gen vµ c¸c chñ ®Ò cã liªn quan kh¸c. C¸c trang Web t−¬ng tù còng ®· ®−îc thiÕt lËp bëi Phßng thÝ nghiÖm Sinh häc ph©n tö Ch©u ¢u vµ Ng©n hµng D÷ liÖu ADN NhËt B¶n; ®©y còng chÝnh lµ hai trung t©m nghiªn cøu hÖ gen cïng hîp t¸c víi NCBI. Nh÷ng trang Web lín vµ toµn diÖn nµy cßn ®−îc bæ sung thªm bëi nh÷ng trang Web kh¸c ®−îc duy tr× bëi c¸c phßng thÝ nghiÖm nhá h¬n hoÆc bëi c¸c c¸ nh©n. C¸c trang Web nhá h¬n th−êng cung cÊp c¸c c¬ së d÷ liÖu vµ c¸c phÇn mÒm ®−îc thiÕt kÕ cho c¸c môc ®Ých nghiªn cøu hÑp h¬n, ch¼ng h¹n nh− ®Ó t×m hiÓu vÒ nh÷ng thay ®æi di truyÒn hoÆc trong hÖ gen liªn quan ®Õn mét bÖnh ung th− nhÊt ®Þnh. C¸c c¬ së d÷ liÖu vÒ c¸c tr×nh tù cña NCBI ®−îc gäi chung

lµ Ng©n hµng gen (Genbank). TÝnh tíi th¸ng 8 n¨m 2007, Genbank ®· chøa tr×nh tù cña 76 triÖu ph©n ®o¹n ADN hÖ gen kh¸c nhau, gåm tæng céng 80 tû cÆp baz¬ ! C¸c tr×nh tù trong ng©n hµng gen liªn tôc ®−îc cËp nhËt, vµ −íc tÝnh l−îng d÷ liÖu cña nã cø sau kho¶ng 18 th¸ng l¹i t¨ng lªn gÊp ®«i. Mäi tr×nh tù trong Genbank cã thÓ ®−îc truy xuÊt vµ ph©n tÝch b»ng c¸c ph©n mÒm ë trang Web cña NCBI hoÆc tõ c¸c trang Web kh¸c. Mét ch−¬ng tr×nh phÇn mÒm s½n cã trªn trang Web cña

NCBI, gäi lµ BLAST, cho phÐp bÊt cø ai truy cËp cã thÓ so s¸nh ®−îc mét tr×nh tù ADN nhÊt ®Þnh víi bÊt cø tr×nh tù nµo s½n cã trong Genbank trªn c¬ së ®èi chiÕu tõng cÆp baz¬, qua ®ã t×m thÊy c¸c vïng tr×nh tù gièng nhau gi÷a chóng. Mét phÇn mÒm kh¸c cho phÐp so s¸nh c¸c tr×nh tù protein dù ®o¸n. Ngoµi ra, mét phÇn mÒm thø ba cho phÐp t×m kiÕm mét chuçi axit amin (miÒn) cã chøc n¨ng sinh häc ®· biÕt hoÆc ®ang ®−îc dù ®o¸n tõ mäi tr×nh tù protein s½n cã trong Genbank; ®ång thêi, nã cã thÓ biÓu diÔn m« h×nh kh«ng gian ba chiÒu cña miÒn chøc n¨ng ®ã cïng víi c¸c th«ng tin cã liªn quan phï hîp (xem H×nh 21.4 ë trang sau). ThËm chÝ cßn cã mét ch−¬ng tr×nh phÇn mÒm cã thÓ so s¸nh mét tËp hîp c¸c tr×nh tù, hoÆc lµ c¸c tr×nh tù axit nucleic hoÆc lµ c¸c tr×nh tù polypeptit, vµ biÓu diÔn chóng ë d¹ng c©y tiÕn hãa trªn c¬ së mèi quan hÖ gi÷a c¸c tr×nh tù. (Chóng ta sÏ ®Ò cËp kü h¬n vÒ nh÷ng s¬ ®å nµy ë Ch−¬ng 26). Trang Web cña NCBI còng cßn duy tr× mét c¬ së d÷ liÖu

bao gåm tÊt c¶ c¸c cÊu tróc ba chiÒu cña protein ®· ®−îc x¸c ®Þnh (®Ó tæng quan vÒ ph©n tÝch cÊu tróc protein, xem H×nh 5.25). B»ng phÇn mÒm m¸y tÝnh, ng−êi xem cã thÓ quay nh÷ng cÊu tróc nµy ®Ó cã thÓ quan s¸t protein tõ mäi phÝa. Gi¶ sö mét nhµ nghiªn cøu cã mét tr×nh tù axit amin lµ tr×nh tù ®Çy ®ñ hoÆc mét phÇn cña mét protein ch−a biÕt nµo ®ã, mµ nã l¹i cã tr×nh tù gièng víi mét tr×nh tù axit amin cã cÊu tróc kh«ng gian ®· biÕt. Trong tr−êng hîp nµy, nhµ nghiªn cøu cã thÓ dù ®o¸n cÊu tróc cña protein ch−a biÕt b»ng mét phÇn mÒm, vµ sö dông mét phÇn mÒm kh¸c ®Ó so s¸nh nã víi tÊt c¶ c¸c cÊu tróc protein ®· biÕt. Nh÷ng th«ng tin nµy cã thÓ gióp nhµ nghiªn cøu x¸c ®Þnh ®−îc chøc n¨ng cña protein ch−a biÕt. HiÖn nay, trªn toµn thÕ giíi cã rÊt nhiÒu nguån tµi nguyªn

s½n cã cho c¸c nhµ nghiªn cøu sö dông. B©y giê chóng ta sÏ nãi ®Õn c¸c chñ ®Ò mµ nh÷ng nguån tµi nguyªn nµy ®Ò cËp ®Õn.

X¸c ®Þnh c¸c gen m� hãa protein trong c¸c tr×nh tù ADN B»ng viÖc sö dông c¸c tr×nh tù ADN s½n cã, c¸c nhµ di truyÒn häc cã thÓ nghiªn cøu trùc tiÕp c¸c gen mµ kh«ng nhÊt thiÕt ph¶i pháng ®o¸n vÒ kiÓu gen trªn c¬ së ph©n tÝch kiÓu h×nh nh− trong c¸c nghiªn cøu di truyÒn häc kinh ®iÓn tr−íc ®©y. Tuy vËy, c¸ch tiÕp cËn nµy l¹i cã mét trë ng¹i kh¸c: ®ã lµ viÖc x¸c ®Þnh kiÓu h×nh trªn c¬ së kiÓu gen ®· biÕt. Trªn c¬ së mét tr×nh

21.2 Kh¸i niÖm

C¸c nhµ khoa häc øng dông tin sinh häc ®Ó ph©n tÝch c¸c hÖ gen vµ chøc n¨ng cña chóng

21.1

1. B¶n ®å liªn kÕt vµ b¶n ®å vËt lý cña mét nhiÔm s¾c thÓ kh¸c nhau c¬ b¶n ë ®Æc ®iÓm g× ?

2. XÐt tæng thÓ, ph−¬ng ph¸p lËp b¶n ®å hÖ gen ®−îc dïng trong Dù ¸n HÖ gen Ng−êi vµ ph−¬ng ph¸p gi¶i tr×nh tù ngÉu nhiªn toµn hÖ gen kh¸c nhau nh− thÕ nµo ?

3. Gi¶ sö b¹n quyÕt ®Þnh tiÕn hµnh gi¶i tr×nh tù hÖ gen cña mét loµi chuét ®ång, vèn lµ mét loµi cã quan hÖ gÇn gòi víi loµi chuét thÝ nghiÖm cã tr×nh tù hÖ gen ®· ®−îc x¸c ®Þnh hoµn toµn. T¹i sao tr×nh tù hÖ gen chuét thÝ nghiÖm ®· biÕt ®−a b¹n ®Õn quyÕt ®Þnh chän ph−¬ng ph¸p gi¶i tr×nh tù ngÉu nhiªn toµn hÖ gen thay cho ph−¬ng ph¸p ba giai ®o¹n ? Xem gîi ý tr¶ lêi ë Phô lôc A.

KiÓm tra kh¸i niÖm

®iÒu g× NÕu

430 khèi kiÕn thøc 3 Di truyÒn häc

tù ADN dµi cã trªn c¬ së d÷ liÖu nh− Genbank, b»ng c¸ch nµo chóng ta cã thÓ nhËn ra c¸c gen m· hãa protein vèn ch−a tõng ®−îc biÕt tíi vµ x¸c ®Þnh chøc n¨ng cña chóng? C¸ch th«ng th−êng lµ sö dông mét phÇn mÒm ®Ó t×m kiÕm

trong nh÷ng tr×nh tù nµy sù cã mÆt hay kh«ng cña c¸c tÝn hiÖu khëi ®Çu vµ kÕt thóc phiªn m· hoÆc dÞch m·, hoÆc lµ c¸c vÞ trÝ c¾t - nèi ARN hay c¸c tÝn hiÖu kh¸c th−êng cã ë c¸c gen m· hãa protein. PhÇn mÒm nµy ®ång thêi còng t×m kiÕm c¸c ®o¹n tr×nh tù ng¾n t−¬ng øng víi c¸c tr×nh tù th−êng cã trªn c¸c ph©n tö mARN ®· biÕt. Hµng ngh×n c¸c tr×nh tù nh− vËy, ®−îc gäi lµ c¸c ®o¹n ®¸nh dÊu tr×nh tù biÓu hiÖn hay EST ®−îc thu thËp tõ c¸c tr×nh tù cADN vµ ®−îc m¸y tÝnh tËp hîp l¹i thµnh c¸c c¬ së d÷ liÖu. KiÓu ph©n tÝch nµy cho phÐp x¸c ®Þnh ®−îc c¸c tr×nh tù t−¬ng øng víi c¸c gen m· hãa protein mµ tr−íc ®ã ch−a tõng ®−îc biÕt tíi. Kho¶ng mét nöa sè gen ë ng−êi ®· ®−îc biÕt tõ tr−íc khi dù

¸n hÖ gen ng−êi b¾t ®Çu. VËy ®èi víi nh÷ng gen cßn l¹i, viÖc ph©n tÝch c¸c tr×nh tù ADN b»ng c¸ch nµo cho biÕt chóng lµ c¸c gen ch−a ®−îc biÕt tr−íc ®ã? Manh mèi ®Ó x¸c ®Þnh nh÷ng gen nµy xuÊt ph¸t tõ viÖc so s¸nh tr×nh tù cña c¸c “gen øng cö viªn” (c¸c tr×nh tù ®−îc dù ®o¸n lµ gen) víi tr×nh tù cña c¸c gen ®· biÕt cã nguån gèc tõ c¸c sinh vËt kh¸c b»ng viÖc sö dông c¸c phÇn mÒm ®· ®−îc nh¾c ®Õn ë trªn. Do tÝnh tho¸i hãa cña m· di truyÒn, b¶n th©n tr×nh tù ADN cã thÓ cã møc ®é biÕn ®æi lín

h¬n so víi c¸c tr×nh tù protein t−¬ng øng. V× vËy, víi c¸c nhµ khoa häc quan t©m ®Õn protein, hä th−êng tiÕn hµnh so s¸nh gi÷a tr×nh tù axit amin cña protein pháng ®o¸n víi c¸c tr×nh tù cña c¸c protein ®· biÕt. §«i khi mét tr×nh tù võa míi ®−îc x¸c ®Þnh khíp hoµn toµn

hay mét phÇn víi tr×nh tù cña mét gen hoÆc mét protein mµ chøc n¨ng ®· biÕt râ. VÝ dô nh−, mét phÇn cña mét gen míi cã thÓ khíp víi mét gen ®· biÕt m· hãa cho mét protein kinase, mét protein quan träng tham gia vµo mét con ®−êng truyÒn tÝn hiÖu (xem Ch−¬ng 11), chØ ra nhiÒu kh¶ n¨ng gen míi nµy cã thÓ cã chøc n¨ng t−¬ng tù. Theo mét c¸ch kh¸c, tr×nh tù cña mét gen míi l¹i gièng víi mét tr×nh tù ®· tõng ®−îc biÕt tõ tr−íc nh−ng ch−a râ chøc n¨ng. Mét kh¶ n¨ng kh¸c lµ tr×nh tù míi ®−îc x¸c ®Þnh kh«ng gièng víi bÊt cø mét tr×nh tù nµo ®· tõng ®−îc biÕt ®Õn. §iÒu nµy lµ ®óng ®èi víi Ýt nhÊt mét phÇn ba c¸c gen cña E. coli khi hÖ gen cña vi khuÈn nµy ®−îc gi¶i tr×nh tù. Trong tr−êng hîp cuèi cïng, chøc n¨ng cña protein th−êng ®−îc suy diÔn b»ng viÖc kÕt hîp gi÷a c¸c nghiªn cøu vÒ chøc n¨ng ph©n tö vµ hãa sinh häc. C¸c nghiªn cøu vÒ hãa sinh nh»m x¸c ®Þnh cÊu tróc kh«ng gian ba chiÒu còng nh− c¸c thuéc tÝnh hãa lý cña protein, ch¼ng h¹n nh− c¸c vÞ trÝ liªn kÕt cña protein víi c¸c ph©n tö kh¸c. Trong khi ®ã, c¸c nghiªn cøu vÒ chøc n¨ng ph©n tö th−êng tiÕn hµnh lµm bÊt ho¹t hoÆc lµm gi¶m møc ®é biÓu hiÖn cña c¸c gen míi x¸c ®Þnh råi theo dâi

� H×nh 21.4 C¸c c«ng cô tin sinh häc s½n cã trªn internet. Mét trang web ®−îc Trung t©m Quèc gia Th«ng tin vÒ C«ng nghÖ Sinh häc (Mü) duy tr× cho phÐp c¸c nhµ khoa häc vµ céng ®ång tiÕp cËn c¸c tr×nh tù protein vµ ADN. Trang

web nµy gåm c¶ kÕt nèi tíi mét c¬ së d÷ liÖu cÊu tróc protein - CDD (Conserved Domain Database) gióp t×m vµ m« t¶ nh÷ng miÒn gièng nhau ë c¸c protein cã quan hÖ víi nhau, còng nh− c¸c phÇn mÒm quan s¸t ba chiÒu - Cn3D - cho phÐp

quan s¸t m« h×nh ba chiÒu cña c¸c miÒn cÊu tróc ®· ®−îc x¸c ®Þnh. H×nh ¶nh ®−îc minh häa ë trªn lµ kÕt qu¶ t×m kiÕm c¸c vïng protein gièng víi mét tr×nh tù axit amin t×m thÊy ë mét protein cña d−a hÊu.

Trong cöa sæ nµy, mét phÇn tr×nh tù axit amin tõ mét protein ch−a biÕt ("Query") ë d−a hÊu ®−îc xÕp th¼ng hµng víi c¸c tr×nh tù cña c¸c protein kh¸c mµ ch−¬ng tr×nh m¸y tÝnh t×m thÊy gièng víi nã. C¸c tr×nh tù ë ®©y biÓu diÔn mét miÒn ®−îc gäi lµ WD40. Bèn dÊu hiÖu ®iÓn h×nh cña miÒn nµy ®−îc nhÊn m¹nh b»ng nÒn mµu vµng. (Sù gièng nhau gi÷a c¸c tr×nh tù ®−îc nhËn biÕt chñ yÕu dùa trªn c¸c ®Æc ®iÓm hãa häc cña c¸c axit amin, v× vËy c¸c axit amin ë c¸c vïng ®−îc nhÊn m¹nh kh«ng nhÊt thiÕt gièng nhau hoµn toµn.)

Ch−¬ng tr×nh Cn3D hiÓn thÞ mét m« h×nh ruy b¨ng ba chiÒu cña protein transductin cña bß (protein ®−îc t« b»ng nÒn mµu tÝm nh¹t trong cöa sæ Sequence Aligment Viewer). Protein nµy lµ lo¹i duy nhÊt trong c¸c protein tr×nh diÖn ë ®©y cã cÊu tróc ®· ®−îc x¸c ®Þnh. Sù gièng víi transductin bß cña c¸c protein kh¸c cho thÊy cÊu tróc cña chóng cã thÓ gièng víi m« h×nh ®−îc hiÓn thÞ ë ®©y.

Transductin bß chøa b¶y miÒn WD40; mét trong nh÷ng miÒn nµy ®−îc nhÊn m¹nh b»ng mµu ghi.

C¸c vïng ®−îc t« mµu vµng nµy t−¬ng øng víi c¸c axit amin dÊu hiÖu ®iÓn h×nh ®−îc t« mµu vµng ë cöa sæ bªn trªn.

Cöa sæ nµy hiÓn thÞ th«ng tin vÒ miÒn

WD40 tõ C¬ së d÷ liÖu cÊu tróc protein – CDD.

Ch−¬ng 21 C¸c hÖ gen vµ sù tiÕn hãa cña chóng 431

sù thay ®æi cña kiÓu h×nh, qua ®ã x¸c ®Þnh chøc n¨ng cña gen. ARNi, ®−îc m« t¶ ë Ch−¬ng 20, lµ mét vÝ dô vÒ kü thuËt phßng thÝ nghiÖm ®−îc dïng ®Ó bÊt ho¹t chøc n¨ng cña gen.

T×m hiÓu c¸c gen vµ c¸c s¶n phÈm cña gen ë cÊp ®é sinh häc hÖ thèng Søc m¹nh ®Çy Ên t−îng cña c¸c c«ng cô sinh tin häc vµ m¸y tÝnh cho phÐp c¸c nhµ khoa häc giê ®©y cã thÓ nghiªn cøu toµn bé c¸c gen thuéc c¸c bé nhiÔm s¾c thÓ vµ sù t−¬ng t¸c cña chóng víi nhau, còng nh− cã thÓ so s¸nh hÖ gen tõ c¸c loµi kh¸c nhau. HÖ gen häc lµ mét tµi nguyªn th«ng tin phong phó vµ chuyªn s©u cã thÓ tr¶ lêi c¸c c©u hái c¬ b¶n vÒ c¸ch tæ chøc cña c¸c hÖ gen, vÒ sù ®iÒu hßa sù biÓu hiÖn c¸c gen, vÒ c¸c qu¸ tr×nh sinh tr−ëng vµ ph¸t triÓn, kÓ c¶ tiÕn hãa. Nh÷ng thµnh c«ng trong lÜnh vùc gi¶i tr×nh tù c¸c hÖ gen vµ

kh¶ n¨ng nghiªn cøu toµn bé c¸c gen thuéc c¸c bé nhiÔm s¾c thÓ kh¸c nhau ®· thóc ®Èy c¸c nhµ khoa häc nç lùc nghiªn cøu mét hÖ thèng t−¬ng tù c¸c bé protein ®Çy ®ñ (proteom) ®−îc m· hãa t−¬ng øng bëi c¸c hÖ gen, tõ ®ã h×nh thµnh nªn mét lÜnh vùc nghiªn cøu míi gäi lµ hÖ protein häc (proteomics). C¸c protein, chø kh«ng ph¶i c¸c gen m· hãa chóng, trong thùc tÕ thùc hiÖn phÇn lín c¸c ho¹t ®éng sèng cña tÕ bµo. V× vËy, ®Ó t×m hiÓu sù biÓu hiÖn chøc n¨ng sinh häc cña c¸c tÕ bµo vµ c¬ thÓ, chóng ta ph¶i t×m hiÓu c¸c protein ®−îc t¹o ra khi nµo vµ ë ®©u trong mçi c¬ thÓ, còng nh− viÖc chóng t−¬ng t¸c víi nhau thÕ nµo trong c¸c m¹ng l−íi t−¬ng t¸c ph©n tö.

C¸c hÖ thèng ®−îc t×m hiÓu thÕ nµo: mét vÝ dô C¸c lÜnh vùc hÖ gen häc vµ hÖ protein häc cho phÐp c¸c nhµ sinh häc tiÕn hµnh c¸c nghiªn cøu vÒ sù sèng ë qui m« ngµy cµng réng lín vµ theo xu h−íng toµn cÇu. B»ng viÖc sö dông c¸c c«ng cô mµ chóng ta ®· m« t¶, c¸c nhµ sinh häc ®· b¾t ®Çu tËp hîp c¸c d÷ liÖu vÒ c¸c gen vµ c¸c protein, tøc lµ liÖt kª tÊt c¶ c¸c “cÊu phÇn” tham gia vµo viÖc ®iÒu hµnh c¸c ho¹t ®éng cña tÕ bµo, m« vµ c¬ thÓ. Víi tËp hîp c¸c d÷ liÖu nh− vËy, c¸c nhµ nghiªn cøu cã thÓ chuyÓn mèi quan t©m cña hä tõ mçi cÊu phÇn ®¬n lÎ sang sù biÓu hiÖn chøc n¨ng ë d¹ng tæ hîp gåm nhiÒu cÊu phÇn ë c¸c cÊp ®é cña hÖ thèng sinh häc. Nhí l¹i ë Ch−¬ng 1, chóng ta ®· ®Ò cËp ®Õn “sinh häc hÖ thèng” lµ lÜnh vùc m« h×nh hãa c¸c biÓu hiÖn ho¹t ®éng n¨ng ®éng cña c¸c hÖ thèng sinh häc toµn bé. Mét øng dông c¬ b¶n cña h−íng nghiªn cøu sinh häc hÖ

thèng lµ x¸c ®Þnh ®−îc c¸c m¹ch nèi tiÕp gi÷a c¸c gen vµ c¸c m¹ng l−íi t−¬ng t¸c cña c¸c protein. Ch¼ng h¹n nh−, ®Ó x©y dùng ®−îc s¬ ®å m¹ng l−íi t−¬ng t¸c gi÷a c¸c protein ë ruåi Drosophila nh− ®−îc nªu ë Ch−¬ng 1, c¸c nhµ nghiªn cøu ®· b¾t ®Çu tõ trªn 10.000 b¶n phiªn m· ARN dù ®o¸n. Sau ®ã, b»ng c¸c ph−¬ng ph¸p ph©n tö, hä ®· kiÓm tra sù t−¬ng t¸c gi÷a toµn bé hoÆc mét phÇn c¸c s¶n phÈm protein thu ®−îc c¸c b¶n phiªn m· nµy. B»ng viÖc sö dông c¸c phÐp ph©n tÝch thèng kª ®Ó chän ra c¸c mèi t−¬ng t¸c cã sè liÖu thuyÕt phôc nhÊt, hä ®· t×m ra kho¶ng 4700 lo¹i protein biÓu hiÖn tham gia vµo 4000 mèi t−¬ng t¸c kh¸c nhau. Mét phÇn trong nh÷ng mèi t−¬ng t¸c nµy ®−îc minh häa ë d¹ng s¬ ®å trªn H×nh 21.5; chi tiÕt cã thÓ ®−îc nh×n dÔ h¬n ë hai h×nh phãng to bªn d−íi. §Ó cã thÓ xö lý mét sè lín c¸c d÷ liÖu thu ®−îc vÒ c¸c mèi t−¬ng t¸c protein - protein phøc t¹p thu ®−îc tõ c¸c thÝ nghiÖm nµy, ®ång thêi cã thÓ tæ hîp chóng víi nhau d−íi d¹ng c¸c s¬ ®å m« h×nh, chóng ta cÇn ®Õn c¸c hÖ thèng m¸y tÝnh hiÖu n¨ng cao, c¸c c«ng cô to¸n häc vµ c¸c phÇn mÒm ®−îc ph¸t triÓn míi. Nh− vËy, cã thÓ nãi sinh häc hÖ thèng trong thùc tÕ ®· trë thµnh hiÖn thùc nhê c¸c tiÕn bé cña tin sinh häc.

øng dông sinh häc hÖ thèng trong y häc Dù ¸n Atl¸t HÖ gen Ung th− lµ mét vÝ dô kh¸c vÒ sinh häc hÖ thèng mµ ë ®ã ng−êi ta ®ång thêi tiÕn hµnh ph©n tÝch mét sè lín c¸c gen vµ s¶n phÈm cña gen t−¬ng t¸c víi nhau. Dù ¸n nµy ®Æt d−íi sù chØ ®¹o phèi hîp cña ViÖn Ung th− Quèc gia (Mü)vµ NIH nh»m t×m hiÓu nh÷ng thay ®æi trong c¸c hÖ thèng sinh häc dÉn ®Õn sù ph¸t sinh ung th−. Trong giai ®o¹n 3 n¨m thö nghiÖm dù ¸n (tõ 2007 ®Õn 2010), c¸c nhµ nghiªn cøu tËp trung ph©n tÝch ba lo¹i ung th− lµ ung th− phæi, ung th− buång trøng vµ u nguyªn bµo ®Öm (glioblastoma) th«ng qua viÖc t×m hiÓu sù kh¸c nhau trong tr×nh tù cña c¸c gen vµ sù biÓu hiÖn cña chóng ë c¸c tÕ bµo ung th− so víi c¸c tÕ bµo b×nh th−êng. Mét tËp hîp gåm kho¶ng 2000 gen ë c¸c tÕ bµo ung th− sÏ ®−îc gi¶i tr×nh tù vµo c¸c thêi ®iÓm kh¸c nhau trong qu¸ tr×nh tiÕn triÓn cña bÖnh nh»m t×m ra nh÷ng thay ®æi hoÆc g©y ra do ®ét biÕn hoÆc g©y ra bëi c¸c c¬ chÕ s¾p xÕp l¹i nhiÔm s¾c thÓ kh¸c. NÕu nh÷ng nghiªn cøu nµy thµnh c«ng, chóng sÏ ®−îc më réng ¸p dông ®Ó nghiªn cøu c¸c lo¹i bÖnh ung th− kh¸c.

� H×nh 21.5 Sinh häc hÖ thèng tiÕp cËn c¸c t−¬ng t¸c protein. B¶n ®å t−¬ng t¸c protein tæng thÓ nµy hiÓn thÞ mét tËp hîp con cña c¸c t−¬ng t¸c nhiÒu kh¶ n¨ng nhÊt (®−êng kÎ nèi) tõ 2300 protein (vßng trßn nhá) ë ruåi Drosophila. Ba mµu nÒn kh¸c nhau trªn b¶n ®å t−¬ng øng víi vÞ trÝ chung cña mçi protein: mµu xanh lôc lµ nh©n, xanh lam lµ tÕ bµo chÊt vµ vµng lµ mµng sinh chÊt. C¸c protein ®−îc “m· hãa” b»ng mµu t−¬ng øng víi vÞ trÝ ®Þnh vÞ trong tÕ bµo ®Æc thï cña chóng; vÝ dô, c¸c vßng trßn mµu xanh lôc lµ c¸c protein trong nh©n.

C¸c protein

432 khèi kiÕn thøc 3 Di truyÒn häc

Sinh häc hÖ thèng cã tiÒm n¨ng øng dông to lín trong y häc, mÆc dï hiÖn nay nã míi b¾t ®Çu ®−îc triÓn khai. §Õn nay, ng−êi ta ®· t¹o ra ®−îc c¸c lo¹i chip vi d·y (microarray) lµm b»ng thñy tinh hoÆc silicon chøa phÇn lín c¸c gen ®· biÕt cña ng−êi (H×nh 21.6). Nh÷ng chip nh− vËy ®ang ®−îc sö dông ®Ó ph©n tÝch sù biÓu hiÖn cña c¸c gen ë nh÷ng bÖnh nh©n m¾c c¸c chøng bÖnh ung th− kh¸c nhau vµ mét sè bÖnh lý kh¸c n÷a. Môc ®Ých cuèi cïng cña nh÷ng nghiªn cøu nµy lµ ®Ò ra c¸c ph¸c ®å ®iÒu trÞ phï hîp ®Æc thï víi b¶n chÊt di truyÒn cña mçi bÖnh nh©n vµ ®Æc tr−ng ®èi víi mçi lo¹i bÖnh ung th− mµ hä m¾c ph¶i. C¸ch tiÕp cËn nµy ®· ®¹t ®−îc mét sè thµnh c«ng nhÊt ®Þnh trong viÖc x¸c ®Þnh ®−îc ®Æc tÝnh ë mét sè nhãm bÖnh ung th−. Cuèi cïng, mçi ng−êi chóng ta cã thÓ cã mét “hå s¬ y häc”

cïng víi c¸c tr×nh tù ADN cña m×nh; ®ã lµ mét tËp hîp nhá th«ng tin di truyÒn víi c¸c vïng hÖ gen ®−îc “®¸nh dÊu” cho biÕt xu h−íng mÉn c¶m víi nh÷ng bÖnh nhÊt ®Þnh. Lóc nµy, tiÒm n¨ng øng dông trong phßng tr¸nh vµ ®iÒu trÞ bÖnh ®èi víi mçi ng−êi sÏ thµnh hiÖn thùc. Sinh häc hÖ thèng lµ mét c¸ch tiÕp cËn nghiªn cøu hiÖu qu¶

vÒ c¸c thuéc tÝnh ë cÊp ®é ph©n tö. Tõ Ch−¬ng 1 chóng ta nhí l¹i r»ng, c¸c thuéc tÝnh míi ®−îc t×m thÊy ë cÊp ®é tæ chøc phøc t¹p h¬n th−êng b¾t nguån tõ sù s¾p xÕp c¸c “khèi cÊu tróc” cña cÊp ®é tæ chøc thÊp h¬n. Khi chóng ta hiÓu biÕt ngµy cµng ®Çy ®ñ h¬n vÒ c¸ch s¾p xÕp vµ tæ hîp cña c¸c cÊu phÇn thuéc c¸c hÖ thèng di truyÒn, chóng ta cµng hiÓu biÕt s©u h¬n vÒ ho¹t ®éng cña c¸c c¬ thÓ sèng. PhÇn cßn l¹i cña ch−¬ng nµy sÏ ®Ò cËp ®Õn nh÷ng kiÕn thøc mµ chóng ta ®· häc ®−îc ®Õn nµy nhê c¸c nghiªn cøu thuéc lÜnh vùc hÖ gen häc.

TÝnh ®Õn ®Çu n¨m 2008, viÖc gi¶i tr×nh tù cña trªn 700 hÖ gen ®· hoµn thµnh vµ kho¶ng trªn 2700 hÖ gen kh¸c ®ang tiÕp tôc ®−îc gi¶i tr×nh tù. Trong nhãm c¸c hÖ gen ®· ®−îc gi¶i tr×nh tù hoµn toµn, cã kho¶ng 600 hÖ gen vi khuÈn vµ 50 hÖ gen vi khuÈn cæ. Trong sè 65 loµi sinh vËt nh©n thËt thuéc nhãm nµy cã c¸c loµi ®éng vËt cã x−¬ng sèng, c¸c loµi ®éng vËt kh«ng x−¬ng sèng, c¸c nguyªn sinh ®éng vËt, nÊm vµ thùc vËt. C¸c tr×nh tù hÖ gen ®· ®−îc tÝch lòy chøa ®ùng mét tµi nguyªn th«ng tin phong phó mµ hiÖn nay chóng ta míi b¾t ®Çu khai th¸c. Cho ®Õn nay chóng ta ®· häc ®−îc g× tõ viÖc so s¸nh c¸c hÖ gen ®· ®−îc gi¶i tr×nh tù? Trong môc nµy, chóng ta sÏ xem xÐt c¸c ®Æc tÝnh vÒ kÝch cì hÖ gen, sè gen vµ mËt ®é gen cña chóng. Do xÐt vÒ chi tiÕt, c¸c ®Æc tÝnh nµy rÊt ®a d¹ng, nªn chóng ta chØ nhÊn m¹nh vµo c¸c xu h−íng chung; tuy vËy, bªn c¹nh c¸c xu h−íng chung th× th−êng xuÊt hiÖn c¸c ngo¹i lÖ.

KÝch cì hÖ gen Khi so s¸nh hÖ gen gi÷a ba liªn giíi (vi khuÈn, vi khuÈn cæ vµ sinh vËt nh©n thËt), chóng ta nhËn thÊy mét xu h−íng kh¸c biÖt chung vÒ kÝch cì hÖ gen gi÷a c¸c sinh vËt nh©n s¬ (vi khuÈn vµ vi khuÈn cæ) víi sinh vËt nh©n thËt (B¶ng 21.1). Ngoµi mét sè ngo¹i lÖ, phÇn lín hÖ gen vi khuÈn cã kÝch cì tõ 1 ®Õn 6 triÖu cÆp baz¬ (bp); ch¼ng h¹n nh− hÖ gen cña E. coli lµ 4,6 triÖu bp. HÖ gen cña c¸c vi khuÈn cæ trong phÇn lín tr−êng hîp cã kÝch cì gièng víi hÖ gen vi khuÈn. (Tuy vËy, cÇn ph¶i nhí r»ng míi chØ cã mét sè Ýt hÖ gen vi khuÈn cæ ®· ®−îc gi¶i tr×nh tù hoµn toµn, v× vËy “bøc tranh toµn c¶nh” nµy còng cã thÓ sÏ thay ®æi.) C¸c hÖ gen sinh vËt nh©n thËt cã xu h−íng lín h¬n. HÖ gen cña nÊm men ®¬n bµo Saccharomyces cerevisiae lµ kho¶ng 13 Mb (triÖu cÆp baz¬); trong khi ®ã, phÇn lín c¸c loµi ®éng vËt vµ thùc vËt, tøc lµ c¸c sinh vËt ®a bµo, cã kÝch cì hÖ gen Ýt nhÊt lµ 100 Mb. HÖ gen ruåi giÊm cã kÝch cì lµ 180 Mb, cßn hÖ gen ng−êi lµ 3.200 Mb, nghÜa lµ lín h¬n tõ 500 ®Õn 3000 lÇn so víi mét hÖ gen vi khuÈn ®iÓn h×nh. Bªn c¹nh sù kh¸c biÖt chung gi÷a hÖ gen cña c¸c sinh vËt

nh©n s¬ vµ sinh vËt nh©n thËt, th× viÖc so s¸nh kÝch cì hÖ gen trong ph¹m vi c¸c loµi sinh vËt nh©n thËt l¹i kh«ng ph¶n ¸nh mèi t−¬ng quan cã hÖ thèng gi÷a kÝch cì hÖ gen víi kiÓu h×nh cña c¸c loµi sinh vËt. Ch¼ng h¹n nh−, hÖ gen cña loµi Fritillaria assyriaca, mét loµi hoa thuéc hä lily, cã kÝch cì lµ 120 tØ cÆp baz¬ (120.000 Mb), tøc lµ lín h¬n kho¶ng 40 lÇn so víi hÖ gen ng−êi. Nh−ng cßn kinh ng¹c h¬n lµ hÖ gen mét loµi amip ®¬n bµo, Amoeba dubia, cã kÝch cì kho¶ng 670.000 Mb. (HÖ gen loµi nµy ch−a ®−îc gi¶i tr×nh tù.) Trong ph¹m vi hÑp h¬n, viÖc so s¸nh hÖ gen gi÷a hai loµi c«n trïng cho thÊy hÖ gen cña dÕ (Anabrus simplex) lín h¬n 11 lÇn so víi hÖ gen cña ruåi giÊm (Drosophila melanogaster). KÝch cì hÖ gen còng biÕn ®éng réng trong ph¹m vi mçi nhãm loµi nguyªn sinh ®éng vËt, c«n trïng, l−ìng c− vµ thùc vËt; nh−ng Ýt biÕn ®éng h¬n trong ph¹m vi c¸c loµi thó vµ bß s¸t.

Sè gen Mét xu h−íng kh¸c biÖt t−¬ng tù còng ®óng khi xÐt vÒ sè gen: nghÜa lµ, nh×n chung c¸c vi khuÈn vµ vi khuÈn cæ cã Ýt gen h¬n so víi sinh vËt nh©n thËt. C¸c vi khuÈn vµ vi khuÈn cæ sèng tù

21.3 Kh¸i niÖm

C¸c hÖ gen kh¸c nhau vÒ kÝch cì, sè gen vµ mËt ®é gen

� H×nh 21.6 Mét chip ph©n tÝch gen ng−êi. C¸c ®iÓm nhá chøa ADN ®−îc xÕp thµnh c¸c ®−êng kÎ « trªn b¶n silicon nµy ®¹i diÖn cho hÇu hÕt c¸c gen trong hÖ gen ng−êi. Nhê sö dông chip nµy, c¸c nhµ nghiªn cøu cã thÓ ph©n tÝch cïng lóc møc biÓu hiÖn cña tÊt c¶ c¸c gen, qua ®ã gióp gi¶m l−îng hãa chÊt cÇn dïng tèi ®a ®ång thêi ®¶m b¶o ®iÒu kiÖn ®ång ®Òu cho tÊt c¶ c¸c gen.

21.2

1. Internet cã vai trß nh− thÕ nµo trong c¸c nghiªn cøu hiÖn nay vÒ c¸c hÖ gen häc vµ protein häc ?

2. H·y gi¶i thÝch −u thÕ cña c¸c nghiªn cøu theo h−íng sinh häc hÖ thèng khi t×m hiÓu vÒ ung th− so víi ph−¬ng ph¸p nghiªn cøu ®éc lËp tõng gen vµo mçi thêi ®iÓm.

3. Gi¶ sö b¹n ®ang dïng mét ph−¬ng ph¸p nghiªn cøu di truyÒn kinh ®iÓn ®Ó t×m hiÓu mét tÝnh tr¹ng di truyÒn ë ruåi Drosophila. Cô thÓ, b¹n ®· g©y ®ét biÕn ë ruåi vµ chän läc ra ®−îc c¸c c¸ thÓ cã kiÓu h×nh mµ b¹n quan t©m. Gi¶ thiÕt b¹n còng cã thÓ sö dông c¸c c«ng cô sinh häc ph©n tö ®Ó thu ®−îc vïng ADN mang ®ét biÕn. B¹n sÏ tiÕp tôc ph©n tÝch ®ét biÕn ®ã nh− thÕ nµo ®Ó cã thÓ x¸c ®Þnh ®−îc c¸ch mµ nã liªn quan ®Õn kiÓu h×nh ®−îc quan t©m ?

Xem gîi ý tr¶ lêi ë Phô lôc A.

KiÓm tra kh¸i niÖm

®iÒu g× NÕu

Ch−¬ng 21 C¸c hÖ gen vµ sù tiÕn hãa cña chóng 433

do cã tõ 1500 ®Õn 7500 gen, trong khi sè gen ë c¸c sinh vËt nh©n thËt dao ®éng tõ kho¶ng 5000 gen ë c¸c nÊm ®¬n bµo cho ®Õn Ýt nhÊt 40.000 gen ë mét sè loµi sinh vËt nh©n thËt ®a bµo (xem B¶ng 21.1). Trong ph¹m vi c¸c loµi sinh vËt nh©n thËt, sè gen ë mçi loµi

th−êng thÊp h¬n sè gen ®−îc dù ®o¸n ®¬n thuÇn trªn c¬ së kÝch cì hÖ gen cña chóng. Nh×n vµo B¶ng 21.1, b¹n cã thÓ thÊy hÖ gen giun trßn C. elegans cã kÝch cì lµ 100 Mb vµ chøa kho¶ng 20.000 gen. Trong khi ®ã, hÖ gen Drosophila cã kÝch c¬ gÇn gÊp ®«i (180 Mb), song chØ cã sè gen b»ng kho¶ng hai phÇn ba - tøc lµ, chØ cã 13.700 gen. H·y xem mét vÝ dô kh¸c gÇn gòi h¬n, chóng ta ®Ó ý thÊy hÖ

gen ng−êi chøa 3200 Mb, tøc lµ lín h¬n kho¶ng trªn 10 lÇn so víi c¸c hÖ gen Drosophila vµ C. elegans. Khi Dù ¸n HÖ gen Ng−êi khëi ®éng, trªn c¬ së sè protein ®· biÕt, c¸c nhµ sinh häc mong ®îi sÏ cã kho¶ng tõ 50.000 ®Õn 100.000 gen sÏ ®−îc x¸c ®Þnh sau khi hoµn thµnh viÖc gi¶i tr×nh tù hÖ gen. Däc theo tiÕn tr×nh triÓn khai dù ¸n, sè gen −íc l−îng cã trong hÖ gen ng−êi ®−îc söa ®æi nhiÒu lÇn theo xu h−íng gi¶m dÇn; vµ ®Õn n¨m 2007, sè gen −íc l−îng ®−îc tin cËy h¬n c¶ dõng ë con sè 20.488 gen. Sè l−îng gen t−¬ng ®èi thÊp nµy, chØ gÇn gièng sè gen cã ë loµi giun trßn C. elegans, ®· g©y söng sèt nhiÒu nhµ sinh häc vèn ®· lu«n mong ®îi hÖ gen ng−êi cã nhiÒu gen h¬n. Thuéc tÝnh di truyÒn nµo ®· cho phÐp loµi ng−êi (vµ nhiÒu

loµi ®éng vËt cã x−¬ng sèng kh¸c) tiÕn hãa mµ kh«ng cÇn nhiÒu gen h¬n so víi giun trßn? Mét yÕu tè quan träng ®ã lµ c¸c tr×nh tù m· hãa trong c¸c hÖ gen ®éng vËt cã x−¬ng sèng cã ®Æc ®iÓm “mét vèn bèn lêi” do chóng cã nhiÒu c¸ch c¾t - nèi c¸c b¶n phiªn m· kh¸c nhau. Chóng ta nhí l¹i r»ng qu¸ tr×nh nµy cã thÓ t¹o ra nhiÒu h¬n mét lo¹i protein biÓu hiÖn chøc

n¨ng xuÊt ph¸t tõ mét gen duy nhÊt (xem H×nh 18.11). VÝ dô nh−, hÇu hÕt c¸c gen ë ng−êi ®Òu chøa nhiÒu exon, vµ −íc l−îng cã kho¶ng 75% sè gen gåm nhiÒu exon nµy ®−îc c¾t - nèi Ýt nhÊt b»ng hai c¸ch kh¸c nhau. NÕu chóng ta gi¶ thiÕt mçi gen khi ®−îc c¾t nèi theo c¸c c¸ch kh¸c nhau trung b×nh x¸c ®Þnh 3 chuçi polypeptit kh¸c nhau, th× tæng sè chuçi polypeptit kh¸c nhau ë ng−êi sÏ ®¹t con sè kho¶ng 75.000. Sù ®a d¹ng cña c¸c chuçi polypeptit thùc tÕ cßn bæ sung thªm bëi c¸c biÕn ®æi sau dÞch m·, ch¼ng h¹n bëi sù c¾t tØa c¸c axit amin hay g¾n thªm c¸c gèc cacbohydrat diÔn ra kh¸c nhau ë c¸c tÕ bµo kh¸c nhau hoÆc ë c¸c giai ®o¹n kh¸c nhau cña qu¸ tr×nh ph¸t triÓn.

MËt ®é gen vµ c¸c tr×nh tù ADN kh«ng m· hãa Bªn c¹nh kÝch cì hÖ gen vµ sè gen, chóng ta còng cã thÓ so s¸nh mËt ®é gen ë nh÷ng loµi kh¸c nhau, nghÜa lµ cã bao nhiªu gen trªn mét ®¬n vÞ chiÒu dµi cña ADN. Khi chóng ta so s¸nh hÖ gen gi÷a c¸c loµi vi khuÈn, vi khuÈn cæ vµ sinh vËt nh©n thËt, chóng ta thÊy sinh vËt nh©n thËt th−êng cã hÖ gen lín h¬n nh−ng l¹i cã sè gen Ýt h¬n trªn cïng mét sè nhÊt ®Þnh c¸c cÆp baz¬. Ng−êi cã kÝch cì hÖ gen lín h¬n hµng tr¨m thËm chÝ hµng ngh×n lÇn so víi hÖ gen cña phÇn lín c¸c loµi vi khuÈn, nh−ng nh− chóng ta ®· nãi, ng−êi chØ cã sè gen gÊp tõ 5 ®Õn 15 lÇn so víi nh÷ng loµi nµy; nh− vËy, mËt ®é gen ë ng−êi lµ thÊp h¬n (xem B¶ng 21.1). Ngay c¶ c¸c loµi sinh vËt nh©n thËt ®¬n bµo, nh− nÊm men, còng cã Ýt gen h¬n trong mçi mét triÖu cÆp baz¬ so víi c¸c loµi vi khuÈn vµ vi khuÈn cæ. Trong sè c¸c hÖ gen ®· ®−îc gi¶i tr×nh tù hoµn toµn ®Õn nay, ng−êi vµ c¸c loµi thó cã mËt ®é gen thÊp nhÊt.

Trong tÊt c¶ c¸c hÖ gen vi khuÈn ®· ®−îc nghiªn cøu ®Õn nay, phÇn lín ADN chøa c¸c gen m· hãa cho protein, tARN hoÆc rARN; mét l−îng nhá cña c¸c tr×nh tù ADN cßn l¹i gåm chñ yÕu lµ c¸c tr×nh tù ®iÒu hßa kh«ng ®−îc phiªn m·, ch¼ng h¹n nh− c¸c tr×nh tù khëi ®Çu phiªn m· (promoter). Tr×nh tù c¸c nucleotit däc theo mét gen m· hãa protein ë vi khuÈn th−êng kh«ng bÞ ng¾t qu·ng tõ vÞ trÝ b¾t ®Çu cho ®Õn vÞ trÝ kÕt thóc bëi c¸c tr×nh tù kh«ng m· hãa (intron). Ng−îc l¹i, ë c¸c hÖ gen sinh vËt nh©n thËt, phÇn lín ADN hoÆc kh«ng ®−îc dïng ®Ó m· hãa cho protein hoÆc kh«ng ®−îc phiªn m· thµnh c¸c ph©n tö ARN biÓu hiÖn chøc n¨ng (nh− tARN ch¼ng h¹n), ®ång thêi ADN chøa nhiÒu tr×nh tù ®iÒu hßa phøc t¹p. Trong thùc tÕ, hÖ gen ng−êi chøa ADN kh«ng m· hãa nhiÒu h¬n kho¶ng 10.000 lÇn so víi hÖ gen vi khuÈn. Mét sè tr×nh tù ADN kh«ng m· hãa nµy ë sinh vËt nh©n thËt ®a bµo xuÊt hiÖn trong c¸c intron cña c¸c gen. Thùc tiÔn cho thÊy c¸c intron lµ nh©n tè chÝnh dÉn ®Õn phÇn lín c¸c kh¸c biÖt vÒ chiÒu dµi trung b×nh gi÷a c¸c gen cña ng−êi (27.000 bp) so víi c¸c gen cña vi khuÈn (1000 bp).

B¶ng 21.1 KÝch cì hÖ gen vµ sè gen −íc tÝnh*

Loµi KÝch cì hÖ gen ®¬n béi (Mb)

Sè gen

Sè gen / Mb

Vi khuÈn

Haemophilus influenzae 1,8 1700 940

Escherichia coli 4,6 4400 950

Vi khuÈn cæ

Archaeoglobus fulgidus 2,2 2500 1130

Methanosarcina barkeri 4,8 3600 750

Sinh vËt nh©n thËt

Saccharomyces cerevisiae (nÊm men) 13 6200 480

Caenorhabditis elegans (giun trßn) 100 20.000 200

Arabidopsis thaliana (c©y thuéc hä mï t¹t) 118 25.500 215

Drosophila melanogaster (ruåi giÊm) 180 13.700 76

Oryza sativa (lóa g¹o) 390 40.000 140

Danio rerio (c¸ ngùa) 1700 23.000 13

Mus musculus (chuét nhµ) 2600 22.000 11

Homo sapiens (ng−êi) 3200 20.500 7

Fritillaria assyriaca (c©y thuéc hä lily) 120.000 ND ND

* Mét sè sè liÖu trªn ®©y cã thÓ sÏ ®−îc chØnh lý sau nµy do c¸c ph©n tÝch hÖ gen vÉn ®ang tiÕp tôc tiÕn hµnh. Mb = 1 triÖu cÆp baz¬ (bp). ND = ch−a x¸c ®Þnh.

434 khèi kiÕn thøc 3 Di truyÒn häc

Bªn c¹nh c¸c intron, c¸c sinh vËt nh©n thËt ®a bµo chøa mét l−îng lín ADN kh«ng m· hãa ë gi÷a c¸c gen. Trong môc tiÕp theo, chóng ta sÏ m« t¶ thµnh phÇn vµ c¸ch s¾p xÕp c¸c chuçi tr×nh tù lín cña ADN nh− vËy trong hÖ gen ng−êi.

§Õn ®©y, cã thÓ nãi chóng ta ®· dïng phÇn lín dung l−îng cña ch−¬ng nµy, mµ thùc tÕ lµ cña c¶ khèi kiÕn thøc nµy, ®Ó tËp trung nãi vÒ c¸c gen m· hãa protein. Nh−ng trong thùc tÕ, c¸c vïng m· hãa cña nh÷ng gen nµy vµ c¸c gen m· hãa cho c¸c s¶n phÈm ARN nh− rARN, tARN vµ tiÓu-ARN (miARN hay microARN) chØ chiÕm mét tØ lÖ nhá trong hÖ gen cña phÇn lín c¸c sinh vËt nh©n thËt ®a bµo. Mét phÇn lín hÖ gen cña hÇu hÕt sinh vËt nh©n thËt lµ c¸c tr×nh tù ADN hoÆc kh«ng m· hãa cho protein hoÆc kh«ng ®−îc phiªn m· ®Ó t¹o nªn c¸c lo¹i ARN cã chøc n¨ng ®· biÕt; nh÷ng tr×nh tù ADN kh«ng m· hãa nµy tr−íc kia th−êng ®−îc m« t¶ nh− c¸c “ADN d− thõa”. Tuy vËy, ngµy cµng cã nhiÒu b»ng chøng cho thÊy nh÷ng tr×nh tù ADN nµy gi÷ vai trß quan träng trong ho¹t ®éng sèng cña tÕ bµo; ý t−ëng nµy ®ång thêi ®−îc cñng cè bëi sù tån t¹i mét c¸ch “bÒn v÷ng” qua hµng tr¨m thÕ hÖ cña nh÷ng tr×nh tù nµy ë nhiÒu hÖ gen kh¸c nhau. Ch¼ng h¹n, khi so s¸nh hÖ gen gi÷a ng−êi víi chuét ®ång vµ chuét nhµ, c¸c nhµ nghiªn cøu t×m thÊy cã ®Õn 500 vïng ADN kh«ng m· hãa trong hÖ gen gièng hÖt nhau ë c¶ ba loµi. ë nh÷ng loµi nµy, møc ®é b¶o thñ cña nh÷ng tr×nh tù nµy thËm chÝ cßn cao h¬n so víi c¸c vïng m· hãa protein; ®iÒu nµy ñng hé m¹nh mÏ cho gi¶ thiÕt c¸c vïng kh«ng m· hãa cã nh÷ng chøc n¨ng quan träng. Trong môc nµy chóng ta sÏ t×m hiÓu c¸c gen vµ c¸c tr×nh tù ADN kh«ng m· hãa ®−îc tæ chøc nh− thÕ nµo trong hÖ gen cña c¸c sinh vËt nh©n thËt, víi vÝ dô chñ yÕu chÝnh lµ hÖ gen ng−êi cña chóng ta. C¸ch tæ chøc cña

hÖ gen cho chóng ta biÕt con ®−êng mµ c¸c hÖ gen ®· vµ ®ang tiÕp tôc tiÕn hãa; ®©y còng lµ néi dung ®−îc ®Ò cËp tiÕp theo. Khi hÖ gen ng−êi ®· ®−îc gi¶i tr×nh tù hoµn toµn, mét sù

thËt ®−îc béc lé râ rµng lµ chØ cã 1,5% tr×nh tù nucleotit trong hÖ gen ®−îc dïng hoÆc ®Ó m· hãa cho c¸c protein hoÆc ®−îc phiªn m· thµnh c¸c ph©n tö rARN vµ tARN. H×nh 21.7 cho thÊy thµnh phÇn cÊu tróc nªn 98,5% tr×nh tù cßn l¹i cña hÖ gen ng−êi. C¸c tr×nh tù ®iÒu hßa liªn quan ®Õn c¸c gen vµ c¸c tr×nh tù intron chiÕm 24% hÖ gen ng−êi; phÇn cßn l¹i, n»m gi÷a c¸c gen biÓu hiÖn chøc n¨ng (c¸c tr×nh tù liªn gen), gåm c¸c tr×nh tù kh«ng m· hãa ®¬n nhÊt, ch¼ng h¹n nh− c¸c ph©n ®o¹n cña gen vµ c¸c gen gi¶, tøc lµ c¸c gen cò vèn tõng tån t¹i nh−ng sau ®ã do tÝch lòy c¸c ®ét biÕn ®· trë nªn mÊt chøc n¨ng. Tuy vËy, phÇn lín c¸c tr×nh tù ADN liªn gen lµ nh÷ng tr×nh tù ADN lÆp l¹i, tøc lµ c¸c tr×nh tù cã mÆt víi nhiÒu b¶n sao trong hÖ gen. §iÒu ®¸ng ng¹c nhiªn lµ ba phÇn t− cña c¸c tr×nh tù ADN lÆp l¹i nµy (t−¬ng øng víi 44% cña toµn bé hÖ gen ng−êi) t¹o nªn c¸c ®¬n vÞ ®−îc gäi lµ c¸c yÕu tè di truyÒn vËn ®éng hoÆc c¸c tr×nh tù cã liªn quan ®Õn chóng.

21.4 Kh¸i niÖm

Sinh vËt nh©n thËt ®a bµo cã nhiÒu ADN kh«ng m� hãa vµ nhiÒu hä ®a gen

21.3

1. Theo c¸c sè liÖu −íc tÝnh hiÖn nay, hÖ gen ng−êi chøa kho¶ng 20.500 gen. Tuy vËy, cã b»ng chøng cho thÊy c¸c tÕ bµo ng−êi cã thÓ s¶n sinh nhiÒu h¬n 20.500 lo¹i chuçi polypeptide kh¸c nhau. Nh÷ng qu¸ tr×nh nµo cã thÓ gióp gi¶i thÝch cho sù “kh«ng nhÊt qu¸n” nµy?

2. Sè hÖ gen ®−îc gi¶i tr×nh tù ®ang tiÕp tôc t¨ng lªn ®Òu ®Æn. H·y sö dông trang web www.genomesonline.org ®Ó t×m sè hÖ gen hiÖn t¹i thuéc c¸c liªn giíi kh¸c nhau ®· ®−îc gi¶i tr×nh tù hoµn toµn, còng nh− sè hÖ gen ®ang tiÕp tôc ®−îc gi¶i tr×nh tù (gîi ý: H·y dïng chuét nh¸y kÐp vµo khÈu lÖnh “GOLD tables” råi sau ®ã nh¸y kÐp vµo “Published Complete Genomes” ®Ó cã thªm th«ng tin.)

3. C¸c qu¸ tr×nh tiÕn hãa nµo cã thÓ gi¶i thÝch cho viÖc c¸c sinh vËt nh©n s¬ cã hÖ gen nhá h¬n so víi c¸c sinh vËt nh©n thËt ?

Xem gîi ý tr¶ lêi ë Phô lôc A.

KiÓm tra kh¸i niÖm

®iÒu g× NÕu

� H×nh 21.7 C¸c lo¹i tr×nh tù ADN trong hÖ gen ng−êi.C¸c tr×nh tù gen m· hãa cho protein hoÆc ®−îc phiªn m· thµnh c¸c ph©n tö rARN hay tARN chØ chiÕm kho¶ng 1,5% hÖ gen ng−êi (mµu tÝa sÉm trªn biÓu ®å táa trßn), trong khi c¸c tr×nh tù ®iÒu hßa vµ c¸c intron liªn quan ®Õn c¸c gen (mµu tÝa nh¹t) chiÕm kho¶ng 1/4 hÖ gen. PhÇn lín h¬n c¶ cña hÖ gen ng−êi lµ nh÷ng tr×nh tù kh«ng m· hãa cho protein vµ còng kh«ng ®−îc dïng ®Ó t¹o ra c¸c lo¹i ARN ®· biÕt, mµ phÇn nhiÒu trong nh÷ng tr×nh tù nµy lµ c¸c ADN lÆp l¹i (mµu xanh lôc sÉm vµ nh¹t). Do ADN lÆp l¹i lµ nh÷ng tr×nh tù khã ph©n tÝch vµ khã gi¶i tr×nh tù h¬n c¶, nªn sù ph©n lo¹i cña mét phÇn nh÷ng tr×nh tù nµy ë trªn chØ cã tÝnh −íc ®o¸n, vµ c¸c tØ lÖ phÇn tr¨m ®−îc nªu cã thÓ sÏ thay ®æi ®«i chót khi c¸c nghiªn cøu ph©n tÝch hÖ gen vÉn ®ang tiÕp diÔn. Nh÷ng gen m· hãa c¸c miARN míi ®−îc t×m thÊy gÇn ®©y thuéc c¸c vïng ADN kh«ng m· hãa ®¬n nhÊt (tøc lµ kh«ng lÆp l¹i) vµ trong c¸c intron; nghÜa lµ, chóng thuéc hai vïng cña ®å thÞ táa trßn trªn ®©y.

C¸c exon (c¸c vïng gen m· hãa cho protein hoÆc ®−îc phiªn m· thµnh rARN vµ tARN) (1,5%)

Intron vµ c¸c tr×nh tù ®iÒu hßa liªn quan ®Õn c¸c gen (24%)

C¸c tr×nh tù ADN kh«ng m· hãa ®¬n nhÊt (15%)

ADN lÆp l¹i kh«ng liªn quan ®Õn c¸c yÕu tè vËn ®éng (15%)

ADN lÆp l¹i bao gåm c¸c yÕu tè vËn ®éng vµ c¸c tr×nh tù liªn quan ®Õn chóng (44%)

C¸c ®o¹n lÆp kÝch th−íc lín (5 - 6%) ADN tr×nh tù ®¬n gi¶n (3%)

C¸c yÕu tè Alu (3%)

C¸c tr×nh tù L1 (17%)

Ch−¬ng 21 C¸c hÖ gen vµ sù tiÕn hãa cña chóng 435

C¸c yÕu tè di truyÒn vËn ®éng vµ c¸c tr×nh tù cã liªn quan ®Õn chóng C¶ sinh vËt nh©n s¬ còng nh− sinh vËt nh©n thËt ®Òu cã trong hÖ gen nh÷ng ®o¹n tr×nh tù ADN cã thÓ di chuyÓn tõ vÞ trÝ nµy sang vÞ trÝ kh¸c trong hÖ gen. Nh÷ng ®o¹n tr×nh tù ADN nh− vËy ®−îc gäi lµ c¸c yÕu tè di truyÒn vËn ®éng, hay ®−îc gäi t¾t lµ c¸c yÕu tè vËn ®éng. Trong qu¸ tr×nh ®−îc gäi lµ vËn ®éng, mét yÕu tè vËn ®éng sÏ di chuyÓn tõ mét vÞ trÝ trªn ADN trong tÕ bµo tíi mét vÞ trÝ ®Ých kh¸c nhê mét qu¸ tr×nh t¸i tæ hîp. §«i khi c¸c yÕu tè vËn ®éng ®−îc gäi lµ c¸c “gen nh¶y”, nh−ng thuËt ng÷ nµy thùc tÕ dÔ g©y hiÓu nhÇm bëi trong thùc tÕ nh÷ng ®o¹n tr×nh tù ADN vËn ®éng kh«ng bao giê rêi khái ADN cña tÕ bµo. (C¸c vÞ trÝ gèc vµ vÞ trÝ ®Ých míi cña c¸c yÕu tè vËn ®éng ®−îc ®−a ®Õn gÇn nhau bëi c¬ chÕ “bÎ cong” ADN.) B»ng chøng ®Çu tiªn vÒ c¸c ph©n ®o¹n ADN cã thÓ di

chuyÓn ®−îc ph¸t hiÖn tõ c¸c thÝ nghiÖm lai gièng ë c©y ng« ®−îc nhµ n÷ di truyÒn häc ng−êi Mü lµ Barbara McClintock tiÕn hµnh vµo nh÷ng n¨m 1940 vµ 1950 (H×nh 21.8). Khi theo dâi c¸c c©y ng« qua nhiÒu thÕ hÖ, McClintock x¸c ®Þnh ®−îc sù thay ®æi mµu néi nhò cña c¸c h¹t ng« chØ cã thÓ gi¶i thÝch ®−îc nÕu nh− cã sù tån t¹i cña c¸c yÕu tè di truyÒn cã thÓ vËn ®éng tõ nh÷ng vÞ trÝ kh¸c trong hÖ gen vµo trong c¸c gen qui ®Þnh tÝnh tr¹ng mµu néi nhò, lµm “ph¸ vì” nh÷ng gen nµy vµ dÉn ®Õn hiÖn t−îng mµu néi nhò thay ®æi. Ph¸t hiÖn cña McClintock ban ®Çu ®−îc ®ãn nhËn b»ng nhiÒu “hoµi nghi” vµ thËm chÝ bÞ ph¶n ®èi. Ph¶i mÊt nhiÒu n¨m sau ®ã, c«ng tr×nh nghiªn cøu kú c«ng cïng nh÷ng ý t−ëng s©u s¾c cña McClintock vÒ c¸c yÕu tè vËn ®éng míi ®−îc x¸c nhËn bëi c¸c nhµ di truyÒn häc vi khuÈn vµ vi sinh vËt khi hä t×m ra c¬ së ph©n tö cña qu¸ tr×nh vËn ®éng cña nh÷ng yÕu tè nµy.

Sù vËn ®éng cña c¸c transposon vµ retrotransposon C¸c sinh vËt nh©n thËt cã hai lo¹i yÕu tè vËn ®éng. Lo¹i thø nhÊt ®−îc gäi lµ c¸c transposon; lo¹i yÕu tè nµy vËn ®éng

trong hÖ gen th«ng qua mét ADN trung gian. C¸c transposon cã thÓ vËn ®éng hoÆc bëi c¬ chÕ “c¾t - d¸n” vµ chóng ®−îc chuyÓn dêi khái vÞ trÝ gèc, hoÆc bëi c¬ chÕ “sao chÐp - d¸n” vµ chóng ®Ó l¹i mét b¶n sao t¹i vÞ trÝ gèc (H×nh 21.9a). PhÇn lín c¸c yÕu tè vËn ®éng trong hÖ gen sinh vËt nh©n

thËt thuéc lo¹i thø hai, ®−îc gäi lµ c¸c retrotransposon; lo¹i yÕu tè nµy vËn ®éng trong hÖ gen th«ng qua mét ARN trung gian; ®©y lµ b¶n phiªn m· cña chÝnh ADN retrostransposon. C¸c retrotransposon lu«n ®Ó l¹i mét b¶n sao t¹i vÞ trÝ ®Ých trong qu¸ tr×nh vËn ®éng, do chóng ®−îc phiªn m· thµnh ARN trung gian (H×nh 21.9b). Tr−íc khi cµi vµo vÞ trÝ ®Ých, ph©n tö ARN trung gian ®−îc phiªn m· ng−îc trë l¹i thµnh ADN bëi enzym phiªn m· ng−îc - reverse transcriptase - do chÝnh retrotransposon m· hãa. §iÒu nµy cã nghÜa lµ enzym phiªn m· ng−îc cã thÓ cã mÆt trong c¸c tÕ bµo mµ chóng kh«ng nhÊt thiÕt ph¶i bÞ l©y nhiÔm bëi retrovirut. (Trong thùc tÕ, c¸c retrovirut, nh− ®· ®−îc ®Ò cËp ë Ch−¬ng 19, cã thÓ ®· tiÕn hãa b¾t nguån tõ chÝnh c¸c retrotransposon.) Ho¹t ®éng cµi tr×nh tù ADN ®−îc phiªn m· ng−îc vµo vÞ trÝ míi ®−îc xóc t¸c bëi enzym trong tÕ bµo.

� H×nh 21.8 ¶nh h−ëng cña c¸c yÕu tè vËn ®éng ®Õn mµu h¹t ng«. Barbara McClintock lµ ng−êi ®Çu tiªn ®−a ra ý t−ëng vÒ nh÷ng yÕu tè di truyÒn cã kh¶ n¨ng vËn ®éng khi quan s¸t hiÖn t−îng cã nhiÒu ®èm mµu kh¸c nhau trong nh©n cña c¸c h¹t ng«. Tuy ban ®Çu ý t−ëng cña bµ vµo nh÷ng n¨m 1940 ®−îc ®ãn nhËn bëi nh÷ng mèi hoµi nghi, nh−ng sau nµy ®· ®−îc kiÓm chøng lµ hoµn toµn x¸c thùc. Bµ ®−îc nhËn gi¶i Nobel n¨m 1983 khi ë tuæi 81 nhê c«ng tr×nh mang tÝnh tiªn phong cña m×nh.

� H×nh 21.9 Sù di chuyÓn cña c¸c yÕu tè vËn ®éng ë sinh vËt nh©n thËt. (a) Sù di chuyÓn cña c¸c transposon hoÆc theo c¬ chÕ “c¾t - d¸n” hoÆc theo c¬ chÕ “sao chÐp - d¸n” (®−îc minh häa ë ®©y) liªn quan ®Õn mét ph©n tö ADN sîi kÐp trung gian sau ®ã ®−îc cµi vµo hÖ gen. (b) Sù di chuyÓn cña c¸c retrotransposon b¾t ®Çu b»ng sù h×nh thµnh mét ph©n tö ARN m¹ch ®¬n trung gian. C¸c b−íc cßn l¹i vÒ b¶n chÊt gièng víi mét phÇn chu kú sinh s¶n cña retrovirut (xem H×nh 19.8). Trong kiÓu di chuyÓn cña c¸c transposon theo kiÓu “sao chÐp - d¸n” vµ kiÓu di chuyÓn cña retrotransposon, tr×nh tù ADN võa ®−îc duy tr× ë vÞ trÝ gèc võa xuÊt hiÖn ë vÞ trÝ míi.

PhÇn (a) ë trªn sÏ kh¸c nh− thÕ nµo nÕu c¬ chÕ ®−îc minh häa ë ®©y lµ c¬ chÕ di chuyÓn kiÓu “c¾t - d¸n” ?

Transposon

ADN hÖ gen

Transposon ®−îc sao chÐp

Transposon vËn ®éng

Cµi vµo hÖ gen

B¶n sao míi cña transposon

(a) Sù di chuyÓn cña transposon (c¬ chÕ kiÓu “sao chÐp - d¸n”)

Retrotransposon

ARN

Reverse transcriptase

Cµi vµo hÖ gen

B¶n sao míi cña retrotransposon

(b) Sù di chuyÓn cña retrotransposon

436 khèi kiÕn thøc 3 Di truyÒn häc

C¸c tr×nh tù liªn quan ®Õn c¸c yÕu tè vËn ®éng ë sinh vËt nh©n thËt, nhiÒu b¶n sao cña c¸c yÕu tè vËn ®éng vµ c¸c tr×nh tù liªn quan ®Õn chóng n»m r¶i r¸c kh¾p hÖ gen. Mçi ®¬n vÞ riªng lÎ cña yÕu tè vËn ®éng th−êng dµi tõ vµi tr¨m ®Õn vµi ngh×n cÆp baz¬, vµ c¸c "b¶n sao" n»m ph©n t¸n th−êng gièng nhau, nh−ng kh«ng gièng hÖt nhau. Mét sè yÕu tè vËn ®éng nh− vËy cã kh¶ n¨ng vËn ®éng; c¸c enzym cÇn thiÕt cho sù vËn ®éng cña nã cã thÓ ®−îc m· hãa bëi mét yÕu tè vËn ®éng bÊt kú, bao gåm c¶ chÝnh yÕu tè vËn ®éng ®ang ho¹t ®éng. Nh÷ng tr×nh tù kh¸c lµ nh÷ng tr×nh tù cã liªn quan nh−ng ®· mÊt hoµn toµn kh¶ n¨ng vËn ®éng. C¸c yÕu tè vËn ®éng vµ c¸c tr×nh tù cã liªn quan chiÕm kho¶ng 25% - 50% hÖ gen ë phÇn lín ®éng vËt cã vó (xem H×nh 21.7); tØ lÖ nµy thËm chÝ cßn cao h¬n ë c¸c loµi l−ìng c− vµ nhiÒu loµi thùc vËt.

ë ng−êi vµ nhiÒu loµi linh tr−ëng kh¸c, mét tØ lÖ lín c¸c tr×nh tù ADN liªn quan ®Õn c¸c yÕu tè vËn ®éng bao gåm mét hä c¸c tr×nh tù gièng nhau ®−îc gäi lµ c¸c yÕu tè Alu. Riªng nh÷ng tr×nh tù nµy ®· chiÕm kho¶ng 10% hÖ gen ng−êi. C¸c yÕu tè Alu cã chiÒu dµi kho¶ng 300 nucleotit, tøc lµ ng¾n h¬n nhiÒu so víi phÇn lín c¸c yÕu tè vËn ®éng cßn ho¹t ®éng kh¸c, vµ chóng kh«ng m· hãa cho bÊt cø protein nµo. Tuy vËy, nhiÒu yÕu tè Alu ®−îc phiªn m· thµnh ARN; chøc n¨ng trong tÕ bµo cña chóng (nÕu cã) ®Õn nay ch−a râ. Mét tØ lÖ lín h¬n (17%) cña hÖ gen ng−êi lµ mét lo¹i

retrotransposon kh¸c, ®−îc gäi lµ c¸c yÕu tè LINE-1 hay L1. Nh÷ng yÕu tè nµy dµi h¬n nhiÒu so víi c¸c yÕu tè Alu (kho¶ng 6500 bp) vµ cã tØ lÖ vËn ®éng thÊp. T¹i sao tØ lÖ vËn ®éng cña c¸c yÕu tè lo¹i nµy l¹i thÊp? C¸c nghiªn cøu gÇn ®©y ph¸t hiÖn ra r»ng trong c¸c yÕu tè L1 cã c¸c tr×nh tù ng¨n c¶n ho¹t ®éng cña ARN polymerase vèn cÇn thiÕt cho sù vËn ®éng. Mét nghiªn cøu bæ sung t×m thÊy c¸c tr×nh tù L1 cã trong intron cña kho¶ng 80% sè gen ng−êi ®−îc ®em ph©n tÝch, ®iÒu nµy cho thÊy cã kh¶ n¨ng L1 gióp ®iÒu hßa biÓu hiÖn gen. Mét sè nhµ nghiªn cøu kh¸c cho r»ng: c¸c retrotransposon L1 cã thÓ cã hiÖu qu¶ biÖt hãa qua ®iÒu hßa biÓu hiÖn gen dÉn ®Õn sù ph¸t triÓn c¸c lo¹i n¬ron, gãp phÇn t¹o nªn sù ®a d¹ng cña c¸c lo¹i tÕ bµo n¬ron (xem Ch−¬ng 48). MÆc dï cã nhiÒu yÕu tè vËn ®éng m· hãa cho c¸c protein,

nh−ng nh÷ng protein nµy kh«ng thùc hiÖn nh÷ng chøc n¨ng tÕ bµo b×nh th−êng. Do vËy, c¸c yÕu tè vËn ®éng th−êng ®−îc qui vµo nhãm ADN “kh«ng m· hãa”, cïng víi c¸c tr×nh tù lÆp l¹i dµi kh¸c cã trong hÖ gen.

C¸c tr×nh tù ADN lÆp l¹i kh¸c, bao gåm c¶ c¸c ADN tr×nh tù ®¬n gi¶n C¸c tr×nh tù ADN lÆp l¹i vèn kh«ng liªn quan ®Õn c¸c yÕu tè vËn ®éng cã vÎ xuÊt hiÖn do c¸c sai sãt trong c¸c qu¸ tr×nh sao chÐp hoÆc t¸i tæ hîp cña ADN. Nh÷ng tr×nh tù ADN nh− vËy chiÕm kho¶ng 15% hÖ gen ng−êi (xem H×nh 21.7). Kho¶ng mét phÇn ba trong sè nµy (tøc lµ kho¶ng 5 - 6% hÖ gen ng−êi) lµ nh÷ng ®o¹n ADN dµi lÆp l¹i hai lÇn víi mçi ®¬n vÞ lÆp l¹i dµi tõ 10.000 ®Õn 30.000 cÆp baz¬. C¸c ®o¹n ADN dµi nh− vËy d−êng nh− ®· ®−îc sao chÐp tõ vÞ trÝ nµy sang vÞ trÝ kh¸c thuéc cïng mét nhiÔm s¾c thÓ hoÆc thuéc hai nhiÔm s¾c thÓ kh¸c nhau.

Kh«ng gièng nh− c¸c b¶n sao cña c¸c tr×nh tù ADN dµi ph©n t¸n kh¾p hÖ gen, c¸c ADN tr×nh tù ®¬n gi¶n th−êng gåm nhiÒu b¶n sao cña c¸c ®o¹n tr×nh tù ng¾n lÆp l¹i liªn tiÕp nh− vÝ dô ®−îc minh häa d−íi ®©y (ë ®©y, chØ minh häa mét m¹ch):

…GTTACGTTACGTTACGTTACGTTACGTTAC… Trong tr−êng hîp nµy, ®¬n vÞ lÆp l¹i (GTTAC) gåm 5 nucleotit. Trong thùc tÕ, c¸c ®¬n vÞ lÆp l¹i nh− vËy cã thÓ dµi ®Õn 500 nucleotit, nh−ng th−êng th× ng¾n h¬n 15 nucleotit nh− vÝ dô trªn ®©y. Khi ®¬n vÞ lÆp l¹i chØ chøa tõ 2 ®Õn 5 nucleotit, th× ®o¹n tr×nh tù lÆp l¹i liªn tiÕp nh− vËy ®−îc gäi lµ tr×nh tù ng¾n lÆp l¹i liªn tiÕp, hay cßn gäi lµ STR (short tandem repeats). Chóng ta ®· nãi vÒ viÖc sö dông chØ thÞ STR trong x©y dùng tµng th− di truyÒn ë Ch−¬ng 20. Sè b¶n sao cña cïng mét ®¬n vÞ lÆp l¹i cã thÓ kh¸c nhau ë nh÷ng vÞ trÝ kh¸c nhau trong hÖ gen. Ch¼ng h¹n nh−, ®¬n vÞ lÆp l¹i GTTAC cã thÓ xuÊt hiÖn liªn tiÕp hµng tr¨m ngh×n lÇn t¹i mét vÞ trÝ trong hÖ gen; nh−ng ë mét vÞ trÝ kh¸c, sè lÇn lÆp l¹i cña ®¬n vÞ nµy chØ b»ng mét nöa. Sè lÇn lÆp l¹i còng rÊt kh¸c nhau gi÷a ng−êi nµy víi ng−êi kh¸c, t¹o nªn sù kh¸c biÖt trong tµng th− di truyÒn cña mçi c¸ nh©n trªn c¬ së ph©n tÝch c¸c tr×nh tù STR. TÝnh tæng céng, c¸c ADN tr×nh tù ®¬n gi¶n chiÕm kho¶ng 3% hÖ gen ng−êi. Thµnh phÇn nucleotit cña c¸c ®o¹n ADN tr×nh tù ®¬n gi¶n

kh¸c biÖt víi thµnh phÇn cña c¸c ®o¹n tr×nh tù ADN kh¸c trong hÖ gen ®Õn møc chóng t¹o nªn sù kh¸c biÖt vÒ tØ träng. NÕu ADN hÖ gen ®−îc c¾t thµnh c¸c ph©n ®o¹n nhá, råi ®−îc ly t©m ë tèc ®é cao, th× c¸c ph©n ®o¹n ADN cã tØ träng kh¸c nhau sÏ “®Þnh vÞ” ë nh÷ng vÞ trÝ kh¸c nhau trong èng ly t©m. C¸c ®o¹n ADN lÆp l¹i vèn ban ®Çu ®−îc ph©n lËp theo c¸ch nµy ®−îc gäi lµ c¸c tr×nh tù ADN vÖ tinh bëi v× c¸c b¨ng ly t©m cña chóng t¸ch biÖt khái phÇn b¨ng ly t©m chung gåm c¸c tr×nh tù ADN cßn l¹i cña hÖ gen gièng nh− mét “vÖ tinh”. ThuËt ng÷ “ADN vÖ tinh” vµ ADN tr×nh tù ®¬n gi¶n hiÖn nay th−êng ®−îc dïng thay thÕ cho nhau. Mét l−îng lín ADN tr×nh tù ®¬n gi¶n cña hÖ gen tËp trung

ë c¸c ®Çu mót vµ t©m ®éng cña nhiÔm s¾c thÓ, cho thÊy nh÷ng tr×nh tù ADN nµy gi÷ vai trß cÊu tróc nhiÔm s¾c thÓ. C¸c tr×nh tù ADN t¹i t©m ®éng lµ thiÕt yÕu cho ho¹t ®éng ph©n ly cña c¸c nhiÔm s¾c tö trong qu¸ tr×nh ph©n bµo (xem Ch−¬ng 12). Tr×nh tù ADN t©m ®éng, cïng víi c¸c ADN tr×nh tù ®¬n gi¶n kh¸c, cã thÓ ®ãng vai trß tæ chøc chÊt nhiÔm s¾c trong nh©n t¹i kú trung gian cña chu tr×nh tÕ bµo. C¸c ADN tr×nh tù ®¬n gi¶n t¹i c¸c ®Çu mót nhiÔm s¾c thÓ gióp b¶o vÖ c¸c gen kh«ng bÞ mÊt do ADN ng¾n l¹i sau mçi lÇn sao chÐp (xem Ch−¬ng 16). ADN ®Çu mót ®ång thêi liªn kÕt víi c¸c protein gióp b¶o vÖ ®Çu mót nhiÔm s¾c thÓ khái bÞ biÕn tÝnh, ®ång thêi kh«ng bÞ dÝnh chËp víi c¸c nhiÔm s¾c thÓ kh¸c.

C¸c gen vµ c¸c hä ®a gen Chóng ta kÕt thóc bµn luËn vÒ c¸c lo¹i tr×nh tù ADN kh¸c nhau trong c¸c hÖ gen sinh vËt nh©n thËt b»ng viÖc nh×n gÇn c¸c gen h¬n. Chóng ta nhí l¹i r»ng tæng céng c¸c tr×nh tù ADN m· hãa hoÆc cho c¸c protein hoÆc cho c¸c lo¹i tARN vµ rARN chØ chiÕm cã 1,5% hÖ gen ng−êi (xem H×nh 21.7). NÕu chóng ta tÝnh c¶ c¸c tr×nh tù intron vµ c¸c tr×nh tù ®iÒu hßa liªn quan ®Õn gen, th× tæng céng tÊt c¶ c¸c tr×nh tù ADN cã liªn quan ®Õn gen (bao gåm c¶ nh÷ng ®o¹n m· hãa vµ kh«ng m· hãa) chiÕm

Ch−¬ng 21 C¸c hÖ gen vµ sù tiÕn hãa cña chóng 437

kho¶ng 25% hÖ gen ng−êi. Nãi c¸ch kh¸c, trung b×nh chØ cã kho¶ng 6% (tøc lµ 1,5% cña 25%) tr×nh tù ®Çy ®ñ cña mét gen cã mÆt trong s¶n phÈm cuèi cïng cña gen. Gièng víi c¸c gen cña vi khuÈn, nhiÒu gen ë sinh vËt nh©n

thËt lµ nh÷ng tr×nh tù ®¬n nhÊt vµ chØ cã mét b¶n sao duy nhÊt trong mçi bé nhiÔm s¾c thÓ ®¬n béi. Tuy vËy, trong hÖ gen ng−êi vµ hÖ gen cña nhiÒu ®éng vËt vµ thùc vËt kh¸c, nh÷ng gen “®¬n ®éc” nh− vËy chiÕm Ýt h¬n mét nöa tæng sè tr×nh tù ADN ®−îc phiªn m·. C¸c gen cßn l¹i xuÊt hiÖn thµnh c¸c hä ®a gen, tøc lµ tËp hîp cña hai hay nhiÒu gen gièng hÖt hoÆc rÊt gièng nhau. Trong c¸c hä ®a gen gåm c¸c tr×nh tù ADN gièng hÖt nhau,

c¸c tr×nh tù ADN lÆp l¹i liÒn kÒ nhau, vµ ngo¹i trõ c¸c gen m· hãa protein histone, chóng m· hãa cho s¶n phÈm cuèi cïng lµ ARN. Mét vÝ dô vÒ hä c¸c tr×nh tù ADN gièng hÖt nhau lµ côm c¸c gen m· hãa cho ba lo¹i ph©n tö rARN lín nhÊt (H×nh 21.10a). Nh÷ng ph©n tö rARN nµy ®−îc phiªn m· thµnh c¸c b¶n phiªn m· duy nhÊt gåm hµng tr¨m thËm chÝ hµng ngh×n lÇn lÆp l¹i kÕ tiÕp nhau vµ tËp hîp thµnh mét hoÆc mét sè côm trong hÖ gen sinh vËt nh©n thËt. Víi nhiÒu b¶n sao cïng cã mÆt trong mét ®¬n vÞ phiªn m· nh− vËy, tÕ bµo cã thÓ nhanh chãng

t¹o ra hµng triÖu ribosome cÇn cho qu¸ tr×nh tæng hîp protein. B¶n phiªn m· s¬ cÊp cña c¸c gen rARN sau ®ã ®−îc c¾t xÐn ®Ó h×nh thµnh nªn ba lo¹i ph©n tö rARN. Nh÷ng ph©n tö rARN nµy sau ®ã ®−îc kÕt hîp víi c¸c protein vµ mét lo¹i rARN kh¸c (rARN 5S) ®Ó t¹o nªn c¸c tiÓu phÇn ribosome. C¸c vÝ dô kinh ®iÓn vÒ c¸c hä ®a gen cã tr×nh tù kh«ng

gièng hÖt nhau gåm hai hä gen cã quan hÖ víi nhau m· hãa cho globin; ®©y lµ mét nhãm c¸c protein gåm c¸c tiÓu phÇn (chuçi polypeptit) α vµ β cña hemoglobin. Cã mét hä gen n»m trªn NST sè 16 ë ng−êi m· hãa cho c¸c d¹ng kh¸c nhau cña α-globin; mét hä gen cßn l¹i n»m trªn NST sè 11 m· hãa cho c¸c d¹ng kh¸c nhau cña β-globin (H×nh 21.10b). C¸c d¹ng kh¸c nhau cña mçi tiÓu phÇn globin ®−îc biÓu hiÖn vµo c¸c thêi ®iÓm kh¸c nhau cña qu¸ tr×nh ph¸t triÓn, qua ®ã gióp hemoglobin biÓu hiÖn chøc n¨ng hiÖu qu¶ trong c¸c ®iÒu kiÖn m«i tr−êng thay ®æi trong qu¸ tr×nh ph¸t triÓn ë ®éng vËt. Ch¼ng h¹n nh−, ë ng−êi, c¸c d¹ng hemoglobin cã trong ph«i vµ thai cã ¸i lùc víi oxy cao h¬n so víi d¹ng hemoglobin ë ng−êi tr−ëng thµnh; ®iÒu nµy gióp ®¶m b¶o hiÖu qu¶ vËn chuyÓn oxy tõ mÑ sang thai nhi. Trong c¸c côm hä gen m· hãa globin, ng−êi ta cßn t×m thÊy mét sè gen gi¶.

� H×nh 21.10 C¸c hä gen.

Trong phÇn (a) cña trªn h×nh, b»ng c¸ch nµo b¹n cã thÓ x¸c ®Þnh ®−îc chiÒu phiªn m·, nÕu nh− kh«ng cã mòi tªn mµu ®á?

Nh©n hem

Hä gen α-globin

ADN

Hä gen β-globin

NhiÔm s¾c thÓ sè 16 NhiÔm s¾c thÓ sè 11

Ph«i Thai vµ ng−êi tr−ëng thµnh Ph«i Thai Ng−êi tr−ëng

thµnh

§o¹n ®Öm kh«ng ®−îc phiªn m· §¬n vÞ phiªn m·

C¸c b¶n phiªn m· ARN

ADN

rARN

(a) Mét phÇn hä gen m� hãa ARN ribosom. Ba trong sè hµng tr¨m b¶n sao cña c¸c ®¬n vÞ phiªn m· rARN trong hÖ gen cña loµi kú gi«ng ®−îc minh häa ë phÇn trªn (¶nh TEM). Mçi mét “chiÕc l«ng” t−¬ng øng víi mét ®¬n vÞ phiªn m· víi kho¶ng 100 ph©n tö ®ang ®−îc tæng hîp bëi ARN polymerase (®iÓm mµu sÉm däc theo sîi ADN) dÞch chuyÓn tõ tr¸i qua ph¶i. C¸c b¶n phiªn m· ARN ®ang ®−îc “më réng” tõ ADN. S¬ ®å bªn d−íi ¶nh TEM m« t¶ mét ®¬n vÞ phiªn m·. Nã bao gåm c¸c gen (mµu xanh lam) m· hãa ba lo¹i rARN xen gi÷a c¸c vïng ®−îc phiªn m· nh−ng sau ®ã ®−îc c¾t bá (mµu vµng). Ban ®Çu chØ mét b¶n phiªn m· ARN duy nhÊt ®−îc t¹o ra, nh−ng sau ®ã nã ®−îc c¾t xÐn ®Ó t¹o nªn ba ph©n tö rARN kh¸c nhau (mçi lo¹i mét ph©n tö); chóng lµ c¸c thµnh phÇn thiÕt yÕu cña ribosom. Mét lo¹i rARN thø t− (5S rARN) còng lµ thµnh phÇn cña ribosom, nh−ng gen m· hãa nã kh«ng thuéc cïng ®¬n vÞ phiªn m· nµy.

(b) C¸c hä gen αααα-globin vµ ββββ-globin ë ng−êi. Hemoglobin ®−îc cÊu t¹o tõ hai tiÓu phÇn (chuçi) polypeptide lo¹i α-globin vµ hai tiÓu phÇn lo¹i β-globin. C¸c gen (mµu xanh lam) m· hãa cho α-globin vµ β-globin ®−îc t×m thÊy trong hai hä gen cã cÊu tróc tæ chøc nh− minh häa trªn h×nh. C¸c tr×nh tù ADN kh«ng m· hãa xen gi÷a c¸c gen chøc n¨ng trong mçi hä gen gåm c¸c gen gi¶ (mµu xanh lôc) vµ c¸c d¹ng biÕn ®æi kh«ng biÓu hiÖn chøc n¨ng cña c¸c gen chøc n¨ng b×nh th−êng. Tªn gäi c¸c gen vµ c¸c gen gi¶ ®−îc kÝ hiÖu vµ ®äc theo tiÕng Hy l¹p.

438 khèi kiÕn thøc 3 Di truyÒn häc

Sù s¾p xÕp c¸c gen thµnh c¸c hä gen ®· gióp c¸c nhµ sinh häc cã nh÷ng hiÓu biÕt s©u h¬n vÒ qu¸ tr×nh tiÕn hãa cña c¸c hÖ gen. Trong môc tiÕp theo, chóng ta sÏ ®Ò cËp ®Õn mét sè qu¸ tr×nh dÉn ®Õn sù ®Þnh h×nh c¸c hÖ gen cña c¸c loµi kh¸c nhau qua qu¸ tr×nh tiÕn hãa.

C¬ së thay ®æi ë cÊp ®é hÖ gen lµ ®ét biÕn vµ ®ã còng lµ nÒn t¶ng cña tiÕn hãa häc hÖ gen. D−êng nh− nh÷ng d¹ng sèng ®Çu tiªn chØ chøa mét sè tèi thiÓu c¸c gen, nghÜa lµ chØ cã c¸c gen thiÕt yÕu cho sù tån t¹i vµ sinh s¶n. NÕu ®iÒu nµy lµ ®óng, th× mét chiÒu h−íng tiÕn hãa h¼n lµ ®· diÔn ra cïng víi sù t¨ng lªn vÒ kÝch th−íc hÖ gen, vµ vËt chÊt di truyÒn bæ sung ®· cung cÊp nguyªn liÖu s¬ cÊp cho tÝnh ®a d¹ng t¨ng lªn cña c¸c gen. Trong môc nµy, ®Çu tiªn chóng ta sÏ m« t¶ b»ng c¸ch nµo nh÷ng b¶n sao bæ sung cña toµn bé hay mét phÇn cña hÖ gen cã thÓ xuÊt hiÖn, råi sau ®ã ®Ò cËp ®Õn nh÷ng qu¸ tr×nh x¶y ra tiÕp theo dÉn ®Õn sù tiÕn hãa cña c¸c protein (hoÆc c¸c s¶n phÈm ARN) cã chøc n¨ng hoµn toµn míi hoÆc thay ®æi chót Ýt.

Sù nh©n ®«i c¸c bé nhiÔm s¾c thÓ C¸c sù kiÖn ngÉu nhiªn trong gi¶m ph©n cã thÓ dÉn ®Õn tÕ bµo cã thÓ cã mét hoÆc nhiÒu bé nhiÔm s¾c thÓ bæ sung thªm; hiÖn t−îng nµy ®−îc gäi lµ ®a béi thÓ. MÆc dï, trong phÇn lín tr−êng hîp nh÷ng sù kiÖn ngÉu nhiªn ®ã th−êng g©y chÕt, nh−ng trong mét sè hiÕm tr−êng hîp, chóng l¹i thóc ®Èy sù tiÕn

hãa cña c¸c gen. ë mét c¬ thÓ ®a béi, mét bé c¸c gen cã thÓ cung cÊp ®ñ c¸c chøc n¨ng thiÕt yÕu cho c¬ thÓ ®ã. Nh÷ng gen ë nh÷ng bé nhiÔm s¾c thÓ bæ sung cã thÓ ph©n ly bëi qu¸ tr×nh tÝch lòy c¸c ®ét biÕn; nh÷ng biÕn dÞ nµy cã thÓ ®−îc duy tr× nÕu nh− c¬ thÓ mang c¸c ®ét biÕn sèng sãt vµ sinh s¶n ®−îc. B»ng c¸ch ®ã, c¸c gen cã thÓ tiÕn hãa víi nh÷ng chøc n¨ng míi.

Cïng víi viÖc mét b¶n sao cña gen thiÕt yÕu ®−îc biÓu hiÖn, sù ph©n ly cña mét b¶n sao kh¸c cã thÓ dÉn ®Õn mét lo¹i protein vÉn do gen ®ã m· hãa song ho¹t ®éng theo mét c¸ch míi, qua ®ã lµm thay ®æi kiÓu h×nh cña sinh vËt. KÕt qu¶ cña sù tÝch lòy c¸c ®ét biÕn nµy cã thÓ dÉn ®Õn sù ph©n nh¸nh tiÕn hãa cña mét loµi míi, gièng nh− biÓu hiÖn th−êng thÊy ë thùc vËt (xem Ch−¬ng 24). C¸c ®éng vËt ®a béi còng tån t¹i, song rÊt hiÕm.

Sù thay ®æi cÊu tróc nhiÔm s¾c thÓ Tõ l©u c¸c nhµ khoa häc ®· biÕt r»ng vµo mét thêi ®iÓm nµo ®ã trong vßng 6 triÖu n¨m tr−íc khi c¸c d¹ng tæ tiªn cña ng−êi hiÖn ®¹i vµ tinh tinh ph©n ly khái nhau vµ h×nh thµnh nªn c¸c loµi riªng biÖt, mét sù dung hîp hai nhiÔm s¾c thÓ kh¸c nhau vèn cã ë d¹ng tæ tiªn ®· dÉn ®Õn loµi ng−êi cã sè nhiÔm s¾c thÓ ®¬n béi (n = 23) kh¸c víi cña tinh tinh (n = 24). Víi sù bïng næ th«ng tin vÒ tr×nh tù c¸c hÖ gen, giê ®©y chóng ta cã thÓ so s¸nh cÊu tróc vµ tæ chøc nhiÔm s¾c thÓ gi÷a nhiÒu loµi ë cÊp ®é ph©n tÝch chi tiÕt h¬n. Nh÷ng th«ng tin nµy gióp chóng ta cã thÓ t×m hiÓu s©u h¬n vÒ c¸c qu¸ tr×nh tiÕn hãa ®· dÉn ®Õn sù h×nh thµnh c¸c nhiÔm s¾c thÓ còng nh− sù ph¸t sinh c¸c loµi. VÝ dô nh−, trong mét nghiªn cøu, c¸c nhµ khoa häc ®· tiÕn

hµnh so s¸nh tr×nh tù ADN gi÷a mçi nhiÔm s¾c thÓ cña ng−êi víi tr×nh tù toµn bé hÖ gen cña chuét. H×nh 21.11 cho thÊy kÕt qu¶ so s¸nh víi nhiÔm s¾c thÓ sè 16 cña ng−êi lµ: nh÷ng “khèi” gen lín trªn nhiÔm s¾c thÓ nµy ®−îc t×m thÊy trªn 4 nhiÔm s¾c thÓ kh¸c nhau cña chuét; ®iÒu nµy cho thÊy c¸c gen trong mçi “khèi” ®· tån t¹i cïng víi nhau trong qu¸ tr×nh tiÕn hãa cña

21.5 Kh¸i niÖm

LÆp ®o¹n, t¸i s¾p xÕp vµ ®ét biÕn trong tr×nh tù ADN ®ãng gãp vµo qu¸ tr×nh tiÕn hãa

21.4

1. H·y nªu c¸c ®Æc ®iÓm cña hÖ gen ®éng vËt cã vó lµm chóng trë nªn lín h¬n so víi c¸c hÖ gen sinh vËt nh©n s¬?

2. C¸c intron, c¸c yÕu tè vËn ®éng vµ c¸c tr×nh tù ADN lÆp l¹i ®¬n gi¶n ph©n bè trong hÖ gen kh¸c nhau nh− thÕ nµo?

3. Nªu sù kh¸c nhau trong cÊu tróc cña c¸c hä gen m· hãa rARN vµ m· hãa c¸c protein globin ë ng−êi. Víi mçi hä gen, h·y gi¶i thÝch lîi thÕ cña sù tån t¹i cÊu tróc kiÓu hä gen ®èi víi sinh vËt.

4. Gi¶ sö b¹n t×m thÊy mét tr×nh tù ADN gièng víi tr×nh tù cña mét gen ®· biÕt, nh−ng chóng l¹i kh¸c nhau râ rÖt ë mét vµi nucleotide nhÊt ®Þnh. B»ng c¸ch nµo b¹n cã thÓ x¸c ®Þnh tr×nh tù míi t×m thÊy cã ph¶i lµ mét “gen” biÓu hiÖn chøc n¨ng hay kh«ng?? Xem gîi ý tr¶ lêi ë Phô lôc A.

KiÓm tra kh¸i niÖm

®iÒu g× NÕu

� H×nh 21.11 C¸c khèi tr×nh tù gièng nhau trªn c¸c nhiÔm s¾c thÓ cña ng−êi vµ chuét. C¸c tr×nh tù ADN rÊt gièng nhau ®−îc t×m thÊy trong mét khèi tr×nh tù lín thuéc nhiÔm s¾c thÓ sè 16 cña ng−êi ®−îc t×m thÊy trªn c¸c nhiÔm s¾c thÓ sè 7, 8, 16 vµ 17 cña chuét. §iÒu nµy cho thÊy c¸c tr×nh tù ADN trong mçi khèi ®· lu«n tån t¹i cïng nhau ë c¸c dßng tiÕn hãa dÉn ®Õn sù h×nh thµnh ng−êi vµ chuét kÓ tõ thêi ®iÓm chóng ph©n ly khái nhau tõ tæ tiªn chung.

NhiÔm s¾c thÓ sè 16 cña ng−êi

C¸c khèi tr×nh tù ADN

C¸c khèi tr×nh tù t−¬ng øng ®−îc t×m thÊy trªn 4 nhiÔm s¾c thÓ cña chuét

Ch−¬ng 21 C¸c hÖ gen vµ sù tiÕn hãa cña chóng 439

chuét còng nh− ë c¸c nh¸nh tiÕn hãa cña ng−êi. Thùc hiÖn phÐp so s¸nh t−¬ng tù gi÷a nhiÔm s¾c thÓ cña ng−êi víi s¸u loµi ®éng vËt cã vó kh¸c còng ®· gióp c¸c nhµ nghiªn cøu t¸i thiÕt ®−îc lÞch sö tiÕn hãa tæ chøc nhiÔm s¾c thÓ ë t¸m loµi ®éng vËt cã vó nµy. Qua ®ã, c¸c nhµ nghiªn cøu ®· t×m ra nhiÒu lÆp ®o¹n vµ ®¶o ®o¹n trªn c¸c ph©n ®o¹n lín cña NST lµ kÕt qu¶ cña c¸c lçi t¸i tæ hîp x¶y ra trong gi¶m ph©n dÉn ®Õn sù ®øt g·y vµ nèi l¹i kh«ng chÝnh x¸c cña ADN. TÇn sè suÊt hiÖn nh÷ng sù kiÖn nµy d−êng nh− ®· t¨ng nhanh trong kho¶ng 100 triÖu n¨m tr−íc, tøc lµ kho¶ng thêi gian nh÷ng loµi khñng long kÝch th−íc lín trë nªn tuyÖt chñng vµ sè loµi ®éng vËt cã vó t¨ng lªn nhanh chãng. Sù trïng lÆp ngÉu nhiªn nµy râ rµng lµ rÊt thó vÞ bëi v× sù t¸i s¾p xÕp nhiÔm s¾c thÓ ®−îc cho lµ ®· ®ãng gãp vµo sù h×nh thµnh c¸c loµi míi. MÆc dï hai c¸ thÓ mang c¸c nhiÔm s¾c thÓ ®−îc s¾p xÕp kh¸c nhau vÉn cã thÓ giao phèi víi nhau vµ sinh s¶n, nh−ng c¸c c¸ thÓ con sinh ra sÏ cã hai bé nhiÔm s¾c thÓ kh«ng t−¬ng ®ång. V× vËy, sù s¾p xÕp l¹i c¸c nhiÔm s¾c thÓ cã thÓ dÉn ®Õn sù h×nh thµnh hai quÇn thÓ kh«ng cßn cã kh¶ n¨ng giao phèi víi nhau n÷a, vµ nã trë thµnh mét b−íc trong con ®−êng dÉn ®Õn sù h×nh thµnh hai loµi t¸ch biÖt (chóng ta sÏ ®Ò cËp kü h¬n vÒ vÊn ®Ò nµy ë Ch−¬ng 24). §iÒu g©y ng¹c nhiªn mét chót lµ nh÷ng nghiªn cøu t−¬ng tù

®· ph¸t hiÖn ra nh÷ng mèi liªn quan ®Õn y häc. ViÖc ph©n tÝch c¸c ®iÓm ®øt g·y nhiÔm s¾c thÓ liªn quan ®Õn sù t¸i s¾p xÕp cña chóng cho thÊy nh÷ng ®iÓm nµy kh«ng hÒ ph©n bè ngÉu nhiªn, mµ chóng lµ nh÷ng ®iÓm ®Æc thï ®−îc dïng ®i dïng l¹i nhiÒu lÇn. NhiÒu “®iÓm nãng” t¸i tæ hîp nh− vËy t−¬ng øng víi vÞ trÝ s¾p xÕp l¹i nhiÔm s¾c thÓ trong hÖ gen ng−êi vèn cã liªn quan ®Õn c¸c bÖnh bÈm sinh. TÊt nhiªn, c¸c nhµ nghiªn cøu cßn quan t©m c¶ nh÷ng vÞ trÝ kh¸c cã thÓ liªn quan ®Õn nh÷ng bÖnh cho ®Õn nay ch−a ®−îc x¸c ®Þnh.

LÆp ®o¹n vµ sù ph©n ly cña c¸c vïng ADN cã kÝch th−íc t−¬ng øng víi gen C¸c lçi trong gi¶m ph©n còng cã thÓ dÉn ®Õn hiÖn t−îng lÆp c¸c vïng nhiÔm s¾c thÓ cã kÝch th−íc nhá h¬n nh÷ng vïng lÆp mµ chóng ta ®· ®Ò cËp trªn ®©y, trong ®ã bao gåm c¸c vïng t−¬ng øng víi chiÒu dµi cña c¸c gen ®¬n lÎ. Ch¼ng h¹n nh−, trao ®æi chÐo kh«ng c©n trong kú ®Çu gi¶m ph©n I cã thÓ dÉn ®Õn mét nhiÔm s¾c thÓ mÊt ®o¹n, trong khi mét nhiÔm s¾c thÓ kh¸c lÆp ®o¹n. Nh− minh häa trªn H×nh 21.12, c¸c yÕu tè vËn ®éng trong hÖ gen lµ nh÷ng vÞ trÝ mµ c¸c nhiÔm s¾c tö kh«ng chÞ em cã thÓ trao ®æi chÐo víi nhau, thËm chÝ ngay c¶ khi chóng kh«ng cã nh÷ng tr×nh t−¬ng ®ång xÕp th¼ng hµng chÝnh x¸c víi nhau. Ngoµi ra, hiÖn t−îng “tr−ît” cã thÓ x¶y ra trong sao chÐp

ADN, ch¼ng h¹n nh− m¹ch lµm khu«n xª dÞch so víi m¹ch t−¬ng ®ång míi ®−îc tæng hîp, hoÆc mét phÇn cña m¹ch lµm khu«n bÞ bé m¸y sao chÐp bá qua hay trong tr−êng hîp kh¸c nã ®−îc dïng lµm khu«n hai lÇn. KÕt qu¶ lµ mét ph©n ®o¹n ADN bÞ mÊt ®i hoÆc lÆp l¹i. Cã thÓ dÔ dµng t−ëng t−îng ra c¸ch mµ nh÷ng lçi nh− vËy cã thÓ xuÊt hiÖn trong c¸c vïng tr×nh tù lÆp l¹i gièng nh− c¸c tr×nh tù ADN lÆp l¹i ®¬n gi¶n ®· ®−îc m« t¶ ë trªn. C¸c tr×nh tù ADN lÆp l¹i ®¬n gi¶n víi sè l−îng biÕn ®éng t¹i mét vÞ trÝ nhÊt ®Þnh, vèn ®−îc dïng cho ph©n tÝch STR, cã thÓ lµ do nh÷ng lçi gièng nh− vËy. C¸c b»ng chøng vÒ trao ®æi chÐo kh«ng c©n vµ hiÖn t−îng “tr−ît” cña m¹ch khu«n trong sao chÐp ADN dÉn ®Õn lÆp gen ®−îc t×m thÊy ë nhiÒu hä ®a gen tån t¹i trong c¸c hÖ gen hiÖn nay.

Sù tiÕn hãa c¸c gen cã chøc n¨ng liªn quan víi nhau: C¸c gen globin ë ng−êi C¸c sù kiÖn lÆp ®o¹n nhiÔm s¾c thÓ hay lÆp gen cã thÓ dÉn ®Õn sù tiÕn hãa cña c¸c gen cã chøc n¨ng liªn quan ®Õn nhau, ch¼ng h¹n nh− c¸c hä gen m· hãa cho α-globin vµ β-globin (xem H×nh 21.10b). ViÖc so s¸nh c¸c tr×nh tù gen trong mét hä ®a gen cã thÓ chØ ra thø tù c¸c gen xuÊt hiÖn. C¸ch tiÕp cËn ®Ó “t¸i t¹o” l¹i lÞch sö tiÕn hãa cña c¸c gen m· hãa globin ®· chØ ra r»ng tÊt c¶ nh÷ng gen nµy ®Òu cã nguån gèc tõ mét gen globin tæ tiªn chung; gen tæ tiªn nµy ®· tr¶i qua hiÖn t−îng lÆp gen råi ph©n ly thµnh c¸c gen α-globin vµ β-globin tæ tiªn kho¶ng 450 - 500 triÖu n¨m tr−íc (H×nh 21.13, ë trang sau). Mçi gen tæ tiªn nµy sau ®ã tiÕp tôc ®−îc nh©n ®«i mét vµi lÇn, råi nh÷ng b¶n sao cña chóng ph©n ly khái nhau vÒ tr×nh tù, dÉn ®Õn h×nh thµnh c¸c gen thµnh viªn thuéc hä gen nh− hiÖn nay. Trong thùc tÕ, gen globin tæ tiªn chung còng cã thÓ lµ nguån gèc cña gen m· hãa protein c¬ liªn kÕt «xy cã tªn gäi lµ myoglobin vµ protein ë thùc vËt lµ leghemoglobin. Hai lo¹i protein nµy hoÆc ®éng ë d¹ng ®¬n ph©n, vµ c¸c gen cña chóng thuéc “siªu hä globin”. TiÕp theo sau c¸c sù kiÖn lÆp gen, sù kh¸c biÖt gi÷a c¸c gen

trong c¸c hä globin râ rµng xuÊt ph¸t tõ c¸c ®ét biÕn ®−îc tÝch lòy trong c¸c b¶n sao cña gen qua nhiÒu thÕ hÖ. VÝ dô, mét m« h×nh hiÖn nay cho r»ng chøc n¨ng thiÕt yÕu cña protein α-globin tr−íc ®©y cã thÓ ®−îc ®¸p øng chØ bëi mét gen duy nhÊt, do vËy c¸c b¶n sao kh¸c cña gen α-globin ®· cã thÓ tÝch lòy c¸c ®ét biÕn ngÉu nhiªn. RÊt nhiÒu ®ét biÕn cã thÓ ®· g©y h¹i cho

� H×nh 21.12 LÆp gen do trao ®æi chÐo kh«ng c©n. Mét c¬ chÕ mµ qua ®ã mét gen (hoÆc mét ®o¹n ADN kh¸c) cã thÓ bÞ lÆp l¹i (nh©n ®«i) lµ sù t¸i tæ hîp x¶y ra trong qu¸ tr×nh gi¶m ph©n gi÷a c¸c b¶n sao kh¸c nhau cña mét yÕu tè vËn ®éng n»m s¸t vïng biªn cña c¸c gen. Sù t¸i tæ hîp nh− vËy x¶y ra do sù “s¾p hµng lÖch” cña hai nhiÔm s¾c tö kh«ng chÞ em thuéc cÆp nhiÔm s¾c thÓ t−¬ng ®ång dÉn ®Õn sù h×nh thµnh mét nhiÔm s¾c tö mang hai b¶n sao cña gen, trong khi nhiÔm s¾c tö cßn l¹i th× kh«ng cã b¶n sao nµo cña gen ®ã.

YÕu tè vËn ®éng

Gen

C¸c nhiÔm s¾c tö kh«ng chÞ em

VÞ trÝ trao ®æi chÐo

Sù b¾t cÆp kh«ng chÝnh x¸c cña hai nhiÔm s¾c thÓ t−¬ng ®ång trong gi¶m ph©n

440 khèi kiÕn thøc 3 Di truyÒn häc

c¬ thÓ sinh vËt, trong khi mét sè ®ét biÕn kh¸c kh«ng g©y hËu qu¶ g×, nh−ng cã mét sè Ýt ®ét biÕn h¼n lµ ®· lµm thay ®æi chøc n¨ng cña s¶n phÈm protein theo c¸ch cã lîi cho c¬ thÓ sinh vËt vµo mét giai ®o¹n sèng nhÊt ®Þnh cña nã ®ång thêi kh«ng lµm thay ®æi chøc n¨ng vËn chuyÓn «xy cña protein. Cã thÓ gi¶ thiÕt r»ng: chän läc tù nhiªn ®· t¸c ®éng lªn nh÷ng gen nµy vµ duy tr× chóng trong quÇn thÓ. Sù gièng nhau vÒ c¸c tr×nh tù axit amin cña c¸c chuçi

polypeptit α-globin vµ β-globin ñng hé cho m« h×nh lÆp gen vµ tÝch lòy ®ét biÕn (B¶ng 21.2). Ch¼ng h¹n nh−, tr×nh tù axit amin cña c¸c β-globin gièng nhau h¬n rÊt nhiÒu so víi tr×nh tù cña α-globin. Sù tån t¹i cña mét sè gen gi¶ n»m gi÷a c¸c gen globin ho¹t ®éng lµ mét b»ng chøng bæ sung kh¸c ñng hé cho m« h×nh nµy (xem H×nh 21.10b). C¸c ®ét biÕn ngÉu nhiªn x¶y ra ë nh÷ng “gen” nµy qua thêi gian tiÕn hãa cã thÓ ®· lµm háng sù biÓu hiÖn chøc n¨ng b×nh th−êng cña chóng.

TiÕn hãa cña c¸c gen cã chøc n¨ng míi Trong qu¸ tr×nh tiÕn hãa cña c¸c hä gen globin, hiÖn t−îng lÆp gen vµ ph©n ly sau ®ã ®· t¹o nªn c¸c gen thµnh viªn mµ s¶n phÈm cña chóng ®Òu thùc hiÖn chøc n¨ng gièng nhau (vËn chuyÓn «xy). Theo mét c¸ch kh¸c, mét b¶n sao cña gen ®−îc nh©n ®«i cã thÓ tr¶i qua nh÷ng biÕn ®æi dÉn ®Õn sù xuÊt hiÖn mét chøc n¨ng hoµn toµn míi cña s¶n phÈm protein. C¸c gen m· hãa lysozyme vµ α-lactalbumin lµ mét vÝ dô nh− vËy. Lysozyme lµ mét enzym gióp b¶o vÖ c¬ thÓ ®éng vËt khái

sù l©y nhiÔm cña vi khuÈn b»ng viÖc xóc t¸c thñy ph©n thµnh tÕ bµo vi khuÈn; α-lactalbumin lµ mét protein kh«ng cã chøc n¨ng enzym, thay vµo ®ã nã gi÷ vai trß trong qu¸ tr×nh s¶n xuÊt s÷a ë ®éng vËt cã vó. Hai protein nµy rÊt gièng nhau vÒ tr×nh tù axit amin vµ cÊu tróc kh«ng gian ba chiÒu. C¶ hai gen ®−îc t×m thÊy ®ång thêi cã mÆt ë c¸c loµi ®éng vËt cã vó, nh−ng ë chim chØ t×m thÊy gen m· hãa lysozyme. §iÒu nµy chØ ra r»ng vµo mét thêi ®iÓm nhÊt ®Þnh nµo ®ã trong qu¸ khø, sau khi c¸c nh¸nh

dÉn ®Õn h×nh thµnh c¸c loµi ®éng vËt cã vó vµ chim ph©n ly khái nhau, gen lysozyme ®· tr¶i qua mét sù kiÖn lÆp gen trong nh¸nh tiÕn hãa h×nh thµnh c¸c ®éng vËt cã x−¬ng sèng, nh−ng kh«ng x¶y ra trong nh¸nh tiÕn hãa cña chim. Cuèi cïng, mét b¶n sao cña gen lysozym ®· ®−îc nh©n ®«i dÉn ®Õn sù tiÕn hãa h×nh thµnh gen m· hãa α-lactanbomin vèn lµ mét protein cã chøc n¨ng kh¸c biÖt ho¹t toµn.

Sù s¾p xÕp l¹i c¸c phÇn cña gen: nh©n ®«i vµ tr¸o exon Sù s¾p xÕp l¹i c¸c tr×nh tù ADN s½n cã trong c¸c gen còng ®· gãp phÇn vµo sù tiÕn hãa hÖ gen. Sù cã mÆt cña intron trong phÇn lín c¸c gen ë sinh vËt nh©n thËt ®a bµo cã thÓ ®· thóc ®Èy sù tiÕn hãa cña c¸c protein cã tiÒm n¨ng h÷u dông míi b»ng viÖc gia t¨ng hiÖn t−îng lÆp ®o¹n hay s¾p xÕp l¹i vÞ trÝ cña c¸c exon trong hÖ gen. Chóng ta nhí l¹i tõ Ch−¬ng 17 r»ng mçi exon th−êng m· hãa cho mét miÒn cã cÊu tróc vµ chøc n¨ng ®Æc thï cña protein. Chóng ta còng ®· biÕt trao ®æi chÐo

kh«ng c©n trong qu¸ tr×nh gi¶m ph©n cã thÓ dÉn ®Õn hiÖn t−îng lÆp gen trªn mét nhiÔm s¾c thÓ ®ång thêi lµm mÊt gen trªn nhiÔm s¾c thÓ t−¬ng ®ång víi nã (xem H×nh 21.12). B»ng mét qu¸ tr×nh t−¬ng tù, mét exon nhÊt ®Þnh trong gen cã thÓ bÞ nh©n ®«i trªn mét nhiÔm s¾c thÓ, song l¹i bÞ mÊt ®i trªn nhiÔm s¾c thÓ kia. C¸c gen mang c¸c exon lÆp l¹i cã thÓ m· hãa cho mét lo¹i protein chøa hai b¶n sao cña mét miÒn protein. Sù thay ®æi nµy trong cÊu tróc cã thÓ lµm t¨ng c−êng sù biÓu hiÖn chøc n¨ng cña protein nÕu protein ®ã lóc nµy trë nªn æn ®Þnh h¬n, vµ t¨ng kh¶ n¨ng liªn kÕt víi mét chÊt g¾n nhÊt ®Þnh hoÆc lµm thay ®æi mét sè thuéc tÝnh kh¸c. Kh¸ nhiÒu gen m·

� H×nh 21.13 Mét m« h×nh tiÕn hãa cña c¸c hä gen α-globin vµ β-globin tõ gen globin “tæ tiªn” duy nhÊt.

C¸c yÕu tè tr×nh tù mµu xanh lôc lµ c¸c gen gi¶. H·y gi¶i thÝch b»ng c¸ch nµo chóng cã thÓ xuÊt hiÖn sau khi ®· x¶y ra c¸c sù kiÖn lÆp gen.

B¶ng 21.2 TØ lÖ gièng nhau trong tr×nh tù axit amin gi÷a c¸c protein globin ë ng−êi

Gen globin “tæ tiªn”

Gen “tæ tiªn” ®−îc nh©n ®«i (lÆp gen)

§ét biÕn tÝch lòy ë c¶ hai b¶n sao

VËn ®éng tíi c¸c nhiÔm s¾c thÓ kh¸c

TiÕp tôc lÆp gen vµ tÝch lòy ®ét biÕn

Hä gen α-globin trªn nhiÔm s¾c thÓ sè 16

Hä gen α-globin trªn nhiÔm s¾c thÓ sè 11

Thêi gian tiÕn hãa

C¸c lo¹i αααα-globin C¸c lo¹i ββββ-globin

C¸c lo¹i αααα-globin

C¸c lo¹i ββββ-globin

Ch−¬ng 21 C¸c hÖ gen vµ sù tiÕn hãa cña chóng 441

hãa protein cã nhiÒu b¶n sao cña c¸c exon cã quan hÖ víi nhau mµ cã thÓ gi¶ thiÕt chóng h×nh thµnh sau mét qu¸ tr×nh lÆp ®o¹n vµ ph©n ly. Mét vÝ dô ®iÓn h×nh vÒ ®iÒu nµy lµ gen m· hãa protein m¹ng ngo¹i bµo collagen. Collagen lµ mét protein cÊu tróc cã tr×nh tù axit amin víi møc ®é lÆp l¹i cao ph¶n ¸nh sù lÆp l¹i cña c¸c exon trong gen collagen. Theo mét c¸ch kh¸c, chóng ta còng cã thÓ t−ëng t−îng sù

kÕt cÆp vµ ®«i khi phèi trén gi÷a c¸c exon kh¸c nhau cña cïng mét gen hoÆc gi÷a hai gen kh«ng alen víi nhau do c¸c lçi t¸i tæ hîp x¶y ra trong qu¸ tr×nh gi¶m ph©n. Qu¸ tr×nh nµy, ®−îc gäi lµ sù tr¸o exon, cã thÓ dÉn ®Õn sù h×nh thµnh nh÷ng protein míi víi nh÷ng tæ hîp chøc n¨ng míi. H·y xem vÝ dô vÒ gen m· hãa yÕu tè ho¹t hãa plasminogen m« (TPA, tissue plasminogen activator). Protein TPA lµ mét lo¹i protein ngo¹i bµo gióp ®iÒu khiÓn sù h×nh thµnh huyÕt khèi (trong qu¸ tr×nh ®«ng m¸u). Protein nµy gåm cã 4 miÒn chøc n¨ng thuéc 3 lo¹i kh¸c nhau; mçi miÒn ®−îc m· hãa bëi mét exon, trong ®ã cã mét exon xuÊt hiÖn víi hai b¶n sao. Do mçi lo¹i exon nµy còng ®−îc t×m thÊy ë nh÷ng protein kh¸c n÷a, nªn ng−êi ta cho r»ng gen m· hãa TPA ®· h×nh thµnh sau mét sè sù kiÖn lÆp ®o¹n vµ tr¸o exon (H×nh 21.14).

C¸c yÕu tè vËn ®éng gãp phÇn vµo sù tiÕn hãa cña hÖ gen nh− thÕ nµo ? Sù cã mÆt æn ®Þnh cña c¸c yÕu tè vËn ®éng vèn chiÕm mét phÇn lín hÖ gen ë mét sè sinh vËt nh©n thËt phï hîp víi ý t−ëng cho r»ng chóng gi÷ mét vai trß quan träng trong qu¸ tr×nh tiÕn hãa hÖ gen cña nh÷ng sinh vËt nµy. Nh÷ng yÕu tè nµy cã thÓ gãp phÇn vµo sù tiÕn hãa cña hÖ gen theo mét sè c¸ch. Chóng cã thÓ

thóc ®Èy c¸c hiÖn t−îng t¸i tæ hîp, lµm ®øt g·y c¸c gen hoÆc c¸c tr×nh tù ®iÒu hßa biÓu hiÖn gen, hoÆc vËn chuyÓn toµn bé mét gen nµo ®ã hoÆc c¸c vïng exon riªng lÎ tíi c¸c vÞ trÝ míi. C¸c yÕu tè vËn ®éng cã tr×nh tù gièng nhau n»m ph©n t¸n

kh¾p hÖ gen lµ ®iÒu kiÖn thóc ®Èy hiÖn t−îng t¸i tæ hîp gi÷a c¸c nhiÔm s¾c thÓ kh¸c nhau bëi nã cung cÊp nh÷ng vïng t−¬ng ®ång cho ho¹t ®éng trao ®æi chÐo. PhÇn lín nh÷ng thay ®æi nh− vËy cã lÏ lµ g©y h¹i, dÉn ®Õn hiÖn t−îng chuyÓn ®o¹n nhiÔm s¾c thÓ hoÆc nh÷ng thay ®æi kh¸c trong hÖ gen vèn cã thÓ g©y chÕt sinh vËt. Nh−ng qua thêi gian tiÕn hãa l©u dµi, mét sù kiÖn t¸i tæ hîp ngÉu nhiªn còng cã thÓ cã lîi cho c¬ thÓ sinh vËt. Sù di chuyÓn cña c¸c yÕu tè vËn ®éng còng cã thÓ g©y nªn

nh÷ng hËu qu¶ trùc tiÕp. VÝ dô, nÕu mét yÕu tè vËn ®éng “nh¶y” vµo gi÷a tr×nh tù m· hãa protein, th× nã sÏ ng¨n c¶n tÕ bµo s¶n xuÊt b¶n phiªn m· b×nh th−êng cña gen. NÕu mét yÕu tè vËn ®éng cµi vµo gi÷a mét tr×nh tù ®iÒu hßa, th× sù di chuyÓn ®ã cã thÓ dÉn ®Õn viÖc sinh tæng hîp mét hoÆc mét sè protein t¨ng lªn hoÆc gi¶m ®i. Sù di chuyÓn cña c¸c yÕu tè vËn ®éng cã thÓ g©y nªn c¶ hai kiÓu hiÖu øng trªn ®èi víi c¸c gen m· hãa cho c¸c enzym tæng hîp s¾c tè ë h¹t ng« trong thÝ nghiÖm cña McClintock. Mét lÇn n÷a, phÇn lín nh÷ng thay ®æi nh− vËy th−êng cã h¹i, song trong mét thêi gian tiÕn hãa dµi th× mét sè thay ®æi ®ã l¹i t¹o nªn −u thÕ vÒ kh¶ n¨ng sèng sãt. Trong qu¸ tr×nh di chuyÓn, c¸c yÕu tè vËn ®éng cã thÓ mang

theo mét gen hoÆc mét nhãm gen tíi mét vÞ trÝ míi trong hÖ gen. C¬ chÕ nµy cã thÓ gi¶i thÝch cho viÖc c¸c hä gen α-globin vµ β-globin ë ng−êi n»m trªn c¸c nhiÔm s¾c thÓ kh¸c nhau, còng nh− hiÖn t−îng c¸c gen thµnh viªn cña mét sè hä gen kh¸c n»m ph©n t¸n kh¾p hÖ gen. Bëi mét qu¸ tr×nh t−¬ng tù diÔn ra l©u dµi, mét exon tõ mét gen cã thÓ ®−îc cµi vµo mét gen kh¸c bëi c¬ chÕ gièng víi hiÖn t−îng tr¸o exon trong t¸i tæ hîp. VÝ dô nh−, mét exon cã thÓ ®−îc cµi vµo trong mét intron cña mét gen m· hãa protein bëi ho¹t ®éng cña mét yÕu tè vËn ®éng. NÕu exon ®−îc cµi vµo ®ã ®−îc duy tr× trong b¶n phiªn m· ARN trong qu¸ tr×nh hoµn thiÖn ARN, th× protein ®−îc tæng hîp ra sÏ cã thªm mét miÒn (domain) míi; ®iÒu nµy cã thÓ dÉn ®Õn mét chøc n¨ng míi cña protein. Mét nghiªn cøu gÇn ®©y cßn chØ ra mét c¸ch kh¸c mµ c¸c

yÕu tè vËn ®éng cã thÓ t¹o nªn c¸c tr×nh tù m· hãa míi. Nghiªn cøu nµy cho thÊy mét yÕu tè Alu cã thÓ “nh¶y” vµo trong mét intron theo c¸ch t¹o nªn mét vÞ trÝ c¾t intron míi ho¹t ®éng yÕu trªn b¶n phiªn m· ARN. Trong qu¸ tr×nh hoµn thiÖn b¶n phiªn m·, c¸c vÞ trÝ c¾t intron b×nh th−êng ®−îc dïng th−êng xuyªn h¬n, nh−ng ®«i khi intron l¹i ®−îc c¾t ë vÞ trÝ míi, dÉn ®Õn h×nh thµnh mét sè b¶n phiªn m· mARN hoµn thiÖn chøa c¶ yÕu tè Alu; kÕt qu¶ lµ yÕu tè nµy m· hãa cho mét phÇn míi cña protein. B»ng c¸ch nµy, mét kiÓu tæ hîp di truyÒn míi cã thÓ ®−îc “thö nghiÖm” trong khi chøc n¨ng cña s¶n phÈm gen gèc vÉn tiÕp tôc ®−îc duy tr×. Râ rµng, tÊt c¶ c¸c qu¸ tr×nh ®−îc th¶o luËn trong môc nµy

phæ biÕn h¬n c¶ lµ g©y h¹i, thËm chÝ cã thÓ g©y chÕt, hoÆc ®¬n gi¶n lµ kh«ng g©y nªn bÊt cø hËu qu¶ g×. Tuy vËy, trong mét sè Ýt tr−êng hîp, nh÷ng thay ®æi cã lîi cã thÓ xuÊt hiÖn. Qua nhiÒu thÕ hÖ, sù ®a d¹ng di truyÒn thu ®−îc sÏ lµ nguån nguyªn liÖu cã gi¸ trÞ cho chän läc tù nhiªn. Sù ®a d¹ng hãa c¸c gen vµ s¶n phÈm cña chóng lµ mét nh©n tè quan träng trong qu¸ tr×nh tiÕn hãa cña mét loµi míi. V× vËy, sù tÝch lòy nh÷ng thay ®æi trong hÖ gen cña mçi loµi còng chÝnh lµ b¶n ghi chÐp vÒ lÞch sö tiÕn hãa cña nã. §Ó ®äc ®−îc b¶n ghi chÐp nµy, chóng ta ph¶i x¸c

� H×nh 21.14 Sù tiÕn hãa cña mét gen míi b»ng c¬ chÕ trao ®æi exon. Sù trao ®æi exon cã thÓ gåm sù di chuyÓn exon tõ c¸c d¹ng tiÒn th©n cña gen m· hãa yÕu tè sinh tr−ëng biÓu b×, cña fibronectin vµ cña plaminogen (bªn tr¸i) vµo gen m· hãa yÕu tè ho¹t hãa plasminogen m« - TPA (bªn ph¶i). Thø tù x¶y ra c¸c sù kiÖn lµ ch−a râ. Sù nh©n ®«i cña exon "kringle" tõ gen plasminogen khi nã di chuyÓn gi¶i thÝch cho sù xuÊt hiÖn hai b¶n sao cña exon nµy trong gen TPA. Mçi lo¹i exon m· hãa cho mét miÒn ®Æc thï cña protein TPA.

B»ng c¸ch nµo sù cã mÆt cña c¸c yÕu tè vËn ®éng cã trong c¸c intron l¹i cã thÓ thóc ®Èy sù trao ®æi exon diÔn ra nh− ®−îc m« t¶ trªn ®©y ?

Gen yÕu tè sinh tr−ëng biÓu b× cã nhiÒu exon EGF (mµu xanh lôc)

Gen fibronectin cã nhiÒu exon “finger” (mµu vµng)

Gen plasminogen cã mét exon “kringle” (mµu xanh lam)

Tr¸o exon

Tr¸o exon

LÆp ®o¹n (nh©n ®«i) exon

442 khèi kiÕn thøc 3 Di truyÒn häc

®Þnh ®−îc nh÷ng thay ®æi diÔn ra trong hÖ gen. So s¸nh hÖ gen cña c¸c loµi kh¸c nhau gióp chóng ta thùc hiÖn ®−îc ®iÒu ®ã, ®ång thêi gióp chóng ta hiÓu râ h¬n c¸c hÖ gen tiÕn hãa nh− thÕ nµo. Chóng ta sÏ ®Ò cËp ®Õn nh÷ng chñ ®Ò nµy trong môc cuèi cïng d−íi ®©y thuéc ch−¬ng nµy.

Mét nhµ nghiªn cøu ®· vÝ giai ®o¹n ph¸t triÓn hiÖn nay cña sinh häc nh− Kû nguyªn Kh¸m ph¸ vµo thÕ kû thø XV sau khi lÜnh vùc hµng h¶i vµ ®ãng tµu vËn t¶i nhanh cã ®−îc hµng lo¹t c¸c tiÕn bé kü thuËt. Trong vßng 20 n¨m qua, chóng ta ®· chøng kiÕn nhiÒu tiÕn bé nhanh chãng trong gi¶i tr×nh tù c¸c hÖ gen vµ tËp hîp c¸c d÷ liÖu, còng nh− sù ph¸t triÓn cña nh÷ng kü thuËt míi cho phÐp ®¸nh gi¸ ho¹t ®éng cña c¸c gen trong kh¾p hÖ gen, vµ c¸c ph−¬ng ph¸p tinh vi cho phÐp t×m hiÓu b»ng c¸ch nµo c¸c gen vµ s¶n phÈm cña chóng cïng phèi hîp ho¹t ®éng trong c¸c hÖ thèng phøc t¹p. Chóng ta míi ë ®Çu ng−ìng cöa cña mét thÕ giíi míi. ViÖc so s¸nh tr×nh tù hÖ gen tõ c¸c loµi kh¸c nhau ®· cung

cÊp nhiÒu th«ng tin vÒ lÞch sö tiÕn hãa cña sù sèng tõ giai ®o¹n cæ ®¹i cho ®Õn gÇn ®©y. T−¬ng tù nh− vËy, c¸c nghiªn cøu so s¸nh vÒ ch−¬ng tr×nh di truyÒn ®· ®iÒu khiÓn qu¸ tr×nh ph¸t triÓn ph«i ë c¸c loµi kh¸c nhau ®ang b¾t ®Çu lµm s¸ng tá c¸c c¬ chÕ t¹o nªn sù phong phó vµ ®a d¹ng cña c¸c d¹ng sèng hiÖn nay. Trong môc nµy, chóng ta sÏ bµn luËn vÒ viÖc chóng ta ®· häc ®−îc g× tõ nh÷ng h−íng nghiªn cøu nµy.

So s¸nh hÖ gen Khi c¸c gen vµ hÖ gen cña hai loµi cµng gièng nhau vÒ tr×nh tù, th× chóng cµng cã quan hÖ gÇn gòi trong lÞch sö tiÕn hãa. ViÖc

so s¸nh hÖ gen cña c¸c loµi cã quan hÖ gÇn gòi gióp lµm s¸ng tá nhiÒu sù kiÖn tiÕn hãa trong thêi gian gÇn ®©y; trong khi ®ã, viÖc so s¸nh hÖ gen cña c¸c loµi cã kho¶ng c¸ch xa h¬n gióp chóng ta hiÓu vÒ lÞch sö tiÕn hãa cæ ®¹i. Trong c¶ hai tr−êng hîp, nh÷ng hiÓu biÕt vÒ nh÷ng ®Æc ®iÓm ®−îc chia sÎ chung vµ ph©n ly riªng gi÷a c¸c nhãm gióp chóng ta cã ®−îc bøc tranh ngµy cµng râ h¬n vÒ sù tiÕn hãa cña c¸c qu¸ tr×nh sinh häc vµ c¸c d¹ng sèng. Nh− ®· ®Ò cËp ë Ch−¬ng 1, mèi liªn hÖ tiÕn hãa gi÷a c¸c loµi cã thÓ biÓu diÔn b»ng s¬ ®å d¹ng c©y (th−êng cã chiÒu quay ngang), mµ trªn ®ã mçi ®iÓm ph©n cµnh chØ sù ph©n ly cña c¸c nh¸nh tiÕn hãa. H×nh 21.15 biÓu diÔn mèi quan hÖ tiÕn hãa cña mét sè loµi vµ nhãm loµi mµ chóng ta sÏ ®Ò cËp d−íi ®©y. Chóng ta sÏ c©n nh¾c so s¸nh gi÷a c¸c loµi cã quan hÖ xa nhau tr−íc.

So s¸nh gi÷a c¸c loµi cã quan hÖ xa nhau

ViÖc ph©n tÝch c¸c gen gièng nhau, th−êng quen gäi lµ cã tÝnh b¶o thñ cao, gi÷a nh÷ng loµi cã quan hÖ xa nhau gióp lµm s¸ng tá mèi quan hÖ tiÕn hãa gi÷a c¸c loµi vèn ph©n ly khái nhau tõ mét thêi ®iÓm rÊt l©u trong qu¸ khø. Trong thùc tÕ, viÖc so s¸nh tr×nh tù hÖ gen ®Çy ®ñ cña vi khuÈn, vi khuÈn cæ vµ sinh vËt nh©n thËt ®· chØ ra r»ng ba nhãm loµi nµy ®· ph©n ly khái nhau kho¶ng tõ 2 tØ ®Õn 4 tØ n¨m tr−íc, ®ång thêi ñng hé m¹nh mÏ gi¶ thuyÕt chóng lµ nh÷ng liªn giíi (l·nh giíi) sinh vËt sèng c¬ b¶n (xem H×nh 21.15). Ngoµi gi¸ trÞ sö dông trong nghiªn cøu tiÕn hãa, c¸c nghiªn

cøu hÖ gen häc so s¸nh cßn gióp kh¼ng ®Þnh sù phï hîp trong viÖc lùa chän nghiªn cøu ë c¸c sinh vËt m« h×nh tõ ®ã gióp chóng ta hiÓu biÕt ngµy cµng ®Çy ®ñ h¬n vÒ sinh häc nãi chung vµ vÒ sinh häc ng−êi nãi riªng. NhiÒu gen ®· tiÕn hãa qua mét thêi gian dµi, song cã thÓ vÉn gièng nhau mét c¸ch ng¹c nhiªn ë c¸c loµi kh¸c h¼n nhau. Mét vÝ dô vÒ ®iÒu nµy lµ mét sè gen ë nÊm men gièng víi mét sè gen g©y bÖnh nhÊt ®Þnh ë ng−êi ®Õn møc nh÷ng nhµ nghiªn cøu cã thÓ suy luËn ra chøc n¨ng cña nh÷ng gen g©y bÖnh nµy th«ng qua nghiªn cøu c¸c gen t−¬ng øng ë nÊm men. Sù gièng nhau ®¸ng ng¹c nhiªn nµy cho thÊy nguån gèc chung cña hai loµi cã quan hÖ xa nhau nµy.

So s¸nh gi÷a c¸c loµi cã quan hÖ gÇn gòi HÖ gen cña hai loµi cã quan hÖ gÇn gòi nhiÒu kh¶ n¨ng cã tæ chøc gièng nhau bëi v× chóng míi chØ ph©n ly khái nhau trong thêi gian gÇn ®©y. Nh− chóng ta ®· ®Ò cËp ë trªn, ®iÒu nµy cho phÐp hÖ gen cña mét loµi ®· ®−îc gi¶i tr×nh tù hoµn toµn cã thÓ ®−îc dïng lµm khung l¾p r¸p c¸c tr×nh tù hÖ gen cña mét loµi cã quan hÖ gÇn gòi víi nã, qu¸ ®ã lµm t¨ng tèc ®é lËp b¶n ®å hÖ gen cña loµi thø hai. VÝ dô nh−, b»ng viÖc sö dông hÖ gen ng−êi lµm b¶n h−íng dÉn, c¸c nhµ nghiªn cøu cã thÓ nhanh chãng gi¶i tr×nh tù hÖ gen cña chuét. Sù ph©n ly gÇn ®©y cña hai loµi cã quan hÖ gÇn còng lµ c¬

së cña hiÖn t−îng chØ cã mét sè Ýt sù kh¸c biÖt vÒ gen ®−îc t×m thÊy khi so s¸nh hÖ gen cña chóng víi nhau. Nh÷ng kh¸c biÖt di truyÒn nhÊt ®Þnh nhê vËy cã thÓ dÔ dµng ®èi chiÕu víi nh÷ng kh¸c biÖt h×nh th¸i gi÷a hai loµi. Mét øng dông lý thó cña kiÓu ph©n tÝch nµy ®−îc ph¸t hiÖn khi c¸c nhµ nghiªn cøu so s¸nh hÖ gen ng−êi víi c¸c hÖ gen cña tinh tinh, chuét nh¾t, chuét ®ång vµ c¸c ®éng vËt cã vó kh¸c. ViÖc x¸c ®Þnh ®−îc c¸c gen ®ång thêi cã mÆt trong hÖ gen cña tÊt c¶ nh÷ng loµi nµy nh−ng kh«ng cã trong hÖ gen cña c¸c loµi kh¸c vèn kh«ng ph¶i ®éng vËt cã vó sÏ cung cÊp “manh mèi” vÒ con qu¸ tr×nh tiÕn hãa vµ ph¸t

21.6 Kh¸i niÖm

So s¸nh c¸c tr×nh tù hÖ gen cung cÊp b»ng chøng vÒ c¸c qu¸ tr×nh tiÕn hãa vµ ph¸t triÓn

21.5

1. H·y nªu ba vÝ dô vÒ c¸c lçi x¶y ra trong c¸c qu¸ tr×nh cña tÕ bµo cã thÓ dÉn ®Õn hiÖn t−îng lÆp ®o¹n ADN?

2. Gi¶i thÝch b»ng c¸ch nµo nhiÒu exon cã thÓ xuÊt hiÖn trong c¸c gen EGF tiÒn th©n vµ fibronectin ®−îc vÏ trªn H×nh 21.14 (phÇn bªn tr¸i)?

3. Ba c¸ch mµ c¸c yÕu tè vËn ®éng ®−îc cho lµ ®· gãp phÇn vµo sù tiÕn hãa cña c¸c hÖ gen lµ g×?

4. N¨m 2005, c¸c nhµ khoa häc Ailen c«ng bè t×m thÊy mét ®¶o ®o¹n lín trªn nhiÔm s¾c thÓ ë 20% sè ng−êi B¾c ¢u, vµ hä nhÊn m¹nh r»ng nh÷ng phô n÷ Ailen mang ®¶o ®o¹n nµy cã nhiÒu con h¬n ®¸ng kÓ so víi nh÷ng ng−êi phô n÷ kh«ng mang ®¶o ®o¹n nµy. TÇn sè cña ®¶o ®o¹n nµy trong quÇn thÓ ng−êi Ailen ë c¸c thÕ hÖ t−¬ng lai ®−îc mong ®îi sÏ nh− thÕ nµo?

Xem gîi ý tr¶ lêi ë Phô lôc A.

KiÓm tra kh¸i niÖm

®iÒu g× NÕu

Ch−¬ng 21 C¸c hÖ gen vµ sù tiÕn hãa cña chóng 443

sinh cña líp ®éng vËt nµy; cïng lóc ®ã, nh÷ng gen ®−îc “chia sΔ chung gi÷a ng−êi vµ tinh tinh nh−ng kh«ng cã ë chuét ®ång cã thÓ cung cÊp b»ng chøng vÒ qu¸ tr×nh tiÕn hãa cña c¸c loµi linh tr−ëng. Vµ, tÊt nhiªn, viÖc so s¸nh gi÷a hÖ gen ng−êi víi hÖ gen tinh tinh cã thÓ gióp chóng ta tr¶ lêi c©u hái ®Çy th¸ch thøc ®· ®−îc nªu ngay ë ®Çu ch−¬ng nµy, ®ã lµ: th«ng tin nµo trong hÖ gen ®· t¹o nªn con ng−êi vµ tinh tinh? Mét ph©n tÝch tæng thÓ c¸c thµnh phÇn cña hÖ gen ng−êi vµ

tinh tinh vèn ®−îc cho lµ ph©n ly khái nhau chØ kho¶ng 6 triÖu n¨m tr−íc (xem H×nh 21.15) cho thÊy mét sè kh¸c biÖt c¬ b¶n. Khi c©n nh¾c c¸c thay thÕ ®¬n nucleotit, hai hÖ gen ng−êi vµ tinh tinh chØ kh¸c nhau kho¶ng 1,2%. Tuy vËy, khi c¸c nhµ nghiªn cøu ph©n tÝch c¸c ®o¹n ADN dµi h¬n, hä ®· rÊt ng¹c nhiªn khi t×m thÊy thªm 2,7% kh¸c biÖt do viÖc cµi thªm hay mÊt ®i cña nh÷ng vïng lín h¬n trong hÖ gen hoÆc ë loµi nµy hoÆc ë loµi kia; nhiÒu tr×nh tù cµi thªm lµ nh÷ng tr×nh tù ®−îc nh©n ®«i hoÆc lµ nh÷ng ®o¹n tr×nh tù ADN lÆp l¹i kh¸c. Trong thùc tÕ, mét phÇn ba c¸c ®o¹n tr×nh tù nh©n ®«i ë ng−êi kh«ng cã mÆt trong hÖ gen cña tinh tinh, vµ mét sè trong nh÷ng tr×nh tù nh©n ®«i nay chøa c¸c vïng cã liªn quan ®Õn c¸c bÖnh ë ng−êi. YÕu tè Alu cã mÆt nhiÒu h¬n trong hÖ gen ng−êi so víi hÖ gen tinh tinh, trong khi ®ã hÖ gen tinh tinh chøa nhiÒu b¶n sao tr×nh tù tiÒn virut cña c¸c retrovirut vèn kh«ng cã trong hÖ gen ng−êi. TÊt c¶ nh÷ng ph¸t hiÖn nµy ®· cung cÊp “manh mèi” vÒ c¸c ¸p lùc ®· lµm ph©n t¸ch hai hÖ gen theo hai con ®−êng kh¸c nhau; nãi vËy, nh−ng chóng ta vÉn ch−a cã bøc tranh ®Çy ®ñ vÒ nã. Ngoµi ra, chóng ta cßn ch−a râ b»ng c¸ch nµo nh÷ng kh¸c biÖt nµy dÉn ®Õn nh÷ng ®Æc ®iÓm ®Æc tr−ng ë mçi loµi. §Ó ph¸t hiÖn ra c¬ së dÉn ®Õn sù kh¸c biÖt h×nh th¸i gi÷a

hai loµi, c¸c nhµ sinh häc ®· nghiªn cøu c¸c gen ®Æc thï vµ c¸c lo¹i gen kh¸c nhau gi÷a ng−êi vµ tinh tinh vµ so s¸nh chóng víi

nh÷ng gen t−¬ng øng ë c¸c loµi ®éng vËt cã vó kh¸c. H−íng nghiªn cøu nµy ®· chØ ra mét sè gen râ rµng ®· biÕn ®æi (tiÕn hãa) nhanh h¬n ë ng−êi so víi tinh tinh còng nh− so víi chuét. Trong sè nh÷ng gen nµy cã c¸c gen liªn quan ®Õn c¸c c¬ chÕ b¶o vÖ c¬ thÓ chèng l¹i c¸c bÖnh sèt rÐt vµ lao vµ Ýt nhÊt liªn quan ®Õn mét gen ®iÒu hßa kÝch th−íc n·o. Khi xÐt vÒ chøc n¨ng, th× c¸c gen d−êng nh− tiÕn hãa nhanh nhÊt lµ c¸c gen m· hãa cho c¸c yÕu tè phiªn m·. §©y lµ mét th«ng tin hÊp dÉn bëi v× c¸c yÕu tè phiªn m· ®iÒu hßa sù biÓu hiÖn cña gen vµ do ®ã gi÷ vai trß chÝnh trong ®iÒu phèi c¸c ch−¬ng tr×nh di truyÒn chung. Mét yÕu tè phiªn m· mµ gen m· hãa

nã biÓu hiÖn biÕn ®æi nhanh trong nh¸nh tiÕn hãa ë ng−êi ®−îc gäi lµ FOXP2. Mét sè b»ng chøng chØ ra r»ng gen FOXP2 cã chøc n¨ng ph¸t triÓn kh¶ n¨ng ph¸t ©m ë ®éng vËt cã x−¬ng sèng. Tr−íc hÕt, c¸c ®ét biÕn x¶y ra ë gen nµy g©y nªn nh÷ng sai háng nghiªm träng vÒ kh¶ n¨ng ph¸t triÓn ng«n ng÷ vµ lêi nãi ë ng−êi. Ngoµi ra, gen FOXP2 còng ®−îc biÓu hiÖn trong n·o cña c¸c loµi chim sÎ vµ c¸c hoµng yÕn trong giai ®o¹n c¸c loµi chim nµy ®Õn ®é tuæi tËp

hãt. Nh−ng cã lÏ nh÷ng b»ng chøng thuyÕt phôc nhÊt b¾t nguån tõ nh÷ng thÝ nghiÖm “knock-out (bÊt ho¹t) gen” mµ Joseph Buxhaum vµ céng sù ®· tiÕn hµnh nh»m lµm háng gen FOXP2 ë chuét råi tiÕn hµnh ph©n tÝch kiÓu h×nh thu ®−îc (H×nh 21.16, xem trang bªn). C¸c chuét ®ét biÕn ®ång hîp tö cã n·o ph¸t triÓn bÊt th−êng vµ mÊt kh¶ n¨ng ph¸t ra ©m thanh siªu ©m b×nh th−êng, ®ång thêi c¸c c¸ thÓ chuét mang mét b¶n sao gen nµy bÞ háng còng gÆp vÊn ®Ò râ rÖt trong ph¸t triÓn ©m thanh. Nh÷ng kÕt qu¶ nµy ñng hé cho ý t−ëng cho r»ng gen FOXP2 ®· tiÕn hµnh bËt c¸c gen liªn quan ®Õn kh¶ n¨ng ph¸t ©m. Më réng tõ kh¸i niÖm nµy, c¸c nhµ nghiªn cøu ®ang kh¸m

ph¸ liÖu sù kh¸c nhau gi÷a protein FOXP2 ë ng−êi vµ tinh tinh cã ph¶i lµ nguyªn nh©n dÉn ®Õn kh¶ n¨ng ph¸t triÓn ng«n ng÷ giao tiÕp ë ng−êi vèn kh«ng cã ®−îc ë tinh tinh hay kh«ng. Protein FOXP2 ë ng−êi vµ tinh tinh chØ kh¸c nhau 2 axit amin duy nhÊt, vµ ¶nh h−ëng cña sù kh¸c biÖt nµy ®Õn chøc n¨ng cña protein ë ng−êi nh− thÕ nµo ®Õn nay vÉn lµ mét c©u hái bÝ Ên ch−a cã c©u tr¶ lêi.

C©u chuyÖn vÒ gen FOXP2 lµ mét vÝ dô ®iÓn h×nh vÒ viÖc b»ng c¸ch nµo c¸c c¸ch tiÕp cËn kh¸c nhau cã thÓ bæ sung cho nhau trong viÖc gióp kh¸m ph¸ c¸c hiÖn t−îng sinh häc cã ý nghÜa quan träng. Trong thÝ nghiÖm ®−îc minh häa trªn H×nh 21.16, chuét ®−îc dïng lµm m« h×nh thay thÕ cho con ng−êi, bëi v× trong nh÷ng thÝ nghiÖm nh− vËy, viÖc thùc hiÖn c¸c nghiªn cøu trªn ng−êi lµ kh«ng phï hîp vÒ ®¹o ®øc (còng nh− lµ kh«ng thùc tÕ). Chuét vµ ng−êi ph©n ly khái nhau c¸ch ®©y kho¶ng 65,5 triÖu n¨m (xem H×nh 21.15) vµ 85% c¸c gen gi÷a hai loµi lµ gièng nhau. Sù gièng nhau vÒ vËt chÊt di truyÒn nh− vËy cã thÓ ®−îc khai th¸c trong c¸c nghiªn cøu vÒ c¸c rèi lo¹n di truyÒn kh¸c ë ng−êi. NÕu c¸c nhµ

� H×nh 21.15 Mèi quan hÖ tiÕn hãa cña ba liªn giíi (l·nh giíi) sinh vËt. S¬ ®å h×nh c©y nµy cho thÊy sù ph©n ly tõ cæ x−a cña ba l·nh giíi vi khuÈn, vi khuÈn cæ vµ sinh vËt nh©n thËt. Mét phÇn cña nh¸nh tiÕn hãa cña sinh vËt nh©n thËt ®−îc t¸ch riªng cho thÊy sù ph©n ly cña ba loµi sinh vËt nh©n thËt ®−îc ®Ò cËp ®Õn ë ch−¬ng nµy.

Vi khuÈn

Tæ tiªn chung gÇn nhÊt cña tÊt c¶ c¸c d¹ng sèng hiÖn nay

Sinh vËt nh©n thËt

Vi khuÈn cæ

Tû n¨m tr−íc

Tinh tinh

Ng−êi

Chuét

TriÖu n¨m tr−íc

444 khèi kiÕn thøc 3 Di truyÒn häc

nghiªn cøu ®· biÕt c¸c m« vµ c¬ quan bÞ ¶nh h−ëng bëi mét rèi lo¹n di truyÒn nhÊt ®Þnh, hä cã thÓ t×m ra c¸c gen ®−îc biÓu hiÖn ë nh÷ng vÞ trÝ ®ã trong c¸c thÝ nghiÖm ®−îc tiÕn hµnh trªn chuét. H−íng nghiªn cøu nµy ®· gióp lµm s¸ng tá mét sè gen ®¸ng quan t©m ë ng−êi, bao gåm c¶ gen gãp phÇn g©y nªn héi chøng §ao.

C¸c nç lùc kh¸c ®ang tiÕp tôc ®−îc triÓn khai nh»m më réng c¸c nghiªn cøu hÖ gen ë c¸c loµi vi sinh vËt, c¸c loµi linh tr−ëng kh¸c, kÓ c¶ c¸c loµi ®· tõng bÞ l·ng quªn thuéc c¸c nh¸nh kh¸c nhau cña c©y sù sèng. Nh÷ng nghiªn cøu nµy gióp n©ng cao hiÓu biÕt cña chóng ta vÒ tÊt c¶ c¸c khÝa c¹nh sinh häc kh¸c nhau, bao gåm søc kháe vµ sinh th¸i còng nh− tiÕn hãa.

� H×nh 21.16 T×m hiÓu

ThÝ nghiÖm

KÕt qu¶

KÕt luËn

Nguån

§iÒu g× nÕu ?

Mét sè b»ng chøng ®· ñng hé cho gi¶ thiÕt vÒ vai trß cña gen FOXP2 trong qu¸ tr×nh ph¸t triÓn lêi nãi vµ ng«n ng÷ ë ng−êi vµ kh¶ n¨ng ph¸t ©m (ph¸t tiÕng) ë mét sè ®éng vËt cã x−¬ng sèng kh¸c. N¨m 2005, Joseph Buxham vµ c¸c céng sù t¹i Tr−êng §¹i häc Y khoa Mount Sinai vµ mét sè viÖt nghiªn cøu kh¸c ®· tiÕn hµnh t×m hiÓu chøc n¨ng cña gen FOXP2. Hä ®· sö dông chuét, lµ sinh vËt m« h×nh dÔ bÊt ho¹t gen, nh− mét ®éng vËt cã x−¬ng sèng cã kh¶ n¨ng ph¸t ©m ®¹i diÖn. Chuét ph¸t ra ©m thanh siªu ©m cã ©m vùc cao, gièng nh− tiÕng “rÝt”, mçi khi diÔn ®¹t tr¹ng th i̧ “stress”. C¸c nhµ nghiªn cøu ®· ¸p dông kü thuËt di truyÒn ®Ó t¹o ra c¸c con chuét cã mét hoÆc hai b¶n sao cña gen FOXP2 bÞ ph¸ háng.

KiÓu d¹i : cã hai b¶n sao gen FOXP2 b×nh th−êng

Chøc n¨ng cña gen FOXP2 lµ g× mµ nã l¹i tiÕn hãa nhanh trong qu ̧tr×nh h×nh thµnh loµi ng−êi?

Gen FOXP2 gi÷ vai trß quan träng trong sù ph¸t triÓn hÖ thèng liªn l¹c b»ng ©m thanh ë chuét. KÕt qu¶ nghiªn cøu nµy cñng cè thªm b»ng chøng cho c¸c nghiªn cøu ë chim vµ ng−êi cho thÊy gen FOX2P cã thÓ ho¹t ®éng chøc n¨ng gièng nhau ë nhiÒu loµi ®éng vËt kh¸c nhau.

Do kÕt qu¶ nghiªn cøu nµy ñng hé gi¶ thiÕt vÒ vai trß cña gen FOXP2 trong kh¶ n¨ng ph¸t ©m ë chuét, b¹n cã thÓ b¨n kho¨n liÖu protein FOXP2 cã ph¶i lµ protein cã vai trß ®iÒu hßa chÝnh trong kh¶ n¨ng ph¸t triÓn lêi nãi ë ng−êi hay kh«ng. NÕu biÕt tr×nh tù axit amin cña c¸c protein FOXP2 b×nh th−êng vµ ®ét biÕn ë ng−êi, còng nh− cña protein FOXP2 ë tinh tinh. B»ng c¸ch nµo b¹n kiÓm chøng ®−îc c©u hái trªn? Nh÷ng th«ng tin bæ sung nµo kh¸c cã thÓ t×m thÊy khi so s¸nh nh÷ng tr×nh tù nµy víi tr×nh tù axit amin cña protein FOXP2 ë chuét ?

KiÓu d¹i

(Kh«ng cã tiÕng "rÝt")

DÞ hîp tö: mét b¶n sao gen FOXP2 bÞ ph¸ háng

§ång hîp tö: c¶ hai b¶n sao gen FOXP2 bÞ ph¸ háng

DÞ hîp tö

§ång hîp tö

Sè tiÕng "rÝt"

KiÓu d¹i DÞ hîp tö §ång hîp tö

Hä sau ®ã so s¸nh kiÓu h×nh cña c¸c con chuét nµy. Hai ®Æc ®iÓm mµ hä ®· theo dâi ®−îc m« t¶ ë ®©y, ®ã lµ: gi¶i phÉu n·o vµ kh¶ n¨ng ph¸t tiÕng.

ThÝ nghiÖm 1: C¸c nhµ nghiªn cøu c¾t n·o chuét thµnh c¸c l¸t c¾t máng råi nhuém chóng víi c¸c hãa chÊt phï hîp ®Ó cã thÓ quan s¸t ®−îc cÊu tróc gi¶i phÉu cña n·o d−íi kÝnh hiÓn vi huúnh quang nguån s¸ng UV.

ThÝ nghiÖm 2: C¸c nhµ nghiªn cøu t¸ch c¸c con chuét con míi sinh ra khái mÑ cña chóng vµ ghi ©m sè tiÕng “rÝt” siªu ©m do chuét con ph¸t ra.

ThÝ nghiÖm 1: Sù ph¸ háng c¶ hai b¶n sao gen FOXP2 dÉn ®Õn sù bÊt th−êng trong cÊu tróc n·o, biÓu hiÖn ë sù hçn ®én cña c¸c tÕ bµo. ¶nh h−ëng kiÓu h×nh ®èi víi c¸ thÓ dÞ hîp tö ë møc ®é Ýt nghiªm träng h¬n.

ThÝ nghiÖm 2: Sù ph¸ háng c¶ hai b¶n sao gen FOXP2 dÉn ®Õn viÖc mÊt kh¶n¨ng ph¸t tiÕng khi ®¸p øng l¹i víi “stress”. ¶nh h−ëng ®èi víi kh¶ n¨ng ph¸t tiÕng cña dÞ hîp tö lµ ®¸ng kÓ.

Ch−¬ng 21 C¸c hÖ gen vµ sù tiÕn hãa cña chóng 445

So s¸nh hÖ gen trong ph¹m vi mét loµi Mét triÓn väng s¸ng sña kh¸c b¾t nguån tõ kh¶ n¨ng chóng ta cã thÓ ph©n tÝch c¸c hÖ gen lµ chóng ta sÏ ngµy cµng hiÓu biÕt h¬n vÒ phæ biÕn dÞ di truyÒn ë ng−êi. Do lÞch sö cña loµi ng−êi t−¬ng ®èi ng¾n - cã lÏ chØ kho¶ng 200.000 n¨m - nªn møc ®é biÕn dÞ di truyÒn ë ng−êi lµ nhá khi so s¸nh víi nhiÒu loµi kh¸c. PhÇn nhiÒu sù ®a d¹ng cña chóng ta d−êng nh− lµ do c¸c ®a h×nh ®¬n nucleotit (SNP, ®· ®−îc m« t¶ ë Ch−¬ng 20), th−êng ®−îc ph¸t hiÖn b»ng gi¶i tr×nh tù ADN. Trong hÖ gen ng−êi, c¸c SNP xuÊt hiÖn trung b×nh víi tÇn sè mét trong mçi ®o¹n tõ 100 ®Õn 300 cÆp baz¬. C¸c nhµ khoa häc ®· x¸c ®Þnh ®−îc vÞ trÝ cña vµi triÖu SNP

trong hÖ gen ng−êi vµ sÏ tiÕp tôc t×m thªm c¸c vÞ trÝ míi. Trong qu¸ tr×nh triÓn khai h−íng nghiªn cøu nµy, hä còng ®· t×m ra nhiÒu d¹ng biÕn dÞ kh¸c - gåm ®¶o ®o¹n, mÊt ®o¹n vµ lÆp ®o¹n - nh−ng kh«ng cã biÓu hiÖn g©y h¹i râ rÖt ®èi víi c¸c c¬ thÓ mang chóng. Nh÷ng d¹ng biÕn dÞ nµy, còng nh− c¸c SNP, sÏ lµ nh÷ng dÊu chuÈn di truyÒn hiÖu qu¶ trong nghiªn cøu tiÕn hãa ë ng−êi, trong viÖc ph¸t hiÖn c¸c kh¸c biÖt gi÷a c¸c quÇn thÓ ng−êi, vµ t×m ra con ®−êng di c− cña c¸c quÇn thÓ ng−êi qua lÞch sö. Sù ®a d¹ng di truyÒn nh− vËy trong ADN cña ng−êi còng sÏ lµ nh÷ng dÊu chuÈn cã gi¸ trÞ ®Ó x¸c ®Þnh ®−îc c¸c gen g©y bÖnh còng nh− c¸c gen cã nh÷ng ¶nh h−ëng ®Õn søc kháe cña chóng ta mét c¸ch Ýt râ rµng h¬n. Ngoµi viÖc cung cÊp cho chóng ta nh÷ng th«ng tin vÒ qu¸ tr×nh tiÕn hãa, viÖc ph©n tÝch nh÷ng ®Æc ®iÓm kh¸c biÖt trong hÖ gen cña c¸c c¸ thÓ cã thÓ sÏ lµm thay ®æi c¸c liÖu ph¸p y häc sau nµy trong thÕ kû 21.

So s¸nh qu¸ tr×nh ph¸t triÓn C¸c nhµ sinh häc thuéc lÜnh vùc sinh häc tiÕn hãa - ph¸t triÓn hay cßn th−êng ®−îc gäi t¾t lµ evo-devo th−êng tiÕn hµnh so s¸nh c¸c qu¸ tr×nh ph¸t triÓn cña c¸c c¬ thÓ ®a bµo kh¸c nhau. Môc tiªu cña hä lµ t×m hiÓu nh÷ng qu¸ tr×nh nµy ®· tiÕn hãa nh− thÕ nµo vµ b»ng c¸ch nµo nh÷ng thay ®æi trong qu¸ tr×nh ph¸t triÓn cã thÓ lµm biÕn ®æi nh÷ng ®Æc ®iÓm cña c¬ thÓ hoÆc thËm chÝ dÉn ®Õn sù h×nh thµnh c¸c ®Æc ®iÓm míi. Nhê c¸c tiÕn bé trong kü thuËt ph©n tö vµ lµn sãng th«ng tin vÒ c¸c hÖ gen gÇn ®©y, chóng ta b¾t ®Çu nhËn ra r»ng ë c¸c loµi cã quan hÖ hä hµng, dï cho chóng cã h×nh d¹ng kh¸c nhau râ rÖt, song sù kh¸c biÖt trong tr×nh tù cña c¸c gen còng nh− sù ®iÒu hßa biÓu hiÖn cña chóng th−êng rÊt nhá. ViÖc ph¸t hiÖn ra c¬ së ph©n tö dÉn ®Õn nh÷ng kh¸c biÖt nµy ®ång thêi gióp chóng ta cã ®−îc nh÷ng hiÓu biÕt vÒ nguån gèc cña v« sè c¸c d¹ng sèng ®a d¹ng ®ang cïng chung sèng trªn hµnh tinh nµy, qua ®ã cung cÊp th«ng tin cho c¸c nghiªn cøu tiÕn hãa cña chóng ta.

TÝnh b¶o tån phæ biÕn cña c¸c gen ®iÒu khiÓn ph¸t triÓn ë c¸c loµi ®éng vËt ë Ch−¬ng 18, chóng ta ®· ®Ò cËp ®Õn c¸c gen ®iÒu khiÓn ph¸t triÓn (homeotic genes) ë ruåi Drosophila cã vai trß cña chóng trong viÖc x¸c ®Þnh sù ph©n ®èt c¬ thÓ (xem H×nh 18.18). ViÖc ph©n tÝch ph©n tö c¸c gen ®iÒu khiÓn ph¸t triÓn ë Drosophila cho thÊy tÊt c¶ c¸c c¸ thÓ ®Òu cã mét tr×nh tù dµi 180 nucleotit ®−îc gäi lµ hép ®iÒu khiÓn (homeobox) m· hãa cho mét miÒn ®iÒu khiÓn (homeodomain) gåm 60 axit amin trong ph©n tö protein. Mét tr×nh tù gièng hÖt hoÆc rÊt gièng víi homeobox cña ruåi giÊm ®Õn nay ®· ®−îc t×m thÊy trong c¸c gen ®iÒu khiÓn ë nhiÒu loµi ®éng vËt cã x−¬ng sèng vµ kh«ng x−¬ng sèng. Nh÷ng tr×nh tù nµy gi÷a ng−êi vµ ruåi giÊm gièng nhau

®Õn nçi, trong thùc tÕ, mét nhµ nghiªn cøu ®· vÝ von “ruåi lµ nh÷ng con ng−êi nhá mang c¸nh”. Sù gièng nhau cña nh÷ng gen nµy cßn biÓu hiÖn ë c¸ch tæ chøc cña chóng: C¸c gen ë ®éng vËt cã x−¬ng sèng t−¬ng ®ång víi c¸c gen ®iÒu khiÓn ph¸t triÓn ë ruåi giÊm gièng hÖt nhau vÒ c¸ch s¾p xÕp trªn nhiÔm s¾c thÓ (H×nh 21.17). C¸c tr×nh tù chøa homeobox còng ®−îc t×m thÊy ë c¸c gen ®iÒu hßa ë nhiÒu sinh vËt nh©n thËt cã quan hÖ hä hµng rÊt xa nhau, ch¼ng h¹n nh− gi÷a thùc vËt vµ nÊm men. Tõ nh÷ng ®Æc ®iÓm gièng nhau nµy, chóng ta cã thÓ suy ra r»ng tr×nh tù ADN cña homeobox ®· h×nh thµnh tõ rÊt sím trong lÞch sö tiÕn hãa cña sù sèng vµ vai trß cña chóng ®èi víi c¸c c¬ thÓ

� H×nh 21.17 Sù b¶o thñ cña gen ®iÒu khiÓn ph¸t triÓn (homeotic genes) ë ruåi giÊm vµ chuét. C¸c gen ®iÒu khiÓn ph¸t triÓn cã vai trß ®iÒu phèi sù h×nh thµnh c¸c cÊu tróc ®Çu - ®u«i cña c¬ thÓ xuÊt hiÖn trªn nhiÔm s¾c thÓ theo c¸c trËt tù rÊt gièng nhau gi÷a ruåi Drosophila vµ chuét. Mçi b¨ng ®−îc t« mµu trªn nhiÔm s¾c thÓ ë ®©y biÓu diÔn cho mét gen “homeotic”. ë ruåi giÊm, tÊt c¶ c¸c gen ®iÒu khiÓn ph¸t triÓn ®−îc t×m thÊy trªn cïng mét nhiÔm s¾c thÓ. Chuét vµ c¸c loµi ®éng vËt cã vó kh¸c cã c¸c bé gen gièng nhau hoÆc gièng hÖt nhau ph©n bè trªn bèn nhiÔm s¾c thÓ kh¸c nhau. C¸c khèi mµu ®−îc vÏ trªn h×nh biÓu diÔn c¸c phÇn cña ph«i mµ ë ®ã nh÷ng gen cã mµu nµy ®−îc biÓu hiÖn mµ cuèi cïng dÉn ®Õn sù h×nh thµnh c¸c phÇn t−¬ng øng ë c¬ thÓ tr−ëng thµnh. Nh÷ng gen nµy gièng hÖt nhau khi so s¸nh gi÷a ruåi giÊm vµ chuét, ngo¹i trõ c¸c gen ®−îc t« mµu ®en, chóng gièng nhau Ýt h¬n so víi nh÷ng gen kia.

Ruåi giÊm tr−ëng thµnh

Ph«i ruåi giÊm (10 giê)

NhiÔm s¾c thÓ cña ruåi giÊm

Chuét tr−ëng thµnh

Ph«i chuét (12 ngµy)

C¸c nhiÔm s¾c thÓ cña chuét

446 khèi kiÕn thøc 3 Di truyÒn häc

quan träng ®Õn møc d−êng nh− chóng kh«ng biÕn ®æi qua hµng tr¨m triÖu n¨m ë c¶ ®éng vËt vµ thùc vËt. C¸c gen ®iÒu khiÓn ph¸t triÓn ë ®éng vËt ®−îc gäi ®Æt tªn lµ

c¸c gen Hox (viÕt t¾t cña c¸c gen mang tr×nh tù homeobox), bëi v× nh÷ng gen ®iÒu khiÓn ph¸t triÓn ®Çu tiªn ®−îc t×m thÊy chøa tr×nh tù homeobox. Cã nh÷ng gen chøa homeobox sau nµy ®−îc t×m thÊy kh«ng ho¹t ®éng nh− c¸c gen ®iÒu khiÓn ph¸t triÓn; nghÜa lµ chóng kh«ng trùc tiÕp x¸c ®Þnh c¸c phÇn vµ vÞ trÝ c¸c phÇn cña c¬ thÓ. Tuy vËy, phÇn lín nh÷ng gen nµy, Ýt nhÊt ë ®éng vËt, ®Òu liªn quan ®Õn qu¸ tr×nh ph¸t triÓn, qua ®ã cho thÊy chóng cã vai trß quan träng c¬ b¶n trong qu¸ tr×nh ph¸t triÓn vµ ®· xuÊt hiÖn tõ l©u trong qu¸ tr×nh tiÕn hãa. VÝ dô, ë Drosophila, c¸c tr×nh tù homeobox kh«ng chØ t×m thÊy trong c¸c gen ®iÒu khiÓn ph¸t triÓn mµ c¶ ë gen x¸c ®Þnh tÝnh ph©n cùc cña trøng cã tªn lµ bicoid (xem Ch−¬ng 18), ngoµi ra, nã cßn ®−îc t×m thÊy ë mét sè gen x¸c ®Þnh tÝnh ph©n ®èt vµ mét gen ®iÒu hßa qu¸ tr×nh ph¸t triÓn cña m¾t. C¸c nhµ nghiªn cøu ®· ph¸t hiÖn ra r»ng c¸c miÒn ®iÒu

khiÓn ®−îc m· hãa bëi homeobox lµ phÇn protein liªn kÕt víi ADN khi protein cã vai trß lµ mét yÕu tè phiªn m·. Tuy nhiªn, cÊu h×nh cña miÒn ®iÒu khiÓn cho phÐp nã liªn kÕt ®−îc víi mäi ph©n ®o¹n ADN; nghÜa lµ, b¶n th©n chóng kh«ng tù x¸c ®Þnh ®−îc mét tr×nh tù ADN ®Æc thï. Thay vµo ®ã, nh÷ng miÒn kh¸c trong ph©n tö protein chøa miÒn ®iÒu khiÓn, vèn cã møc ®é biÕn dÞ lín h¬n, míi x¸c ®Þnh gen nµo sÏ ®−îc nh÷ng protein nµy ®iÒu khiÓn. Sù t−¬ng t¸c gi÷a nh÷ng miÒn võa ®−îc nh¾c ®Õn ë sau víi nh÷ng yÕu tè phiªn m· kh¸c n÷a gióp cho c¸c protein mang miÒn ®iÒu khiÓn cã thÓ nhËn ra c¸c tr×nh tù t¨ng c−êng (enhancer) ®Æc thï trªn ph©n tö ADN. C¸c protein cã homeodomain cã thÓ ®· ®iÒu hßa qu¸ tr×nh ph¸t triÓn b»ng viÖc

®iÒu phèi ho¹t ®éng phiªn m· cña nh÷ng bé (tËp hîp) gen sinh tr−ëng kh¸c nhau, lµm chóng “bËt” hay “t¾t”. ë ph«i cña Drosophila vµ nhiÒu loµi ®éng vËt kh¸c, nh÷ng tæ hîp kh¸c nhau cña c¸c gen homeobox ®−îc ho¹t hãa ë nh÷ng phÇn kh¸c nhau. Sù biÓu hiÖn chän läc cña nh÷ng gen ®iÒu hßa nh− vËy, vèn kh¸c nhau vÒ thêi gian vµ vÞ trÝ trong qu¸ tr×nh ph¸t triÓn cña ph«i, lµ trung t©m cña sù h×nh thµnh mÉu h×nh c¬ thÓ. Bªn c¹nh c¸c gen ®iÒu khiÓn ph¸t triÓn, c¸c nhµ sinh häc

ph¸t triÓn cßn t×m thÊy nhiÒu gen kh¸c liªn quan ®Õn qu¸ tr×nh ph¸t triÓn vµ cã tÝnh b¶o thñ rÊt cao khi so s¸nh gi÷a c¸c loµi. Nh÷ng gen nµy bao gåm nhiÒu gen m· hãa cho c¸c thµnh phÇn cña c¸c con ®−êng truyÒn tÝn hiÖu. Sù gièng nhau mét c¸ch ®Æc biÖt gi÷a c¸c gen sinh tr−ëng nhÊt ®Þnh ë c¸c loµi ®éng vËt kh¸c nhau lµm n¶y sinh mét c©u hái: B»ng c¸ch nµo nh÷ng gen gièng nhau cã thÓ cïng tham gia vµo qu¸ tr×nh ph¸t triÓn ë nh÷ng loµi ®éng vËt mµ h×nh d¹ng cña chóng rÊt kh¸c nhau ? Nh÷ng nghiªn cøu gÇn ®©y ®· gãp phÇn gîi ý c©u tr¶ lêi ®èi

víi c©u hái nµy. Trong mét sè tr−êng hîp, nh÷ng thay ®æi nhá trong tr×nh tù ®iÒu khiÓn cña nh÷ng gen nhÊt ®Þnh cã thÓ lµm thay ®æi kiÓu biÓu hiÖn cña gen dÉn ®Õn nh÷ng thay ®æi lín vÒ h×nh d¹ng c¬ thÓ. H·y xem vÝ dô sau: c¸c kiÓu biÓu hiÖn kh¸c nhau cña c¸c gen Hox däc theo trôc c¬ thÓ ë c«n trïng vµ gi¸p x¸c cã thÓ gi¶i thÝch cho c¸c d¹ng biÕn dÞ vÒ sè c¸c ®èt th©n cã ch©n ë c¸c loµi ®éng vËt ph©n ®èt (H×nh 21.18). T−¬ng tù nh− vËy, nh÷ng nghiªn cøu gÇn ®©y chØ ra r»ng cïng mét s¶n phÈm cña gen Hox cã thÓ g©y nªn nh÷ng hiÖu øng kh¸c nhau ®«i chót ë nh÷ng loµi kh¸c nhau, gióp “bËt” nh÷ng gen míi hoÆc “bËt” nh÷ng gen gièng nhau song ë møc ®é biÓu hiÖn t¨ng lªn hoÆc gi¶m ®i. Trong nh÷ng tr−êng hîp kh¸c, cã nh÷ng gen gièng nhau nh−ng ®iÒu khiÓn c¸c qu¸ tr×nh ph¸t triÓn kh¸c nhau khi

xÐt ë c¸c loµi kh¸c nhau, dÉn ®Õn sù ®a d¹ng vÒ h×nh d¹ng c¬ thÓ. Ch¼ng h¹n nh−, mét sè gen Hox ®−îc biÓu hiÖn trong giai ®o¹n ph«i vµ Êu trïng ë loµi nhÝm biÓn vèn lµ mét loµi ®éng vËt kh«ng thuéc nhãm ph©n ®èt vµ cã s¬ ®å c¬ thÓ kh¸c hoµn toµn so víi c«n trïng vµ chuét. C¸c con nhÝm biÓn tr−ëng thµnh cã h×nh d¹ng c¬ thÓ nh− nh÷ng “chiÕc gèi c¾m kim”. Chóng thuéc nhãm loµi tõ l©u ®−îc dïng cho nghiªn cøu ph«i häc kinh ®iÓn (xem Ch−¬ng 47).

So s¸nh qu¸ tr×nh ph¸t triÓn gi÷a ®éng vËt vµ thùc vËt Tæ tiªn chung gÇn nhÊt cña ®éng vËt vµ thùc vËt cã lÏ lµ mét sinh vËt nh©n thËt ®¬n bµo sèng c¸ch ®©y hµng tr¨m triÖu n¨m; do vËy, c¸c qu¸ tr×nh ph¸t triÓn h¼n lµ ®· tiÕn hãa ®éc lËp víi nhau t¹o nªn hai nh¸nh sinh vËt ®a bµo. Thùc vËt tiÕn hãa cïng víi sù xuÊt hiÖn thµnh tÕ bµo cøng, g©y ng¨n c¶n sù vËn ®éng cña c¸c m« vµ tÕ bµo vèn lµ ®Æc ®iÓm quan träng ë ®éng vËt. Thay vµo ®ã, sù ph¸t sinh h×nh th¸i ë thùc vËt chñ yÕu phô thuéc vµo sù h×nh thµnh c¸c mÆt ph¼ng ph©n bµo kh¸c nhau vµ tÝnh gi·n në chän läc cña tÕ bµo. (Chóng ta sÏ ®Ò cËp

� H×nh 21.18 ¶nh h−ëng cña sù ®iÒu hßa biÓu hiÖn gen Hox kh¸c nhau trong qu¸ tr×nh ph¸t triÓn ë gi¸p x¸c vµ c«n trïng. Nh÷ng thay ®æi vÒ kiÓu biÓu hiÖn cña bèn gen Hox ®· diÔn ra qua thêi gian tiÕn hãa. Nh÷ng thay ®æi nµy phÇn nµo gi¶i thÝch cho sù kh¸c biÖt vÒ s¬ ®å c¬ thÓ gi÷a loµi t«m biÓn Artemia (mét loµi gi¸p x¸c, h×nh trªn) víi loµi ch©u chÊu (mét loµi c«n trïng, h×nh d−íi). §−îc minh häa ë ®©y lµ c¸c phÇn c¬ thÓ ®−îc t« mµu nh»m ph¶n ¸nh sù biÓu hiÖn cña c¸c gen Hox kh¸c nhau cã vai trß x¸c ®Þnh c¸c phÇn c¬ thÓ trong qu¸ tr×nh ph¸t triÓn ph«i. Mçi mµu ®¹i diÖn cho mét gen Hox ®Æc thï.

Ngùc C¸c ®èt sinh dôc Bông

Ngùc Bông

Ch−¬ng 21 C¸c hÖ gen vµ sù tiÕn hãa cña chóng 447

vÒ nh÷ng qu¸ tr×nh nµy ë Ch−¬ng 35.) Tuy cã nhiÒu kh¸c biÖt gi÷a ®éng vËt vµ thùc vËt, nh−ng c¸c c¬ chÕ ph©n tö cña qu¸ tr×nh ph¸t triÓn ë ®éng vËt vµ thùc vËt cã nhiÒu ®iÓm gièng nhau; cã lÏ, ®ã lµ di s¶n chung mµ chóng thõa h−ëng tõ t« tiªn.

ë c¶ ®éng vËt vµ thùc vËt, qu¸ tr×nh ph¸t triÓn phô thuéc vµo mét chuçi (gåm nhiÒu m¾t xÝch cña) c¸c yÕu tè ®iÒu hßa phiªn m· cã vai trß “bËt” hoÆc “t¾t” c¸c gen kh¸c nhau theo c¸c thø tù ®−îc ®iÒu khiÓn tinh vi. VÝ dô nh−, mét sè nghiªn cøu ë mét loµi thùc vËt cã hoa nhá thuéc hä mï t¹t lµ Arabidopsis thaliana cho thÊy sù s¾p xÕp táa trßn cña c¸c phÇn thuéc hoa còng gièng nh− sù h×nh thµnh trôc ®Çu - ®u«i ë Drosophila ®Òu liªn quan ®Õn mét chuçi c¸c yÕu tè phiªn m·. Tuy vËy, nh÷ng gen ®iÒu khiÓn nh÷ng qu¸ tr×nh nµy l¹i kh¸c nhau ®¸ng kÓ gi÷a ®éng vËt vµ thùc vËt. NÕu nh− kh¸ nhiÒu c¸c “c«ng t¾c ®iÒu hßa” ë Drosophila lµ c¸c gen Hox mang c¸c homeobox, th× c¸c gen ë Arabidopsis thuéc mét hä gen hoµn toµn kh¸c, ®−îc gäi lµ c¸c gen Mads-box. MÆc dï c¸c gen chøa c¸c homebox còng ®−îc t×m thÊy ë thùc vËt, còng nh− c¸c gen Mads-box còng ®−îc t×m thÊy ë ®éng vËt, song trong c¶ hai tr−êng hîp chóng kh«ng thùc hiÖn nh÷ng vai trß chÝnh gièng nhau trong qu¸ tr×nh ph¸t triÓn gièng nh− ë nhãm kia. Nh− vËy, c¸c b»ng chøng ph©n tö ñng hé cho gi¶ thiÕt r»ng: “ch−¬ng tr×nh ph¸t triÓn” ®· tiÕn hãa ®éc lËp víi nhau ë ®éng vËt vµ thùc vËt. Qua ch−¬ng cuèi cïng nµy thuéc khèi kiÕn thøc di truyÒn

häc, chóng ta ®· biÕt b»ng c¸ch nµo c¸c nghiªn cøu vÒ thµnh phÇn c¸c hÖ gen vµ so s¸nh hÖ gen gi÷a c¸c loµi cã thÓ lµm s¸ng tá qu¸ tr×nh tiÕn hãa cña c¸c hÖ gen. Ngoµi ra, b»ng viÖc so

s¸nh “ch−¬ng tr×nh ph¸t triÓn”, chóng ta cã thÓ thÊy sù thèng nhÊt cña sinh giíi ®−îc biÓu hiÖn qua sù gièng nhau vÒ c¸c c¬ chÕ ph©n tö vµ tÕ bµo ®−îc dïng ®Ó thiÕt lËp nªn c¸c mÉu h×nh c¬ thÓ, mÆc dï c¸c gen ®iÒu khiÓn qu¸ tr×nh ph¸t triÓn cã thÓ kh¸c nhau gi÷a c¸c sinh vËt kh¸c nhau. Sù gièng nhau gi÷a c¸c hÖ gen ®ång thêi ph¶n ¸nh tæ tiªn chung cña tÊt c¶ c¸c d¹ng sèng trªn Tr¸i ®Êt. Nh−ng sù kh¸c nhau còng lµ ®¸ng kÓ, tõ ®ã chóng ®· t¹o nªn sù ®a d¹ng phong phó cña c¸c loµi qua tiÕn hãa. Trong phÇn cßn l¹i cña cuèn s¸ch nµy, chóng ta sÏ më réng tÇm quan s¸t ra khái c¸c cÊp ®é ph©n tö, tÕ bµo vµ gen ®Ó kh¸m ph¸ sù ®a d¹ng cña sinh vËt ë cÊp ®é c¬ thÓ.

Tæng kÕt Ch−¬ng

H·y tham kh¶o c¬ së häc liÖu gåm c¸c h×nh ¶nh ®éng ba chiÒu, c¸c bµi h−íng dÉn d¹ng file MP3, video, c¸c bµi kiÓm tra thùc hµnh, eBook vµ nhiÒu häc liÖu kh¸c t¹i ®Þa chØ Web www.masteringbio.com

C¸c ph−¬ng ph¸p míi ®� gióp gia t¨ng tèc ®é gi¶i tr×nh tù c¸c hÖ gen (c¸c trang 427 –––– 429)

� Gi¶i tr×nh tù hÖ gen qua ba giai ®o¹n: Trong giai ®o¹n lËp b¶n ®å liªn kÕt, trËt tù cña c¸c gen vµ c¸c dÊu chuÈn di truyÒn kh¸c trong hÖ gen vµ kho¶ng c¸ch t−¬ng ®èi gi÷a chóng cã thÓ ®−îc x¸c ®Þnh th«ng qua c¸c tÇn sè t¸i tæ hîp. Trong giai ®o¹n tiÕp theo, b¶n ®å vËt lý dïng c¸c tr×nh tù gèi lªn nhau cña c¸c ph©n ®o¹n ADN ®Ó s¾p xÕp c¸c ph©n ®o¹n nµy vµo ®óng trËt tù cña chóng trong hÖ gen, ®ång thêi x¸c ®Þnh kho¶ng c¸ch gi÷a c¸c dÊu chuÈn tÝnh theo ®¬n vÞ cÆp baz¬. Cuèi cïng, ë giai ®o¹n thø ba, c¸c ph©n ®o¹n ADN ®· theo ®óng trËt tù ®−îc gi¶i tr×nh tù, tõ ®ã chóng ta thu ®−îc tr×nh tù hÖ gen ®Çy ®ñ.

� Gi¶i tr×nh tù ngÉu nhiªn toµn hÖ gen: Toµn hÖ gen ®−îc ph©n c¾t thµnh nhiÒu ®o¹n nhá, gèi lªn nhau. Nh÷ng ®o¹n nµy sau ®ã ®−îc gi¶i tr×nh tù, råi ®−îc r¸p nèi l¹i thµnh c¸c tr×nh tù hoµn chØnh nhê phÇn mÒm m¸y tÝnh. NÕu cã s½n c¸c th«ng tin vÒ b¶n ®å di truyÒn, th× viÖc r¸p nèi sÏ thuËn lîi vµ chÝnh x¸c.

Tãm t¾t c¸c kh¸i niÖm chÝnh

§a ph−¬ng tiÖn Ho¹t ®éng Dù ¸n hÖ gen ng−êi: C¸c gen trªn NST sè 17 cña ng−êi C¸c nhµ khoa häc øng dông tin sinh häc ®Ó ph©n tÝch c¸c hÖ gen vµ chøc n¨ng cña chóng (c¸c trang 429 –––– 432)

� TËp hîp d÷ liÖu ®Ó ph©n tÝch c¸c hÖ gen NhiÒu trang web trªn Internet cung cÊp tµi nguyªn truy cËp vµ t×m kiÕm tr×nh tù cña c¸c hÖ gen, c¸c c«ng cô ph©n tÝch còng nh− c¸c th«ng tin kh¸c cã liªn quan ®Õn c¸c hÖ gen.

� X¸c ®Þnh c¸c gen m� hãa protein trong c¸c tr×nh tù ADN ViÖc ph©n tÝch c¸c tr×nh tù hÖ gen nhê m¸y tÝnh gióp c¸c nhµ nghiªn cøu x¸c ®Þnh ®−îc c¸c tr×nh tù nhiÒu kh¶ n¨ng m· hãa cho c¸c protein. ViÖc so s¸nh c¸c tr×nh tù cña c¸c gen "míi" víi c¸c gen ®· biÕt ë nh÷ng loµi kh¸c cã thÓ gióp x¸c ®Þnh chøc n¨ng cña c¸c gen míi. §èi víi gen ch−a râ chøc n¨ng, viÖc g©y bÊt ho¹t gen thùc nghiÖm vµ quan s¸t hiÖu qu¶ kiÓu h×nh thu ®−îc cã thÓ cung cÊp ®Çu míi th«ng tin vÒ chøc n¨ng cña chóng.

� T×m hiÓu c¸c gen vµ c¸c s¶n phÈm cña gen ë cÊp ®é sinh häc hÖ thèng B»ng viÖc sö dông m¸y tÝnh vµ c¸c c«ng cô sinh tin häc, c¸c nhµ khoa häc cã thÓ so s¸nh c¸c hÖ gen vµ nghiªn cøu tËp hîp c¸c gen vµ protein nh− c¸c hÖ thèng hoµn chØnh (hÖ gen häc vµ hÖ protein häc). Nh÷ng nghiªn cøu nµy bao gåm c¸c ph©n tÝch vÒ t−¬ng t¸c protein ë quy m« lín.

§a ph−¬ng tiÖn

Kh¸i niÖm 21.2

Kh¸i niÖm 21.1

21.6

1. Theo b¹n, hÖ gen cña khØ gièng hÖ gen cña chuét h¬n hay gièng hÖ gen cña ng−êi h¬n? T¹i sao?

2. C¸c tr×nh tù ADN ®−îc gäi lµ c¸c homeobox, gióp c¸c gen ®iÒu khiÓn ph¸t triÓn ë ®éng vËt cã thÓ ®iÒu phèi ®−îc qu¸ tr×nh ph¸t triÓn, rÊt gièng nhau gi÷a ruåi vµ chuét. H·y gi¶i thÝch t¹i sao mÆc dï cã sù gièng nhau nµy, nh−ng h×nh th¸i cña c¸c ®éng vËt nµy lµ rÊt kh¸c nhau.

3. C¸c yÕu tè Alu trong hÖ gen ng−êi nhiÒu gÊp 3 lÇn so víi hÖ gen tinh tinh. Theo b¹n, b»ng c¸ch nµo hÖ gen ng−êi cã thªm nh÷ng b¶n sao cña c¸c yÕu tè Alu? H·y nªu mét vai trß cã thÓ cã cña yÕu tè Alu trong qu¸ tr×nh tiÕn hãa ph©n ly gi÷a hai loµi.

Xem gîi ý tr¶ lêi ë Phô lôc A.

KiÓm tra kh¸i niÖm

®iÒu g× NÕu

448 khèi kiÕn thøc 3 Di truyÒn häc

C¸c hÖ gen kh¸c nhau vÒ kÝch cì, sè gen vµ mËt ®é gen (c¸c trang 432 – 434)

Vi khuÈn Vi khuÈn cæ Sinh vËt nh©n thËt

KÝch cì hÖ gen

PhÇn lín trong kho¶ng 1 - 6 Mb

PhÇn lín trong kho¶ng 10 - 4000

Mb, nh−ng mét sè lín h¬n

Sè gen 1500 - 7500 5000 - 40.000

MËt ®é gen

Cao h¬n so víi sinh vËt nh©n thËt

ThÊp h¬n so víi sinh vËt nh©n s¬

(Trong c¸c sinh vËt nh©n thËt, mËt ®é gen thÊp h¬n ë c¸c hÖ gen lín h¬n)

C¸c intron

Kh«ng cã ë c¸c gen m· hãa protein

Cã ë mét sè gen

ë sinh vËt nh©n thËt ®¬n bµo: cã, song chØ phæ biÕn ë mét sè loµi ë sinh vËt nh©n thËt ®a bµo: cã ë phÇn lín gen

ADN kh«ng m� hãa kh¸c

ChØ cã rÊt Ýt trong hÖ gen

ChiÕm l−îng lín trong hÖ gen: nh×n chung cã nhiÒu tr×nh tù lÆp l¹i kh«ng m· hãa ë c¸c sinh vËt nh©n thËt ®a

bµo

Sinh vËt nh©n thËt ®a bµo cã nhiÒu ADN kh«ng m� hãa vµ nhiÒu hä ®a gen (c¸c trang 434 –––– 438) � ChØ cã 1,5% hÖ gen ng−êi m· hãa cho protein hoÆc cho rARN vµ

tARN; phÇn cßn l¹i lµ c¸c tr×nh tù ADN kh«ng m· hãa, bao gåm nhiÒu tr×nh tù ADN lÆp l¹i.

� C¸c yÕu tè di truyÒn vËn ®éng vµ c¸c tr×nh tù cã liªn quan ®Õn chóng. Lo¹i tr×nh tù ADN lÆp l¹i phæ biÕn nhÊt trong hÖ gen sinh vËt nh©n thËt ®a bµo lµ c¸c yÕu tè di truyÒn vËn ®éng vµ c¸c tr×nh tù cã liªn quan ®Õn chóng. Cã hai lo¹i yÕu tè vËn ®éng trong hÖ gen sinh vËt nh©n thËt: transposon vËn ®éng th«ng qua mét ph©n tö ADN trung gian, vµ retrotransposon cã møc ®é phæ biÕn cao h¬n vµ vËn ®éng th«ng qua mét ph©n tö ARN trung gian.

� C¸c tr×nh tù ADN lÆp l¹i kh¸c, bao gåm c¶ c¸c ADN tr×nh tù ®¬n gi¶n. NhiÒu tr×nh tù ng¾n kh«ng m· hãa lÆp l¹i liªn tôc hµng ngh×n lÇn (gäi lµ c¸c ADN tr×nh tù ®¬n gi¶n, bao gåm c¶ c¸c STR) cã mÆt ®Æc biÖt phæ biÕn ë vïng t©m ®éng vµ c¸c ®Çu mót nhiÔm s¾c thÓ; chóng cã thÓ cã vai trß quan träng trong cÊu tróc cña nhiÔm s¾c thÓ.

� C¸c gen vµ c¸c hä ®a gen. MÆc dï nhiÒu gen ë sinh vËt nh©n thËt chØ cã mét b¶n sao duy nhÊt trong bé nhiÔm s¾c thÓ ®¬n béi cña chóng, c¸c gen cßn l¹i (phÇn lín ë mét sè loµi) lµ thµnh viªn cña cïng hä c¸c gen cã quan hÖ víi nhau. §¬n vÞ phiªn m· t−¬ng øng víi ba lo¹i rARN lín nhÊt lÆp l¹i liªn tiÕp hµng tr¨m ngh×n lÇn trªn mét hoÆc mét sè vÞ trÝ kh¸c nhau cña c¸c nhiÔm s¾c thÓ; cÊu tróc nµy gióp tÕ bµo cã thÓ nhanh chãng tæng hîp rARN cÇn

Kh¸i niÖm 21.3

Kh¸i niÖm 21.4

LÆp ®o¹n, t¸i s¾p xÕp vµ ®ét biÕn trong tr×nh tù ADN ®ãng gãp vµo qu¸ tr×nh tiÕn hãa (c¸c trang 438 –––– 442) � Sù nh©n ®«i c¸c bé nhiÔm s¾c thÓ. C¸c sù kiÖn ngÉu nhiªn

trong qu¸ tr×nh ph©n bµo cã thÓ dÉn ®Õn c¸c tÕ bµo cã thªm nh÷ng b¶n sao cña tÊt c¶ hay mét phÇn hÖ gen. Nh÷ng hÖ gen nµy sau ®ã cã thÓ ph©n ly nÕu nh− mét bé nhiÔm s¾c thÓ tÝch lòy c¸c biÕn ®æi trong tr×nh tù ADN.

� Sù thay ®æi cÊu tróc nhiÔm s¾c thÓ. CÊu tróc nhiÔm s¾c thÓ c¸c hÖ gen cã thÓ ®−îc ®em so s¸nh gi÷a c¸c loµi, qua ®ã cung cÊp th«ng tin vÒ mèi quan hÖ tiÕn hãa. Trong ph¹m vi mét loµi nhÊt ®Þnh, sù s¾p xÕp l¹i c¸c nhiÔm s¾c thÓ ®−îc cho lµ mét c¬ chÕ ®ãng gãp vµo sù ph¸t sinh loµi míi.

� LÆp ®o¹n vµ sù ph©n ly cña c¸c vïng ADN cã kÝch th−íc t−¬ng øng víi gen. C¸c gen m· hãa cho c¸c lo¹i protein globin kh¸c nhau tiÕn hãa b¾t nguån tõ mét gen globin tæ tiªn chung; gen tæ tiªn nµy ®· nh©n ®«i vµ ph©n ly thµnh c¸c gen tæ tiªn cña α-globin vµ β-globin. HiÖn t−îng nh©n ®«i sau ®ã kÕt hîp víi c¸c ®ét biÕn ngÉu nhiªn ®· dÉn ®Õn sù h×nh thµnh c¸c gen hiÖn nay; tÊt c¶ nh÷ng gen nµy ®Òu m· hãa cho c¸c protein liªn kÕt «xy. C¸c b¶n sao kh¸c nhau cña gen lÆp ®· ph©n ly ®Õn møc mµ chøc n¨ng cña c¸c protein hiÖn nay do chóng m· hãa ®· trë nªn kh¸c nhau mét c¸ch c¨n b¶n.

� Sù s¾p xÕp l¹i c¸c phÇn cña gen: lÆp ®o¹n vµ trao ®æi exon. Sù s¾p xÕp l¹i c¸c exon trong ph¹m vi mét gen vµ gi÷a c¸c gen trong qu¸ tr×nh tiÕn hãa ®· dÉn ®Õn c¸c gen chøa nhiÒu b¶n sao cña c¸c exon gièng nhau vµ/hoÆc cña mét sè exon kh¸c nhau b¾t nguån tõ c¸c gen kh¸c.

� C¸c yÕu tè vËn ®éng gãp phÇn vµo sù tiÕn hãa cña hÖ gen nh− thÕ nµo ? Sù di chuyÓn cña c¸c yÕu tè vËn ®éng hay t¸i tæ hîp gi÷a c¸c b¶n sao cña cïng mét yÕu tè vËn ®éng ®«i khi t¹o ra nh÷ng tæ hîp tr×nh tù míi cã lîi cho c¬ thÓ sinh vËt. Nh÷ng c¬ chÕ nh− vËy cã thÓ lµm thay ®æi c¸c chøc n¨ng cña c¸c gen hoÆc kiÓu biÓu hiÖn hay ®iÒu hßa biÓu hiÖn cña chóng.

Phßng thÝ nghiÖm (PTN) sinh häc trùc tuyÕn PTN Hemoglobin

So s¸nh c¸c tr×nh tù hÖ gen cung cÊp b»ng chøng vÒ c¸c qu¸ tr×nh tiÕn hãa vµ ph¸t triÓn � So s¸nh c¸c hÖ gen C¸c nghiªn cøu so s¸nh hÖ gen gi÷a c¸c

loµi cã quan hÖ gÇn gòi còng nh− gi÷a c¸c loµi cã møc ®é ph©n ly xa h¬n cung cÊp nhiÒu th«ng tin gi¸ trÞ t−¬ng øng vÒ lÞch sö tiÕn hãa cËn ®¹i vµ cæ x−a. C¸c tr×nh tù hÖ gen ng−êi vµ tinh tinh kh¸c nhau kho¶ng 4%, chñ yÕu do thªm ®o¹n, mÊt ®o¹n, vµ lÆp ®o¹n trong mét nh¸nh tiÕn hãa. Cïng víi c¸c biÕn ®æi vÒ c¸c nucleotit trong nh÷ng gen ®Æc thï (vÝ dô nh− gen FOXP2, mét gen ¶nh h−ëng ®Õn kh¶ n¨ng ph¸t ©m), nh÷ng thay ®æi nµy cã thÓ gi¶i thÝch cho c¸c ®Æc ®iÓm kh¸c biÖt gi÷a hai loµi. C¸c ®a h×nh ®¬n nucleotit gi÷a c¸c c¸ thÓ trong ph¹m vi mét loµi còng cã thÓ cung cÊp th«ng tin vÒ lÞch sö tiÕn hãa cña loµi ®ã.

� So s¸nh qu¸ tr×nh ph¸t triÓn C¸c gen ®iÒu khiÓn ph¸t triÓn vµ mét sè gen kh¸c cã liªn quan ®Õn qu¸ tr×nh ph¸t triÓn ë ®éng vËt chøa mét vïng homeobox; ®ã lµ tr×nh tù gièng hÖt nhau hoÆc rÊt gièng nhau ë nhiÒu loµi. NhiÒu tr×nh tù cã quan hÖ víi nhau ®−îc t×m thÊy ®ång thêi ë c¸c hÖ gen cthùc vËt vµ nÊm men. C¸c gen ®iÒu hßa ph¸t triÓn kh¸c còng cã tÝnh b¶o thñ cao ë c¸c loµi ®éng vËt, nh−ng chóng cã thÓ cã vai trß kh¸c nhau trong qu¸ tr×nh ph¸t triÓn cña c¸c loµi kh¸c nhau. Trong qu¸ tr×nh ph¸t triÓn ph«i ë ®éng vËt còng nh− thùc vËt cã mét chuçi c¸c yÕu tè phiªn m· gióp bËt hoÆc t¾t c¸c gen theo mét trËt tù nghiªm ngÆt. Tuy vËy, c¸c gen ®iÒu khiÓn qu¸ tr×nh ph¸t triÓn t−¬ng tù l¹i cã tr×nh tù kh¸c nhau ®¸ng kÓ khi so s¸nh gi÷a ®éng vËt vµ thùc vËt; cã lÏ do tæ tiªn cña chóng ®· ph©n ly tõ l©u trong qu¸ tr×nh tiÕn hãa.

Kh¸i niÖm 21.5

§a ph−¬ng tiÖn

Kh¸i niÖm 21.6

Ch−¬ng 21 C¸c hÖ gen vµ sù tiÕn hãa cña chóng 449

chuét vµ ng−êi. §©y chÝnh lµ nh÷ng ph©n ®o¹n chøa tÊt c¶ c¸c axit amin kh¸c nhau trong protein FOXP2 khi so s¸nh gi÷a nh÷ng loµi nµy. 1. ATETI … PKSSD … TSSTT … NARRD 2. ATETI … PKSSE … TSSTT … NARRD 3. ATETI … PKSSD … TSSTT … NARRD 4. ATETI … PKSSD … TSSNT … SARRD 5. ATETI … PKSSD … TSSTT … NARRD 6. VTETI … PKSSD … TSSTT … NARRD H·y dïng bót ®¸nh dÊu b«i mµu vµo c¸c axit amin kh¸c biÖt gi÷a c¸c loµi. (phñ mµu lªn axit amin ®ã ë tÊt c¶ c¸c loµi.) Sau ®ã, tr¶ lêi c¸c c©u hái d−íi ®©y: a. C¸c tr×nh tù cña tinh tinh (T), khØ gorila (G) vµ khØ rªzut (R) gièng hÖt nhau. Nh÷ng dßng nµo t−¬ng øng víi nh÷ng loµi nµy.

b. Tr×nh tù ë ng−êi kh¸c víi tr×nh tù cña c¸c loµi T, G vµ R ë hai axit amin. Dßng nµo t−¬ng øng víi tr×nh tù cña ng−êi? G¹ch ch©n hai axit amin kh¸c biÖt.

c. Tr×nh tù cña ®−êi −¬i kh¸c víi tr×nh tù cña c¸c loµi T, G vµ R ë mét axit amin (thay thÕ alanine b»ng valine) vµ kh¸c víi tr×nh tù cña ng−êi ë ba axit amin. Dßng nµo t−¬ng øng víi tr×nh tù cña ®−êi −¬i ?

d. Cã bao nhiªu axit amin kh¸c biÖt gi÷a tr×nh tù cña chuét so víi tr×nh tù cña c¸c loµi T, G vµ R? Khoanh trßn vµo c¸c axit amin kh¸c biÖt ë chuét. Cã bao nhiªu axit amin kh¸c biÖt gi÷a chuét vµ ng−êi? VÏ h×nh vu«ng bao quanh axit amin kh¸c biÖt ë chuét.

e. C¸c loµi linh tr−ëng vµ bé gÆm nhÊm ph©n ly khái nhau c¸ch ®©y kho¶ng tõ 60 ®Õn 100 triÖu n¨m, cßn ng−êi vµ tinh tinh ph©n ly khái nhau c¸ch ®©y kho¶ng 6 triÖu n¨m. Tõ c¬ së ®ã, b¹n cã thÓ kÕt luËn ®iÒu g× khi so s¸nh sù kh¸c biÖt vÒ tr×nh tù axit amin gi÷a chuét víi c¸c loµi T, G vµ R ®ång thêi ®èi chiÕu víi sù kh¸c biÖt gi÷a ng−êi víi c¸c loµi T, G vµ R?

Xem gîi ý tr¶ lêi C¸c c©u hái tù ®¸nh gi¸ ë Phô lôc A.

Thùc hiÖn bµi KiÓm tra thùc hµnh t¹i trang web www.masteringbio.com

liªn hÖ víi tiÕn hãa

8. C¸c gen gi÷ vai trß quan träng trong ph¸t triÓn ph«i ë ®éng vËt, ch¼ng h¹n nh− c¸c gen mang miÒn homeobox, cã tÝnh b¶o thñ t−¬ng ®èi cao trong qu¸ tr×nh tiÕn hãa; nghÜa lµ, khi so s¸nh gi÷a c¸c loµi, chóng gièng nhau nhiÒu h¬n so víi nhiÒu gen kh¸c. T¹i sao l¹i nh− vËy?

T×m hiÓu khoa häc

9. C¸c nhµ khoa häc khi lËp b¶n ®å c¸c SNP trong hÖ gen ng−êi ®· ®Ó ý thÊy hiÖn t−îng c¸c nhãm SNP cã xu h−íng di truyÒn víi nhau thµnh tõng khèi vµ ®−îc gäi lµ c¸c ®¬n d¹ng (hoÆc ®¬n nh¸nh; haplotype) cã chiÒu dµi tõ 5000 ®Õn 200.000 cÆp baz¬. Mçi haplotype chØ cã kho¶ng tõ 4 ®Õn 5 kiÓu tæ hîp cña c¸c SNP xuÊt hiÖn phæ biÕn. H·y nªu gi¶ thiÕt gi¶i thÝch cho hiÖn t−îng nµy trªn c¬ së kÕt hîp c¸c th«ng tin thu nhËn ®−îc tõ ch−¬ng nµy nãi riªng vµ khèi kiÕn thøc di truyÒn häc nãi chung.

§a ph−¬ng tiÖn

C¸c c©u hái tù ®¸nh gi¸

1. Tin sinh häc bao gåm tÊt c¶ c¸c néi dung sau, trõ a. sö dông c¸c ch−¬ng tr×nh m¸y tÝnh ®Ó so s¸nh c¸c tr×nh tù ADN.

b. ph©n tÝch t−¬ng t¸c gi÷a c¸c protein trong mét loµi. c. sö dông sinh häc ph©n tö ®Ó kÕt hîp ADN tõ c¸c nguån kh¸c nhau trong ®iÒu kiÖn in-vitro.

d. ph¸t triÓn c¸c c«ng cô m¸y tÝnh ®Ó ph©n tÝch hÖ gen. e. sö dông c¸c c«ng cô to¸n häc ®Ó t×m hiÓu c¸c hÖ thèng sinh häc.

2. Loµi nµo d−íi ®©y cã hÖ gen lín nhÊt vµ mËt ®é gen thÊp nhÊt tÝnh theo sè cÆp baz¬ cã trong hÖ gen ? a. Haemophilus influenza (vi khuÈn) b. Saccharomyces cerevisiae (nÊm men) c. Arabidopsis thaliana (thùc vËt) d. Drosophila melanogaster (ruåi giÊm) e. Homo sapiens (ng−êi hiÖn ®¹i)

3. Mét ®Æc ®iÓm cña c¸c retrotransposon lµ a. chóng m· hãa cho mét enzym tæng hîp ADN sö dông

ARN lµm m¹ch khu«n. b. chóng chØ ®−îc t×m thÊy ë c¸c tÕ bµo ®éng vËt. c. chóng th−êng vËn ®éng bëi c¬ chÕ c¾t - d¸n. d. chóng ®ãng gãp mét phÇn ®¸ng kÓ vµo c¸c biÕn dÞ di

truyÒn quan s¸t thÊy trong mét quÇn thÓ c¸c giao tö. e. chóng ®−îc nh©n b¶n phô thuéc vµo mét retrovirut.

4. C¸c hä ®a gen lµ a. c¸c nhãm tr×nh tù t¨ng c−êng ®iÒu khiÓn phiªn m·. b. c¸c gen th−êng kÕt thµnh côm ë c¸c ®Çu mót. c. c¸c cÊu tróc t−¬ng øng víi c¸c operon cña sinh vËt nh©n s¬.

d. c¸c nhãm gen ®−îc ®iÒu khiÓn ®ång thêi. e. c¸c bé gen gièng hÖt nhau hoÆc rÊt gièng nhau tiÕn hãa qua qu¸ tr×nh lÆp gen.

5. Hai protein ë sinh vËt nh©n thËt chøa mét miÒn chøc n¨ng gièng nhau, song phÇn cßn l¹i cña chóng th× rÊt kh¸c nhau. Qu¸ tr×nh nµo d−íi ®©y nhiÒu kh¶ n¨ng gãp phÇn g©y ra sù gièng nhau nµy cña chóng ? a. LÆp gen d. BiÕn ®æi histone b. XÐn ARN e. C¸c ®ét biÕn ®iÓm ngÉu nhiªn c. Trao ®æi exon

6. C¸c gen ®iÒu khiÓn ph¸t triÓn (homeotic genes) a. m· hãa cho c¸c yÕu tè phiªn m· ®iÒu khiÓn sù biÓu hiÖn cña c¸c gen cã vai trß x¸c ®Þnh cÊu tróc gi¶i phÉu ®Æc thï.

b. chØ ®−îc t×m thÊy ë Drosophila vµ c¸c loµi th©n ®èt. c. lµ nh÷ng gen duy nhÊt mang miÒn homeobox. d. m· hãa cho c¸c protein h×nh thµnh nªn cÊu tróc gi¶i phÉu cña ruåi giÊm.

e. cã vai trß x¸c ®Þnh mÉu h×nh ph¸t triÓn cña thùc vËt.

7. ë phÝa trªn cña cét bªn lµ c¸c tr×nh tù axit amin (dïng kiÓu viÕt t¾t mét ch÷ c¸i; xem H×nh 5.17) thuéc bèn ph©n ®o¹n ng¾n cña protein FOXP2 ®−îc t×m thÊy ë 6 loµi kh¸c nhau, gåm: tinh tinh, ®−êi −¬i, khØ gorila, khØ rªzut,

KiÓm tra kiÕn thøc cña b¹n

vÏ tiÕp