55
1

バイオインフォマティックス概論授業予定 · Web view1.ショウジョウバエ(Drosophila)のhedgehogタンパク質のアミノ酸配列を、proteinデータベースからキーワード検索する(Accession

  • Upload
    others

  • View
    0

  • Download
    0

Embed Size (px)

Citation preview

Page 1: バイオインフォマティックス概論授業予定 · Web view1.ショウジョウバエ(Drosophila)のhedgehogタンパク質のアミノ酸配列を、proteinデータベースからキーワード検索する(Accession

1

Page 2: バイオインフォマティックス概論授業予定 · Web view1.ショウジョウバエ(Drosophila)のhedgehogタンパク質のアミノ酸配列を、proteinデータベースからキーワード検索する(Accession

H29 バ イ オ イ ン フ ォ マ テ ィ ッ ク ス 概 論 授 業 予 定

( 授 業 の 進 み 具 合 に よ っ て 変 更 の 可 能 性 が あ り ま す )

黒 字 は 、 講 義 に よ る 解 説 。 青 字 は ウ ェ ブ を 使 っ た 実 習 を 示 し ま す 。 黄 色 の 網 掛 け は 、 重 要 な

キ ー ワ ー ド

第 1 回 10 月 3日

授 業 概 要 説 明

Bioinformatics と は ?

ゲ ノ ム - 遺 伝 子 -mRNA- タ ン パ ク 質 の 関 係 の 復 習 ( D V D )

さ ま ざ ま な デ ー タ ベ ー ス ・ ゲ ノ ム デ ー タ ベ ー ス に 触 れ て み る

第 2 回 10 月 10日

配 列 デ ー タ ベ ー ス に つ い て の 解 説

配 列 デ ー タ ベ ー ス か ら の 塩 基 配 列 と ア ミ ノ 酸 配 列 の 取 り 出 し 方

配 列 エ ン ト リ ー の 見 方

ヒ ト 全 ゲ ノ ム 解 読 プ ロ ジ ェ ク ト に つ い て の 解 説 ( 1/ 3 )

ヒ ト ゲ ノ ム プ ロ ジ ェ ク ト の 歴 史 ・ 戦 術

連 鎖 地 図 作 製

宿 題 ( 1 ) : 配 布

第 3 回 10 月 17日

ホ モ ロ ジ ー 検 索 ( BLAST 検 索 ) に つ い て の 解 説

BLAST 検 索 の 実 習 ( 1/2 ) ( BLASTP )結 果 の 見 方

ヒ ト 全 ゲ ノ ム 解 読 プ ロ ジ ェ ク ト に つ い て の 解 説 ( 2/ 3 )

BAC ラ イ ブ ラ リ ー の 作 製 、 整 列 化

第 4 回 10 月 24日

BLAST 検 索 の 実 習 ( 2 /2 ) ( BLASTN, BLASTX, TBLASTX )

ヒ ト 全 ゲ ノ ム 解 読 プ ロ ジ ェ ク ト に つ い て の 解 説 ( 3 / 3 )

BAC ラ イ ブ ラ リ ー の シ ョ ッ ト ガ ン シ ー ケ ン ス

配 列 の ア セ ン ブ リ ー 、 コ ー ド 配 列 の 予 測 ( ア ノ テ ー シ ョ ン )

宿 題 ( 2 ) : 配 布

第 5 回 10 月 31日

MapViewer の 利 用 : 生 物 毎 の ゲ ノ ム デ ー タ ベ ー ス を 使 っ た BLAST 検 索

Whole genome shotgun sequence に よ る ゲ ノ ム 解 読

配 列 解 読 か ら 明 ら か に な っ た ヒ ト ゲ ノ ム の 特 徴

“ 宿 題 ( 1 ) : 提 出 ”

第 6 回 11 月 7日

配 列 ア ラ イ メ ン ト に つ い て の 解 説

ペ ア ワ イ ズ ア ラ イ メ ン ト の 実 際

多 重 配 列 ア ラ イ メ ン ト の 作 成 と 見 方 ( CLUSTALW )

2

Page 3: バイオインフォマティックス概論授業予定 · Web view1.ショウジョウバエ(Drosophila)のhedgehogタンパク質のアミノ酸配列を、proteinデータベースからキーワード検索する(Accession

分 子 系 統 樹 に つ い て

第 7 回 11 月 14日

分 子 系 統 樹 の 作 成

分 子 系 統 樹 か ら 分 か る こ と

ゲ ノ ム 構 造 の 変 化 と 生 物 進 化

ゲ ノ ム の 重 複 、 遺 伝 子 の 重 複 と 遺 伝 子 レ パ ー ト リ ー の 増 加

オ ル ソ ロ グ と パ ラ ロ グ の 発 生

遺 伝 子 の 並 行 進 化

宿 題 ( 3 ) 配 布

第 8 回 11 月 21日

代 謝 経 路 デ ー タ ベ ー ス ( KEGG ) の 利 用

KEGG を 使 っ た 演 習

例 : デ ー タ ベ ー ス を 使 っ て 、 dopamine の 合 成 経 路 、 合 成

部 位 、 作 用 機 序 、 薬 剤 等 に つ い て 情 報 収 集 す る

宿 題 ( 2 ) 提 出

第 9 回 11 月 28日

論 文 の 構 成 、 総 説 の 内 容

研 究 計 画 立 案 、 レ ポ ー ト ・ 論 文 作 成 に 必 要 な 文 献 情 報 収 集

文 献 検 索 ( PubMed, 大 学 図 書 館 On line journals )

EndNote に つ い て

宿 題 ( 4 ) 配 布

第 10 回 12 月 5日

酒 井 義 文 先 生 ( 本 学 工 学 研 究 科 情 報 科 学 出 身 ) に よ る 解 説

last 検 索 、 ClustalW 、 分 子 系 統 樹 の ア ル ゴ リ ズ ム と 原 理

( 鈴 木 : 分 子 生 物 学 会 に 出 席 )

第 11 回 12 月 12日

タ ン パ ク 質 の 構 造 に つ い て の 解 説 ( シ グ ナ ル ペ プ チ ド 、 疎 水 ・ 親 水

性 プ ロ ッ ト 、 ド メ イ ン 構 造 )

ウ ェ ブ サ イ ト を 使 っ た タ ン パ ク 質 の 構 造 解 析

塩 基 配 列 か ら ア ミ ノ 酸 配 列 へ の 変 換

分 子 量 と 等 電 点 の 予 測

シ グ ナ ル ペ プ チ ド の 予 測

ド メ イ ン 構 造 の 予 測

糖 鎖 結 合 部 位 の 予 測

“ 宿 題 ( 3 ) 提 出 ”

3

Page 4: バイオインフォマティックス概論授業予定 · Web view1.ショウジョウバエ(Drosophila)のhedgehogタンパク質のアミノ酸配列を、proteinデータベースからキーワード検索する(Accession

第 12 回 12 月 19日

ポ ス ト ゲ ノ ム 研 究 に つ い て : 21 世 紀 の 分 子 生 物 学

ポ ス ト ゲ ノ ム 研 究 - 1 : ゲ ノ ム編集 ( 遺 伝 子編集 )技術

CRISPR/Cas9 に よ る ゲ ノ ム編集 の 原 理 (動画 を 使 っ た 説 明 )

ゲ ノ ム編集 の農学 、医療へ の応用

プ ロ グ ラ ム を 使 っ て オ フ タ ー ゲ ッ ト の な い タ ー ゲ ッ ト 配 列 を設計

す る

ポ ス ト ゲ ノ ム 研 究 - 2 :次世 代 シ ー ケ ン ス 解 析

次世 代 シ ー ケ ン ス の 原 理

次世 代 シ ー ケ ン スで読 み 取 ら れ た リ ー ド の 情 報処理 ( 遺 伝 研 パ イ

プ ラ イ ン )

宿 題 (5) 配 布

12 月 2

6日

休講

第 13 回 1 月 9 日 次世 代 シ ー ケ ン ス 解 析 - 利 用 (1/ 4 )ゲ ノ ム 解 読 (参照ゲ ノ ム有=リ シ ー ケ ン ス.新規= de novoシ ー ケ ン ス )

ト ラ ン ス ク リ プ ト ー ム 解 析

次世代シーケンス解析-利用 (2/ 4)De novo ゲ ノ ム シ ー ケ ン ス の 遺 伝形質 解 析 へ の応用

ト ラ ン ス ク リ プ ト ー ム 解 析 の 生 物 研 究 へ の応用

ゲ ノ ム ブ ラ ウザEnsembl Genome Browser の 利 用

ゲ ノ ム 塩 基 配 列 を ゲ ノ ム デ ー タ ベ ー ス か ら 取 り 出 す

取 り 出 し た プ ロ モ ー タ ー 配 列 か ら 転 写 因 子 が 結 合 す る

Consensus配 列 を 予 測 す る

“ 宿 題 ( 4 ) 提 出 ”

4

Page 5: バイオインフォマティックス概論授業予定 · Web view1.ショウジョウバエ(Drosophila)のhedgehogタンパク質のアミノ酸配列を、proteinデータベースからキーワード検索する(Accession

第 14 回 1 月 16日

次世代シーケンス解析-利用 (3/ 4)Exome 解 析 : エ ク ソ ン の み に絞っ て 配 列 を比較す る こ と に よ

る 、 遺 伝形質 の 原因遺 伝 子 の同定 ( 一遺 伝 子 の 変異でメ ン デ ル

遺 伝 す る 遺 伝 子疾患に有効 )Genome Wide Association Study (GWAS) : SNP マーカー を

使 っ た 遺 伝形質 の責任遺 伝 子 の同定 ( 複数遺 伝 子 が 関与し 、 こ

れ まで解 析困難であ っ た 遺 伝形質 にも有効 )

次世 代 シ ー ケ ン ス 解 析 - 利 用 ( 4 / 4 ) :

RADシ ー ケ ン ス :簡便で高速な ゲ ノ ム 全体にわた る SNP マ ー

カー の 収 集 と 遺 伝形質 の責任遺 伝 子 の同定 → マ ーカー ア シ

ス ト育種に有効 ( 農林水産で有効 )

バ イ オ デ ー タ ベ ー ス の 利 用 ( 遺 伝 子 の 機 能 、 発現、 遺 伝 子疾患)

OMIM (Online Menderian Inheritance in Man)MGI (Mouse Genome Informatics)ZFIN (The Zebrafish Model Organism Database)

第 1 5回

最終回

1 月 2 3

ポ ス ト ゲ ノ ム 研 究 - 3 :比較ゲ ノ ム ( Comparative Genomics )

進 化 に伴う染色体構 造 の 変 化 ( 繰り返し 配 列 の 発 生 、 シ ン テ

ニー領域)

CNE(Conserved Noncoding element) : 進 化的に隔た っ た 生 物

間で高度に保存さ れ た非翻訳領域( 特 に 重 要 な転写調節領域)

プ ロ グ ラ ム を 使 っ て シ ン テニー を調べる

プ ロ グ ラ ム を 使 っ て CNE を調べる

“ 宿 題 (5) 提 出 ”

授 業評価

推薦図 書 とおもだっ た ウ ェ ブ サ イ ト は こ の ファイ ル の最後に掲示 し て あ り ま す 。

5

Page 6: バイオインフォマティックス概論授業予定 · Web view1.ショウジョウバエ(Drosophila)のhedgehogタンパク質のアミノ酸配列を、proteinデータベースからキーワード検索する(Accession

10 月 3 日 ( 第 1 回 )

講 義

1 ) 授 業 の 予 定 と 進め方

2 ) 「バ イ オ イ ン フ ォ マ テ ィ ッ ク ス」と は ?

3 ) 遺 伝 子 の 構 造 に つ い て の 復 習 : パ ワ ー ポ イ ン ト の ファイ ル を参照

4 ) 遺 伝 子 、転写、翻訳の 復 習 ( DVD を 使 っ て )

5) ゲ ノ ム デ ー タ ベ ー ス (動物 、植物 、菌類、 バ ク テ リ ア ) を のぞい て み る

6) どの ような デ ー タ ベ ー ス が 利 用できる か

使 用 す る DVD : 講談社ブ ル ー バ ッ ク ス B1582 「見 てわか る DNA の しくみ」

今日 は 第一回目の 授 業です ので、最初に今年の 授 業 予 定 を紹介し ま す 。 こ の 授 業 は 、 コ ン

ピュー タ ー を 使 っ た 実 習 と 講 義で進めま す 。 実 習では 、 ウ ェ ブ上で公開さ れ て い る デ ー タ ベ ー

スや配 列 解 析 プ ロ グ ラ ム を 使 い ま す 。

現在では 、 多様な 生 物 の ゲ ノ ム 配 列 が 解 読 さ れ 、 配 列 は一般にも利 用できる ように 整備さ れ

て い ま す 。 ど の よ う な 生 物 で ゲ ノ ム 解 読 が 行 わ れ て い る の か 、 ウ ェ ブ サ イ ト ( NCBI, Ensembl ) を 使 っ て少し のぞい て み ま しょう。 ま た 生 物 学 、 分 子 生 物 学 、農学 研 究 に 利 用でき

る デ ー タ ベ ー ス にどの ようなもの が あ る か を紹介し ま す 。

なおこ の テ キ ス トでは 、その 日 の 授 業で行う講 義 内 容 と コ ンピュー タ ー を 使 っ た 実 習 に つ い

て 、操作 方法を含めて簡単に 説 明 し て あ り ま す 。 必 要 に応じて 、 コピー 、 プ リ ン ト ア ウ ト し て

下さ い 。 講 義で使うパ ワ ー ポ イ ン ト の 図 は プ リ ン ト し たもの を資料と し て 配 布 し ま す 。 毎 回 、

翌週の プ リ ン ト を 配 り ま す 。 こ の テ キ ス ト と 配 布資料を 使 っ て 、 予 習 ・ 復 習 し て下さ い 。

————————————————————————————————

実 習

2 つ の ウ ェ ブ サ イ ト を開い て 、どの ような 生 物でゲ ノ ム 情 報 が 利 用できる か調べて み よう

1. NCBI (National Center for Biotechnology): http://www.ncbi.nlm.nih.gov/2. Ensembl Genome Browser: http://asia.ensembl.org/index.html

6

Page 7: バイオインフォマティックス概論授業予定 · Web view1.ショウジョウバエ(Drosophila)のhedgehogタンパク質のアミノ酸配列を、proteinデータベースからキーワード検索する(Accession

10 月 10 日 ( 第 2 回 )

今日 の 授 業 内 容

1. 実 習 : デ ー タ ベ ー ス か ら の ア ミ ノ 酸 配 列 、 塩 基 配 列 の 取 り 出 し 方

2. 実 習 : 配 列 エ ン ト リ ー に 示 さ れ て い る 情 報 に つ い て

3. 講 義 : ゲ ノ ム 解 読 プ ロ ジ ェ ク ト ( 1/2 )

実 習

塩 基 配 列 ・ ア ミ ノ 酸 配 列 の 収 集

配 列 デ ー タ ベ ー ス か ら 必 要 な タ ン パ ク 質 の ア ミ ノ 酸 配 列 、 遺 伝 子 の 塩 基 配 列 の 取 り 出 し 方 を 実

習 し ま す .

ア ミ ノ 酸 の 取 り 出 し 方

使 用 す る ウ ェ ブ サ イ ト : NCBI.先頭ペ ー ジ右側に あ る Popular Resources の中の「 Protein 」を 使 用 す る .あ る い は左上( All databases ) か ら選ぶこ とも可 能 .

キ ー ワ ー ド に よ る 検 索

例 : cow, prion でキ ー ワ ー ド 検 索 し て み よう

cow, prion と 関 連 す る タ ン パ ク 質 が 多数リ ス ト さ れ る が 、 先頭の 2 つ が目的の

配 列

タ ン パ ク 質名( 青 字 ) を ク リ ッ ク す る と 配 列 エ ン ト リ ー が表示 さ れ る ( 見 方 は

配付資料を参照)

FASTA を ク リ ッ ク す る と 配 列 が FASTA format で表示 さ れ る

配 列 は 、別の ファイ ル に コピーできる .Graphics では 、 タ ン パ ク の 構 造 が表示 さ れ る

Identical Proteins では 、別の名前が付け ら れ て い る同一タ ン パ ク 質 が表示 さ

れ る

Related Sequences では 、 関 連 す る タ ン パ ク 質 が表示 さ れ る

FASTA format 塩 基 配 列 と ア ミ ノ 酸 配 列 の ファイ ル フ ォ ー ム

「> 」で始ま る 1 行 が コ メ ン ト ( 遺 伝 子名や任意の番号やコ メ ン ト ) を記述す る た

めに 用意さ れ ており 、続く2 行目か ら 塩 基 配 列 あ る い は ア ミ ノ 酸 配 列 を記述す る 。

最後に改行 し て「 // 」を記載し 、 1 つ の 配 列 の記述が完了す る ( 記号「 // 」は なく

てもよ い )ホ モ ロ ジ ー 検 索 、 多 重 ア ラ イ メ ン ト 、 分 子 系 統 樹 作 成 等で使うフ ォ ー ム .

>NP_001258555.1 major prion protein preproprotein [Bos taurus]MVKSHIGSWILVLFVAMWSDVGLCKKRPKPGGGWNTGGSRYPGQGSPGGNRYPPQGGGGWGQPHGGGWG

7

Page 8: バイオインフォマティックス概論授業予定 · Web view1.ショウジョウバエ(Drosophila)のhedgehogタンパク質のアミノ酸配列を、proteinデータベースからキーワード検索する(Accession

QPHGGGWGQPHGGGWGQPHGGGWGQPHGGGGWGQGGTHGQWNKPSKPKTNMKHVAGAAAAGAVVGGLGGYMLGSAMSRPLIHFGSDYEDRYYRENMHRYPNQVYYRPVDQYSNQNNFVHDCVNITVKEHTVTTTTKGENFTETDIKMMERVVEQMCITQYQRESQAYYQRGASVILFSSPPVILLISFLIFLIVG//

塩 基 配 列 の 取 り 出 し 方

使 用 す る ウ ェ ブ サ イ ト : NCBI. Popular Resources の中の「Nucleotide」を 使 用 す る

1. キ ー ワ ー ド に よ る 検 索

例 : cow, prion でキ ー ワ ー ド 検 索 し て み よう

cow, prion の 配 列だけでなく、 関 連 遺 伝 子も多数検 索 さ れ てくる ため、 必 要 な

配 列 を 見 つ け る 必 要 が あ る .Bos taurus prion (PRNP), mRNA が今回 、欲し い 配 列

であ る .上の 遺 伝 子 質名を ク リ ッ ク す る と 配 列 エ ン ト リ ー が表示 さ れ る ( デ ー タ の 見 方

は 配付資料を参照の こ と )

FASTA を ク リ ッ ク す る と 配 列 が FASTA format で表示 さ れ る

配 列 は 、別の ファイ ル に コピーできる .Graphic では 、 ゲ ノ ム上の 位置が表示 さ れ る

2.ア ク セ ッ シ ョ ン番号に よ る 検 索

accession number=DDBJ/EMBL/GenBank 国際 塩 基 配 列 デ ー タ ベ ー ス におい て各登録

単 位 ( エ ン ト リ ー ; 各 遺 伝 子 ) に 発 行 さ れ る エ ン ト リ ー 識 別 子 ( entry identification, ID ) を指す 。

例 : NM_001271626 ( entry identification, ID )で検 索 し て み よう

なお表示 結 果 の詳細な 説 明 は 、次の サ イ トで閲覧できま す 。

http://hinv.ddbj.nig.ac.jp/manual_cdna-j.html

配 列 エ ン ト リ ー に 示 さ れ て い る デ ー タ

遺 伝 子名、 生 物名、 学名、 遺 伝 子座、 遺 伝 子 ク ロ ーニン グ を 行 っ た 論 文 リ ス ト 、翻訳

開始・終了点 、 ド メ イ ン 構 造 、 塩 基 配 列 、 ア ミ ノ 酸 配 列 ( 配付資料では 、 zebrafish, prion (NM_205586) を 使 っ て 説 明 し て あ り ま す )

講 義

ヒ ト ゲ ノ ム 解 読 プ ロ ジ ェ ク ト ( 1/3 )

国際 研 究 プ ロ ジ ェ ク ト に よ る ヒ ト ゲ ノ ム 計 画 (Human Genome Project) は 1990 年に着手

さ れ 、 13 年後の 2003 年に 解 読完了が宣言さ れ ま し た.ヒ ト ゲ ノ ム 計 画 は 、階層的シ ョ ッ ト

ガ ン法と呼ばれ る手法で行われ ま し た 。 す なわち連 鎖 地 図 の 作 成 か ら BAC ク ロ ー ン の 整 列 化 の

過程を 経 た のち、染色体上に マ ッ プ さ れ た BAC ク ロ ー ン を シ ョ ッ ト ガ ン法で解 読 し 、染色体レ

ベ ル に まで塩 基 配 列 を繋ぐと いう過程を 経 て 、 ゲ ノ ム 塩 基 配 列 の完全 解 読 に まで到達し ま し た 。

こ の プ ロ ジ ェ ク ト の間に 塩 基 配 列 の 解 析 能力( DNA シ ー ク エ ン サ ー ) は 大幅に ア ッ プ し 、同時

8

Page 9: バイオインフォマティックス概論授業予定 · Web view1.ショウジョウバエ(Drosophila)のhedgehogタンパク質のアミノ酸配列を、proteinデータベースからキーワード検索する(Accession

に 塩 基 配 列 を つ なぎ合わせる コ ンピュー タ ー の処理 能力も著しく進歩し た こ と に よ り 、 連 鎖 地

図 作 製 を省略し て 、 全 ゲ ノ ム を いきな り シ ョ ッ ト ガ ン法で読むこ と が 可 能 と な り ま し た.民間

企業 の シ エ ラ社は 、数年の あ いだに 全 ゲ ノ ム シ ョ ッ ト ガ ン法に よ り ヒ ト ゲ ノ ム を 解 読 す る こ と

に 成功し ま し た 。最終的に は 、国際 研 究 プ ロ ジ ェ ク ト と シ エ ラ社の間で協議の 結 果 、 解 読 成 果

が同時に公表さ れ ま し た.

ヒ ト ゲ ノ ム 計 画 の終了と前後し て 、 多くの 生 物で全 ゲ ノ ム 解 読 プ ロ ジ ェ ク ト が始めら れ 、最

近では 、次世 代 シ ー ケ ン サ ー の登場に よ り 、数ヶ月でゲ ノ ム 解 読 が 可 能 と な り ま し た.その た

め、既に数百種の動物で全 ゲ ノ ム 配 列 の 解 読 が終了し 、現在も新し い 生 物 の ゲ ノ ム 解 読 が次々

に完了し て い ま す.

ゲ ノ ム 情 報 は 、 遺 伝 子 の 機 能 解 析 の有力なツー ル に な る こ と は言うまでもあ り ませんが 、 生

物間でゲ ノ ム 構 造 を比較す る こ と に よ り 、無脊椎動物 か ら脊椎動物 の 進 化 の過程で起こ っ た ゲ

ノ ム 構 造 の 変 化 等も明 ら か に な り ま し た.ま た哺乳類の中でも単孔類(カモ ノハシ ) 、有袋類

( オ ポ ッ サ ム ) か ら有胎盤類に至る 進 化 の過程や、 ま た チ ン パ ン ジ ー と ヒ トでの知能 の差を ゲ

ノ ム 構 造 の 進 化 の観点 か ら議論 さ れ て い ま す.

全 ゲ ノ ム 塩 基 配 列 が 利 用できる と いう条件のもとで、 進めら れ る 遺 伝 子 機 能やゲ ノ ム 研 究 が

ポ ス ト ゲ ノ ム 研 究です.既に家畜や野菜や穀物植物 の ゲ ノ ムもほとんどの種で解 読 さ れ て い ま

す 。農学でも新し い 研 究 分野を開拓す る ために は 、 ゲ ノ ム 情 報 を有効に 利 用できる がどうか が 、

極めて 重 要 な素養と な り ま す.

ゲ ノ ム 解 読 に は 、階層的シ ョ ッ ト ガ ン法と 全 ゲ ノ ム シ ョ ッ ト ガ ン法の 2 通り の 方法が あ り 、

現在では 全 ゲ ノ ム シ ョ ッ ト ガ ン法が主流と な っ て い ま す 。 ま た こ の数年の間に 、次世 代 シ ー ケ

ン サ ー (NGS) が 実 用 化 さ れ 、既に ゲ ノ ム 解 読 は NGS を 使 っ て 、 全 ゲ ノ ム シ ョ ッ ト ガ ン法で解 読

す る の が主流と な っ て い ま す.NGS に よ る シ ー ケ ン ス の超高速化 に よ り 、様々な 生 物でゲ ノ ム

解 読 が 行われ て い ま す.NGS の 原 理 と 利 用法に つ い て は 授 業 の後半で解 説 し ま す.

**********************************************************************ゲ ノ ム 解 読 プ ロ ジ ェ ク トで解 析 さ れ た ゲ ノ ム DNA 配 列 情 報 は 、 NCBI と Ensemblで一般に

利 用できる よう整備さ れ て い ま す 。 遺 伝 子 の染色体上の 位置や類似遺 伝 子 の 検 索 に は NCBIが便利です 。 ゲ ノ ム の 塩 基 配 列 を デ ー タ ベ ー ス か ら 取 り 出 す場合 に は 、 NCBI あ る い は

Ensemblを 使 い ま す 。 NCBI と Ensemblの 使 い 方 は 、 授 業で実 習 し ま す 。 ゲ ノ ム 情 報 が い

か に強力なツー ル に な る か を体験し 、 実感し てもらおうと考えて い ま す 。

————————————————————————————————ゲ ノ ム 解 読 の 歴 史的な背景と 、 ゲ ノ ム 解 読 の 方法論 を 理 解 し てもらうために 、 授 業では階層

的シ ョ ッ ト ガ ン法で解 読 さ れ た ヒ ト ゲ ノ ム プ ロ ジ ェ ク ト を 例 に し て ゲ ノ ム 解 読 の道筋を 解 説 し

ま す.もはや、 歴 史 を振り返る ような感もあ り ま す が 、 ゲ ノ ム を 理 解 す る の にもよ い ので3 回

に 分 け て 解 説 し ま す 。

ヒ ト 全 ゲ ノ ム 塩 基 配 列 解 読 の 行程( 1/ 3 )

1 ) 連 鎖 地 図

2 ) BAC ラ イ ブ ラ リ ー 作 製

3 ) BAC ラ イ ブ ラ リ ー 整 列 化 ( 物 理 地 図 )

4 ) シ ョ ッ ト ガ ン シ ー ク エ ン ス

5) ア セ ン ブ ル

6) ア ノ テ ー シ ョ ン

9

Page 10: バイオインフォマティックス概論授業予定 · Web view1.ショウジョウバエ(Drosophila)のhedgehogタンパク質のアミノ酸配列を、proteinデータベースからキーワード検索する(Accession

10 月 17 日 ( 第 3 回 )

今日 の 授 業 内 容

1. 実 習 : ホ モ ロ ジ ー 検 索 BLASTP2. 実 習 : 検 索 結 果 の 見 方

3. 講 義 : ゲ ノ ム 解 読 プ ロ ジ ェ ク ト ( 2 /3)

実 習

ホ モ ロ ジ ー 検 索 ( BLAST検 索 ) 1/2 遺 伝 子やゲ ノ ム を扱う研 究で使 用 す る 機 会 が最も多 い プ ロ グ ラ ム が 、 塩 基 配 列やア ミ ノ 酸

配 列 の ホ モ ロ ジ ー (相同性 ) 検 索 プ ロ グ ラ ムです.実験で新し い 塩 基 配 列 が得ら れ た時に 、

遺 伝 子 を同定 す る ために 、最初に 行う操作 が相同性 検 索でだか らです.相同性 検 索 に よ り 、

ク ロ ーニン グ し た 遺 伝 子 が 、 デ ー タ ベ ー ス に登録さ れ て い るどの 遺 伝 子 と類似し て い る か を

調べる こ と ができま す.

次世 代 シ ー ク エ ン ス 解 析で得ら れ た 配 列 を ゲ ノ ム 配 列 に マ ッ プ す る 際 にもBLAST 検 索 が 用

い ら れ ま す.ゲ ノ ム 解 読 さ れ て い る 生 物であ れば、 100bp の短い 配 列 (次世 代 シ ー ケ ン サ ー

の 解 析では 、 1 リ ー ド は 100-120bp )でもゲ ノ ム のどの 位置に あ る か を調べる こ ともできま

す.ま た次世 代 シ ー ク エ ン ス 解 析 を 使 っ た ト ラ ン ス ク リ プ ト ー ム 解 析 (組織に 発現す る 遺 伝

子 を 網羅的に 配 列 解 読 と 遺 伝 子名の 特 定 、 発現量 の 解 析 ができる )では 、 解 読 し た 配 列 は ホ

モ ロ ジ ー (相同性 ) 検 索 の BLASTX で遺 伝 子名が判別さ れ ま す.

 授 業では 、 BLAST (Basic Local Alignment Search Tool) プ ロ グ ラ ム を 用 い ま す 。今日 は 、

塩 基 配 列 ・ ア ミ ノ 酸 配 列 の デ ー タ ベ ー ス 、問い 合わせ配 列 と デ ー タ ベ ー ス の組合せ、各組合

せで使う BLAST プ ロ グ ラ ム に つ い て 説 明 し ま す.その あ と テ ス ト 配 列 ( ア ミ ノ 酸 配 列 ) を

使 っ て 、 実 際 に BLAST 検 索 を 行 い ま す.

ホ モ ロ ジ ー ( homology ) 検 索 、 と は ?

問い 合わせ配 列 (query sequence) に対し 、類似し た 配 列 を デ ー タ ベ ー ス か ら探し 出 す

操作.最も高頻度に 利 用 さ れ る バ イ オ イ ン フ ォ マ テ ィ ッ ク ス の手法のひと つ.

検 索 内 容 :

例 ) 実験でク ロ ーニン グ し た 遺 伝 子 の種類を 特 定 す る 。それ が コ ー ド す る ア ミ ノ 酸 配

列 が デ ー タ ベ ー ス に登録さ れ て い る 遺 伝 子 、蛋白質 のどれ と 、 ま たどの程度類似す る

か ?

遺 伝 子 配 列 デ ー タ ベ ー ス : GenBank, DDBJ, EMBL

最 も 広 く利 用 さ れ ており 、 検 索 が高 速 な プ ロ グ ラ ム が BLAST(Basic Local Alignment Search Tool) です (昔、 FASTと言うプ ロ グ ラ ムも使われ て い た が 、現在はほとんど見

か け な い )

--------------------------------------------------------――――――――――――――――――-------------10

Page 11: バイオインフォマティックス概論授業予定 · Web view1.ショウジョウバエ(Drosophila)のhedgehogタンパク質のアミノ酸配列を、proteinデータベースからキーワード検索する(Accession

検 索 の組合せ          問い 合わせ配 列 対 デ ー タ ベ ー ス

----------------------------------------------------――――――――――――――――――-----------------BLASTN           塩 基 配 列 対 塩 基 配 列 デ ー タ ベ ー ス

BLASTP           ア ミ ノ 酸 配 列 対 ア ミ ノ 酸 配 列 デ ー タ ベ ー ス

BLASTX  塩 基 配 列 ( ア ミ ノ 酸 配 列 に置換 ) 対 ア ミ ノ 酸 配 列 デ ー タ ベ ー ス

TBLASTN           ア ミ ノ 酸 配 列 対 塩 基 配 列 デ ー タ ベ ー ス ( ア ミ ノ 酸

配 列 に置換 )

TBLASTX 塩 基 配 列 ( ア ミ ノ 酸 配 列 に置換 ) 対 塩 基 配 列 デ ー タ ベ ー ス 塩 基 配 列 ( ア ミ ノ

酸 配 列 に置換 )

----------------------------------------------------――――――――――――――――――-----------------

配 列 の種間変異の激し い 遺 伝 子 の場合 ( サ イ トカイ ン 等 ) 、 塩 基 配 列 を BLASTN 検 索 し て

も相同遺 伝 子 が デ ー タ ベ ー ス か ら 検 出 さ れ な い こ と が あ る.その場合でも、 BLASTX な ら

相同遺 伝 子 が ヒ ッ ト す る こ と が 多 い.その ため、 塩基配列で 相同遺伝子を 検索する 場合、一般に BLASTN よ り も BLASTX が 用い ら れ る .

**************************************************************************

BLAST 検 索 の 原 理 1. ホ モ ロ ジ ー が観察さ れ る 配 列間の局所ア ラ イ メ ン ト に は 、 多くの場合 、ギャッ プ を含ま

な い保存領域が存在す る 。 BLAST では 、その ような局所保存領域( ワ ー ド ) を まず高速

に 検 索 す る 。

2. 一致し た ワ ー ド か ら ア ラ イ メ ン ト を 配 列 に沿っ てそれぞれ の 方向に拡張し て いき、 ス コ

ア が 増 加 す る まで続け る 。拡張処理 は 、 ス コ ア の 増 加 が止ま り 、伸ばす前の ベ ス ト ス コ

ア よ り減少し始めた時に終了す る 。 こ の時点で、 HSP (high-scoring segment pair) と呼ば

れ る 、 大きな 配 列領域が 見 つ か る 。 こ の時点でギャッ プ が あ る とそこ か ら 先 に は伸長し

て い な い 。

3. 一般に 、 ア ミ ノ 酸 配 列 と 塩 基 配 列 に はギャッ プ が 生じて い る ため、 HSP の みでは類似領

域の 検 索 と し て不十分であ る 。そこで、 BLAST では 、 HSP におい て対応す る 位置に存在

す る 1 組の記号の ペ ア を適切に選び、類似度の高い領域は こ の ペ ア を含むもの と仮定 し

て 、動的計 画法と呼ばれ る 方法を 用 い て類似領域を探索 す る 。 HSP か ら選んだペ ア を起

点 と し て探索範囲を狭く取 る こ と に よ っ て 、類似度の最適性 は保証さ れ な いもの の 、従

来の動的計 画法と比較し て高速な類似領域の探索 を 実現し て い る 。

(詳細は 、 12 月 5 日 に 酒 井 先 生 が 解 説 し ま す 。 )

ス コ アア ミ ノ 酸 配 列 の場合 : BLOSUM62 ス コ ア ( ア ミ ノ 酸 の組合せに よ っ て値が決めら れ て い る )

塩 基 配 列 の場合 :値は同じ塩 基 、異な る 塩 基 の組合せでの み決めら れ て い る

     ————————————————————————————————

BLASTP 実 習

>test_DNA_sequence-1 (私の 研 究 グ ル ー プで単離し た 遺 伝 子で、既に デ ー タ ベ ー ス に登録

済みであ る :由来生 物 zebrafish .遺 伝 子名 charon 、 機 能=内臓・脳の非対称性制御) と ア

ミ ノ 酸 配 列 を下に 示 し ま し た 。試し に こ の ア ミ ノ 酸 配 列でBLASTP 検 索 し て み よう .11

Page 12: バイオインフォマティックス概論授業予定 · Web view1.ショウジョウバエ(Drosophila)のhedgehogタンパク質のアミノ酸配列を、proteinデータベースからキーワード検索する(Accession

BLASTP の操作手順

1.NCBI 先頭ペ ー ジ右上 Popular Resources か ら BLASTを選択す る 。 Basic BLASTに上記 5 種類の BLAST プ ロ グ ラ ム の ア イ コ ン が あ る.

2. protein blastを ク リ ッ ク す る 。 ア ミ ノ 酸 配 列 (FASTA format) を枠内 に コピー す

る 。 Database (non-redundant protein sequences (nr) ), Algorithm (blastp; protein-protein BLAST) は 、 デ フ ォ ル ト の ま までよ い.

3.BLASTのボタ ン を押し て 、 検 索 を開始す る 。

>test_DNA_sequence-1(zebrafish_charon)_protein-seq

MTFQVGFFVLLSVTTIGAFPRNAFQREFHRHVAKDFESSGNGPDEPVRGSVRIVKLNPHFLRRAAVSHVPFRNSPSRGAFP

AFLALGRPGPAILTHSKPAPQVSSSADRRKQGLEMWKKVVHKSERKKEAVALRINPKDMNKQSCAAVPFTQRITEEGCETV

TVHNNLCYGQCSSMFVPSSGGSHGQQKAQCMRCGPSRARSVLLHLRRGSEVRERRVLIVEECKCETSSEEAKVQNTDMFNL

デ ー タ ベ ー ス に登録さ れ て い る

PSI-BLASTP, PHI-BLAST: 比較的最近開発 さ れ た プ ロ グ ラ ムで、 系 統的に離れ た 生 物 あ

る い は 関 連 遺 伝 子 を 検 索 す る場合 に 利 用 す る . 種間の保存性 が低い 遺 伝 子 の場合 に

利 用価値が高い .

検 索 結 果 の 見 方 :

グ ラ フ ィ ッ ク の次に 示 さ れ て い る数値の 説 明

E-value : 検 索 結 果 は 、 Query 配 列 と相同性 を 示 す 配 列 の ア ラ イ メ ン ト 結 果 が表示

さ れ る 。 e-value は 、 検 索 に 使 っ た デ ー タ ベ ー ス の な かで、 Query の局所配 列 と

検 索 配 列 の組合わせが 、偶然に み つ か る個数を 示 す 。相同性 が高いほど、値は 0に近づく(最も重 要 な デ ー タ :蛋白質 の場合 、 e-5あ た り が 関 連 遺 伝 子 か 、そうで

な い か を判断す る 基準と な る ) 。 検 索 結 果 の数値のうち、最も重 要であ る.

Total score (bits): 検 索 さ れ てきた局所配 列 の長さ をビッ ト形式で示 し たもの 。値

が 大きいほど、相同性 を 示 す領域が長い 。

Query cover: 問合せ配 列 の 全長のうち、 検 索 配 列 と 配 列 が一致し て い る領域の%

Identities: ア ミ ノ 酸 配 列で、相同領域の な かで一致し て い る ア ミ ノ 酸 の比率

ア ラ イ メ ン ト の添えら れ て い る数字

Identities: ア ミ ノ 酸 配 列で、相同領域の な かで一致し て い る ア ミ ノ 酸 の比率

Positives: ア ミ ノ 酸 配 列 の場合 に 、一致し て い る ア ミ ノ 酸+化 学的に類似す る ア ミ

ノ 酸 の比率

Gaps: ア ラ イ メ ン ト さ れ た 配 列で、片一方で欠損し て い る 塩 基 あ る い は ア ミ ノ 酸 の

総 計

講 義

12

Page 13: バイオインフォマティックス概論授業予定 · Web view1.ショウジョウバエ(Drosophila)のhedgehogタンパク質のアミノ酸配列を、proteinデータベースからキーワード検索する(Accession

ヒ ト 全 ゲ ノ ム 塩 基 配 列 解 読 の 行程( 2/ 3 )

1 ) 連 鎖 地 図 ・ 物 理 地 図 ( Radiation hybrid panel )

2 ) BAC ラ イ ブ ラ リ ー 作 製

3 ) BAC ラ イ ブ ラ リ ー の 整 列 化

4 ) シ ョ ッ ト ガ ン シ ー ク エ ン ス

5) ア セ ン ブ ル

6) ア ノ テ ー シ ョ ン

完全長 cDNA 配 列 解 読 プ ロ ジ ェ ク ト 、 EST ( expressed sequence tags ) プ ロ ジ ェ ク ト

に つ い て の 解 説

13

Page 14: バイオインフォマティックス概論授業予定 · Web view1.ショウジョウバエ(Drosophila)のhedgehogタンパク質のアミノ酸配列を、proteinデータベースからキーワード検索する(Accession

10 月 24 日 ( 第 4 回 )

今日 の 授 業 内 容

1. 実 習 : BLAST検 索 ( BLASTN, BLASTX, TBLASTX )

2. 講 義 : ゲ ノ ム 解 読 プ ロ ジ ェ ク ト ( 3/3 )

実 習ホ モ ロ ジ ー 検 索 ( BLAST検 索 ) 2/2

BLASTN 実 習

blastn を 使 っ て 、 >test_DNA_sequence-1 の相同遺 伝 子 を 検 索 し て み よう

BLASTN の 検 索手順

1.NCBI 、 Popular Resources の中か ら BLASTを選択す る 。 Basic BLAST に上記

5 種類の BLAST プ ロ グ ラ ム の ア イ コ ン が あ る 。

2 .nucleotide blast を ク リ ッ ク す る 。

「Database」が 、 デ フ ォ ル トでは nucleotide collection (nr/nt) で、 こ の ま

までよ い 。

注 意 : Program selection で somewhat similar sequences (blastn) を 選 択 す る 。

3 . 塩 基 配 列 (FASTA format) を枠内 に コピー す る 。

4 .BLAST のボタ ン を押し て 、 検 索 を開始す る 。

>test_DNA_sequence-1(zebrafish_charon)

AACGAAACCTTGAACCGCAAGATTTTTCAACAAATAATCGACTATATGTATTTTTAGAGAGAAATAAATTCCCTCTCTTTT

CTTTTTTGTAAAATTCTATAATTTAGCTAAAATGACTTTTCAGGTCGGCTTTTTTGTGCTGTTGTCAGTCACAACAATTGG

CGCTTTCCCGCGCAATGCATTTCAGCGGGAATTTCACCGACACGTGGCGAAAGACTTTGAATCCTCCGGGAATGGACCAGA

CGAACCTGTTCGGGGATCTGTCCGAATTGTCAAACTAAACCCTCATTTTCTGCGCCGGGCCGCCGTTAGTCATGTGCCGTT

CAGAAATTCACCAAGTCGAGGCGCGTTTCCCGCGTTCTTGGCCCTCGGACGTCCGGGCCCCGCAATCCTGACCCATAGCAA

ACCTGCGCCTCAGGTGAGCAGCAGTGCAGACAGGAGGAAACAAGGGCTCGAGATGTGGAAGAAAGTGGTGCACAAAAGCGA

GCGAAAAAAAGAGGCAGTGGCTCTGCGCATCAATCCCAAAGACATGAACAAACAGAGCTGTGCCGCAGTTCCCTTTACACA

GCGCATAACGGAGGAGGGCTGTGAGACGGTGACCGTTCACAATAATCTCTGCTACGGTCAGTGCAGCTCCATGTTCGTGCC

CTCCAGCGGAGGCTCTCACGGACAACAGAAAGCGCAGTGCATGCGCTGCGGCCCCTCTAGAGCGCGCTCCGTGCTCCTGCA

CCTGCGCCGCGGGTCTGAGGTGCGGGAGAGGCGCGTACTGATCGTTGAGGAGTGCAAGTGTGAAACCAGCAGCGAAGAGGC

CAAAGTTCAGAACACAGATATGTTTAATTTATAACAGTCATTTTAAAGTTTATAAAAATCGTAA

>test_DNA_sequence-1(zebrafish_charon)_protein-seq

MTFQVGFFVLLSVTTIGAFPRNAFQREFHRHVAKDFESSGNGPDEPVRGSVRIVKLNPHFLRRAAVSHVPFRNSPSRGAFP

AFLALGRPGPAILTHSKPAPQVSSSADRRKQGLEMWKKVVHKSERKKEAVALRINPKDMNKQSCAAVPFTQRITEEGCETV

TVHNNLCYGQCSSMFVPSSGGSHGQQKAQCMRCGPSRARSVLLHLRRGSEVRERRVLIVEECKCETSSEEAKVQNTDMFNL

14

Page 15: バイオインフォマティックス概論授業予定 · Web view1.ショウジョウバエ(Drosophila)のhedgehogタンパク質のアミノ酸配列を、proteinデータベースからキーワード検索する(Accession

Blastn の 利 用 例 :

と り あえず調べた い 遺 伝 子 が 、既知のどの 遺 伝 子 に類似す る か ? を調べる時等 に

使う。 ただし 、 生 物間で変異の激し い 遺 伝 子 ( 実 習で使う charon が一例 ) の場合

に は 、 Blastn では相同遺 伝 子 が十分 に 検 索 さ れ て こ な い こ と が あ る ので、 遺 伝 子

を 特 定 す る ために は 、次の Blastx を 使う方 が よ い 。

次世 代 シ ー ケ ン ス 解 析で得ら れ た断片( 100bp ) を ゲ ノ ム に マ ッ プ す る時は

Blastn を 用 い る 。

同じ遺 伝 子 の 配 列 >test_DNA_sequence-1(zebrafish_charon) な の に 、 blastpと blastnで検 索 さ れ てくる 遺 伝 子 ・蛋白質 の数が違うこ と に注意!(その 理由を 理 解 し て下さ い )

BLASTX 実 習

blastXを 使 っ て 、 >test_DNA_sequence-1 の相同遺 伝 子 を 検 索 し て み よう

blastx の 特 性 :

こ の プ ロ グ ラ ムでは 、 遺 伝 子 が コ ー ド す る ア ミ ノ 酸 配 列 と相同性 の高い蛋白質 を

探す 。問い 合わせ塩 基 配 列 は 、一度 6 フ レ ー ムで翻訳さ れ 、翻訳さ れ た 配 列 が ア

ミ ノ 酸 配 列 デ ー タ ベ ー ス に対し て 検 索 に か け ら れ て い る 。 --- タ ン パ ク の 配 列で

BLASTP 検 索 し た時と同じ検 索 結 果 が得ら れ て い る

 ア ミ ノ 酸置換 の激し い 遺 伝 子 の相同性 検 索 に非常に有効

 進 化的に離れ た 生 物 か ら相同遺 伝 子 を探す場合 にも有効

次世 代 シ ー ケ ン サ ー を 使 っ た de novo ト ラ ン ス ク リ プ ト ー ム 解 析で得ら れ た 配

列 を同定 す る場合 、 BLASTX が 使 用 さ れ る

ヒ ト の ゲ ノ ム デ ー タ ベ ー ス に 対 し て 、>test_DNA_sequence-1(zebrafish_charon)配 列 を 問 合 せ 配 列に し て 、 blastn, blastx 検 索 を 行 い 、 得 ら れ る デ ータ の 違 い を 理 解 し よ う .

TBLASTN 実 習

tblastx を 使 っ て 、 >test_DNA_sequence-1 の相同性 検 索 を試し て み よう

tblastx の 特 性 :

問い 合わせの 塩 基 配 列 、 デ ー タ ベ ー ス の 塩 基 配 列 とも3 フ レ ー ムで翻訳さ れ 、 検

索 に か け ら れ て い る 。

Tblastx の 利 用 例 :

単離し た 遺 伝 子 が コ ー ド す る ア ミ ノ 酸 配 列 と相同性 の高い ア ミ ノ 酸 配 列 を コ ー ド

す る 塩 基 配 列 を探す 。 配 列 の 変異が激し い 遺 伝 子種の場合 に有効。

15

Page 16: バイオインフォマティックス概論授業予定 · Web view1.ショウジョウバエ(Drosophila)のhedgehogタンパク質のアミノ酸配列を、proteinデータベースからキーワード検索する(Accession

練習

PCNA は DNA 複 製で働くタ ン パ ク 質で、 バ ク テ リ ア か ら ヒ ト まで配 列 の保存性 が非常

に高い 。 こ の 配 列でBLASTN 検 索 し て 、 >test_DNA_sequence-1 の 検 索 結 果 と の違い を

考えて み よう。

対象生 物 を イネに限定 し て 、 イネゲ ノ ム に相同遺 伝 子 が存在す る か調べて み よう。 ま

た 、 バ ク テ リ ア の ゲ ノ ムで試し て み よう。

>zebrafish_PCNA_cDNA

ACTTTAGTTCCTCCTACTCCAAACTAAGAAAGCAGCACAATGTTTGAGGCACGTCTGGTTCAGGGATCTATCCTTAAGAAG

GTCCTGGAGGCTCTGAAAGACCTGATCACCGAGGCTTGCTGGGATGTGAGCTCGTCGGGCATTTCTCTGCAGAGTATGGAC

TCCTCTCATGTGTCTCTGGTGCAGCTGACGCTCCGGAGTGACGGGTTCGACTCCTACCGCTGCGACAGAAACCTAGCCATG

GGGGTCAATCTGAGCAGCATGTCGAAGATTCTGAAGTGTGCTGGAAATGAAGACATCCAGACACTTAGAGCTGAAGACAAT

GCTGACACGCTGGCACTGGTCTTTGAAGCTCAAAATCAGGAGAAAGTGTCCGACTATGAGATGAAACTGATGGATCTGGAT

GTGGAGCAGCTTGGCATTCCAGAGCAGGAATACAGTTGTGTGGTGAAGATGCCGTCGGGTGAGTTTGCCCGCATCTGCAGG

GATCTGTCACAGATTGGTGATGCTGTCATGATCTCGTGTGCCAAGGATGGCGTGAAGTTCTCTGCTAGCGGAGAGCTGGGC

ACAGGCAACATCAAGCTCTCACAGACCAGCAATGTCGACAAGGAGGATGAAGCGGTAACAATTGAGATGAATGAGCCAGTG

CAGCTCATTTTTGCATTGAACTACCTGAACTTCTTCACCAAGCCAACTCCTCTGTCCAGAACGGTCACACTTAGAATGTCC

GCACATATTCCACTAGTGGTTGAGGACAAAATTGCAGACCTTGAACACGTAAAATATTACCTGGCGCCCCAGATCGAGGAT

GAAGAGTCCTCCTAATCCAAGCAGAAGAGCGAAGCCTGTCATCTGTGGGATTTTCATTCTGCAACTCAGAAGTTATTGCAT

AGATGTTTTGGGAAAATGCATTTTATTACTCAGTGTCTGCTGTGGTTTCCAGTTCAATGGATTCCCGATTGTGACCCTCTA

AAGCCATTACATATCATTGGCAGAATTGCGGGCGCACTTATTAAATGATGGTAGTTTGGGCCTTAGCTTTACCAGGCGCTC

CGTGGGCTGAATCTAGAGTGCTCTCATGTACATACTCCACATTCAGTCTTGTTTTTCTCCCTTTTTGCCGTTGTCCTCTTG

TGTCCATTTCAGGTTTTGTCCAACTGCTCATTCCAATGTGTAGATAATTGTCTGTAAATATGCTAATTGGACACCGTTCAT

CCAGTCAACCCGTAATAAAACTGTTGTATCGG

>zebrafish_PCNA_Protein

MFEARLVQGSILKKVLEALKDLITEACWDVSSSGISLQSMDSSHVSLVQLTLRSDGFDSYRCDRNLAMGVNLSSMSKILKC

AGNEDIITLRAEDNADALALVFETLNQEKVSDYEMKLMDLDVEQLGIPEQEYSCVVKMPSGEFARICRDLSQIGDAVMISC

AKDGVKFSASGELGTGNIKLSQTSNVDKEDEAVTIEMNEPVQLIFALNYLNFFTKATPLSKTVTLSMSADIPLVVEYKIAD

MGHVKYYLAPKIDEESS

講 義

ヒ ト 全 ゲ ノ ム 塩 基 配 列 解 読 の 行程( 3/ 3 )

1 ) 連 鎖 地 図 ・ 物 理 地 図 ( Radiation hybrid panel )

2 ) BAC ラ イ ブ ラ リ ー 作 製

3 ) BAC ラ イ ブ ラ リ ー の 整 列 化

4 ) シ ョ ッ ト ガ ン シ ー ク エ ン ス

5) ア セ ン ブ ル

16

Page 17: バイオインフォマティックス概論授業予定 · Web view1.ショウジョウバエ(Drosophila)のhedgehogタンパク質のアミノ酸配列を、proteinデータベースからキーワード検索する(Accession

6) ア ノ テ ー シ ョ ン

完全長 cDNA 配 列 解 読 プ ロ ジ ェ ク ト 、 EST ( expressed sequence tags ) プ ロ ジ ェ ク ト に

つ い て の 解 説

17

Page 18: バイオインフォマティックス概論授業予定 · Web view1.ショウジョウバエ(Drosophila)のhedgehogタンパク質のアミノ酸配列を、proteinデータベースからキーワード検索する(Accession

10 月 31 日 ( 第5回 )

今日 の 授 業 内 容

1. 実 習 : NCBI の ゲ ノ ム デ ー タ ベ ー ス (Map Viewer) での BLAST検 索

2. 講 義 : Whole genome shotgun sequence

3. 講 義 : ゲ ノ ム 解 読で分 か っ た ヒ ト ゲ ノ ム の 特 性

実 習—NCBI Map Viewer の 利 用 —

NCBIの Map Viewerでは ゲ ノ ム 解 読 が 行われ た 生 物種ごと に 、 遺 伝 子 の染色体上の 位置を調べる

こ とや、 BLAST 検 索 を 行うこ と ができま す 。 授 業では 、 Map Viewer を 使 っ て 、 4 つ の 使 用法を

実 習 し ま す 。

NCBI Map Viewerの 利 用 ( 1 /4)

— 遺 伝 子 の染色体上の 位置を調べる ー

1.NCBI 先頭ペ ー ジ All resources の中か ら Map Viewer を選択す る

2.ゲ ノ ム 塩 基 配 列 が公開さ れ て い る 分類に 分 け て 生 物種一覧が表示 さ れ る : toolsに

虫眼鏡マ ー ク ( 遺 伝 子 の染色体上の 位置を調べる ) と B マ ー ク ( BLAST 検 索 ) が あ る

3.虫眼鏡マ ー ク を ク リ ッ ク

4. Search for の枠に 遺 伝 子名を記入し 、 リ タ ー ン キ ー ( or Find ) を押す

5.遺 伝 子 の 位置が染色体上に赤く示 さ れ る 。下の Map element を選択す れば、 よ り

詳細な ゲ ノ ム 情 報 が表示 さ れ る 。

ヒ ト染色体におけ る 遺 伝 子 の 位置( 遺 伝 子座) を 検 索 し て み よう

練習 : sonic hedghog (shh) を 検 索 し て み よう

1.NCBI で Map Viewer を開け る

2.Homo sapiens (human) の Tools に虫眼鏡マ ー ク を選択

3. Search for に shh を記入し て 、 Return4.Map element の な か か ら SHH( NM_000193.2 ) を選んでク リ ッ ク

5. shh の染色体上の 位置、周辺の 遺 伝 子 が表示 さ れ る

6. Zoom out、 Zoom in し て み よう

7. SHH を ク リ ッ ク す る と 、 SHH 遺 伝 子 の イ ン ト ロ ン ・ エ ク ソ ン 構 造 、 変

異に よ る病状等 に つ い て の 情 報 が得ら れ る

8 . OMIM (OMIM は KEGG に も リ ン ク ), HGNC (HUGO nomenclature committee; HUG0=human genome organization) を開け る と 、 変異に よ る異

常や分 子 構 造 の 特 性 に 関 す る 情 報 が得ら れ る

ウ シ 、ニワ ト リ 、ゼブ ラ フ ィ ッ シュでも shh でキ ー ワ ー ド 検 索 し て み よう

 NCBI Map Viewerの 利 用 ( 2/4 )

18

Page 19: バイオインフォマティックス概論授業予定 · Web view1.ショウジョウバエ(Drosophila)のhedgehogタンパク質のアミノ酸配列を、proteinデータベースからキーワード検索する(Accession

— さ ま ざ ま な 生 物 の ゲ ノ ム デ ー タ ベ ー ス の 利 用—

 NCBI, Map Viewer では 、 バ ク テ リ ア か ら植物 、哺乳類に至る まで多様な 生 物 の ゲ ノ ム 情 報 が

利 用できま す 。 ヒ ト が持っ て い る 遺 伝 子 の相同遺 伝 子 を 進 化的に たどっ て 、どの 生 物 に まで存

在し て い る か と言う疑問に つ い ても、 BLAST 検 索 に よ っ て調べる こ と ができま す 。

練習 : ヒ ト の 増殖細胞核抗原 ( PCNA: proliferating nuclear antigen ) の相同遺 伝 子 を イネゲ ノ ム

( Oryza sativa (japonica cultivar-group) ) 、 バ ク テ リ ア か ら探し て み よう。

 マ ウ スビタ ミ ン D受容体の相同遺 伝 子 が 、 シ ョ ウ ジ ョ ウ バ エ 、 原 生動物 ( ア メ ー バ ー ) 、 イ

ネに存在す る かどうかも試し て み よう。

バ ク テ リ ア の ゲ ノ ム 検 索では 、 small genome に入り 、種を指定 し 、 検 索 す る 。

>human_pcna

MFEGRLVQGSILKKVLEALKDLINEACWDISSSGVNLQSMDSSHVSLVQLTLRSEGFDTYRCDRNLAMGVNLTSMSKILKCAGNE

DIITLRAEDNADTLALVFEAPNQEKVSDYEMKLMDLDVEQLGIPEQEYSCVVKMPSGEFARICRDLSHIGDAVVISCAKDGVKFS

ASGELGNGNIKLSQTSNVDKEEEAVTIEMNEPVQLTFALRYLNFFTKATPLSSTVTLSMSADVPLVVEYKIADMGHLKYNLAPKI

EDEEGS

NCBI Map Viewer の 利 用 ( 3/4 )

— 特 定 の 生 物 の ゲ ノ ム に存在す る 遺 伝 子 ファミ リ ー の メ ン バ ー の 検 索—

 多くの 遺 伝 子 に は 、 生 物 進 化 の過程で共通の 遺 伝 子 か ら派生 し た兄弟遺 伝 子 が存在し ま す 。

ま たその メ ン バ ー は 進 化 に伴っ て 増える傾向に あ り ま す 。 マ ウ ス な ら マ ウ ス の ゲ ノ ム に対し て 、

あ る メ ン バ ーでゲ ノ ム を 検 索 す る こ と に よ り 、 進 化的に 関 連 し て 部 分的にでも共通の 配 列 を持

つ メ ン バ ー を 全 て 検 索 す る こ と ができま す 。今回 は 、 マ ウ ス ゲ ノ ム に存在す る核レ セ プ タ ー

ファミ リ ー の メ ン バ ー 、及びG タ ン パ ク共役受容体の メ ン バ ー を探す操作 を 実 習 し ま す 。

練習 : マ ウ ス ゲ ノ ム に核受容体ファミ リ ー の メ ン バ ー が幾つ存在す る か ?

1.NCBI の Map Viewer ( ペ ー ジ下、 POPULAR ) を開け る

2.Mus musculus の Tools か ら B ( BLAST ) を選択3 . mouse_vitamin_D_receptor の 配 列 を 枠 に コ ピ ー し 、 Program か ら

BLASTP を選択し 、 Begin Search を ク リ ッ ク

4.マ ウ ス ゲ ノ ム に存在す る核レ セ プ タ ー ファミ リ ー の 全 て の メ ン バ ー が 検

索 さ れ てくる 。 60 種類あ ま り存在す る こ と が 分 か る

5.上の 方 に あ る Genome View を ク リ ッ ク し て み よう: 検 索 さ れ てきた 遺 伝

子 の染色体上の 位置が表示 さ れ る

>mouse_vitamin_D_receptor

MEAMAASTSLPDPGDFDRNVPRICGVCGDRATGFHFNAMTCEGCKGFFRRSMKRKALFTCPFNGDCRITKD

NRRHCQACRLKRCVDIGMMKEFILTDEEVQRKREMIMKRKEEEALKDSLRPKLSEEQQHIIAILLDAHHKT

YDPTYADFRDFRPPIRADVSTGSYSPRPTLSFSGDSSSNSDLYTPSLDMMEPASFSTMDLNEEGSDDPSVT

19

Page 20: バイオインフォマティックス概論授業予定 · Web view1.ショウジョウバエ(Drosophila)のhedgehogタンパク質のアミノ酸配列を、proteinデータベースからキーワード検索する(Accession

LDLSPLSMLPHLADLVSYSIQKVIGFAKMIPGFRDLTSDDQIVLLKSSAIEVIMLRSNQSFTLDDMSWDCG

SQDYKYDITDVSRAGHTLELIEPLIKFQVGLKKLNLHEEEHVLLMAICIVSPDRPGVQDAKLVEAIQDRLS

NTLQTYIRCRHPPPGSHQLYAKMIQKLADLRSLNEEHSKQYRSLSFQPENSMKLTPLVLEVFGNEIS

G-protein coupled receptor の メ ン バ ーで試し て み よう。

>human_MC4R

MVNSTHRGMHTSLHLWNRSSYRLHSNASESLGKGYSDGGCYEQLFVSPEVFVTLGVISLLENILVIVAIAK

NKNLHSPMYFFICSLAVADMLVSVSNGSETIVITLLNSTDTDAQSFTVNIDNVIDSVICSSLLASICSLLS

IAVDRYFTIFYALQYHNIMTVKRVGIIISCIWAACTVSGILFIIYSDSSAVIICLITMFFTMLALMASLYV

HMFLMARLHIKRIAVLPGTGAIRQGANMKGAITLTILIGVFVVCWAPFFLHLIFYISCPQNPYCVCFMSHF

NLYLILIMCNSIIDPLIYALRSQELRKTFKEIICCYPLGGLCDLSSRY

練習 : シ ョ ウ ジ ョ ウ バ エ の ゲ ノ ム に は 、核受容体ファミ リ ー の メ ン バ ー が幾つ存在す

るでしょうか ?

ホヤ( Ciona intestinalis )でも検 索 し て み よう

  NCBI Map Viewerの 利 用 ( 4/4 )

—次世 代 シ ー ケ ン ス 解 析で得ら れ た 配 列 の染色体へ の マ ッピン グ—

 最も汎用 さ れ て い る次世 代 シ ー ケ ン サ ーであ る Illumina2000 では 、一度の 解 析で 100bの断片配 列 が約 4000 万個得ら れ ま す 。 ゲ ノ ム 解 析 が 行われ て い る 生 物では 、 こ の ような

短い断片でも染色体に マ ッピン グできま す 。 さ ら に参照ゲ ノ ム と 塩 基 配 列 の違い が あ る か

どうか 、 遺 伝 子疾患の 原因が 解 析 さ れ た個人の ゲ ノ ム に存在し て い る かどうかも判定 可 能

です 。

練習 :

BLAST 検 索で human を選択し て 、次の 配 列 を ゲ ノ ム に マ ッピン グ し て み よう。

>human_100bp_fragment

CCAAATTTAATTGATAATGGAAGCTGGCCAGCCACCACCATACAGAATTCTGTAGCTTTGAAGAATGCAGGTTTAATATCC

ACTTTGAAAAAGAAAACAA

20

Page 21: バイオインフォマティックス概論授業予定 · Web view1.ショウジョウバエ(Drosophila)のhedgehogタンパク質のアミノ酸配列を、proteinデータベースからキーワード検索する(Accession

11 月 7 日 ( 第6回 )

今日 の 授 業 内 容

1. 実 習 : 配 列 ア ラ イ メ ン ト

2. 講 義 : 分 子 系 統 樹 に つ い て

講 義

  2 つ以上の 塩 基 配 列 あ る い は ア ミ ノ 酸 配 列 の一致度を調べる場合 、 ア ラ イ メ ン ト プ ロ グ ラ ム

を 使 い ま す 。 タ ン パ ク 質 の場合 、異な る 生 物間でア ミ ノ 酸 配 列 を ア ラ イ メ ン ト す る こ と に よ り 、

保存性 の高い領域を 特 定 す る こ と ができま す 。 系 統的に隔た っ た 生 物間( 例えば、 マ ウ ス とゼ

ブ ラ フ ィ ッ シュ、 あ る い は マ ウ ス と酵母の 関 係 等 )で保存性 が高い領域は 、 タ ン パ ク 質 の 機 能

で重 要 な役割を持っ た領域であ る と考えら れ ま す 。 ま た シ ス テ イ ン残基 は 、 タ ン パ ク 質 の高次

構 造 に深く関わる ジ ス ル フ ィ ド ( S-S ) 結 合 を 作 る場合 が 多 い ため、保存さ れ て い る こ と が 多

く、異な る 生 物 の タ ン パ ク 質 を ア ラ イ メ ン ト す る こ とで重 要で保存さ れ た ジ ス ル フ ィ ド 結 合 の

位置を 予 測できま す 。

  ClustalW プ ロ グ ラ ム を 使うと 、 多 重 ( マ ル チ プ ル ) ア ラ イ メ ン ト の 結 果 か ら 分 子 系 統 樹 を 作

成できま す 。 分 子 系 統 樹では 、 遺 伝 子 の種間あ る い は同種間におけ る 進 化的関 係 を 予 測 す る こ

と ができま す 。種間の 進 化的関 係では 、異な る 生 物間におけ る相同遺 伝 子 ( オ ー ソ ロ グ ) を同

定 す る こ と が 可 能です 。同種間で関 連 遺 伝 子 の 系 統 樹 を 作 成 す る と 、 遺 伝 子 ファミ リ ー の メ ン

バ ー の 進 化的関 係 が 分 か り ま す 。 ま た モ デ ル 生 物 ( マ ウ ス 、ゼブ ラ フ ィ ッ シュ) の 配 列 を 分 子

系 統 樹 に 加える こ とで、 研 究対象の 遺 伝 子 に対す る モ デ ル 生 物 の オ ー ソ ロ グ を 検 索 し 、 モ デ ル

生 物 の 情 報 か ら か ら 、 研 究対象の 遺 伝 子 の 機 能 に つ い ておおよその 情 報 を得る こ と ができま す 。

 授 業では 、 ペ ア ワ イ ズ ア ラ イ メ ン ト ( 2 つ の 配 列 を比較) 、 マ ル チ プ ル ア ラ イ メ ン ト ( 3 つ

以上の 配 列 を比較)および分 子 系 統 樹 の 作 成 (来週) を 実 習 し ま す 。

配 列 ア ラ イ ン メ ン ト

配 列 ア ラ イ ン メ ン ト と は 、 配 列中で同じ並び方 を し て い る 文 字 列 を探す こ とであ る 。同一

もしくは似た 文 字 は同じ列 に置き、同一でな い 文 字 は同じ列 に不一致と し て置くか 、

ギャッ プ を入れ る 。

ペ ア ワ イ ズ ア ラ イ ン メ ン ト (pairwise alignment) : 2 つ の 配 列 の比較

大域的ア ラ イ ン メ ン ト (global pairwise alignment)局所的ア ラ イ ン メ ン ト (local pairwise alignment)

多 重 配 列 ア ラ イ ン メ ン ト (multiple alignment) : 3 つ以上の 配 列 の比較

************************************************************************

実 習21

Page 22: バイオインフォマティックス概論授業予定 · Web view1.ショウジョウバエ(Drosophila)のhedgehogタンパク質のアミノ酸配列を、proteinデータベースからキーワード検索する(Accession

AlignmentPairwise alignment

1 ) 使 用 す る ウ ェ ブ サ イ ト : The European Bioinformatics Institute (EBI )http://www.ebi.ac.uk/Information/ ( Internet explorerを 使 っ て EBI で検 索 )

2 ) Services の中 か ら Proteins を選 択。 →左 下の See all toolsを開 け 、 リ ス ト の中か ら

EMBOSS を選択

Local alignment → Matcher (protein)2 つ の枠内 に 配 列 を ペ ー ス ト し て Submit練習 :

下の gnrh ( gonadotropin-releasing hormone; 生腺腺刺激ホ ル モ ン ) か ら ヒ ト とゼブ ラ フ ィ

シュを選んでア ラ イ ン メ ン ト を 実 行 し て み よう。

次に 、 ヒ ト と ホヤ( Ciona )で実 行 し て み よう

Global alignment → Needle (protein)Needle, Protein を選択し 2 つ の枠内 に 配 列 を ペ ー ス ト し て Submit練習 :上と同じ入力を 行 い 、 結 果 の違い を 理 解 し よう

>human_GNRH1

MKPIQKLLAGLILLTSCVEGCSS

QHWSYGLRPGGKRDAENLIDSFQEIVKEVGQLAETQRFECTTHQPRSPLRDLKGALESLIEEETGQKKI

>mouse_Gnrh

MILKLMAGILLLTVCLEGCSSQHWSYGLRPGGKRNTEHLVESFQEMGKEVDQMAEPQHFECTVHWPRSPLRDLRGALESLIEEEA

RQKKM

>chicken_Gnrh1

MEKSRKILVGVLLFTASVAICLAQHWSYGLQPGGKRNAENLVESFQEIANEMESLGEGQKAECPGSYQHPRLSDLKETMASLIEG

EARRKEI

>xenopus_GnRH1

MKAFPTFALLFLVLLFSAHVSDAQHWSYGLRPGGKRDTESLQDMYHETPNEVALFPELERLECSVPQSRLNVLRGALMNWLEGEN

RKKI

>zebrafish_gnrh2

MVLVCRLLLVVGLMLCLSAQLSSAQHWSHGWYPGGKREIDLYDTSEVSEEVKLCEAGKCSYLRPQGRNILKTILLDALIRDFQKR

K

>ciona_gnrh1

MLDIEKDELAALLQRENSAFRDLLYHKNAGNFEKSDSGKFGSLKPQNNFPHLDLGLGVDLDAVDQWNRYKQANAQRMQDLGVPVN

ARQHWSYEFMPGGRRAAWENANVGVPVSRQHWSYEYMPGGRRSAGRHAMTKRQHWSKGYSPGGKRSVDLSEFDDQGRRITKHEGM

PEEPFKVEQPRPRNGIHGPAGLDQNEPDWKNWMNEQPAVSSDDKGSDVE

GNRH: 生腺刺激ホ ル モ ン放出 ホ ル モ ン . 視床下部で合 成 さ れ 、下垂体門脈経 路 を介し て下垂体

前葉に運ばれ 、 生腺刺激ホ ル モ ンであ る 黄体形成 ホ ル モ ン (LH) と濾法刺激ホ ル モ ン (FS

H) の産生 と放出 を促進 す る神経 性 ペ プ チ ド ホ ル モ ン . ホ ル モ ン前駆体と し て 合 成 さ れ た あ と

酵素に よ り切断さ れ 、 ヒ トでは HWSYGLRPG ペ プ チ ド が ホ ル モ ン と し て 機 能 す る 。

22

Page 23: バイオインフォマティックス概論授業予定 · Web view1.ショウジョウバエ(Drosophila)のhedgehogタンパク質のアミノ酸配列を、proteinデータベースからキーワード検索する(Accession

Ciona: カタユレ イボヤ( ホヤの仲間で日 本 の 研 究 グ ル ー プ に よ っ て ゲ ノ ム シ ー ク エ ン ス が 解 読

さ れ た )

講 義分 子 系 統 樹 : Phylogenetic tree, Evolutionary tree

分 子 系 統 樹 ( 進 化 系 統 樹 ) (molecular phylogenetic tree, evolutionary tree)塩 基 配 列やア ミ ノ 酸 配 列 を 基 に 分岐位置と 分岐時間を推定 し 、 構築さ れ た 系 統 樹

近接接合法 (neighbor-joining method): 距離行 列法で作 成 す る 分 子 系 統 樹 の 作 成 方

法で、 生 物 分野で最も一般的に 利 用 さ れ る 。

キ ー ワ ー ド

節、枝、 ク ラ ス タ ー (cluster) あ る い は ク レ ー ド (clade)Outgroup 、 Bootstrap value ( ブ ーツス ト ラ ッ プ値) 、 Evolutionary distance

分 子 系 統 樹 の 利 用

( 1 ) 遺 伝 子 の同種間、異種間での 系 統 関 係 の 解 析

( 2 ) 遺 伝 子 ファミ リ ー に属す る メ ン バ ー の 系 統 関 係 の 解 析

( 3 ) 重 複 遺 伝 子 の 重 複時期と 進 化的関 係 の 解 析

( 4 ) 種や系 統 の 進 化的関 係 の推定

 分 子 系 統 樹 か ら 、様々な 情 報 を 読 み 取 る こ と ができま す 。異な る 生 物達の 関 連 ( ホ モ ロ グ )

遺 伝 子で分 子 系 統 樹 を 作 製 す る と 、 遺 伝 子 の 進 化的関 係 を 予 測 す る こ と ができま す 。 ま た ミ ト

コ ン ド リ ア DNA の 配 列 を 使うと 、人種の類縁関 係や進 化的関 係 を 解 析 す る こ と が 可 能です 。 授

業では 、 分 子 系 統 樹 の 作 製 方法と デ ー タ の 見 方 を 講 義 し ま す 。

実 習

分 子 系 統 樹 の 作 製

ClustalW を 使 っ た Multiple alignmen と 分 子 系 統 の 作 成 1 ) 使 用 す る ウ ェ ブ サ イ ト ClustalW     http://clustalw.genome.jp/2 ) Fasta format で並べた 配 列 を枠内 に ペ ー ス ト し 、 execute multiple alignment を押

す (各種ボタ ン は デ フ ォ ル トでよ い )

練 習 : 下 の gnrh (gonadotropin-releasing hormone) のうち、 >ciona_gnrh1 ( ホ

ヤ) を除く配 列でア ラ イ ン メ ン ト を 実 行 し て み よう。次に 、 >ciona_gnrh1 を入

れ て ア ラ イ ン メ ン ト を 実 行 し 、 結 果 を比べて み よう。

上に Multiple sequence alignments の 結 果 が表示 さ れ る 。

その下に あ る select tree menuで表示形式を選択し て 、 Exec を ク リ ッ ク す る

23

Page 24: バイオインフォマティックス概論授業予定 · Web view1.ショウジョウバエ(Drosophila)のhedgehogタンパク質のアミノ酸配列を、proteinデータベースからキーワード検索する(Accession

表示形式、 N-J tree branch length と Unrooted dendrogram の 結 果 を比較

し て み よう

>human_GNRH1

MKPIQKLLAGLILLTSCVEGCSS

QHWSYGLRPGGKRDAENLIDSFQEIVKEVGQLAETQRFECTTHQPRSPLRDLKGALESLIEEETGQKKI

>mouse_Gnrh

MILKLMAGILLLTVCLEGCSSQHWSYGLRPGGKRNTEHLVESFQEMGKEVDQMAEPQHFECTVHWPRSPLRDLRGALESLIEEEA

RQKKM

>chicken_Gnrh1

MEKSRKILVGVLLFTASVAICLAQHWSYGLQPGGKRNAENLVESFQEIANEMESLGEGQKAECPGSYQHPRLSDLKETMASLIEG

EARRKEI

>xenopus_GnRH1

MKAFPTFALLFLVLLFSAHVSDAQHWSYGLRPGGKRDTESLQDMYHETPNEVALFPELERLECSVPQSRLNVLRGALMNWLEGEN

RKKI

>zebrafish_gnrh2

MVLVCRLLLVVGLMLCLSAQLSSAQHWSHGWYPGGKREIDLYDTSEVSEEVKLCEAGKCSYLRPQGRNILKTILLDALIRDFQKR

K

>ciona_gnrh1

MLDIEKDELAALLQRENSAFRDLLYHKNAGNFEKSDSGKFGSLKPQNNFPHLDLGLGVDLDAVDQWNRYKQANAQRMQDLGVPVN

ARQHWSYEFMPGGRRAAWENANVGVPVSRQHWSYEYMPGGRRSAGRHAMTKRQHWSKGYSPGGKRSVDLSEFDDQGRRITKHEGM

PEEPFKVEQPRPRNGIHGPAGLDQNEPDWKNWMNEQPAVSSDDKGSDVE

こ の サ イ トでの 検 索 結 果では 、 Bootstrap value, evolutionary distance の値は表示 さ れ な い 。

DDBJ の ClustalW を 使えば、 こ れ ら の値が求めら れ る 。 ただし 、 ま た 結 果 の 図形を表示 す

る ために 、 Tree View と言う無料ソ フ ト をダウ ン ロ ー ド す る 必 要 が あ る 。教室の コ ン

ピュー タ ーでは 、 ソ フ ト ウ ェ ア のダウ ン ロ ー ド は ためらわれ る ので、各自の パ ソ コ ンで

DDBJ を試し て下さ い 。

あ る い は 、 ClustalX の プ ロ グ ラ ム をダウ ン ロ ー ド し て 解 析 す る (下記 URL ) 。

http://www.cbs.dtu.dk/courses/humanbio/2010/exercises/ExMulPhyl/Ex_Phylo.php

NCBI を 使 っ た Multiple alignment と 系 統 樹 の 作 成

1 . NCB→BLAST→ 下に あ る Multiple Alignment を選択

2. 枠内 に 配 列 を Fasta format でコピー

3 . Align を ク リ ッ ク し て 検 索

4. 検 索 画面上の Phylogenetic Tree を ク リ ッ ク

5 . Evolutionary distance を反映し た 系 統 樹 が表示 さ れ る

6 . Tools か ら Layout 、 Radial tree を選択す る と無根系 統 樹 が表示 さ れ る

プ ロ グ ラ ム に は 、 2007 年に開発 さ れ た 、 COBALT: constraint-based alignment tool for multiple protein sequences が 使われ て い る

24

Page 25: バイオインフォマティックス概論授業予定 · Web view1.ショウジョウバエ(Drosophila)のhedgehogタンパク質のアミノ酸配列を、proteinデータベースからキーワード検索する(Accession

>drosophila_hh

MDNHSSVPWASAASVTCLSLDAKCHSSSSSSSSKSAASSISAIPQEETQTMRHIAHTQRCLSRLTSLVALLLIVLPMVFSPAHSCGPGRGLGRHRA

RNLYPLVLKQTIPNLSEYTNSASGPLEGVIRRDSPKFKDLVPNYNRDILFRDEEGTGADRLMSKRCKEKLNVLAYSVMNEWPGIRLLVTESWDEDY

HHGQESLHYEGRAVTIATSDRDQSKYGMLARLAVEAGFDWVSYVSRRHIYCSVKSDSSISSHVHGCFTPESTALLESGVRKPLGELSIGDRVLSMT

ANGQAVYSEVILFMDRNLEQMQNFVQLHTDGGAVLTVTPAHLVSVWQPESQKLTFVFADRIEEKNQVLVRDVETGELRPQRVVKVGSVRSKGVVAP

LTREGTIVVNSVAASCYAVINSQSLAHWGLAPMRLLSTLEAWLPAKEQLHSSPKVVSSAQQQNGIHWYANALYKVKDYVLPQSWRHD

>mouse_dhh

MALPASLLPLCCLALLALSAQSCGPGRGPVGRRRYVRKQLVPLLYKQFVPSMPERTLGASGPAEGRVTRGSERFRDLVPNYNPDIIFKDEENSGAD

RLMTERCKERVNALAIAVMNMWPGVRLRVTEGWDEDGHHAQDSLHYEGRALDITTSDRDRNKYGLLARLAVEAGFDWVYYESRNHIHVSVKADNSL

AVRAGGCFPGNATVRLRSGERKGLRELHRGDWVLAADAAGRVVPTPVLLFLDRDLQRRASFVAVETERPPRKLLLTPWHLVFAARGPAPAPGDFAP

VFARRLRAGDSVLAPGGDALQPARVARVAREEAVGVFAPLTAHGTLLVNDVLASCYAVLESHQWAHRAFAPLRLLHALGALLPGGAVQPTGMHWYS

RLLYRLAEELMG

>mouse_ishh

MSPAWLRPRLRFCLFLLLLLLVPAARGCGPGRVVGSRRRPPRKLVPLAYKQFSPNVPEKTLGASGRYEGKIARSSERFKELTPNYNPDIIFKDEEN

TGADRLMTQRCKDRLNSLAISVMNQWPGVKLRVTEGWDEDGHHSEESLHYEGRAVDITTSDRDRNKYGLLARLAVEAGFDWVYYESKAHVHCSVKS

EHSAAAKTGGCFPAGAQVRLENGERVALSAVKPGDRVLAMGEDGTPTFSDVLIFLDREPNRLRAFQVIETQDPPRRLALTPAHLLFIADNHTEPAA

HFRATFASHVQPGQYVLVSGVPGLQPARVAAVSTHVALGSYAPLTRHGTLVVEDVVASCFAAVADHHLAQLAFWPLRLFPSLAWGSWTPSEGVHWY

PQMLYRLGRLLLEESTFHPLGMSGAGS

>mouse_shh

MLLLLARCFLVILASSLLVCPGLACGPGRGFGKRRHPKKLTPLAYKQFIPNVAEKTLGASGRYEGKITRNSERFKELTPNYNPDIIFKDEENTGAD

RLMTQRCKDKLNALAISVMNQWPGVKLRVTEGWDEDGHHSEESLHYEGRAVDITTSDRDRSKYGMLARLAVEAGFDWVYYESKAHIHCSVKAENSV

AAKSGGCFPGSATVHLEQGGTKLVKDLRPGDRVLAADDQGRLLYSDFLTFLDRDEGAKKVFYVIETLEPRERLLLTAAHLLFVAPHNDSGPTPGPS

ALFASRVRPGQRVYVVAERGGDRRLLPAAVHSVTLREEEAGAYAPLTAHGTILINRVLASCYAVIEEHSWAHRAFAPFRLAHALLAALAPARTDGG

GGGSIPAAQSATEARGAEPTAGIHWYSQLLYHIGTWLLDSETMHPLGMAVKSS

>xenopus_shh

MLVATQSLLLLSFICTLVTPPGLACGPGRGIGKRRHPKKLTPLAYKQFIPNVAEKTLGASGRYEGKITRNSDCFKELTPNYNPDIMFKDEESTGAD

RLMTQRCKDKLNALAISVMNQWPGVKLRVTEGWDEDGHHLEESLHYEGRAVDITTSDRDRSKYGMLGRLAVEAGFDWVYYESKAHIHCSVKAENSV

AAKSGGCFPAGARVMVEFGGTKAVKDLRPGDRVLSSDPQGNLLYSDFLMFIDQERDVKKLFYVIETSQRKIRLTAAHLLFVAQTKVNGTRSFKSVF

ASNIQPGDLIYTADPKTMTLKAVKVEKVDLEEDTGAYAPLTAHGTVVIDQVLASCYAVIEEHTWAHLAFAPLRFGMSLSSYIYPRDSSPPSGLQPH

HQVDLQSHHQVDLQSHHQVDLQSHHQLEGIHWYSQLLYQIGTWLLDSNSLHPLGMATKSS

>xenopus_dhh

MPAVRIVILAICCGLLLVPVRCCGPGRGPVGRRRYMRKLVPLHYKQFVPNVPEKTLGASGKSEGKIHRGSERFIELVPNYNPDIIFKDEEKTGADR

LMTERCKDRVNALAISVMNMWPGVKLRVTEGWDEDGHHAHDSLHYEGRALDITTSDRDRNKYGMLARLAVEAGFDWVYYESKAHIHVSVKADNSLG

VRSGGCFPGTAMVMMGTGERKPLSELKIGDTVYTTDETGQLITSVVLLFLHRNPYKTATFVLIEAEGHPSKLLVTPNHLLFIQSSSSAGFLPFAYR

VQIGDLVQIYVNGTQVQSSKVVRVSLEEQTGVYAPMTEHGTLLVDGVLTSCYATVESHTLAHVSLAPLRLFQGIASMLPDLDMSDGVHWYCHILYV

LAKYVLWWDMP

>xenopus_ihh

MQLPKVVLLLCAAALLLSGAVRGCGPGRVVGRRRRPTKLSPLSYKQFSPNVPEKTLGASGRYEGKISRNSERFKELTPNYNPDIIFKDEEITGADR

LMTQRCKDRLNSLAISVMNQWPGVKLRVTEGWDEDGHHFEESLHYEGRAVDITTSDRDRNKYGMLARLAVEAGFDWVYYESKAHIHCSVKSEHSAA

AKTGGCFPGEALATLESGEKIPVSQLSPGLRVLAMDNSGRPTYSDFLSFLDHSPKEEHMFQVIKTQDPHRRLFLTPAHLIFVSDNYSTPASEFQAV

FASSVRPGQYILVSNVVGLIPAKVRSVNTQTNYGAYAPLTQHGTLVVDDVVVSCFALVQKQRLAQIVYWPLRVLYNLGIIAGTQPSQQMGIHWYSK

ALYHLGRLILHGNEFHPLGIVQLES

25

Page 26: バイオインフォマティックス概論授業予定 · Web view1.ショウジョウバエ(Drosophila)のhedgehogタンパク質のアミノ酸配列を、proteinデータベースからキーワード検索する(Accession

26

Page 27: バイオインフォマティックス概論授業予定 · Web view1.ショウジョウバエ(Drosophila)のhedgehogタンパク質のアミノ酸配列を、proteinデータベースからキーワード検索する(Accession

11 月 14 日 ( 第 7 回 )

実 習

分 子 系 統 樹 の 作 成

シ ョ ウ ジ ョ ウ バ エ ( Drosophila ) の hedgehog タ ン パ ク 質 に 対 す る 、 マ ウ ス ( Mus musculus) とツメ ガ エ ル ( Xenopus tropicalis ) の類似遺 伝 子 を 検 索 し て 分 子 系 統 樹 を 作 成

す る 。

配 列 は メ モ帳( Text ファイ ル ) に コピー す る 。

手順は以下の ように 行う

1 . シ ョ ウ ジ ョ ウ バ エ ( Drosophila ) の hedgehog タ ン パ ク 質 の ア ミ ノ 酸 配 列 を 、

proteinデ ー タ ベ ー ス か ら キ ー ワ ー ド 検 索 す る (Accession number: AAF56102) 。 FASTA ボタ

ン を押す と 、 FASTA フ ォ ー ム の 配 列 が表示 さ れ る 。 ア ミ ノ 酸 配 列 を Word に コピー す る 。

> 名前を付け て 、 Fasta format と す る ( ス ペ ー ス と数字 は 、 検 索時に削除さ れ て 計算さ

れ る ので、その ま ま に し てもか まわな い ) 。

2.マ ウ ス の hedgehog ホ モ ロ グ を 検 索 し て 、 配 列 を 取 り 出 す

NCBI先頭ペ ー ジ下側 Features に あ る Map viewer でマ ウ ス Mus musculus の B (blast) ボタ ン

を ク リ ッ ク 。 マ ウ ス ゲ ノ ム に対す る BLAST が開くので、 Bastp を選択し て 検 索 す る ( マ

ウ ス ゲ ノ ム に コ ー ド さ れ る 全 て の タ ン パ ク 質 ア ミ ノ 酸 情 報 に対し て 検 索 ) 。

  検 索 に よ り 表 示 さ れ た 3 種 類 の hedgehog の 配 列 を 取 り 出 す 。 取 り 出 し 方 は 、

Accession 番号を ク リ ッ ク し 、表示 さ れ た 配 列 情 報 ペ ー ジ の上に あ る FASTA ボタ ン を押

す 。 FASTA フ ォ ー ム の 配 列 が表示 さ れ るで、 コピー す る 。

3. Xenopus の hedgehog ホ モ ロ グ を 検 索 し て 、 配 列 を 取 り 出 す

Map viewer でXenopus tropicalis を選ぶ。以下、 2 の操作 と同じ。

4. ClustalW ( http://clustalw.genome.jp/ ) を 使 っ て 、枠内 に7つ の 遺 伝 子 の 全 配 列 を コ

ピー し 、 マ ル チ プ ル ア ラ イ メ ン ト を 実施す る 。 マ ウ ス と Xenopus の間で配 列 の保存性 を

注意深くみ て 、保存性 の 特 徴 を 理 解 す る 。

5.分 子 系 統 樹 を 作 成 す る 。 N-J tree branch length と Unrooted dendrogram の 結 果

を比較

4 の 結 果 と あわせて 、 Outgroup, Paralog, Ortholog の 関 係 を 理 解 す る 。 ヒ ト 遺 伝 子間の パ

ラ ロ グ よ りも、 ヒ ト と Xenopus の オ ル ソ ロ グ間の 方 が保存性 の高い こ と に注意 。 こ れ は

祖先 遺 伝 子 が 重 複 し て 2 つ の 遺 伝 子 ( パ ラ ロ グ と な る ) を形成 し 、その あ と に種分 化 が

起こ っ た ためであ る 。

講 義

27

Page 28: バイオインフォマティックス概論授業予定 · Web view1.ショウジョウバエ(Drosophila)のhedgehogタンパク質のアミノ酸配列を、proteinデータベースからキーワード検索する(Accession

オ ル ソ ロ グ と パ ラ ロ グ 、 ホ モ ロ グ の 関 係 に つ い て

 無 脊椎 動 物 か ら脊椎 動 物 へ の 進 化 の過 程で、 全 ゲ ノ ム ( 全 て の染 色体 ) の 重 複 ( whole genome duplication: WGD ) が 2 回起こ っ て い ま す 。その ため原 索動物 ( ナ メ ク ジ ウ オ 等 が含ま

れ 、無脊椎動物 の な かで脊椎動物 に最も近い )で 1 種類であ っ た 遺 伝 子 は 、一度 4 つ に数が 増

えて い ま す ( 遺 伝 子 に よ っ て は 4 つ に 増えた あ と 、 4 つ とも残っ て い るもの 、 1 つ消失し て 3つ が残っ て い るもの 、 2 つ消失し て 2 つ が残っ て い るもの 、 3 つ が消失し て 1 種類だけ残っ て

い るものもあ り ま す ) 。一つ の 遺 伝 子 か ら 、 ゲ ノ ム 重 複 に よ り誕生 し た 重 複産物 の種内での 関

係 は パ ラ ロ グ ( Paralog ) と呼ばれ ま す 。現存の脊椎動物 (円口類を除く) は 2 回 の ゲ ノ ム の

重 複 が起こ っ て か ら 、 多様な種に 分岐し て い ま す 。その ため、脊椎動物 の 生 物種間で相同な 重

複 遺 伝 子 が存在し ており 、それ ら は ( Ortholog ) と呼ばれ 、 パ ラ ロ グ と区別さ れ ま す 。 オ ル ソ

ロ グ の 関 係 に あ る 遺 伝 子 は 、種が異な っ ても( 例えば哺乳類と魚類) 機 能 が良く保存さ れ て い

ま す 。一方 、 パ ラ ロ グ の 関 係 に あ る 遺 伝 子では 、 機 能 分担が起こ っ て い ま す 。 オ ル ソ ロ グ と パ

ラ ロ グ と の 関 係 は 、 分 子 系 統 樹 を 作 製 す る こ と に よ り 理 解できま す 。 ホ モ ロ グ ( 関 連 遺 伝 子 )

は 、共通祖先 か ら 発 生 し た 遺 伝 子 の 総称で、 オ ル ソ ロ グ と パ ラ ロ グもホ モ ロ グ に含ま れ ま す 。

 オ ル ソ ロ グ と パ ラ ロ グ の 関 係 を 理 解 す る ために 、 生 物 の 進 化 の 歴 史 、 遺 伝 子 重 複 の 歴 史 に つ

い て 解 説 し ま す 。 ま た hedgehog 遺 伝 子 を モ デ ル と し て 、 分 子 系 統 樹 を 作 製 し 、 ホ モ ロ グ と パ

ラ ロ グ の 関 係 を 説 明 し ま す 。

 無脊椎動物 か ら脊椎動物 に 進 化 す る過程で発 生 し た ゲ ノ ム 重 複 に つ い て少し詳しく説 明 し ま

す 。 hox 遺 伝 子 、核内受容体遺 伝 子 を 例 に し て 、 ゲ ノ ム に刻ま れ た 遺 伝 子 重 複 の 歴 史 を 解 説 し

ま す ( こ こでは 、 配付資料を参考に し て 説 明 し ま す ) 。

28

Page 29: バイオインフォマティックス概論授業予定 · Web view1.ショウジョウバエ(Drosophila)のhedgehogタンパク質のアミノ酸配列を、proteinデータベースからキーワード検索する(Accession

11 月 21 日 ( 第 8 回 )

実 習

代 謝 経 路 デ ー タ ベ ー ス の 利 用

 無料で公開さ れ て い る 代 謝 経 路 の デ ー タ ベ ー ス と し て最も充実 し て い る の が 、京都大 学 化 学

研 究所が 統括し て い る KEGG (Kyoto Encyclopedia of Genes and Genomics) であ る 。 代 謝 経 路

の マ ッ プ を調べる こ と ができるだけでなく、 遺 伝 子 の 機 能 、 配 列 、 タ ン パ ク 質 の 立体構 造も検

索できる 。 ク ロ ーニン グ し た 遺 伝 子 がどの ような 代 謝 経 路で機 能 し て い る か 、 あ る い は 代 謝異

常の メカニズ ム なども調べる こ と ができる 。

 ま た さ ま ざ ま な 化 合 物 (抗生 物 質 等 )や市販の医薬品の 構 造 、 薬 理 作 用 、副作 用 を 検 索 す る

こ ともできる 。 遺 伝 子や化 合 物 の 機 能や相互作 用 を調べる場合 、 ま た レ ポ ー ト 作 成 等 にも役立

つ 。 日 本語表記の サ イ トも利 用できる 。

 KEGG MEDICUS と名付け ら れ た 、医薬品・疾患・ パ ス ウ ェ ー の 統 合 デ ー タ ベ ー スも公開さ

れ て い る 。疾患・医薬品・環境物 質 など社会的ニー ズ の高い デ ー タ を 、 ゲ ノ ム 情 報 を 基盤と し

た 生体シ ス テ ム 情 報 と い て 統 合 し た リ ソ ー スで、 研 究者だけでなく、医療従事者や一般の人に

も情 報 を 提供し て い る 。

KEGG ブ ラ ウザ: http://www.genome.jp/kegg/pathway.html

KEGG Pathway を開け て み よう。 パ ス ウ ェ ー の項目は 、以下ように 分類さ れ て い る 。

1. Metabolism ;代 謝 経 路 (ビタ ミ ン A, retinol metabolism, の 代 謝 経 路 を調べて み よ

う。 代 謝産物 を 示 す が ア ク テ ィ ブで構 造 等 が表示 さ れ る 。 ま た 代 謝 を司る酵素名も◯ア ク テ ィ ブで、 配 列 情 報 等 が表示 さ れ る )

2. Genetic Information Processing ;遺 伝 子 か ら蛋白質 合 成 経 路 ・蛋白の修飾と 分

解 ・ ゲ ノ ム の修復 等 ( homologous recombination と non-homologous end-joining の 経 路

を比較し て み よう)

3. Environmental Information Processing ;細胞内 シ グ ナ ル 伝達経 路 ・ 分泌性 シ グ ナ

ル因子 を介し た細胞間相互作 用 ( TGF-beta の細胞内 伝達系 を調べて み よう。 発現の促

進 と抑制( ア ゴニス ト ) の 関 係 が 分 か る )

4. Cellular Processes :細胞の活動、細胞分裂サ イ ク ル 等 ( Oocyte meiosis (卵母細

胞減数分裂) を調べて み よう)

5. Organismal system;免疫系 ・ 内 分泌制御経 路 等 ( GnRH 、 生殖腺刺激ホ ル モ ン放

出 ホ ル モ ン 、 の 内 分泌経 路 を調べて み よう)

6. Human Deseases : 発 ガ ン 経 路 ・ 代 謝異常等 ( Melanoma, プ リ オ ン病 , diabetes( 1型糖尿病、 2 型糖尿病) の 発症経 路 を調べて み よう)

7. Drug Development :抗生 物 質 ・ 薬 剤 の 化 学 構 造 ( penicillin, antidepressants を調べ

て み よう。 合 成 経 路 、 薬 剤 の 分 解酵素等も表示 さ れ る )

遺 伝 子 の キ ー ワ ー ドでパ ス ウ ェ ー を 検 索 す る時の操作 は下記の通り ( 遺 伝 子名か ら パ ス

29

Page 30: バイオインフォマティックス概論授業予定 · Web view1.ショウジョウバエ(Drosophila)のhedgehogタンパク質のアミノ酸配列を、proteinデータベースからキーワード検索する(Accession

ウ ェ ー に入る )

練習 に hh; hedgehog の シ グ ナ ル パ ス ウ ェ ー を 見 よう

1. 先頭ペ ー ジで KEGG PATHWAT を ク リ ッ ク

2. 枠に hedgehog を入力し て GO3 . hedgehog が 関与す る パ ス ウ ェ ー ( Entry ) が 複数表示 さ れ る

4. 試し に map04340 を選択し て み よう。

5. パ ス ウ ェ ー が拡大 さ れ る 。各遺 伝 子 が ア ク テ ィ ブで、 配 列 ・ 機 能 情 報 に リ

ン ク し て い る 。

6. 上の HEDGEHOG SIGNALLING PATHWAY を選択す る と 、 こ の シ グ ナ ル の 説 明

を 見 る こ と ができる 。

練習 に estradiol の 合 成 経 路 を調べて み よう

1. 先頭ペ ー ジで KEGG PATHWAT を ク リ ッ ク

2. 枠に estradiol を入力し て GO3 . estradiol が 関与す る パ ス ウ ェ ー ( Entry ) が 複数表示 さ れ る

4 . Steroid hormone biosynthesis を あ け る と cholesterol か ら の 合 成 経 路 を 見 ら

れ る

5. 反応を 触媒す る酵素名が ア ク テ ィ ブで反応系 、 配 列 等 の 情 報 を 見 る こ と が

できる

6. ま た各代 謝産物 の 化 学 構 造も表示できる

遺 伝 子 の 化 合 物 の 構 造 を 検 索 す る時の操作 は下記の通り

練習 に ampicillin の 構 造 を調べて み よう

1. 先頭ペ ー ジで KEGG DRUG を ク リ ッ ク

2. 枠に ampicillinを入力し て GO3 . Entry を選択す る と 構 造 等 が 見 ら れ る

KEGG の BLAST検 索 を 使 っ て 、調べた い 遺 伝 子 ・ タ ン パ ク 質 が乗っ て い る パ ス ウ ェ ー を 検

索 す る こ ともできる .1. KEGG2 先頭ペ ー ジ上段の GENES を ク リ ッ ク 。 BLAST を開け る 。

2 . 例 と し て 、下の 塩 基 配 列 (私達の 研 究 グ ル ー プ が ウ ナギか ら ク ロ ーニン グ し

た 遺 伝 子でまだデ ー タ ベ ー ス に は登録し て い な い )でBLASTX 検 索 し て み よ

>test_DNA_sequence-2

ATCACTGCGTCTTGTGTCCTATCGGTCTAGCCTAGCCACTGTCTANAAGCTATAGGAAGGTTTCAGTATTGGGAGCCATGTTTGGGAGC

CTGCTGTTCACTGTGCTGTGTGAGGCAGCAGTGGCCCTCATCAACCCAAATCTAAGCCTCCATTGGGAGATGTGGAAGGAGGGACATGA

CAAGACCTACCTGTTTAAGGCTGAAGAGTTTGCACGCCGCCAGATCTGGGAGAAGAACCTGAAGCTGATAACTCTGCATAATTTGGAGG

CGTCCATGGGAATGCACACCTATGATCTGGGCATGAACCACCTAGGAGACTTGACTACCGAGGAGATTCTTGACGTGCTAGCTGTAACT

CGTGTGCCTCCAAACTTCAGCAGGGGTCCTTCTCCCTTTGTGGGGGTATCCAGGGCCCCTGTGCCTCACAATGTTGATTGGCGAAGAAA

GGGCTATGTCACAGAAGTCAAGAGTCAGGGGCGTTGTGGCTCCTGCTGGGCCTTCAGTGCTGCAGGTGCCCTGGAGGGCCAGCTGATGA

AGACTCAGGGAACACTTGTATCCCTCAGCCCTCAGAACCTGGTTGACTGCTCCTACAAATATGGCAACGAGGGCTGTCATGGAGGGTTC

30

Page 31: バイオインフォマティックス概論授業予定 · Web view1.ショウジョウバエ(Drosophila)のhedgehogタンパク質のアミノ酸配列を、proteinデータベースからキーワード検索する(Accession

ATGACTCAAGCCTTCCAGTATGTCATTGAGAACGGGGGCATTGAGTCTGACTTTTCATACCCTTACACTGGCATGGAAGAACAATGCAG

ATATGATTCAGAACTCCGTGTTGCCAACTGTTCCAGCTACAGGTTTCTTCCTGAAGGTGATGAGGTTGCATTAAAATGGGCTCTGGCCA

CTGTTGGACCAATCTCTGTGGCTATTGATGCTGCTCGACCTAATTTCCACTTCTACCGGAGTGGTGTGTACCATGACCCTACCTGTACC

CAAGAAGTAAACCATGGTGTTCTAGCAGTTGGCTATGGTACGCTCAATGGTGAGGACTACTGGCTTGTGAAGAACAGCTGGGGACAGCC

TTTTGGGGAACAGGGCTACATTCGCATGGCACGAAACAAGAACAACCAGTGTGGCGTTGCCTTGTATGCCTGCTACCCCATTATGTGAC

GACCTGAAGCAAAGGATTGATTTCTAACTTGAAACATTTTAAAATTTTTATTTTGATTTGCACCTGTGCATGTTACTGATTTGTAAAGA

ATACTGTTAAAATGATTTGTATTAAAAAAATATATATTTTTAGATGTGGAATTTTAGTTGAACCTAAATAAATAAATGTAAAAAAAAA

1. ゼブ ラ フ ィ ッ シュDre の エ ン ト リ ー を開け て み よう

2 . Pathway を開け て み よう。 検 索 し た 遺 伝 子 の パ ス ウ ェ ー上の 位置が 分 か る

KEGG MEDICUS利 用できる サ ービス

・ KEGG MEDICUS  医薬品情 報

・ KEGG MEDICUS  疾患情 報

・ KEGG MEDICUS  医薬品相互作 用

・ KEGG BRITE 医薬品分類

・ KEGG お薬 情 報

・ KEGG 先頭ペ ー ジ上段で、 MEDICUS を選択

・ Imatinib と言う医薬品でキ ー ワ ー ド 検 索 し て み よう

・効果 、 製 造 会社、 化 学 構 造 等 を知る こ と ができる :

31

Page 32: バイオインフォマティックス概論授業予定 · Web view1.ショウジョウバエ(Drosophila)のhedgehogタンパク質のアミノ酸配列を、proteinデータベースからキーワード検索する(Accession

以 下 工 事 中

講 義

タ ン パ ク 質 の 構 造 に つ い て の 解 説各種プ ロ グ ラ ム を 使うこ と に よ り 、 タ ン パ ク 質 の 構 造的特 徴 を 予 測 す る こ と ができま す 。今日

の 授 業では 、 シ グ ナ ル ペ プ チ ド 、 ド メ イ ン 構 造 に つ い て 解 説 し た あ と 、 テ ス ト 配 列 を 使 っ て 実

際 に こ れ ら 構 造 の 検 索 ( 分 子 量 、 等 電 点 、 シ グ ナ ル ペ プ チ ド 、 疎 水 性 ・ 親 水 性領域、 ド メ イ ン

構 造 ) を 行 い ま す 。

 代表的な ド メ イ ン 構 造 ( モ チ ー フ ) 検 索 サ イ ト に は 、 イギリ ス の サ ン ガ ー 研 究所が公開し て

い る Pfam が あ り ま す 。

シ グ ナ ル ペ プ チ ド

分泌性 の蛋白質 の N 末端に存在す る 、 15-30 残基 の 疎 水 性 ア ミ ノ 酸 か ら 構 成 さ れ た シ グ ナ ル 配

列 。 分泌前に 、 シ グ ナ ル ペ プ チダーゼに よ っ て切断さ れ る 。

タ ン パ ク 質 の ド メ イ ン ( モ チ ー フ ) 構 造

ド メ イ ン 構 造 ( = モ チ ー フ ) : タ ン パ ク 質 の ア ミ ノ 酸 配 列 の な かで、 特有な 性 質 を持っ た領域。

分 子 の 構 造上あ る い は 機 能上一つ の ま と ま り を持つ領域。

ド メ イ ン 構 造 の 例

細胞膜レ セ プ タ ー : リ ガ ン ド 結 合 ド メ イ ン 、細胞膜貫通ド メ イ ン 、 チ ロ シ ン キ ナ ーゼ

ド メ イ ン 、 リ ン 酸 化 ド メ イ ン

核レ セ プ タ ー : リ ガ ン ド 結 合 ド メ イ ン 、 DNA 結 合 ド メ イ ン

実 習

塩 基 配 列 の ア ミ ノ 酸 配 列 へ の 変 換

し て み ま す 。 コ ンピュー タ ー操作 に慣れ る ように し て下さ い 。今回 は 、魚類の cDNA ラ イ ブ

ラ リ ー か ら ク ロ ーニン グ さ れ た cDNA ク ロ ー ン の 全長配 列 ( 5’UTR, CDS, 3’UTR を含んでい る )

を 使 っ て 実 習 し ま す 。

5’UTR ( 5’非翻訳領域) , CDS ( コ ー ド 配 列 ) , 3’UTR( 3’非翻訳領域)

塩 基 配 列 ( >test_DNA_sequence-1 ) を ア ミ ノ 酸 配 列 に 変 換 し て み よう

1 ) 利 用 す る ウ ェ ブ サ イ ト : NCBI (National Center for Biotechnology Center) http://www.ncbi.nlm.nih.gov/

2 ) 使 用 す る ア イ コ ン : Open Reading Frame Finder (ORF finder )32

Page 33: バイオインフォマティックス概論授業予定 · Web view1.ショウジョウバエ(Drosophila)のhedgehogタンパク質のアミノ酸配列を、proteinデータベースからキーワード検索する(Accession

open reading frame =  蛋白質 を コ ー ド す る 塩 基 配 列 の 読 み 取 り枠

あ る い は 、 Epaxy の Translatehttps://web.expasy.org/translate/

ORF finder に よ る 検 索 手 順1 . NCBIの ウ ェ ブ サ イ ト を開き、左上Resource List (A-Z) を ク リ ッ ク

2 . Open reading frame finder(ORF finder)を開け る

3.ア ミ ノ 酸 配 列 に 変 換 す る

配 列 (FASTA format) を枠内 に 配 列 を コピー す る

OrfFind ボタ ン を押す

青で示 さ れ た 部 分 が 、 予想さ れ る ア ミ ノ 酸 配 列

( セ ン ス 、 ア ン チ セ ン ス 鎖 の 3 フ レ ー ムでの翻訳結 果 が 示 さ れ る )

通常、一番長い フ レ ー ム が タ ン パ ク 質 の コ ー ド 配 列であ る

青 の バ ー を ク リ ッ ク す る = 塩 基 配 列 と ア ミ ノ 酸 配 列 が表示 さ れ る

4.推定 さ れ た ア ミ ノ 酸 配 列 を 取 り 出 す に は

Acceptボタ ン を押す

Viewボタ ン を押す : ア ミ ノ 酸 配 列 デ ー タ と諸情 報 が 示 さ れ て い る

ア ミ ノ 酸 配 列 を テ キ ス ト ファイ ル 等 に コピー す る

>test_DNA_sequence-1(zebrafish_charon)

AACGAAACCTTGAACCGCAAGATTTTTCAACAAATAATCGACTATATGTATTTTTAGAGAGAAATAAATTCCCTCTCTTTT

CTTTTTTGTAAAATTCTATAATTTAGCTAAAATGACTTTTCAGGTCGGCTTTTTTGTGCTGTTGTCAGTCACAACAATTGG

CGCTTTCCCGCGCAATGCATTTCAGCGGGAATTTCACCGACACGTGGCGAAAGACTTTGAATCCTCCGGGAATGGACCAGA

CGAACCTGTTCGGGGATCTGTCCGAATTGTCAAACTAAACCCTCATTTTCTGCGCCGGGCCGCCGTTAGTCATGTGCCGTT

CAGAAATTCACCAAGTCGAGGCGCGTTTCCCGCGTTCTTGGCCCTCGGACGTCCGGGCCCCGCAATCCTGACCCATAGCAA

ACCTGCGCCTCAGGTGAGCAGCAGTGCAGACAGGAGGAAACAAGGGCTCGAGATGTGGAAGAAAGTGGTGCACAAAAGCGA

GCGAAAAAAAGAGGCAGTGGCTCTGCGCATCAATCCCAAAGACATGAACAAACAGAGCTGTGCCGCAGTTCCCTTTACACA

GCGCATAACGGAGGAGGGCTGTGAGACGGTGACCGTTCACAATAATCTCTGCTACGGTCAGTGCAGCTCCATGTTCGTGCC

CTCCAGCGGAGGCTCTCACGGACAACAGAAAGCGCAGTGCATGCGCTGCGGCCCCTCTAGAGCGCGCTCCGTGCTCCTGCA

CCTGCGCCGCGGGTCTGAGGTGCGGGAGAGGCGCGTACTGATCGTTGAGGAGTGCAAGTGTGAAACCAGCAGCGAAGAGGC

CAAAGTTCAGAACACAGATATGTTTAATTTATAACAGTCATTTTAAAGTTTATAAAAATCGTAA

//

Epaxy の Translate に よ る 検 索 手 順

タ ン パ ク 質 の 構 造 解 析では 、ヨー ロ ッ パ の 研 究 機 関 の ウ ェ ブ サ イ ト が充実 し て い る 。 特 に

Swiss Institute of Bioinformatics 、 Sanger研 究所( イギリ ス ) の サ イ ト は 、 利 用価値が高い 。前

者は 、 ExPASy (Bioinformatics Resource Portal) 、後者は Pfam ( ド メ イ ン 解 析 ) を公開し て い る 。

ま た European Bioinformatics Institute (EBI)でも、 タ ン パ ク 質 の 構 造 解 析 プ ロ グ ラ ム を公開し て い

る 。

1 . Epaxy を あ け る

33

Page 34: バイオインフォマティックス概論授業予定 · Web view1.ショウジョウバエ(Drosophila)のhedgehogタンパク質のアミノ酸配列を、proteinデータベースからキーワード検索する(Accession

2. 左の Visual guideの 、 DNA を ク リ ッ ク

3 . Translate を選択

4. 枠内 に 塩 基 配 列 の み コピー し 、 Translate sequenceを ク リ ッ ク し て 検 索

基 本 構 造 の 解 析

タ ン パ ク 質 の 分子量・等電点の 予 測 :

1 ) ExPASy (http://ca.expasy.org/)を開け る 。

2 ) Category の な か の Proteomics を開け る

3 ) Tools か ら Compute PI/Mw を選択

4 ) 下記の > zebrafish_Charon で検 索 し て み よう。 ア ミ ノ 酸 配 列 を枠内 に コピー す る

( 配 列 の み : こ の プ ロ グ ラ ム で は > で 始 ま る 行 は コ ピ ー し な い ) 。 Click here to computepI/Mw ボタ ン を ク リ ッ ク す る 。

5) 検 索 結 果 : Theoretical pI/Mw: 10.00 ( 等 電 点 ) / 27073.04( 分 子 量 )

>zebrafish_CharonMTFQVGFFVLLSVTTIGAFPRNAFQREFHRHVAKDFESSGNGPDEPVRGSVRIVKLNPHFLRRAAVSHVPFRN

SPSRGAFPAFLALGRPGPAILTHSKPAPQVSSSADRRKQGLEMWKKVVHKSERKKEAVALRINPKDMNKQSCA

AVPFTQRITEEGCETVTVHNNLCYGQCSSMFVPSSGGSHGQQKAQCMRCGPSRARSVLLHLRRGSEVRERRVL

IVEECKCETSSEEAKVQNTDMFNL

//

(ゼブ ラ フ ィ ッ シュCharon: 分泌型の シ グ ナ ル タ ン パ ク 質 )

疎水性・親水性領域の 解 析 :

1 ) ExPASy Proteomics tools (http://ca.expasy.org/) を開け る 2 ) Category の Proteomics を開け る

3 ) Tools か ら Prot Scale を選択

4 ) ア ミ ノ 酸 配 列 を枠内 に コピー す る 。 Hphob. / Kyte &Doolittle ( デ フ ォ ル ト状態:

疎 水 性 / 親 水 性 解 析で最も利 用 さ れ て い る プ ロ グ ラ ム ) を選択す る 。

5) >zebrafish_fgfr1 で試し て み よう

6) Submit ボタ ン を押す

7) 結 果 : グ ラ フ の プ ラ ス が 疎 水 性 、 マ イ ナ ス が 親 水 性 を 示 す . fgfr1 では 、 ア ミ ノ末端

側の 疎 水領域は シ グ ナ ル ペ プ チ ド の 部 分 。中央の 疎 水領域は 、細胞膜貫通ド メ イ ンで

あ る 。

>zebrafish_fgfr1

MIMKTTLLLISVLLTQALQSQGRPAIQDEAPAEPTSYTLDSGEKLELSCKAKEDTQKVTWTKDLVPLVDGEHTRLRN

DQMEIEKVEPADSGLYACFAQGLNSNHTEYFNISVTDEEDEVDSSSEEAKLSNDQNLPMAPVWAQPDKMEKKLHAVP

ASKTVKFRCQANGNPTPTLKWLKNGKEFKRDQRIGGFKVREHMWTIIMESVVPSDRGNYTCLVENRHGSINHTYQLD

VVERSPHRPILQAGLPANRTAVVGSDVEFECKVFSDPQPHIQWLKHIEVNGSRYGPDGLPYVRALKTAGVNTTDKEM

EVLQIRNVSLEDAGEYTCLAGNSIGHSHHSAWLTVYKAVPPTQLPNQTYLEVLIYCVGFFLICVMVGTAVLAKMHSS

AKKSDFNSQLAVHKLAKSIPLRRQVTVSVDSSSSMHSGGMLVRPSRLSSSGSPMLSGVSEYELPQDPRWEVQRDRLV

34

Page 35: バイオインフォマティックス概論授業予定 · Web view1.ショウジョウバエ(Drosophila)のhedgehogタンパク質のアミノ酸配列を、proteinデータベースからキーワード検索する(Accession

LGKPLGEGCFGQVMMAEAMGMDKEKPNRITKVAVKMLKSDATEKDLSDLISEMEMMKIIGKHKNIINLLGACTQDGP

LYVIVEFAAKGNLREYLRVRRPPGMEYCYNPDQVPVENMSIKDLVSCAYQVARGMEYLASKKCIHRDLAARNVLVTE

DNVMKIADFGLARDIHHIDYYKKTTNGRLPVKWMAPEALFDRIYTHQSDVWSFGVLLWEIFTLGGSPYPGVPVEELF

KLLKEGHRMDRPSTCTHELYMMMRDCWHAVPSQRPTFKQLVEDLDRTLSMTSNQEYLDLSVSLDQFSPNFPDTRSST

CSSGEDSVFSHDAGADEPCLPKFPPHPNRGVAFKKR

( FGF 受容体:細胞内 に チ ロ シ ン キ ナ ーゼド メ イ ン を持っ た膜貫通型細胞膜受容体・

FGF=fibroblast growth factor/ 繊維芽細胞増殖因子 :創傷治癒、培養条件下で繊維芽細

胞の 分裂を促進 す る 。胚発 生では中胚葉誘導に 関与す る )

シ グ ナ ル ペ プ チ ド の 検 索

タ ン パ ク 質 の シ グ ナ ル ペ プ チ ド の 予 測 :

1 ) SignalP 3.0 Server ( http://www.cbs.dtu.dk/services/SignalP/ ) を開け る ( デ ン マ ー

ク の Technical University が公開)

2 ) >zebrafish_Charonで検 索 し て み よう。 ア ミ ノ 酸 配 列 を枠内 に コピー す る 。 Submitボタ ン を ク リ ッ ク す る 。

練習 :下の ア ミ ノ 酸 配 列でも検 索 し て み よう

>mouse_vitamin_D_receptor

MEAMAASTSLPDPGDFDRNVPRICGVCGDRATGFHFNAMTCEGCKGFFRRSMKRKALFTCPFNGDCRITKDNR

RHCQACRLKRCVDIGMMKEFILTDEEVQRKREMIMKRKEEEALKDSLRPKLSEEQQHIIAILLDAHHKTYDPT

YADFRDFRPPIRADVSTGSYSPRPTLSFSGDSSSNSDLYTPSLDMMEPASFSTMDLNEEGSDDPSVTLDLSPL

SMLPHLADLVSYSIQKVIGFAKMIPGFRDLTSDDQIVLLKSSAIEVIMLRSNQSFTLDDMSWDCGSQDYKYDI

TDVSRAGHTLELIEPLIKFQVGLKKLNLHEEEHVLLMAICIVSPDRPGVQDAKLVEAIQDRLSNTLQTYIRCR

HPPPGSHQLYAKMIQKLADLRSLNEEHSKQYRSLSFQPENSMKLTPLVLEVFGNEIS

(ビタ ミ ン D受容体は 、核に移行 す る蛋白質 な のでシ グ ナ ル ペ プ チ ド は な い )

ド メ イ ン 構 造 の 検 索

タ ン パ ク 質 の ド メ イ ン 構造の 予 測 -1: Pfam を 使う( ド メ イ ン 検 索で最も利 用 さ れ て

い る : 機 能 ド メ イ ン を探す の に便利 )

今日 は 、下の マ ウ ス のビタ ミ ン D受容体で検 索 し ま す 。

1 ) Pfam ( http://pfam.sanger.ac.uk/ ) ( イギリ ス の サ ン ガ ー 研 究所) を開け る

2 ) SEQUENCE SEARCH ボタ ン を押す

3 ) 枠内 に ア ミ ノ 酸 配 列 (試し に >mouse_vitamin_D_receptor ) を コピー し 、 Go を押す

4 ) み つ か っ た ド メ イ ン 構 造 が グ ラ フ ィ ッ クで上に 図 示 さ れ る 。

5) 下に は各ド メ イ ン の 説 明 が表示 さ れ る 。

6) 一番右の Show/hide alignment を押す と 、 デ ー タ ベ ー ス に納めら れ て い る ド メ イ ン

35

Page 36: バイオインフォマティックス概論授業予定 · Web view1.ショウジョウバエ(Drosophila)のhedgehogタンパク質のアミノ酸配列を、proteinデータベースからキーワード検索する(Accession

配 列 と問い 合わせ配 列 の ア ラ イ メ ン ト が表示 さ れ る

7) ド メ イ ンネー ム (上の グ ラ フ ィ ッ クも同様) が ア ク テ ィ ブで、それ を押す と 、 ド メ

イ ン の 説 明 、 立体構 図 が表示 さ れ る

8) 右上の グ ラ フ ィ ッ クツー ル のうち、 crystallographic structuresを押す と 、 み つ か っ た

タ ン パ ク 質 の高次構 造 が グ ラ フ ィ ッ クで示 さ れ 、詳細な 構 造 の 説 明も表示 さ れ る 。

PBD ID を押す と 、 タ ン パ ク 質 の高次構 造 ( ア ル ファへ リ ッ ク ス 構 造 等 ) が表示 さ れ

る 。

>mouse_vitamin_D_receptor

MEAMAASTSLPDPGDFDRN

VPRICGVCGDRATGFHFNAMTCEGCKGFFRRSMKRKALFTCPFNGDCRITKDNRRHCQACRLKRCVDIGMMKEFILT

DEEVQRKREMIMKRKEEEALKDSLRPKLSEEQQHIIAILLDAHHKTYDPTYADFRDFRPPIRADVSTGSYSPRPTLS

FSGDSSSNSDLYTPSLDMMEPASFSTMDLNEEGSDDPSVTLDLSPLSMLPHLADLVSYSIQKVIGFAKMIPGFRDLT

SDDQIVLLKSSAIEVIMLRSNQSFTLDDMSWDCGSQDYKYDITDVSRAGHTLELIEPLIKFQVGLKKLNLHEEEHVL

LMAICIVSPDRPGVQDAKLVEAIQDRLSNTLQTYIRCRHPPPGSHQLYAKMIQKLADLRSLNEEHSKQYRSLSFQPE

NSMKLTPLVLEVFGNEIS

(ビタ ミ ン D受容体;核タ ン パ ク 質受容体ファミ リ ー の メ ン バ ーで、骨形成 等 に 関与

す る )

終わっ た人は 、次の タ ン パ ク 質で検 索 し て み よう:

ゼブ ラ フ ィ ッ シュ・ FGF レ セ プ タ ー

等 鎖 結 合 部 位 の 予 測

Asn-Xaa-Ser/Thr タ イ プ の 等 鎖 結 合 部 位 の 予 測 プ ロ グ ラ ム

http://www.cbs.dtu.dk/services/NetNGlyc/

3D 構 造 デ ー タ ベ ー ス の閲覧

NCBI の 利 用

NCBIの Resource List の中に あ る Structure (Molecular Modelling Database) を 使うと 、 タ ン パ ク 質

構 造 デ ー タ ベ ー ス に納めら れ て い る 3D 構 造 を閲覧す る こ と ができま す 。

↓NCBI homepage↓Resource List か ら Structure (Molecular Modelling Database) を選択

↓ 左カラ ム の Search を選択

↓Search の枠に タ ン パ ク 質 明 を入力し て 検 索 (試し に prion, VDR で検 索 し て み よう)

PDB (Protein Data Bank) の 利 用

www.pdb.org 上の ア イ コ ン か ら macromolecule を指定 し て キ ー ワ ー ド 検 索 (試し に prion, VDR で検 索 し て み

よう)

3D 構 造だけでなく、 遺 伝 子 の 機 能 の 解 説も添えら れ て い る

36

Page 37: バイオインフォマティックス概論授業予定 · Web view1.ショウジョウバエ(Drosophila)のhedgehogタンパク質のアミノ酸配列を、proteinデータベースからキーワード検索する(Accession

NCBI blastp に よ る 検 索

Blastp でデ ー タ ベ ー ス を Protein Data Bank を選択し て 検 索 す る (上の Protein Data Bankに登録さ れ て い る高次構 造 の 分 か っ て い る タ ン パ ク 質 に対し て blastp検 索 が 行われ る )

配 列類似遺 伝 子で高次構 造 の 解 析 さ れ て い る タ ン パ ク 質 が表示 さ れ る 。右の Accession ボ

タ ン を押す と 、 デ ー タ が表示 さ れ る 。右に 3D 構 造 が 図 示 さ れ る 。

37

Page 38: バイオインフォマティックス概論授業予定 · Web view1.ショウジョウバエ(Drosophila)のhedgehogタンパク質のアミノ酸配列を、proteinデータベースからキーワード検索する(Accession

11 月 28 日 ( 第 9 回 )

講 義

配 列 情 報 と 文 献 の 検 索

 研 究 計 画 を 立 て る場合 、その 研 究 に 関 連 し た過去の 論 文 を リ ス ト ア ッ プ し て 、既に 報告さ れ

て い る 成 果 を調べておくこ と が 大 変 重 要です 。 こ の操作 に よ り 、 こ れ か ら 進める 研 究 テ ー マ に

つ い て 、 研 究 がどこ まで進んでい る の か 、何が 分 か っ て い な い の か を調べる訳です 。そし て未

知の 生 物現象を 解 明 す る の に 、最も有効な 計 画 を 立 案 し ま す 。もちろん研 究で遺 伝 子 を扱う場

合 、その 遺 伝 子 の 配 列 、 こ れ までに 分 か っ て い る 性 質 を調べておくこ とも重 要です 。 こ の 検 索

操作 をちゃんと し ておか な い と 、「せっ かく得ら れ た 実験成 果 が既に 報告さ れ て い た」と言う

ような悲惨な こ とも起きかねません。

 ま た卒業 論 文や投稿用 論 文 の 作 成時に は 、緒言に 研 究 の 歴 史 と背景、 研 究 内 容 の意義 を述べ、

考察では 実験結 果 と既知の 成 果 を比較検討し 、 研 究で得ら れ た新し い知見 に つ い て議論 し ま す 。

論 文 を仕上げる時にも、 関 連 論 文 を 収 集 し て精査す る 必 要 が あ り ま す 。 文 献以外にも、 ク ロ ー

ニン グ し た 遺 伝 子 と 関 連 遺 伝 子 と の ア ラ イ メ ン ト を 行うこ とや、 分 子 系 統 樹 を 作 成 す る の に 関

連 遺 伝 子 を デ ー タ ベ ー ス か ら引き出 し てくる こ と が 必 要 と な る こ と が あ り ま す 。

 例えば、自分 の 研 究でウ シやブ タ などの家畜、 あ る い は 作 物で遺 伝 子 を ク ロ ーニン グ し た と

し ま す 。 遺 伝 子 機 能 に 関 す る 研 究 が 進んだ現在では 、 モ デ ル 生 物 ( マ ウ ス 、ニワ ト リ 、ゼブ ラ

フ ィ シュ、 シ ョ ウ ジ ョ ウ バ エ 、線虫、酵母、 シ ロ イ ズ ナ ズ ナ 等 ) のどれ かで相同遺 伝 子 の 機 能

が 解 析 さ れ 、 論 文 の形で出版さ れ て い る こ と が 多 い と言えま す 。その 論 文 を 読めば、 ク ロ ーニ

ン グ し た 遺 伝 子 の持つ 機 能 の 概 要 を知る こ と ができま す 。 デ ー タ ベ ー ス を 利 用 す れば、 こ の様

な 情 報も簡単に 収 集できま す 。 遺 伝 子 を BLAST 検 索 し 、 モ デ ル 生 物 の相同性 の高い 遺 伝 子 配 列

を探し 、そこ か ら 文 献 情 報 を探す こ と が 可 能です 。

 今日 は 、 研 究 計 画 を 立 て る時や論 文 を 書く際 、 ク ロ ーニン グ さ れ た 遺 伝 子 に 関 連 す る 論 文 の

検 索 、 研 究や論 文 作 成で必 要 な 論 文 の 検 索 方法を 実 習 し ま す 。

文 献 の 検 索 に は 、 ( 1 ) NCBIの PuBMed 、 ( 2 ) 大 学 の 図 書 館 の オ ン ラ イ ン ジャー ナ ル 、

( 3 ) Scopus( Elsevier 社の有料検 索 シ ス テ ム ) が 利 用できま す 。 PuBMed の 使 い勝手が最近

非常に よくな っ た ので、ほとんどの こ と は PuBMed です み ま す 。従っ て 、 PuBMed の 使 い 方 を

中心に 演 習 し 、 大 学 の 図 書 館 の オ ン ラ イ ン ジャー ナ ル に つ い て少し 解 説 を 加えま す 。

文 献 検 索 を 使う目的に は 、下記の ように幾つ か の シ チュエ ー シ ョ ン に 分 か れ ま す 。 いずれも

PuBMed で可 能です 。

1. 特 定 の 論 文 をダウ ン ロ ー ド し た い 。

2. あ る 研 究者がどの ような 論 文 を 出版し て い る か知り た い

3. あ る 生 物現象に 関 す る 論 文 をもれ なく調べた い 。

4. 作 成中の 論 文 の考察に 必 要 な 論 文 を探し た い

5. 扱う遺 伝 子 に 関 連 す る 論 文 を調べた い 。

38

Page 39: バイオインフォマティックス概論授業予定 · Web view1.ショウジョウバエ(Drosophila)のhedgehogタンパク質のアミノ酸配列を、proteinデータベースからキーワード検索する(Accession

実 習

文 献 の 検 索

使 用 す る ウ ェ ブ サ イ ト : NCBI使 用 す る ア イ テ ム : PubMed 上の枠の下に あ る Advanced ボタ ン を 使う。

左の All Fields ボタ ン を ク リ ッ ク す る と 、 著者名、 出版年度 、 タ イ ト ル中の ワ ー ド 、

Abstract中の ワ ー ド 、 Journal (雑誌)名で検 索できる シ ス テ ム に な っ て い る 。 こ れ

ら をうまく使うと 必 要 な 文 献 をうまく検 索 す る こ と が 可 能であ る 。それぞれ に つ い て

授 業では 実 習 し ま す 。東北大 学 図 書 館 が購読契約し て い る雑誌、 あ る は Plos One の よ

うな on-line journalであ れば、 検 索 結 果 の ペ ー ジ か ら 論 文 の pdf ファイ ル を と りだし て 、

プ リ ン トやダウ ン ロ ー ド ができま す 。

1. 特 定 の 論 文 をダウ ン ロ ー ド し た い 。

例えば、山中先 生 が ノ ー ベ ル賞をもらうこ と に な っ た iPS 細胞の 論 文 を探し て み よ

う。

Author: Yamanaka ShinyaJournal: Cell

2. あ る 研 究者がどの ような 論 文 を 出版し て い る か知り た い

例えば、私と 研 究室の助教の横井 さんの共著論 文 を探し て み よう。

Author: Suzuki TohruAuthor: Yokoi Hayato

3. あ る 生 物現象に 関 す る 論 文 をもれ なく調べた い 。 論 文 の考察に 関 連 す る 論 文 を探し た い 。

例えば、魚類の iPS 細胞に 関 す る 論 文 が 出版さ れ て い る か ?

Title/Abstract: FishTitle/Abstract: iPS cell

成長ホ ル モ ン の 日周リ ズ ム に 関 す る 論 文 を知り た い

Title/Abstract: growth hormoneTitle/Abstract: circadian rhythm

4. 扱う遺 伝 子 に 関 連 す る 論 文 を調べた い 。

例えば、癌遺 伝 子 Brca2 に 関 す る 論 文 を調べた い 。

Title/Abstract: Brca2Title/Abstract: human or mouse or zebrafish

39

Page 40: バイオインフォマティックス概論授業予定 · Web view1.ショウジョウバエ(Drosophila)のhedgehogタンパク質のアミノ酸配列を、proteinデータベースからキーワード検索する(Accession

BLAST 検 索 結 果 か ら 、 検 索 し た 遺 伝 子 に 関 す る 文 献 情 報 を 収 集 す る こ ともできま す 。 リ ス ト

ア ッ プ さ れ てきた 遺 伝 子 の名称が ア ク テ ィ ブで、それ を ク リ ッ ク す る と 配 列 情 報 に 加えて 、

PUBMED の番号を添えた形で関 連 の 論 文もリ ス ト ア ッ プ さ れ て い ま す 。 PUBMED 番号を ク リ ッ

ク す る と 文 献 情 報 に入る こ と ができま す 。

test_sequence-1 で試し て み よう。

>test_sequence-1(zebrafish_charon)_peptide

MTFQVGFFVLLSVTTIGAFPRNAFQREFHRHVAKDFESSGNGPDEPVRGSVRIVKLNPHFLRRAAVSHVPFRNSPSRGAFP

AFLALGRPGPAILTHSKPAPQVSSSADRRKQGLEMWKKVVHKSERKKEAVALRINPKDMNKQSCAAVPFTQRITEEGCETV

TVHNNLCYGQCSSMFVPSSGGSHGQQKAQCMRCGPSRARSVLLHLRRGSEVRERRVLI

「電 子 ジャー ナ ル」へ の ア ク セ ス の 方法

東北大 学 ホ ー ム ペ ー ジ→東北大 学付属図 書 館→電 子 ジャー ナ ル リ ス ト ( 学 内者限定 )→

雑誌名の キ ー ワ ー ド 検 索 OR ア ル ファベ ッ ト順で検 索→ volume, page 入力・ 検 索

40

Page 41: バイオインフォマティックス概論授業予定 · Web view1.ショウジョウバエ(Drosophila)のhedgehogタンパク質のアミノ酸配列を、proteinデータベースからキーワード検索する(Accession

1. 講 義 : 論 文 の 構 成 、 文 献 デ ー タ ベ ー ス

2. 実 習 : 文 献 検 索 ( PubMed )

鈴 木不在( 分 子 生 物 学 会 に 出 席 ) の ため酒 井 先 生 が 代わり に下記の 内 容で授 業 を 行 い ま す 。

配 列 の ア ラ イ ン メ ン ト手法とBLAST検 索 の 原 理

・ 配 列 の ア ラ イ ン メ ン ト と は

・ 全域ア ラ イ ン メ ン ト と局所ア ラ イ ン メ ン ト

・ ア ミ ノ 酸置換 行 列

・動的計 画法に 基づく局所ア ラ イ ン メ ン ト の求め方

・BLASTはどの ように 検 索 を 行 っ て い る の か

(動的計 画法と の違い と 、それ に ともなう利 点 、問題 点 )

進 化 系 統 樹 とCLASTAL Wで用 い ら れ て い る近隣結 合法の 原 理

・種の 進 化 モ デ ル

・ 分 子時計仮説

・ ウ ル ト ラ メ ト リ ッ ク 木 と 加法木

・UPGMA法

・近隣結 合法

以上に つ い て 概 説 す る 。

同内 容 の詳細に つ い て は 3年前期「生 物 生産情 報処理 概 論」に て 講 義 す る 。

41

Page 42: バイオインフォマティックス概論授業予定 · Web view1.ショウジョウバエ(Drosophila)のhedgehogタンパク質のアミノ酸配列を、proteinデータベースからキーワード検索する(Accession

12 月 5 日 ( 第 10 回 )

講 義

講 義 :次世 代 シ ー ケ ン ス 解 析 の 原 理

次世 代 シ ー ケ ン ス 解 析 に つ い て

 次世 代 シ ー ケ ン ス 解 析 は 、 こ の数年で実 用 化 さ れ た DNA シ ー ク エ ン ス 解 析技術で、

その 原 理 は従来の サ ン ガ ー法を 基礎と し た蛍光シ ー ク エ ン サ ー と は異な り 、 ガ ラ ス 基

盤( フ ロ ー セ ル ) に固着し た プ ラ イ マ ー を鋳型に し て ( ブ リ ッ ジ PCR ) 、 基板上で1

塩 基 の伸長反応ごと に 結 合 し た 塩 基 を蛍光検 出 し ま す ( Sequence by synthesis ) 。 ナ

ノ技術 に よ り 、 1mm 四方で万単位 の シ ー ク エ ン ス 解 析 が 可 能です 。最も汎用 さ れ て

い る Illumina 社の HiSeq2500 では 、 1 リ ー ド の リ ー ド長は 125bp と短いです が 、 シ ー

ケ ン サ ー を一度動か す と ( 1 ラ ン )で 80 億リ ー ド が 読 ま れ ま す 。 つ ま り 1 ラ ンで、

1000 Gbp (ギガ =10 億) の 配 列 が得ら れ る こ と に な り ま す 。 ヒ ト の ゲ ノ ム サ イ ズ は

約 3 Gbp な ので、その x300 が 読 ま れ る こ と に な り ま す 。現在では 、個人の ゲ ノ ム 解

読も可 能です 。

従来の蛍光シ ー ケ ン サ ーでは 、 1 ラ ンで 700bp の リ ー ド が 96 、 総 計約 67kb の 塩

基 配 列 が得ら れ る の に比べる と 、 オ ーダー が千万単位違い ま す 。 つ ま り次世 代 シ ー ケ

ン サ ー が 1 台 で 、 蛍 光 シ ー ケ ン サ ー の 千 万 台 分 の 解 析 能 力 が あ る わ け で す 。

HiSeq2500 では 、 ペ ア エ ン ド の シ ー ク エ ン ス 解 析 (約 300bp の断片を両側か ら 125bp読む) が 可 能です.シ ン グ ル エ ン ド の シ ー ケ ン ス 解 析 に比べ、 ペ ア 情 報 は 配 列 を コ ン

テ ィ グ に繋ぐ時に非常に有用 に な り ま す 。従っ て 、 de novo genome sequencing, de novo transcriptome 解 析 に は ペ ア エ ン ド の シ ー ク エ ン ス 解 析 が 必須であ る 。

 世 代 シ ー ケ ン サ ー は 1 台が数億円す る ため、 研 究室で購入す る こ と は非現実的です

が 、依頼解 析 が随分廉価と な り 、 すでに農学 研 究でも汎用 さ れ て い ま す 。農学 が対象

と す る 生 物も、ほぼ全 て の種の ゲ ノ ム 解 読 が終わっ て い ま す 。今後は 系 統間の 塩 基 配

列 の違い を調べ、 遺 伝形質 と 配 列 と の 関 係 を 解 析 す る こ と が 重 要 に な る と思われ ま す 。

 こ こで注意し な け ればな ら な い こ と は 、 1 レ ー ン あ た り 125bp の 配 列断片が約 7 億個得ら れ る と言うこ とで、その 解 析 は とうて い人の手に負える はずは なく、 コ ン

ピュー タ ー 解 析技術 が 必須です 。 ゲ ノ ム に し ても cDNA の 配 列 を 読むに し ても、最初

に 125bp の 配 列断片か ら 重 な り 合う部 分 を探し て 、 配 列 を コ ン テ ィ グ に つ なげる 必 要

が あ り ま す 。 配 列 解 析 の バ イ オ イ ン フ ォ マ テ ィ ッ ク ス は現在非常に 重 要 に な っ ており 、

まだ人材不足の状況です 。 と り あえずは 、 遺 伝 研 の パ イ プ ラ イ ン 等 を 使えば、普通に

必 要 な 解 析 は誰にでもできま す が 。

 授 業では 、 ( 1 )次世 代 シ ー ケ ン サ ー の 塩 基 配 列 解 読 原 理 、 ( 2 )次世 代 シ ー ケ ン

ス 解 析 の 利 用 方法に つ い て 講 義 し ま す 。

次世 代 シ ー ケ ン サ ー の 解 析 原 理 等 は 、国立 遺 伝 学 研 究所 先端ゲ ノ ミ ク ス推進 セ ン

タ ー の ホ ー ム ペ ー ジ が参考に な る

http://genome.nig.ac.jp/glossary/glossary11.html

42

Page 43: バイオインフォマティックス概論授業予定 · Web view1.ショウジョウバエ(Drosophila)のhedgehogタンパク質のアミノ酸配列を、proteinデータベースからキーワード検索する(Accession

12 月 12 ( 第 11 )

講 義ポ ス ト ゲ ノ ム 研 究

様々な 生 物 の ゲ ノ ム 配 列 が 解 読 さ れ る ように な り 、 ゲ ノ ム 配 列 を 使 っ た新し い 研 究 が ス タ ー

ト し て い ま す 。 ゲ ノ ム 配 列 が 利 用できる と言う前提 のもと に始ま る 研 究 が ポ ス ト ゲ ノ ム 研 究で

す 。その 内 容 は 、 遺 伝 子 の 機 能 解 析 、 生 物 進 化 、 遺 伝 子疾患の 原因遺 伝 子 の探索 など多岐にわ

た り ま す 。 こ の 授 業では 、 3 つ の トピッ ク ス に つ い て紹介し ま す 。

ポ ス ト ゲ ノ ム 研 究 - 1

比較ゲ ノ ム 学 : 進 化 に伴うゲ ノ ム 構 造 の 変 化

 進 化的に隔た っ た 多様な 生 物でゲ ノ ム 解 読 が 行われ た こ と に よ り 、種内 の パ ラ ロ グ の 検

索 、 ま た異な る 生 物間でオ ル ソ ロ グ を比較す る こ と 、 遺 伝 子 ファミ リ ー の メ ン バ ー を比較

す る こ と が 可 能 に な り ま し た 。 ま た染色体上の 遺 伝 子 の 配 列 を 系 統的に離れ た 生 物間で比

較す る こ と に よ り 、それ ら の共通祖先 生 物 の染色体構 造 を推定 す る こ と が 可 能 と な っ て い

ま す 。比較ゲ ノ ム は 、 こ の ように 生 物間でゲ ノ ム を比較し て 、 進 化 を 論じる 研 究 分野です 。

授 業では 、哺乳類と魚類の比較ゲ ノ ム を紹介し ま す 。

 フ グ と ヒ ト は 、 進 化的観点 か ら 見 る と脊椎動物 系 統 樹 の両端に 位置し ま す 。脊椎動物 は 、

大 部 分 の魚類を含む条鰭類、それ と シ ー ラカン ス ・肺魚および四肢動物 を含む総鰭類の 2

つ の グ ル ー プ に 大別さ れ ま す 。条鰭類と 総鰭類は 4億5千年前に 分岐し ま し た 。 フ グ と ヒ

ト の ゲ ノ ム 構 造 を比較す る こ と に よ り 、 4億 5 千年前に 生きて い た 総鰭類と条鰭類の共通

祖先 (もちろん現存し な い ) の ゲ ノ ム 構 造 が 明 ら か と な り 、その後の ゲ ノ ム 構 造 の 変 化 が

解 明 さ れ ま し た 。 解 析 の 結 果 、脊椎動物 の ゲ ノ ム の 進 化 に つ い て 、次の ような 予想もさ れ

て い な か っ た 結 果 が得ら れ ま し た 。

( 1 ) 4億 5 千年前に 生きて い た 総鰭類と条鰭類の共通祖先 は 1 2組の染色体を

持っ て い た 。

( 2 ) 総鰭類では条鰭類と 分 か れ た直後に 、 ゲ ノ ム に 大 量 の レ ト ロ ウ ィ ル ス が挿

入さ れ 、 ゲ ノ ム サ イ ズ が 大きくな っ た 。その後染色体間の転移と融合 ( ミ キ シ ン

グ ) が頻繁に起こ っ た 。

( 3 ) 条鰭類では 総鰭類と 分 か れ た直後に 、 ゲ ノ ム の倍化 (脊椎動物 の誕生 か ら

数える と 3度目) が起こ っ た 。 重 複 し た 遺 伝 子 の 大 部 分 は片方 が ゲ ノ ム か ら脱落し

た が 、約 20 %の 遺 伝 子 は倍加 し た ま ま現在でも機 能 遺 伝 子 と し て働い て い る 。そ

の ため、 ゲ ノ ム上の 遺 伝 子数は条鰭類の 方 が 総鰭類よ りも 20 %程多 い 。 こ の よう

な 遺 伝 子数の 増 加 が 、魚類に形態や環境適応の 多様性 をもた ら し た のでは な い か と

考えら れ て い る 。 ま た条鰭類では染色体へ の レ ト ロ ウ ィ ル ス の挿入はわずかであ り 、

染色体の ミ キ シ ン グもわずかであ る 。

 ま た 、無脊椎動物でも進 化的に 重 要 な 位置に あ る ホヤやナ メ ク ジ ウ オ の ゲ ノ ム 解 読 が 行

われ 、哺乳類でも多数の 生 物 の ゲ ノ ム が 解 読 さ れ て い ま す 。 生 物間でゲ ノ ム を比較す る こ

と に よ り 、臭覚受容 遺 伝 子 が無脊椎動物 か ら脊椎動物 の 進 化 の過程で遺 伝 子数を 増 加 し て

きた こ と が 、 明 ら か に な っ て い ま す 。 ま た胎盤の 進 化では 、 レ ト ロ ト ラ ン ス ポゾン由来の

43

Page 44: バイオインフォマティックス概論授業予定 · Web view1.ショウジョウバエ(Drosophila)のhedgehogタンパク質のアミノ酸配列を、proteinデータベースからキーワード検索する(Accession

遺 伝 子 が 重 要 な役割を 果 た し て い る と いう、意外な事実も示唆さ れ て い ま す 。 ま た ヒ ト と

チ ン パ ン ジ ーでは 、 塩 基 の置換率は た っ た 1.23%です が 、反復 配 列 の挿入が ヒ ト の 方 が か

な り 多 い こ と が 分 か り ま し た 。 こ の ように挿入配 列 は 、以前考えら れ て い た ような たんな

る ガ ラ ク タでは な い こ と が 分 か っ てきま し た 。

シ ン テ ニ ー

 異な る脊椎動物 ( 例えば、 ヒ ト - マ ウ ス 、 ヒ ト - フ グ ) を過去に遡る と 、共通祖先 が存在し

ま す 。共通祖先 か ら 分岐し た あ と 、それぞれ の 系で転座と融合 が起こ っ て い る が 、小さ な ブ

ロ ッ ク単位で見 る と 遺 伝 子 の 並びが一致す る領域が あ り ま す 。染色体上で遺 伝 子 の 並びが一致

し て い る状態は 、 シ ン テニー と呼ばれ ま す 。 全 ゲ ノ ム が 解 読 さ れ る と ゲ ノ ム 全体を 生 物間で比

較す る こ と が 可 能 と な り 、 シ ン テニー の様子 が 明 ら か と な り ま す 。

 ヒ ト と マ ウ ス を比べる と 、哺乳類同士の ため、 明瞭に シ ン テニー の保存状態が 見 て 取 れ ま す 。

 一方 、魚類では四肢動物 と 分 か れ て か ら直後に 全 ゲ ノ ム の 重 複 が起こ っ て い る ため、魚類の

染色体は ヒ トやマ ウ ス の染色体に対し て 2 重 の シ ン テニー を 示 す 特 徴 が あ り ま す 。

12 月 19 ( 第 12 )

講 義

次世 代 シ ー ケ ン スで読 み 取 ら れ た リ ー ド の 情 報処理

ト ラ ン ス ク リ プ ト ー ム 解 析 ( RNA配 列 の 解 析 )

ゲ ノ ム シ ー ケ ン ス

HiSeq2000 だと一つ の リ ー ド長は 100bp 、 HiSeq2500 だと 125bp で、依頼解 析 に 出 す と 、 1サ ン プ ル あ た りギガ オ ーダー の リ ー ド が USB に コピー さ れ て送ら れ てきま す 。 日 本では 、次世

代 シ ー ケ ン ス 解 析 を広く普及す る ために 、 遺 伝 学 研 究所に よ り 、次世 代 シ ー ケ ン ス の リ ー ド を

情 報処理 す る プ ロ グ ラ ム (Pipeline) が 、 ウ ェ ブ上で無料で利 用できる ように 整備さ れ て い ま す 。

有料の プ ロ グ ラ ム の場合 、半年契約で 50 万円あ ま り と高額です 。 解 析 は 、 大型コ ンピュー

タ ー が 必 要 な ので、 ク ラ ウ ド シ ス テ ムで、 配 列 を Pipeline で送り 、 遺 伝 研 の コ ンピュー タ ーで

情 報処理 さ れ 、数日後に 解 析 デ ー タ が送ら れ てくる シ ス テ ム に な っ て い ま す 。

シ ー ケ ン ス の サ ン プ ル は 、 ゲ ノ ム DNA の場合 と組織・細胞に 発現す る mRNA(cDNA) に 大別さ

れ ま す 。 ま た 、 解 析 の対象生 物 は 、参照ゲ ノ ム の あ る 生 物 、新規に シ ー ク エ ン ス す る 生 物 に 分

か れ ま す 。参照ゲ ノ ム の あ る 生 物では 、 ゲ ノ ム 配 列 の デ ー タ ベ ー ス とcDNA の デ ー タ ベ ー ス が

準備さ れ て い る ので、 ゲ ノ ム DNA 、 RNA の リ ー ド ともに参照配 列 に直接マ ッ プ す る こ と ができ

ま す 。 ゲ ノ ム DNAであ れば、 サ ン プ ル間で、 SNP や配 列 の挿入・欠損を 見 いだす こ と が 可 能で

す ( ゲ ノ ム リ シ ー ケ ン ス ) 。 RNA であ れば、各cDNA に マ ッ プ さ れ る リ ー ド数をカウ ン ト と し

て 、 サ ン プ ル間で比較す る こ と に よ り 、組織に 発現す る 全 遺 伝 子 を同定 す る と ともに 、 サ ン プ

ル間で現量 を比較す る こ と が 可 能です ( ト ラ ン ス ク リ プ ト ー ム 解 析 ) 。

参照ゲ ノ ム の な い 生 物 の場合 、 リ ー ド を一度、 ア セ ン ブ ル す る 必 要 が あ り ま す 。 こ れも遺 伝

研 の Pipeline で実 行できま す 。 ゲ ノ ム の場合 、現在だと HiSeq2500 の リ ー ド を繋いだ

Contig に 、 PacBio の次世 代 シ ー ケ ン ス 解 析 の リ ー ド ( 約 10kb) を併用 す る こ とでか な り長い

Scaffold に までつ なぎ合わす こ と が 可 能です (de novo ゲ ノ ム シ ー ケ ン ス ) 。 RNA の場合 、 リ ー

44

Page 45: バイオインフォマティックス概論授業予定 · Web view1.ショウジョウバエ(Drosophila)のhedgehogタンパク質のアミノ酸配列を、proteinデータベースからキーワード検索する(Accession

ド を ア セ ン ブ ル し て得ら れ る Contig が コ ー ド す る 遺 伝 子 を BLASTX に よ り同定 し ま す が 、 こ の

操作も Pipeline の Maser が 全 てやっ てくれ ま す 。 さ ら に KEGG の 代 謝 パ ス ウ ェ ー へ の GO(gene ontology)ア ノ テ ー シ ョ ンも同時に 実 行 し てくれ ま す 。

授 業では 、 こ れ ら の技術 を 使 っ て 行われ た 研 究 成 果 に つ い て幾つ か紹介し ま す 。

実 習

— ゲ ノ ム 塩 基 配 列 を デ ー タ ベ ー ス か ら 取 り 出す —

Ensembl Genome Brower

Ensembl Genome Brower ( ゲ ノ ム デ ー タ の 統括サ イ ト ) は 、 Sanger研 究所・ EBI が管理 す る

ゲ ノ ム デ ー タ ベ ー スです 。最大 の 特 徴 は 、 必 要 な 遺 伝 子 、 あ る い は染色体領域の ゲ ノ ム 塩 基

配 列 を 取 り 出 す こ と ができる こ と に あ り ま す 。 cDNA を 特異的に 増幅す る PCR プ ラ イ マ ー の

設計 、 CRIPR-Cas9 を 使 っ た ゲ ノ ム編集 、 ノ ッ ク ア ウ ト マ ウ ス の相同組換えに 用 い る 配 列 、

GFP を 使 っ た レ ポ ー タ ー 遺 伝 子 作 製 用 の プ ロ モ ー タ ー 配 列 が 必 要 な場合 などで、 Ensembl を

使 っ て ゲ ノ ム 配 列 を 取 り 出 す こ と に な り ま す 。 実 習では 、 Ensembl の 説 明 と 実 際 の 配 列 の 取

り 出 し 方 を教えま す 。

ま た 、 ゲ ノ ム 配 列 、 全 遺 伝 子 の コ ー ド 配 列 、 全蛋白質 の ア ミ ノ 酸 配 列もダウ ン ロ ー ド す る こ

と が 可 能で、それ ら を 使 っ て自前でバ イ オ イ ン フ ォ マ テ ィ ッ ク ス 解 析 を 行うこ と ができま す 。

「使 用法- 1」

Ensemblを 使 っ て 、試し に マ ウ ス の sonic   hedgehog ( shh ) の ゲ ノ ム 配 列 を 取 り 出 し て み

ま す 。

1.下記の ウ ェ ブ サ イ ト を開け る

http://www.ensembl.org/index.html (ensembl でキ ー ワ ー ド 検 索 )2.生 物種を指定 す る

マ ウ ス を選択

3.検 索項目か ら gene を選び、 遺 伝 子名 (shh) をボッ ク ス に入れ て 検 索

4.リ ス ト ア ッ プ さ れ てきた 複数の 遺 伝 子 か ら 、 shh を ク リ ッ ク ( ESMSUSG000000002633 )

す る

染色体上の 地 図 が表示 さ れ る

5.左側のツー ルボッ ク ス の中か ら Sequence を選択し て ク リ ッ ク

6.配 列 が表示 さ れ る ( エ ク ソ ン は赤字で肌色 の背景、 エ ク ソ ン間の 黒 字 の 部 分 は イ ン ト ロ ン 、

第一エ ク ソ ン よ り上流は プ ロ モ ー タ ー領域の一部であ る )

7.戻っ て 、 Location か らもゲ ノ ム 構 造 を 検 索 す る こ と ができる

8.左側に あ る Export dataで、範囲を選択し て 配 列 を 取 り 出 す こ と ができる (範囲を指定 し て 、

よ り長い プ ロ モ ー タ ー 配 列 を 取 りです こ と ができる )

「使 用法- 2」

45

Page 46: バイオインフォマティックス概論授業予定 · Web view1.ショウジョウバエ(Drosophila)のhedgehogタンパク質のアミノ酸配列を、proteinデータベースからキーワード検索する(Accession

ゲ ノ ム 配 列 、 全 遺 伝 子 の コ ー ド 配 列 、 全蛋白質 の ア ミ ノ 酸 配 列 をダウ ン ロ ー ド す る

Gene annotation --- Download genes, cDNAs, ncRNA, proteins (FASTA) か らダウ ン ロ ー ド 可 能

46

Page 47: バイオインフォマティックス概論授業予定 · Web view1.ショウジョウバエ(Drosophila)のhedgehogタンパク質のアミノ酸配列を、proteinデータベースからキーワード検索する(Accession

1 月 9 ( 第 13 回 )

次世 代 シ ー ケ ン ス を 使 っ た ゲ ノ ム シ ー ク エ ン ス に よ り 、 こ れ までの 連 鎖 解 析では同定困

難であ っ た疾患や形質 の 原因遺 伝 子 を 見 つ け 出 す こ と が 可 能 と な っ て い ま す 。最近の 報

告例 を 使 っ て 、紹介し ま す 。

Whole genome association study (WGAS)コ ン ト ロ ー ル群と 実験群(表現形質 : 例えば左利き)で、 全 ゲ ノ ム にわた っ て SNP の

出現頻度を比較す る 。表現型の責任遺 伝 子近傍の SNP では表現型集団で一致度が高くな

る ので、それ を 検 出 す る こ とで責任遺 伝 子 の ゲ ノ ム上の 位置を 特 定 す る 。

Exome 解 析

 メ ン デ ル 遺 伝 す る 1 遺 伝 子 に よ る レ ア な 遺 伝 子疾患の場合 、 コ ー ド領域の 変異に よ り

ア ミ ノ 酸 の置換 が起こ っ て い る こ と が 多 い 。 こ の技術では 、 ゲ ノ ム の エ ク ソ ン の み 配 列

を 解 読 す る こ とで、患者に 特異的な 塩 基置換 、 InDelを 検 出 す る こ とで、 遺 伝 子疾患の

責任遺 伝 子 を 特 定 す る 。 総 エ ク ソ ン の 塩 基 配 列 は 、 ゲ ノ ム の 1 %程度な ので、 解 析 量 が

少なくて すむ。場合 に よ っ て は 、 5 名程度の患者を 解 析 す るだけで、 原 遺 伝 子 が 特 定 さ

れ る 例もあ る 。

Rad-Seq ゲ ノ ム を 特 定 の制限酵素で消化 し 、消化断片の末端を次世 代 シ ー ケ ン スで解 析 し 、

SNAP を 検 出 す る 。通常の NGS ゲ ノ ム 解 読では ラ ンダム に断片化 す る ので、 集団間で

リ ー ド を直接比較す る こ と は不可 能であ る の に対し 、 Rad-Seq の場合 に は 、制限酵素の

切り口がそろっ て い る ので、 ゲ ノ ム 全体にわた っ て リ ー ド を高速か つ間便に 系 統間です

る こ と が 可 能であ る 。農林水産での品種の 解 析 に有効だと思われ る 。

バ イ オ デ ー タ ベ ー ス の 利 用

 遺 伝 子 の 機 能 を知り た い場合 に は 、 ポ ス ト ゲ ノ ム の モ デ ル 生 物 ( マ ウ ス 、ゼブ ラ フ ィ ッ シュ、

シ ロ イ ズ ナ ズ ナ 等 ) の 検 索 サ イ ト が 重宝し ま す 。 こ れ ら は 、 バ イ オ デ ー タ ベ ー ス と呼ばれ ま す 。

モ デ ル 生 物 の な かでも、 特 に マ ウ ス とゼブ ラ フ ィ ッ シュの デ ー タ ベ ー ス が充実 し ており 、 遺 伝

子 の 機 能だけでなく発現パ タ ー ン ( 遺 伝 子 が何時、どの組織で、どれだけ の 量 が 発現す る か ) 、

遺 伝 子 ノ ッ ク ア ウ トやノ ッ クダウ ン の表現型もデ ー タ ベ ー ス 化 さ れ ており 、 遺 伝 子名の キ ー

ワ ー ド 検 索でデ ー タ を入手す る こ と が 可 能です 。

  ヒ ト の 遺 伝 子 機 能 と 遺 伝 子 疾 患 の デ ー タ ベ ー ス と し て NCBIに OMIM ( Online Menderian Inheritance in Man ) が公開さ れ て い ま す 。 遺 伝 子名でキ ー ワ ー ド 検 索 す る と 、 遺 伝 子 の 機 能 、

遺 伝 子疾患が存在す る場合 に は 、 配 列 変異と疾患の表現型を知る こ と が 可 能です 。

 マ ウ ス の デ ー タ ベ ー ス ( MGI: mouse genome informatics ) の 特 徴 と し て 、 遺 伝 子ごと に ノ ッ

ク ア ウ ト マ ウ ス の表現型が デ ー タ ベ ー ス 化 さ れ ており 、表現型か ら 遺 伝 子 の 機 能 を調べる こ と

ができま す 。 マ ウ ス の デ ー タ ベ ー スでは 、 遺 伝 子 の正確な マ ッ プ ポ ジ シ ョ ン ( 連 鎖 地 図 、 ゲ ノ

ム 配 列上) 等も示 さ れ て い ま す 。

47

Page 48: バイオインフォマティックス概論授業予定 · Web view1.ショウジョウバエ(Drosophila)のhedgehogタンパク質のアミノ酸配列を、proteinデータベースからキーワード検索する(Accession

 ゼブ ラ フ ィ ッ シュの デ ー タ ベ ー ス ( ZFIN: zebrafish Organism Data Base ) に は 、 in situ ハイ

ブ リダイゼー シ ョ ン に よ る 発現解 析 の デ ー タ が写真で掲載さ れ ており 、 遺 伝 子 発現に 関 す る組

織レ ベ ル の 情 報 を得る こ と ができる 特 徴 が あ り ま す 。脊椎動物中であ ればオ ル ソ ロ グ 遺 伝 子

(異な る 生 物 の同一遺 伝 子 ) の 発現パ タ ー ン は類似し て い る こ と が 多 い ので、 マ ウ ス 、 ウ シや

ニワ ト リ を 研 究対象に す る場合でも参考と な り ま す 。

論 文や単行 書 を 読んで機 能 が 分 か ら な い 遺 伝 子 ( タ ン パ ク 質 ) がでてきた時に は 、それ ら の

遺 伝 子 の 機 能 を 調 べ る 必 要 が あ り ま す 。 こ の よ う な と き に は NCBI の OMIM (Online Mendelian Inheritance in Man) と マ ウ ス ・ゼブ ラ フ ィ ッ シュの ウ ェ ブ サ イ ト を 使うと 情 報 を

得る こ と ができま す 。 授 業では 、 こ れ ら の サ イ ト の 使 い 方 と 特 徴 に つ い て 説 明 し ま す 。

OMIM の 使 い 方

ヒ トで分 か っ て い る 遺 伝 子 の 機 能 を詳細に記述し て い る 。 関 連 文 献もリ ス と さ れ て い る 。

1. NCBIを開け 、左上の All List (A-Z)か ら Online Menderian Inheritance in Man (OMIM) を選択

す る 。

2 . 枠内 に 遺 伝 子名を入力し て 検 索

練習 に growth hormone ( 成長ホ ル モ ン ) を 検 索 し て み よう

growth hormone 遺 伝 子および関 連 遺 伝 子 の 配 列 変異に よ っ て起こ る症候群の リ ス ト が表

記さ れ る 。 遺 伝 子 の 機 能 、 変異に伴う疾患、 タ ン パ ク 質 の 構 造 、 関 連 論 文 を調べる こ と

ができる 。

MGI, ZFIN の 使 い 方

ポ ス ト ゲ ノ ム 研 究 の モ デ ル 生 物 の ウ ェ ブ サ イ ト を 利 用 し て み よう。 こ れ までの 研 究 に よ っ て 明

ら か に さ れ て い る 遺 伝 子 の 機 能 が 検 索できる 。

1.マ ウ ス ( MGI )

mouse genome informatics :  http://www.informatics.jax.org/ 1 . 先頭ペ ー ジ の QuickSearch の枠内 に 遺 伝 子名を入力す る

2 . 入力し た 遺 伝 子 の 情 報 、 遺 伝 子改変 マ ウ ス が リ ス ト さ れ る

試し に Pax6 (眼の 発 生 の上流に あ る転写因子 ) を入力し て み よう

Pax6と言うワ ー ド を含む遺 伝 子 リ ス ト が表示 さ れ る 。 Pax6 を選択す る

得ら れ る 情 報

Symbol/Name/ID : 遺 伝 子 の正式名称、略記

Synonyms :同義語(別名)

Genetic map : 遺 伝 子 の 連 鎖 地 図上の 位置

Sequence Map : 遺 伝 子 の 物 理 地 図上の 位置

Mammalian Homology :哺乳類の相同・類似遺 伝 子

Sequences : ゲ ノ ム 塩 基 配 列 ・ cDNA 塩 基 配 列 ・ ア ミ ノ 酸 配 列 情 報

Phenotypes; ノ ッ ク ア ウ ト マ ウ ス の表現型。 遺 伝 子 の 生 物 機 能 が 分 か る

48

Page 49: バイオインフォマティックス概論授業予定 · Web view1.ショウジョウバエ(Drosophila)のhedgehogタンパク質のアミノ酸配列を、proteinデータベースからキーワード検索する(Accession

Polymorphism: 系 統間で見 ら れ る 配 列 多型。 SNPs ( 1 塩 基 多型) 等

Gene Ontology (GO) : 遺 伝 子 の 機 能 、 構 造

Expression : 発現す る組織の リ ス ト

Protein Domains :転写産物 が持つ ド メ イ ン 構 造 の リ ス ト

References : 関 連 文 献

2.ゼブ ラ フ ィ ッ シュ( ZFIN)

The Zebrafish Model Organism Database : http://zfin.org/ 1 . Genes/Makers/Clones を開け る

2 . Name/Symbol に 遺 伝 子名を入力し て 検 索

試し に pax6 と入力し て 検 索 し て み よう。

魚類で単独に起こ っ た ゲ ノ ム 重 複 の ため pax6a と pax6b が あ る

Symbol-name では 遺 伝 子 の各種情 報 が表記さ れ る

Expression では 、 遺 伝 子 発現の デ ー タ が表記さ れ る

Phenotypeでは 、 ノ ッ クダウ ン と ノ ッ ク ア ウ ト の表現型が表記さ れ る

Locationでは 、染色体上の 位置が表記さ れ る

49

Page 50: バイオインフォマティックス概論授業予定 · Web view1.ショウジョウバエ(Drosophila)のhedgehogタンパク質のアミノ酸配列を、proteinデータベースからキーワード検索する(Accession

1 月 16 日 ( 第 14 回 )

ポ ス ト ゲ ノ ム 研 究 ( 3 )

— 機 能 ゲ ノ ム 学—

-  ゲ ノ ム を比較し て 遺 伝 子 の 発現調節機 構 を探る  - ポ ス ト ゲ ノ ム 研 究 の 重 要 な テ ー マ と し て 、 全 て の 遺 伝 子 の 機 能 を調べる こ と に 加えて 、 遺 伝

子 の転写調節に 重 要 な 配 列領域を 見 つ け る こ と が あ り ま す 。転写調節領域は 遺 伝 子 が何時、何

処で、どれだけ 発現さ れ る か と言う情 報 を コ ー ド し て い る こ と か ら 、 生 物 の形態や環境適応の

多様性 の背景に あ る ゲ ノ ム 情 報 は 、 タ ン パ ク 質 コ ー ド領域よ りもむしろ転写調節領域に存在す

る場合 が 多 いもの と 予想できま す 。

 特 に胚発 生 など生 物 の 基 本的な 生命現象に 関 係 す る 遺 伝 子 ( 例えば sonic hedghogや Pax 遺 伝

子 ) の転写調節領域は 、 生 物間で強く保存さ れ る傾向に あ り ま す 。 ゲ ノ ム 情 報 を 利 用 す る こ と

に よ り 、 遺 伝 子 発現に 必須の領域を 検 索 し た り 、 生 物間で変異が起こ っ て い る領域を 見 つ けだ

し 、それ ら の 機 能や生 物 学的意味を 解 析 す る 研 究 分野は 、 機 能 ゲ ノ ム 学 と呼ばれ ま す 。 授 業で

は 、 ヒ ト と フ グ の非コ ー ド領域の比較か ら 、 遺 伝 子 の転写調節に 重 要 な領域( CNE; conserved non-coding elements ) を 見 つ けだし た 研 究事例 を紹介し ま す 。

実 習今日 は 、 こ れ までの 実 習 の 復 習 を 行 い ま す 。

lefty と言う名前の 遺 伝 子 を材料に し て 復 習 を し ま しょう:

lefty の 機 能 の 検 索

メ ン バ ー の同定

遺 伝 子 の 発現パ タ ー ン

ヒ ト とゼブ ラで分 子 系 統 樹 を 作 製

メ ン バ ー の 進 化的関 係 を推定 し よう

50

Page 51: バイオインフォマティックス概論授業予定 · Web view1.ショウジョウバエ(Drosophila)のhedgehogタンパク質のアミノ酸配列を、proteinデータベースからキーワード検索する(Accession

1 月 16 日 ( 第 14 回 )

転写調節領域の コ ン セ ン サ ス 結 合 配 列 の 予 測 -

講 義遺 伝 子 の 発現調節機 構

 遺 伝 子 は 、 特 定 の細胞ま た時期に 必 要 量だけ 発現す る ように調節さ れ て い ま す 。 例えば、 ペ

プ シ ノ ー ゲ ン の 発現は胃に限定 さ れ ており 、筋肉や脳では決し て 発現し な い ように制御さ れ て

い ま す 。 発 生 に 関 係 す る 遺 伝 子 の な か に は 、魚類の孵化酵素の ように一生 のうち孵化時に一度

だけ 発現す る 遺 伝 子もあ り ま す 。 こ の ような 発現調節に 関 す る 情 報 は 、 ゲ ノ ム の コ ー ド領域で

は なく、その近辺に存在す る転写調節領域( エ ンハン サ ー領域) に コ ー ド さ れ て い ま す ( 5’上流に あ る場合 が 多 い が 、 3’下流に あ るものやイ ン ト ロ ン に あ る 遺 伝 子も存在す る ) 。 具体的に

は 、転写因子 が 結 合 す る コ ン セ ン サ ス 結 合 配 列 がその 情 報 と言うこ と に な り ま す 。転写因子 は 、

ゲ ノ ム の決ま っ た 配 列 を認識し て 結 合 し ま す 。その 配 列 が コ ン セ ン サ ス 結 合 配 列です 。 コ ン セ

ン サ ス 結 合 配 列 は 、 6-20 塩 基ほどの短い 配 列です 。転写調節領域に は 、 複数個の コ ン セ ン サ ス

配 列 が存在し 、 複数の転写因子 が 結 合 ・ 解離す る こ と に よ り 、 遺 伝 子 の転写を精密に調節し て

い ま す 。 講 義では転写調節の メカニズ ム に つ い て 解 説 し 、 実 習で転写調節領域の コ ン セ ン サ ス

配 列 を 検 索 し ま す 。

実 習マ ウ ス の sonic hedghog遺 伝 子 の 5’上流域の転写調節領域の 配 列 を ゲ ノ ム デ ベ ー ス か ら 取 り 出 し 、

コ ン セ ン サ ス 結 合 配 列 を 予 測 し て み ま す 。

コ ン セ ン サ ス 結 合 配 列 の 検 索 に は幾つ か の プ ロ グ ラ ム が あ り ま す が 、 実 習では TFSearch を

用 い ま す 。

http://www.cbrc.jp/research/db/TFSEARCHJ.html

問題 : マ ウ ス の sonic hedghog ( shh ) 遺 伝 子 の転写調節領域の 配 列 を ゲ ノ ム デ ー タ ベ ー ス か

ら 取 り 出 し 、 コ ン セ ン サ ス 結 合 配 列 を 予 測 す る 。

( 1 )最初にゼブ ラ フ ィ ッ シュの sonic hedghog遺 伝 子 の 5’上流域の転写調節領域の 配 列 を ゲ

ノ ム デ ベ ー ス か ら 取 り 出 し ま す 。

1 ) Emsembl (http://www.ensembl.org/index.html) を開け ま す

2 ) 対象性 物 か ら mouse を選択

3 ) 検 索項目か ら gene を選び、 shh で検 索

4 ) 検 索 結 果 の ペ ー ジ に あ る shh の ア ク セ ッ シ ョ ン を ク リ ッ ク

5) 左側ボタ ン の Sequence を ク リ ッ ク す る と 、 ゲ ノ ム 配 列 が表示 さ れ る

6) 第 1 エ ク ソ ン (赤字 ) か ら上流の 配 列 (転写調節領域) を メ モ帳に コピー す る ( -40 b あ た り に TATA box (TATA(A/T)A(A/T))が存在す る こ と が 分 か る 。その約 40b 上流に は

CAAT Box (GCCAATCT) が 配置す る )

( 2 )次に 、 MOTIF Search を開け る

51

Page 52: バイオインフォマティックス概論授業予定 · Web view1.ショウジョウバエ(Drosophila)のhedgehogタンパク質のアミノ酸配列を、proteinデータベースからキーワード検索する(Accession

( http://www.cbrc.jp/research/db/TFSEARCHJ.html )7) 上の枠に任意の名前を入力す る

8) 下の枠に 塩 基 配 列 を コピー 、 分類を脊椎動物 と し 、 Execを ク リ ッ ク

注意: コ ン セ ン サ ス 配 列 は 、ほとんどの場合 6-10b 程の短い 配 列であ り 、 加えて あ る程度の 配

列 の バ リ エ ー シ ョ ン を許容 し ま す 。その ため予想さ れ た 配 列 に は 、 実 際 に は転写因子 と相互作

用 し な い 配 列 が高い比率で含ま れ ま す 。 検 索 結 果 は 、目安程度に考えて下さ い 。 実 際 の コ ン セ

ン サ ス 配 列 を同定 す る ために は 、 分 子 生 物 学 の技術 ( ゲ ル シ フ ト ア ッ セ イ 、 ル シ フ ェ ラ ーゼを

レ ポ ー タ ー に し た プ ロ モ ー タ ー 解 析 等 ) を 使 っ て 実験的に 検証す る 必 要 が あ り ま す 。

52

Page 53: バイオインフォマティックス概論授業予定 · Web view1.ショウジョウバエ(Drosophila)のhedgehogタンパク質のアミノ酸配列を、proteinデータベースからキーワード検索する(Accession

1 月 10 日 ( 13 回 )

1. ゲ ノ ム 解 読で明 ら か に な っ た ヒ ト ゲ ノ ム の 特 徴 、医療へ の 利 用 に つ い ても簡単に紹

介し ま す

ポ ス ト ゲ ノ ム 研 究 - 2

次世 代 シ ー ケ ン ス を 使 っ た ゲ ノ ム シ ー ク エ ン ス に よ り 、 こ れ までの 連 鎖 解 析では同定困難で

あ っ た疾患や形質 の 原因遺 伝 子 を 見 つ け 出 す こ とも可 能 と な っ て い ま す 。 こ の技術 は 、 whole genome association study (WGAS) と呼ばれ ま す 。最近の 報告例 を 使 っ て 、 WGAS に つ い て紹介

し ま す 。

ま た 、 ゲ ノ ム の 多様性 ( 多型性 ) をもた ら す 配 列 変 化 に つ い ても説 明 し 、 配 列 の 多様性 が動

物 の形質 と リ ン ク し て い る 例 を紹介し ま す 。

実 習発現デ ー タ ベ ー ス を 使 っ た シ ミュレ ー シ ョ ン 実験( 1 )

-   digital differential display -   ゲ ノ ム 解 読 プ ロ ジ ェ ク ト の 進めら れ て い る 生 物では 、 EST (expressed sequence tags) の 塩 基

配 列 解 読 プ ロ ジ ェ ク トも並 行 し て 進めら れ て い ま す 。 EST プ ロ ジ ェ ク トでは 、組織あ る い は細

胞種ごと に 、 cDNA ラ イ ブ ラ リ ー か ら無作為に ク ロ ー ン を選んで配 列 ( 5’, 3’ 末端の ワ ン パ ス

シ ー ク エ ン ス ) を 解 析 し て い ま す 。 EST デ ー タ ベ ー スでは 、同定 さ れ た 遺 伝 子種とその数値

(何個検 出 さ れ た か ) が組織あ る い は細胞種ごと に 整 理 さ れ て い ま す 。従っ て デ ー タ に は 、各

組織に 発現し て い る 遺 伝 子種と 遺 伝 子ごと の相対的な 発現強度が反映さ れ て い る こ と に な り ま

す 。 こ れ ら の デ ー タ は 、 ト ラ ン ス ク リ プ ト ー ム (Transcriptome) と呼ばれ ま す 。 こ の デ ー タ を

利 用 す る こ と に よ り 、調べた い組織に 発現し て い る 遺 伝 子 の種類と 発現強度、組織間で発現強

度の異な る 遺 伝 子 を調べる こ と ができま す 。 コ ンピュー タ ーで遺 伝 子 発現を調べる操作 は 、

digital differential display と呼ばれ ま す 。 授 業では次の 例 題 を 使 っ て 、 digital differential displayの操作 を 実 習 し ま す 。

例 題 1.生 物 の各器官で発現す る 遺 伝 子 の種類と 発現強度を調べる

ウ シ の乳腺で発現す る 遺 伝 子種とその強度は ?

例 題 2.2 つ の細胞種で発現量 が異な る 遺 伝 子 を調べる

マ ウ ス の ES 細胞 (Embryonic stem cells) と胚細胞 (Blastocytes) で発現量 の異な る 遺 伝

子 は ?

例 題 3.あ る 生 物 の 2 つ の器官で発現量 が異な る 遺 伝 子 を調べる

マ ウ ス の小脳 (Cerebellum) と 大脳皮質 (Cortex) で発現量 の異な る 遺 伝 子 は ?

53

Page 54: バイオインフォマティックス概論授業予定 · Web view1.ショウジョウバエ(Drosophila)のhedgehogタンパク質のアミノ酸配列を、proteinデータベースからキーワード検索する(Accession

Digital differential display (DDD) の ペ ー ジ の開け 方

NCBI の Transcriptome 情 報 を 使う - Digital differential display1 . NCBIの 先頭ペ ー ジ に あ る All Resources か ら 、 Digital differential display (DDD) を選択

例 題 1.生 物 の各器官で発現す る 遺 伝 子 の種類と 発現強度を調べる

ウ シ の乳腺 (mammary gland) で発現す る 遺 伝 子種とその強度は ?

手順

1 . Species を Bos taurus に選択、 continue を ク リ ッ ク

2. 組織名( Mammary gland ) の ID番号を ク リ ッ ク 。 発現強度の強い 遺 伝 子 か ら順に表

記さ れ る 。 TMP は 、 100 万個の mRNA 当た り に 出現す る個数を 示 す 。

例 題 2.あ る 生 物 の 2 つ の器官・細胞で発現量 が異な る 遺 伝 子 を調べる

マ ウ ス の ES 細胞 (Embryonic stem cells) と胚細胞 (Blastocytes) で発現量 の異な る 遺 伝

子 は ?

1. Species を Mus musculus に選択、 continue を ク リ ッ ク

2 . まずA ( こ こでは Embryonic stem cells ) の ID番号 (15703, 15704, 15705) を

選択、上の枠内 に名前( ES cells ) と記入し 、 continue を押す

3. B の組織( こ こでは Blastocytes ) の ID(850, 875, 1021, 10026) を チ ェ ッ ク し 、

枠内 に名前( Blastocytes ) と記入し 、 continue を押す

4. A と B で発現強度が有意に異な る 遺 伝 子 が 、表示 さ れ る

1 月 17 日 ( 第 14 回 :最終回 )

講 義次世 代 シ ー ケ ン サ ー の応用 に つ い て 2 例紹介し ま す 。

1 . RANA-seq: Transcriptome 解 析 ( mRNA の 発現プ ロ ファイ ル の 解 析 、 サ ン プ ル間比

較)

2 . Rad –seq: ゲ ノ ム 全体をカバ ー す る簡便な SNP マ ーカー の 収 集

2 つ の 方法とも農学 分野の 研 究 に非常に有効です 。

RANA-seq:組織に 発現し て い る 遺 伝 子 をほぼ全 て 網羅的に同定 す る こ と ができま す 。 ま た各遺

伝 子 の 発現量 (組織にm RNA が何コピー 発現し て い る か )も数値化 さ れ ま す 。従っ て 、組織の

遺 伝 子 発現プ ロ ファイ ル が 明 ら か に な るだけでなく、 2 つ の サ ン プ ル ( 例えば、対照区と 実験

区)で発現し て い る 全 遺 伝 子 の 発現量 を比較す る こ と ができま す 。

Rad –seq:通常の ゲ ノ ム シ ー ケ ン スでは 、精製 し た ゲ ノ ム DNA を 物 理的に 300bp 程度に切断し て 、

断片の両側か ら 100bp を シ ー ケ ン ス し ま す 。 物 理的に切断す る ので断片は完全 に ラ ンダム な ゲ

ノ ム断片と な り ま す 。 Rad –seq では 、決ま っ た 4 塩 基 あ る い は 6 塩 基 の 配 列 を認識し て切断す

54

Page 55: バイオインフォマティックス概論授業予定 · Web view1.ショウジョウバエ(Drosophila)のhedgehogタンパク質のアミノ酸配列を、proteinデータベースからキーワード検索する(Accession

る制限酵素でゲ ノ ム を断片化 し 、断片の両側か ら 100bp を シ ー ケ ン ス し ま す 。異な る 系 統でも、

同じ部 位でゲ ノ ム が切断さ れ る ので、断片の 配 列 を 2 系 統で直接比較( ア ラ イ メ ン ト ) す る こ

と が 可 能 と な り ま す 。 100bp の中に存在す る SNP を同定でき、 ゲ ノ ム 全体にわた っ て SNP を ま

んべんなく収 集 す る こ と が 可 能です 。高密度な SNP マ ーカー が短時間で一挙に得ら れ る ため、

品種間の 遺 伝的差異や形質 の 連 鎖 解 析 に有効に 利 用できま す 。

55

Page 56: バイオインフォマティックス概論授業予定 · Web view1.ショウジョウバエ(Drosophila)のhedgehogタンパク質のアミノ酸配列を、proteinデータベースからキーワード検索する(Accession

ポ ス ト ゲ ノ ム 研 究 ( 1 )

— ゲ ノ ム に存在す る 全 て の 遺 伝 子 の 機 能 を調べる

 全 ゲ ノ ム 塩 基 配 列 の 解 読 の あ と にくる最も重 要 な 研 究課題 と し て 、 ゲ ノ ム に存在す る 全

て の 遺 伝 子 の 機 能 解 明 が あげら れ ま す 。 遺 伝 子 の 機 能 を 解 析 す る ス ト ラ テ ジ ー は 、 大きく

分 け る と フ ォ ワ ー ド ジ ェ テ ィ ク ス ( Forward Genetics: 順遺 伝 学 ) と リ バ ー ス ジ ェネテ ィ ク

ス ( Reverse Genetics: 逆遺 伝 学 ) に 分 け る こ と ができま す 。 マ ウ ス 、ゼブ ラ フ ィ ッ シュ、

シ ョ ウ ジ ョ ウ バ エ 、線虫は こ れ ら ポ ス ト ゲ ノ ム 研 究 の モ デ ル 生 物 と し て 用 い ら れ て い ま す 。

 リ バ ー ス ジ ェネテ ィ ク ス は 、 遺 伝 子 の 生体内での 機 能 を 解 明 す る ための最も直接的な 方

法で、 遺 伝 子 の 機 能 を破壊し 、 発 生や器官形成 、 代 謝 、 行動に表れ る表現型を 解 析 し 、表

現型か ら 遺 伝 子 の 機 能 を 解 明 し ま す 。 遺 伝 子 の 機 能破壊の 方法に は 、 遺 伝 子 ノ ッ クダウ ン

あ る い は 遺 伝 子 ノ ッ ク ア ウ ト の 2 つ が あ り ま す 。上の モ デ ル 生 物では いずれも、 遺 伝 子破

壊に よ る 全 遺 伝 子 の 機 能 解 明 プ ロ ジ ェ ク ト が 進めら れ て い ま す 。線虫と魚類は 、 ア ン チ セ

ン ス技術 を個体レ ベ ルで適応できる 点で、 遺 伝 子 機 能 解 析 に圧倒的に有利です 。 特 に線虫

は 、 RNAi法で簡単に 遺 伝 子 機 能 を破壊できる こ と か ら 、 ゴ ー ル ( 全 遺 伝 子 の 機 能 解 明 ) に

最も近い と言えま す 。線虫では 機 能破壊に よ り寿命が延びる と言うような興味深い 遺 伝 子

も見 つ か っ て い ま す 。

 遺 伝 子 機 能 を 解 明 す るうえで、 ノ ッ ク ア ウ ト マ ウ ス は 重 要 な役割を 果 た し て い ま す が 、

ES 細胞で相同組み 換えに よ り 遺 伝 子破壊を 行 い 、その ES 細胞を胚移植し て ノ ッ ク ア ウ

ト個体を 作 製 す る に は 、 1 年あ ま り 必 要です 。最近、 TALEN 法、 CRISPR/Cas9 法と よばれ

る新し い ノ ッ ク ア ウ ト と ノ ッ ク イ ン技術 が開発 さ れ て い ま す 。卵生 の魚類やカエ ルでは 、

受精卵に コ ン ス ト ラ ク と の RNA を顕微注入す るだけで遺 伝 子 の ノ ッ ク ア ウ ト が 可 能です 。

ま た TALEN 法は 原 理的に は 、 遺 伝 子疾患の 原因であ る 変異遺 伝 子 の 配 列 を正常に治癒させ

る こ とも可 能です 。 iPS 技術 と組み 合わせる と 遺 伝 子治療へ の 発展が期待できま す 。 授 業

では簡単に TALEN 法と CRISPR/Cas9 法の 原 理 を 解 説 し ま す 。

 

以下工事中

以下、今年使 用 し な か っ た過去の資料

講 義

 脊椎動物 の中ではゼブ ラ フ ィ ッ シュが 、 モ ル フ ォ リ ノ オ リ ゴ を 使 っ た ア ン チ セ ン ス技術

で遺 伝 子 機 能 を破壊できる 点で、 遺 伝 子 機 能 の 解 析 が 容易だと言えま す 。 具体的に は 、顕

微注入に よ り ア ン チ セ ン ス モ ル フ ォ リ ノ オ リ ゴ を受精卵に注入し 、 発 生で現れ る表現型

(体に表れ る異常) を調べる こ とで、 遺 伝 子 機 能 を 解 析 す る こ と が 可 能です 。 ただし こ の

方法で解 析できる の は 、受精後 2 日以内 に働く遺 伝 子 に限ら れ 、 成人病に 関 連 す る ような

遺 伝 子 等 の 機 能 は 解 析不能です 。ゼブ ラ フ ィ ッ シュの ウ ェ ブ サ イ ト ( ZFIN)では 、誰にで

も機 能破壊実験を 行うこ と ができる ように 、各遺 伝 子 の 機 能破壊に 必 要 な モ ル フ ォ リ ノ オ

リ ゴ の 塩 基 配 列 が掲載さ れ て い ま す 。

56

Page 57: バイオインフォマティックス概論授業予定 · Web view1.ショウジョウバエ(Drosophila)のhedgehogタンパク質のアミノ酸配列を、proteinデータベースからキーワード検索する(Accession

  一 方 、 フ ォ ワ ー ド ジ ェ テ ィ ク ス で は 、 点 変 異 を 誘 導 す る 化 学 変 異 源 ( ENU. Ethyl nitrosourea ) に よ り突然変異体の ラ イ ブ ラ リ ー を まず作 製 し ま す 。様々な表現型の突然変

異体が得ら れ ま す が 、 こ の時点では突然変異体でどの 遺 伝 子 に 変異が起こ っ て い る の か

( 原因遺 伝 子 、責任遺 伝 子 ) は 明 ら かであ り ません。 フ ォ ワ ー ド ジ ェ テ ィ ク スでは 、 遺 伝

マ ーカー (主に マ イ ク ロ サ テ ラ イ ト ) と の 連 鎖 解 析 に よ り 、 原因遺 伝 子 を 連 鎖 地 図 に マ ッ

プ し 、組換え率が 0.1% 程度の マ ーカー が 見 つ か る まで連 鎖 解 析 を 進めま す 。 見 つ か っ た

近隣マ ーカー近くの 変異体ゲ

ノ ム を 解 読 し 、突然変異に よ り 塩 基置換 が起こ っ て い る場所を探し 出 し ま す 。 こ の 方法は 、

ポ ジ シ ョ ナ ル ク ロ ーニン グ と呼ばれ ま す 。

デ ー タ ベ ー ス を 使 っ た 遺 伝 子 機 能 の 検 索

ENTREZNCBIの 全 デ ー タ ベ ー ス ( 配 列 、 文 献 、 遺 伝 子 発現、 SNP 等々) に納めら れ て い る 情 報 か

ら 、 キ ー ワ ー ド 検 索 に よ り 関 連 情 報 を 網羅的に 検 索できる サ イ ト

ENTREZ の 利 用

NCBI (http://www.ncbi.nlm.nih.gov/) に は 、 キ ー ワ ー ドで全 て の デ ー タ ベ ー ス を一挙に 検 索 す る

ツ ー ル ENTREZ が あ り ま す 。 ENTREZ で キ ー ワ ー ド 検 索 す る と 、 配 列 情 報 、 文 献 情 報 、

OMIM 、 OMIA 、 立体構 造 等々の デ ー タ がもれ なく検 索 さ れ てきま す 。 ENTREZ を 利 用 す れば、

タ ン パ ク 質 の 構 造や遺 伝病等 に 関 す る 情 報 を一挙に入手す る こ と ができ、非常に便利 な 検 索 シ

ス テ ム と いえま す 。

ENTREZ の 使 い 方

・ 開け 方 : NCBIの 先頭ペ ー ジ All databeses で、枠内空欄の ま ま Search を ク リ ッ ク

・ 枠内 に 遺 伝 子名(略字 等 ) を入力し て 検 索

・ 調べた 遺 伝 子 に つ い て NCBIの デ ー タ ベ ー ス に あ る 情 報 が 全 て表示 さ れ る (数字 は デ ー タ

ベ ー ス に納めら れ て い る 情 報 の数を 示 す )

57

Page 58: バイオインフォマティックス概論授業予定 · Web view1.ショウジョウバエ(Drosophila)のhedgehogタンパク質のアミノ酸配列を、proteinデータベースからキーワード検索する(Accession

講 義

推薦図 書

ゲ ノ ム 関 連

「ゲ ノ ム」岡崎康司 / 坊農秀雅監訳・ メ デ ィカル ・ サ イ エ ン ス ・ イ ン タ ー ナ シ ョ ナ ル社

( 9,500 円)

「ゲ ノ ム 研 究 実験ハン ド ブ ッ ク」辻本豪三、田中利男・羊土社( 6,500 円)

「大規模ゲ ノ ム 解 析 と ポ ス ト シ ー ク エ ン ス時代 の 遺 伝 子 機 能 解 析」林崎良英監修・中山書

店( 3,600 円)

「比較ゲ ノ ム か ら 読 み 解く生命シ ス テ ム」藤山秋佐夫監修・秀潤社( 4,000 円)

バ イ オ イ ン フ ォ マ テ ィ ッ ク ス 関 連

「バ イ オ イ ン フ ォ マ テ ィ ッ ク ス 基礎講 義 - 一歩進んだ発想を み がくために」岡崎康司 / 坊農秀雅 監訳・ メ デ ィカル ・ サ イ エ ン ス ・ イ ン タ ー ナ シ ョ ナ ル社( 3,900 円)

「バ イ オ イ ン フ ォ マ テ ィ ッ ク ス がわか る」菅原秀明 ・羊土社( 4,200 円)

「ゲ ノ ム 情 報 は こう活かせ」岡崎康司 / 坊農秀雅・羊土社( 4,410 円)

「即活用 の ための バ イ オ イ ン フ ォ マ テ ィ ッ ク ス入門 」広川貴次 / 美宅成 樹著・中山書店

( 3,500 円)

「バ イ オ デ ー タ ベ ー ス と ウ ェ ブツー ル の手と り足と り活用法 」中村保一ら編集 ・羊土社

( 3,800 円)

「できる バ イ オ イ ン フ ォ マ テ ィ ッ ク ス」広川貴次 / 美宅成 樹著・中山書店( 3,500 円)

    「 バ イ オ イ ン フ ォ マ テ ィ ッ ク ス 」 メ デ ィカル ・ サ イ エ ン ス ・ イ ン タ ー ナ シ ョ ナ ル 社

( 9,500 円)

  「バ イ オ リ ソ ー ス&デ ー タ ベ ー ス活用 術」秀潤社( 4,600 円)

  「バ イ オ イ ン フ ォ マ テ ィ ク ス事典」日 本 バ イ オ イ ン フ ォ マ テ ィ ク ス 学 会編集 ・共立 出版

( 14,000円)

ウ ェ ブ サ イ ト

研 究室 home page        http://www.agri.tohoku.ac.jp/bioinfor/index-j.html =========================================================================

文 献 検 索 、 塩 基 配 列 、 ホ モ ロ ジ ー 検 索 、 ORF finder 、 Map viewer 等

NCBI http://www.ncbi.nlm.nih.gov/ (National Center for Biotechnology Information)

塩 基 配 列 、 ホ モ ロ ジ ー 検 索 、 分 子 系 統 樹 作 成 、 シ ー ク エ ン ス登録等

DDBJ http://www.ddbj.nig.ac.jp/Welcome-j.html (DNA Data Bank of Japan)

塩 基 配 列 、 ホ モ ロ ジ ー 検 索 、 タ ン パ ク 質 の 構 造 ( ド メ イ ン ・ モ チ ー フ 検 索 等 ) 解 析

EBI http://www.ebi.ac.uk/Information/ (European Bioinformatics Institute)

58

Page 59: バイオインフォマティックス概論授業予定 · Web view1.ショウジョウバエ(Drosophila)のhedgehogタンパク質のアミノ酸配列を、proteinデータベースからキーワード検索する(Accession

ゲ ノ ム 配 列 の デ ー タ ベ ー ス

Ensembl            http://www.ensembl.org/index.html=======================================================================

分 子 系 統 樹 作 成

ClustalW http://clustalw.genome.jp/ =======================================================================

タ ン パ ク 質 ・ 遺 伝 子 の 機 能 検 索

オ ン ト ロ ジ ー

http://www.geneontology.org/ http://www.pir.uniprot.org/ ド メ イ ン ・ モ チ ー フ 検 索 http://www.ebi.ac.uk/Information/ シ グ ナ ル ペ プ チ ド の 予 測

http://www.cbs.dtu.dk/services/SignalP/ 3D 立体構 造 の 予 測 、 DNA の翻訳 http://ca.expasy.org/ノ ッ ク ア ウ ト マ ウ ス の表現型 http://www.informatics.jax.org/ =======================================================================

転写調節領域の モ チ ー フ 検 索

転写因子 の 結 合 部 位 予 測         http://www.cbrc.jp/research/db/TFSEARCHJ.html ======================================================================

代 謝 経 路

KEGG http://www.genome.jp/kegg/pathway.html =======================================================================

ゲ ノ ム 研 究 の モ デ ル 生 物

マ ウ ス

http://www.informatics.jax.org/ツメ ガ エ ル http://genome.jgi-psf.org/cgi-bin/runAlignment?db=frog4x1ミ ド リ フ グ フ グ ゲ ノ ム デ ー タ ベ ー ス

http://www.genoscope.cns.fr/externe/tetranew/ト ラ フ グ フ グ ゲ ノ ム デ ー タ ベ ー ス

http://fugu.biology.qmul.ac.uk/ト ラ フ グ フ グ ゲ ノ ム デ ー タ ベ ー ス

http://genome.jgi-psf.org/cgi-bin/runAlignment?db=fugu6&advanced=1ゼブ ラ フ ィ ッ シュ http://zfin.org/

http://www.ensembl.org/Danio_rerio/index.htmlメダカ http://shigen.lab.nig.ac.jp/medaka/

59

Page 60: バイオインフォマティックス概論授業予定 · Web view1.ショウジョウバエ(Drosophila)のhedgehogタンパク質のアミノ酸配列を、proteinデータベースからキーワード検索する(Accession

http://medakagb.lab.nig.ac.jp/Oryzias_latipes/index.htmlシ ョ ウ ジ ョ ウ バ エ

http://www.ncbi.nlm.nih.gov/BLAST/Genome/Insects.html http://genome.med.yale.edu/lab/index.htm線 虫

http://omicspace.riken.jp/Ce/rnai/jsp/index.jsp 酵 母

http://www.ncbi.nlm.nih.gov/mapview/map_search.cgi?taxid=4932 http://www.fhcrc.org/science/labs/kruglyak/Data/

=======================================================================

cDNA, EST 情 報

マ ウ ス cDNA http://fantom3.gsc.riken.jp/index.htmlア フ リカツメ ガ エ ル EST http://xenopus.nibb.ac.jp/ メダカ EST http://medaka.lab.nig.ac.jp/est_index.htmlカタユウ レ イボヤ EST http://ghost.zool.kyoto-u.ac.jp/indexr1.html

=========================================================================

microarray に 関 す る 情 報

ヒ ト繊維芽細胞 http://genome-www.stanford.edu/serum/data.htmlシ ョ ウ ジ ョ ウ バ エ http://genome.med.yale.edu/Lifecycle/

=========================================================================

その他

http://genes.mit.edu/GENSCAN.html http://www.tigr.org/software/microarray.shtml http://motif.genome.jp/ http://www.rcsb.org/pdb/

=============================================================

60