8
個別要素技術3 タンパク質相互作用情報や発現頻度 情報等のデータベースへの格納 平成20年11月18日 産業技術総合研究所 バイオメディシナル情報研究センター 坂手 龍一

タンパク質相互作用情報や発現頻度 情報等のデータ …...1 個別要素技術3 課題一覧 遺伝子発現制御データベースの構築-> 「発現」 ①転写制御領域予測データベースの構築

  • Upload
    others

  • View
    0

  • Download
    0

Embed Size (px)

Citation preview

Page 1: タンパク質相互作用情報や発現頻度 情報等のデータ …...1 個別要素技術3 課題一覧 遺伝子発現制御データベースの構築-> 「発現」 ①転写制御領域予測データベースの構築

個別要素技術3

タンパク質相互作用情報や発現頻度情報等のデータベースへの格納

平成20年11月18日

産業技術総合研究所 バイオメディシナル情報研究センター

坂手 龍一

Page 2: タンパク質相互作用情報や発現頻度 情報等のデータ …...1 個別要素技術3 課題一覧 遺伝子発現制御データベースの構築-> 「発現」 ①転写制御領域予測データベースの構築

1

個別要素技術3 課題一覧

遺伝子発現制御データベースの構築 -> 「発現」① 転写制御領域予測データベースの構築② H-ANGELの改良と利用③ 遺伝子転写後修飾および翻訳制御情報のヒト全遺伝子データベースへの格納

タンパク質相互作用データの集約 -> 「タンパク質相互作用」④ タンパクなどの生体分子相互作用情報のヒト全遺伝子データベースへの格納

モデル動物との間の高精度なオルソログ解析 -> 「進化」⑤ 比較ゲノムブラウザの開発⑥ 多重比較ゲノムデータベースの開発

Page 3: タンパク質相互作用情報や発現頻度 情報等のデータ …...1 個別要素技術3 課題一覧 遺伝子発現制御データベースの構築-> 「発現」 ①転写制御領域予測データベースの構築

遺伝子発現制御データベースの構築 -> 「発現」

① 転写制御領域予測データベースの構築

Motif Distribution Viewer (MDV) http://hinv.jp/mdv/

目標

ヒト遺伝子発現データベース(H-

ANGEL)の組織特異的発現データ

と転写調節領域の配列情報を3

万遺伝子を目標に統合する。

主な成果 [目標達成]

組織特異的発現に関わると推定

される転写因子結合モチーフ情報

を33,883遺伝子について同定した。

結果を格納するMotif Distribution

Viewer (MDV)を公開した。

利用例:

転写開始点上流40〜50bpのPlus

strandにTBP(TATA)モチーフが局在。

2

Page 4: タンパク質相互作用情報や発現頻度 情報等のデータ …...1 個別要素技術3 課題一覧 遺伝子発現制御データベースの構築-> 「発現」 ①転写制御領域予測データベースの構築

遺伝子発現制御データベースの構築 -> 「発現」

② H-ANGELの改良と利用

異なるアイソフォームを同時に検出するプローブ

アイソフォーム特異的プローブ

H-ANGEL http://hinv.jp/h-angel/(上)とDNAProbeLocator http://hinv.jp/DNAProbeLocator/(下)

目標

ヒト遺伝子発現データベース”H-

ANGEL”をH-InvDBと同時に更

新し、3万以上の遺伝子の発現

情報を格納する。

主な成果 [目標達成]

H-ANGELの更新により28,858遺

伝子の発現情報を格納した。

また、商用プローブセットと転写

物の対応情報を格納する

DNAProbeLocatorを公開した。

利用例:

スプライシングバリアントなどによる

アイソフォーム特異的なプローブの

探索。

3

Page 5: タンパク質相互作用情報や発現頻度 情報等のデータ …...1 個別要素技術3 課題一覧 遺伝子発現制御データベースの構築-> 「発現」 ①転写制御領域予測データベースの構築

遺伝子発現制御データベースの構築 -> 「発現」

③ 遺伝子転写後修飾および翻訳制御情報のヒト全遺伝子データ

ベースへの格納

目標

各種生物の遺伝子翻訳制御情報を

収集し、遺伝子発現に影響を与える

転写後修飾に関するデータベースを

構築する。

主な成果 [目標達成]

全遺伝子に対してアンチセンス遺伝

子が存在するかどうかの情報(有:

8,352遺伝子)をH-InvDBから新たに

公開した。また、開始コドン付近のコ

ンセンサス配列であるKozak配列の

有無の情報(有:1,040転写物)をH-

InvDBから公開した。

H-InvDB各カテゴリー(I〜VII)に含まれる遺伝子の、開始コドン周辺の塩基出現頻度の期待値からのずれ(スコア)

4

Nakagawa et al. (2008)

Page 6: タンパク質相互作用情報や発現頻度 情報等のデータ …...1 個別要素技術3 課題一覧 遺伝子発現制御データベースの構築-> 「発現」 ①転写制御領域予測データベースの構築

タンパク質相互作用データの集約 -> 「タンパク質相互作用」

④ タンパクなどの生体分子相互作用情報のヒト全遺伝子データ

ベースへの格納目標

タンパク質相互作用(PPI)などの

情報を統合し、遺伝子間の相互

関係情報を格納するシステムを

公開する。また、遺伝子座間の

相互作用などについて種間保存

情報を提供する。

主な成果 [目標達成]

BINDなどの5つのデータベース

のタンパク質相互作用情報を統

合し、9,268タンパク質からなる

32,198 PPI 情報をPPI viewを通

じて公開した。遺伝子の種間保

存情報は、分子進化データベー

ス”Evola”と関連付けて提供した。 PPI view http://hinv.jp/ppi/

5

Page 7: タンパク質相互作用情報や発現頻度 情報等のデータ …...1 個別要素技術3 課題一覧 遺伝子発現制御データベースの構築-> 「発現」 ①転写制御領域予測データベースの構築

モデル動物との間の高精度なオルソログ解析 -> 「進化」

⑤ 比較ゲノムブラウザの開発

目標

20以上の生物種の全ゲノ

ム配列を格納し、100万箇

所以上の保存性の高いゲ

ノム領域の配列アラインメ

ントを提供する。

主な成果 [目標一部達

成]

比較ゲノムブラウザ”G-

compass”を開発し、解析

実行時に利用可能であっ

たすべての脊椎動物ゲノ

ム配列(ヒトと12生物種)に

ついて、564万箇所の配列

アラインメントを公開した。 G-compass http://hinv.jp/g-compass/

6

Page 8: タンパク質相互作用情報や発現頻度 情報等のデータ …...1 個別要素技術3 課題一覧 遺伝子発現制御データベースの構築-> 「発現」 ①転写制御領域予測データベースの構築

モデル動物との間の高精度なオルソログ解析 -> 「進化」

⑥ 多重比較ゲノムデータベースの開発

目標

オルソログ関係(共通祖先由来)

にある遺伝子セットを、ヒト-マウ

スで1万遺伝子を目標に同定す

る。ヒト2万遺伝子について、他

生物とのオルソログ、パラログ、

偽遺伝子の情報を公開する。

主な成果 [目標達成]

Evolaで、マウスとオルソログ関係

のヒト16,284遺伝子を同定した。

ヒト20,150遺伝子について、いず

れかのモデル生物とのオルソロ

グ、パラログ等の情報を公開した。

Evola http://hinv.jp/evola/Matsuya et al. (2008)

7