DNAロボットや合成生物学の ための...

Preview:

Citation preview

DNAロボットや合成生物学のDNAロボットや合成生物学のためのための

情報科学技術

人間知能と人工知能人間知能と人工知能

• 人間知能 ‐‐‐ネットワーク上の共同作業

– 集合知(Web2.0)• ネットワーク上の知識の蓄積と共有ネットワ ク上の知識の蓄積と共有

– 合成生物学の場合

iGEMの i t• iGEMのregistry

• 人工知能 ‐‐‐コンピュータによる自動化

– 自動設計

• コンピュータによる最適化、特に進化的計算

– DNAロボットの場合

• 塩基配列塩基配列

• DNAデバイスそのもの

集合知(Web2.0)• 集合知(collective intelligence)

ネットワ クでつながれた有名 無名の人たちが– ネットワークでつながれた有名・無名の人たちが

共同で知識を形成して行く

– Wisdom of Crowds• OSS(open source software)OSS(open source software)

– Linuxに代表されるソフトウェア

集合知の手本– 集合知の手本

• Wikipedia– 集合知の見本

– 完璧な無制御完璧な無制御

– それでも百科事典に匹敵する正確さ

iGEMの本当の目的 --- registryg y• 遺伝子部品のライブラリ

f ト ジ タ デ タブ ク– cf. トランジスタのデータブック

– iGEM参加者は新しい部品を登録する義務を負う。

生命に学ぶ人工知能命 学ぶ人 知能• 生命の進化・適応の能力に着目

– 進化による環境への最適化

• 進化的計算進化的計算

– 突然変異・交叉(組み換え)・選択(適者生存)を

ンピ タの中で模擬してコンピュータの中で模擬して、

様々な探索問題・最適化問題を解く。

– 探索空間が膨大、選択基準が複雑な場合に

特に有効。特に有効。

– 各種の設計問題に適用されている。

• DNAロボットの自動設計• DNAロボットの自動設計

• 人工遺伝子回路の設計 生命から学んだ技術が生命を作る

人工知能人工知能

自動実験ロボット

新しい生物新しい生物

大腸菌ロボット

DNAロボット

人工知能人工知能

自動実験ロボット

何が必要?何が必要?

象 適 デ• 化学反応や生命現象の適切なモデル

– 粗すぎず。粗すぎず。

– 細かすぎず。

実用的な探索方法• 実用的な探索方法

– 最良のものが得られなくてもよいから、

効率よく探索。

– 最良でなくても 十分に動作するもの最良でなくても、十分に動作するもの

– 後で検証すればよい。

どうせ検証しなければならない– どうせ検証しなければならない。

化学系・生物系の計算モデル

目次目次

いろいろ喋っても…

• マルチセット書き換え

• Gillespie法• π計算と確率π計算 この他 膜システム• π計算と確率π計算

• グラフ書き換え系

この他、膜システム、セル・オートマトン、ハイブリッド・システムなど

• DNAデバイスの自動設計

ハイブリッド システムなど

• DNAデバイスの自動設計

マルチセット書き換え

化学反応のモデル化学反応のモデル

• 濃度大

– 連続濃度に対する微分方程式連続濃度に対する微分方程式

• 少分子

ルチセ ト書き換え系– マルチセット書き換え系

– 確率マルチセット書き換え系

• 確率微分方程式(マスター方程式)

連続濃度に対する微分方程式連続濃度に対する微分方程式

1k

22 2 RGkBRkdG 21 2 RGkBRk

dt

k2k

マルチセット書き換え系マルチセット書き換え系

確率的マルチセット書き換え系確率的マルチセット書き換え系

propensity11

423

c

1c

2

22c

c221

2c

マスター方程式

確率的マルチセット書き換え系

propensity11

423

c

1c

22c

解析的に

調べるのは 221c

2c調べるのは

一般に困難

rrggbbb pccpcpcdp

22324143

rrggbbbrggggbbbrrrgbbbb pccpcpcdt

2121 21122112

Gillespie法

Gillespie法• 確率的シミュレーションの標準的手法

Gillespie法確率的シミュレ ションの標準的手法

– 各々の書き換え規則(反応)は、

比例 た確率 実行されるpropensityに比例した確率で実行される

– a0 をpropensityの和としたとき、0

いずれかの規則が今から時間 t のうちに

実行される確率は 1ea0t 今から時間 t の間に実行されない実行される確率は 1e 0

• Gillespie法の各ステップ

今から時間 t の間に実行されない確率を P(t) とすると、P(0) = 1 で、dP(t) = a0 P(t) dt

– [0,1] の一様乱数 r から (1/a0)ln(1/r) によって

次の書き換えの時刻を決定 1 ea0t = 1r次 書き換 時刻を決定

– 乱数を用いてpropensityに比例して規則を選択

一般に一般に…

密 確 布• 累積密度 Φ(t) の確率分布から

確率変数 t をサンプルするには、確率変数 t をサンプルするには、

[0,1] の一様乱数を r として、

Φ(t) = r を解けばよい(Φ(t) = 1r でも同じ)。

• すると 一様乱数が r~r+dr に入るとき• すると、 様乱数が r r+dr に入るとき、

確率変数は t~t+dr/f(t) に入る。

ただし、 f(t) は確率密度(f(t)dt = dr)。• t はちょうど密度 f(t) で分布する• t はちょうど密度 f(t) で分布する。

分子種 i の個数が Xi分子種 個数 i

τ跳躍法τ跳躍法

• Gillespie法の効率化

• 分子数がある程度大きい場合、分子数がある程度大きい場合、

数回の反応では分子数は大きく変化しない

• 適当な時間間隔 の間に

propensityが a の反応が起こる回数 n はpropensityが a の反応が起こる回数 n は、

平均 a のPoisson分布に従う

細胞内における化学反応細胞内における化学反応

転• 転写

– 遺伝子 mRNA遺伝子

• 翻訳

RNA タンパク– mRNA タンパク

– 制御タンパクは遺伝子の発現を制御

• 代謝

シグナル伝達• シグナル伝達

• …

例:遺伝子回路によるトグル・スイッチ• Tian et al., 2006

u: λCI の濃度v: LacR の濃度

Hill係数Hill係数

u: λCI の濃度u: λCI の濃度v: LacR の濃度

LacR の生成速度

λCI に依存

しない部分

λCI に依存する部分:λCI は三つまとまってしない部分 λCI は三つまとまってLacR の転写を阻害していると推測される。3 は Hill係数という3 は Hill係数という。

Hill係数Hill係数λCI の分解速度

u: λCI の濃度u: λCI の濃度v: LacR の濃度

マイトマイシンに

依存しな 部分

マイトマイシンCに依存する部分依存しない部分 依存する部分:Hill係数は 1

微分方程式を数値的に解くと微分方程式を数値的に解くと…

パラメータ s の違い --- マイトマイシンCの濃度の違い

少分子系として少分子系として…

適• τ跳躍法の適用

– λCI と LacR の生成と分解の回数はC と の生成と分解の回数は

Poisson分布に従うPoisson分布の平均

propensityと解釈

確率的シミュレーション(τ跳躍法)確率的シミュレ ション(τ跳躍法)

π計算と確率π計算

π計算π計算

並 算 デ• 並行計算のモデル

• チャネルを通して通信し合うプロセスチャネルを通して通信し合うプロセス

– 各種の反応を表現することが可能

入れ子 構造• 入れ子の構造

– 膜のモデル

• プロセス間の等価性の理論が発展

• 非決定性に確率を付与 ⇒ 確率π計算非決定性に確率を付与 確率 計算

プロセスの定義プロセスの定義チャネルaからの入力

Gene(a,b) :=並列合成

( , ).(Gene(a,b)|Protein(b)) + a..Gene(a,b)

チョイス自発的遷移

Protein(b) := b.Protein(b) + .0

チャネルbへの出力

自発的遷移自発的遷移

...|(… + .P + …)|... → ...|P|...

...|(.(Gene(a,b)|Protein(b)) + a..Gene(a,b))|...→ ...|Gene(a,b)|Protein(b)|…

...|(b.Protein(b) + .0)|... → ...|0|... ...|...

通信通信

...|(… + a.P + …)|(… + a.Q + …)|...→ |P|Q|→ ...|P|Q|...

• より一般的には

...|(… + a(x).P(x) + …)|(… + a(M).Q + …)|...→ ...|P(M)|Q|...

通信通信

...|(… + a.P + …)|(… + a.Q + …)|...→ |P|Q|→ ...|P|Q|...

...|(.(Gene(a,b)|Protein(b)) + a..Gene(a,b))|(a Protein(a) + 0)||(a.Protein(a) + .0)|...

→ ...|.Gene(a,b)|Protein(a)|...

例例

Gene(a,b)|Protein(a)(.(Gene(a,b)|Protein(b)) + a..Gene(a,b))|(a.Protein(a) + .0)→ .Gene(a,b)|Protein(a)→ Gene(a,b)|Protein(a)( )| ( )(.(Gene(a,b)|Protein(b)) + a..Gene(a,b))|(a.Protein(a) + .0)→ (.(Gene(a,b)|Protein(b)) + a..Gene(a,b))|0( ( ( , )| ( )) ( , ))|(.(Gene(a,b)|Protein(b)) + a..Gene(a,b))→ Gene(a,b)|Protein(b)( , )| ( )(.(Gene(a,b)|Protein(b)) + a..Gene(a,b))|(b.Protein(b) + .0)→ Gene(a,b)|Protein(b)|(b.Protein(b) + .0) Gene(a,b)|Protein(b)|(b.Protein(b) .0)

確率π計算確率π計算チャネルaからの入力

Gene(a,b) :=並列合成

( , )t.(Gene(a,b)|Protein(b)) + a.u.Gene(a,b)

チョイス自発的遷移遅延

遅延

Protein(b) := b.Protein(b) + d.0 (b)

チャネルbへの出力 遅延

チャネルbの速度

プロセスの例プロセスの例

グ• トグル・スイッチ

Gene(a b)|Gene(b a)Gene(a,b)|Gene(b,a)

• オシレータ

Gene(a b)|Gene(b c)|Gene(c a)Gene(a,b)|Gene(b,c)|Gene(c,a)

(a) = (b) = (c) = 1.0t = 0.1d = 0 001d = 0.001u = 0.0001

グラフ書き換え系

グラフグラフ

離散的なトポ ジ の最も 般的な形• 離散的なトポロジーの最も一般的な形– マルチセットも(π計算の)プロセスも包含

– 頂点(ノード)はラベル(状態)を持つ

• 様々なグラフ書き換え系様々なグラフ書き換え系– グラフ文法

Interacting Automata– Interacting Automata– 膜計算

プロセス計算( 計算 アンビエント計算 )– プロセス計算(π計算・アンビエント計算・・・)

– Bigraph(膜+グラフ)

グラフ書き換え規則グラフ書き換え規則

グラ の書き換えのパタ ン• グラフの書き換えのパターン– 一般にはトポロジーも変化する

• 様々なアプローチ

Double pushout single pushout– Double pushout, single pushout, …• 多くの事例

– Self-organizing robots– 化学反応化学反応

– Programmed self-assembly pathways– …

Self Organizing RobotsSelf-Organizing Robots

• Klavins et al, 2005• グラフ文法グラフ文法

aa

aa

xc

bca

aa

ac

bc

x

* * xa

aa

*b

x

xc

b

*c

x

bc

cx

xc

bc

xb

*

#b

x

xc

*

#c

x

xc

cc

cc

cc

cx

x x*, # = b or c

形式的定義形式的定義

• Klavins流Klavins流• G = (V, E, l) = (VG, EG, lG) : グラフ

頂点 集合– V : 頂点の集合

– E : 辺のマルチセット(集合)

• 辺 = 頂点の二点集合 : (単純)無向グラフ

• 辺 = 頂点の対 : (単純)有向グラフ

– l : V から へのラベル付け関数

• r = (L R) : 規則• r = (L, R) : 規則

– L, R : VL = VR を満たすグラフ

頂点の状態

• 頂点は追加されたり削除されたりしない

形式的定義(単純有向の場合)• h : G1 から G2 への埋め込み

– h : VG から VG への単射h : VG1 から VG2 の単射

– {x,y}EG1 ならば {h(x),h(y)}EG2l l h– lG1 = lG2

oh• G = (V, E, l) から r = (L, R) により G' を得る( ) ( )

– h : L から G への埋め込み

G' = (V' E' l')– G = (V , E , l )• V' = V• E' = (E {h(x) h(y)} | {x y}E }) • E' = (E {h(x),h(y)} | {x,y}EL})

{{h(x),h(y)} | {x,y}ER}もし h(V ) ならば l'( ) l( )• もし xh(VL) ならば l'(x)=l(x)

• そうでなければ l'(x)=lR(h1(x))

化学反応学反

• Valiente et al., 2005C

CCC

CC

CC

C CC

CC C

Diels-Alder reaction

C CCO

CO

C

CC

C C

CC

CC

O

C

O

C CC

OC

O

DNAによる構造分子のモデル化DNAによる構造分子のモデル化

Kawamata et al 2009

ATACCAACAATAGTAACAGA

Kawamata et al., 2009

TATGGTTGTTATACCAACAATAGTAACAGA

TTGTTATCATTGTCT

Inputs GateATAGTAACAGA TTGTTATCATTGTCT

p

d b c CBD Ad b c

C A

CBD A

b c aC A b c a

DNAによる構造分子のモデル化DNAによる構造分子のモデル化

Kawamata et al 2009 Kawamata et al., 2009

D B C Ad b c

D B C A

bInputs Gate

C A b c ap

d b c CBD Ad b c

C A

CBD A

b c aC A b c a

反応のモデル反応のモデル

Ac

A Ac

Cc aa

C C AA

• 3 types of reactions– Hybridization– Hybridization– Denaturation– Branch migrationBranch migration

• Graph operations

反応のモデル反応のモデル

Ac

A Ac

Cc aa

C C AA

• 3 types of reactions– Hybridization– Hybridization– Denaturation– Branch migrationBranch migration

• Graph operations

反応のモデル反応のモデル

Ac a

A Ac a

C Ac a

C AC A

• 3 types of reactions– Hybridization– Hybridization– Denaturation– Branch migrationBranch migration

• Graph operations

DNAデバイスの自動設計

Automatic Design of Logic GatesKawamata, Tanaka and Hagiya 2009

g g

Generate initial model of DNAGenerate initial model of DNA

Simulate time change of concentrationSimulate time change of concentration

Evaluate systemCreate Evaluate system

Transit to neighbor model with probability

Createlocal changeas neighbor Transit to neighbor model with probabilityas neighbor

Terminal Condition?NoYes

Output solutionYes

Evaluation FunctionEvaluation FunctionOutput concentrations in the cases p

whose output should be T

outputoutputconcentration

s

time

s

time

F cases• Evaluated better asthe difference is larger

Flow chart of Automatic DesignFlow chart of Automatic DesignGenerate initial model of DNA

Simulate time change of concentrationg

Evaluate systemCreate y

Transit to neighbor model with probabilitylocal changeas neighbor Transit to neighbor model with probabilityg

Terminal Condition?NoYes

Output solutionYes

Flow chart of Automatic DesignFlow chart of Automatic DesignGenerate initial model of DNA

Simulate time change of concentrationg

Evaluate systemCreate y

Transit to neighbor model with probabilitylocal changeas neighbor Transit to neighbor model with probabilityg

Terminal Condition?NoYes

Output solutionYes

Flow chart of Automatic DesignFlow chart of Automatic DesignGenerate initial model of DNA

Simulate time change of concentrationg

Evaluate systemCreate y

Transit to neighbor model with probabilitylocal changeas neighbor Transit to neighbor model with probabilityg

Terminal Condition?NoYes

Output solutionYes

Flow chart of Automatic DesignFlow chart of Automatic DesignGenerate initial model of DNA

Simulate time change of concentrationg

Evaluate systemCreate y

Transit to neighbor model with probabilitylocal changeas neighbor Transit to neighbor model with probabilityg

F=0.1Terminal Condition?No

YesOutput solution

Yes

Flow chart of Automatic DesignFlow chart of Automatic DesignGenerate initial model of DNA

Simulate time change of concentrationg

Evaluate systemCreate y

Transit to neighbor model with probabilitylocal changeas neighbor Transit to neighbor model with probabilityg

Terminal Condition?NoYes

Output solutionYes

Flow chart of Automatic DesignFlow chart of Automatic DesignGenerate initial model of DNA

Simulate time change of concentrationg

Evaluate systemCreate y

Transit to neighbor model with probabilitylocal changeas neighbor Transit to neighbor model with probabilityg

Terminal Condition?NoYes

Output solutionYes

Flow chart of Automatic DesignFlow chart of Automatic DesignGenerate initial model of DNA

Simulate time change of concentrationg

Evaluate systemCreate y

Transit to neighbor model with probabilitylocal changeas neighbor Transit to neighbor model with probabilityg

Terminal Condition?NoYes

Output solutionYes

Flow chart of Automatic DesignFlow chart of Automatic DesignGenerate initial model of DNA

Simulate time change of concentrationg

Evaluate systemCreate y

Transit to neighbor model with probabilitylocal changeas neighbor Transit to neighbor model with probabilityg

F=0.5Terminal Condition?No

YesOutput solution

Yes

Flow chart of Automatic DesignFlow chart of Automatic DesignGenerate initial model of DNA

Simulate time change of concentrationg

Evaluate systemCreate y

Transit to neighbor model with probabilitylocal changeas neighbor Transit to neighbor model with probabilityg

Terminal Condition?NoYes

Output solutionYes

Flow chart of Automatic DesignFlow chart of Automatic DesignGenerate initial model of DNA

Simulate time change of concentrationg

Evaluate systemCreate y

Transit to neighbor model with probabilitylocal changeas neighbor Transit to neighbor model with probabilityg

Terminal Condition?NoYes

Output solutionYes

Flow chart of Automatic DesignFlow chart of Automatic DesignGenerate initial model of DNA

Simulate time change of concentrationg

Evaluate systemCreate y

Transit to neighbor model with probabilitylocal changeas neighbor Transit to neighbor model with probabilityg

Terminal Condition?NoYes

Output solutionYes

Flow chart of Automatic DesignFlow chart of Automatic DesignGenerate initial model of DNA

Simulate time change of concentrationg

Evaluate systemCreate y

Transit to neighbor model with probabilitylocal changeas neighbor Transit to neighbor model with probabilityg

F=0.9Terminal Condition?No

YesOutput solution

Yes

Flow chart of Automatic DesignFlow chart of Automatic DesignGenerate initial model of DNA

Simulate time change of concentrationg

Evaluate systemCreate y

Transit to neighbor model with probabilitylocal changeas neighbor Transit to neighbor model with probabilityg

Terminal Condition?NoYes

Output solutionYes

Example of a Designed Gate p g(AND Gate)

O t t (A) iOutput (A) isbound

A B A

a binput1

A Ca cinput2

AA

AB

a b

A a cC

A A B

a b

A a Cc

A B

a bA

A a Cc

A B

b

A B

Aa b

CA

a c

A BOutput (A) is

l d!

b

A B released!

a b At tA CA output

a c

Kinetic Simulation

outputconcentration

simulation steps

Fluorescence Experimentp

Virtual sequences DNA sequencesinput1 CCAAACTACTTACGTTGAACATACACCGAGGTTT

AGTGAACACTTCTAAGCAACTAA

i t2input2 TGAACATACACCGAGGTTTAGTCCAAA

output TGAACATACACCGAGGTTTAG

outCp1 TGTTCACTAAACCTCGGTGTATGTTCApoutCp2 TTTGGACTAAACCTCGGTGTATGTTCA

Experimental Resultp

レポート課題

DNA AutomatonDNA Automaton

CB

Cc a T1

b

c a T1

T2AC

Input 2 Input 1t2 B A t1Input 2 Input 1

想定する反応想定する反応

分 構造 相補鎖• 2分子(構造)の間の相補鎖のhybridization– 連続する相補鎖は一度に結合。連続する相補鎖は 度 結合。

– Denaturationはなしとする。

1分子(構造)内のb h i ti• 1分子(構造)内のbranch migration

課題(ボトムライン)課題(ボトムライン)

ド投 序が 場合• ストランド投入の順序が以下の場合について

生成される構造をすべて数え上げよ。生成される構造をすべて数え上げよ。

– 入力以外の混合

投入– Input1投入

– Input2投入

反応のパラメータ反応のパラメータ

分 相補鎖 速度• 2分子の相補鎖のhybridizationの速度: 0.1– 連続する相補鎖は一度に結合。連続する相補鎖は 度 結合。

– Denaturationはなしとする。

1分子内のb h i ti の速度 0 01• 1分子内のbranch migrationの速度: 0.01

• 反応時間

– 入力以外のストランドを混合してから100単位時間

Input1を投入してから100単位時間– Input1を投入してから100単位時間

– Input2を投入してから100単位時間

課題(オプション)課題(オプション)

連続的• 連続的シミュレーション

– 各ストランドの初期濃度: 10.0単位濃度各 ラン 初期濃度 単位濃度

– 刻み幅: 0.01くらいに設定。

確率的シミ レ ション• 確率的シミュレーション

– 各ストランドは10個ずつ用意。

– 速度は単位時間あたりの反応確率を与える。

• 各分子(構造)の濃度・個数をプロット• 各分子(構造)の濃度 個数をプロット。

• 両者を比較すると面白い。

Recommended