Upload
others
View
0
Download
0
Embed Size (px)
Citation preview
DNAロボットや合成生物学のDNAロボットや合成生物学のためのための
情報科学技術
人間知能と人工知能人間知能と人工知能
• 人間知能 ‐‐‐ネットワーク上の共同作業
– 集合知(Web2.0)• ネットワーク上の知識の蓄積と共有ネットワ ク上の知識の蓄積と共有
– 合成生物学の場合
iGEMの i t• iGEMのregistry
• 人工知能 ‐‐‐コンピュータによる自動化
– 自動設計
• コンピュータによる最適化、特に進化的計算
– DNAロボットの場合
• 塩基配列塩基配列
• DNAデバイスそのもの
集合知(Web2.0)• 集合知(collective intelligence)
ネットワ クでつながれた有名 無名の人たちが– ネットワークでつながれた有名・無名の人たちが
共同で知識を形成して行く
– Wisdom of Crowds• OSS(open source software)OSS(open source software)
– Linuxに代表されるソフトウェア
集合知の手本– 集合知の手本
• Wikipedia– 集合知の見本
– 完璧な無制御完璧な無制御
– それでも百科事典に匹敵する正確さ
iGEMの本当の目的 --- registryg y• 遺伝子部品のライブラリ
f ト ジ タ デ タブ ク– cf. トランジスタのデータブック
– iGEM参加者は新しい部品を登録する義務を負う。
生命に学ぶ人工知能命 学ぶ人 知能• 生命の進化・適応の能力に着目
– 進化による環境への最適化
• 進化的計算進化的計算
– 突然変異・交叉(組み換え)・選択(適者生存)を
ンピ タの中で模擬してコンピュータの中で模擬して、
様々な探索問題・最適化問題を解く。
– 探索空間が膨大、選択基準が複雑な場合に
特に有効。特に有効。
– 各種の設計問題に適用されている。
• DNAロボットの自動設計• DNAロボットの自動設計
• 人工遺伝子回路の設計 生命から学んだ技術が生命を作る
人工知能人工知能
自動実験ロボット
新しい生物新しい生物
大腸菌ロボット
DNAロボット
人工知能人工知能
自動実験ロボット
何が必要?何が必要?
象 適 デ• 化学反応や生命現象の適切なモデル
– 粗すぎず。粗すぎず。
– 細かすぎず。
実用的な探索方法• 実用的な探索方法
– 最良のものが得られなくてもよいから、
効率よく探索。
– 最良でなくても 十分に動作するもの最良でなくても、十分に動作するもの
– 後で検証すればよい。
どうせ検証しなければならない– どうせ検証しなければならない。
化学系・生物系の計算モデル
目次目次
いろいろ喋っても…
• マルチセット書き換え
• Gillespie法• π計算と確率π計算 この他 膜システム• π計算と確率π計算
• グラフ書き換え系
この他、膜システム、セル・オートマトン、ハイブリッド・システムなど
• DNAデバイスの自動設計
ハイブリッド システムなど
• DNAデバイスの自動設計
マルチセット書き換え
化学反応のモデル化学反応のモデル
• 濃度大
– 連続濃度に対する微分方程式連続濃度に対する微分方程式
• 少分子
ルチセ ト書き換え系– マルチセット書き換え系
– 確率マルチセット書き換え系
• 確率微分方程式(マスター方程式)
連続濃度に対する微分方程式連続濃度に対する微分方程式
1k
22 2 RGkBRkdG 21 2 RGkBRk
dt
k2k
マルチセット書き換え系マルチセット書き換え系
確率的マルチセット書き換え系確率的マルチセット書き換え系
propensity11
423
c
1c
2
22c
c221
2c
マスター方程式
確率的マルチセット書き換え系
propensity11
423
c
1c
22c
解析的に
調べるのは 221c
2c調べるのは
一般に困難
rrggbbb pccpcpcdp
22324143
rrggbbbrggggbbbrrrgbbbb pccpcpcdt
2121 21122112
Gillespie法
Gillespie法• 確率的シミュレーションの標準的手法
Gillespie法確率的シミュレ ションの標準的手法
– 各々の書き換え規則(反応)は、
比例 た確率 実行されるpropensityに比例した確率で実行される
– a0 をpropensityの和としたとき、0
いずれかの規則が今から時間 t のうちに
実行される確率は 1ea0t 今から時間 t の間に実行されない実行される確率は 1e 0
• Gillespie法の各ステップ
今から時間 t の間に実行されない確率を P(t) とすると、P(0) = 1 で、dP(t) = a0 P(t) dt
– [0,1] の一様乱数 r から (1/a0)ln(1/r) によって
次の書き換えの時刻を決定 1 ea0t = 1r次 書き換 時刻を決定
– 乱数を用いてpropensityに比例して規則を選択
一般に一般に…
密 確 布• 累積密度 Φ(t) の確率分布から
確率変数 t をサンプルするには、確率変数 t をサンプルするには、
[0,1] の一様乱数を r として、
Φ(t) = r を解けばよい(Φ(t) = 1r でも同じ)。
• すると 一様乱数が r~r+dr に入るとき• すると、 様乱数が r r+dr に入るとき、
確率変数は t~t+dr/f(t) に入る。
ただし、 f(t) は確率密度(f(t)dt = dr)。• t はちょうど密度 f(t) で分布する• t はちょうど密度 f(t) で分布する。
分子種 i の個数が Xi分子種 個数 i
τ跳躍法τ跳躍法
• Gillespie法の効率化
• 分子数がある程度大きい場合、分子数がある程度大きい場合、
数回の反応では分子数は大きく変化しない
• 適当な時間間隔 の間に
propensityが a の反応が起こる回数 n はpropensityが a の反応が起こる回数 n は、
平均 a のPoisson分布に従う
細胞内における化学反応細胞内における化学反応
転• 転写
– 遺伝子 mRNA遺伝子
• 翻訳
RNA タンパク– mRNA タンパク
– 制御タンパクは遺伝子の発現を制御
• 代謝
シグナル伝達• シグナル伝達
• …
例:遺伝子回路によるトグル・スイッチ• Tian et al., 2006
u: λCI の濃度v: LacR の濃度
Hill係数Hill係数
u: λCI の濃度u: λCI の濃度v: LacR の濃度
LacR の生成速度
λCI に依存
しない部分
λCI に依存する部分:λCI は三つまとまってしない部分 λCI は三つまとまってLacR の転写を阻害していると推測される。3 は Hill係数という3 は Hill係数という。
Hill係数Hill係数λCI の分解速度
u: λCI の濃度u: λCI の濃度v: LacR の濃度
マイトマイシンに
依存しな 部分
マイトマイシンCに依存する部分依存しない部分 依存する部分:Hill係数は 1
微分方程式を数値的に解くと微分方程式を数値的に解くと…
パラメータ s の違い --- マイトマイシンCの濃度の違い
少分子系として少分子系として…
適• τ跳躍法の適用
– λCI と LacR の生成と分解の回数はC と の生成と分解の回数は
Poisson分布に従うPoisson分布の平均
propensityと解釈
確率的シミュレーション(τ跳躍法)確率的シミュレ ション(τ跳躍法)
π計算と確率π計算
π計算π計算
並 算 デ• 並行計算のモデル
• チャネルを通して通信し合うプロセスチャネルを通して通信し合うプロセス
– 各種の反応を表現することが可能
入れ子 構造• 入れ子の構造
– 膜のモデル
• プロセス間の等価性の理論が発展
• 非決定性に確率を付与 ⇒ 確率π計算非決定性に確率を付与 確率 計算
プロセスの定義プロセスの定義チャネルaからの入力
Gene(a,b) :=並列合成
( , ).(Gene(a,b)|Protein(b)) + a..Gene(a,b)
チョイス自発的遷移
Protein(b) := b.Protein(b) + .0
チャネルbへの出力
自発的遷移自発的遷移
...|(… + .P + …)|... → ...|P|...
...|(.(Gene(a,b)|Protein(b)) + a..Gene(a,b))|...→ ...|Gene(a,b)|Protein(b)|…
...|(b.Protein(b) + .0)|... → ...|0|... ...|...
通信通信
...|(… + a.P + …)|(… + a.Q + …)|...→ |P|Q|→ ...|P|Q|...
• より一般的には
...|(… + a(x).P(x) + …)|(… + a(M).Q + …)|...→ ...|P(M)|Q|...
通信通信
...|(… + a.P + …)|(… + a.Q + …)|...→ |P|Q|→ ...|P|Q|...
...|(.(Gene(a,b)|Protein(b)) + a..Gene(a,b))|(a Protein(a) + 0)||(a.Protein(a) + .0)|...
→ ...|.Gene(a,b)|Protein(a)|...
例例
Gene(a,b)|Protein(a)(.(Gene(a,b)|Protein(b)) + a..Gene(a,b))|(a.Protein(a) + .0)→ .Gene(a,b)|Protein(a)→ Gene(a,b)|Protein(a)( )| ( )(.(Gene(a,b)|Protein(b)) + a..Gene(a,b))|(a.Protein(a) + .0)→ (.(Gene(a,b)|Protein(b)) + a..Gene(a,b))|0( ( ( , )| ( )) ( , ))|(.(Gene(a,b)|Protein(b)) + a..Gene(a,b))→ Gene(a,b)|Protein(b)( , )| ( )(.(Gene(a,b)|Protein(b)) + a..Gene(a,b))|(b.Protein(b) + .0)→ Gene(a,b)|Protein(b)|(b.Protein(b) + .0) Gene(a,b)|Protein(b)|(b.Protein(b) .0)
確率π計算確率π計算チャネルaからの入力
Gene(a,b) :=並列合成
( , )t.(Gene(a,b)|Protein(b)) + a.u.Gene(a,b)
チョイス自発的遷移遅延
遅延
Protein(b) := b.Protein(b) + d.0 (b)
チャネルbへの出力 遅延
チャネルbの速度
プロセスの例プロセスの例
グ• トグル・スイッチ
Gene(a b)|Gene(b a)Gene(a,b)|Gene(b,a)
• オシレータ
Gene(a b)|Gene(b c)|Gene(c a)Gene(a,b)|Gene(b,c)|Gene(c,a)
(a) = (b) = (c) = 1.0t = 0.1d = 0 001d = 0.001u = 0.0001
グラフ書き換え系
グラフグラフ
離散的なトポ ジ の最も 般的な形• 離散的なトポロジーの最も一般的な形– マルチセットも(π計算の)プロセスも包含
– 頂点(ノード)はラベル(状態)を持つ
• 様々なグラフ書き換え系様々なグラフ書き換え系– グラフ文法
Interacting Automata– Interacting Automata– 膜計算
プロセス計算( 計算 アンビエント計算 )– プロセス計算(π計算・アンビエント計算・・・)
– Bigraph(膜+グラフ)
グラフ書き換え規則グラフ書き換え規則
グラ の書き換えのパタ ン• グラフの書き換えのパターン– 一般にはトポロジーも変化する
• 様々なアプローチ
Double pushout single pushout– Double pushout, single pushout, …• 多くの事例
– Self-organizing robots– 化学反応化学反応
– Programmed self-assembly pathways– …
Self Organizing RobotsSelf-Organizing Robots
• Klavins et al, 2005• グラフ文法グラフ文法
aa
aa
xc
bca
aa
ac
bc
x
* * xa
aa
*b
x
xc
b
*c
x
bc
cx
xc
bc
xb
*
#b
x
xc
*
#c
x
xc
cc
cc
cc
cx
x x*, # = b or c
形式的定義形式的定義
• Klavins流Klavins流• G = (V, E, l) = (VG, EG, lG) : グラフ
頂点 集合– V : 頂点の集合
– E : 辺のマルチセット(集合)
• 辺 = 頂点の二点集合 : (単純)無向グラフ
• 辺 = 頂点の対 : (単純)有向グラフ
– l : V から へのラベル付け関数
• r = (L R) : 規則• r = (L, R) : 規則
– L, R : VL = VR を満たすグラフ
頂点の状態
• 頂点は追加されたり削除されたりしない
形式的定義(単純有向の場合)• h : G1 から G2 への埋め込み
– h : VG から VG への単射h : VG1 から VG2 の単射
– {x,y}EG1 ならば {h(x),h(y)}EG2l l h– lG1 = lG2
oh• G = (V, E, l) から r = (L, R) により G' を得る( ) ( )
– h : L から G への埋め込み
G' = (V' E' l')– G = (V , E , l )• V' = V• E' = (E {h(x) h(y)} | {x y}E }) • E' = (E {h(x),h(y)} | {x,y}EL})
{{h(x),h(y)} | {x,y}ER}もし h(V ) ならば l'( ) l( )• もし xh(VL) ならば l'(x)=l(x)
• そうでなければ l'(x)=lR(h1(x))
化学反応学反
• Valiente et al., 2005C
CCC
CC
CC
C CC
CC C
Diels-Alder reaction
C CCO
CO
C
CC
C C
CC
CC
O
C
O
C CC
OC
O
DNAによる構造分子のモデル化DNAによる構造分子のモデル化
Kawamata et al 2009
ATACCAACAATAGTAACAGA
Kawamata et al., 2009
TATGGTTGTTATACCAACAATAGTAACAGA
TTGTTATCATTGTCT
Inputs GateATAGTAACAGA TTGTTATCATTGTCT
p
d b c CBD Ad b c
C A
CBD A
b c aC A b c a
DNAによる構造分子のモデル化DNAによる構造分子のモデル化
Kawamata et al 2009 Kawamata et al., 2009
D B C Ad b c
D B C A
bInputs Gate
C A b c ap
d b c CBD Ad b c
C A
CBD A
b c aC A b c a
反応のモデル反応のモデル
Ac
A Ac
Cc aa
C C AA
• 3 types of reactions– Hybridization– Hybridization– Denaturation– Branch migrationBranch migration
• Graph operations
反応のモデル反応のモデル
Ac
A Ac
Cc aa
C C AA
• 3 types of reactions– Hybridization– Hybridization– Denaturation– Branch migrationBranch migration
• Graph operations
反応のモデル反応のモデル
Ac a
A Ac a
C Ac a
C AC A
• 3 types of reactions– Hybridization– Hybridization– Denaturation– Branch migrationBranch migration
• Graph operations
DNAデバイスの自動設計
Automatic Design of Logic GatesKawamata, Tanaka and Hagiya 2009
g g
Generate initial model of DNAGenerate initial model of DNA
Simulate time change of concentrationSimulate time change of concentration
Evaluate systemCreate Evaluate system
Transit to neighbor model with probability
Createlocal changeas neighbor Transit to neighbor model with probabilityas neighbor
Terminal Condition?NoYes
Output solutionYes
Evaluation FunctionEvaluation FunctionOutput concentrations in the cases p
whose output should be T
outputoutputconcentration
s
time
s
time
F cases• Evaluated better asthe difference is larger
Flow chart of Automatic DesignFlow chart of Automatic DesignGenerate initial model of DNA
Simulate time change of concentrationg
Evaluate systemCreate y
Transit to neighbor model with probabilitylocal changeas neighbor Transit to neighbor model with probabilityg
Terminal Condition?NoYes
Output solutionYes
Flow chart of Automatic DesignFlow chart of Automatic DesignGenerate initial model of DNA
Simulate time change of concentrationg
Evaluate systemCreate y
Transit to neighbor model with probabilitylocal changeas neighbor Transit to neighbor model with probabilityg
Terminal Condition?NoYes
Output solutionYes
Flow chart of Automatic DesignFlow chart of Automatic DesignGenerate initial model of DNA
Simulate time change of concentrationg
Evaluate systemCreate y
Transit to neighbor model with probabilitylocal changeas neighbor Transit to neighbor model with probabilityg
Terminal Condition?NoYes
Output solutionYes
Flow chart of Automatic DesignFlow chart of Automatic DesignGenerate initial model of DNA
Simulate time change of concentrationg
Evaluate systemCreate y
Transit to neighbor model with probabilitylocal changeas neighbor Transit to neighbor model with probabilityg
F=0.1Terminal Condition?No
YesOutput solution
Yes
Flow chart of Automatic DesignFlow chart of Automatic DesignGenerate initial model of DNA
Simulate time change of concentrationg
Evaluate systemCreate y
Transit to neighbor model with probabilitylocal changeas neighbor Transit to neighbor model with probabilityg
Terminal Condition?NoYes
Output solutionYes
Flow chart of Automatic DesignFlow chart of Automatic DesignGenerate initial model of DNA
Simulate time change of concentrationg
Evaluate systemCreate y
Transit to neighbor model with probabilitylocal changeas neighbor Transit to neighbor model with probabilityg
Terminal Condition?NoYes
Output solutionYes
Flow chart of Automatic DesignFlow chart of Automatic DesignGenerate initial model of DNA
Simulate time change of concentrationg
Evaluate systemCreate y
Transit to neighbor model with probabilitylocal changeas neighbor Transit to neighbor model with probabilityg
Terminal Condition?NoYes
Output solutionYes
Flow chart of Automatic DesignFlow chart of Automatic DesignGenerate initial model of DNA
Simulate time change of concentrationg
Evaluate systemCreate y
Transit to neighbor model with probabilitylocal changeas neighbor Transit to neighbor model with probabilityg
F=0.5Terminal Condition?No
YesOutput solution
Yes
Flow chart of Automatic DesignFlow chart of Automatic DesignGenerate initial model of DNA
Simulate time change of concentrationg
Evaluate systemCreate y
Transit to neighbor model with probabilitylocal changeas neighbor Transit to neighbor model with probabilityg
Terminal Condition?NoYes
Output solutionYes
Flow chart of Automatic DesignFlow chart of Automatic DesignGenerate initial model of DNA
Simulate time change of concentrationg
Evaluate systemCreate y
Transit to neighbor model with probabilitylocal changeas neighbor Transit to neighbor model with probabilityg
Terminal Condition?NoYes
Output solutionYes
Flow chart of Automatic DesignFlow chart of Automatic DesignGenerate initial model of DNA
Simulate time change of concentrationg
Evaluate systemCreate y
Transit to neighbor model with probabilitylocal changeas neighbor Transit to neighbor model with probabilityg
Terminal Condition?NoYes
Output solutionYes
Flow chart of Automatic DesignFlow chart of Automatic DesignGenerate initial model of DNA
Simulate time change of concentrationg
Evaluate systemCreate y
Transit to neighbor model with probabilitylocal changeas neighbor Transit to neighbor model with probabilityg
F=0.9Terminal Condition?No
YesOutput solution
Yes
Flow chart of Automatic DesignFlow chart of Automatic DesignGenerate initial model of DNA
Simulate time change of concentrationg
Evaluate systemCreate y
Transit to neighbor model with probabilitylocal changeas neighbor Transit to neighbor model with probabilityg
Terminal Condition?NoYes
Output solutionYes
Example of a Designed Gate p g(AND Gate)
O t t (A) iOutput (A) isbound
A B A
a binput1
A Ca cinput2
AA
AB
a b
A a cC
A A B
a b
A a Cc
A B
a bA
A a Cc
A B
b
A B
Aa b
CA
a c
A BOutput (A) is
l d!
b
A B released!
a b At tA CA output
a c
Kinetic Simulation
outputconcentration
simulation steps
Fluorescence Experimentp
Virtual sequences DNA sequencesinput1 CCAAACTACTTACGTTGAACATACACCGAGGTTT
AGTGAACACTTCTAAGCAACTAA
i t2input2 TGAACATACACCGAGGTTTAGTCCAAA
output TGAACATACACCGAGGTTTAG
outCp1 TGTTCACTAAACCTCGGTGTATGTTCApoutCp2 TTTGGACTAAACCTCGGTGTATGTTCA
Experimental Resultp
レポート課題
DNA AutomatonDNA Automaton
CB
Cc a T1
b
c a T1
T2AC
Input 2 Input 1t2 B A t1Input 2 Input 1
想定する反応想定する反応
分 構造 相補鎖• 2分子(構造)の間の相補鎖のhybridization– 連続する相補鎖は一度に結合。連続する相補鎖は 度 結合。
– Denaturationはなしとする。
1分子(構造)内のb h i ti• 1分子(構造)内のbranch migration
課題(ボトムライン)課題(ボトムライン)
ド投 序が 場合• ストランド投入の順序が以下の場合について
生成される構造をすべて数え上げよ。生成される構造をすべて数え上げよ。
– 入力以外の混合
投入– Input1投入
– Input2投入
反応のパラメータ反応のパラメータ
分 相補鎖 速度• 2分子の相補鎖のhybridizationの速度: 0.1– 連続する相補鎖は一度に結合。連続する相補鎖は 度 結合。
– Denaturationはなしとする。
1分子内のb h i ti の速度 0 01• 1分子内のbranch migrationの速度: 0.01
• 反応時間
– 入力以外のストランドを混合してから100単位時間
Input1を投入してから100単位時間– Input1を投入してから100単位時間
– Input2を投入してから100単位時間
課題(オプション)課題(オプション)
連続的• 連続的シミュレーション
– 各ストランドの初期濃度: 10.0単位濃度各 ラン 初期濃度 単位濃度
– 刻み幅: 0.01くらいに設定。
確率的シミ レ ション• 確率的シミュレーション
– 各ストランドは10個ずつ用意。
– 速度は単位時間あたりの反応確率を与える。
• 各分子(構造)の濃度・個数をプロット• 各分子(構造)の濃度 個数をプロット。
• 両者を比較すると面白い。