DNAロボットや合成生物学のための...

DNAロボットや合成生物学のDNAロボットや合成生物学のためのための

情報科学技術

人間知能と人工知能人間知能と人工知能

• 人間知能 ‐‐‐ネットワーク上の共同作業

– 集合知（Web2.0）• ネットワーク上の知識の蓄積と共有ネットワク上の知識の蓄積と共有

– 合成生物学の場合

iGEMの i t• iGEMのregistry

• 人工知能 ‐‐‐コンピュータによる自動化

– 自動設計

• コンピュータによる最適化、特に進化的計算

– DNAロボットの場合

• 塩基配列塩基配列

• DNAデバイスそのもの

集合知（Web2.0）• 集合知（collective intelligence）

ネットワクでつながれた有名無名の人たちが– ネットワークでつながれた有名・無名の人たちが

共同で知識を形成して行く

– Wisdom of Crowds• OSS（open source software）OSS（open source software）

– Linuxに代表されるソフトウェア

集合知の手本– 集合知の手本

• Wikipedia– 集合知の見本

– 完璧な無制御完璧な無制御

– それでも百科事典に匹敵する正確さ

iGEMの本当の目的 --- registryg y• 遺伝子部品のライブラリ

f トジタデタブク– cf. トランジスタのデータブック

– iGEM参加者は新しい部品を登録する義務を負う。

生命に学ぶ人工知能命学ぶ人知能• 生命の進化・適応の能力に着目

– 進化による環境への最適化

• 進化的計算進化的計算

– 突然変異・交叉（組み換え）・選択（適者生存）を

ンピタの中で模擬してコンピュータの中で模擬して、

様々な探索問題・最適化問題を解く。

– 探索空間が膨大、選択基準が複雑な場合に

特に有効。特に有効。

– 各種の設計問題に適用されている。

• DNAロボットの自動設計• DNAロボットの自動設計

• 人工遺伝子回路の設計生命から学んだ技術が生命を作る

人工知能人工知能

自動実験ロボット

新しい生物新しい生物

大腸菌ロボット

DNAロボット

人工知能人工知能

自動実験ロボット

何が必要？何が必要？

象適デ• 化学反応や生命現象の適切なモデル

– 粗すぎず。粗すぎず。

– 細かすぎず。

実用的な探索方法• 実用的な探索方法

– 最良のものが得られなくてもよいから、

効率よく探索。

– 最良でなくても十分に動作するもの最良でなくても、十分に動作するもの

– 後で検証すればよい。

どうせ検証しなければならない– どうせ検証しなければならない。

化学系・生物系の計算モデル

目次目次

いろいろ喋っても…

• マルチセット書き換え

• Gillespie法• π計算と確率π計算この他膜システム• π計算と確率π計算

• グラフ書き換え系

この他、膜システム、セル・オートマトン、ハイブリッド・システムなど

• DNAデバイスの自動設計

ハイブリッドシステムなど

• DNAデバイスの自動設計

マルチセット書き換え

化学反応のモデル化学反応のモデル

• 濃度大

– 連続濃度に対する微分方程式連続濃度に対する微分方程式

• 少分子

ルチセト書き換え系– マルチセット書き換え系

– 確率マルチセット書き換え系

• 確率微分方程式（マスター方程式）

連続濃度に対する微分方程式連続濃度に対する微分方程式

22 2 RGkBRkdG 21 2 RGkBRk

マルチセット書き換え系マルチセット書き換え系

確率的マルチセット書き換え系確率的マルチセット書き換え系

propensity11

マスター方程式

確率的マルチセット書き換え系

propensity11

解析的に

調べるのは 221c

2c調べるのは

一般に困難

rrggbbb pccpcpcdp

22324143

rrggbbbrggggbbbrrrgbbbb pccpcpcdt

2121 21122112

Gillespie法

Gillespie法• 確率的シミュレーションの標準的手法

Gillespie法確率的シミュレションの標準的手法

– 各々の書き換え規則（反応）は、

比例た確率実行されるpropensityに比例した確率で実行される

– a0 をpropensityの和としたとき、0

いずれかの規則が今から時間 t のうちに

実行される確率は 1ea0t 今から時間 t の間に実行されない実行される確率は 1e 0

• Gillespie法の各ステップ

今から時間 t の間に実行されない確率を P(t) とすると、P(0) = 1 で、dP(t) = a0 P(t) dt

– [0,1] の一様乱数 r から (1/a0)ln(1/r) によって

次の書き換えの時刻を決定 1 ea0t = 1r次書き換時刻を決定

– 乱数を用いてpropensityに比例して規則を選択

一般に一般に…

密確布• 累積密度 Φ(t) の確率分布から

確率変数 t をサンプルするには、確率変数 t をサンプルするには、

[0,1] の一様乱数を r として、

Φ(t) = r を解けばよい（Φ(t) = 1r でも同じ）。

• すると一様乱数が r~r+dr に入るとき• すると、様乱数が r r+dr に入るとき、

確率変数は t~t+dr/f(t) に入る。

ただし、 f(t) は確率密度（f(t)dt = dr）。• t はちょうど密度 f(t) で分布する• t はちょうど密度 f(t) で分布する。

分子種 i の個数が Xi分子種個数 i

τ跳躍法τ跳躍法

• Gillespie法の効率化

• 分子数がある程度大きい場合、分子数がある程度大きい場合、

数回の反応では分子数は大きく変化しない

• 適当な時間間隔の間に

propensityが a の反応が起こる回数 n はpropensityが a の反応が起こる回数 n は、

平均 a のPoisson分布に従う

細胞内における化学反応細胞内における化学反応

転• 転写

– 遺伝子 mRNA遺伝子

• 翻訳

RNA タンパク– mRNA タンパク

– 制御タンパクは遺伝子の発現を制御

• 代謝

シグナル伝達• シグナル伝達

• …

例：遺伝子回路によるトグル・スイッチ• Tian et al., 2006

u: λCI の濃度v: LacR の濃度

Hill係数Hill係数

u: λCI の濃度u: λCI の濃度v: LacR の濃度

LacR の生成速度

λCI に依存

しない部分

λCI に依存する部分：λCI は三つまとまってしない部分 λCI は三つまとまってLacR の転写を阻害していると推測される。3 は Hill係数という3 は Hill係数という。

Hill係数Hill係数λCI の分解速度

u: λCI の濃度u: λCI の濃度v: LacR の濃度

マイトマイシンに

依存しな部分

マイトマイシンCに依存する部分依存しない部分依存する部分:Hill係数は 1

微分方程式を数値的に解くと微分方程式を数値的に解くと…

パラメータ s の違い --- マイトマイシンCの濃度の違い

少分子系として少分子系として…

適• τ跳躍法の適用

– λCI と LacR の生成と分解の回数はC との生成と分解の回数は

Poisson分布に従うPoisson分布の平均

propensityと解釈

確率的シミュレーション（τ跳躍法）確率的シミュレション（τ跳躍法）

π計算と確率π計算

π計算π計算

並算デ• 並行計算のモデル

• チャネルを通して通信し合うプロセスチャネルを通して通信し合うプロセス

– 各種の反応を表現することが可能

入れ子構造• 入れ子の構造

– 膜のモデル

• プロセス間の等価性の理論が発展

• 非決定性に確率を付与 ⇒ 確率π計算非決定性に確率を付与確率計算

プロセスの定義プロセスの定義チャネルaからの入力

Gene(a,b) :=並列合成

( , ).(Gene(a,b)|Protein(b)) + a..Gene(a,b)

チョイス自発的遷移

Protein(b) := b.Protein(b) + .0

チャネルbへの出力

自発的遷移自発的遷移

...|(… + .P + …)|... → ...|P|...

...|(.(Gene(a,b)|Protein(b)) + a..Gene(a,b))|...→ ...|Gene(a,b)|Protein(b)|…

...|(b.Protein(b) + .0)|... → ...|0|... ...|...

通信通信

...|(… + a.P + …)|(… + a.Q + …)|...→ |P|Q|→ ...|P|Q|...

• より一般的には

...|(… + a(x).P(x) + …)|(… + a(M).Q + …)|...→ ...|P(M)|Q|...

通信通信

...|(… + a.P + …)|(… + a.Q + …)|...→ |P|Q|→ ...|P|Q|...

...|(.(Gene(a,b)|Protein(b)) + a..Gene(a,b))|(a Protein(a) + 0)||(a.Protein(a) + .0)|...

→ ...|.Gene(a,b)|Protein(a)|...

例例

確率π計算確率π計算チャネルaからの入力

Gene(a,b) :=並列合成

( , )t.(Gene(a,b)|Protein(b)) + a.u.Gene(a,b)

チョイス自発的遷移遅延

遅延

Protein(b) := b.Protein(b) + d.0 (b)

チャネルbへの出力遅延

チャネルbの速度

プロセスの例プロセスの例

グ• トグル・スイッチ

Gene(a b)|Gene(b a)Gene(a,b)|Gene(b,a)

• オシレータ

Gene(a b)|Gene(b c)|Gene(c a)Gene(a,b)|Gene(b,c)|Gene(c,a)

(a) = (b) = (c) = 1.0t = 0.1d = 0 001d = 0.001u = 0.0001

グラフ書き換え系

グラフグラフ

離散的なトポジの最も般的な形• 離散的なトポロジーの最も一般的な形– マルチセットも（π計算の）プロセスも包含

– 頂点（ノード）はラベル（状態）を持つ

• 様々なグラフ書き換え系様々なグラフ書き換え系– グラフ文法

Interacting Automata– Interacting Automata– 膜計算

プロセス計算（計算アンビエント計算）– プロセス計算（π計算・アンビエント計算・・・）

– Bigraph（膜＋グラフ）

グラフ書き換え規則グラフ書き換え規則

グラの書き換えのパタン• グラフの書き換えのパターン– 一般にはトポロジーも変化する

• 様々なアプローチ

Double pushout single pushout– Double pushout, single pushout, …• 多くの事例

– Self-organizing robots– 化学反応化学反応

– Programmed self-assembly pathways– …

Self Organizing RobotsSelf-Organizing Robots

• Klavins et al, 2005• グラフ文法グラフ文法

* * xa

x x*, # = b or c

形式的定義形式的定義

• Klavins流Klavins流• G = (V, E, l) = (VG, EG, lG) : グラフ

頂点集合– V : 頂点の集合

– E : 辺のマルチセット（集合）

• 辺 = 頂点の二点集合 : （単純）無向グラフ

• 辺 = 頂点の対 : （単純）有向グラフ

– l : V からへのラベル付け関数

• r = (L R) : 規則• r = (L, R) : 規則

– L, R : VL = VR を満たすグラフ

頂点の状態

• 頂点は追加されたり削除されたりしない

形式的定義（単純有向の場合）• h : G1 から G2 への埋め込み

– h : VG から VG への単射h : VG1 から VG2 の単射

– {x,y}EG1 ならば {h(x),h(y)}EG2l l h– lG1 = lG2

oh• G = (V, E, l) から r = (L, R) により G' を得る( ) ( )

– h : L から G への埋め込み

G' = (V' E' l')– G = (V , E , l )• V' = V• E' = (E {h(x) h(y)} | {x y}E }) • E' = (E {h(x),h(y)} | {x,y}EL})

{{h(x),h(y)} | {x,y}ER}もし h(V ) ならば l'( ) l( )• もし xh(VL) ならば l'(x)=l(x)

• そうでなければ l'(x)=lR(h1(x))

化学反応学反

• Valiente et al., 2005C

Diels-Alder reaction

DNAによる構造分子のモデル化DNAによる構造分子のモデル化

Kawamata et al 2009

ATACCAACAATAGTAACAGA

Kawamata et al., 2009

TATGGTTGTTATACCAACAATAGTAACAGA

TTGTTATCATTGTCT

Inputs GateATAGTAACAGA TTGTTATCATTGTCT

d b c CBD Ad b c

b c aC A b c a

DNAによる構造分子のモデル化DNAによる構造分子のモデル化

Kawamata et al 2009 Kawamata et al., 2009

D B C Ad b c

D B C A

bInputs Gate

C A b c ap

d b c CBD Ad b c

b c aC A b c a

反応のモデル反応のモデル

C C AA

• 3 types of reactions– Hybridization– Hybridization– Denaturation– Branch migrationBranch migration

• Graph operations

C C AA

A Ac a

C Ac a

C AC A

DNAデバイスの自動設計

Automatic Design of Logic GatesKawamata, Tanaka and Hagiya 2009

Generate initial model of DNAGenerate initial model of DNA

Simulate time change of concentrationSimulate time change of concentration

Evaluate systemCreate Evaluate system

Transit to neighbor model with probability

Createlocal changeas neighbor Transit to neighbor model with probabilityas neighbor

Terminal Condition？NoYes

Output solutionYes

Evaluation FunctionEvaluation FunctionOutput concentrations in the cases p

whose output should be T

outputoutputconcentration

F cases• Evaluated better asthe difference is larger

Flow chart of Automatic DesignFlow chart of Automatic DesignGenerate initial model of DNA

Simulate time change of concentrationg

Evaluate systemCreate y

Transit to neighbor model with probabilitylocal changeas neighbor Transit to neighbor model with probabilityg

Output solutionYes

F=0.1Terminal Condition？No

YesOutput solution

Output solutionYes

YesOutput solution

Output solutionYes

YesOutput solution

Output solutionYes

Example of a Designed Gate p g(AND Gate)

O t t (A) iOutput (A) isbound

a binput1

A Ca cinput2

A a cC

A a Cc

A BOutput (A) is

A B released!

a b At tA CA output

Kinetic Simulation

outputconcentration

simulation steps

Fluorescence Experimentp

Virtual sequences DNA sequencesinput1 CCAAACTACTTACGTTGAACATACACCGAGGTTT

AGTGAACACTTCTAAGCAACTAA

i t2input2 TGAACATACACCGAGGTTTAGTCCAAA

output TGAACATACACCGAGGTTTAG

outCp1 TGTTCACTAAACCTCGGTGTATGTTCApoutCp2 TTTGGACTAAACCTCGGTGTATGTTCA

Experimental Resultp

レポート課題

DNA AutomatonDNA Automaton

Cc a T1

c a T1

Input 2 Input 1t2 B A t1Input 2 Input 1

想定する反応想定する反応

分構造相補鎖• 2分子（構造）の間の相補鎖のhybridization– 連続する相補鎖は一度に結合。連続する相補鎖は度結合。

– Denaturationはなしとする。

1分子（構造）内のb h i ti• 1分子（構造）内のbranch migration

課題（ボトムライン）課題（ボトムライン）

ド投序が場合• ストランド投入の順序が以下の場合について

生成される構造をすべて数え上げよ。生成される構造をすべて数え上げよ。

– 入力以外の混合

投入– Input1投入

– Input2投入

反応のパラメータ反応のパラメータ

分相補鎖速度• 2分子の相補鎖のhybridizationの速度: 0.1– 連続する相補鎖は一度に結合。連続する相補鎖は度結合。

– Denaturationはなしとする。

1分子内のb h i ti の速度 0 01• 1分子内のbranch migrationの速度: 0.01

• 反応時間

– 入力以外のストランドを混合してから100単位時間

Input1を投入してから100単位時間– Input1を投入してから100単位時間

– Input2を投入してから100単位時間

課題（オプション）課題（オプション）

連続的• 連続的シミュレーション

– 各ストランドの初期濃度: 10.0単位濃度各ラン初期濃度単位濃度

– 刻み幅: 0.01くらいに設定。

確率的シミレション• 確率的シミュレーション

– 各ストランドは10個ずつ用意。

– 速度は単位時間あたりの反応確率を与える。

• 各分子（構造）の濃度・個数をプロット• 各分子（構造）の濃度個数をプロット。

• 両者を比較すると面白い。

DNAロボットや合成生物学のための...

Documents

次世代人工知能フレームワーク・テストベッドの研究開発 · 「次世代人工知能・ロボット中核技術開発」（人工知能分野）中間成果発表会

人工知能特論 II 　第 8 回

人工知能特論 2011 資料 No.6

2009 人工知能（２） April 21,2009

人工知能のための哲学塾 : 東洋哲学第1回荘子と人工知能の解体

人工知能と人間...人工知能と人間北橋忠宏 69期大阪大学名誉教授 2017.11.15 （人工知能は人間知能を越えるか）人工知能が、急に騒がれ出したのは何故か

企業の人工知能 AI

イラストで学ぶ人工知能概論 9

人工知能特論 II 　第 10 回

人工知能特論 II 　第 14 回

人工知能とは～人工知能技術の発展と展望～ - KIAI人工知能（ Artificial Intelligence ） •人間の知能のように賢いコンピュータやロボットを作りたい！•人間はどうして賢い（愚かな）のか

人工知能計画 Lecture 11

人工知能特論 2011 資料 No.7

Artifical Intelligence (人工知能) の歴史と Augmented Intelligence (知能増幅) について

人工知能特論 II 　第 7 回

SFCアカデミーキャンプ2016 人工知能

人工知能特論 II 　第 15 回

Word2Vec Neologdで作るアニメ人工知能

人工知能のための哲学塾 : 論理思考と人間と人工知能グループワーク

I oT・ビッグデータ・人工知能...（担当：渡利・森口） I oT・ビッグデータ・人工知能 12月23日 [月] 13：30～14：30 令和2年2月21日[金] 人工知能入門セミ

DNAロボットや合成生物学の ための...

DNAロボットや合成生物学のための...