60
Инструменты и методы системной биологии [email protected] Н. А. Колчанов

Инструменты и методы системной биологии. Биоинформатика

Embed Size (px)

Citation preview

Page 1: Инструменты и методы системной биологии. Биоинформатика

Инструменты и методы системной

биологии

[email protected]

Н. А. Колчанов

Page 2: Инструменты и методы системной биологии. Биоинформатика

1953

2001

РЕВОЛЮЦИЯ В МОЛЕКУЛЯРНОЙ БИОЛОГИИ И ГЕНЕТИКЕ

Расшифровка структуры двойной спирали ДНК

• Рентгено-структурные методы расшифровка пространственной

структуры белков

• Методы расшифровки аминокислотных последовательностей

• Методы расшифровки нуклеотидных последовательностей

• Генетическая инженерия

• Генодиагностика

• Трансгенез

• Клонирования

• Молекулярные биотехнологии

• ДНК-микрочипы

• Массове секвенирование геномов

Расшифровка генома человека

Протеомика

Транскриптомика

Молекулярная медицина, генотерапия

Конструирование молекулярно-генетических систем с заданными свойствами

Page 3: Инструменты и методы системной биологии. Биоинформатика

Современная биология стала производителем

беспрецедентно огромных объемов

экспериментальных данных. Их осмысливание

невозможно без привлечения современных

информационных технологий, эффективных методов

анализа данных и моделирования биологических

систем и процессов на различных уровнях

организации живой материи: от молекулярно-

генетического, включая организменный и заканчивая

экосистемным и биосферным.

В ответ на этот вызов возникает наука,

называемая информационной биологией.

Page 4: Инструменты и методы системной биологии. Биоинформатика

......

......

...... ......

. . . .

. .

. . . .

.

. .

. .

.

. ATGCCCGGGTTTAATGCGTCAGTGACTGCACA…..

АНАЛИТИЧЕСКИЕ МЕТОДЫ СОВРЕМЕННОЙ БИОЛОГИИ:

ИНФОРМАЦИОННЫЙ ВЗРЫВ

Page 5: Инструменты и методы системной биологии. Биоинформатика

СИСТЕМНАЯ БИОЛОГИЯ - ОТ АНАЛИЗА

К СИНТЕЗУ

ЦЕЛЬ:

Реконструкция знаний о системах и процессах, обеспечивающих

воспроизведение КЛЕТОК и ОРГАНИЗМОВ, их функционирование и

взаимодействие с окружающей средой на основе информации,

закодированной в геномах.

МЕТОДЫ: ИНТЕГРАТИВНЫЕ ЭКСПЕРИМЕНТАЛЬНЫЕ ПОДХОДЫ: системная

транскриптомика, протеомика, метаболомика, клеточная

биология.

БИОИНФОРМАТИКА: компьютерная интеграция

экспериментальных данных, получаемых аналитическими

методами молекулярной биологии, математическое

моделирование молекулярно-генетических систем и процессов.

Page 6: Инструменты и методы системной биологии. Биоинформатика

ГЕННАЯ СЕТЬ – центральный

объект системной биологии

Генная сеть - группа координировано

функционирующих генов, обеспечивающих

формирование определенного фенотипического

признака организма (молекулярного,

биохимического, физиологического,

морфологического, поведенческого и т.д.)

Обязательные компоненты генной сети:

гены, кодируемые ими РНК и белки, метаболиты,

пути передачи сигналов, метаболические пути,

регуляторные контуры с положительными и

отрицательными обратными связями.

Page 7: Инструменты и методы системной биологии. Биоинформатика

Граф взаимодействий

между генами

ИНСТРУМЕНТЫ И МЕТОДЫ СИСТЕМНОЙ БИОЛОГИИ. ИНТЕГРАТИВНЫЕ ЭКСПЕРИМЕНТАЛЬНЫЕ ПОДХОДЫ:

экспрессионные ДНК-чипы.

Время

Ген

ы (

mR

NA

) Экспериментальные данные: x

Время

i j концентрация i-го гена

в j-й временной точке

XN x M :=

···

···

1

1

2

1

M

1

M

2

2

2

1

2

··· M

N

2

N

1

N

. . . . . .

. . . . . .

Page 8: Инструменты и методы системной биологии. Биоинформатика

ИНСТРУМЕНТЫ И МЕТОДЫ СИСТЕМНОЙ БИОЛОГИИ. ИНТЕГРАТИВНЫЕ ЭКСПЕРИМЕНТАЛЬНЫЕ ПОДХОДЫ: Граф белок-

белковых взаимодействий Drosophila melanogaster (7048 белков и 4780 высоко

достоверных взаимодействий)

Белки дрозофилы, ортологичные

белкам человека, имеющим важное

значение при возникновении

заболеваний, выделены кружками с

зазубренным краем.

Принадлежность белков человека к

тому или иному функциональному

классу, обеспечивает возможность

поиска новых стратегий для терапии

таких болезней как рак, сердечно-

сосудистые заболевания или

диабеты различной природы.

Такие белки пригодны в качестве

мишеней действия лекарственных

препаратов.

(Science, 302(5651):1727-1736)

Page 9: Инструменты и методы системной биологии. Биоинформатика

ИНСТРУМЕНТЫ И МЕТОДЫ СИСТЕМНОЙ БИОЛОГИИ

Современная биология стала источником огромных объемов экспериментальных

данных, осмысливание которых невозможно без использования эффективных

информационных технологий и методов компьютерного анализа и

математического моделирования

ИНТЕГРАЦИЯ КОМПЬЮТЕРНЫХ БАЗ ДАННЫХ И МОДЕЛИРОВАНИЕ МОЛЕКУЛЯРНО-ГЕНЕТИЧЕСКИХ СИСТЕМ И ПРОЦЕССОВ

Интеграция

баз данных по

метаболическим

путям и их

генетической

регуляции

Page 10: Инструменты и методы системной биологии. Биоинформатика

ИНСТРУМЕНТЫ И МЕТОДЫ СИСТЕМНОЙ БИОЛОГИИ. TRRD - база данных

регуляторных районов генов эукариот: регуляторные районы гена аполипопротеина В

человека.

+ 1 - 5 0 - 1 0 0 - 1 2 5

A G G C C C G G G A G G C G C C C T T T G G A C C T T T T G C A A T C C T G G C G C T C T - 8 0

- 9 0

+ 1 - 8 9 8 - 1 2 9 - 6 3 9

ARP-1 HNF-1

Негативный регуляторный

элемент

Негативный регуляторный элемент промотор

Регуляторная область в экзоне 1

Энхансер в интроне 1

Энхансер в интроне 2

HNF-3 COUP

HNF-4

C/EBP TATA

COUP

C/EBP

Композиционный элемент

HNF-4

-3678 -1802 +1064 -898 +1 +12

0 +346 +521 +621

-70 -60 -50

ИЦиГ СО РАН, http://www.bionet.nsc.ru/trrd/

Page 11: Инструменты и методы системной биологии. Биоинформатика

ИНСТРУМЕНТЫ И МЕТОДЫ СИСТЕМНОЙ БИОЛОГИИ: базы данных по

межклеточным коммуникациям и путям передачи сигналов.

Турнаев И. И., ИЦиГ СО РАН, http://wwwmgs.bionet.nsc.ru/mgs/gnw/genenet/

МАР-киназный путь передачи сигнала в ядро

клетки, активируемый ростовыми факторами,

контролирующий процесс КЛЕТОЧНОГО

ДЕЛЕНИЯ

Page 12: Инструменты и методы системной биологии. Биоинформатика

ИСТОЧНИКИ ИНФОРМАЦИИ ДЛЯ

РЕКОНСТРУКЦИИ ГЕННЫХ СЕТЕЙ

ИНФОРМАЦИЯ ИЗ КОМПЬЮТЕРНЫХ БАЗ ДАННЫХ

(ЭКСТРАКЦИЯ С ИСПОЛЬЗОВАНИЕМ

СПЕЦИАЛЬНЫХ ПРОГРАММ – КОНВЕРТОРОВ)

ЭКСПЕРИМЕНТАЛЬНЫЕ ДАННЫЕ,

ПРЕДСТАВЛЕННЫЕ В НАУЧНЫХ ПУБЛИКАЦИЯХ

(КОМПЬЮТЕРНАЯ АННОТАЦИЯ)

Page 13: Инструменты и методы системной биологии. Биоинформатика

Компьютерная технология реконструкции

генных сетей: иерархия классов

Gene network

components

Elementary

structures

(Entities)

Elementary events

(Relationships

between the Entities )

Genes RNAs Proteins Substances Regulatory

events Reactions

Page 14: Инструменты и методы системной биологии. Биоинформатика

ГЕННАЯ СЕТЬ

Примеры элементарных структур и событий, значимых для

функционирования генных сетей

Активация

транскрипции

Фосфорилирование

Энзиматический синтез

Fe++

Heme

cytoplasm

ProtoIX

FCH

ISGF3

ISGF3alpha

p48

nucleus

Мультимеризация

OAS mRNA

OAS

nucleus

cytoplasm

Транскрипция

NPY

NPY mRNA

cytoplasm

Трансляция

Объекты:

Jak1

Jak1-p

cytoplasm

IFNR-II

Подавление

транскрипции

IRF-2

IFN-beta nucleus

IFN-beta

IRF-1

IRF-2 nucleus

IRF-2

Inactive protein

Active protein

Gene

Reaction

Switch on Increase

- switch off - decrease

mRNA

Page 15: Инструменты и методы системной биологии. Биоинформатика

Компьютерная технология формализованного описания,

конструирования и визуализации генных сетей:

редактор генных сетей GenNetEd. Edit component

properties

Page 16: Инструменты и методы системной биологии. Биоинформатика

Формализованное описание, конструирование и

визуализация генных сетей: скрытые слои

Gene network

“Macrophage activation”

Click

Subscheme“Jak-Stat signal

transduction payhway”

Page 17: Инструменты и методы системной биологии. Биоинформатика

X

t

0 X0

Основные типы генных сетей, описанных в базе данных

GeneNet: http://wwwmgs.bionet.nsc.ru/mgs/gnw/genenet/

X0

X

t

0

Генные сети,

контролирующие

процессы роста,

развития,

дифференцировки,

морфогенеза

Генные сети

гомеостаза

Генные сети

стрессового ответа

X

t

Генные сети

циклических

процессов

Processes determining the value of the output

system parameter

POSITIVE FEEDBACK +

u(X)

x0

x

X

X

t

0

NEGATIVE FEEDBACK -

u(X-X0 )

x0

x Processes determining the value of the output

system parameter

Page 18: Инструменты и методы системной биологии. Биоинформатика

Acetoacetyl CoA

+

Acetyl CoA

mevalonate

squalene

cholesterol

HMG-

CoA -S

HMG-

CoA -R

FDFS

SREBP

SRP

preSREBP

SS .… .…

HMG-CoA-S gene

HMG-CoA-R gene

FDPS gene

SS gene

+

- +

+ + +

LDLR gene +

LDLR

cholesterol +

HMG-CoA

farnesyldip

hosphate

База данных GENENET: центральный

фрагмент генной сети биосинтеза

холестерина в клетке

(регуляция по механизму отрицательной

обратной связи)

Принципиальная схема

регуляторного контура с

отрицательной обратной

связью

X

X

t

0

Процессы, определяющие

величину выходного

параметра системы

Отрицательная обратная связь

X0 X

u(X-X0)

-

Игнатьева Е.В., ИЦиГ СО РАН, http://wwwmgs.bionet.nsc.ru/mgs/gnw/genenet/

Page 19: Инструменты и методы системной биологии. Биоинформатика

X

X

t

0

ФРАГМЕНТ ГЕННОЙ СЕТИ

ДИФФЕРЕНЦИРОВКИ И СОЗРЕВАНИЯ

ЭРИТРОЦИТОВ (База данных GENENET)

+ +

+

+

+

+

Принципиальная схема

регуляторного контура с

положительной обратной

связью

Процессы, определяющие

величину выходного

параметра системы X0

X

u(X)

+ Положительная обратная связь

Подколодная О.А., ИЦиГ СО РАН, http://wwwmgs.bionet.nsc.ru/mgs/gnw/genenet/

Page 20: Инструменты и методы системной биологии. Биоинформатика

DP-1 E2F-1

сайт связывания E2F-1/DP-1

Альтернативная репрессия и активация кассеты генов

с участием транскрипционного фактора E2F-1

на стадиях G1 S перехода

Усиление транскрипции Подавление транскрипции

+ DP-1

E2F-1 - pRB

сайт связывания E2F-1/DP-1

http://wwwmgs.bionet.nsc.ru/mgs/gnw/genenet/

Подколодная

О.А.,Турнаев И.И.,

ИЦиГ СО РАН

ИЕРАРХИЧЕСКАЯ ОРГАНИЗАЦИЯ

ГЕННЫХ СЕТЕЙ

Page 21: Инструменты и методы системной биологии. Биоинформатика

Транскрипционный фактор SF1 - центральный

регулятор генных сетей стероидогенеза

SF1

SF1

SF1

гипоталамус гипофиз надпочечники, гонады

ALD1m

StaRm, h, b

P450sccm, h, b, r

3betaHSD h

P450c17 h, b, r

P450arom h, r

P450c21m

P450c11 m, b, r LeyILm

MISm, h

SF1r

DAXm, h

DAXm, h

SF1r

SF1r

DAXm, h

GTHIIchs Lhbetar,b,ho,s

GHAm, h

GHRm, r

PRLR r

ACTHR m,h

FSHR m

LHR r

LHR r

LHR r

OH HO O

O

HCO

O

O OH

OH HO

OH

O

OH

OH

HO холестерин

альдостерон

Aльдо-

стерон

Проге-

стерон

Дезокси-

кортико-

стерон

Кортико-

стерон

17-

гидрокси-

прегнонолон

17-гидрокси-

прогестерон 11-дезокси-

кортизол

Дегидро-

эпиандро-

стерон андростендион эстрон

эстрадиол

тестостерон ФЕРМЕНТЫ

РЕЦЕПТОРЫ

кортизол

5-андро-

стен-3

Игнатьева Е.В., ИЦиГ СО РАН http://wwwmgs.bionet.nsc.ru/mgs/gnw/genenet/

Page 22: Инструменты и методы системной биологии. Биоинформатика

Цитокины

Антиоксидантная

защита

Арест клеточного цикла

Воспаление

Метаболизм железа

Ответ на тепловой шок

Апоптоз

Активные формы кислорода

Генные сети – интеграторы:

генная сеть регуляции уровня свободных радикалов и активация связанных с нею генных сетей в ходе противовоспалительного ответа

организма

В зависимости от функционального

состояния организма одна и та же

генная сеть – интегратор

обеспечивает комбинаторную

активацию различных кассет генных

сетей.

http://wwwmgs.bionet.nsc.ru/mgs/gnw/genenet/, Степаненко И. Л.,

ИЦиГ СО РАН

Page 23: Инструменты и методы системной биологии. Биоинформатика

Per 1,2

Cry 1,2 E-box

E-box E-box

E-box

Bmal1

Rora

Reva-Erba

REV-ERBa

RORa

Коровая петля Стабилизирующая петля

RRE

CLK/BMAL1

PER/CRY

Структура центрального

осциллятора генной сети

циркадного ритма

J.D.Richter, 2004, Neuron

Page 24: Инструменты и методы системной биологии. Биоинформатика

Печень

187-575

(2.7-9%)

Сердце

462

(4.7%)

Эпифиз

38

(3.2%)

Супрахиазматическое

ядро

80-337

(0.6-2.7%)

Ритмические биологические процессы F. Delaunay, TRENDS in Genetics, 2002

ХАРАКТЕРИСТИКИ ЦЕНТРАЛЬНОГО И ПЕРЕФЕРИЧЕСКИХ

ОСЦИЛЛЯТОРОВ, ПОЛУЧЕННЫЕ НА ОСНОВЕ

ЭКСПРЕССИОННЫХ ДНК-ЧИПОВ: КОЛИЧЕСТВО ЦИКЛИРУЮЩИХ

ГЕНОВ И ФАЗОВЫЕ СДВИГИ

Т ~ 4-8 часов

Page 25: Инструменты и методы системной биологии. Биоинформатика

misc

6%

транспортер 1%

белки теплового

шока/шапероны 4%

рецепторы сопряженные

с G-белком 1%

EST's 22%

транскриционные

факторы 8%

трансляция 1%

неизвестная функция 7%

КЛЕТОЧНЫЙ ЦИКЛ

каналы 4%

Clock белки

2%

ферменты 13%

передача сигнала 6%

протеосомы 1%

прогормоны 1%

транскрипция

4%

транспорт/перенос 6%

6%

ФУНКЦИОНАЛЬНЫЕ КЛАССЫ ЦИКЛИРУЮЩИХ

ТРАНСКРИПТОВ В ФИБРОБЛАСТАХ,

ВЫЯВЛЕННЫЕ С ИСПОЛЬЗОВАНИЕМ

ЭКСПРЕССИОННЫХ ДНК-ЧИПОВ

Grundschober C., 2001, J. Biol.

Chem.

структура/цитоскелет

7%

Page 26: Инструменты и методы системной биологии. Биоинформатика

База данных

GeneNet:

компьютерная

реконструкция

генной сети

регуляции

продукции

инсулина бета

клеткой

поджелудочной

железы

Игнатьева Е.В., Воронич Е.С. ,ИЦиГ СО РАН Межклеточное пространство

Цитоплазма

Клеточная мембрана

Ядро

Митохондрия

ГЛЮКОЗНЫЙ СЕНСОР

ПУТЬ СИГНАЛЬНОЙ ТРАНСДУКЦИИ ОТ РЕЦЕПТОРА ИНСУЛИНА

МЕТАБОЛИ-ЧЕСКИЕ

РЕАКЦИИ

РЕГУЛЯЦИЯ ЭКСПРЕССИИ

ИНСУЛИНА

СЕКРЕЦИЯ ИНСУЛИНА

ИНТЕГРАЦИЯ

ГЕННЫХ

СЕТЕЙ

ГОМЕО-

СТАЗА

Page 27: Инструменты и методы системной биологии. Биоинформатика

+

+

_ +

Бета клетка

РЕГУЛЯТОРНЫЕ КОНТУРЫ С ПОЛОЖИТЕЛЬНЫМИ ОБРАТНЫМИ

СВЯЗЯМИ, ФУНКЦИОНИРУЮЩИЕ НА УРОВНЕ БЕТА-КЛЕТОК,

КОНТРОЛИРУЮТСЯ ОТРИЦАТЕЛЬНЫМИ ОБРАТНЫМИ СВЯЗЯМИ

ИЕРАРХИЧЕСКИ ВЫСОКОГО УРОВНЯ, ФУНКЦИОНИРУЮЩИМИ НА

УРОВНЕ ОРГАНИЗМА

инсулин

Поступление

глюкозы

Транспорт глюкозы

в ткани о органы

Уровень

глюкозы

в крови

+

+ + +

Адипоцит

Page 28: Инструменты и методы системной биологии. Биоинформатика

Внешниние факторы

ГОРМОНЫ: •Глюкокортикоиды •Инсулин •и т.д.

Глюкоза

Настройка функционирования

адипоцита

Секреция сигнальных веществ

Компоненты ренин-ангиотензино-вой системы

БАЗА ДАННЫХ GENENET: ГЕННАЯ СЕТЬ АДИРОЦИТА

(РЕГУЛЯЦИЯ БИОСИНТЕЗА, ЗАПАСАНИЯ И МЕТАБОЛИЗМА

ЖИРОВ)

ГЛАВНАЯ

ФУНКЦИЯ

АДИПОЦИТА:

ЗАПАСАНИЕ

ЭНЕРГИИ В ФОРМЕ

ЖИРОВ

(ТРИГЛИЦЕРИДОВ)

OH - C - H

H2C - OH

H2C - O - P

ГЛИЦЕРОЛ-3-ФОСФАТ

+ 3 (R - COOH)

ЖИРНЫЕ КИСЛОТЫ

O

H2C - O - C - R`

H2C - O - C - R``

O

R - C - O - C - H

O

ТРИАЦИЛГЛИЦЕРИД

Лептин

Биосинтез

жирных

кислот

Page 29: Инструменты и методы системной биологии. Биоинформатика

Адипоцит: индукция экспрессии генов инсулином

(база данных GENENET)

ИНСУЛИН

SCD1

AGT

OB

FAS

ИНСУЛИН стимулирует

экспрессию:

FAS -синтетаза жирных кислот,

осуществляет биосинтез

насыщенных жирных кислот

SCD1 - стеароил-КоА-десатураза,

участвует в синтезе

ненасыщенных жирных жирных

кислот

Ob (лептин), гормон,

регулирующий пищевое

поведение

Leptin AGT

Проскура А.Л., Игнатьева Е.В. ИЦиГ СО РАН,

http://wwwmgs.bionet.nsc.ru/mgs/gnw/genenet/

Page 30: Инструменты и методы системной биологии. Биоинформатика

ПУТИ ПЕРЕДАЧИ СИГНАЛА ГОРМОНА ЛЕПТИНА И МУТАЦИИ,

ВЫЗЫВАЮЩИЕ НАКОПЛЕНИЕ ИЗБЫТОЧНОЙ МАССЫ ТЕЛА

Barsh G. et al., Genetics of body-weight regulation, Nature, 2000, N6778

+

ЖИРОВАЯ КЛЕТКА

Лептин

ПОТРЕБЛЕНИЕ ПИЩИ

РЕЦЕПТОР

ЛЕПТИНА

NPY

- + POMC

MSH

+

PROHORMONE

CONVERTASE 1

МУТАЦИИ

NPY - НЕЙРОПЕПТИД Y

MSH - МЕЛАНОКОРТИН

POMC - ПРООПИО-

МЕЛАНОКОРТИН

ГИПОТАЛАМУС

+ РЕЦЕПТОР MSH

+

-

+

Page 31: Инструменты и методы системной биологии. Биоинформатика

Проскура А.Л., Игнатьева Е.В. ИЦиГ СО

РАН, http://wwwmgs.bionet.nsc.ru/mgs/gnw/genenet/

ГЛЮКОКОРТИ-

КОИДЫ SCD1

AGT

OB

FAS

Leptin AGT

Адипоцит: индукция экспрессии генов

глюкокортикоидами (база данных GENENET)

ГЛЮКОКОРТИКОИДЫ

стимулируют экспрессию:

SCD1 - стеароил-КоА-

десатураза, участвует в

синтезе ненасыщенных

жирных жирных кисло

Ob (лептин), гормон,

регулирующий пищевое

поведение

AGT – (ангиотензиноген),

предшественник

ингиотензина II,

регулирующего давление

крови

Page 32: Инструменты и методы системной биологии. Биоинформатика

Фрагмент генной сети адипоцита: глюкокортикоиды

активируют экспрессию генов ренин-ангиотензиной

системы (база данных GENENET))

ДЕКСАМЕТАЗОН

ПРОЛИФЕРАЦИЯ

КАТЕПСИН Д КАТЕПСИН Ж

АПФ

РЕНИН

АНГИО-

ТЕНЗИН II АНГИОТЕНЗИНОГЕН

ЦИКЛИН Д1

АНГИОТЕНЗИН I

AGT

OB

Leptin

Leptin

CTSG

CTSD

REN ACE

ИЦиГ СО РАН, Проскура А.Л., Игнатьева Е.В. , http://wwwmgs.bionet.nsc.ru/mgs/gnw/genenet/

Глюкокортикоиды

активируют

транскрипцию гена

AGT, кодирующего

ангиотензиноген -

предшественник

ингиотензина II,

повышающего

артериальное

давление.

Page 33: Инструменты и методы системной биологии. Биоинформатика

C. elegans:

•миРНК контролируют переход

между личиночными стадиями

[Chen C. et al., Science 303, 83

(2004)];

•асимметричное расположение

нейронов (Isy-6) [Miska E. et all.,

Genome biology (2004)].

lin-4 let-7

СЕТИ РНК-РНК ВЗАИМОДЕЙСТВИЙ: микро-РНК

D. melanogaster [Chen C. et al., Science

303, 83 (2004)]:

широкий спектр действия миРНК

•стимулирует пролиферации клеток

(miR-bantam);

•предотвращает апоптоз (miR-14, miR-

bantam);

•влияет на жировой метаболизм (miR-

14).

Щитовидная железа

Печень

Кишечник

Головной мозг

Легкие

Костный мозг

H. sapiens - эффекты миРНК

регуляция гемопоэза;

•регуляция развития мозга.

Список патологий,

возникающих при нарушении

функционирования миРНК:

•лейкемия;

•нейробластома;

•фолликулярная лимфома;

•пролимфоцитарная лейкемия;

•миелодиспластический

синдром;

•рак: кожи; легких;

носоглотки; шейки матки;

молочной железы; толстого

кишечника; эпителия

мочевыводящих путей.

[Calin G. et all., PNAS (2003)]

Минимальные оценки: в геномах

млекопитающих имеется до 200

микро-РНК. Каждая микро-РНК

может иметь до 100 генов-

мишеней. В целом сеть микроРНК-

взаимодействий может включать

до 20 000 генов.

Page 34: Инструменты и методы системной биологии. Биоинформатика

КОМПЬЮТЕРНОЕ МОДЕЛИРОВАНИЕ ДИНАМИКИ

ГЕННЫХ СЕТЕЙ: ХИМИКО-КИНЕТИЧЕСКИЙ ПОДХОД Примеры формального описания элементарных процессов

Page 35: Инструменты и методы системной биологии. Биоинформатика

Здесь i – это номер эксперимента и j(i) – номер j-го наблюдения i-го эксперимента. Xijexp – это значение

переменной генной сети, измеренной в j-ом наблюдении i-го эксперимента. Xijtheor (c1,…,ck) - это же

значение, вычисленное с фиксированными значениями коэффициентов c1,…,ck

Генные сети: решение обратной задачи

Эксперимент 1

0.00

0.50

1.00

1.50

2.00

2.50

0 50 100 150

X1

0

50

100

150

200

250

0 0.5 1.0 1.5

Xn

модель эксперимент

Эксперимент N

2)(,

1exp1 ),...,(.... iji

k

ij

theor

ij

k ccXXccFmin

• Математическая модель генной сети характеризуется набором констант c1, …,ck

в системе дифференциальных уравнений.

• Как правило, экспериментально измеренные значения известны только

для ограниченного числа констант.

• Значения остальных констант определяются численно.

• Ищутся такие значения констант c1, …,ck, которые обеспечивают максимальное

соответствие между рассчитанной и экспериментально наблюдаемой динамикой

генной сети по множеству переменных и множеству экспериментов одновременно.

Page 36: Инструменты и методы системной биологии. Биоинформатика

Генная сеть с

оптимальными

значениями

коэффициентов

c1,…,ck

Отбор

Целевой функционал: W=1/F, где

W – приспособленность организма в определенных условиях;

F – среднеквадратическое отклонение вычисленных характеристик от

соответствующих им экспериментальных

Начальная

популяция генных

сетей: не все

константы c1,…, ck

известны

РЕШЕНИЕ ОБРАТНОЙ ЗАДАЧИ ДЛЯ ГЕННОЙ СЕТИ:

генетический алгоритм

МУТАЦИОННЫЙ ПРОЦЕСС

РЕКОМБИНАЦИИ

Page 37: Инструменты и методы системной биологии. Биоинформатика

База данных для решения обратной задачи:

экспериментальная динамика генных сетей

Type

Name_brief

Name_full

Organism

Cells

StageCellDifferentiation

OrganismStatus

ExpressionDetectionDevice

Reference

Comments

Сytoplasm

Nucleus

LPS

IL-12p40 IL-12p35

IL-12

Extracellular space

General information

Time Concentration

IDExternalFactor

Specification(initialpoint)

(exposuretime)

Units Value Units

1 LPSEscherichiacoli O55:B5

0 6 hours 10 ng/ml

2 LPSEscherichiacoli O55:B5

0 1 hours 100 ng/ml

2 LPSEscherichiacoli O55:B5

1 7 hours 10 ng/ml

3 … … … … … … …

Experimental conditions

Data on dynamics Time Product

IDPointOf

MeasurementUnits Concentratio

n%

StandartError

0 0 hours 0.0

1 6 hours 30.6

2 7 hours 4.6

3 9 hours 4.0

4 12 hours 2.8

5 18 hours 2.7

6 30 hours 0.2

7 30 hours 0.3

8 30 hours 1.9

Protein

IL-12

Interleukin-12

Mouse – mus musculus

Peritoneal macrophages

Terminally differentiated

Norm

Relative protein level

Nomura F. et al., 2000

C57BL/6J mice

Peritoneal macrophages were preincubated with LPS for

the indicated periods, then washed with HBSS twice, and

then stimulated with LPS.

Page 38: Инструменты и методы системной биологии. Биоинформатика

Генная сеть активации макрофагов

при действии липополисахаридов

(LPS) и интерферона-γ (IFN-γ) http://wwwmgs.bionet.nsc.ru/mgs/gnw/genenet/

Сравнение экспериментальных данных

(Hambleton J., et al, 1996) и результатов

расчетов модели после адаптации

параметров.

Обратная задача генных сетей:

динамика концентрации

транскрипционного фактора АР-1

Page 39: Инструменты и методы системной биологии. Биоинформатика

Mutation

Norm

Compensatory effect (after delivering the substance)

0

5

10

15

20

25

30

35

0 5 10 15 20 25 30

t (hours)

NO

(1

0^

8 u

nit

/ce

ll)

Поиск оптимального управления, нормализующего динамику генной сети биосинтеза NO при мутации, приводящей к избытку рецептора CD14).

ОПТИМАЛЬНОЕ ФАРМАКОЛОГИЧЕСКОЕ УПРАВЛЕНИЕ

ФУНКЦИЕЙ ГЕННЫХ СЕТЕЙ

Page 40: Инструменты и методы системной биологии. Биоинформатика

Моделирование влияния мутаций на функцию генной сети

регуляции биосинтеза холестерина в клетке

Моделирование отклика генной сети на увеличенное в 2 раза поступления ЛНП в плазму крови при

мутации, уменьшающей скорость экспрессии гена ЛНП рецепторов в 2 раза

0.0E+00

2.0E+02

4.0E+02

6.0E+02

8.0E+02

1.0E+03

0 5 10 15 20 25 30

[св

. Л

НП

рец

еп

то

ры

], ш

т/к

лет

ку

Рецепторы

ЛНП МУТАЦИЯ НОРМА

мРНК ЛНП

рецепторов

норма норма

норма

мутация мутация

мутация

0.0E+00

1.0E+05

2.0E+05

3.0E+05

4.0E+05

5.0E+05

0 5 10 15 20 25 30

часы

[ЛН

П],

шт

/об

ъем

кл

етк

и

2.5E+04

2.6E+04

2.7E+04

2.8E+04

2.9E+04

3.0E+04

3.1E+04

3.2E+04

0 5 10 15 20 25 30

часы

[св

. хо

лес

тер

ин

], ш

т/к

лет

ку

часы

Page 41: Инструменты и методы системной биологии. Биоинформатика

Анализ мутационного портрета генной сети регуляции биосинтеза холестерина в клетке

Изменение содержания свободного холестерина в клетке в зависимости от мутационного

изменения констант элементарных процессов в генной сети биосинтеза холестерина

0

30

60

90

120

150

180

210

-4 -3 -2 -1 0 1 2 3 4

ln(Ki under a mutation/Ki in the norm)

fre

e c

ho

les

tero

l c

on

ten

t,

% r

ela

tiv

e t

o t

he

no

rm

1

2

4

3

0

30

60

90

120

150

180

210

-4 -3 -2 -1 0 1 2 3 4

ln(Ki under a mutation/Ki in the norm)

fre

e c

ho

les

tero

l c

on

ten

t,

% r

ela

tiv

e t

o t

he

no

rm

1

2

4

3

200%

0

30

60

90

120

150

180

210

-4 -3 -2 -1 0 1 2 3 4

ln(Ki under a mutation/Ki in the norm)

fre

e c

ho

les

tero

l c

on

ten

t,

% r

ela

tiv

e t

o t

he

no

rm

1

2

4

3

65-70%

(2) Константа обратной реакции димеризации SREBP1;

0

30

60

90

120

150

180

210

-4 -3 -2 -1 0 1 2 3 4

ln(Ki under a mutation/Ki in the norm)

free c

ho

leste

rol

co

nte

nt,

% r

ela

tive t

o t

he n

orm

1

2

4

3

15-20%

(3) Константа Михаэлиса-Ментен фермента ацетоацетил КоА тиолазы;

(4) Константа оборота фермента АХАТ (ацил-КoA: холестерин ацилтрансфераза)

0

30

60

90

120

150

180

210

-4 -3 -2 -1 0 1 2 3 4

ln(Ki under a mutation/Ki in the norm)

fre

e c

ho

les

tero

l c

on

ten

t,

% r

ela

tiv

e t

o t

he

no

rm

1

2

4

3

(1) Константа оборота фермента SRP;

Page 42: Инструменты и методы системной биологии. Биоинформатика

Анализ мутационного портрета генной сети

регуляции биосинтеза холестерина в клетке

ГЕННАЯ СЕТЬ С УКАЗАНИЕМ ЧУВСТВИТЕЛЬНОСТИ СТАЦИОНАРНОГО

СОДЕРЖАНИЯ СВОБОДНОГО ХОЛЕСТЕРИНА В КЛЕТКЕ К МУТАЦИОННЫМ

ИЗМЕНЕНИЯМ ПАРАМЕТРОВ

- изменение скоростей

данных процессов в

значительной степени

сказывается на

стационарной концентрации

холестерина, которая может

меняться от 0 до более чем

200% относительно нормы;

- стационарная

концентрация холестерина

меняется не более чем на

35% от нормы;

- стационарная

концентрация холестерина

меняется не более чем на

25% от нормы.

Page 43: Инструменты и методы системной биологии. Биоинформатика

Acetoacetyl CoA

+

Acetyl CoA

mevalonate

squalene

cholesterol

HMG-

CoA -S

HMG-

CoA -R

FDFS

SREBP

SRP

preSREBP

SS .… .…

HMG-CoA-S gene

HMG-CoA-R gene

FDPS gene

SS gene

+

-

+

+ + +

LDLR gene +

LDLR

cholesterol +

HMG-CoA

farnesyldiphos

phate

ЦЕНТРАЛЬНЫЙ ФРАГМЕНТ ГЕННОЙ СЕТИ

БИОСИНТЕЗА ХОЛЕСТЕРИНА В КЛЕТКЕ

Игнатьева Е.В., ИЦиГ СО РАН, http://wwwmgs.bionet.nsc.ru/mgs/gnw/genenet/

Page 44: Инструменты и методы системной биологии. Биоинформатика

ОПТИМАЛЬНОЕ ФАРМАКОЛОГИЧЕСКОЕ УПРАВЛЕНИЕ

ФУНКЦИЕЙ ГЕННЫХ СЕТЕЙ

Мишенями оптимального фармакологического

управления могут быть только лимитирующие звенья

генной сети. Их не так много. Построение мутационного

портрета генной сети – обязательный этап поиска

оптимального фармакологического управления.

Оптимальное управление, нормализующее критическую

переменную генной сети, не должно выводить генную

сеть за границы нормы по другим значимым

переменным.

Page 45: Инструменты и методы системной биологии. Биоинформатика

Оптимальное

фармакологическое

управление функцией генных

сетей

P - PATHOLOGY

N - NORM

U – оптимальный контроль,

нормализующий функцию

генной сети за счет сдвига

стационарного состояния

мутантной генной сети в

окрестность нормы.

U - класс кусочно-линейных

управляющих функций,

описывающих изменение

вектора параметров a в

процессе фармакологического

контроля)

dV

dt = (V, a*, U)

Оптимальное управление, нормализующее критическую переменную генной сети, не должно

выводить генную сеть за границы нормы по другим значимым переменным.

V – вектор переменных;

a – вектор параметров

(a1,…,ak,…, ar);

N- стационарное состояние,

соответствующее норме.

dV

dt = (V, a)

V – вектор переменных;

a – вектор параметров

(a1,…,a*k,…, ar);

N- стационарное состояние,

соответствующее патологии.

dV

dt = (V, a*)

*

ak

ak *

Page 46: Инструменты и методы системной биологии. Биоинформатика

-

-

- participation in the process

with nonzero stehiometry

- participation in the process

with zero stehiometry

Automatically generated computer model of cell metabolism

of Escherichia coli K-12

Bipartite graph of computer

dynamic model of cell

metabolism, with specification

to the organism

Escherichia coli K-12

4036

3973

dynamic

variables (substrates)

processes

(enzyme reactions)

Page 47: Инструменты и методы системной биологии. Биоинформатика

мРНК

белковый

мультимер Генетический элемент (g) – элементарная структурная

единица ГГС

Функционирование генетического элемента - синтез белка

Активность генетического элемента – скорость синтеза

белка

Продукт (p) – белок, кодируемый g

Регуляторная связь () - элементарная единица

искусственной генной сети, посредством которой

устанавливается регулирование активности одного

генетического элемента (g2), другим генетическим

элементом (g1)

ген g

белок p

g1 g2

ИСКУССТВЕННЫЕ ГЕННЫЕ СЕТИ:

КОМПЬЮТЕРНЫЙ ДИЗАЙН И

ЭКСПЕРИМЕНТАЛЬНОЕ

КОНСТРУИРОВАНИЕ

Page 48: Инструменты и методы системной биологии. Биоинформатика

14

12

24

23

31

41

34

43

42

g1 g2 g3 g4

0

2

4

6

0 5 10

p4

p1 р2,р3

время

ко

нц

ен

тр

ац

ии

0

1

2

3

0 5 10 74.8 79.8

p3 p2 p1

ко

нц

ен

тр

ац

ии

время

84.8

p4

Устойчивый циклический режим

Устойчивое стационарное состояние

ИСКУССТВЕННЫЕ ГЕННЫЕ СЕТИ: КОМПЬЮТЕРНЫЙ ДИЗАЙН И

ЭКСПЕРИМЕНТАЛЬНОЕ КОНСТРУИРОВАНИЕ

УСТОЙЧИВОЕ

СТАЦИОНАРНОЕ

СОСТОЯНИЕ:

В зависимости от начальных данных эта генная сеть

имеет два качественно различных режима

функционирования.

УСТОЙЧИВЫЙ ЦИКЛ:

Page 49: Инструменты и методы системной биологии. Биоинформатика

ГЕНЕТИЧЕСКИЕ КОМПЬЮТЕРЫ:

искусственная генная сеть, суммирующая

четырех-разрядные двоичные числа

1010

110 +

_____

10000

0+0=00

0+1+1=10

1+0+1=10

1+1+0=10

Page 50: Инструменты и методы системной биологии. Биоинформатика

ИНФОРМАЦИОННЫЙ ВЗРЫВ В МОЛЕКУЛЯРНОЙ БИОЛОГИИ И ГЕНЕТИКЕ

Расшифрованы

аминокислотные

последовательности

сотен тысяч белков

Расшифрованы

пространственные

структуры десятков

тысяч белков

Расшифрованы геномы десятков тысяч вирусов, тысяч

бактерий, геном дрожжей, геномы ряда растений и животных

Page 51: Инструменты и методы системной биологии. Биоинформатика

PDBSite: A Database on Protein Active Sites and

Their Environment

PDB PDBSite

Active site Site environment

Page 52: Инструменты и методы системной биологии. Биоинформатика

Содержание базы данных

PDBSite

ИНСТИТУТ ЦИТОЛОГИИ

И ГЕНЕТИКИ

Сайты связывания

Белок+ДНК (2700)

Белок+белок (1000)

Белок+РНК (2000)

Фармакологические

препараты (50)

Каталитические

центры (1300)

Посттрансляционная

модификация (100)

Органические

лиганды (2100)

Металлы (1000)

Неорганические

лиганды (400)

~15000 сайтов

Page 53: Инструменты и методы системной биологии. Биоинформатика

Программа поиска активных сайтов

в структурах белков: PDBSiteScan

Поиск сайта связывания меди в молекуле пластоцианина (PDB ID 1BXU).

Зеленым цветом изображены остатки распознанного сайта в

пластоцианине, синим цветом изображены остатки сайта-шаблона из

базы PDBSite (ID 1B3ICU). Ион меди показан оранжевым шариком.

Шаблоны сайтов

(PDBSite)

Структура

пластоцианина

ИНСТИТУТ ЦИТОЛОГИИ

И ГЕНЕТИКИ

Page 54: Инструменты и методы системной биологии. Биоинформатика

Zn2+

Zn-binding site

Cys242

His179

Cys176

Cys238

Normal DNA-binding

МОЛЕКУЛЯРНЫЕ МЕХАНИЗМЫ НАРУШЕНИЯ ФУНКЦИИ

МУТАНТНОГО БЕЛКА P53, ПРИВОДЯЩИЕ К РАЗВИТИЮ РАКА

SubstitutionGly245->Cys

Page 55: Инструменты и методы системной биологии. Биоинформатика

Cl-связывающий

SO4-связывающий

Области адаптивной

эволюции выделены

овалами

Адаптивная эволюция : мутационное ускользание вируса от иммунной

системы

Сайты связывания ионов в пространственной структуре гемагглютинина вируса гриппа А

человека совпадают с участками адаптивной эволюции

Предложен новый механизм

эволюционной защиты

оболочечных белков вируса

гриппа от действия антител

– формирование ионных

«шуб» в области антигенных

детерминант, обусловленное

возникновением сайтов

связывания различных

ионов.

Ca-связывающий

PO4-связывающий

ИНСТИТУТ ЦИТОЛОГИИ

И ГЕНЕТИКИ

Page 56: Инструменты и методы системной биологии. Биоинформатика

белок 1 белок 2

белок 3

белок 4

белок 5

y1 y2

y3

y4

y5

Множественное выравнивание последовательностей белков Активности

подвижная рамка

x1 x2

x3

x4

x5

От аминокислот к их

физико-химическим свойствам сайт Поиск статистической

зависимости Y = F(X)

Физико-химическая

характеристика сайтов

WebProAnalyst: программа для количественного анализа взаимосвязи

структура-активность в семействах гомологичных белков

http://wwwmgs.bionet.nsc.ru/mgs/programs/panalyst/

ИНСТИТУТ ЦИТОЛОГИИ

И ГЕНЕТИКИ

Page 57: Инструменты и методы системной биологии. Биоинформатика

Зависимость между ингибирующей слипание тромбоцитов активностью дезинтегринов и

зарядом и альфаспиральным моментом гидрофильности сайта 26-30

Количественные зависимости структура-активность в белковых

семействах

ИНСТИТУТ ЦИТОЛОГИИ

И ГЕНЕТИКИ

1.5

1.7

1.9

2.1

2.3

2.5

2.7

1.5 2 2.5 3

Измеренная активность

Пр

едск

аза

нн

ая

0

1

2

3

4

5

6

0 2 4 6 8

Измеренная активность П

ред

сказа

нн

ая

Зависимость между антимикробной активностью пептидов и альфаспиральным моментом

гидрофобности сайта 3-18

Page 58: Инструменты и методы системной биологии. Биоинформатика

Предсказание видимого спектра для зрения археозавра

(λmax предкового родопсина археозавра)

Рисунок взят из работы Chang et al., Mol. Biol. Evol. 19(9):1483–1489. 2002

ИНСТИТУТ ЦИТОЛОГИИ

И ГЕНЕТИКИ

Page 59: Инструменты и методы системной биологии. Биоинформатика

Предсказание λmax для родопсина археозавра

Экспериментальные λmax

Пр

едск

азан

ны

е λm

ax

490

493

496

499

502

505

508

490 493 496 499 502 505 508

R=0.97

Уравнение регрессии:

Y=15.784*X1-467.266*X2-37.661

X1 – Среднее значение для изоэлектрической точки (Bogard)

X2 – Момент гидрофобности (Eisenberg)

λmax предсказанное : Y= 506.7

λmax измеренное: Y= 508

Остатки влияющие на сдвиг

длины волны, результаты

согласуются с данными других

авторов Briscoe, Mol. Biol.

Evol. (2001).

ИНСТИТУТ ЦИТОЛОГИИ

И ГЕНЕТИКИ

Page 60: Инструменты и методы системной биологии. Биоинформатика

ИНСТИТУТ ЦИТОЛОГИИ

И ГЕНЕТИКИ