13
Нахождение ориджинов в последовательности нуклеотидов Выполнил: Ромашкин Амир, 445 гр. Руководитель: Профессор АФТУ, Порозов Юрий

Нахождение ориджинов в последовательности нуклеотидов

  • Upload
    sadah

  • View
    63

  • Download
    2

Embed Size (px)

DESCRIPTION

Выполнил: Ромашкин Амир, 445 гр. Руководитель: Профессор АФТУ, Порозов Юрий. Нахождение ориджинов в последовательности нуклеотидов. Основные понятия. ДНК – последовательность нуклеотидов(сиквенс): А, G, C, T Репликация – процесс синтеза дочерней молекулы ДНК - PowerPoint PPT Presentation

Citation preview

Page 1: Нахождение ориджинов в последовательности нуклеотидов

Нахождение ориджинов впоследовательности

нуклеотидов

Выполнил:Ромашкин Амир, 445 гр.

Руководитель: Профессор АФТУ, Порозов Юрий

Page 2: Нахождение ориджинов в последовательности нуклеотидов

Основные понятия ДНК – последовательность

нуклеотидов(сиквенс): А, G, C, T

Репликация – процесс синтеза дочерней молекулы ДНК

Ориджины(ORI) – место(<50 нуклеотидов) начала репликации.

Page 3: Нахождение ориджинов в последовательности нуклеотидов

Мотивация Есть гипотезы о влиянии некоторых

факторов на положение ORI Знания о положении ориджинов позволят:

Регенерировать клетки и управлять ростом организмов

Найти ключи к понимаю лечения рака Современные экспериментальные методы

трудоемки, затратны, неточны Нет реальных вычислительных методов!

Page 4: Нахождение ориджинов в последовательности нуклеотидов

Гипотеза: Факторы

Температура плавления(Tm) CpG-острова(CpG) Палиндромы(Pal)

Геометрические факторы(Banana)

Факторы транскрипций(Tfs)

Page 5: Нахождение ориджинов в последовательности нуклеотидов

Цели работы Изучить проблему нахождения ORI

Сформулировать варианты решения

Написать приложение для упрощение анализа сиквенсов на наличие факторов

Уметь удобно получать сиквенсы и вычислять все факторы

Исследовать зависимость ORI от факторов

Попробовать с “хорошей” вероятностью определять, есть ли в последовательности ориджин

Page 6: Нахождение ориджинов в последовательности нуклеотидов

Используемые технологии

Python, BioPython lib. .Net, Neurodotnet lib.

Page 7: Нахождение ориджинов в последовательности нуклеотидов

Проблемы Нетронутость проблемной области

Нет доказанных теорий Все с нуля

Неоднозначность факторов Неясная интерпретация

Гипотетичность темы

Page 8: Нахождение ориджинов в последовательности нуклеотидов

Двумя способами: Количественно, на весь сиквенс

количество Cpg-островов, средняя темп. плавления, количество палиндромов и тд

По окнам размером в 30 нуклеотидов Cpg, палиндромы, транскр.: сумма 3х

минимальных расстояний до факторов. Темп. плавления, геом. факторы: среднее

значение на окне.

Обучение нейронной сети

Page 9: Нахождение ориджинов в последовательности нуклеотидов

Результаты(1\2)Практический вклад

Сформирована база для дальнейшего исследования

Был написано приложение, которое позволяет: Получить последовательности

Вычислить все 5 факторов

Вручную: Темп. плавления, Транскрипции Используя eMboss: остальные

Посмотреть результаты вычисления факторов

Посмотреть сосредоточение факторов в сиквенсе в виде графиков

В нем реализована нейронная сеть, которая обучалась 2 вариантами:

Факторы на сиквенс

Факторы по окнам(30 нукл.)

Результаты обоих вариантов неудовлетворительны.

Page 10: Нахождение ориджинов в последовательности нуклеотидов
Page 11: Нахождение ориджинов в последовательности нуклеотидов
Page 12: Нахождение ориджинов в последовательности нуклеотидов

Результаты(2\2)Теоретический вклад

Известные “сильные” ORI-содержащие сиквенсы не отличаются от обычных по количеству или сосредоточению факторов => эти факторы слабо определяют, либо вовсе не определяют ORI

Page 13: Нахождение ориджинов в последовательности нуклеотидов

Контакты

Email: [email protected] Skype: berezovaya_brunka

Спасибо за внимание!