27
指指指指 指指指 指指指指 961472 指指指 961531 指指指 Acetyllysine 與 Methyllysine 與與與

Acetyllysine 與 Methyllysine 之 分類

  • Upload
    donnel

  • View
    48

  • Download
    5

Embed Size (px)

DESCRIPTION

Acetyllysine 與 Methyllysine 之 分類. 指導老師:李宗 夷 專題 製作 : 961472 陳少川 961531 林世偉. Outline. Background Motivation Goal Materials and Methods Expected results. 專題研究背景. - PowerPoint PPT Presentation

Citation preview

Page 1: Acetyllysine 與  Methyllysine 之 分類

指 導 老 師 : 李 宗 夷 專 題 製 作 : 961472 陳 少 川

961531 林 世 偉

Acetyllysine 與 Methyllysine 之分類

Page 2: Acetyllysine 與  Methyllysine 之 分類

Outline

BackgroundMotivationGoalMaterials and MethodsExpected results

Page 3: Acetyllysine 與  Methyllysine 之 分類

專題研究背景

N-acetylation orchestrates a variety of cellular processes, including transcription regulation, DNA repair, apoptosis, cytokine signaling, and nuclear import.

N- 甲基離胺酸 (N-methyllysine) 被發現於肌凝蛋白 (myosin) 中,為一種與肌肉收縮有關之蛋白質。

Page 4: Acetyllysine 與  Methyllysine 之 分類

研究動機

Acetyllysine & Methyllysine 皆為蛋白質後轉譯修飾裡其中兩個重要的機制,若能預測出發生此兩機制的基因片段,對生物界以及醫學界都有很大的幫助。

Page 5: Acetyllysine 與  Methyllysine 之 分類

研究目的

在未處理的蛋白質序列中,預測出發生 Acetyllysine 或 Methyllysine 的基因片段。

Page 6: Acetyllysine 與  Methyllysine 之 分類

實驗材料

來源 Database : UniProt

蛋白質序列:會發生 Acetyllysine 有 2003 條會發生 Methyllysine 有 158 條

Page 7: Acetyllysine 與  Methyllysine 之 分類

實驗方法

先將會發生 Acetyllysine 和 Methyllysine 反應的蛋白質胺基酸序列一比例取出當作 independent( 測試樣本 ) ,剩下的用來做 trainning model 。

將給定發生分別會發生的 Acetyllysine 和Methyllysine 的 positive 的基因片段,用來對蛋白質序列刪選出 positive 和 negative 基因片段。

皆以 K 胺基酸為中心分別分段來分析,切成一定長度19/25 的 windows sizes 。

把重複的片段刪除。

Page 8: Acetyllysine 與  Methyllysine 之 分類

實驗方法

將基因片段作編碼 (feature)

Trainning model 使用 5-foldcross validation 後,再使用分類工具分類。

將 independent 加入 Trainning model 裡,使用5-foldcross validation ,再用分類工具分類。

評測結果

Page 9: Acetyllysine 與  Methyllysine 之 分類

System Flow

Page 10: Acetyllysine 與  Methyllysine 之 分類

評測方法

Negative

Positive

TN

TPFN FP Predict

Page 11: Acetyllysine 與  Methyllysine 之 分類

實作流程

Page 12: Acetyllysine 與  Methyllysine 之 分類

STEP1

Acetyllysine_protein 和 Methyllysine_protein中有重複的蛋白質序列 , 將重複的序列捨去Acetyllysine_protein 部分並留下Methyllysine_protein 的部分。

#Acetyllysine_protein 和 Methyllysin_proteine 重複的有 46 條。

Page 13: Acetyllysine 與  Methyllysine 之 分類

STEP2

將 STEP1 處理後的 Acetyllysine_protein 和 Methyllysine_protein 分別依比例以 1:5 取出,分成兩部份 independent 和 training 。

# 為了 independent 和 training model 都能取到

Page 14: Acetyllysine 與  Methyllysine 之 分類

比例 1:5

Page 15: Acetyllysine 與  Methyllysine 之 分類

STEP3

把給定的 Acetyllysine_pos 和 Methyllysine_pos中有完全相同的取出另存

# 會同時發生 Acetyllysine 和 Methyllysine 的 K ,在作分類的時候不易處理。

Page 16: Acetyllysine 與  Methyllysine 之 分類

STEP4

利用 step3 處理過的 Acetyllysine_pos 和Methyllysine_pos ,將 independent 和trainning model 的這兩類的蛋白質序列切windows size 。並分成 positive 和 negative

Page 17: Acetyllysine 與  Methyllysine 之 分類

取出 Positive & Negitive

將給定會發生 Acetyllysine/Methyllysine 反應的 K位置,將會發生反應的蛋白質序列片段篩選出Positive & Negative ,並把 Negative 部分取出另存。

Page 18: Acetyllysine 與  Methyllysine 之 分類

Windows sizes

將處理後的基因片段,皆以 K 胺基酸為中心分別分段來分析,切成每段 windows sizes 長度為 25 的胺基酸片段。

格式 : ID_ 位置 _ 基因片段 (fragment) 基因片段 : 以 K 胺基酸為中心,左右各 12 個胺基酸

Page 19: Acetyllysine 與  Methyllysine 之 分類

STEP5

切好後 WINDOWS SIZE 的independent_Acetyllysine_SEQ 和independent_Methyllysine_SEQ 刪除重複片段。

Trainning Model 亦將兩類作同樣處理。

Page 20: Acetyllysine 與  Methyllysine 之 分類

STEP6

上步處理重複後的independent_Acetyllysine_SEQ 和independent_Methyllysine_SEQ 轉編碼合併成independent 部分。

上步處理重複後的 train_Acetyllysine_SEQ 和 train_Methyllysine_SEQ 轉編碼合併成 trainning Model 部分。

Page 21: Acetyllysine 與  Methyllysine 之 分類

編碼 1- 0 / 1

將 20 種胺基酸以 0 和 1 為組成,組成 20 個不同的編碼。

格式 : 屬性 (pos/neg)_ 編碼 1_1: 0 _2:1_~~499:1_500:0 #windos sizes 長度為 25 所以有 25*20=500 個編碼數屬性 :pos/neg pos 為 1 neg 為 2

Page 22: Acetyllysine 與  Methyllysine 之 分類

編碼 2-BLOSUM62

格式 : 屬性 _ 編碼屬性 :pos/neg (pos 為 1 neg 為 2)編碼 : 給定的編碼對照表 長度 25*20

Page 23: Acetyllysine 與  Methyllysine 之 分類

編碼 - 範例

範例 CST 1:9_2:-1_3:-1_4:-3_......_19:-2_20:-2_21:-

1_22:4_......._39:-2_40:-3_41:-1_42:1_......_59:-2_60:-3

Page 24: Acetyllysine 與  Methyllysine 之 分類

  C S T P A G N D E Q H R K M I L V F Y W

C 9 -1 -1 -3 0 -3 -3 -3 -4 -3 -3 -3 -3 -1 -1 -1 -1 -2 -2 -2

S -1 4 1 -1 1 0 1 0 0 0 -1 -1 0 -1 -2 -2 -2 -2 -2 -3

T -1 1 4 1 -1 1 0 1 0 0 0 -1 0 -1 -2 -2 -2 -2 -2 -3

P -3 -1 1 7 -1 -2 -1 -1 -1 -1 -2 -2 -1 -2 -3 -3 -2 -4 -3 -4

A 0 1 -1 -1 4 0 -1 -2 -1 -1 -2 -1 -1 -1 -1 -1 -2 -2 -2 -3

G -3 0 1 -2 0 6 -2 -1 -2 -2 -2 -2 -2 -3 -4 -4 0 -3 -3 -2

N -3 1 0 -2 -2 0 6 1 0 0 -1 0 0 -2 -3 -3 -3 -3 -2 -4

D -3 0 1 -1 -2 -1 1 6 2 0 -1 -2 -1 -3 -3 -4 -3 -3 -3 -4

E -4 0 0 -1 -1 -2 0 2 5 2 0 0 1 -2 -3 -3 -3 -3 -2 -3

Q -3 0 0 -1 -1 -2 0 0 2 5 0 1 1 0 -3 -2 -2 -3 -1 -2

H -3 -1 0 -2 -2 -2 1 1 0 0 8 0 -1 -2 -3 -3 -2 -1 2 -2

R -3 -1 -1 -2 -1 -2 0 -2 0 1 0 5 2 -1 -3 -2 -3 -3 -2 -3

K -3 0 0 -1 -1 -2 0 -1 1 1 -1 2 5 -1 -3 -2 -3 -3 -2 -3

M -1 -1 -1 -2 -1 -3 -2 -3 -2 0 -2 -1 -1 5 1 2 -2 0 -1 -1

I -1 -2 -2 -3 -1 -4 -3 -3 -3 -3 -3 -3 -3 1 4 2 1 0 -1 -3

L -1 -2 -2 -3 -1 -4 -3 -4 -3 -2 -3 -2 -2 2 2 4 3 0 -1 -2

V -1 -2 -2 -2 0 -3 -3 -3 -2 -2 -3 -3 -2 1 3 1 4 -1 -1 -3

F -2 -2 -2 -4 -2 -3 -3 -3 -3 -3 -1 -3 -3 0 0 0 -1 6 3 1

Y -2 -2 -2 -3 -2 -3 -2 -3 -2 -1 2 -2 -2 -1 -1 -1 -1 3 7 2

W -2 -3 -3 -4 -3 -2 -4 -4 -3 -2 -2 -3 -3 -1 -3 -2 -3 1 2 11

Page 25: Acetyllysine 與  Methyllysine 之 分類

STEP7

trainning Model 和 independent 用 5-fold Cross Validation 做 quickrbf 分類處理。

Page 26: Acetyllysine 與  Methyllysine 之 分類

評測預測結果

將 QuickRBF 分類器分類出來的預測結果和positive 發生反應的胺基酸片段作資料作比對,將比對的結果作統計機率的分析,算出評測的效果表現。

Page 27: Acetyllysine 與  Methyllysine 之 分類

實驗結果