1
ユーザーによる処理の追加可能なproteome解析プラットフォームJobRequestそれを利用したタンパク質同定ツールProteoAnalysis MSSJ2013 3P - 04 ○田畑剛 1 ・吉沢明康 2 ・山本昇 1 ・青島健 1 ・小田吉哉 1 ・梶原茂樹 2 ・田中耕一 2 1:エーザイ株式会社 バイオマーカー&パーソナライズドメディスン機能ユニット 2:島津製作所 田中最先端研究所 Tsuyoshi Tabata 1 , Akiyasu C. Yoshizawa 2 , Noboru Yamamoto 1 , Ken Aoshima 1 , Yoshiya Oda 1 , Shigeki Kajihara 2 , Koichi Tanaka 2 1:Biomarkers and Personalized Medicine, Eisai Product Creation Systems, 2:Koichi Tanaka Laboratory of Advanced Science and Technology, Shimadzu Corporation JobRequest and ProteoAnalysis an user-customizable bioinformatics software platform for proteomics analysis and its application for protein identification 1. Introduction クライアント サーバー ssh XMLHttpRequest 2.JobRequestの概要 解析処理実行部 Job制御部 開発言語 HTML5, JavaScript (for Client) PHP, Ruby (for Server) スクリプト言語のみで開発可能 クライアントからサーバーにJobが登録されると 自動でCPU負荷の低いノードを使い 複数の処理を並列に実行します。 5. Summary ・このJobRequestプラットフォームを使うことで、実際の解析処理部分のプログラミングのみで、システムを作成 することが出来た。 HTML5 JavaScriptの画面部分の知識が不要) ・既知PTMの検索の高速化と、PTM情報の根拠となったジャーナル情報を表示可能なシステムを構築できた。 本研究は、日本学術振興会の最先端研究開発支援(FIRST) プログラムによる助成を受けて行われた。 Acknowledgment X!Tandem 検索のJob要求画面(PTM search : ONProteoAnalysisを使いJobを実行 X!Tandemの実行 (アミノ酸の重量変更) Amide Acetyl Hydroxy Methyl Phospho AccNum : sp|Q9H1E3|NUCKS_HUMAN ProtName : Nuclear ubiquitous casein and cyclin-dependent kinases substrate OS=Homo sapiens GN=NUCKS1 PE=1 SV=1 Seq : VVDYSQFQESDDADEDYGRDSGPPTK Mod : Phospho (S) ModPosition : 79.9663@S:10 JournalInfo : [Journal Article (2004) PMID: 15302935 Cervix carcinoma] Large-scale characterization of HeLa cell nuclear phosphoproteins. SearchResult.csv PubMedへのリンク 1回のjobで実行された、複数の生 データの検索結果が、単一のcsv ファイルとして得られます。 このファイルはExcelを使って開くこ とができます。 Access to http://www.first-ms3d.jp/english/achievement/software X!Tandem用のFASTAに変換 XXXX.fasta.pro files Hydroxy Amide Methyl Phospho Acetyl [ベースとなったアイディア] ①既知の修飾情報(Swiss-Prot FASTAファイルへの変換フロー 既知のPTM(以下、リン酸化とする)について あり得るペプチド配列のバリエーションを生成 ペプチド配列中の リン酸化セリン(S)Bリン酸化スレオニン(T)Oリン酸化チロシン(Y)Zに置き換える 酵素(トリプシンなど)消化で生じるペプチドを生成する missed cleavage1以下としておく) 3. JobRequestを適応したアプリケーション : ProteoAnalysis Jobコントロール用定義ファイル ⑥パラメータ設定用定義ファイル X!Tandem実行用スクリプト JobRequestへの適応 X!TandemMSPTM-DBの作成 Reference [1] Anal. Chem.; (2003) 75:768-774. 皆さんは実験データの解析にどのようなソフトウエアを使用されているでしょうか。 販売されている解析ソフトウエアでは、自分のアイディアを形に出来なく、不満をお持ちではありませんでしょうか? 実行ノード ・翻訳後修飾の従来法variable modification法では、多数の仮想配列を メモリ中に生成するため、計算時間やE- valueなどに問題が生じることが多い。 ・そこで、「検索エンジンで使われていない アミノ酸コード(B, O, Zなど)を、「修飾さ れたアミノ酸」を表す記号として用いる MSPTM-DB )ことによって、既知の修飾 を通常法で高速検索できないか。 このアイディアをJobRequestを使い実装した。 我々は、解析アイディアのプログラミングと実行を比較的簡単に行える、解析プラットフォーム『JobRequest』を作成し ました。 このプラットフォームは、実際の解析処理とは関係のない、ハードウェアの管理などを全て自動で処理します。このた め、作成した解析フローをこのプラットフォーム上で実行すると、複数のPCに自動的に処理を分散して解析が実行さ れます。 今回、このプラットフォームを用いた開発の実例として、我々のプロテオーム解析のアイディアを webツールとして作 成しました。 4. 適用MSシステムの拡大 (1) Thermo ScientificQ-Exactive + 独自のPeak Picking + Mascot (2) AB SciexTripleTOF 5600 + 独自のPeak Picking + Mascot/ProteinPilot (京都大学薬学研究科 石濱研究室と連携して研究進行中)

それを利用したタンパク質同定ツールProteoAnalysis ......ユーザーによる処理の追加可能なproteome解析プラットフォームJobRequestと それを利用したタンパク質同定ツールProteoAnalysis

  • Upload
    others

  • View
    2

  • Download
    0

Embed Size (px)

Citation preview

  • ユーザーによる処理の追加可能なproteome解析プラットフォームJobRequestと それを利用したタンパク質同定ツールProteoAnalysis

    MSSJ2013 3P - 04

    ○田畑剛1・吉沢明康2・山本昇1・青島健1・小田吉哉1・梶原茂樹2・田中耕一2 1:エーザイ株式会社 バイオマーカー&パーソナライズドメディスン機能ユニット 2:島津製作所 田中最先端研究所

    ○ Tsuyoshi Tabata1, Akiyasu C. Yoshizawa 2, Noboru Yamamoto 1, Ken Aoshima 1, Yoshiya Oda 1, Shigeki Kajihara 2, Koichi Tanaka 2 1:Biomarkers and Personalized Medicine, Eisai Product Creation Systems, 2:Koichi Tanaka Laboratory of Advanced Science and Technology, Shimadzu Corporation

    JobRequest and ProteoAnalysis – an user-customizable bioinformatics software platform for proteomics analysis and its application for protein identification

    1. Introduction

    クライアント サーバー

    ssh XMLHttpRequest

    2.JobRequestの概要

    解析処理実行部 Job制御部 開発言語 HTML5, JavaScript (for Client)

    PHP, Ruby (for Server)

    スクリプト言語のみで開発可能

    クライアントからサーバーにJobが登録されると 自動でCPU負荷の低いノードを使い 複数の処理を並列に実行します。

    5. Summary

    ・このJobRequestプラットフォームを使うことで、実際の解析処理部分のプログラミングのみで、システムを作成することが出来た。 ( HTML5 やJavaScriptの画面部分の知識が不要) ・既知PTMの検索の高速化と、PTM情報の根拠となったジャーナル情報を表示可能なシステムを構築できた。 本研究は、日本学術振興会の最先端研究開発支援(FIRST)

    プログラムによる助成を受けて行われた。

    Acknowledgment

    ⑦X!Tandem 検索のJob要求画面(PTM search : ON) ProteoAnalysisを使いJobを実行

    ⑧X!Tandemの実行 (アミノ酸の重量変更)

    Amide Acetyl

    Hydroxy Methyl

    Phospho

    AccNum : sp|Q9H1E3|NUCKS_HUMAN

    ProtName : Nuclear ubiquitous casein and cyclin-dependent kinases

    substrate OS=Homo sapiens GN=NUCKS1 PE=1 SV=1

    Seq : VVDYSQFQESDDADEDYGRDSGPPTK

    Mod : Phospho (S)

    ModPosition : 79.9663@S:10

    JournalInfo : [Journal Article (2004) PMID: 15302935 Cervix carcinoma]

    Large-scale characterization of HeLa cell nuclear

    phosphoproteins.

    ⑨SearchResult.csv ⑩PubMedへのリンク

    1回のjobで実行された、複数の生データの検索結果が、単一のcsvファイルとして得られます。 このファイルはExcelを使って開くことができます。

    Access to

    http://www.first-ms3d.jp/english/achievement/software

    ③X!Tandem用のFASTAに変換 (XXXX.fasta.pro files )

    Hydroxy

    Amide Methyl

    Phospho Acetyl

    [ベースとなったアイディア] ①既知の修飾情報(Swiss-Prot ) ② FASTAファイルへの変換フロー

    既知のPTM(以下、リン酸化とする)について あり得るペプチド配列のバリエーションを生成

    ペプチド配列中の リン酸化セリン(S)をBに リン酸化スレオニン(T)をOに

    リン酸化チロシン(Y)をZに置き換える

    酵素(トリプシンなど)消化で生じるペプチドを生成する (missed cleavageは1以下としておく)

    3. JobRequestを適応したアプリケーション : ProteoAnalysis

    ⑤Jobコントロール用定義ファイル

    ⑥パラメータ設定用定義ファイル

    ④X!Tandem実行用スクリプト

    JobRequestへの適応 X!Tandem用MSPTM-DBの作成

    Reference

    [1] Anal. Chem.; (2003) 75:768-774.

    皆さんは実験データの解析にどのようなソフトウエアを使用されているでしょうか。 販売されている解析ソフトウエアでは、自分のアイディアを形に出来なく、不満をお持ちではありませんでしょうか?

    実行ノード

    ・翻訳後修飾の従来法variable modification法では、多数の仮想配列をメモリ中に生成するため、計算時間やE-valueなどに問題が生じることが多い。 ・そこで、「検索エンジンで使われていないアミノ酸コード(B, O, Zなど)を、「修飾されたアミノ酸」を表す記号として用いる(MSPTM-DB )ことによって、既知の修飾を通常法で高速検索できないか。

    このアイディアをJobRequestを使い実装した。

    我々は、解析アイディアのプログラミングと実行を比較的簡単に行える、解析プラットフォーム『JobRequest』を作成しました。 このプラットフォームは、実際の解析処理とは関係のない、ハードウェアの管理などを全て自動で処理します。このため、作成した解析フローをこのプラットフォーム上で実行すると、複数のPCに自動的に処理を分散して解析が実行されます。 今回、このプラットフォームを用いた開発の実例として、我々のプロテオーム解析のアイディアをwebツールとして作成しました。

    4. 適用MSシステムの拡大

    (1) Thermo Scientific社 Q-Exactive + 独自のPeak Picking + Mascot (2) AB Sciex社 TripleTOF 5600 + 独自のPeak Picking + Mascot/ProteinPilot (京都大学薬学研究科 石濱研究室と連携して研究進行中)