50
Aug 29-30 2017 1 NGS解析(初~中級) ゲノムアセンブリ後の各種解析 の補足資料(プラスアルファ) 2017.08.08版 東京大学・大学院農学生命科学研究科 アグリバイオインフォマティクス教育研究プログラム 寺田朋子、門田幸二 プラスアルファの内容です

NGS解析(初~中級)kadota/bioinfo_ngs_sokushu_2017/...2017/08/29  · Aug 29-30 2017 1 NGS解析(初~中級) ゲノムアセンブリ後の各種解析 の補足資料(プラスアルファ)

  • Upload
    others

  • View
    1

  • Download
    0

Embed Size (px)

Citation preview

Page 1: NGS解析(初~中級)kadota/bioinfo_ngs_sokushu_2017/...2017/08/29  · Aug 29-30 2017 1 NGS解析(初~中級) ゲノムアセンブリ後の各種解析 の補足資料(プラスアルファ)

Aug 29-30 2017 1

NGS解析(初~中級)ゲノムアセンブリ後の各種解析の補足資料(プラスアルファ)

2017.08.08版

東京大学・大学院農学生命科学研究科アグリバイオインフォマティクス教育研究プログラム

寺田朋子、門田幸二

プラスアルファの内容です

Page 2: NGS解析(初~中級)kadota/bioinfo_ngs_sokushu_2017/...2017/08/29  · Aug 29-30 2017 1 NGS解析(初~中級) ゲノムアセンブリ後の各種解析 の補足資料(プラスアルファ)

Contents Gepardでドットプロット

連載第8回W5-3で最も長いsequence1同士のドットプロットを実行できなかったが、Gepardというプログラムで実行可能。

動かせなかったらすぐに諦めるのではなく、「少ないメモリで動かせるもっといいプログラムがあるはず!」という視点で探すべし!

BlastViewerの新しいバージョンもある 連載第8回W7-2でBlastViewer ver. 2.2を利用したが、よく調べるとver. 5.2.0が存在します。

2Aug 29-30 2017

Page 3: NGS解析(初~中級)kadota/bioinfo_ngs_sokushu_2017/...2017/08/29  · Aug 29-30 2017 1 NGS解析(初~中級) ゲノムアセンブリ後の各種解析 の補足資料(プラスアルファ)

ウェブ検索

3Aug 29-30 2017

Googleで①それっぽいキーワードで検索した結果。②Wikipedia

のページを眺めてみる

Page 4: NGS解析(初~中級)kadota/bioinfo_ngs_sokushu_2017/...2017/08/29  · Aug 29-30 2017 1 NGS解析(初~中級) ゲノムアセンブリ後の各種解析 の補足資料(プラスアルファ)

Wikipediaのドットプロット

4Aug 29-30 2017

①ページ下部に移動

Page 5: NGS解析(初~中級)kadota/bioinfo_ngs_sokushu_2017/...2017/08/29  · Aug 29-30 2017 1 NGS解析(初~中級) ゲノムアセンブリ後の各種解析 の補足資料(プラスアルファ)

Wikipediaのドットプロット

5Aug 29-30 2017

①このあたりまで移動して、②Software

to create plotsのところで手を止める

Page 6: NGS解析(初~中級)kadota/bioinfo_ngs_sokushu_2017/...2017/08/29  · Aug 29-30 2017 1 NGS解析(初~中級) ゲノムアセンブリ後の各種解析 の補足資料(プラスアルファ)

Gepardよさそう

6Aug 29-30 2017

①H29年度講習会スライド94-で用いたseqinrというRパッケージもちゃんとリストアップされている。②genome scaleの大

きさの配列に対してもドットプロットしてくれる③Gepardというものもあるようだ

③②

Page 7: NGS解析(初~中級)kadota/bioinfo_ngs_sokushu_2017/...2017/08/29  · Aug 29-30 2017 1 NGS解析(初~中級) ゲノムアセンブリ後の各種解析 の補足資料(プラスアルファ)

原著論文もある

7Aug 29-30 2017

①PubMed上で、②「gepard dotplot」で検

索すると、③原著論文が見つかりました

① ②

Page 8: NGS解析(初~中級)kadota/bioinfo_ngs_sokushu_2017/...2017/08/29  · Aug 29-30 2017 1 NGS解析(初~中級) ゲノムアセンブリ後の各種解析 の補足資料(プラスアルファ)

原著論文もある

8Aug 29-30 2017

①ページ下部に移動すると、100回以

上引用されていることがわかります。②このURLにアクセスすればいいようだ

http://mips.gsf.de/services/analysis/gepard

Page 9: NGS解析(初~中級)kadota/bioinfo_ngs_sokushu_2017/...2017/08/29  · Aug 29-30 2017 1 NGS解析(初~中級) ゲノムアセンブリ後の各種解析 の補足資料(プラスアルファ)

Gepardのページ

9Aug 29-30 2017

①Gepardのページにアクセスしたとこ

ろ。②ここでも原著論文情報がありますね。③ページ下部に移動してプログラムをダウンロードできるところを探す

Krumsiek et al., Bioinformatics, 23: 1026-1028, 2007

Page 10: NGS解析(初~中級)kadota/bioinfo_ngs_sokushu_2017/...2017/08/29  · Aug 29-30 2017 1 NGS解析(初~中級) ゲノムアセンブリ後の各種解析 の補足資料(プラスアルファ)

GepardはJavaプログラム

10Aug 29-30 2017

①GepardはJavaプログラムであることがわかります。②Version

5.0以上という条件があるようです

① ②

Page 11: NGS解析(初~中級)kadota/bioinfo_ngs_sokushu_2017/...2017/08/29  · Aug 29-30 2017 1 NGS解析(初~中級) ゲノムアセンブリ後の各種解析 の補足資料(プラスアルファ)

Javaバージョン確認

11Aug 29-30 2017

Linux上でのJavaのバージョン確認は①「java -version」です(第4回W9-2)

Page 12: NGS解析(初~中級)kadota/bioinfo_ngs_sokushu_2017/...2017/08/29  · Aug 29-30 2017 1 NGS解析(初~中級) ゲノムアセンブリ後の各種解析 の補足資料(プラスアルファ)

Javaバージョン確認

12Aug 29-30 2017

①java version 1.7.0_79は、Java Runtime Environment 7.0という意味。②要求(5.0 or later)を満たしています

Page 13: NGS解析(初~中級)kadota/bioinfo_ngs_sokushu_2017/...2017/08/29  · Aug 29-30 2017 1 NGS解析(初~中級) ゲノムアセンブリ後の各種解析 の補足資料(プラスアルファ)

ダウンロード

13Aug 29-30 2017

①DOWNLOADの、②jar fileのところでクリック

して、(移動が楽なので共有フォルダに)③保存

① ②

見るだけ

Page 14: NGS解析(初~中級)kadota/bioinfo_ngs_sokushu_2017/...2017/08/29  · Aug 29-30 2017 1 NGS解析(初~中級) ゲノムアセンブリ後の各種解析 の補足資料(プラスアルファ)

ダウンロード

14Aug 29-30 2017

①共有フォルダ(~/Desktop/mac_share)上で、②Gepard-1.4.0.jarが見えていればOKですが…

見るだけ

Page 15: NGS解析(初~中級)kadota/bioinfo_ngs_sokushu_2017/...2017/08/29  · Aug 29-30 2017 1 NGS解析(初~中級) ゲノムアセンブリ後の各種解析 の補足資料(プラスアルファ)

ダウンロード

15Aug 29-30 2017

①backupディレクトリ(~/backup)上にも、②Gepard-1.4.0.jarがありますのでご安心ください

見るだけ

Page 16: NGS解析(初~中級)kadota/bioinfo_ngs_sokushu_2017/...2017/08/29  · Aug 29-30 2017 1 NGS解析(初~中級) ゲノムアセンブリ後の各種解析 の補足資料(プラスアルファ)

実行

16Aug 29-30 2017

①お約束の呪文(java –jar ファイル名)を唱えて起動。ここではLinux上で起動していますが、ホストOS上でダブルクリックでの起動でも構いません

Page 17: NGS解析(初~中級)kadota/bioinfo_ngs_sokushu_2017/...2017/08/29  · Aug 29-30 2017 1 NGS解析(初~中級) ゲノムアセンブリ後の各種解析 の補足資料(プラスアルファ)

実行

17Aug 29-30 2017

GepardのGUI版が起動します。①ここで比較したい2つのファイルを指定します。コマンドライン上での実行方法をまだ把握していません

Page 18: NGS解析(初~中級)kadota/bioinfo_ngs_sokushu_2017/...2017/08/29  · Aug 29-30 2017 1 NGS解析(初~中級) ゲノムアセンブリ後の各種解析 の補足資料(プラスアルファ)

実行

18Aug 29-30 2017

①両方に~/Desktop/mac_share/result/sequence1.faを指定したところ。②Create dotplot

Page 19: NGS解析(初~中級)kadota/bioinfo_ngs_sokushu_2017/...2017/08/29  · Aug 29-30 2017 1 NGS解析(初~中級) ゲノムアセンブリ後の各種解析 の補足資料(プラスアルファ)

作成中…

19Aug 29-30 2017

①作成中です。10秒ほどで…

Page 20: NGS解析(初~中級)kadota/bioinfo_ngs_sokushu_2017/...2017/08/29  · Aug 29-30 2017 1 NGS解析(初~中級) ゲノムアセンブリ後の各種解析 の補足資料(プラスアルファ)

作成完了

20Aug 29-30 2017

確かにsequence1同士のドットプロットをあっさりと描画してくれました!

Page 21: NGS解析(初~中級)kadota/bioinfo_ngs_sokushu_2017/...2017/08/29  · Aug 29-30 2017 1 NGS解析(初~中級) ゲノムアセンブリ後の各種解析 の補足資料(プラスアルファ)

部分的に拡大したい場合

21Aug 29-30 2017

①こんな感じでマウスドラッグで拡大したい領域を指定して、②update dotplot。

Page 22: NGS解析(初~中級)kadota/bioinfo_ngs_sokushu_2017/...2017/08/29  · Aug 29-30 2017 1 NGS解析(初~中級) ゲノムアセンブリ後の各種解析 の補足資料(プラスアルファ)

部分的に拡大したい場合

22Aug 29-30 2017

おお!

Page 23: NGS解析(初~中級)kadota/bioinfo_ngs_sokushu_2017/...2017/08/29  · Aug 29-30 2017 1 NGS解析(初~中級) ゲノムアセンブリ後の各種解析 の補足資料(プラスアルファ)

画像を保存したい場合

23Aug 29-30 2017

①Advanced mode

Page 24: NGS解析(初~中級)kadota/bioinfo_ngs_sokushu_2017/...2017/08/29  · Aug 29-30 2017 1 NGS解析(初~中級) ゲノムアセンブリ後の各種解析 の補足資料(プラスアルファ)

画像を保存したい場合

24Aug 29-30 2017

こんな感じになります。①下部に移動

Page 25: NGS解析(初~中級)kadota/bioinfo_ngs_sokushu_2017/...2017/08/29  · Aug 29-30 2017 1 NGS解析(初~中級) ゲノムアセンブリ後の各種解析 の補足資料(プラスアルファ)

画像を保存したい場合

25Aug 29-30 2017

①Export image

Page 26: NGS解析(初~中級)kadota/bioinfo_ngs_sokushu_2017/...2017/08/29  · Aug 29-30 2017 1 NGS解析(初~中級) ゲノムアセンブリ後の各種解析 の補足資料(プラスアルファ)

画像を保存したい場合

26Aug 29-30 2017

①jpeg形式で保存できるようですね。ここでは共有フォルダ上に保存します

Page 27: NGS解析(初~中級)kadota/bioinfo_ngs_sokushu_2017/...2017/08/29  · Aug 29-30 2017 1 NGS解析(初~中級) ゲノムアセンブリ後の各種解析 の補足資料(プラスアルファ)

画像を保存したい場合

27Aug 29-30 2017

①共有フォルダ上で、②seq1_115304と打って、③Save

Page 28: NGS解析(初~中級)kadota/bioinfo_ngs_sokushu_2017/...2017/08/29  · Aug 29-30 2017 1 NGS解析(初~中級) ゲノムアセンブリ後の各種解析 の補足資料(プラスアルファ)

画像を保存したい場合

28Aug 29-30 2017

無事保存されたようです。①OK

Page 29: NGS解析(初~中級)kadota/bioinfo_ngs_sokushu_2017/...2017/08/29  · Aug 29-30 2017 1 NGS解析(初~中級) ゲノムアセンブリ後の各種解析 の補足資料(プラスアルファ)

保存されたファイルは

29Aug 29-30 2017

①seq1_115304.jpegというファイル名になっていますね。②中身

Page 30: NGS解析(初~中級)kadota/bioinfo_ngs_sokushu_2017/...2017/08/29  · Aug 29-30 2017 1 NGS解析(初~中級) ゲノムアセンブリ後の各種解析 の補足資料(プラスアルファ)

Contents Gepardでドットプロット

連載第8回W5-3で最も長いsequence1同士のドットプロットを実行できなかったが、Gepardというプログラムで実行可能。

動かせなかったらすぐに諦めるのではなく、「少ないメモリで動かせるもっといいプログラムがあるはず!」という視点で探すべし!

BlastViewerの新しいバージョンもある 連載第8回W7-2でBlastViewer ver. 2.2を利用したが、よく調べるとver. 5.2.0が存在する、という話

30Aug 29-30 2017

Page 31: NGS解析(初~中級)kadota/bioinfo_ngs_sokushu_2017/...2017/08/29  · Aug 29-30 2017 1 NGS解析(初~中級) ゲノムアセンブリ後の各種解析 の補足資料(プラスアルファ)

W7-2:BlastViewer

Aug 29-30 2017 31

①Korilogというところが提供しているBlastViewerのウェブページ。②Windows版と③Macintosh版ともにver. 2.2。このページは、「blastviewer」でウェブ検索した上位に存在します

Page 32: NGS解析(初~中級)kadota/bioinfo_ngs_sokushu_2017/...2017/08/29  · Aug 29-30 2017 1 NGS解析(初~中級) ゲノムアセンブリ後の各種解析 の補足資料(プラスアルファ)

blastviewerで検索

Aug 29-30 2017 32

①「blastviewer」でウェブ検索した結果。さきほどの②Korilogというところが提供しているBlastViewerのウェブページはこちら。今着目しているBlastViewerver. 5.2.0は、③ページ下部にあります

Page 33: NGS解析(初~中級)kadota/bioinfo_ngs_sokushu_2017/...2017/08/29  · Aug 29-30 2017 1 NGS解析(初~中級) ゲノムアセンブリ後の各種解析 の補足資料(プラスアルファ)

blastviewerで検索

Aug 29-30 2017 33

①今着目しているBlastViewer ver. 5.2.0は、こちらのGitHubのサイト

Page 34: NGS解析(初~中級)kadota/bioinfo_ngs_sokushu_2017/...2017/08/29  · Aug 29-30 2017 1 NGS解析(初~中級) ゲノムアセンブリ後の各種解析 の補足資料(プラスアルファ)

GitHubのBlastViewer

Aug 29-30 2017 34

このGitHubのサイト上で、①Wiki

https://github.com/pgdurand/BlastViewer

Page 35: NGS解析(初~中級)kadota/bioinfo_ngs_sokushu_2017/...2017/08/29  · Aug 29-30 2017 1 NGS解析(初~中級) ゲノムアセンブリ後の各種解析 の補足資料(プラスアルファ)

GitHubのBlastViewer

Aug 29-30 2017 35

①Releases

https://github.com/pgdurand/BlastViewer/wiki

Page 36: NGS解析(初~中級)kadota/bioinfo_ngs_sokushu_2017/...2017/08/29  · Aug 29-30 2017 1 NGS解析(初~中級) ゲノムアセンブリ後の各種解析 の補足資料(プラスアルファ)

GitHubのBlastViewer

Aug 29-30 2017 36

①これ(blastviewer-5.2.0.jar)をダウンロードすれば使えます

https://github.com/pgdurand/BlastViewer/releases

Page 37: NGS解析(初~中級)kadota/bioinfo_ngs_sokushu_2017/...2017/08/29  · Aug 29-30 2017 1 NGS解析(初~中級) ゲノムアセンブリ後の各種解析 の補足資料(プラスアルファ)

Bio-Linux上でやると…

Aug 29-30 2017 37

①まずはGepardを終了

Page 38: NGS解析(初~中級)kadota/bioinfo_ngs_sokushu_2017/...2017/08/29  · Aug 29-30 2017 1 NGS解析(初~中級) ゲノムアセンブリ後の各種解析 の補足資料(プラスアルファ)

Bio-Linux上でやると…

Aug 29-30 2017 38

①Close

Page 39: NGS解析(初~中級)kadota/bioinfo_ngs_sokushu_2017/...2017/08/29  · Aug 29-30 2017 1 NGS解析(初~中級) ゲノムアセンブリ後の各種解析 の補足資料(プラスアルファ)

共有フォルダに移動

Aug 29-30 2017 39

この状態から、場所はどこでもいいといえばいいのですが、とりあえず共有フォルダに移動します

Page 40: NGS解析(初~中級)kadota/bioinfo_ngs_sokushu_2017/...2017/08/29  · Aug 29-30 2017 1 NGS解析(初~中級) ゲノムアセンブリ後の各種解析 の補足資料(プラスアルファ)

共有フォルダに移動

Aug 29-30 2017 40

①cd, pwd, ls

Page 41: NGS解析(初~中級)kadota/bioinfo_ngs_sokushu_2017/...2017/08/29  · Aug 29-30 2017 1 NGS解析(初~中級) ゲノムアセンブリ後の各種解析 の補足資料(プラスアルファ)

wget

Aug 29-30 2017 41

①「wget –c 」

Page 42: NGS解析(初~中級)kadota/bioinfo_ngs_sokushu_2017/...2017/08/29  · Aug 29-30 2017 1 NGS解析(初~中級) ゲノムアセンブリ後の各種解析 の補足資料(プラスアルファ)

wget

Aug 29-30 2017 42

①そのままjarファイルを共有フォルダにダウンロードするのでもよいが、ここでは右クリックで②ショートカットのコピーでwgetに必要なURL情報をコピーした

Page 43: NGS解析(初~中級)kadota/bioinfo_ngs_sokushu_2017/...2017/08/29  · Aug 29-30 2017 1 NGS解析(初~中級) ゲノムアセンブリ後の各種解析 の補足資料(プラスアルファ)

wget

Aug 29-30 2017 43

①Paste

Page 44: NGS解析(初~中級)kadota/bioinfo_ngs_sokushu_2017/...2017/08/29  · Aug 29-30 2017 1 NGS解析(初~中級) ゲノムアセンブリ後の各種解析 の補足資料(プラスアルファ)

wget

Aug 29-30 2017 44

①リターン

Page 45: NGS解析(初~中級)kadota/bioinfo_ngs_sokushu_2017/...2017/08/29  · Aug 29-30 2017 1 NGS解析(初~中級) ゲノムアセンブリ後の各種解析 の補足資料(プラスアルファ)

wget完了

Aug 29-30 2017 45

①lsで確かに約10MBのjarファイルがあることを確認。作業ディレクトリは共有フォルダなので?!、デフォルトでjarファイルに実行権限がついている

Page 46: NGS解析(初~中級)kadota/bioinfo_ngs_sokushu_2017/...2017/08/29  · Aug 29-30 2017 1 NGS解析(初~中級) ゲノムアセンブリ後の各種解析 の補足資料(プラスアルファ)

実行

Aug 29-30 2017 46

①jarファイルのありかはここなので、②cdでホームディレクトリに移動した状態でも、③のような感じで相対パス指定すればblastviewer-5.2.0.jarファイルを実行できます

Page 47: NGS解析(初~中級)kadota/bioinfo_ngs_sokushu_2017/...2017/08/29  · Aug 29-30 2017 1 NGS解析(初~中級) ゲノムアセンブリ後の各種解析 の補足資料(プラスアルファ)

GUI起動

Aug 29-30 2017 47

BlastViewer ver. 5.2.0起動直後の状態。①Openで、Blast実行結果のxml形式ファイル(sequence1_blast.xml)を読み込む

Page 48: NGS解析(初~中級)kadota/bioinfo_ngs_sokushu_2017/...2017/08/29  · Aug 29-30 2017 1 NGS解析(初~中級) ゲノムアセンブリ後の各種解析 の補足資料(プラスアルファ)

読み込み

Aug 29-30 2017 48

Blast実行結果のxml形式ファイル(sequence1_blast.xml)は、~/Desktop/mac_share/resultディレクトリにあります

Page 49: NGS解析(初~中級)kadota/bioinfo_ngs_sokushu_2017/...2017/08/29  · Aug 29-30 2017 1 NGS解析(初~中級) ゲノムアセンブリ後の各種解析 の補足資料(プラスアルファ)

読み込み

Aug 29-30 2017 49

①Blast実行結果のxml形式ファイル(sequence1_blast.xml)を選択して、②Open

Page 50: NGS解析(初~中級)kadota/bioinfo_ngs_sokushu_2017/...2017/08/29  · Aug 29-30 2017 1 NGS解析(初~中級) ゲノムアセンブリ後の各種解析 の補足資料(プラスアルファ)

読み込み後

Aug 29-30 2017 50

こんな感じ