56
へへへへへへへ DRA へへへへへへへ 1. へへへへへへへへ DRA --- 3 2. DRA へへへへへへへ --- 6 3. BioProject へへへ --- 12 4. BioSample へへへ --- 25 5. RA へへへへ --- 43 6. へへ --- 55

Ddbj all ver3

Embed Size (px)

Citation preview

Page 1: Ddbj all ver3

DRAへのデータ登録

登録までの流れ

1. DRAアカウントの取得---   32. DRA 登録のイメージ --- 6   3. BioProject の登録 --- 124. BioSample の登録 ---  255. D RA への登録  ---  436. 備考 ---  55

Page 2: Ddbj all ver3

注意1:アスタリスク ( * ) は、必須項目です。

注意4:すべて入力は英語です。

登録前の注意点

注意2:この資料は、必須項目についてのみ解説しています。      optional な部分については、補足説明していません。

注意5:より詳細な内容は、 DRA Handbookをご覧ください。

注意3:この資料は、 Illumina MiSeq を用いた標準的なアンプリ     コン解析と微生物ドラフトゲノム解析のデータを登録する     と仮定して作製しています。

Page 3: Ddbj all ver3

1.  D RA アカウントの取得

Page 4: Ddbj all ver3

DRA アカウントの取得

①  登録ポータル D-wayにアクセスします。

②  クリック ③  必須項目を記入し、クリック

④  入力した内容を確認し、クリック

入力されたアドレス宛に確認メールが送信されま

す。メールに記載されている

URL を選択します。⑤  パスワードを設

定し、"Set" をクリック

アカウントの仮登録完了!

次に所属と公開鍵を登録します。

Page 5: Ddbj all ver3

所属と公開鍵の登録

Center Full Name: 組織名を入力し,提示される候

補から選択します。

組織名を記入後、 "Updata" をクリック

Center Name が登録されると、下部に "Public Key" が表示されます。公開鍵ファイルを参照し、 [Register public key] で公開鍵を登録します。

公開鍵の作成方法は、 DDBJ の " 公開鍵/秘密鍵ペアの生成" や京都大学学術情報メディアセンターをご覧ください。

Page 6: Ddbj all ver3

2.   DRA 登録のイメージ

Page 7: Ddbj all ver3

DRA登録のイメージ

メタデータ ランデータ

関連付け

・シークエンスデータ  *.fastq

・サブミッション情報 Submission・研究情報 Study ( =BioProject )・サンプル情報 Sample ( =BioSample )・実験情報 Experiment・ラン情報 Run

プロジェクトデータ

・研究情報 BioProject・サンプル情報 BioSample

関連付け ① BioProject と BioSample の登録

② ランデータを DDBJ のサーバに転送③ サンプル情報とデータの関連付け

Page 8: Ddbj all ver3

Run

Experiment

*.fastq

Run

Experiment

*.fastq

Run

Experiment

*.fastq

Run

Experiment

*.fastq

Run

Experiment

*.fastq

Run

Experiment

*.fastq

Run

Experiment

*.fastq

Run

Experiment

*.fastq

Run

Experiment

*.fastq

Run

Experiment

*.fastq

Run

Experiment

*.fastq

Run

Experiment

*.fastq

Run

Experiment

*.fastq

Run

Experiment

*.fastq

Run

Experiment

*.fastq

Run

Experiment

*.fastq

異なる 16 地点の土壌から DNA 抽出を行い、 SSU rRNA アンプリコン解析を行った場合

BioSampleBioSampleBioSampleBioSample

BioProject

BioSampleBioSampleBioSampleBioSampleBioSampleBioSampleBioSampleBioSample

BioSampleBioSampleBioSampleBioSample

1 つの BioSample に対し、それぞれExperiment と Run を1つずつ関連付けま

す。

メタデータの構成の具体例 その 1

Page 9: Ddbj all ver3

異なる 4 地点の土壌から DNA 抽出を行い、 4 つの biological or technical replicate で SSU rRNA アンプリコン解析した場合

BioSampleBioSampleBioSampleBioSample

BioProject

ExperimentExperimentExperimentExperiment

Run Run Run Run

*.fastq *.fastq *.fastq *.fastq

x 4

1 つの BioSample に対し、それぞれ Experiment と Run を 4 つずつ関

連付けます。

メタデータの構成の具体例 その 2

Page 10: Ddbj all ver3

メタデータの構成の具体例 その 3

1種類のバクテリアのドラフトゲノム解読を 1 種類のライブラリーを用いて行った場合

BioSample

BioProject

Experiment

Run

*.fastq

1 つの BioSample に対し、それぞれExperiment と Run を 1 つずつ関連付けま

す。

Page 11: Ddbj all ver3

1種類のバクテリアのドラフトゲノム解読を 2 種類のライブラリーを用いて行った場合

BioSample

BioProject

Experiment

Run

*.fastq

1 つの BioSample に対し、それぞれExperiment と Run を 2 つずつ関連付けま

す。

Experiment

Run

*.fastq

メタデータの構成の具体例 その 4

Page 12: Ddbj all ver3

3.   BioProject の登録

Page 13: Ddbj all ver3

BioProject の作成

D-way にログインすると、以下のような画面が表示されます。

① クリック

② クリックして、新しいプロジェクトIDを作成

③ 作成されたIDをクリック

Page 14: Ddbj all ver3

BioProject の登録 – SUBMITTER –

記入後、クリック

Name: 氏名を記入します。

E-mail: メールアドレスを記入します。

Submitting organization: 所属名を記入します。

Data release: データ公開の有無を選択しま

す。

Page 15: Ddbj all ver3

BioProject の登録 – GENERAL INFO –

Project title: プロジェクト名を記入します。

Description: 研究目的や実験手法を記述します。第三者がデータを解釈することができるように十分な量( 100 文字以上)の情報を記入

します。

記入後、クリック

Page 16: Ddbj all ver3

BioProject の登録 – PROJECT TYPE –

アンプリコン解析とドラフトゲノム解析によって

BioProject の登録方法が異なります。

Page 17: Ddbj all ver3

BioProject の登録 – PROJECT TYPE –

アンプリコン解析の場合

Page 18: Ddbj all ver3

BioProject の登録 –アンプリコン解析–

Project data type:Metagenome を選択します。

記入後、クリック

Objective:Raw Sequence Reads を選択

します。

名称 選択項目Sample scope Environment

Material Genome

Capture Targeted Locus/Loci

Methodology Sequencing

Page 19: Ddbj all ver3

BioProject の登録 –アンプリコン解析–

Environmental sample name: Taxonomy Browserの中から、

適切な項目を選択し、記入します。

Environmental sample description:サンプル情報の詳細を記入します。

記入後、クリック

Page 20: Ddbj all ver3

BioProject の登録 – PROJECT TYPE –

ドラフトゲノム解析の場合

Page 21: Ddbj all ver3

BioProject の登録 –ドラフトゲノム解析–

Project data type:Genome Sequencing を

選択します。

選択後、クリック

Objective:Raw Sequence Reads を

選択します。

名称 選択項目Sample scope 単離された微生物の場合、

Monoisolate を選択します。 Material Genome

Capture whole

Methodology Sequencing

Page 22: Ddbj all ver3

BioProject の登録 –ドラフトゲノム解析–

Organism name: 生物種名を記入する。 Taxonomy IDは自動的に対応したIDが記載さ

れます。

記入後、クリック

Page 23: Ddbj all ver3

BioProject の登録 – PUBLICATION–

記入後、クリックPublication:

既に論文が受理されていれば、記入することができる(任意)。

Page 24: Ddbj all ver3

BioProject の登録 – OVERVIEW–

最後に [Submit] ボタンをクリックした後、 D-way 上で修正は出来ません。修正される場合は、メール ([email protected]) で申請する必要があります。アノテータが査定を行ってから、 BioProject ID を発行するため、少しお時間がかかります。

内容確認後、クリック

Page 25: Ddbj all ver3

4.   BioSample の登録

Page 26: Ddbj all ver3

BioSample の登録

D-way にログインすると、以下のような画面が表示されます。

① クリック

② クリックして、新しいプロジェクトIDを作成

③ 作成されたIDをクリック

BioSample の作成

Page 27: Ddbj all ver3

記入後、クリック

Name: 氏名を記入します。

E-mail: メールアドレスを記入します。

Submitting organization: 所属名を記入します。

BioSample の登録BioSample の登録  -SUBMITTER-

Page 28: Ddbj all ver3

BioSample の登録

選択後、クリック

Hold / Release: データ公開の有無を選択しま

す。

BioSample の登録 – GENERAL INFO-

Page 29: Ddbj all ver3

BioSample の登録

アンプリコン解析とドラフトゲノム解析によって

BioSample の登録方法が異なります。

BioSample の登録 – SAMPLE TYPE-

Page 30: Ddbj all ver3

BioSample の登録

アンプリコン解析の場合

BioSample の登録 – SAMPLE TYPE-

Page 31: Ddbj all ver3

BioSample の登録

Core Package:Survey related Marker Sequences

を選択します。

Environmental package: どのような環境中のサンプルを採取したかを選択します。

選択後、クリック

BioSample の登録 -SAMPLE TYPE-

Page 32: Ddbj all ver3

BioSample の登録

ドラフトゲノム解析の場合

BioSample の登録 -SAMPLE TYPE-

Page 33: Ddbj all ver3

BioSample の登録

Core Package:バクテリアのドラフトゲノム解析の場合は、 Cultured Bacterial/ Archaeal Genomic

Sequences を選択します。

Environmental package: 自動的に No package が選択されます。

選択後、クリック

BioSample の登録 -SAMPLE TYPE-

Page 34: Ddbj all ver3

BioSample の登録

① クリック

③ 次項以降の情報を参考に表計算ソフト上で必須項目を記入し、「テキスト(タブ区切り)」形式で保存します。

② ダウンロードされたファイルを「 Excel」や「 Numbers」などの表計算ソフトで開きます。

④ 保存したファイルを選択します。

⑤ 選択後、クリック

BioSample の登録 -ATTRIBUTES-

Page 35: Ddbj all ver3

注意 9 :必須ではない空欄項目列は、削除せずにそのまま残します。

BioSample の登録

注意 6 :1地点から、 biological replicate 3反復とった場合は、 BioSample の登録は1つで良いが、異なる 3 地点から、 biological replicate 3反復とった場合は、 1 つの BioSample 登録内に 3つの Sample を登録する必要があります。注意 7 :アスタリスク( * )は、必須項目です。登録するサンプルによって、必須項目が異なります。注意 8 :必須項目でも該当しない場合やわからない場合は、 "NA" や "unknown" と記入することができます。

BioSample の登録 -ATTRIBUTES- の注意点

例)

削除しない。

Page 36: Ddbj all ver3

BioSample の登録BioSample の登録 -ATTRIBUTES-

名称 内容 例sample_name sample name は登録者がサンプルに付け

た任意の ID です。Soli_1 、 Water_2

sample_title サンプルタイトルは、サンプルをよく表す簡潔なものを記入します。

Sapporo_soli_1 、 Tokyo_soli_2

organism Taxonomy Browser ( メタゲノム解析用 )や Taxonomy Browser ( ドラフトゲノム解析用 ) の中から、適切な項目を選択します。

soil metagenome 、 fish gut metagenome 、 Escherichia coli K-12

taxonomy_id organism に対応した taxonomy_idを記入します。

410658 、 1602388

collection_date サンプルを採取した日付 を記入します。2008-01-23T19:23:10 、 2008-01-23

Page 37: Ddbj all ver3

BioSample の登録BioSample の登録 -ATTRIBUTES-

名称 内容 例env_biome サンプルに関する広い生態学的な環境を

記入します。 biomeの中から適切な項目を探し、記入します。

grassland biome, desert biome, woodland biome

env_feature 周辺の空間へ強い影響を及ぼしている実体 を 環 境 を 記 入 し ま す 。environmental featureの中から適切な項目を探し、記入します。

grassland soil, woodland

env_material ここでは、質量や体積、環境に含まれる媒 体 の 他 の 部 分 を 表 す 。environmental materialの中から適切な項目を探し、記入します。

farm soil, underground water, marine mud

geo_loc_name サンプルを得た地域を記入します。 Japan:Kanagawa, Atsugi, The Sagami River

Page 38: Ddbj all ver3

BioSample の登録BioSample の登録 -ATTRIBUTES-

名称 内容 例lat_lon サンプルが採取された位置の地理的座標

を記入します。小数点以下の数字は分秒ではなく小数で記入します。

"47.94 N 28.12 W", "45.0123 S 4.1234 E"

project_name 全体のプロジェクトを記載した簡潔な名称を記入します。

Genome analysis of ****

depth 地表表面からの距離を記入します。 one meters below ground

elev 標高を記入します。 324 m

isol_growth_condt 単離や生育条件の詳細を記載している

pubmed ID 、 DOIあるいは URL を記入します。

PMID: **********

ref_biomaterial Primary publication か primary genome report の pubmed ID 、 DOIあるいは URLを記入します。

doi: ***************

num_replicons 真核生物の核ゲノム、微生物のゲノムにおけるレプリコンの数、セグメント化されたウィルスにおけるセグメントの数を記入します。

1

Page 39: Ddbj all ver3

BioSample の登録

内容確認後、クリック

登録した内容が、表示されます。

BioSample の登録 -ATTRIBUTES-

Page 40: Ddbj all ver3

BioSample の登録

記入後、クリック Publication: 既に論文が受理されていれば、

記入することができます(任意)。

BioSample の登録 – PUBLICATION-

Page 41: Ddbj all ver3

BioSample の登録

記入後、クリック Comments: DDBJ スタッフに対してコメン

トがあれば記入します(任意)。

BioSample の登録 – COMMENTS-

Page 42: Ddbj all ver3

BioSample の登録 -OVERVIEW-

最後に [Submit] ボタンをクリックした後、 D-way 上で修正は出来ません。内容を変更する場合は、メール ([email protected]) に て 、お知ら せ て く だ さ い 。 アノ テ ー タ が査定 を 行 っ て から、 BioSample ID が発行されるため、少しお時間がかかります。

内容確認後、クリック

Page 43: Ddbj all ver3

5. D RA への登録

※ BioProject と BioSample ID の取得が完了していないと、 DRA に登録できません。

Page 44: Ddbj all ver3

メタデータの作成

① クリック

② "Create new Submission" クリックし、新しい Submission を作成します。

③ 作成された Submission を選択します。

④ Submission を編集します。

Page 45: Ddbj all ver3

シークエンスデータのアップロード

弊社が送付した生データ (*.fastq) を DDBJ のサーバに転送します。データは、作成した Submission ID 名の下に保存します。

転送方法は DRA Handbookをご覧ください。

※ BioProject と BioSample ID の取得とシークエンスデータ( Run data )のアップロードが完了していないと、このあとのデータ登録ができません。

Page 46: Ddbj all ver3

Run

Experiment

*.fastq

Run

Experiment

*.fastq

Run

Experiment

*.fastq

Run

Experiment

*.fastq

Run

Experiment

*.fastq

Run

Experiment

*.fastq

Run

Experiment

*.fastq

Run

Experiment

*.fastq

Run

Experiment

*.fastq

Run

Experiment

*.fastq

Run

Experiment

*.fastq

Run

Experiment

*.fastq

Run

Experiment

*.fastq

Run

Experiment

*.fastq

Run

Experiment

*.fastq

Run

Experiment

*.fastq

メタデータのイメージ ~おさらい~

異なる 16 地点からそれぞれ 1 サンプル毎に解析した場合

BioSampleBioSampleBioSampleBioSample

BioProject

異なる 4 地点からそれぞれ 4 つの biological or technical replicate を解析した場合

BioSampleBioSampleBioSampleBioSample

BioProject

BioSampleBioSampleBioSampleBioSampleBioSampleBioSampleBioSampleBioSample

BioSampleBioSampleBioSampleBioSample

ExperimentExperimentExperimentExperiment

Run Run Run Run

*.fastq *.fastq *.fastq *.fastq

x 4

1 つの BioSample に対し、 Experiment と Run を1つずつ関連付けます。

1 つの BioSample に対し、 Experiment と Run を4 つずつ関連付けます。

Page 47: Ddbj all ver3

メタデータの作成  -Submission-

Center Name, Lab Name: アカウント作成時に登録した

Center が記入されています。 Lab Name には、詳細な所属を記入し

ます。 

Submitter: 氏名と E-mail アドレスを記入しま

す。

Hold Until: データ公開日の設定します。最長2年後まで設定することができま

す。

記入後、クリック

申請者を追加することができます

Page 48: Ddbj all ver3

メタデータの作成 -Study-

BioProject ID:BioProject を登録しないと、ここに表示されません。登録には数日かかります、お早目に BioProject を登録することをお

勧め致します。 

選択後、クリック

Page 49: Ddbj all ver3

メタデータの作成 -Sample-

BioSample ID:Ctrlキーを押しながらクリックすると、複数の BioSample ID を選

択可能です。 BioSample を登録しないと、ここに表示されません。登録には数日かかります、お早目に BioSample を登録することを

お勧め致します。 

選択後、クリック

Page 50: Ddbj all ver3

メタデータの作成 -Experiment-

Library Name: 任意のライブラリー名を記入

します。

Library Source: ライブラリー構築に用いた試料。アンプリコン解析

( Metagenomic )、ドラフトゲノム解析( Genomic )を選択します。Library Selection:

ライブラリー作成時に用いたサンプルの選別や濃縮方法。アンプリコン解析( PCR )、ドラフトゲノム解析

( RANDOM )を選択します。

Library Strategy:ライブラリーの構築手法。

アンプリコン解析( AMPLICON )、ドラフトゲ

ノム解析( WGS )を選択します。

Instrument:シークエンサの機種の選択。Illumina MiSeq を選択します。

Spot Type:リード構成の選択。

paired (FR) を選択します。

次項に続く

作成した library数分だけ "Experiment" を作成する。

Page 51: Ddbj all ver3

メタデータの作成  -Experiment-

Spot Length:P aired-end リードの合計の長さ。アンプリ

コン解析( 502 ) , ドラフトゲノム解析(602) と記入します。

Nominal Length: ライブラリーのインサート長。アンプリコン解

析( 600 ) , ドラフトゲノム解析 (800) を記入します。

BioSample Used:Experiment に対応している

BioSample ID を記入します。

選択後、 "Run" をクリック

Page 52: Ddbj all ver3

メタデータの作成  -Run-

Experiment と同じ数だけ Run を作成し、それぞれ 1 対 1 に対応させます。

対応させた後、クリック

Page 53: Ddbj all ver3

メタデータの作成  -Run-

Run/Analysis contains files:fastq データが、どの Run に対応す

るのか選択します。

File Type:generic_fastq

を選択します。

MD5 Checksum:弊社が提供した文字列を記入します。

② 最後に "Submit" をクリック

① 項目を記入後、 "Save" する

Run/Analysis:Run が選択され

ます。

Page 54: Ddbj all ver3

メタデータの作成

"Validate data files" をクリックすると、登録したメタデータの内容とランデータが一致しているか確認作業が始まります。

しばらく経った後、 "data_error" が発生した場合は、 [Stop validation] をクリックして、 Validation 処理を停止します。メタデータのエラー箇所を修正後、再アップロードし、再度 validation を 開始し ま す 。 エ ラ ー の原因がわか ら な い 方 は 、 DRA チー ム( [email protected] )へご連絡ください。

Statusの内容new :メタデータの投稿前metadata_submitted :メタデータが投稿されたdata_validating :データファイルの Validation 中data_error :データファイルの Validation エラーsubmission_validated :メタデータとデータファイルの Validationが完了completed :アクセッション番号が発行されたconfidential :非公開public :公開

Page 55: Ddbj all ver3

5. 備考

Page 56: Ddbj all ver3

Run データの数が多く、対応付けが困難な場合

"Experiment" と "Run" のメタデータは、表計算ソフトで記入し、それをインポートすることができます。

ダウンロードしたファイルをそれぞれ表計算ソフトで開き、必須項目を記入します。保存は、「テキスト(タブ区切り)」形式で行います。※必須ではない空欄項目列は、削除せずにそのまま残します。※ い く つ か の 項 目 を 手 入 力 し た後、 "Download TSV file" でダウンロードすると入力形式がわかりやすくなります。その後、「タブ区切り」で保存したデータを参照すれば、インポートすることができます。

"Experiment" の入力時

"Run" の入力時

"Experiment" と "Run" の対応付け時