Upload
yoshihirohanda
View
417
Download
0
Embed Size (px)
Citation preview
DRAへのデータ登録
登録までの流れ
1. DRAアカウントの取得--- 32. DRA 登録のイメージ --- 6 3. BioProject の登録 --- 124. BioSample の登録 --- 255. D RA への登録 --- 436. 備考 --- 55
注意1:アスタリスク ( * ) は、必須項目です。
注意4:すべて入力は英語です。
登録前の注意点
注意2:この資料は、必須項目についてのみ解説しています。 optional な部分については、補足説明していません。
注意5:より詳細な内容は、 DRA Handbookをご覧ください。
注意3:この資料は、 Illumina MiSeq を用いた標準的なアンプリ コン解析と微生物ドラフトゲノム解析のデータを登録する と仮定して作製しています。
1. D RA アカウントの取得
DRA アカウントの取得
① 登録ポータル D-wayにアクセスします。
② クリック ③ 必須項目を記入し、クリック
④ 入力した内容を確認し、クリック
入力されたアドレス宛に確認メールが送信されま
す。メールに記載されている
URL を選択します。⑤ パスワードを設
定し、"Set" をクリック
アカウントの仮登録完了!
次に所属と公開鍵を登録します。
所属と公開鍵の登録
Center Full Name: 組織名を入力し,提示される候
補から選択します。
組織名を記入後、 "Updata" をクリック
Center Name が登録されると、下部に "Public Key" が表示されます。公開鍵ファイルを参照し、 [Register public key] で公開鍵を登録します。
公開鍵の作成方法は、 DDBJ の " 公開鍵/秘密鍵ペアの生成" や京都大学学術情報メディアセンターをご覧ください。
2. DRA 登録のイメージ
DRA登録のイメージ
メタデータ ランデータ
関連付け
・シークエンスデータ *.fastq
・サブミッション情報 Submission・研究情報 Study ( =BioProject )・サンプル情報 Sample ( =BioSample )・実験情報 Experiment・ラン情報 Run
プロジェクトデータ
・研究情報 BioProject・サンプル情報 BioSample
関連付け ① BioProject と BioSample の登録
② ランデータを DDBJ のサーバに転送③ サンプル情報とデータの関連付け
Run
Experiment
*.fastq
Run
Experiment
*.fastq
Run
Experiment
*.fastq
Run
Experiment
*.fastq
Run
Experiment
*.fastq
Run
Experiment
*.fastq
Run
Experiment
*.fastq
Run
Experiment
*.fastq
Run
Experiment
*.fastq
Run
Experiment
*.fastq
Run
Experiment
*.fastq
Run
Experiment
*.fastq
Run
Experiment
*.fastq
Run
Experiment
*.fastq
Run
Experiment
*.fastq
Run
Experiment
*.fastq
異なる 16 地点の土壌から DNA 抽出を行い、 SSU rRNA アンプリコン解析を行った場合
BioSampleBioSampleBioSampleBioSample
BioProject
BioSampleBioSampleBioSampleBioSampleBioSampleBioSampleBioSampleBioSample
BioSampleBioSampleBioSampleBioSample
1 つの BioSample に対し、それぞれExperiment と Run を1つずつ関連付けま
す。
メタデータの構成の具体例 その 1
異なる 4 地点の土壌から DNA 抽出を行い、 4 つの biological or technical replicate で SSU rRNA アンプリコン解析した場合
BioSampleBioSampleBioSampleBioSample
BioProject
ExperimentExperimentExperimentExperiment
Run Run Run Run
*.fastq *.fastq *.fastq *.fastq
x 4
1 つの BioSample に対し、それぞれ Experiment と Run を 4 つずつ関
連付けます。
メタデータの構成の具体例 その 2
メタデータの構成の具体例 その 3
1種類のバクテリアのドラフトゲノム解読を 1 種類のライブラリーを用いて行った場合
BioSample
BioProject
Experiment
Run
*.fastq
1 つの BioSample に対し、それぞれExperiment と Run を 1 つずつ関連付けま
す。
1種類のバクテリアのドラフトゲノム解読を 2 種類のライブラリーを用いて行った場合
BioSample
BioProject
Experiment
Run
*.fastq
1 つの BioSample に対し、それぞれExperiment と Run を 2 つずつ関連付けま
す。
Experiment
Run
*.fastq
メタデータの構成の具体例 その 4
3. BioProject の登録
BioProject の作成
D-way にログインすると、以下のような画面が表示されます。
① クリック
② クリックして、新しいプロジェクトIDを作成
③ 作成されたIDをクリック
BioProject の登録 – SUBMITTER –
記入後、クリック
Name: 氏名を記入します。
E-mail: メールアドレスを記入します。
Submitting organization: 所属名を記入します。
Data release: データ公開の有無を選択しま
す。
BioProject の登録 – GENERAL INFO –
Project title: プロジェクト名を記入します。
Description: 研究目的や実験手法を記述します。第三者がデータを解釈することができるように十分な量( 100 文字以上)の情報を記入
します。
記入後、クリック
BioProject の登録 – PROJECT TYPE –
アンプリコン解析とドラフトゲノム解析によって
BioProject の登録方法が異なります。
BioProject の登録 – PROJECT TYPE –
アンプリコン解析の場合
BioProject の登録 –アンプリコン解析–
Project data type:Metagenome を選択します。
記入後、クリック
Objective:Raw Sequence Reads を選択
します。
名称 選択項目Sample scope Environment
Material Genome
Capture Targeted Locus/Loci
Methodology Sequencing
BioProject の登録 –アンプリコン解析–
Environmental sample name: Taxonomy Browserの中から、
適切な項目を選択し、記入します。
Environmental sample description:サンプル情報の詳細を記入します。
記入後、クリック
BioProject の登録 – PROJECT TYPE –
ドラフトゲノム解析の場合
BioProject の登録 –ドラフトゲノム解析–
Project data type:Genome Sequencing を
選択します。
選択後、クリック
Objective:Raw Sequence Reads を
選択します。
名称 選択項目Sample scope 単離された微生物の場合、
Monoisolate を選択します。 Material Genome
Capture whole
Methodology Sequencing
BioProject の登録 –ドラフトゲノム解析–
Organism name: 生物種名を記入する。 Taxonomy IDは自動的に対応したIDが記載さ
れます。
記入後、クリック
BioProject の登録 – PUBLICATION–
記入後、クリックPublication:
既に論文が受理されていれば、記入することができる(任意)。
BioProject の登録 – OVERVIEW–
最後に [Submit] ボタンをクリックした後、 D-way 上で修正は出来ません。修正される場合は、メール ([email protected]) で申請する必要があります。アノテータが査定を行ってから、 BioProject ID を発行するため、少しお時間がかかります。
内容確認後、クリック
4. BioSample の登録
BioSample の登録
D-way にログインすると、以下のような画面が表示されます。
① クリック
② クリックして、新しいプロジェクトIDを作成
③ 作成されたIDをクリック
BioSample の作成
記入後、クリック
Name: 氏名を記入します。
E-mail: メールアドレスを記入します。
Submitting organization: 所属名を記入します。
BioSample の登録BioSample の登録 -SUBMITTER-
BioSample の登録
選択後、クリック
Hold / Release: データ公開の有無を選択しま
す。
BioSample の登録 – GENERAL INFO-
BioSample の登録
アンプリコン解析とドラフトゲノム解析によって
BioSample の登録方法が異なります。
BioSample の登録 – SAMPLE TYPE-
BioSample の登録
アンプリコン解析の場合
BioSample の登録 – SAMPLE TYPE-
BioSample の登録
Core Package:Survey related Marker Sequences
を選択します。
Environmental package: どのような環境中のサンプルを採取したかを選択します。
選択後、クリック
BioSample の登録 -SAMPLE TYPE-
BioSample の登録
ドラフトゲノム解析の場合
BioSample の登録 -SAMPLE TYPE-
BioSample の登録
Core Package:バクテリアのドラフトゲノム解析の場合は、 Cultured Bacterial/ Archaeal Genomic
Sequences を選択します。
Environmental package: 自動的に No package が選択されます。
選択後、クリック
BioSample の登録 -SAMPLE TYPE-
BioSample の登録
① クリック
③ 次項以降の情報を参考に表計算ソフト上で必須項目を記入し、「テキスト(タブ区切り)」形式で保存します。
② ダウンロードされたファイルを「 Excel」や「 Numbers」などの表計算ソフトで開きます。
④ 保存したファイルを選択します。
⑤ 選択後、クリック
BioSample の登録 -ATTRIBUTES-
注意 9 :必須ではない空欄項目列は、削除せずにそのまま残します。
BioSample の登録
注意 6 :1地点から、 biological replicate 3反復とった場合は、 BioSample の登録は1つで良いが、異なる 3 地点から、 biological replicate 3反復とった場合は、 1 つの BioSample 登録内に 3つの Sample を登録する必要があります。注意 7 :アスタリスク( * )は、必須項目です。登録するサンプルによって、必須項目が異なります。注意 8 :必須項目でも該当しない場合やわからない場合は、 "NA" や "unknown" と記入することができます。
BioSample の登録 -ATTRIBUTES- の注意点
例)
削除しない。
BioSample の登録BioSample の登録 -ATTRIBUTES-
名称 内容 例sample_name sample name は登録者がサンプルに付け
た任意の ID です。Soli_1 、 Water_2
sample_title サンプルタイトルは、サンプルをよく表す簡潔なものを記入します。
Sapporo_soli_1 、 Tokyo_soli_2
organism Taxonomy Browser ( メタゲノム解析用 )や Taxonomy Browser ( ドラフトゲノム解析用 ) の中から、適切な項目を選択します。
soil metagenome 、 fish gut metagenome 、 Escherichia coli K-12
taxonomy_id organism に対応した taxonomy_idを記入します。
410658 、 1602388
collection_date サンプルを採取した日付 を記入します。2008-01-23T19:23:10 、 2008-01-23
BioSample の登録BioSample の登録 -ATTRIBUTES-
名称 内容 例env_biome サンプルに関する広い生態学的な環境を
記入します。 biomeの中から適切な項目を探し、記入します。
grassland biome, desert biome, woodland biome
env_feature 周辺の空間へ強い影響を及ぼしている実体 を 環 境 を 記 入 し ま す 。environmental featureの中から適切な項目を探し、記入します。
grassland soil, woodland
env_material ここでは、質量や体積、環境に含まれる媒 体 の 他 の 部 分 を 表 す 。environmental materialの中から適切な項目を探し、記入します。
farm soil, underground water, marine mud
geo_loc_name サンプルを得た地域を記入します。 Japan:Kanagawa, Atsugi, The Sagami River
BioSample の登録BioSample の登録 -ATTRIBUTES-
名称 内容 例lat_lon サンプルが採取された位置の地理的座標
を記入します。小数点以下の数字は分秒ではなく小数で記入します。
"47.94 N 28.12 W", "45.0123 S 4.1234 E"
project_name 全体のプロジェクトを記載した簡潔な名称を記入します。
Genome analysis of ****
depth 地表表面からの距離を記入します。 one meters below ground
elev 標高を記入します。 324 m
isol_growth_condt 単離や生育条件の詳細を記載している
pubmed ID 、 DOIあるいは URL を記入します。
PMID: **********
ref_biomaterial Primary publication か primary genome report の pubmed ID 、 DOIあるいは URLを記入します。
doi: ***************
num_replicons 真核生物の核ゲノム、微生物のゲノムにおけるレプリコンの数、セグメント化されたウィルスにおけるセグメントの数を記入します。
1
BioSample の登録
内容確認後、クリック
登録した内容が、表示されます。
BioSample の登録 -ATTRIBUTES-
BioSample の登録
記入後、クリック Publication: 既に論文が受理されていれば、
記入することができます(任意)。
BioSample の登録 – PUBLICATION-
BioSample の登録
記入後、クリック Comments: DDBJ スタッフに対してコメン
トがあれば記入します(任意)。
BioSample の登録 – COMMENTS-
BioSample の登録 -OVERVIEW-
最後に [Submit] ボタンをクリックした後、 D-way 上で修正は出来ません。内容を変更する場合は、メール ([email protected]) に て 、お知ら せ て く だ さ い 。 アノ テ ー タ が査定 を 行 っ て から、 BioSample ID が発行されるため、少しお時間がかかります。
内容確認後、クリック
5. D RA への登録
※ BioProject と BioSample ID の取得が完了していないと、 DRA に登録できません。
メタデータの作成
① クリック
② "Create new Submission" クリックし、新しい Submission を作成します。
③ 作成された Submission を選択します。
④ Submission を編集します。
シークエンスデータのアップロード
弊社が送付した生データ (*.fastq) を DDBJ のサーバに転送します。データは、作成した Submission ID 名の下に保存します。
転送方法は DRA Handbookをご覧ください。
※ BioProject と BioSample ID の取得とシークエンスデータ( Run data )のアップロードが完了していないと、このあとのデータ登録ができません。
Run
Experiment
*.fastq
Run
Experiment
*.fastq
Run
Experiment
*.fastq
Run
Experiment
*.fastq
Run
Experiment
*.fastq
Run
Experiment
*.fastq
Run
Experiment
*.fastq
Run
Experiment
*.fastq
Run
Experiment
*.fastq
Run
Experiment
*.fastq
Run
Experiment
*.fastq
Run
Experiment
*.fastq
Run
Experiment
*.fastq
Run
Experiment
*.fastq
Run
Experiment
*.fastq
Run
Experiment
*.fastq
メタデータのイメージ ~おさらい~
異なる 16 地点からそれぞれ 1 サンプル毎に解析した場合
BioSampleBioSampleBioSampleBioSample
BioProject
異なる 4 地点からそれぞれ 4 つの biological or technical replicate を解析した場合
BioSampleBioSampleBioSampleBioSample
BioProject
BioSampleBioSampleBioSampleBioSampleBioSampleBioSampleBioSampleBioSample
BioSampleBioSampleBioSampleBioSample
ExperimentExperimentExperimentExperiment
Run Run Run Run
*.fastq *.fastq *.fastq *.fastq
x 4
1 つの BioSample に対し、 Experiment と Run を1つずつ関連付けます。
1 つの BioSample に対し、 Experiment と Run を4 つずつ関連付けます。
メタデータの作成 -Submission-
Center Name, Lab Name: アカウント作成時に登録した
Center が記入されています。 Lab Name には、詳細な所属を記入し
ます。
Submitter: 氏名と E-mail アドレスを記入しま
す。
Hold Until: データ公開日の設定します。最長2年後まで設定することができま
す。
記入後、クリック
申請者を追加することができます
メタデータの作成 -Study-
BioProject ID:BioProject を登録しないと、ここに表示されません。登録には数日かかります、お早目に BioProject を登録することをお
勧め致します。
選択後、クリック
メタデータの作成 -Sample-
BioSample ID:Ctrlキーを押しながらクリックすると、複数の BioSample ID を選
択可能です。 BioSample を登録しないと、ここに表示されません。登録には数日かかります、お早目に BioSample を登録することを
お勧め致します。
選択後、クリック
メタデータの作成 -Experiment-
Library Name: 任意のライブラリー名を記入
します。
Library Source: ライブラリー構築に用いた試料。アンプリコン解析
( Metagenomic )、ドラフトゲノム解析( Genomic )を選択します。Library Selection:
ライブラリー作成時に用いたサンプルの選別や濃縮方法。アンプリコン解析( PCR )、ドラフトゲノム解析
( RANDOM )を選択します。
Library Strategy:ライブラリーの構築手法。
アンプリコン解析( AMPLICON )、ドラフトゲ
ノム解析( WGS )を選択します。
Instrument:シークエンサの機種の選択。Illumina MiSeq を選択します。
Spot Type:リード構成の選択。
paired (FR) を選択します。
次項に続く
作成した library数分だけ "Experiment" を作成する。
メタデータの作成 -Experiment-
Spot Length:P aired-end リードの合計の長さ。アンプリ
コン解析( 502 ) , ドラフトゲノム解析(602) と記入します。
Nominal Length: ライブラリーのインサート長。アンプリコン解
析( 600 ) , ドラフトゲノム解析 (800) を記入します。
BioSample Used:Experiment に対応している
BioSample ID を記入します。
選択後、 "Run" をクリック
メタデータの作成 -Run-
Experiment と同じ数だけ Run を作成し、それぞれ 1 対 1 に対応させます。
対応させた後、クリック
メタデータの作成 -Run-
Run/Analysis contains files:fastq データが、どの Run に対応す
るのか選択します。
File Type:generic_fastq
を選択します。
MD5 Checksum:弊社が提供した文字列を記入します。
② 最後に "Submit" をクリック
① 項目を記入後、 "Save" する
Run/Analysis:Run が選択され
ます。
メタデータの作成
"Validate data files" をクリックすると、登録したメタデータの内容とランデータが一致しているか確認作業が始まります。
しばらく経った後、 "data_error" が発生した場合は、 [Stop validation] をクリックして、 Validation 処理を停止します。メタデータのエラー箇所を修正後、再アップロードし、再度 validation を 開始し ま す 。 エ ラ ー の原因がわか ら な い 方 は 、 DRA チー ム( [email protected] )へご連絡ください。
Statusの内容new :メタデータの投稿前metadata_submitted :メタデータが投稿されたdata_validating :データファイルの Validation 中data_error :データファイルの Validation エラーsubmission_validated :メタデータとデータファイルの Validationが完了completed :アクセッション番号が発行されたconfidential :非公開public :公開
5. 備考
Run データの数が多く、対応付けが困難な場合
"Experiment" と "Run" のメタデータは、表計算ソフトで記入し、それをインポートすることができます。
ダウンロードしたファイルをそれぞれ表計算ソフトで開き、必須項目を記入します。保存は、「テキスト(タブ区切り)」形式で行います。※必須ではない空欄項目列は、削除せずにそのまま残します。※ い く つ か の 項 目 を 手 入 力 し た後、 "Download TSV file" でダウンロードすると入力形式がわかりやすくなります。その後、「タブ区切り」で保存したデータを参照すれば、インポートすることができます。
"Experiment" の入力時
"Run" の入力時
"Experiment" と "Run" の対応付け時