View
43
Download
0
Category
Preview:
DESCRIPTION
天文学 DB 用検索言語仕様の考察. 白崎裕治 , 田中昌宏 , 本田敏志 , 大石雅寿 , 水本好彦 ( 国立天文台 ), 安田直樹 ( 東大宇宙線研 ), 増永良文 ( お茶の水大 ). はじめに. バーチャル天文台 ( VO) 計画. 世界中の天文データベースを自動連携 データベースと解析ツールの統合環境 学校教育等、一般社会での利用 参加国 アメリカ、ヨーロッパ連合、カナダ、ロシア、インド、オーストラリア、中国、韓国、日本、等。. 国内の望遠鏡 すばる望遠鏡、野辺山45m電波望遠鏡、野辺山電波干渉計、 ALMA (国立天文台) - PowerPoint PPT Presentation
Citation preview
天文学 DB 用検索言語仕様の考察
白崎裕治 , 田中昌宏 , 本田敏志 , 大石雅寿 , 水本好彦 ( 国立天文台 ),
安田直樹 ( 東大宇宙線研 ),増永良文 ( お茶の水大 )
はじめに
バーチャル天文台 ( VO) 計画
• 世界中の天文データベースを自動連携• データベースと解析ツールの統合環境• 学校教育等、一般社会での利用• 参加国
アメリカ、ヨーロッパ連合、カナダ、ロシア、インド、オーストラリア、中国、韓国、日本、等。
現在 将来の望遠鏡・• 国内の望遠鏡– すばる望遠鏡、野辺山45m電波望遠鏡、野辺山電波干渉計、 ALMA (国立天文台)
– あすか , はるか , Astro-F, Astro-E2 ( 宇宙航空研究開発機構 )
• 海外の望遠鏡•ハッブル宇宙望遠鏡 , VLT, Gemini, VLA, チャンドラ X 線望遠鏡、 XMM ニュートン X 線望遠鏡、 Integral 、 GLAST 、 HETE-2 、 Swift 等…
望遠鏡は年々巨大化 高機能化し、データ量も爆発的に増加・
野辺山電波~ 1TB/ 年 , すばる~ 20TB/ 年 , ALMA ~ 1PB/年
天文 DB の現状ウェッブブラウザを利用して誰でもデータ
ベースへアクセス可能•国内
• SMOKA http://smoka.nao.ac.jp/• NRO http://nrodb.nro.nao.ac.jp/• Darts http://www.darts.isas.jaxa.jp/
•海外• MAST http://archive.stsci.edu/• SDSS http://skyserver.sdss.org/dr1/en/• VizieR http://cdsweb.u-strasbg.fr/viz-bin/VizieR• NED http://nedwww.ipac.caltech.edu/
データはこれからますます増えつづける。
これらの DB へのポータルサイト、バーチャルオブザバトリ (VO) が必要。
データモデル
天文データの種類• 天体カタログ:天体の属性(座標、明るさ、形状等)につい
てのテーブル。
• 画像データ:天体の外観 構造や局所的 大局的分布について・ ・の情報を視覚的に表現するデータ形式。
• スペクトルデータ:天体の波長毎の明るさの分布。元素組成、その天体までの距離の情報。
• フォトンデータ:光子毎の属性データ(座標、エネルギー、時刻)。
• ライトカーブデータ:天体の明るさの時間変動。ブラックホールの質量推定。
異なる形式のデータに対する統一的な検索言語データモデルの共通化
観測データモデル• 天体観測というものは、空間座標と波長軸からなる三次元空間( データキューブ ) 内の明るさ分布を測定する、ということである。
• 画像データはデータキューブを空間平面へ射影である。
• スペクトルデータは波長軸への射影である。
データキューブの仮想テーブル化データキューブからのデータの切り出し
• 切り出し条件(3次元空間内の部分空間を指定)• 射影方法(画像かスペクトル)
データへのポインタ(実データを得るための URL )これらをテーブルの要素 カラムとする無限個のレコードからな・る仮想テーブルを考え、それに対する検索とみなす。
条件1 条件2 Image() Spectrum()
領域1 波長域1 http://naoj/subaru/image?id=2312&ra=230.&dec=+23&r=1
http://naoj/subaru/spectrum?id=2312&ra=230.&dec=+23&r=1
領域2 波長域2 … …
SQL による検索、 RDB であるカタログデータとの親和性
要求事項 検索システム・
VO 用検索言語への要求事項• 分散 DB 対応
観測所毎に管理されている DB への一括検索要求。• 天球座標上での検索条件指定
特異点(極、経度360度)の取り扱い方法。• 天球座標に基づくテーブル Join の方法
天体の ID は座標である。複数テーブルの Join は座標の近さで行う。テーブル毎に座標値の精度は異なる。
• 画像データやスペクトルデータの検索データキューブからのデータ切り出し方法を記述。
• テーブル名やカラム名のアブストラクト指定大量にあるテーブルの中から、必要なテーブルを条
件付けて指定する方法。カラム名の共通化。• 読みやすく分かりやい言語
VO における検索システム
天文 DB
データサービス
天文 DB
データサービス
天文 DB
データサービス
VO ポータル
MetadataDB
Registryサービス
SkyQueryADQL
ADQL
ADQL
SkyQuery は ユーザが VO ポータルを経由して利用する検索言語
ADQL (Astronomical Query Language) はデータサービスへの検索言語。 SkyQuery は ADQL の上位互換言語。 ADQL は SQL の上位互換言語。
ユーザ他の VO
• テーブル カラム名の解決・• 天体座標の解決• データサービス URL の解決
検索言語仕様
テーブル カラム指定・分散 DB への対応テーブル名、カラム名の URI を記述する。
[[[Authority.]DBname.]TableName.](ColumnName|UCD)
• Authority は DB管理組織に対して一意に割り当てられる名称。
• 各 DB管理組織はその内部で DB名の重複がないよう管理する。
• UCD (Unified Column Description) は天文データのカラムを意味づける標準名。フランス CDS を中心に取り決め。
• ファイル形式のテーブルの指定
File:FileName
• 例 国立天文台のすばるデータベースにある銀河カタログの天体名カラム
naoj.subaru.galaxy.objectName
テーブル カラム名のアブストラクト指定・
テーブル名を指定するのではなく、テーブルの属性で検索候補を指定したい。
FROM TABLE OF [Keyword] “文字列”
Keyword はテーブルのメタデータキーワードを利用する。 (IVOA により標準化作業中 )
UCD名の候補を列挙 ,ワイルドカードの使用。SELECT (PHOTO_MAG_* | SPECT_FLUX_NORM)
これらの文法は SkyQuery のみサポート。 データサーバに対してはテーブル名 カラム名は解・決した状態の SQL を渡すこと。
位置指定文天球上の位置を記述する文
POINT(第一座標 , 第二座標 [, 座標系 [, 座標の Epoch]])POINT( 天体名 )
• 第一座標は赤経 (赤道座標) または銀経 (銀河座標 ) 、第二座標は赤緯または銀緯。• 座標系は赤道座標 (RA_DEC) または銀河座標 (GLON_GLAT) 。• 座標の Epoch は B1950 または J2000 。• 例
POINT(207.2, +23.3, RA_DEC, J2000)POINT(23:23:47.22, +02:35:10.00)POINT(“SN1987A”)
領域指定文
位置領域指定文BOX(位置指定文 , 縦サイズ , 横サイズ [, ポジションアングル ])CIRCLE(位置指定文 , 半径サイズ )POLYGON(位置指定文のリスト [,(LARGE|SMALL)])HTM(HTM インデックスのリスト )
スペクトル範囲指定文SPECTRUM( 境界 1, 境界 2) | SPECTRUM( 波長帯名 ) • 境界値は波長 , 周波数 , エネルギーのいずれかを単位つきで指定する。• 波長帯名は “ optical”, “IR”, “radio”, “X-ray”, “gamma-ray”。
テーブル Joinテーブル Join 文 ( クロスマッチ文 )XMATCH( テーブル1 , [!]テーブル2 ) <精度
[NEAREST|BRIGHTEST|ALL]• テーブル1の天体を基準に、テーブル2の天体とのジョインをその座標に基づき指定された精度で行う。• NEAREST がつくと最も近くの天体とジョインを行う。• BRIGHTEST がつくと最も明るい天体とのジョインを行う。• ALL がつくと「精度」内のすべての天体とのジョイン。• テーブル2に「!」がつく場合は排他的ジョイン。• Where 節で使用。
画像 スペクトル検索・画像 スペクトルデータの検索・ SELECT Image(条件指定文 ) | Spectrum(条件指定文 ) FROM Authority.DBName.DataCube WHERE 条件指定文• 条件指定文は「領域指定文」、「スペクトル範囲指定文」、「キーワードに対する条件文」のうち複数を指定可。
• キーワードは別途定義の必要がある。例えば、 spatialRegion, spectrumBand, observatinTime, imagePixsize, integration 等。
• 検索結果はデータへのポインタ ( アクセス URL) を返す。• 画像 スペクトルデータの検索もカラム名の代わりに・ Image
(), Spectrum() といった関数を使うという以外、テーブルデータと同様の文法で記述される。
まとめ
SkyQuery, ADQL の拡張機能SQL への拡張機能 節 対応言語
テーブル名 カラム名の ・ URI 指定
S,F,W SkyQuery , ADQL
テーブル名 カラム名のアブスト・ラクト指定
S,F SkyQuery
天球上の位置指定文定義 S,W SkyQuery, ADQL( 天体名指定は SQのみ )
天球上の領域指定文定義 S,W SkyQuery, ADQLスペクトル範値指定文定義 S,W SkyQuery, ADQL座標値の誤差を考慮したテーブル Join 文
W SkyQuery, ADQL
画像検索指定文 Image() S SkyQuery, ADQLスペクトル検索指示文 Spectrum()
S SkyQuery, ADQL
Recommended