menu

第200回定例オープンセミナー資料
超高層物理学を試験環境とした学術情報基盤の考察

開催日時 2015(平成27)年10月28日
題目 超高層物理学を試験環境とした学術情報基盤の考察
Consideration of the scholarly information infrastructure on upper atmospheric research field as a test bed
発表者 小山幸伸(新領域融合研究センター・特任研究員)
関連ミッション ミッション 3 (宇宙環境・利用)

要旨

2013年における世界のストレージの総容量は約4.4ゼタバイト(ゼタは10の21乗)で、毎年40 %程度増加している[1]。研究データもこれに大きく寄与していると推測され、大量に生成されるデータの洪水、いわゆるビッグデータから、いかにして科学的知見を得るかが注目を集めている。他方で、2004年ごろを境に世界の論文数の増加率がさらに上昇しているが[2]、それらの論文と、データに代表される論拠との結びつきは不十分であり、再現性が担保されていない論文の量産が問題視されている[3]。しかしながら、1665年の英国にその起源を持つ学術論文は、電子化等の変遷による流通促進はあったものの、英文、図、式、表で情報伝達する形式そのものは、ビッグデータ時代の現在までほとんど変わっていない。第4のパラダイムと言われるデータ中心科学の到来が示唆されている現在、改めて学術情報基盤のあり方を考える必要がある。

日本の超高層物理学コミュニティに転じてみると、1957年の国際地球観測年以来、論文の源泉である、地上観測データの多くがオープンで共有されてきた。そして、2009年から開始された「超高層大気長期変動の全球地上ネットワーク観測・研究」(IUGONETプロジェクト)によって、研究データの検索性と流通性を高めるためのメタデータ・データベースがオープンアクセス可能となった。また、データセットを一意に識別するための、Digital Object Identifier (DOI)を付与する取り組み[5]が行われており、Japan Link Centerを介した、最初の研究データへのDOI付与例が生み出された[6]。さらには、同じくDOIを用いて識別される論文とつなぐ試み、すなわちデータ引用も行われつつある[7]。この様に、論文を出発点に、その論拠であるデータまで到達可能になりつつある。

データへの到達性の向上によって、次なる問題、すなわちデータの可視化、解析問題が顕在化してきた。超高層物理学のデータ形式自体が多様でありSPEDASに挙げられるデータ解析ソフトウェアがその形式の差異を吸収してきた。SPEDASは、ドメイン・サイエンティスト向けのデータ可視化・解析ソフトウェアとして、着実にドメイン内での利用者を伸ばしてきたが、基本的に高価な商用ライセンスが必要であり、1. たくさんのコアを使えない点と、2. オブジェクト志向言語で無い故に相互運用性が低い、という2大問題を抱える。

発表者は、商用ラインセンスの購入が困難な途上国の研究者、隣接分野の研究者、データ・サイエンティスト、そして近年注目されつつあるシチズンサイエンティストであっても、制限無しに利用可能で、多数のコアを使ったビッグデータ解析が可能な、他のソフトウェアへの組み込みも可能な相互運用性の高いソフトウェアを作ることを志向して開発を進めている、Java-based iUgonet Data Analysis Software (JudasFX)の紹介を行う。

超高層物理学を題材として取り上げている本発表は、便宜的にミッション3(宇宙環境・利用)との関連を掲げている。しかしながら、学術情報を俯瞰した上で個別の話題に落とし込むため、その多くは他のミッション関係者にも共通する学術情報の話題である。

キーワード: データ中心科学、オープン・サイエンス、ビッグデータ、超高層物理学、学術情報、識別子

[1] http://www.emc.com/collateral/analyst-reports/idc-digital-universe-2014.pdf.
[2] 文部科学省 科学技術政策研究所、科学研究のベンチマーキング2012 —論文分析でみる世界の研究活動の変化と日本の状況—、2012.
[3] Wadman, Unable to validate the relevant preclinical research for almost two-thirds, nature, 2013.
[4] Hey, T., The Fourth Paradigm: Data-Intensive Scientific Discovery, 2009.
[5] 小林賢、ジャパンリンクセンター「研究データへのDOI登録実験プロジェクト」中間報告会、http://doi.org/10.1241/johokanri.58.485.
[6] https://doi.org/10.17591/55838dbd6c0ad.
[7] https://doi.org/10.1002/2014JD022647.

印刷用PDFファイル(188 553 バイト) | 一つ前のページへもどる
2015年10月14日作成