REPORT2021年9月号 Vol. 32 No. 6(通巻370号)

研究データ公開その後:データの利活用状況をどう把握するか? Japan Open Science Summit 2021セッション企画

  • 白井知子(地球環境研究センター 地球環境データ統合解析推進室長)
  • 福田陽子(地球環境研究センター地球環境データ統合解析推進室 高度技能専門員)

1.はじめに

昨今、オープンサイエンスへの期待が高まる中、各分野の研究者、大学図書館員やリサーチ・アドミニストレーター(URA)といった支援者、IT基盤の研究開発者をはじめとしたあらゆるステークホルダーが集まる日本最大のカンファレンス「ジャパン・オープンサイエンス・サミット(Japan Open Science Summit:JOSS)」(https://joss.rcos.nii.ac.jp/)が2018年から開催されています。地球環境データ統合解析推進室(以下、推進室)からも開催初年度から研究者やスタッフが参加していますが、2021年6月14日から19日に開催されたJOSS2021ではデータ利活用に関するセッション(https://joss.rcos.nii.ac.jp/session/overview/?id=se_99)企画に携わりましたので、ご報告します。

2.RDUFとJDARN

推進室では、オープンサイエンスの実現に向けた国内および国際的な活動を目指して2016年6月に設立された「研究データ利活用協議会(Research Data Utilization Forum:RDUF)」(https://japanlinkcenter.org/rduf/)に参加して、活動報告や情報交換を行っています。この協議会の下、「ジャパンデータリポジトリネットワーク推進部会(Japan DAta Repository Network :JDARN)https://japanlinkcenter.org/rduf/permanent_subcommittee/index.html」のメンバーとしても活動しています。

JDARNは様々な機関で研究データ公開を担うリポジトリ関係者で構成されており、内閣府の国際的動向を踏まえたオープンサイエンスの推進に関する検討会により策定された「研究データリポジトリ整備・運用ガイドライン」(2019年3月29日付)の原案作成にも貢献しました。JDARNでは、新型コロナウイルス流行の影響でJOSSの開催時期や形式が大幅に変更になった2020年を除き、毎年、セッションを企画・実施してきました。今回のセッションもJDARNのメンバーで話し合いながら企画したものです。

3.研究データ公開その後

昨今、研究現場ではデータ公開を促される機会が増えています。論文の投稿や出版のタイミングで、使用したデータの公開を要請する学術雑誌が増えていることは、皆さんも実感されていることでしょう。それに加え、論文出版だけが評価されるのではなく、データも出版し、データ提供者が評価されるという新しい仕組みへの期待が高まっています。

地球環境研究センター(CGER)では地球環境モニタリングをはじめ多くの独自データを継続的に生みだしており、2016年よりCGERのデータ公開リポジトリである地球環境データベース(https://db.cger.nies.go.jp/portal/)から研究データへのDOI(デジタルオブジェクト識別子)を付与が可能になったこともあって、データ公開のペースは増加しています。2020年のNIES IAB(International Advisory Board)では、低炭素研究プログラムに対し、国立環境研究所(NIES)の貴重なデータをもっと効果的に世界の研究コミュニティに発信してほしい、との要望も寄せられるなど、今後さらに積極的にデータを公開し、利活用を促進することが望まれています。

一方で、データ提供側にとっては、データ公開に対する知識やリソースの不足、メリットのわかりにくさ等が邪魔をして、公開を躊躇するケースも少なくありません。データの利活用状況をきちんと見える化することで、データ提供者の成果に結びつけると同時に、自分が公開したデータが新たな成果を生み出す等の効果を実感することができ、データ公開へのインセンティブに結びつくことが期待されます。

JDARNでは、研究データ公開もまだ進んでいない機関が多い中、その先の話をして参加者がついてこられるのか、との意見も出ましたが、蓋を開けて見ると、本セッションの登録者は200人を超え、参加者も160名と、JOSS2021の22セッション(Youtube配信中のものを除く)中で3番目に多く、関心の高さが伺えました。セッションでは、まず白井が「データ利活用状況の把握がなぜ大切か?」として、セッションの趣旨説明を行いました(写真1)。

写真1 セッションの趣旨説明(白井)

続いて、国立情報学研究所の北本朝展教授と大波純一特任准教授、海洋研究開発機構(JAMSTEC)の福田和代技術副主幹に話題提供いただいた後、オンラインの参加者も交えてパネルディスカッションを行いました。

北本教授は「研究データのインパクトを計測可能に~データ引用とMahaloプロジェクト~」というタイトルで、研究成果が論文だけでなく多様化していること、研究データ引用の実例とその課題や問題点、データ公開者に対する自発的な利用報告を集める仕組み(Mahaloプロジェクト)(https://mahalo.ex.nii.ac.jp/https://dias.ex.nii.ac.jp/mahalo/)を紹介しました(写真2)。

写真2 Mahaloプロジェクトの紹介(北本氏)

福田技術副主幹は、「データ引用状況把握の試み -地球科学分野の事例-」として、JAMSTECのデータリポジトリ運用者の立場から、データに付与したDOIについてデータ引用状況把握を試みた結果について報告しました(写真3)。DOIはデータ引用状況を把握するのに強力なツールであること、ただしDOI付与したデータでも現状では一つの検索サービスでデータ引用状況を把握するのは困難であることが示されました。

写真3 複数の検索サービスでデータ引用状況を追跡(福田氏)

大波准教授は「学術検索基盤CiNii Researchを通じて研究データ公開の意義を考える」として、国立情報学研究所が提供する学術コンテンツの新サービスとして2021年4月より公開されたCiNii Researchを紹介しました。CiNii Researchでは、論文、研究データ、書誌情報、博士論文、研究プロジェクトデータ等の多様な学術情報に一つの検索画面からアクセスでき、研究関連リソースの統合化によるデータの価値最大化を目指しています(写真4)。

写真4 学術検索基盤CiNii Researchの紹介(大波氏)

パネルディスカッションでは、RDUFの下で、2019年1月から2020年6月まで研究データ引用の普及活動を行った「リサーチデータサイテーション(Research Data Citation:RDC)小委員会」から名古屋大学の能勢正仁准教授と文教大学の池内有為専任講師を招き、オンライン参加者の質問・コメントも交えながら、データ利活用の把握に欠かせないデータ引用に関わる現状や課題、今後の取り組みについて議論しました。

RDC小委員会の調査によると、データ公開を要求する学術雑誌が多くの分野で増加しているのに対し、データ引用まで要求している雑誌はまだそれほど多くありません(能勢、池内、2020*1)。データ提供側はデータ引用を徹底してほしい一方で、利用側にはデータ引用の必要性や手法が十分に伝わっていない、という現状が議論でも浮き彫りになりました。また、分野によるデータ公開に対する意識や慣習の違い、データ引用の技術的な疑問や課題なども共有されました。

今後、データ引用を慣習化するための取り組みとしては、データへのDOI付与の普及、データ提供時のデータ引用方法の明記、データ引用を研究者教育の一環に含める、等、活発に意見が交わされました。当日、パネルディスカッション中に出たキーワードは、JDARN代表を務める科学技術振興機構の八塚茂研究員がライブで参加者と画面共有してくれました(写真5)。データ引用全般に関する概念的な議論から、現場での具体的な問題共有まで、多岐にわたり話が尽きないまま、セッション終了を迎えました。

写真5 セッション中、登場したキーワードリスト(八塚氏)

4.おわりに

自分が公開した研究データがどのように利活用されているのか知りたい、データ公開により研究コミュニティに貢献していることを評価してほしい、というのはデータ提供者にとって当然の欲求です。しかし、データ引用は世界的にもまだ発展途上なのが現状です(Vannan et al., 2020*2)。

今回、企画したセッションでも多くの関係者が問題意識を抱えていることがわかりました。推進室では、引き続き、研究データへのDOI付与を促進すると同時に、確実にデータ引用してもらえる仕組みや、効率的なデータ利活用状況把握方法を探っていきます。また、RDUFのようなコミュニティを通じて、データ引用の慣習化に向けて取り組んで行きます。データ引用が慣習化し、データ提供者がもっと評価され、よりデータ公開が進むことで、さらにデータ利用も進みます。研究現場にいる私たち一人ひとりがデータ引用への意識を高めることが必要とされているのです。

※なお、国立情報学研究所のサイトで大波さんによる本セッションの報告記事(https://rcos.nii.ac.jp/diary/2021/06/20210625-1/index.php)をお読みいただけます。