環境要因
国立衛生研究所 (NIH) は、NIH データ管理および共有 (DMS) 計画を作成、実施、報告することを、NIH から資金提供を受けているすべての研究者に義務付ける新しいデータ管理および共有ポリシーを定めています。 1月25日に発効したこの新政策は、納税者の資金提供による研究が確実に公開されることを目指している。 DMS 計画には、政府の研究データを FAIR (検索可能、アクセス可能、相互運用可能、再利用可能) 原則に向けて移行するのに役立つ 6 つの要素が含まれています。
環境健康科学の研究者を新たな任務で支援するために、NIEHS Environmental Health Language Collaborative (EHLC) は、「環境健康科学データの共有: メタデータ、標準、およびツール」と題した 3 つの半日ワークショップを開催しました。
「ワークショップの目的は、研究者が2023年の新しい政策に準拠するために使用できるメタデータ、標準、ツールについての意識を高め、その使用を奨励することでした」とNIEHSデータサイエンス局のプログラムマネージャーで委員長のステファニー・ホルムグレン氏は述べた。ワークショッププログラム企画委員会。 「ワークショップは、NIHのデータ管理と共有計画を開発または実装しようとしている人、または環境健康科学データを効果的に管理、共有、再利用する方法を学ぶことに興味がある人を対象としていました。」
EHLC の使命に沿って、ワークショップ シリーズの焦点は、環境健康科学の研究者が DMS 計画に含める必要がある 6 つの必須政策要素のうちの要素 1 (データの説明) と 3 (基準) を遵守できるよう支援することでした。 プレゼンテーションでは、メタデータ アノテーション用のツールについて取り上げられ、環境健康科学研究に関連するオントロジーと管理された語彙を見つけて使用する方法に関する情報が含まれていました。
DMS 計画の最初の要素の目的は、データの検索に役立つ詳細な説明と命名規則を適用することです。 特に、メタデータの詳細を含めることが期待されます。 メタデータは、科学データを解釈可能および再利用可能にすることを目的とした追加情報を提供するデータです。
たとえば、すべてのデータはリポジトリに保存され、標準化された説明は注釈、検索機能、情報抽出に役立ちます。 一貫した用語を使用することで、研究データを再利用し、相互運用可能にすることができます。
「メタデータは、データがどのように生成されたのか、データの内容を伝えるのに役立つため、非常に重要です」とホルムグレン氏は述べています。 「そうすると、別の人間がそのデータを理解できるだけでなく、機械もそのデータを理解できるようになります。 マシンパワーを活用することで、データ全体の推論やデータ内のパターンの確認という点で、データを使ってさらに多くのことができるようになり、それによって研究者はより複雑な問題に取り組むことができるようになります。」
明確な説明に加えて、環境健康科学データをどのように構造化するかについてのコミュニティの開発、合意、標準の採用も必要です。
「データを公正なものにするためには、優れたメタデータが本当に必要であり、その優れたメタデータはコミュニティで承認されたメタデータ標準がある場合に実現します」とスタンフォード大学のマーク・ムセン医学博士はワークショップのプレゼンテーションで述べた。 。
このシリーズでは、環境健康科学に関連する基礎的な基準に焦点を当て、調査研究の特定の側面について基準が存在しない場合の対処法について詳細なベスト プラクティスを紹介しました。
「私たちは、すべての研究がユニークであり、それぞれの側面があることを認識していますが、生殖毒性研究や環境疫学研究の性質には、依然としていくつかの基本的な共通分母が存在します」とホルムグレン氏は述べた。
DMS 計画の実装にはデータ共有が含まれます。
「もはや、『要求に応じてデータが共有されます』と言うだけでは十分ではありません。 現在では、実際にデータをリポジトリに送信する必要があります」と Holmgren 氏は述べています。
リポジトリ共有のベスト プラクティスには次のようなものがあります。
「新しいポリシーの中心は、データ共有がなぜ重要なのかという価値を伝えようとすることです」とホルムグレン氏は述べた。 「データを適切に共有しようとする場合は、データを効果的に管理する必要があります。 データ管理は研究ライフサイクル全体で行われるため、この 2 つは複雑に関連しています。 DMS プランは、研究者が研究を実施する前にデータ管理とデータ共有の問題について事前に考えるのに役立ちます。」