TimedText:Common Workflow Language explained in 64 seconds.webm.ja.srt

1 00:00:00,000 --> 00:00:03,630 バイオインフォマティクス、医療用画像、天文学など多くの科学分野で、

2 00:00:03,629 --> 00:00:06,299 大量のデータを分析する必要があります。

3 00:00:06,299 --> 00:00:10,769 データ分析では、

4 00:00:10,769 --> 00:00:15,239 ワークフローと呼ばれる複数のツールからなるパイプライン処理を大規模なデータに対して反復的に実行することがあります。

5 00:00:15,240 --> 00:00:18,930 データに対して異なるツールを手作業で実行することや、 各ツールの出力を次のツールの入力形式に変換する作業は、

6 00:00:18,930 --> 00:00:21,950 非常に時間がかかる作業です。

7 00:00:21,949 --> 00:00:26,129 ワークフロー管理システムは、ワークフローを形式的に表現し、

8 00:00:26,130 --> 00:00:30,090 ワークフローのセットアップ、実行、監視を行うことで、これらの問題を軽減します。

9 00:00:30,090 --> 00:00:34,290 ワークフローを形式的に表現することで、研究者の間でワークフローを共有、

10 00:00:34,290 --> 00:00:38,400 再利用することが簡単になります。 さらに、この形式化されたワークフローは、

11 00:00:38,399 --> 00:00:43,109 論文で発表された計算結果の検証にも使用できます。

12 00:00:43,110 --> 00:00:46,580 しかしワークフローを記述する表現方法は数多くあるため、この目的は達成できていません。

13 00:00:46,579 --> 00:00:50,399 現在、数百種類以上のデータ解析ワークフローシステムがありますが、

14 00:00:50,399 --> 00:00:55,019 それらの間には相互運用性がありません。

15 00:00:55,020 --> 00:00:58,470 単一の共通の規格が必要なため、「Common Workflow Language」プロジェクトが始まりました:

16 00:00:58,469 --> 00:01:02,429 Common Workflow Language は、 YAML フォーマットのファイル群で

17 00:01:02,430 --> 00:01:05,540 ワークフローとツールを表現するオープンな規格です。