TimedText:Common Workflow Language explained in 64 seconds.webm.zh-hans.srt
1 00:00:00,000 --> 00:00:03,629 在许多科学领域(例如生物信息学,医学成像和天文学)
2 00:00:03,629 --> 00:00:06,299 中,需要分析大量的数据。
3 00:00:06,299 --> 00:00:10,769 在很长的流水线中运用不同的工具会涉及许多大规模和重复性流程
4 00:00:10,769 --> 00:00:15,240 (称为工作流程)。
5 00:00:15,240 --> 00:00:18,930 手动导入数据到这些不同工具的数据,
6 00:00:18,930 --> 00:00:21,949 并将其输出转换为不同的格式使其与下一步兼容,将会非常耗时。
7 00:00:21,949 --> 00:00:26,130 工作流管理系统旨在通过允许这些工作流程有条理的表达并提供基础设施来设立,
8 00:00:26,130 --> 00:00:30,090 执行和监视这些工作流来缓解此问题。
9 00:00:30,090 --> 00:00:34,290 这种工作流的正式表达允许科学家轻松地共享和重用它们。
10 00:00:34,290 --> 00:00:38,399 关键的是,它们也可用于去验证那些已发布工作的计算结果。
11 00:00:38,399 --> 00:00:43,110 然而,
12 00:00:43,110 --> 00:00:46,579 有许多相互争论的方法来描述工作流程,这是对目标实现的障碍。
13 00:00:46,579 --> 00:00:50,399 目前,有超过一百种不同的数据分析工作流系统之间没有互操作性。
14 00:00:50,399 --> 00:00:55,020 我们需要有一个共同的标准,
15 00:00:55,020 --> 00:00:58,469 因此创建了“通用工作流程语言”项目:
16 00:00:58,469 --> 00:01:02,430 一个开放标准,
17 00:01:02,430 --> 00:01:05,539 旨在表达工作流程及其在YAML结构化文本文件组中的工具。