2018年数据科学与机器学习成熟曲线

现今许多产业都相当热衷于发展数据科学与机器学习,根据Gartner 2018年的调查报告显示,77%的高阶主管认为数据科学能为企业带来相当显著的价值或将成为企业的基础。许多技术正稳定攀升至技术成熟曲线中的过度期望高峰期,不过多数的企业仍处于探索数据科学与机器学习的早期阶段。

Gartner报告中具颠覆性效益的技术包含:2-5年内可能被产业应用的机器学习(Machine Learning)、公民的数据科学(Citizen Data Science) 、深度神经网络(Deep Neural Nets)、事件串流处理(Event Stream Processing, ESP)与扩增分析(Augmented Analytics);5-10年内可能被产业应用的技术为认知运算(Cognitive Computing)与本年度新增的连续性智慧(Continuous Intelligence);10年以上则仅有通用人工智能(Artificial General Intelligence)。

本文将摘录近年来与数据科学、机器学习与人工智能有关的趋势发展,并介绍皆处于过度期望高峰期的机器学习与公民的数据科学,其市场渗透率皆为5-20%。

一、 近年来数据科学、机器学习与人工智能(AI)间的关联性与发展持续受到重视,加以下列趋势让各界持续热衷于上述技术。

  • (一) AI仍是最众所瞩目的议题,加上供应商的行销-语意学(semantics)的战争,以及数据科学与机器学习整并成容易让人理解的AI。
  • (二) 数据科学与机器学习的人才持续不足,要因应人才短缺问题,需要教育、提升技能,以及如公民的数据科学、扩增分析与自动化机器学习这类的创新。
  • (三) 运算能力与进阶系统架构不断提升,更有效率与能力的晶片组可用于扩充机器学习的架构,且云端服务商针对机器学习应用程式介面(API)与模型建立与设置的特定运算能力,提供以使用量计价的收费方式。
  • (四) 数据科学与机器学习的开放原始码(open-source)工具与程式库(library)持续风行,数据科学与机器学习社群相当活跃且相互合作,并十分支持开放原始码技术。新进者与既有提供者皆对于开放原始码的语言、工具、程式库与架构提供一流的支援。
  • (五) 更快与自动化的模型建立、选定与设置仍为关键趋势,因模型管理能处理产品内成千上万种的模型与其他操作需求。

二、 公民的数据科学

  • (一) 定义:公民的数据科学是一套新兴能力与实作,能让使用者自资料中提出进阶分析见解,而不需要具备广泛的数据科学专长。促使公民数据科学发展的主要核心为扩增分析能力快速进展,其能简化资料准备、提供数据科学使用指南(包含相关性、集群(Clustering)与预测),以及透过自动化模型建立与型态侦测强化使用者的见解,并进而促使众人合作与分享。
  • (二) 现况:现行的模型分析与商业智慧(Business Intelligence, BI)通常多以手动方式准备资料、探索资料与某些模式(pattern)辨识。但是建立数据科学与机器学习模型的专家大多是昂贵且缺乏人才,公民数据科学的工具能透过自动化与特征选定,引导使用者完成终端对终端的模型建立程序。
  • (三) 商业影响:公民数据科学是新世代使用者的分析基础,这将使数据科学和机器学习的见解(Insight)更容易在企业中普及和取得。公民数据科学家将能填补目前短缺且高成本的数据科学与机器学习人才之缺口。将公民的数据科学家纳入分析生命周期的特定阶段,可让组织内的数据科学与机器学习资源更具可扩展性与集中使用。举例来说,若在计画的探索阶段纳入公民的数据科学,能让具备高技巧的数据科学家可更专注于尖端模型建立阶段。 Gartner预测,未来数年内,更为普及的公民的数据科学将提升整个企业的数据科学能力;2020年前将有超过40%的数据科学任务被自动化,并因此提高公民数据科学家的生产力;在2024年前,缺乏数据科学家的情况将不再影响企业采用数据科学与机器学习。透过自动化产出与优先提供具统计意义的见解予使用者,将能强化使用者的发现能力。

三、 机器学习

  • (一) 定义:机器学习是利用数学模型从资料中萃取型态与知识,来解决商业问题。主要分为三种方式:监督式学习(观察值包含成对式的输入与输出,亦称为标签资料)、非监督式学习(无标签),以及强化学习(评估情况的好坏)。
  • (二) 现况:机器学习仍是最热门的技术概念之一,不断成长的资料数量与复杂性是促使机器学习快速发展与采用的主要原因,越来越多的企业正探索着如何应用机器学习并已有相关试验计画,且技术提供者正在尝试把机器学习的能力内嵌至软体中。不过多数企业对于机器学习仍仅只处在浅尝阶段,因找寻执行机器学习所需的角色与相关技能,对企业来说仍相当具有挑战性。当资料来源的数量越来越多,系统的复杂度也将持续提高,在这样的情境下,估计未来许多产业的发展将需要有机器学习的协助。
  • (三) 商业影响:机器学习驱动跨业务、顾客与社交情境的业务问题改善与新解决方案,包含自动化、药品研发、顾客参与、最适化供应链、预测性维护、运作效率、劳动力效率、诈欺侦测与资源最适化。

关注我们的公众号获取更多信息:

2018年数据科学与机器学习成熟曲线

本文来自互联网,不代表前途科技立场,如若转载,请注明出处:https://accesspath.com/tech/5672239/

(0)
NEXTECH的头像NEXTECH
上一篇 2018年8月16日 上午12:00
下一篇 2018年8月23日 上午12:00

相关推荐

发表回复

您的电子邮箱地址不会被公开。 必填项已用*标注