沃卡惠移动端logo

沃卡惠  技术前沿

资讯详情

机器学习与统计有什么区别?

2022-12-08 17:19:314636

我们如何预测和解释未来趋势和结果并不是一个简单的过程。即使拥有世界上最好的意志和数据科学家,它也不会也不能总是 100% 正确。在当今时代,这通常是机器学习或统计学发挥作用的地方。

历史一直依赖人类在决策时检查和解释统计数据。不过,现在机器学习的出现使计算机成为回答“接下来会发生什么?”这一重要问题的核心。

人工智能 (AI)和分析驱动的模型正在成为常态。然而,在采用机器学习方法与采用统计方法的好处之间仍然存在真正的混淆。这些差异甚至延伸到教育途径和职业机会,包括机器学习课程与统计学的替代方案。

机器学习与统计有什么区别

什么是机器学习?

机器学习使用计算机来识别数据中的模式,而不需要计算机遵循明确的指令。相反,他们使用初始算法和模型进行编程,并学习根据输入的数据调整这些算法和模型以提供答案。然而,这也意味着对结果的人为控制较少。

TurinTech 的联合创始人 Michail Basios 博士说:“机器学习模型旨在提供准确的预测,而无需显式编程。机器学习模型可以提供更好的预测,但更难理解和解释它们。”

什么是统计数据?

统计模型根据数值数据进行预测。这通常是通过询问人们并要求他们做出选择而获得的;例如,它是政治和选举投票的运作方式,或消费者购物调查。人类的参与通常更多地涉及对这些数据的解释。“虽然一些统计模型可以做出预测,”Basios 解释说,“但这些模型的准确性通常不是最好的,因为它们无法捕捉数据之间的复杂关系。”

机器学习和统计之间的主要区别是什么?

出于机器学习的目的,统计数据将被输入计算机,但这两种方法之间有一个关键区别。谢菲尔德大学教授、Peak Indicators 人工智能和数据科学负责人 Paul Clough 表示,这种差异不在于数据的分析方式,而在于目标或期望的结果。

Clough 举了一个例子,衡量一只母鸡吃的鸡饲料量与它下的蛋的数量。“统计分析旨在解释饲料量如何影响产蛋数,”他说。“预测性 [机器学习] 分析将使用这些数据来预测农民下周将获得多少鸡蛋。”

您什么时候会使用机器学习而不是统计数据?

Clough 的鸡蛋类比有助于进一步探索这一点。“机器学习模型不会告诉你任何关于经营一个更高效的农场的信息,”他建议道,“而如果你拥有数万只鸡,统计模型就会变得笨拙。”

在查看庞大的数据集时,机器学习可以更优化。许多人承认,当数据水平很高时,统计数据无法对数据之间的关系和相关性进行更深入的分析。

它们也不能依赖于因果关系、概率和确定性,因为危险是它们可能被误解或故意滥用以支持特定论点。正如那句名言所说:“有谎言,该死的谎言,还有统计数据。”人类的参与是统计中的一个弱点。

然而,Basios 解释说,当你理解“变量之间的特定交互作用”和“对它们的关系有先验知识”时,你可以应用统计建模。同时,机器学习可用于实现“高预测准确性”。

它倾向于更多地“部署”在数据源;随着数据的收集和增长,算法会自动开始提供情报。例如,在制造业中,它可以预测机器何时需要维护,从而减少中断。它还可以分析一个选项与另一个选项的比较——预测哪个结果会更好。

你什么时候会选择统计而不是机器学习?

Capgemini 智能行业首席架构师 Graham Upton 表示,统计数据对于理解需要更深入思考的特定问题点以及生成指标、表格和 KPI 仍然很有用。事实上,根据奇点大学 IEEE AI 伦理工程师 Eleanor Watson 的说法,统计是一种以人为中心的方法,很容易解释,而机器学习则很难解释。

尽管机器学习在具有复杂模式的情况下可能“更强大”——例如,那些变量太多而人类无法管理的情况——人们不应该依赖最强大的工具来解决问题。她警告说:“当优秀的老式数据科学成本更低、速度更快时,公司通常会使用 AI 的手提钻通过外科手术来解决问题。”“数据科学比机器学习更能支撑现代经济,但它仍然是一个无名英雄。”

机器学习和统计学都有作用吗?

政府、企业和组织越来越依赖机器学习和传统统计数据来帮助他们做出更好更快的决策。但是,每种方法都有其自身的缺点需要考虑。

“统计模型的预测准确性有限,因为有时模型的基本假设过于严格,无法代表现实,”Basios 说。“当今的企业正在采用结合统计建模和机器学习特征的混合方法,以深入了解底层模型的工作原理并生成准确的预测。”

机器学习和统计学的未来会怎样?

Quantellia 首席科学家 Lorien Pratt 博士强调说,决策智能 (DI) 是未来的理解空间。她解释说,它连接了技术和我们为构建我们的世界所做的成百上千次的日常决定。

“有一类问题——从日常业务战略到气候变化的现实——涉及无形资产、复杂的系统动力学和人机交互,”她说。“机器学习作为人工智能的一种‘增压’形式,可以消除噪音并产生真正的影响。”

Pratt 继续说道:“与其从思考我们拥有的数据开始,关键是首先询问我们想要什么结果以及可以采取什么行动来实现这些结果,然后将数据融入到行动中。结果路径。”