沃卡惠移动端logo

沃卡惠  行业资讯

资讯详情

人工智能不会以数据集结束

2022-09-16 09:30:224636

<a href=https://www.wokahui.cn/ai/ target=_blank class=infotextkey>人工智能</a>不会以数据集结束

我记得我在AI领域的本科教授说:“AI是他们所谓的机器智能,他们还没有完全理解。一旦他们理解了它,它就不再被认为是人工智能。一旦机器人技术被很好地理解,它就不再是人工智能,而是成为了它自己的分支。一旦计算机视觉被理解,它就变得独立了。语音识别和自然语言处理也遵循了这条路线。”也许,唯一一个被充分理解但对人工智能如此重要以至于分离会使人工智能变得毫无意义的领域是机器学习,这是一门使用复杂的数学密集型算法来插入潜在函数的科学。正是由于这种特殊的地位,我们有时会得到诸如“人工智能和机器学习”之类的口号,这有点像在说“数学和微积分”。

机器学习(包括更著名的分支“深度学习”)当然是至关重要的。ML算法在许多AI领域都很常见,它们是非常深奥的关键,它可以帮助机器从一些晦涩的输入中猜测出期望的结果。将数据集加载到模型中,瞧——你得到了预测。ML实现了这一点。媒体得到消息。如果你阅读了这些天最流行的文章,你可能会相信人工智能会神奇地解决所有问题。总体配方对于错误来说是平庸的-收集数据集,找到可以插入问题复杂性的ML算法,训练模型并收集现金。简单的。

然而,正如任何真正的人工智能从业者都知道的那样,机器学习虽然至关重要,但并不是问题的核心。GoogleML研究人员的一篇开创性NIPS论文深入解释了机器学习只是AI应用程序的一小部分。大部分工作围绕着优化管道、收集干净的数据和提取适合ML模型并在动态环境中可维护的特征。这在自然语言理解中尤其明显,为了提取分类器模型可口的特征,需要解决拼写错误、词干、停用词、消除歧义实体引用,可能,查看上下文,了解人们经常使用虚构单词,准备好慢慢变化的词汇和主题分布,以及无数其他事情。

有人可能会问,为什么不完全跳过这一点,将任务加载到一个强大的深度学习盒子中呢?当然,我们可以用数据建模的复杂性来换取在训练阶段花费更多的时间吗?好吧,祝你好运。你试过用年轮预测天气吗?它们是相关的……您的机器应该能够找到从一个到另一个的路径。问题是,到那时你可能已经在地下安静地休息了很久。一些用于预测天气的最强大的超级计算机仍然做出不准确的预测。有一个原因——计算的指数复杂性不是开玩笑。

这就是领域专业知识变得无价的地方。简而言之,人类专家可以通过为机器提供快捷方式来减少许多不必要的计算。这是通过使用人类专家多年来在特定领域积累的知识对推理路径进行建模来完成的。继续使用NLU,一个很好的例子是使用来自语言学的信息来丰富数据,例如词性、句子结构(即解析树)、正字法等。要了解其好处,请考虑如何有效地管理复杂的项目。您要做的第一件事是将其分解并建立中间里程碑。这些范围更小,更容易定义,因此更容易达到。然后将实现更大的整体简化为达到每个中间里程碑,这更容易定义和跟踪。

但建模不仅仅是走捷径。训练数据集的支持者忽略了过多的领域,甚至很难定义如何编译数据集进行训练。这意味着人们将很难向注释者(用预期结果标记数据集的人)解释如何为每个数据样本得出预期结果的逻辑。有时,标签的模糊性使事情变得复杂。其他时候,是分析输入数据的复杂性——可能完全不可能向人类提供所需的感官数据。在物理世界中,某些测量值可能对注释器很危险(例如,如果您的输入是气体)。这些情况中的每一种都会立即使收集数据的整个过程从一开始就变得不可行。

可能值得重新检查所有从人工智能“分支”的领域。其中一个共同的主题是领域建模和知识的数量惊人。例如,机器人技术依赖于运动物理学、力学、材料、电气工程、光学和其他更基础的科学。虽然最终结果可能是将图像输入CV单元,但大部分“魔法”实际上发生在此之前。换句话说,制造“神奇”人工智能应用程序的根本不是ML,而是描述系统进行预测的领域的公理、定理、测量、调整等的混合物。ML只是锦上添花。这些领域的应用程序不依赖机器将输入与输出相关联,而是将领域知识放在首位,自下而上地构建他们的技术——从基本规则到复杂系统,可能会在一些步骤中与ML连接起来。它们的整体构成始终由领域逻辑驱动。

这样做的好处是很多的。首先,您不再需要严重依赖手动数据收集,正如我们所讨论的,手动数据收集充满了限制和错误。这样可以更全面地覆盖您的域。想一想你想要什么,一个2个数字相乘的规则,还是一个列出不同对可达数字乘积的无限表?其次,您能够向最终用户解释推论。

与其强调你的反向传播是如何在第7个隐藏层上进行的,你可以解释它是一个具有真实英文名称的特定领域特征,它对结果的影响最大。第三,它允许更清洁的产品组装以及用更优化的实现替换组件的能力。尝试使用ML管道来做到这一点!(这是值得再次阅读上述NIPS论文的地方)

那么,你可能会问?到目前为止,您可能同意域建模对于有效实施至关重要。您决定聘请领域专家并继续前进。还有更多吗?是的!因为领域建模对于AI应用如此重要,它也可以作为寻找新的AI未开发应用的指南针!换句话说,为了寻找新的机会,寻找一个数据难以收集的领域,而一般的领域环境很好理解,只是缺乏自动化。正是在那些空间中,人们可以通过一个简单的ML桥来缩小两个领域知识集群之间的小差距,并突然获得更令人印象深刻的结果。而且,与“我们将所有事物与所有人群相关联”不同,您将拥有完整的域覆盖范围、更好的描述能力,以及最终,