让计算机从经验获取知识,可以避免由人类来给计算机形式化的指定它所需要的所有知识。层次化的概念让计算机构建较简单的概念来学习复杂概念。如果绘制出表示这些概念如何建立在彼此之上的图,我们得到一张“深”(层次很多)的图。基于这个原因,我们称这种方法为 AI 深度学习(deep learning)。
人工智能的一个关键挑战是如何将非形式化的知识传达给计算机。
一些人工智能项目力求将关于世界的知识用形式化的语言进行硬编码(hard-code)。这就是众所周知的知识库(knowledge base)方法。
依靠硬编码的知识体系面临严重的缺陷,AI 系统需要具备自己获取知识的能力,即从原始数据中提取模式的能力。这种能力称为机器学习(machine learning)。
许多人工智能任务都可以通过以下方式解决:先提取一个合适的特征集,然后将这些特征提供给简单的机器学习算法。然而,对许多任务来说,我们很难知道应该提取哪些特征。解决这个问题的途径之一是使用机器学习来发掘表示本身,而不仅仅是把表示映射到输出。这种方法称之为表示学习(representation learning)。
表示学习算法的典型例子是自编码器(autoencoder)。自编码器由一个编码器(encoder)函数和一个解码器(decoder)函数组合而成。
显然,从原始数据中提取高层次、抽象的特征是非常困难的。许多诸如说话口音这样的变差因素(factors of vatiation),只能通过对数据进行复杂的、接近人类水平的理解来辨识。这几乎与获得原问题的表示一样困难,因此,乍一看,表示学习似乎并不能帮助我们。
深度学习(deep learning)通过其他较简单的表示来表达复杂表示,解决了表达学习中的核心问题。