前言 人工智能经历了3次发展浪潮,其中第三次是深度学习的复兴,就目前来看似乎还处在循环的前半段: 技术突破先前的局限而快速发展,投资狂热,追随者甚多。问题是现在的热潮是技术萌芽期的过分膨胀还是昙花一现且将逐渐冷却后进入寒冬?Keras之父Francois Chollet总结了深度学习自身的特质——简单、可扩展、多功能与可利用,并称它确实是“人工智能的革命,且能长盛不衰”。李开复也曾总结第三次浪潮是由商业需求主导的,而这次更多的是解决问题。 那是不是每个人都要学习人工智能、深度学习呢?计算机工程越来越庞大和细分,方向繁多,诸如前端、后端、测试等,纵然是计算机从业人员,到后来大多也只能集中精力在一个方向上深入。实质上,深度学习更像是一种新的思维,能补充我们对计算机乃至世界运行规律的理解。深度学习将传统机器学习中最为复杂的“特征工程”自动化,使机器可以“自主地”抽象和学习更具统计意义的“模式”。 深度学习如何高效入门可以说是AI领域老生常谈的一个问题,一种思路是从传统的统计学习开始,然后跟着书上推导公式学数学; 另一种思路是从实验入手,通过学习深度学习框架TensorFlow和Keras以及具体的图像识别的任务开展。 本书为什么会在众多语言当中选择Python实现深度学习呢?其主要原因如下: Python是一种效率极高的语言; 相比其他语言,Python语言简单、易学、易读、易维护。 另外,对程序员来说,社区是非常重要的,大多数程序员都需要向解决过类似问题的人寻求建议,在需要有人帮助解决问题时,有一个联系紧密、互帮互助的社区至关重要,Python社区就是这样一个社区。 本书立足实践,以通俗易懂的方式详细介绍深度学习的基础理论以及相关的必要知识,同时以实际动手操作的方式引导读者入门人工智能深度学习。本书编写特色主要表现在: 1. 内容浅显易懂 本书不会纠缠于晦涩难懂的概念,整本书力求用浅显易懂的语言引出概念,用常用的方式介绍编程、用清晰的逻辑解释思路,帮助非专业人员理解神经网络与深度学习。 2. 知识点全面,实例丰富 深度学习涉及面较广,且有一定的门槛。没有一定广度很难达到一定深度,所以本书内容包括机器学习、深度学习的主要内容。书中各章一般先介绍相应的架构或原理,再通过相应的经典实例进行说明,帮助读者快速领会知识要点。 3. 图文并茂,实用性强 在深度学习中,有很多抽象的概念、复杂的算法、深奥的理论等,如果只用文字来描述,很难达到使读者茅塞顿开的效果,如果用一些图形进行展现,再加上文字注明,那么呈现的效果是一目了然的。 4. 实用性强 本书在理论上突出可读性并兼具知识的深度和广度,实践上强调可操作性并兼具应用的广泛性。书中每章都做到理论与实例相结合,内容丰富、实用,帮助读者快速领会知识要点。并且书中源代码、数据集等读者都可免费获得。 全书共10章,每章的主要内容如下。 第1章掀开深度学习的面纱,主要包括深度学习是什么、机器学习与深度学习、深度学习的应用领域与架构等内容。 第2章神经网络的数学基础,主要包括认识神经网络、神经网络的数据表示、张量运算、梯度优化、神经网络剖析、Keras介绍等内容。 第3章机器学习的基础,主要包括机器学习概述、过拟合和欠拟合、监督学习与数据预处理等内容。 第4章神经网络分析与应用,主要包括单层感知器、激活函数、解决XOR问题、优化算法等内容。 第5章计算视觉分析与应用,主要包括从全连接到卷积、卷积神经网络、现代经典网络、卷积神经网络CIFAR10数据集分类等内容。 第6章文本和序列分析与应用,主要包括处理文本数据、循环神经网络、ACF和PACF、循环神经网络的应用等内容。 第7章目标检测分析与应用,主要包括目标检测概述、目标检测法、典型的目标检测算法等内容。 第8章生成式深度学习分析与应用,主要包括使用LSTM生成文本、DeepDream算法、风格迁移、深入理解自编码器、生成对抗网络等内容。 第9章人脸检测分析与应用,主要包括KLT、CAMShift跟踪目标、OpenCV实现人脸识别、HOG识别微笑、卷积神经网络实现人脸识别微笑检测、MTCNN算法实现人脸检测等内容。 第10章强化学习分析与应用,主要包括强化学习的特点与要素、Q学习、深度Q学习、双重深度Q网络、对偶深度Q网络、深度Q网络经典应用等内容。 本书可作为高等学校相关专业本科生和研究生的教学用书,也可作为相关专业科研人员、学者、工程技术人员的参考用书。 本书是由佛山科学技术学院丁伟雄编写。 由于时间仓促,加之作者水平有限,书中疏漏之处在所难免,诚恳地期望得到各领域的专家和广大读者的批评指正。 作者2024年6月