计算机视觉是人工智能领域的一个重要组成部分,它的主要任务是对采集的图片或视频进行处理以获得相应信息。传统的计算机视觉算法的主要步骤是提取包括边缘、角点、颜色等图像特征,然后利用这些图像特征完成图像处理与机器学习的任务。传统算法的主要问题在于需要告诉系统在图像中寻找哪些图像特性。由于提取图像特征部分是人为设计的,在实现的过程中,对于算法、功能及阈值的更改都需要手工完成,这对高质量的项目实现造成了很大的障碍,而深度学习的出现解决了这一问题。当前,深度学习在处理计算机视觉子任务方面取得了重大进展。深度学习的最大不同之处在于它不再通过精心设计的算法来搜索特定的图像特征,而是通过训练大量的神经网络参数来实现。本书将从计算机视觉的四大关键技术出发,详细介绍基于深度学习的计算机视觉技术的基础理论、主要算法项目实战及代码实现。本书结合常见的人工智能应用场景,循序渐进地带领读者进入美妙的计算机视觉世界。   第1章介绍人工智能概述,对人工智能的发展历程及常见的应用案例进行详细介绍;第2章讲解卷积神经网络的基本原理,几种常见的深度卷积神经网络框架,并介绍图像分类的项目实战;第3章主要讲解目标检测的基本原理,几种典型的目标检测算法,并介绍目标检测的项目实战;第4章讲解图像分割的基本原理,几种典型的图像分割算法,结合项目实战使读者进一步理解图像分割算法;第5章介绍目标跟踪的基本原理,几种典型的目标跟踪算法,并通过项目实战介绍目标跟踪算法的实现过程;第6章讲解文字检测与识别系统的基本构成及原理,几种典型的文字检测及识别算法,并通过项目实战进一步介绍文字检测与识别的实现过程;第7章讲解多任务深度学习网络的原理、构建方法和实用技巧,并通过项目实例给出了易于理解的项目实战方法;第8章讲解生成对抗神经网络的基本原理,介绍几种典型的生成对抗神经网络算法,并通过项目实例介绍生成对抗神经网络的构建过程;第9章主要讲解怎样制作训练样本,包括数据的标注及数据增强两部分;第10章介绍Keras和API的安装方法;第11章介绍综合实验。按照以上章节介绍的理论及案例,就可以逐步开启计算机视觉的项目实战了。   时光荏苒,岁月如梭,转眼研究计算机视觉与神经网络已经近二十个年头了,感谢引领我进入这个领域的恩师谷荻隆嗣教授,在教授那里学习到的研究方法和学术态度让我受益终身。在漫长岁月里,由于计算资源的限制和一些结构上的缺陷,神经网络一度备受冷落,由衷地敬佩和感慨Geoffrey Hinton教授在这一领域锲而不舍地坚持和奉献,让深度学习真正地进入了产业界,解决了我在漫长二十年的学术生涯中遇到的多个百思不得其解的难题。同样感谢我的学生们的支持和奉献。本书的部分章节参考了我指导的研究生黄伟杰、裴柳、李博、李雪倩、支勇、王贝贝的硕士论文及毕业设计成果。在撰写书稿的过程中,重新翻开同学们的毕业论文,在一起奋战的日日夜夜一幕幕地浮现在眼前。传承、融入、影响、身教、合作、困惑与顿悟汇成了我对计算机视觉的全部理解。 编 者   2021年7月