前言 近年来,随着深度学习技术的革新、GPU计算性能的突破、互联网数据的激增,图像处理领域的研究蓬勃发展,尤其在自动驾驶、智能安防、智慧城市、医疗保健、商业零售、航空能源、虚拟现实等诸多人工智能热门领域,图像处理技术落地开花,熠熠生辉。图像处理研究工作在学术界和工业界取得的巨大成功,每年吸引着数以万计的研究人员蜂拥而至,甚至生物医学、机械制造、自动化、土木建筑等诸多跨专业的从业人员也开始涉猎研究。对于非计算机相关专业的读者而言,学习过程中往往因缺少交流机会,不容易把握深度学习与图像处理知识的全貌,并且该领域知识更新迭代快,新的理论层出不穷,如何在日新月异的知识体系中抽丝剥茧,掌握核心的算法精髓显得尤为重要,这也是撰写本书的根本原因。 本书内容 本书以图像处理技术作为切入点,围绕近些年流行的深度学习算法进行讲解,研究方向包括图像分类、目标检测、语义分割、实例分割、关键点检测和风格迁移等,重点剖析了各个图像处理领域常见的算法原理,并在此基础上结合新颖实用的项目案例贯穿所学,让读者在掌握算法原理基础上能够达到产业界要求的深度学习实战能力。 本书项目案例采用国产开源深度学习框架PaddlePaddle来实现,考虑到易用性以及未来发展趋势,全部采用最新的动态图版本进行编写。 全书分为两部分,共8章,在内容安排上循序渐进。第1部分基础知识(第1、2章),第1章图像处理基础,第2章深度学习基础; 第2部分案例应用(第3~8章),第3章图像分类(智能垃圾分拣器),第4章目标检测(二维码扫码枪),第5章语义分割(证件照制作工具),第6章实例分割(肾小球影像分析仪),第7章关键点检测(身份证识读App),第8章风格迁移(照片动漫化在线转换网站)。 本书特色 (1) 理实结合,强调实用。本书以基础知识点精讲与实战开发案例相结合的方式,由浅入深地带领读者掌握深度学习与图像处理开发的原理和技术。 (2) 实战开发,案例丰富。手把手带领读者完成8个完整工程项目案例开发,并对其采用的算法原理进行详解,同时提供源代码和数据集,便于读者复现。 (3) 内容翔实,讲解全面。部署方案齐全且详细,涵盖Jetson Nano边缘计算、树莓派嵌入式、Qt客户端、C#工控程序、安卓App、HTTP微服务等。 配套资源 为便于教与学,本书配有丰富的配套资源,包括微课视频、源代码、教学课件、教学大纲、教学进度表、教案、期末试卷及答案。 (1) 获取微课视频方式: 先刮开并用手机版微信App扫描本书封底的文泉云盘防盗码,授权后再扫描书中相应的视频二维码,观看教学视频。 (2) 获取源代码、彩色图片和全书网址方式: 先刮开并用手机版微信App扫描本书封底的文泉云盘防盗码,授权后再扫描下方二维码,即可获取。 源代码 彩色图片 全书网址 (3) 其他配套资源可以扫描本书封底的“书圈”二维码,关注后回复本书书号,即可下载。 读者对象 本书可作为全国高等学校计算机、人工智能等专业的“深度学习”课程教材,主要面向相关领域的教师、在读学生和科研人员,以及从事深度学习与图像处理的工程技术人员和爱好者。 写给读者 阅读本书前需要读者具备Python基础语法知识及基本的数学背景知识(如向量、矩阵、求导等)。 通过阅读本书,希望读者能够掌握常见的深度学习与图像处理概念,并构建出一套自己的知识脉络; 能够深入了解图像分类、目标检测、语义分割、实例分割、关键点检测、风格迁移等技术在各个领域的处理方法; 能够借鉴本书项目案例运用到实际的研究或工作任务中,举一反三,学以致用。 本书在项目部署部分涉及多门编程语言和编程框架,知识点较多,如果在学习本书前没有完全掌握本书软硬件涉及的相关知识,那么也不必立即打退堂鼓,可以先尝试性地跟着本书 “跑起来”,熟悉掌握了整个开发流程后,再逐个对知识点进行学习。这种靶向型、实践型的学习方式未尝不是一种有效的学习范式。 致谢 在本书的撰写过程中,感谢南京理工大学沈肖波教授和北京工业大学同磊副教授对本书的建议,感谢俞晓燕、赵婷和朱妤梦为本书提供的人像素材,感谢无锡儿童医院成芸医师对本书医学影像数据的专业标注。 由于时间仓促,加之作者水平有限,错误和疏漏之处在所难免。在此,诚恳地期望得到各领域的专家和广大读者的批评指正。 作者2024年7月