前言

党的二十大报告强调“必须坚持科技是第一生产力、人才是第一资源、创新是第一动力,深入实施科教兴国战略、人才强国战略、创新驱动发展战略,开辟发展新领域新赛道,不断塑造发展新动能新优势。”

在人工智能蓬勃发展的今天,深度学习已成为推动技术变革的重要力量,尤其在计算机视觉领域,深度学习技术引领着一波又一波的创新浪潮。从图像分类到目标检测,从图像分割到风格迁移,深度学习让计算机具备了前所未有的视觉理解能力。而在众多深度学习框架中,PyTorch以其灵活性和易用性,成为广大研究者和开发者的首选工具。

本书主要内容

本书旨在为读者提供一条从基础到实战的学习路径,帮助读者深入理解计算机视觉中的核心概念和技术,掌握使用PyTorch构建和优化深度学习模型的实战技巧。本书内容结构清晰,案例丰富,既适合初学者入门,也适合有一定基础的读者进一步提升技能。

全书共分为两部分,共12章。

第1部分基础篇,主要介绍了深度学习理论知识,包括第1~4章。第1章人工智能基础,包括人工智能概述、计算机视觉基础、深度学习在实际中的应用; 第2章深度学习的基本原理,包括神经网络的实现方法、梯度与自动微分、参数优化与更新策略; 第3章卷积神经网络的基本构建,包括卷积层的多种操作、可变形卷积技术、反卷积与目标分割、池化层的多重特性、全连接层的作用与影响、数据标准化和正则化; 第4章PyTorch的基本应用,包括PyTorch简介与环境搭建、PyTorch基本语法与操作、PyTorch中的自动微分、模型的保存与加载、跨设备模型加载、权重的修改与调整。

第2部分应用篇,主要列举了部分深度学习项目的实践案例,包括第5~12章。第5章分类识别技术与应用,包括应用背景、卷积神经网络的设计与构建、卷积神经网络的训练与评测、应用集成开发与界面设计; 第6章目标检测技术与应用,包括应用背景、目标检测的候选框生成策略、神经网络在目标检测中的应用、主干神经网络的选择与应用、单阶段目标检测模型、双阶段目标检测模型; 第7章基于视觉大数据检索的图搜图应用,包括应用背景、视觉特征提取、视觉特征索引、视觉搜索引擎、集成应用开发; 第8章验证码AI识别,包括应用背景、验证码图像生成、验证码识别模型、集成应用开发; 第9章基于生成式对抗网络的图像生成应用,包括应用背景、生成式对抗网络模型、集成应用开发; 第10章肺炎感染影像智能识别,包括应用背景、肺炎感染影像识别、集成应用开发; 第11章基于深度学习的人脸二维码识别,包括应用背景、QR编译码、人脸压缩、CNN分类识别、集成应用开发; 第12章污损遮挡号牌识别与违法行为检测,包括应用背景、理论基础、功能设计、功能实现。

本书特色

(1) 问题驱动,由浅入深。

在解决实际问题的过程中,逐步深入探究深度学习和计算机视觉的核心概念和原理,帮助读者建立系统的知识体系。

(2) 突出重点,强化理解。

通过精选的重点内容和深入分析,帮助读者深刻理解关键技术,并在应用中加深对知识的掌握。

(3) 注重理论,联系实际。

以PyTorch为工具,结合典型案例对理论进行讲解和演示,提升读者的动手能力和实践经验。

(4) 风格简洁,使用方便。

本书采用简洁明快的风格,提供实用的代码示例和丰富的项目案例,便于读者理解和实践操作。

配套资源

为便于教与学,本书配有微课视频、源代码、数据集、教学课件、教学大纲、教案、教学日历、教学进度表、案例素材、软件安装包、期末试卷及答案。

(1) 获取微课视频方式: 先刮开本书封底的文泉云盘防盗码并用手机版微信App扫描,授权后再扫描书中相应的视频二维码,观看教学视频。

(2) 获取源代码等方式: 先刮开本书封底的文泉云盘防盗码并用手机版微信App扫描,授权后再扫描下方二维码,即可获取。



源代码




数据集




案例素材




软件安装包




全书网址




(3) 其他配套资源可以扫描本书封底的“书圈”二维码,关注后回复本书书号,即可下载。

读者对象

本书主要针对广泛的读者群体,面向从事图像处理、人工智能、深度学习、计算机视觉等领域的专业人士,深度学习学科专任教师,人工智能、图像处理等专业的高校在读学生及相关领域的研究人员。


在本书的编写过程中,马振书、刘灵珊、兰征兴、张秦帆、康乐天、魏轩、赵艺萱、史玉琪等同学为书稿的完善作出了重要贡献,在此谨致谢忱。同时,作者在编著过程中,参阅了相关领域的文献资料,特向这些学术成果的创作者们致以诚挚的感谢。

限于个人水平和时间仓促,书中难免存在疏漏之处,欢迎广大读者批评指正。



作者2025年1月