前言 人工智能(Artificial Intelligence, AI)已经成为新一代工业生产和生活方式变革的核心驱动力,正在对各行各业产生深远的影响。通俗来说,人工智能就是使用人工的方法在计算机上实现的智能。人工智能领域中,机器视觉和深度学习是最为活跃的研究方向,也是目前人工智能领域中最受关注的广泛性技术应用。 随着智能制造的深入推进,机器视觉以其非接触式感知、处理速度快和计算精准等优点,广泛应用在物流跟踪、质量检测和安全监控等各种工业场景。传统的数字图像处理方法,如滤波、边缘检测、分割、纹理特征提取和形态学运算等,对于复杂工业场景的机器视觉已经显得越来越“力不从心”,而将深度学习与传统数字图像处理方法结合,以深度学习为主构建识别、检测和分割模型,以传统数字图像处理方法进行预处理、后处理或辅助处理,已经成为工业场景中主流的技术路线。因此,传统数字图像处理方法与深度学习方法正在进行深度融合,以构建更加可靠、更高精度、更快速度的机器视觉系统。本书内容组织如下。 第1章对数字图像、图像数字化过程、工业数字图像、机器视觉系统组成及开发过程等基础知识进行概述,从硬件、软件两个角度展现实际的机器视觉系统的全貌,揭示传统数字图像处理方法和深度学习方法对构建机器视觉系统的重要作用。 第2章对基于传统方法的数字图像处理进行一般性介绍,以像素及像素之间的位置关系为主线,涉及像素的算术和逻辑运算、图像滤波、边缘检测、图像分割、纹理计算和形态学运算等常见的计算和处理方法,掌握对图像或图像中感兴趣目标的颜色、形状以及纹理等特征进行分析和抽取的经典方法。同时,本章通过实际案例分析基于传统方法进行数字图像处理的优点和不足。 第3章对基于深度学习的数字图像处理进行全面介绍,涉及人工智能、机器学习、深度学习的基本概念,深度学习的训练、损失函数设计、评价指标计算等基本方法,深度学习模型开发的一般过程,普通神经网络的基本结构,深度卷积神经网络的基本算子,代表性的深度卷积神经网络以及深度卷积神经网络中的新技术,使读者深入理解深度卷积神经网络对数字图像进行特征抽取的原理和过程,体会深度学习应用于工业数字图像处理和机器视觉系统开发的优势。〖1〗数字图像处理与深度学习第4章以钢铁工业中的字符识别问题为任务,介绍使用传统数字图像处理方法进行识别的一般过程,对传统数字图像处理方法应用于实际工业场景的不足和局限性进行了简单分析,对两阶段目标检测的深度卷积神经网络发展、原理和应用进行重点讨论,展示使用深度学习方法进行工业场景中较为简单的目标检测的案例。 第5章以磨粒图谱识别与分割问题为任务,介绍铁谱分析技术、设备磨损机理和磨粒图谱,对使用传统图像处理方法提取磨粒颜色、形状和纹理特征进行展示,同时对使用深度卷积神经网络进行磨粒图谱检测并使用传统数字图像处理方法对检测出的目标区域进行分割的全过程进行详细讨论,展示结合深度学习方法和传统图像处理方法进行工业场景中较为复杂的目标检测和分割的案例。 第6章以X射线的焊缝缺陷识别为任务,介绍射线检测技术、射线检测成像方式、焊缝缺陷中的典型图谱,系统讨论焊缝缺陷识别的困难和应对策略,基于两阶段目标检测的深度卷积神经网络,面向多尺度、小目标检测任务,对数据扩增方法、特征金字塔网络等进行重点介绍,系统、完整地展示以深度学习为主、以传统数字图像处理方法为辅的技术路线,以应对工业场景中的多尺度、小目标、边缘模糊等困难的检测任务。 第7章为嵌入式机器视觉系统开发,针对机器视觉深度学习模型在边缘进行部署的需求,简单介绍边缘计算的基本概念以及常见的嵌入式机器视觉开发板,对适合边侧部署和推理的轻量级卷积神经网络MobileNet进行较为详细的讨论,同时对一阶段目标检测算法SSD的原理进行概要描述,最后以实际案例展示嵌入式机器视觉系统开发的过程。 第8章对传统数字图像处理算法库OpenCV和深度学习框架PyTorch进行概要介绍,为本书相关内容的实践奠定基础。本章内容在实际教学过程中,可根据需要灵活组织。 本书共8章,第1、2章由李莉编写,第3~8章由汪红兵编写。全书由汪红兵统稿。在本书编写过程中,得到黄蓉、魏书琪、高丽园、陈新坜、康帅、刘靖谊、季晨、王佐铭、霍云、李航、周建飞、张文翰、杨灏瀛、闫岩、赵文慈等研究生同学的大力协助,在此一并表示感谢。 此外,本书第4章“工业字符智能识别”、第5章“磨粒图谱识别与分割”、第6章“射线检测的焊缝缺陷识别”及第7章“嵌入式机器视觉系统开发”,是在课题组承担的科研项目基础上总结提炼而成的,书中使用了课题相关单位提供的一些图谱和素材,在此表示最诚挚的感谢。 感谢各位审稿专家对本书的编排提出的宝贵意见。本书的编写得到了北京科技大学教材建设经费的资助,在此一并谢过。 由于作者水平有限,书中错误在所难免,恳请读者批评指正。 编者 2023年2月