前言 创新正是领导与员工的区别所在。 —史蒂夫·乔布斯(Steve Jobs) 你的驾驶技术如何?你会比自动驾驶系统的驾驶技术更好吗?或者你认为在医学图像分类方面,某种算法会比专家表现得更好吗?这可能是一个比较棘手的问题。但是,人工智能目前已经在通过图像分析检测肺癌和乳腺癌方面超过了医生。 大自然非常仁慈地赐予了我们视觉、味觉、嗅觉、触觉和听觉的能力。在这些感官之中,视觉的力量让我们能够欣赏世界的美丽,享受色彩,识别家人和所爱之人的面孔,更重要的是享受这个美丽的世界和生活。随着时间的推移,人类提升了大脑的力量,并做出了开创性的发明和发现。车轮或飞机、印刷机或时钟、灯泡或个人计算机——这些创新已经改变了我们的生活、工作、旅行、决策和进步的方式,让生活变得更简单、更容易、更愉快和更安全。 数据科学和深度学习能够进一步提升创新的可能性。通过深度学习可以复制大自然赋予的视觉力量。计算机通过训练可以执行与人类相同的任务。它可以检测颜色、形状或大小,对猫、狗或马进行分类,或者在道路上行驶——应用案例不胜枚举。这些解决方案适用于零售、制造、金融服务和保险、农业、安全、运输、制药等行业。 本书重点介绍和解释与计算机视觉问题相关的深度学习和神经网络概念。书中详细研究卷积神经网络以及各个组成部件和属性,探索各种神经网络架构,介绍了LeNet、AlexNet、VGG、RCNN、Fast RCNN、Faster RCNN、SSD、YOLO、ResNet、Inception、DeepFace和FaceNet等模型的细节。书中使用Python和Keras作为解决方案的开发工具,开发实用的解决方案,用于解决二值图像分类、多类图像分类、目标检测、人脸识别和视频分析等实际问题。所有的代码和数据集都被收录至GitHub repo,读者可以快速访问这些资源。最后一章探讨了深度学习开发项目中的所有步骤——从定义业务问题到计算机视觉系统的部署,以及如何处理在制订解决方案时面临的重大错误和问题。本书提供了能够进行更好训练的算法技巧,减少训练时间,能够及时地监测结果并改进解决方案。书中还分享了很多优秀的研究论文和数据集,建议读者深入阅读并获得更多知识。 本书适合想使用深度学习来探索和实施计算机视觉解决方案的研究人员和学生。本书面向实际应用,因此推荐给打算探索前沿技术、掌握先进概念、深入了解深度学习架构并获得最佳实践和解决方案、迎接计算机视觉挑战的广大计算机专业人士。同时,本书也适用于使用深度学习算法解决计算机视觉问题,并想尝试Python的读者。 我要感谢Apress、Aaron、Jessica和Vishwesh,感谢他们对我的信任,赋予我在这个课题上工作的机会。我还要特别感谢我的家人——Yashi、Pakhi和Rudra,感谢他们的大力支持。没有他们的支持,这项工作就不可能完成。 Vaibhav Verdhan 2020年11月于爱尔兰利默里克