CONTENTS 目录 引言00 第1章昇腾AI基础00 1.1人工智能与深度学习00 1.1.1人工智能简史00 1.1.2深度学习概述00 1.2达芬奇架构00 1.2.1计算单元00 1.2.2存储系统0 1.2.3控制单元0 1.2.4指令集设计0 1.2.5卷积加速计算实例0 1.3昇腾AI处理器0 1.3.1昇腾310处理器0 1.3.2昇腾910处理器0 1.4Atlas硬件计算平台0 1.4.1模组(Atlas 200)与开发者套件(Atlas 200DK)0 1.4.2Atlas 300板卡0 1.4.3Atlas 500智能小站0 1.4.4服务器(Atlas 800/Atlas 500 Pro)0 1.4.5Atlas 900 AI集群0 1.5本章小结0 第2章昇腾AI异构计算架构CANN0 2.1CANN概述0 2.2昇腾计算图0 2.3运行架构0 2.3.1训练场景运行架构0 2.3.2推理场景运行架构0 2.4开发环境安装0 2.5全流程开发0 2.5.1开发工具链0 2.5.2典型开发流程0 2.6全流程开发工具链MindStudio0 2.6.1MindStudio简介0 2.6.2模型开发0 2.6.3应用开发与调优0 2.6.4算子开发0 2.7本章小结0 昇腾AI处理器CANN架构与编程 目录 第3章CANN自定义算子开发0 3.1TBE开发概述0 3.1.1算子基本概念0 3.1.2TBE基本概念0 3.1.3TBE开发方式与流程0 3.2TBE DSL算子开发0 3.2.1开发环境准备0 3.2.2DSL的API接口0 3.2.3DSL算子开发示例0 3.2.4算子原型定义与算子信息定义0 3.2.5算子适配插件开发与算子编译及部署0 3.2.6算子单元测试0 3.2.7算子系统测试 3.3TBE TIK算子开发 3.3.1TIK的适用场景 3.3.2TIK算子开发示例 3.3.3算子的性能优化 3.4AI CPU算子开发 3.5本章小结 第4章昇腾计算语言 4.1AscendCL编程模型 4.1.1基本概念 4.1.2逻辑架构 4.1.3线程模型 4.1.4内存模型 4.2资源管理 4.2.1初始化管理 4.2.2Device管理 4.2.3Context管理 4.2.4Stream管理 4.2.5内存管理 4.3模型加载与执行 4.3.1模型加载 4.3.2模型执行 4.3.3设置动态Batch/动态分辨率/动态AIPP/动态维度 4.3.4准备模型执行的输入/输出数据结构 4.4算子功能开发 4.4.1算子功能开发典型流程 4.4.2封装成AscendCL的算子 4.4.3未被封装成AscendCL的算子 4.5辅助功能 4.5.1同步/异步 4.5.2AI Core异常信息获取 4.5.3日志管理 4.5.4Profiling性能数据采集 4.6高级功能 4.6.1图开发 4.6.2分布式开发 4.6.3融合规则开发 4.7本章小结 第5章CANN模型训练 5.1深度学习训练框架 5.1.1MindSpore 5.1.2TensorFlow 5.1.3PyTorch 5.1.4主流框架对比 5.2深度学习训练流程 5.2.1数据处理 5.2.2模型搭建与训练配置 5.2.3训练网络与保存模型 5.3CANN训练实例之MindSpore 5.3.1环境搭建 5.3.2ResNet50实现图像分类 5.3.3高阶技巧 5.4CANN训练框架之其他框架 5.4.1CANN与TensorFlow的适配原理 5.4.2使用TensorFlow训练ResNet50 5.4.3CANN与PyTorch的适配原理 5.4.4使用PyTorch训练ResNet50 5.5网络模型迁移和在线推理 5.5.1模型迁移和在线推理流程 5.5.2性能分析工具——Profiling 5.5.3算子自动调优工具——AutoTune 5.5.4精度分析工具——Data Dump 5.6本章小结 第6章CANN模型部署 6.1模型部署概述 6.1.1模型部署全流程 6.1.2调用AscendCL实现推理执行 6.2CANN的数字视觉预处理模块 6.2.1DVPP工作原理 6.2.2DVPP使用方法 6.3CANN的模型转换工具 6.3.1ATC工具工作原理 6.3.2ATC工具使用方法 6.3.3AIPP 6.3.4使用MindStudio完成模型转换 6.4CANN的昇腾模型压缩工具 6.4.1模型量化原理 6.4.2昇腾模型压缩工具简介 6.5CANN的模型部署实例 6.5.1TensorFlow模型推理——以ResNet50为例 6.5.2MindSpore模型推理——以Faster RCNN为例 6.5.3PyTorch模型推理——以Transformer为例 6.6本章小结 第7章行业应用实例 7.1个性化影视推荐系统全流程开发实例 7.1.1实例简介 7.1.2系统总体设计 7.1.3系统详细设计与实现 7.1.4实例系统部署 7.2基于文字感知的智能巡检机器人全流程开发实例 7.2.1实例简介 7.2.2系统总体设计 7.2.3系统详细设计与实现 7.2.4实例系统部署 7.3本章小结