目录 第1章大模型技术概述1 1.1人工智能与大模型发展史1 1.2大模型的定义5 1.3大模型的分类7 1.3.1按模态方式划分7 1.3.2按应用领域划分7 1.4大模型的构建流程8 1.4.1数据准备8 1.4.2模型选择与设计9 1.4.3模型训练9 1.4.4模型评估与优化9 1.4.5模型部署与维护10 1.5大模型的应用场景11 1.5.1文字生成: 从对话到创作11 1.5.2图像生成: 从想象到现实14 1.5.3音视频生成: 声音与画面的合成16 1.5.4虚拟人生成: 数字生命的诞生17 1.5.5代码生成: 编程的自动化17 1.5.6多模态生成: 融合的艺术18 1.5.7策略生成: 决策的智能化21 1.6大模型与搜索引擎22 1.6.1相似性22 1.6.2差异性22 1.6.3互补性23 本章小结24 习题一24 第2章大模型技术平台27 2.1大模型的层次结构27 2.1.1硬件基础设施层27 2.1.2软件基础设施层28 2.1.3模型即服务层29 2.1.4应用层29 2.2大模型的三大要素31 2.2.1算力31 2.2.2算法31 2.2.3数据32 2.2.4三大要素的协同32 2.3大模型的核心技术32 2.3.1Transformer架构33 2.3.2预训练模型37 2.3.3模型微调39 2.3.4基于人类反馈的强化学习41 2.3.5模型推理42 2.4大模型的典型平台43 2.4.1文心一言44 2.4.2Kimi智能助手45 2.4.3ChatGPT47 2.5大模型的API调用49 2.5.1API调用的意义49 2.5.2API的调用过程50 2.5.3文心大模型的API调用51 本章小结54 习题二55 第3章大模型提示工程57 3.1提示工程概述57 3.1.1提示工程的优化方法57 3.1.2提示工程的应用场景58 3.2零样本提示61 3.2.1零样本提示的内涵61 3.2.2零样本提示的优化策略62 3.2.3零样本提示的应用场景62 3.2.4零样本提示与迁移学习的关系67 3.3少样本提示68 3.3.1少样本提示的内涵68 3.3.2少样本提示的工作原理69 3.3.3少样本提示的应用场景70 3.3.4少样本提示的优势与局限72 3.4思维链提示72 3.4.1思维链提示的内涵73 3.4.2思维链提示的优化策略73 3.4.3思维链提示的应用场景74 3.4.4思维链提示的挑战与限制77 3.5思维树提示78 3.5.1思维树提示的内涵78 3.5.2思维树提示的工作步骤79 3.5.3思维树提示的应用场景80 3.5.4思维树提示与思维链提示的比较83 3.6自动提示工程84 3.6.1为什么需要自动提示工程84 3.6.2自动提示工程的技术原理85 3.6.3自动提示工程的未来方向86 阅读材料: 提示工程师87 本章小结87 习题三88 第4章大模型典型应用90 4.1内容创作90 4.1.1社交媒体90 4.1.2新闻报道92 4.1.3小说创作94 4.1.4诗歌创作96 4.1.5学术选题98 4.2智能办公100 4.2.1办公应用100 4.2.2会议管理105 4.2.3语言翻译106 4.2.4文档要点108 4.3智能客服109 4.3.1智能客服的优势109 4.3.2智能客服的关键技术109 4.4智能编程110 4.4.1编写程序代码111 4.4.2改写程序代码113 4.4.3协助解决程序异常114 4.5自动驾驶116 4.5.1数据处理与预处理117 4.5.2环境感知与理解118 4.5.3决策与规划118 4.5.4智能优化与控制119 本章小结119 习题四120 第5章大模型数据分析122 5.1数据分析概述122 5.1.1数据分析的定义122 5.1.2数据分析的特点123 5.1.3数据分析的流程124 5.1.4数据分析的应用125 5.2数据处理方法126 5.2.1数据预处理126 5.2.2数据选择129 5.2.3数值操作129 5.2.4数值运算130 5.2.5数据分组130 5.2.6时间序列分析131 5.3数据可视化134 5.3.1数据可视化及图表类型134 5.3.2柱形图应用134 5.3.3折线图应用135 5.3.4饼图的应用138 5.4回归分析140 5.4.1线性回归的概念140 5.4.2线性回归算法实现141 5.4.3多项式回归的概念143 5.4.4多项式回归算法实现144 5.5聚类分析147 5.5.1KMeans聚类分析147 5.5.2KMeans聚类算法实现148 5.5.3层次聚类分析154 5.5.4层次聚类算法实现155 阅读材料: 数据分析师158 本章小结159 习题五160 第6章大模型行业应用162 6.1行业大模型162 6.1.1行业大模型的概念162 6.1.2行业大模型的特点163 6.1.3行业大模型的应用163 6.2工业大模型165 6.2.1工业大模型的概念165 6.2.2工业大模型的技术流程165 6.2.3工业大模型的应用场景166 6.3金融大模型170 6.3.1金融大模型的概念170 6.3.2金融大模型的技术路径170 6.3.3金融大模型的应用领域172 6.4医疗大模型175 6.4.1医疗大模型的概念175 6.4.2常见的医疗大模型175 6.4.3医疗大模型的应用177 6.5教育大模型179 6.5.1教育大模型的概念179 6.5.2教育大模型的技术架构180 6.5.3教育大模型的应用场景181 6.6文化大模型183 6.6.1文化大模型的概念183 6.6.2文化大模型的关键技术184 6.6.3文化大模型的应用场景185 本章小结186 习题六187 第7章大模型未来趋势189 7.1多模态大模型189 7.2AI智能体191 7.2.1AI智能体的定义191 7.2.2AI智能体的演进192 7.2.3AI智能体的未来193 7.3具身智能196 7.3.1具身智能的概念196 7.3.2具身智能的发展历程197 7.3.3具身智能的应用领域198 阅读材料: 未来科学家199 本章小结200 习题七200 附录A实验指导203 实验1文本生成203 实验2绘画创作207 实验3提示词设计214 实验4论文助手220 实验5编程助手229 实验6数据分析236 参考文献243