目录 第1章中文分词 1.1中文分词中的基本问题 1.1.1中文分词规范问题 1.1.2歧义切分问题 1.1.3未登录词识别问题 1.2基于词表的分词算法 1.2.1正向最大匹配算法 1.2.2逆向最大匹配算法 1.2.3双向最大匹配算法 1.3基于统计模型的分词算法 1.4基于序列标注的分词算法 1.4.1基于HMM的分词方法 1.4.2基于CRF的分词方法 1.4.3基于BiLSTMCRF的中文分词方法 参考文献 第2章命名实体识别 2.1基于CRF的命名实体识别 2.1.1CRF基本概念 2.1.2命名实体识别任务 2.2基于BiLSTMCRF的命名实体识别 2.2.1RNN 2.2.2LSTM网络 2.2.3双向LSTM网络 2.2.4BiLSTMCRF 2.3注意力机制 参考文献 第3章关系抽取 3.1实体关系抽取定义 3.2实体关系抽取框架 3.3评测方法 3.4有监督实体关系抽取方法 3.5半监督实体关系抽取方法 3.6远程监督实体关系抽取方法 参考文献 第4章词向量技术 4.1OneHot词向量技术 4.2Word2Vec词向量技术 4.2.1CBOW模型 4.2.2SkipGram模型 4.2.3优化方法 4.3BERT词向量嵌入 4.3.1注意力机制 4.3.2Transformer 4.3.3BERT 4.3.4基于BERT的衍生模型 参考文献 第5章关键词提取 5.1TextRank关键词提取算法 5.1.1基于图的排序算法 5.1.2基于图的排序算法的拓展运用 5.1.3基于图的排序算法在关键词提取中的运用 5.1.4TextRank算法 5.2TFIDF关键词提取算法 5.3LDA与PLSA关键词提取算法 5.3.1相关基础知识 5.3.2PLSA模型 5.3.3LDA模型 参考文献 第6章文本分类 6.1文本分类概述 6.2文本表示 6.2.1离散式表示 6.2.2分布式表示 6.3文本特征提取 6.3.1基于DF的特征提取法 6.3.2信息增益法 6.3.3χ2统计量 6.3.4互信息法 6.4特征权重计算方法 6.5分类器构建 6.5.1朴素贝叶斯分类器 6.5.2SVM分类器 6.5.3基于神经网络的分类器 6.6文本分类评价指标 参考文献 第7章知识图谱 7.1知识图谱概述 7.1.1知识图谱的介绍 7.1.2知识图谱基本概念 7.1.3知识表示与存储 7.2知识图谱构建 7.2.1知识抽取 7.2.2知识融合 7.2.3知识加工 7.2.4知识更新 7.3知识图谱补全 7.3.1知识图谱补全简介 7.3.2表示学习的相关理论 7.3.3知识图谱补全(表示学习) 7.4知识图谱应用 7.4.1通用和领域知识图谱 7.4.2语义集成 7.4.3语义搜索 7.4.4基于知识的问答 参考文献 第8章机器阅读理解 8.1机器阅读理解概述 8.1.1机器阅读理解任务 8.1.2机器阅读理解发展 8.2数据集以及测评方式 8.2.1数据集 8.2.2测评方式 8.3模型 8.3.1模型架构 8.3.2预训练模型 8.4应用以及未来 8.4.1智能客服 8.4.2搜索引擎 8.4.3教育 8.4.4机器阅读理解面临的挑战 参考文献 第9章自动文摘和文本生成 9.1自动文摘概述 9.1.1自动文摘任务 9.1.2自动文摘发展及分类 9.2生成式摘要 9.2.1问题与方法 9.2.2文摘评测 9.3自动文本生成 9.3.1自动文本生成概述 9.3.2基于主题的文本生成 9.3.3自动文本生成技术评测 参考文献 第10章对话系统 10.1问题理解 10.1.1意图识别 10.1.2槽填充 10.2对话状态管理 10.2.1对话状态跟踪 10.2.2对话策略 10.3答句生成 参考文献