目录


第1章自然语言处理概述

实践一: 随机数生成与排序

实践二: 99乘法表

实践三: “海量”文件遍历

实践四: 文本词频分析

实践五: 百度百科数据爬取

实践六: 百度百科数据预处理


第2章文本表示

实践七: 基于Word2vec的语言模型实践

实践八: 基于ERNIE语言模型的文本语义匹配

实践九: 基于PaddleNLP的短文本相似度计算


第3章文本分类

实践十: 基于FNN网络的电影评论情感分析

实践十一: 基于LSTM网络的谣言检测

实践十二: 基于PaddleHub的低俗文本审核


第4章信息抽取

实践十三: 基于LSTM的命名实体识别

实践十四: 基于BiLSTM+CRF的事件抽取

实践十五: 基于BiLSTM的关系抽取


第5章机器翻译

实践十六: 基于序列到序列模型的中英机器翻译

实践十七: 基于注意力机制的中英机器翻译

实践十八: 基于Transformer的中英机器翻译


第6章自动文摘

实践十九: 基于注意力机制的英文新闻标题生成

实践二十: 基于Transformer的英文自动文摘

实践二十一: 基于ERNIEGEN的中文自动文摘


第7章机器阅读理解

实践二十二: 基于SQuAD的机器阅读理解

实践二十三: 基于BiDAF的机器阅读理解

实践二十四: 基于预训练——微调的机器阅读理解


第8章聊天机器人设计与实现

实践二十五(一): 聊天机器人模块实现

实践二十五(二): 聊天机器人系统评测


参考文献