目录 第1章走近知识图谱1 1.1基本概念1 1.1.1源自搜索引擎1 1.1.2知识图谱的定义2 1.1.3知识表示3 1.1.4操作和存储5 1.2构建流程7 1.2.1数据获取8 1.2.2信息抽取9 1.2.3知识融合11 1.2.4知识加工13 1.3知识图谱应用15 1.3.1知识图谱分类15 1.3.2通用知识图谱应用16 1.3.3领域知识图谱应用18 1.3.4面临的技术挑战22 1.4本书实战知识点23 第2章企业信息知识图谱25 2.1项目设计25 2.1.1需求分析25 2.1.2工作流程25 2.1.3技术选型26 2.1.4开发准备27 2.2数据准备和预处理28 2.2.1数据获取28 2.2.2数据的预处理30 2.3知识建模和存储31 2.3.1企业主要属性31 2.3.2企业数据源形成31 2.3.3知识图谱主体构建35 2.3.4企业信息三元组形成36 2.3.5数据存储 37 2.4图谱可视化和知识应用38 2.4.1查询企业全貌39 2.4.2企业关系维度分析41 2.4.3司法维度分析41 2.5小结和扩展42 〖1〗〖2〗实战知识图谱〖1〗目录第3章医药疾病知识图谱44 3.1项目设计44 3.1.1需求分析44 3.1.2工作流程44 3.1.3技术选型45 3.1.4开发准备47 3.2数据准备和预处理47 3.2.1数据描述47 3.2.2数据获取48 3.2.3数据预处理50 3.3知识建模和存储51 3.3.1实体抽取51 3.3.2三元组的抽取53 3.3.3数据存储55 3.4图谱可视化和知识应用56 3.4.1数据查询57 3.4.2膳食维度分析58 3.4.3用药维度分析60 3.5小结和扩展60 第4章银行审计知识图谱61 4.1项目设计61 4.1.1需求分析61 4.1.2工作流程61 4.1.3技术选型62 4.1.4开发准备62 4.2数据准备和预处理63 4.2.1数据获取63 4.2.2数据预处理66 4.3知识建模和存储67 4.3.1构建账户数据模型 67 4.3.2抽取三元组并存储68 4.4图谱可视化和知识应用70 4.4.1客户的所有账户70 4.4.2账户的全部交易记录71 4.4.3某时间段内账户的交易记录71 4.4.4账户相关的全部对方账户73 4.4.5客户的异常交易行为73 4.4.6下一步改进工作74 4.5小结和扩展77 第5章人物关系智能问答78 5.1项目设计78 5.1.1需求分析78 5.1.2工作流程79 5.1.3技术选型79 5.1.4开发准备81 5.2数据准备和预处理82 5.2.1数据准备82 5.2.2数据预处理82 5.3知识建模和存储83 5.3.1知识建模及描述83 5.3.2数据存储84 5.4图谱可视化和知识应用88 5.4.1问题模板定义89 5.4.2朴素贝叶斯问题分类90 5.4.3意图识别与槽位填充91 5.4.4问答展示93 5.5小结和扩展96 第6章基于知识库的实体链接系统98 6.1项目设计98 6.1.1需求分析98 6.1.2工作流程98 6.1.3技术选型99 6.1.4开发准备100 6.2数据准备和预处理101 6.2.1数据获取101 6.2.2数据预处理101 6.2.3自定义词典104 6.3知识建模和存储104 6.3.1候选实体生成104 6.3.2候选实体消歧108 6.4知识应用111 6.4.1功能实现111 6.4.2应用场景112 6.5小结和扩展113 第7章交通出行科研文献研究114 7.1项目设计114 7.1.1需求分析114 7.1.2工作流程114 7.1.3技术选型115 7.1.4开发准备116 7.2数据准备和预处理117 7.2.1文献数据下载117 7.2.2文献数据导入117 7.2.3数据转换处理118 7.2.4CNKI引文数据获取119 7.3图谱可视化和知识应用121 7.3.1共现和聚类分析122 7.3.2突现分析126 7.3.3共被引分析127 7.3.4合作网络分析128 7.4小结和扩展129 第8章微博舆情知识图谱130 8.1项目设计130 8.1.1需求分析130 8.1.2工作流程130 8.1.3技术选型132 8.1.4开发准备133 8.2数据准备和预处理133 8.2.1采集话题帖子133 8.2.2解析关键数据134 8.2.3情感倾向分析142 8.3知识建模和存储143 8.4图谱可视化和知识应用146 8.4.1图谱可视化146 8.4.2展示性分析147 8.5小结和扩展149 第9章基于法规知识图谱的搜索系统150 9.1项目设计150 9.1.1需求分析150 9.1.2工作流程151 9.1.3技术选型152 9.1.4开发准备154 9.2数据准备和预处理155 9.2.1获取法规列表155 9.2.2获得法律内容详情156 9.2.3法规实体抽取158 9.3知识建模和存储160 9.3.1法规采集记录160 9.3.2法规详情信息161 9.3.3法规关系数据163 9.4图谱可视化和知识应用165 9.4.1可视化实现过程165 9.4.2法规数据图谱展示170 9.4.3法律法规Web搜索171 9.5小结和扩展173 第10章基于裁判文书的司法知识图谱174 10.1项目设计174 10.1.1需求分析174 10.1.2工作流程175 10.1.3技术选型175 10.1.4开发准备177 10.2数据准备和预处理177 10.2.1数据获取177 10.2.2获取裁判文书数据178 10.2.3获取关键字典数据179 10.2.4序列标注180 10.2.5特征提取182 10.3知识建模和存储183 10.3.1基于BiLSTM+CRF模型的命名实体识别183 10.3.2实体关系抽取186 10.4图谱可视化和知识应用187 10.4.1绘制知识图谱187 10.4.2知识图谱展示188 10.4.3知识图谱应用188 10.5小结和扩展189 第11章政府信箱知识服务190 11.1项目设计190 11.1.1需求分析190 11.1.2工作流程191 11.1.3技术选型192 11.1.4开发准备193 11.2数据准备和预处理194 11.2.1源网站分析195 11.2.2URL信息获取195 11.2.3信息预处理196 11.2.4关系数据库表存储197 11.3知识建模和存储198 11.3.1知识表示和建模198 11.3.2知识抽取199 11.3.3图数据库存储203 11.4图谱可视化和知识应用204 11.4.1民生关注点词云204 11.4.2政府信箱智能问答206 11.5小结和扩展210 第12章新闻推荐系统211 12.1项目设计211 12.1.1需求分析211 12.1.2工作流程211 12.1.3技术选型212 12.1.4开发准备212 12.2知识图谱构建213 12.2.1数据准备213 12.2.2数据处理213 12.2.3知识图谱构建214 12.3推荐模型构建216 12.3.1数据集生成216 12.3.2模型训练217 12.3.3模型训练总结220 12.4可视化应用220 12.4.1框架搭建220 12.4.2用户行为收集221 12.4.3实时新闻数据更新222 12.4.4个性化推荐224 12.5小结和扩展227