知识图谱的发展历史源远流长,从经典人工智能的核心命题——知识工程,到互联网时代的语义Web,再到当下很多领域构建的数千亿级别的现代知识图谱。知识图谱兼具人工智能、大数据和互联网的多重技术基因,是知识表示、表示学习、自然语言处理、图数据库和图计算等多个领域技术的综合集成。本书全面覆盖了知识图谱的表示、存储、获取、推理、融合、问答和分析等七大方面,一百多个基础知识点的内容,同时囊括多模态知识图谱、知识图谱与图神经网络的融合、本体表示学习、事理知识图谱,以及知识增强的语言预训练模型等新热点、新发展。作为一本导论性质的书,本书希望帮助初学者梳理知识图谱的基本知识点和关键技术要素,也希望帮助技术决策者建立知识图谱的整体视图和系统工程观,为前沿科研人员拓展创新视野和研究方向。
本书在技术广度和深度上兼具极强的参考性,适合高等院校的计算机专业师生阅读,也可供计算机相关行业的管理者和研发人员参考。
章知识图谱概述1
1.1语言与知识2
1.2知识图谱的起源7
1.3知识图谱的价值12
1.4知识图谱的技术内涵16
1.5建立知识图谱的系统工程观20
第2章知识图谱的表示21
2.1什么是知识表示22
2.2人工智能历史发展长河中的知识表示24
2.3知识图谱的符号表示方法28
2.4知识图谱的向量表示方法32
2.5总结38
第3章知识图谱的存储与查询39
3.1基于关系型数据库的知识图谱存储40
3.2基于原生图数据库的知识图谱存储44
3.3原生图数据库实现原理浅析52
3.4总结55
第4章知识图谱的获取与构建57
4.1重新理解知识工程与知识获取58
4.2实体识别62
4.3关系抽取71
4.4属性补全81
4.5概念抽取83
4.6事件识别与抽取87
4.7知识抽取技术前沿91
4.8总结95
第5章知识图谱推理96
5.1推理简述97
5.2知识图谱推理简介101
5.3基于符号逻辑的知识图谱推理108
5.4基于表示学习的知识图谱推理117
5.5总结144
第6章知识图谱融合146
6.1知识图谱融合概述147
6.2概念层融合——本体匹配150
6.3实例层的融合——实体对齐155
6.4知识融合技术前沿159
6.5总结162
第7章知识图谱问答163
7.1智能问答概述164
7.2基于问句模板的知识图谱问答172
7.3基于语义解析的知识图谱问答178
7.4基于检索排序的知识图谱问答185
7.5基于深度学习的知识图谱问答188
7.6总结195
第8章图算法与图数据分析196
8.1图的基本知识197
8.2基础图算法204
8.3图表示学习与图神经网络211
8.4知识图谱与图神经网络224
8.5总结232
第9章知识图谱技术发展233
9.1多模态知识图谱234
9.2知识图谱与语言预训练248
9.3事理知识图谱255
9.4知识图谱与低资源学习261
9.5结构化知识预训练276
9.6知识图谱与区块链293
9.7总结308
陈华钧,浙江大学计算机科学与技术学院教授。主要研究方向为知识图谱、自然语言处理、大数据系统等。