胡芳槐:大规模知识图谱数据存储

本文摘录自上海海翼知信息科技有限公司胡芳槐博士4月14日在北京理工大学分享的《大规模知识图谱数据存储》PPT。作者对知识图谱的存储进行了全面的介绍,内容包括:什么是知识图谱,知识图谱的适用场景,知识图谱数据存储的几种常见方式和最佳方案,知识图谱中的时态信息及其存储实现,结合实例说明如何利用图数据库进行数据存储。
知识图谱即用来描述真实世界中存在的各种实体或概念,以及它们之间的关联关系。
其中:

  • 每个实体或概念用一个全局唯一确定的ID来标识,称为标识符;
  • 每个属性—值对用来刻画实体的内在特性,而关系用来连接两个实体,刻画它们之间的关联。

从抽象层面看,本体最抽象,其次是知识库,最后才是知识图谱,因此本体与知识图谱的区别在于以下三点:

  • 知识图谱并不是本体的替代品,它是在本体的基础上进行了丰富和扩充,这种扩充主要体现在实体(Entity)层面。
  • 本体中突出和强调的是概念以及概念之间的关联关系,而知识图谱则是在本体的基础上,增加了更加丰富的关于实体的信息。
  • 本体描述了知识图谱的数据模式(schema),即为知识图谱构建数据模式相当于为其建立本体。

知识图谱的适用场景,我们看到知识图谱有了如此多的应用,不过它最适合处理还是这些数据:

  • 关系复杂的数据、
  • 类型繁多的数据、
  • 结构多变的数据。

作为数据融合与链接的纽带,知识图谱整合结构化、半结构化和非结构化数据,拥有如下的消费和数据场景。

《大规模知识图谱数据存储》
上半场

  • 语义大数据背景下的知识图谱技术
  • 数据存储的发展历史
  • 知识图谱数据存储
  • 知识图谱时态信息存储

下半场

  • 常见的图数据存储
  • 应用场景分析
  • 使用图数据库进行数据存储
  • 复杂应用场景存储的最佳实践

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

推荐文章

沪公网安备 31010702002009号