干货系列(一) | 初识知识图谱

2021-08-25 09:46:02 阅读 15536

前言

大数据时代,人工智能技术获得了前所未有的进步。伴随着科技的发展,人们对数据处理和理解的需求增加,知识图谱也逐日升温,成为推动人工智能发展的核心驱动力。

认识知识图谱的内涵,了解知识图谱的应用,有助于我们更好地融入这个时代。从本周开始,我们将为大家分享知识图谱的系列文章。


系列(一)主要包含3个方面:

1.一个案例带你走进知识图谱;

2.知识图谱的前世今生;

3.知识图谱的典型应用;

全文预计阅读时长为6分钟。


1

走进知识图谱


当你看见下面这一串文本你会联想到什么?

Ronaldo Luís Nazário de Lima



估计绝大多数人都不明白上面文本代表的意思。我们来看看它对应的中文:

罗纳尔多·路易斯·纳萨里奥·德·利马。

这是一个外国人的名字,但有些人估计不知道他具体是谁。下面是关于他的某张图 ▼




从这张图我们得到了额外信息,他是一位足球运动员。对足球不熟悉的,可能还是没什么印象。那么再看看下面这张图 ▼




此时再加上那句洗脑的广告词:“保护嗓子,请用金嗓子喉片。广西金嗓子!”。

这下应该许多人都知道他是谁了,毕竟多年前被这洗脑的广告语摧残了很长一段时间。

从姓名到照片,再到耳熟能详的广告语,我们围绕这个人展开相应拓展的过程,其实和机器的反应是很相似的。

以“罗纳尔多”为例,当机器围绕他进行相应的扩展,会得到下面这张知识图 ▼



构建机器的先验知识,能确保它们理解信息背后的含义。机器拥有了这样的知识后,当它再次看到Ronaldo Luís Nazário de Lima,它就会“想”:“这是一个名字叫罗纳尔多的巴西足球运动员。”


为了优化搜索引擎,Google于2012年5月16日发布了知识图谱(Knowledge Graph)。

在之前的版本中,我们只能得到包含某个搜索关键词的相关网页作为返回结果,然后不得不进入某些网页查找我们感兴趣的信息。

但优化后,除了相关网页,搜索引擎还会返回一个“知识卡片”,包含了查询对象的基本信息和其他相关对象,如下图红框的内容▼




如果我们只是想知道罗纳尔多的国籍、年龄、婚姻状况、子女信息,不用再做多余的操作,在最短的时间内,我们获取了最为简洁,准确的信息。

有知识图谱作为辅助,搜索引擎能够洞察用户查询背后的语义信息,返回更为精准、结构化的信息,更大可能地满足用户的查询需求。

通过上面这个例子,你应该有了一个初步的印象,知识图谱其本质是为了表示知识,为我们提供更便捷的服务。


2

知识图谱的前世今生


知识图谱的概念并不新,它背后的思想可以追溯到上个世纪五六十年代所提出的一种知识表示形式——语义网络(Semantic Network)。

语义网络由相互连接的节点和边组成,节点表示概念或者对象,边表示他们之间的关系,如下图 ▼




除了语义网络,人工智能的分支——专家系统,万维网之父Tim Berners Lee于1998年提出的语义网(Semantic Web)和在2006年提出的关联数据(Linked Data)都和知识图谱有着千丝万缕的关系,可以说它们是知识图谱前身。

目前,知识图谱并没有一个标准的、统一的定义。我们可以从不同的视角去审视知识图谱的概念


1

在Web视角下,知识图谱如同简单文本之间的超链接一样,通过建立数据之间的语义链接,支持语义搜索。

2

在自然语言处理视角下,知识图谱就是从文本中抽取语义和结构化的数据。

3

在知识表示视角下,知识图谱是采用计算机符号表示和处理知识的方法。

4

在人工智能视角下,知识图谱是利用知识库来辅助理解人类语言的工具。

5

在数据库视角下,知识图谱是利用图的方式去存储知识的方法。


3

知识图谱的典型应用


Google最初提出知识图谱是为了增强搜索结果,改善用户搜索体验,但知识图谱的应用远不止这些,基于知识图谱的服务和应用是当前的一大研究热点。

按照应用方式,典型应用可以分为语义搜索、知识问答、基于知识的大数据分析与决策等。


01

知识图谱在语义搜索中的应用


利用知识图谱所具有的良好定义的结构形式,提供满足用户需求的结构化语义内容。语义搜索利用建立大规模知识库对搜索关键词和文档内容进行语义标注,改善搜索结果。




如谷歌、百度和搜狗在搜索结果中嵌入知识图谱,能直接给出满足用户搜索意图的答案,而不是包含关键词的相关网页的链接。


02

知识图谱在知识问答中的应用


基于知识库的问答通过对问句的语义分析,将非结构化问句解析成结构化的查询,在已有结构化的知识库上获取答案。




智能问答系统被看作是未来信息服务的颠覆性技术之一,亦被认为是机器具备语言理解能力的主要验证手段之一。近年来很多研究者开始研究基于深度学习的知识库问答方法。


03

知识图谱在大数据分析决策中的应用


知识驱动的大数据分析与决策:利用知识图谱可以辅助行业和领域的大数据分析和决策。



(本图使用火眼金睛制作)


如大数据公司智器云推出的知识图谱,在情报分析领域助力公检法人员更好更快地进行研判分析;媒体公司Netflix利用基于其订阅用户的注册信息和观看行为构建的知识图谱,拍摄了热门美剧《纸牌屋》等。



通过本次分享,我们已经初步了解的知识图谱的内涵。但为什么要使用知识图谱?它对我们造成了哪些影响?将在下一期将为大家一一解答,不见不散!


本文来源

[1]知乎  为什么需要知识图谱?什么是知识图谱?——KG的前世今生

[2]李涓子,侯磊.知识图谱研究综述[J].山西大学学报(自然科学版),2017,40(03):454-459.


参考文献

1.W3C: RDF 1.1 Concepts and Abstract Syntax.

2.Exploiting Linked Data and Knowledge Graphs in Large Organisations.

3.Google: Introducing the Knowledge Graph: things, not strings.

4.Blog:Problems of the RDF model: Blank Nodes.

6.Chen, L., Zhang, H., Chen, Y., & Guo, W. (2012). Blank nodes in rdf. Journal of Software, 7(9).


本文整体内容摘自网络平台,若有侵权,请联系管理员删除。


关注微信公众号,获取最新信息小编微信(zqykj0811),加入微信群与悟空团队的数据分析师一起交流

返回新闻活动列表