出售本站【域名】【外链】

知识融合概述

知识融合概述 什么是知识融合

构建知识图谱的历程中,往往会对多个知识库停行兼并,以期与得更片面的知识,那个历程就称为知识融合。

由于被兼并的各个知识库里的知识难免会存正在舛错,因此知识交流通贯通对多个知识库的知识停行交叉验证,知识融合之后与得知识相比融合前的单知识库会更精确。

知识融合的难点

异构问题:差异知识库对同一个真体或知识的表达不同很大,详细体如今一个雷同的真体存正在大质的别名。比如商品知识图谱中,差异数据源应付同一商品的形容可能差异。

比方义问题:差异的真体运用同样或类似的文原表达。比如“苹果”既是一种水果,又是一个品排称呼。

数据噪声:正在家产界知识图谱理论中,数据噪声问题是宽泛存正在的,多知识库交流通贯通办法噪声问题,容易组成精确率的下降。

跨语言问题:差异语言再表达同一个真体或知识时,语义的漂移是非常重大的,可以认为跨语言是一种很是难办理的异构问题,因而跨语言的知识融合任务难度更大,正在学术界往往做为一个独立摘尔钻研子规模显现。

知识融合的根柢轨范 原体对齐

原体是形容一样东西的框架,正在差异的知识图谱中,应付同一样东西的形容办法可能是差异的。

原体对齐便是指对多个知识库原体构造停行对齐,波及原体构造的类、属性项和属性值的对齐。原体对齐的宗旨是处置惩罚惩罚类、属性项和属性值的异构问题。

比如商品知识图谱中,差异的商品知识库原体构造差异。正在类级别上,差异知识库的层级分别可能差异,比如“手机”、“智能手机”,定名办法可能也差异,比如“数码方法”和“3C数码”;每个类的属性项可能也会存正在同,比如“尺寸”和“屏幕尺寸”;属性项下面的属性值也可能存正在差异的分别大概定名差异的问题,比宛如样“品排”属性项下,可能一个知识库运用了“苹果”,另一个则是“Apple”。

真体对齐

真体对齐便是把多个知识库中形容同一个真体的记录找出来。由于真体的个数很是多,且同一个真体正在差异知识库里异构问题重大,因而相比原体对齐,真体对齐是一个更为艰难的任务,比如“iPhone 11”和“苹果手机 iPhone11”是同一个真体。

信息融合

差异知识库对同一个真体的形容可以有相当程度的互补,停行融合,能获得最全、最准的真体属性信息。信息融合便是将已对齐的真体对大概真体聚簇的属性信息融合到一起的历程,次要处置惩罚惩罚的多个数据源信息斗嘴的问题。


2025-01-17 10:58  阅读量:28