当前位置:网站首页>TransC知识表示模型
TransC知识表示模型
2022-07-26 14:16:00 【迪迦瓦特曼】
目录
一、研究背景
TransE之后又诞生了TransD、TransH、TransR等模型,但这些模型的基本思想是相同的,即利用head向量和relation向量的和来预测tail向量。向量的和就是信息的积累。但实体和关系可能比这更复杂。寻找一种更有效的方法来表达知识可能是一个具有挑战性的研究课题。

二、TransC的提出
《Differentiating Concepts and Instances for Knowledge Graph Embedding》(2018)提出了一种新的区分概念和实例的知识图谱表示学习方法,将上下位关系与普通的关系做了区分,可以很好的解决上下位关系的传递性问题,并且能够表示概念在空间中的层次与包含关系。

如上图,Alice是教授的实例(InstanceOf),教授隶属于(SubClassOf)科研人员类,科研人员隶属于(SubClassOf)工作人员类,通过关系传递性(IsA Transitivity),教授与工作人员建立联系。
模型解决的问题:
1. Insufficient concept representation
不能区分concept和instance
2. Lack transitivity of both isA relations
isA这种关系缺少传递性
三、模型思路
作者提出一个逻辑推理问题,类似于isA这种关系,中文理解就是“是”意思,如(zhangsan, instanceof, teacher)+(teacher, subClassof, people)推出(zhangsan, is, teacher),这就是isA的逻辑推理。
该文将关系三元组分为三种类型:
1. (Instance, Relation, Instance)
即(Zhangsan, Friendof, Lisi)这种就采用常规的TransE模型即可
2. (Instance, Relation, Concept)
即(Zhangsan, Is, Teacher)
对于实例应该与它们所属的概念相近,将每个concept编码为一个领域,将每个instance编码为同一语义空间中的向量,并利用相对位置对concept和instance之间的关系进行建模。
3. (Concept, Relation, Concept)
即(Teacher, Is, People)
将这种关系分为四种不同的关系,即(A, Relation, B),A和B之间的关系为B包含于A, 二者无关, 二者相交, A包含于B。
该文将推理分为两种类型:
1. concept到concept的推理出subClassOf-subClassOf
2. instance到concept的推理出instanceOf-subClassOf
举例说明:
1. subClassOf-subClassOf
( 教授,是,学者 ) ∩( 学者,是,人 )⇒ (教授,是,人 )
2. instanceOf-subClassOf
( 张三,是,教 授 )∩( 教 授,是,学 者 ) ⇒ ( 张三,是,学者 )
四、模型训练
对于存在"subClassOf" 关系的三元组 (ci,rc,cj),两个概念球 si(pi,mi) 和 sj(pj,mj) ,两个球心的距离为:d=∥pi−pj∥2。若关系成立,两个球的位置关系应当像图(a)一样,它是对于正样本三元组的训练目标。另外三种情况,分别定义打分函数,使其相对位置关系向理想情况靠近。
如上图所是,两个概念Cj包含Ci,实体为概念空间中的向量,图a是理想模型。图b是两个球体相离,图c是两个球体相交,图d是两个球体被包含关系偏离实际。则:
1.(b)和(c)通过拉近球心距离,增加球j的半径,减小球i的半径,来达到(a)的效果;
2. (d)通过增加球j的半径,减小球i的半径,来达到(a)的效果。
五、论文及代码
边栏推荐
- .net6 encounter with the League of heroes - create a game assistant according to the official LCU API
- JS timer realizes the countdown and jumps to the login page
- 研发了 5 年的时序数据库,到底要解决什么问题?
- 基于多任务深度学习的实体和事件联合抽取模型
- Plato farm is expected to further expand its ecosystem through elephant swap
- 基于用户画像的在线健康社区用户流失预测研究
- My creation Anniversary - from the heart
- What is the problem of the time series database that has been developed for 5 years?
- [GYCTF2020]FlaskApp
- Tdengine helps Siemens' lightweight digital solution simicas simplify data processing process
猜你喜欢

我的创作纪念日-从心出发

What is the problem of the time series database that has been developed for 5 years?
![[GYCTF2020]FlaskApp](/img/ee/dcb42617af4a0e41657f6cf7095feb.png)
[GYCTF2020]FlaskApp

Research on technology subject division method based on patent multi-attribute fusion

Uni app from creation to operation to wechat developer tool

Multi task text classification model based on tag embedded attention mechanism

win10安装Dexdump并脱壳

GOM登录器配置免费版生成图文教程

One stop monitoring of the software and hardware infrastructure of the whole university, and Suzhou University replaces PostgreSQL with time series database

Latest battle report: Ten certifications and five best practices
随机推荐
12437 words, take you to explore the principle of RPC communication
A survey of machine learning based technology term recognition
URL的使用下载资源
Flink SQL(三) 连接到外部系统System和JDBC
当AI邂逅生命健康,华为云为他们搭建三座桥
低功耗多通道WFAS1431无线数据采集采发仪使用流程说明
C语言_结构体指针变量引入
Joint entity and event extraction model based on multi task deep learning
Use of URL download resources
~6. ccf 2021-09-1 数组推导
Circular queue (implemented in C language)
Solve the problem that JUnit of idea console cannot be input with scanner
Comparison between agile development and Devops
基于专利多属性融合的技术主题划分方法研究
Job 7.25 sorting and searching
First knowledge of opencv4.x --- image perspective transformation
gdb常用命令
Jzoffer (array; string; linked list)
手持振弦采集仪VH03各种接口使用说明
OLAP (business) - transaction analysis (query)