博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
清华大学-刘知远:表示学习与知识获取
阅读量:4616 次
发布时间:2019-06-09

本文共 874 字,大约阅读时间需要 2 分钟。

---恢复内容开始---

分布式表示优势:

在一段文本当中,进行实体抽取:实际是在计算词汇与文档之间的相似度。

自动摘要技术:是在计算句子与文档之间的相似度。

优势2:由表层的数据,关联关系,能够进一步挖掘出数据底层的深层语义,因果关系。

————————————————————————————————————————

NLP的任务:标注、理解、生成。

从多源异构的文本中,依次进行词汇表示、网络表示、知识表示。

其中词汇表示,包括实体、短语、文档、词义、句子的表示。

 

下面详细讲一讲词汇的表示。

word2Vec 主要包括2个模型

cbow: 知道一个词的前两个词和后两个词,推导出该词。

skip-gram: 知道改词,推导其前后两个词。

 

分布式词表示学习模型,可以进行词汇相似度的计算。比如,输入China ,计算如下。

 

词汇表示还可以发现词汇间的隐含关系

 

 词汇表示还可以发现词汇之间的语义层级关系

 

跨语言词汇联合表示

 

视觉-文本联合表示

 

 一个有意思的任务:给你一张图,生成该图的一句话的简要描述。image caption generation

词汇语义变迁研究

——————————————————————————————————————————————————————————————

知识表示:

 

知识表示与关系抽取

  1. 融合文本与知识进行关系抽取
  2. 利用关系路径进行关系抽取
  3. 利用远程监督多实例进行关系抽取

 

 融合文本与知识进行关系抽取

 融合实体描述的知识表示

zero-shot场景下的 关系预测

 

————————————————————————————————————————

利用关系路径进行关系抽取

Path Ranking Algorithm

 

 

PTransE:考虑关系路径的TransE

 

Path based TransE

 

关系抽取结果

 

 

远程监督关系抽取的多实例问题

 

多监督抽取结果

 

开源代码

 

 

 

 

 

 

---恢复内容结束---

转载于:https://www.cnblogs.com/vector11248/p/10409161.html

你可能感兴趣的文章
布局技巧4:使用ViewStub
查看>>
ddt Ui 案例2
查看>>
拿下主机后内网的信息收集
查看>>
LeetCode 876. Middle of the Linked List
查看>>
作业一
查看>>
joj1023
查看>>
动画原理——旋转
查看>>
Finding LCM LightOJ - 1215 (水题)
查看>>
python生成器
查看>>
PowerDesigner Constraint name uniqueness 错误
查看>>
系统子系统_GPRS子系统流程图
查看>>
为什么 NSLog 不支持 Swift 对象(转)
查看>>
Ubuntu 下搭建SVN服务器
查看>>
css3转换
查看>>
将字符串中不同字符的个数打印出来
查看>>
java第三次上机
查看>>
android Javah生成JNI头文件
查看>>
npm创建react项目
查看>>
关于u32中查找和定位最后到bit Number of 1 Bits
查看>>
sql数据库查询
查看>>