学位论文 > 优秀研究生学位论文题录展示
面向社会网络应用的关系抽取研究
作 者: 江超男
导 师: 丁晟春
学 校: 南京理工大学
专 业: 情报学
关键词: 命名实体识别 角色标注 关系抽取 社会关系本体 SWRL规则 Jess 隐含关系挖掘
分类号: G350
类 型: 硕士论文
年 份: 2010年
下 载: 245次
引 用: 2次
阅 读: 论文下载
内容摘要
自搜索引擎出现至今,大量信息扑面而来,但其中绝大部分均为重复信息。搜索引擎返回了过多的结果却依旧很难找到有用的信息。倘若有一种方法能将检索结果进行有效过滤,只抽取出人们所需要的关键信息,并以网络图的形式,而非仅仅是文字的形式呈现出来的话,则人们获取信息的效率必将会大大提高。基于此,本文针对社会网络领域中命名实体间的关系抽取问题进行了深入研究,尝试构建了一个面向社会网络领域的社会关系本体,在包含两个或两个以上命名实体的句子中抽取出相应的词语作为实体间的关系描述。同时还定义了一系列的SWRL规则,并结合Jess推理引擎对本体中的隐含社会关系进行了挖掘。在命名实体识别任务中,本文主要针对人名和机构名进行识别,借鉴了语义角色标注的思想,采用Viterbi算法,自动标注出句中各分词片段在人名或机构名中所代表的不同角色,同时根据人名和机构名的成词特点,总结出符合条件的构词规则,进行模式匹配,以得出最终的识别结果。本文对真实语料进行了开放测试,实验结果显示,该方法的召回率高于准确率,已接近70%。此结果验证了上述方法的有效性。在关系抽取任务中,本文综合本体工程中的七步法和迭进法,构建了一个面向社会网络领域,应用于互联网行业内企业的社会关系本体。同时设计了一系列的SWRL规则,将其与社会关系本体一并导入Jess规则推理引擎中,尝试通过本体严密的概念逻辑关系进行推理,以挖掘出实体间的隐含社会关系。最终得到(实体关系实体)的关系三元组并存入关系库中,大大精炼了信息内容,提高了人们获取信息的效率。
|
全文目录
相似论文
- 英文文本中命名实体识别及关系抽取技术研究,TP391.1
- 基于本体的医学命名实体识别技术研究,TP391.1
- 基于CRF的命名实体和关系的联合抽取,TP391.4
- 基于点击数据和搜索结果片断的命名实体挖掘,TP391.3
- 基于自学习的社会关系抽取的研究,TP391.1
- 基于丰富特征和多核学习的蛋白质关系抽取,Q51
- 面向概念查询的生物医学多文档摘要技术研究,TP391.1
- 中文命名实体识别与歧义消解研究,TP391.1
- 中文命名实体识别及若干相关问题的研究,TP391.41
- 基于最大熵模型的中文实体关系自动抽取研究,TP391.1
- 采用JESS开发专家系统的研究与应用,TP311.52
- 基于马尔可夫逻辑网络的语义角色标注,TP391.1
- 基于分层需求的领域本体构建及语义标注方法研究,TP391.1
- 基于条件随机场的中文命名实体识别研究,TP391.4
- 基于条件随机场的中文命名实体识别,TP391.43
- 本地搜索领域POI缩略词词典的研究,TP391.3
- 基于分类器融合的生物医学命名实体与关系识别研究,TP391.4
- 领域自适应的中文实体关系抽取研究,TP391.1
- 汉英双向时间数字和数量词的识别与翻译技术,TP391.2
- 语义角色标注的集成策略的研究,TP391.1
- 基于Web的比较观点挖掘方法研究,TP391.1
中图分类: > 文化、科学、教育、体育 > 科学、科学研究 > 情报学、情报工作 > 情报学
© 2012 www.xueweilunwen.com
|