Chinese Compound Noun Phrases Semantic Relations Knowledge Base Construction and Auto Recognition

ZHANG Wenmin,LI Huayong,SHAO Yanqiu
2019-01-01
Abstract:(1.北京语言大学 信息科学学院,北京 100083) 摘 要:汉语复合名词短语因其使用范围广泛、结构独特、内部语义复杂的特点,一直是语言学分析和中文信息处理领域的 重要研究对象。国内关于复合名词短语的语言资源极其匮乏,且现有知识库只研究名名复合形式的短语,包含动词的复合名词短 语的知识库构建仍处于空白阶段,同时现有的复合名词短语知识库大部分脱离了语境,没有句子级别的信息。针对这一现状,该 文从多个领域搜集语料,建立了一套新的语义关系体系,标注构建了一个具有相当规模的带有句子信息的复合名词语义关系知识 库。该库的标注重点是标注句子中复合名词短语的边界以及短语内部成分之间的语义关系,总共收录 27007 条句子。该文对标注 后的知识库做了详细的计量统计分析。最后基于标注得到的知识库,该文使用基线模型对复合名词短语进行了自动定界和语义分 类实验,并对实验结果和未来可能的改进方向做了总结分析。 关键词:汉语复合名词短语;语义关系体系;定界识别 中图分类号:TP391 文献标识码:A
What problem does this paper attempt to address?