一种基于使用差异的词语领域性分析方法

被引:5
作者
李素建 [1 ]
宋涛 [1 ]
高杰 [2 ]
幺鹏跃 [1 ]
李文捷 [3 ]
机构
[1] 北京大学计算语言学教育部重点实验室
[2] 山东菏泽学院
[3] 香港理工大学计算机系
关键词
人工智能; 自然语言处理; 领域性分析; 领域词; 领域部件词; 链接分析; 使用差异;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
081203 ; 0835 ;
摘要
领域知识的表达形式最终体现在词汇的领域性上,因此对领域词及其部件的领域度分析是一个关键。该文在分词的基础上,对各个领域语料进行分析,利用词语之间的关系,引入链接分析方法分析词语在各个领域中的使用重要性,并通过词语在各个领域中的使用差异性计算其领域度,从而达到领域分析的目的,获取某个领域的领域部件词。该文采用以上方法在军事、娱乐等领域进行了实验,实验结果表明该方法相对于当前常用的tf×idf方法和Bootstrapping方法,可以更有效地进行领域分析获取领域部件词。
引用
收藏
页码:72 / 78
页数:7
相关论文
empty
未找到相关数据