基于Web属性抽取训练分类模型的方法研究

被引:3
作者
吴月萍
机构
[1] 上海第二工业大学计算机与信息学院
关键词
属性抽取; 分类规则; 特征值; 最大熵;
D O I
10.19570/j.cnki.jsspu.2008.01.006
中图分类号
TP393.09 [];
学科分类号
080402 ;
摘要
针对通用搜索引擎信息量大、查询不准确、深度不够等问题,提出了基于Web的产品属性抽取这一新的搜索引擎服务模式。基于Web的产品属性抽取实际就是一个自动分类问题,其任务是:在给定的分类体系下,根据相关产品模板自动地判断属性的是非。完成此任务的关键在于寻找有效的特征值;确定相关分类规则,最终通过P、R和F指标来评价分类算法。
引用
收藏
页码:29 / 34
页数:6
相关论文
共 4 条
  • [1] 基于最大熵模型的组块分析
    李素建
    刘群
    杨志峰
    [J]. 计算机学报, 2003, (12) : 1722 - 1727
  • [2] 基于最大熵方法的中英文基本名词短语识别
    周雅倩
    郭以昆
    黄萱菁
    吴立德
    [J]. 计算机研究与发展, 2003, (03) : 440 - 446
  • [3] Exploiting diverse knowledge sources via maximum entropy in named entity recognition .2 BORTHWICK,ANDREW,STERLING J,et al. Processing of the 6th Workshop on Very Large Corpora . 1998
  • [4] Maximum Entropy Modeling Toolkit for Python and C++ .2 ZHANG Le. http://homepages.inf.ed.ac.uk/s0450736 . 2004