基于DPI数据挖掘实现URL分类挂载的相关技术研究

被引:3
作者
边凌燕
贺仁龙
姚晓辉
机构
[1] 中国电信股份有限公司上海研究院
关键词
深度分组检测; 中文分词; 特征选择; 文本分类;
D O I
暂无
中图分类号
TP311.13 [];
学科分类号
1201 ;
摘要
通过对DPI用户上网行为数据进行深入挖掘,实现与网页URL分类体系的归类映射,是精准锁定上网用户兴趣偏好特征的关键。在梳理DPI数据自动挂载URL分类节点流程的基础上,重点研究了过程中涉及的网页信息提取、中文分词、特征选择及文本分类等关键技术,为利用DPI数据提升客户洞察能力铺平了技术道路。
引用
收藏
页码:6 / 11+16 +16
页数:7
相关论文
共 10 条
[1]   DPI技术力助运营商精细化运营 [J].
罗忆祖 .
邮电设计技术, 2009, (03) :42-45
[2]   文本挖掘技术研究 [J].
薛为民 ;
陆玉昌 .
北京联合大学学报(自然科学版), 2005, (04) :59-63
[3]   国内中文分词技术研究新进展 [J].
冯书晓 ;
徐新 ;
杨春梅 ;
不详 .
情报杂志 , 2002, (11) :29-30
[4]  
Principal Manifolds for Data Visualisation and Dimension Reduction..Gorvan A;.Springer.2007,
[5]  
基于页面主体提取的WEB信息抽取技术研究.[D].于静.南京邮电大学.2013, 06
[6]  
中文文本分类中分词和特征选择方法研究.[D].李原.吉林大学.2011, 09
[7]  
文本分类的特征选择和分类方法研究.[D].王法波.山东大学.2011, 04
[8]  
文本分类的特征选择方法研究.[D].宋江.南京航空航天大学.2010, 08
[9]  
基于词典的中文分词技术研究.[D].郭瞳康.哈尔滨理工大学.2010, 06
[10]  
基于SVM算法的web分类研究与实现.[D].陈燃燃.北京邮电大学.2010, 03