一种基于中文分词和数据聚合的餐饮行为特征挖掘方法

被引:23
作者
刘为怀
才华
何东杰
机构
[1] 中国银联电子支付研究院
关键词
大数据; 中文分词; 数据挖掘; 数据聚合; 餐饮行为特征;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
120506 [数字人文];
摘要
针持卡人使用银行卡进行日常交易时,通过商户类别码(MCC)可以判断交易商户是否为餐饮商户,但是无法进一步细分交易商户所属菜系。为了分析持卡人餐饮行为特征,提出了一种银联数据与外部数据相结合的数据聚合方法。选择百度地图餐饮数据作为外部数据,对不同菜系的餐馆名进行中文分词、清洗,形成区分不同菜系的关键词组。以银联大数据平台为基础,百度数据与银联数据通过Map Reduce技术进行聚合。百度菜系的关键词组对银联餐饮商户进行菜系划分,带有菜系标签的银联餐饮商户数据与银联持卡人日常交易数据进行聚合,挖掘出持卡人餐饮行为特征。
引用
收藏
页码:47 / 51+56 +56
页数:6
相关论文
empty
未找到相关数据