基于大规模手机感知数据的用户特性挖掘

被引:0
作者
赵莎
机构
[1] 浙江大学
关键词
智能手机; 用户特性挖掘; 匿名WiFi扫描列表; 手机App安装列表; 手机App使用行为; 移动模式; 用户属性; 用户群体;
D O I
暂无
年度学位
2017
学位类型
博士
摘要
智能手机逐渐成为人们日常生活中不可或缺的一部分。作为智能手机的主体,用户在频繁使用手机的过程中产生了大量的个人历史数据。这些历史数据可以概括为以下几种:1)位置信号,通过GPS、手机信号塔、WiFi等方式获取的地理位置信息;2)使用信号,记录了用户在何时何地使用了手机做了什么;3)社交信号,隐含在CDR(call detail record),GPS,WiFi/蓝牙连接以及通讯录等数据里;4)个人行为信号,通过加速度、陀螺仪、相机等传感器获取。考虑到智能手机经常被同一个用户使用,这些历史数据隐含了很多与用户相关的个性化信息,例如性别,年龄,职业,婚姻状况等,也在一定程度上反应了用户的生活习惯和兴趣爱好。智能手机为推测用户属性与特征、理解用户提供了新的信息渠道。通过智能手机感知数据理解用户不仅有商业价值,并且可以帮助用户更好地理解自已。首先,通过智能手机感知数据理解用户有很强的商业价值,可以用来改善设备,应用和服务。例如,通过理解用户的兴趣爱好、属性等基本信息更好地提高应用的个性化,例如,个性化网页搜索和个性化推荐,进而提高商业利益。其次,通过手机记录的数据来理解用户可以帮助用户更全面更客观地了解自已。手机记录的一些行为信息可以帮助用户去客观的了解自已,也帮助他们发现自已不了解的一面。另外,人们的记忆能力是有限的,而手机的记录是无限的,可以持续长时间的记录用户的行为信息,从而帮助用户全面地理解自已。用户更全面地理解自已,可以帮助用户改善不健康的生活习惯等,从而提高生活质量。本文基于真实的手机感知数据,以理论研究为基础,着重从位置信息、手机App的安装信息以及手机app的使用信息等三个方面来理解用户的移动性、生活模式、兴趣偏好及习惯等特性。考虑到移动信息揭示了用户在日常生活中“何时”“何地”的基本要素,我们首先通过匿名WiFi扫描列推测用户的动态属性,移动性;其次,试图通过手机App安装列表挖掘用户的静态属性,例如年龄、性别、兴趣、偏好等;最后,我们通过手机App的使用信息去综合理解用户之间的相似性和差异性,并发现多个用户群体的存在。我们具体研究内容与意义描述如下:(1)基于匿名WiFi扫描列表的用户移动模式分析首先,我们试图从匿名的WiFi扫描列表里推测用户的移动轨迹,并在此基础上发现用户的生活方式。我们在WiFi扫描列表里提取出驻留地点之后,利用图论知识给每个用户建立了移动图,以描述他/她的移动轨迹。在用户的移动图里,我们通过社群检测的方法推测出用户的活动区域。在发现的活动区域的基础之上,我们定义了活跃性和多样性两个指标来衡量用户的移动性。除此之外,我们识别出家庭和工作地点两个重要的地点,并学习用户在家和工作地点方面的生活习惯,例如,某个用户在家待的平均时长,晚上外出的活跃性,分别在工作日和周末的工作时长等。我们在Device Analyzer数据集上验证了我们的方法,其中Device Analyzer数据及包含了17,000多个用户详细的手机使用信息。(2)基于手机App安装列表的用户属性挖掘除了推测用户的动态属性,移动性,我们还试图通过手机app安装列表挖掘用户的静态属性,例如,性别、年龄、兴趣、偏好等。我们尝试通过用户的手机App安装列表去挖掘用户的属性。我们提出基于特定属性的表征方法来描述用户的特性,并且对手机app与特定的属性之间的关系进行建模。为了验证我们的方法,我们在一个包含100,000多用户的手机App列表的数据集上做了很多实验。我们的方法对于12个预定义的用户属性,平均等错误率为16.4%。据我们所知,这是第一个通过手机App安装列表来挖掘用户属性的工作。(3)基于手机App使用记录的用户群体发现最后,我们试图通过分析手机App的使用情况,综合地理解用户之间的差异性和相似性,从而发现多个用户群体。我们分析了 106,672个安卓手机用户持续一个月的手机App的使用信息,利用我们提出的两步聚类法和特征排序的方法,基于手机App使用行为的相似性,发现了 382个明显不同的手机用户群体。我们的研究结果对可推广的研究,手机应用的设计和开发,不同用户群体的手机应用预安装的决策方面都有着深远的意义。
引用
收藏
页数:128
共 28 条
[1]
Your Installed Apps Reveal Your Gender and More!.[J].Suranga Seneviratne;Aruna Seneviratne;Prasant Mohapatra;Anirban Mahanti.ACM SIGMOBILE Mobile Computing and Communications Review.2015, 3
[2]
Predicting User Traits From a Snapshot of Apps Installed on a Smartphone [J].
Seneviratne, Suranga ;
Seneviratne, Aruna ;
Mohapatra, Prasant ;
Mahanti, Anirban .
MOBILE COMPUTING AND COMMUNICATIONS REVIEW, 2014, 18 (02) :1-8
[3]
Mining geographic-temporal-semantic patterns in trajectories for location prediction.[J].Josh Jia-Ching Ying;Wang-Chien Lee;Vincent S. Tseng.ACM Transactions on Intelligent Systems and Technology (TIST).2014, 1
[4]
Temporal motifs reveal homophily, gender-specific patterns, and group talk in call sequences [J].
Kovanen, Lauri ;
Kaski, Kimmo ;
Kertesz, Janos ;
Saramaki, Jari .
PROCEEDINGS OF THE NATIONAL ACADEMY OF SCIENCES OF THE UNITED STATES OF AMERICA, 2013, 110 (45) :18070-18075
[5]
Overlapping community detection in networks.[J].Jierui Xie;Stephen Kelley;Boleslaw K. Szymanski.ACM Computing Surveys (CSUR).2013, 4
[6]
Mobile application usage prediction through context-based learning [J].
Leroux, Philip ;
Roobroeck, Klaas ;
Dhoedt, Bart ;
Demeester, Piet ;
De Turck, Filip .
JOURNAL OF AMBIENT INTELLIGENCE AND SMART ENVIRONMENTS, 2013, 5 (02) :213-235
[7]
Clustering and community detection in directed networks: A survey [J].
Malliaros, Fragkiskos D. ;
Vazirgiannis, Michalis .
PHYSICS REPORTS-REVIEW SECTION OF PHYSICS LETTERS, 2013, 533 (04) :95-142
[8]
Mining large-scale smartphone data for personality studies [J].
Chittaranjan, Gokul ;
Blom, Jan ;
Gatica-Perez, Daniel .
PERSONAL AND UBIQUITOUS COMPUTING, 2013, 17 (03) :433-450
[9]
Discovering places of interest in everyday life from smartphone data [J].
Montoliu, Raul ;
Blom, Jan ;
Gatica-Perez, Daniel .
MULTIMEDIA TOOLS AND APPLICATIONS, 2013, 62 (01) :179-207
[10]
Human Mobility Characterization from Cellular Network Data [J].
Becker, Richard ;
Caceres, Ramon ;
Hanson, Karrie ;
Isaacman, Sibren ;
Loh, Ji Meng ;
Martonosi, Margaret ;
Rowland, James ;
Urbanek, Simon ;
Varshavsky, Alexander ;
Volinsky, Chris .
COMMUNICATIONS OF THE ACM, 2013, 56 (01) :74-82