截止目前累计成功为5,000,000 用户成功查重检测

CNCNKI学术不端文献查重检测系统 多语种 图文 高校 期刊 职称 查重 抄袭检测系统

「范文」基于位置语义和概率的人群分类方法

时间:2017-07-06 16:32:00 编辑:知网 阅读:

摘要 针对现有的人群分类方法忽略地理位置隐含的功能特征及其访问概率的问题,提出了一种基于位置语义和概率的人群分类方法。该方法主要包括两部分:位置语义发现、访问概率向量聚类。首先,经由位置语义发现方法得到位置词汇隐含的位置语义;其次根据位置语义分配情况获得用户对位置语义的访问概率向量;最后将其作为聚类分析的权向量,实现人群分类。实验结果表明,该方法能有效提取位置语义,得到的相同群体内用户经常访问相同的位置语义,对位置语义的访问概率向量相似。与现有的人群分类方法相比,本文提出的人群分类方法F-measure提高了4%,实验效果更优。

关键词 位置;语义信息;聚类分析;概率向量;人群分类

人群分类

城市化和现代文明的发展使城市由各种功能区域组成,如居民区、商业区、和教育区等。人们每天在这些功能区域之间从事不同的社会活动,如购物、工作、娱乐等。随着各种各样基于位置服务的应用软件的兴起,可以通过社交软件微信、购物软件淘宝、导航软件百度地图等获取人们在功能区域中活动产生的GPS坐标。深入挖掘移动用户的GPS坐标所在地区的功能特征,计算用户在不同功能特征区域出现的概率,对于研究群体用户的兴趣爱好、生活习惯,进而判断用户类型具有重要意义。例如,用户A的位置集中包含大量功能特征为餐馆的GPS坐标,可推断该用户喜欢在外就餐;甚至可进一步分析,得到用户时常光顾的餐厅类别,挖掘用户口味。

目前,基于地理位置的人群分类研究大多假设相似的用户通常会出现在相同的地方。这种方法局限于仅判断GPS坐标相似性,依据用户活动区域进行人群分类。若用户B的位置集中包含与用户A完全不同的GPS坐标,但其功能特征同为餐饮区,基于地理位置的人群分类会判定用户A与B是不同类型的用户,而这与事实不符。而现有基于功能特征的人群分类局限于用户是否拥有相同的功能特征,忽略了功能特征的不确定性。

针对以上问题,本文提出了一种基于位置语义和概率的人群分类方法。在所定义的位置词汇与位置语义概念基础上,将位置语义及其概率作为特征进行人群分类。首先通过位置语义发现方法挖掘位置词汇的深层语义,计算用户对位置语义的访问概率;再在此基础上构造聚类数据矩阵,以聚类结果识别用户类型。

1相关工作

随着用户位置数据的大量产生,基于位置数据的人群分类研究受到了不少学者的关注。按照人群分类特征的不同,可分为基于GPS坐标的分类方法和基于功能特征的分类方法。

基于GPS坐标的分类方法假设用户出现的GPS坐标可以作为推断用户社会关系的依据。频繁出现在相同的GPS坐标的用户可视为同类人群,因此可采用频繁模式[1-4]挖掘用户经常出现的坐标点,以此作为人群分类特征。宋衡等收集三个不同年级学生的位置数据,采用主成分分析(Principal Component Analysis,PCA)[5]提取特征,对学生进行年级分类,验证了地理位置是人群分类的重要属性。与此类似,张成等提出一种基于主成分分析(Principal Component Analysis,PCA)[6]的单变量贡献度方法,确定人群关键行为属性,利用最大似然估计方法对人群进行分类管理。基于GPS坐标的人群分类算法仅局限于在地理位置中选取分类特征,而在现实环境中,不同的地理位置可能具有相同的功能特征。

 

以上就是部分论文写作范文,如写好论文后想在查重的小伙伴,可以点击论文查重,然后选择相应的论文查重系统。PS:要先了解自己学校是什么检测系统!

返回