首页>参考读物>计算机科学与技术>数据库

移动数据挖掘
作者 : 连德富 张富峥 王英子 袁晶 谢幸 编著
丛书名 : 大数据管理丛书
出版日期 : 2017-05-11
ISBN : 978-7-111-56256-6
定价 : 69.00元
扩展资源下载
扩展信息
语种 : 简体中文
页数 : 149
开本 : 16
原书名 :
原出版社:
属性分类: 店面
包含CD :
绝版 : 未绝版
图书简介

本书在内容上摘取自近年来顶级会议或者期刊上发表的论文为基础进行改写,内容先进新颖。在主题上,和当前的在学术界和工业解的热点研究问题相一致。而且该书自成体系,内容丰富,构成了数据挖掘和机器学习在地理学、时空数据挖掘领域、推荐系统等领域的应用和理论创新。

图书前言

大约在十年前,本书作者所在的研究团队,也就是目前的微软亚洲研究院社会计算组,对挖掘人群移动数据中隐藏的知识产生了兴趣。这个团队在2007年开展了GeoLife项目,通过用户主动分享的移动数据来研究用户的出行模式,为旅游规划等应用提供支持。基于这个项目在WWW 2009大会上发表的论文“Mining interesting locations and travel sequences from GPS trajectories”目前引用数已经上千,在学术界产生了一定的影响。本书第一作者,目前在电子科技大学任教的连德富教授,长期针对基于移动数据的推荐系统进行研究,发表了大量有影响力的研究成果。在过去十年,随着室内外定位、移动社交网络和物联网技术的发展与普及,移动数据的种类、规模和产生速度一直在迅速增加。这些数据中很大一部分是由人产生的,也就是通过各种方式记录下来的人的活动历史。它们包含了大量的知识,对于众多实际应用有着重要的价值。我们可以通过对这些数据进行挖掘,发现人类出行的规律,并针对用户的属性和兴趣爱好生成画像,从而为用户提供更加个性化的服务,包括交通出行规划、旅游线路和购物餐饮推荐等。这些知识还能用来研究疾病传播、城市发展以及人类迁徙等具有重大社会意义的科学问题。在实际应用中,移动数据的形式多种多样,既有来自移动社交网络的签到数据,来自运营商的日志数据,也有来自公交计费系统的刷卡记录数据,还有很多并不是由人产生的数据,例如由车辆、船舶甚至动物的移动生成的数据。在本书中,我们试图以人群移动数据为例,探讨和设计针对移动数据的数据挖掘算法,并指出在该领域展开研究将面临的挑战,希望这些经验也同样能应用到其它类型的移动数据上。编辑为本书封面选取了清代苏州籍宫廷画家徐扬的巨幅长卷画作《姑苏繁华图》。在画中,画家通过自己对城市的理解,重现了苏州“商贾辐辏,百货骈阗”的市井风情。令人惊叹的是,据说全画中有各色人物1万2千余人。将他们的活动一一刻画出来是一个浩大的工程,反映了画家对苏州居民生活和出行规律的深刻理解,这也完美呼应了本书的主题。最后,我们希望本书能帮助有兴趣研究移动数据挖掘的读者缩短学习的过程,共同推进该领域的研究进展。

作者
2017年4月

上架指导

计算机\数据挖掘

作者简介

连德富 张富峥 王英子 袁晶 谢幸 编著:
连德富,博士,电子科技大学计算机学院讲师,教育大数据研究所副所长。2009年本科毕业于中国科学技术大学计算机学院,2014年在中国科学技术大学获得计算机应用专业博士学位,以及中科院院长奖。他的研究领域包括用户建模、推荐系统、时空数据挖掘、教育大数据等,在KDD、IJCAI、WWW、ICDM、TIST等顶级期刊和会议上发表论文20余篇。


图书目录

丛书前言
前言
作者简介
第1章 引言1
  1.1 移动数据及其价值1
  1.2 概念与定义4
  1.3 挑战5
  1.4 本书简介7
第2章 移动数据预处理10
  2.1 移动数据简介10
  2.2 缺失数据补全18
    2.2.1 公交卡的上下点补全19
    2.2.2 地点类别补全23
  2.3 重要地点检测25
  2.4 语义信息标注29
    2.4.1 区域功能标记29
    2.4.2 地点命名36
第3章 用户移动建模42
  3.1 基于人类动力学的移动建模研究43
    3.1.1 连续时间的随机游走模型43
    3.1.2 引力模型47
  3.2 基于时空数据挖掘的移动建模研究47
    3.2.1 马尔可夫链模型48
    3.2.2 时间规律性模型58
    3.2.3 时空降维模型60
    3.2.4 社交关系影响63
    3.2.5 新颖地点预测65
    3.2.6 预测算法的融合66
第4章 基于移动数据的用户画像73
  4.1 显性属性预测74
    4.1.1 移动数据和显性属性的关联74
    4.1.2 位置画像模型76
  4.2 隐性属性预测80
    4.2.1 猎奇心理特质挖掘80
    4.2.2 消费冲动心理挖掘85
第5章 个性化兴趣地点推荐90
  5.1 协同过滤92
    5.1.1 基于邻域的方法93
    5.1.2 基于社交相似性的协同过滤95
    5.1.3 基于模型的方法95
  5.2 基于内容的过滤102
    5.2.1 内容过滤方法简介103
    5.2.2 地理建模104
    5.2.3 文本内容与情感分析108
  5.3 混合方法110
    5.3.1 混合模型基本方法110
    5.3.2 地理建模和协同过滤的联合模型111
    5.3.3 社交正则化的矩阵分解116
    5.3.4 内容感知的协同过滤方法117
    5.3.5 集成学习120
  5.4 情境感知的协同过滤方法120
    5.4.1 时间感知的地点推荐120
    5.4.2 序列化地点推荐124
  5.5 地点推荐系统的评价124
第6章 结语126
参考文献128

教学资源推荐
作者: 李丹 赵占坤 丁宏伟 石彦芳
作者: [美]孟卫一(Weiyi Meng)纽约州立大学宾汉姆顿分校 於德(Clement T. Yu) 伊利诺伊大学芝加哥分校  著
作者: Ramon A.Mata-Toledo,Pauline K.Cushman
参考读物推荐
作者: (美)Shankaran Iyer
作者: (美)Ben Chang Mark Scardina Stefan Kiritzov
作者: Paul DuBois