首页>参考读物>计算机科学与技术>数据库

个人数据管理
作者 : 李玉坤 孟小峰 编著
丛书名 : 大数据管理丛书
出版日期 : 2017-05-11
ISBN : 978-7-111-56106-4
定价 : 69.00元
扩展资源下载
扩展信息
语种 : 简体中文
页数 : 195
开本 : 16
原书名 :
原出版社:
属性分类: 店面
包含CD :
绝版 : 未绝版
图书简介

本书基于作者多年在个人数据管理方面的研究积累,对个人数据管理相关技术进行了总结和整理。内容涵盖了个人数据管理技术的发展、数据模型、数据集成、数据融合、数据存储、数据查询、系统实现、个人数据管理新技术发展几个部分。

图书前言

据IDC统计,2006年全球新产生的数据量达到1610亿GB,2007年达到2810亿GB,2010年达到12 000亿GB(1.2ZB),信息的爆炸性增长使人们日常需要处理的信息量迅速增长,个人数据管理问题日益突出。微软公司的研究员Gordon Bell从2000年开始收集个人数据信息,包括阅读的文章、听过的音乐、建立的文档、访问的网页、个人医疗信息以及拍摄的照片等,到2007年其收集的个人信息量已经达到150GB。个人信息量的迅猛增长使人们管理个人信息的负担日益加重。许多人都有这样的体会:尽管人们在信息分类、存储、备份、安全保护等方面花费了大量时间和精力,但仍然频繁出现问题,如硬盘意外损坏造成大量个人数据丢失,记忆不准确造成个人数据查找困难,分散存储数据导致数据的不一致,无意之中造成个人隐私信息泄露,等等。如何高效管理个人数据信息日益成为学术界和产业界共同关注的问题,特别是近年来随着Web 2.0、物联网等相关技术的发展,以及手机等移动终端的普及,个人的健康信息、移动轨迹等数据都可能被收集起来,个人数据量会进一步增长,个人数据管理问题将更加突出。
目前大数据管理技术日益引起相关领域学者的关注。大数据管理的最终目的是提高人们的生活质量与工作效率,这是大数据管理的价值体现。个人数据管理问题本质上是分散、大规模、异构、复杂数据的管理问题在个人数据管理领域的反映,涉及数据存储、索引、查询、安全与隐私保护等诸多问题,这也都是大数据管理所要解决的基本问题。本书旨在基于近年来作者在这一领域的研究工作,对个人数据管理相关技术进行整理,以期对该领域的研究人员、技术人员或普通用户有所帮助。
本书与同类图书的比较
本书作者自2006年开始进行个人数据管理方面的研究。本书基于作者及合作者多年在个人数据管理方面的研究积累,对个人数据管理相关技术进行了总结,内容涵盖个人数据管理技术的发展、数据模型、数据集成、数据融合、数据存储、数据查询、系统实现、个人数据管理新技术发展几个部分。
目前并未看到一本系统介绍个人数据管理相关理论、技术与系统实现方面的著作,本书作者参与编写的《Web数据管理:概念与技术》一书中介绍了数据空间的相关理论与技术,但是并未特别针对个人数据信息管理技术进行系统的阐述。
本书的内容和组织结构
本书分为8章。
第1章是本书的总述,主要讨论个人数据管理技术的发展、个人数据特征以及个人数据管理系统框架。
第2章介绍个人数据空间模型,包括概念模型、逻辑模型以及面向主体的任务空间和核心数据空间模型。
第3章重点介绍个人数据集成技术,主要包括个人数据集成的概念、个人初始数据空间的建立策略以及个人操作行为的识别技术。
第4章重点介绍个人数据集成中的数据融合问题,主要包括个人数据空间的同义词概念识别、个人数据的版本管理、基于时序关系的实体引用关系识别。
第5章主要介绍个人数据存储技术,包括分布式数据存储模式、支持数据空间演化的索引策略。
第6章重点讨论个人数据查询问题,主要包括查询接口、基于同义词的个人信息查询、基于任务的个人数据查询。
第7章重点讨论个人数据空间系统的实现技术、系统框架及相关功能。
第8章关注的是个人数据管理领域新的技术成果和研究动向。
本书主要面向各类研究人员和开发人员,既可以作为本研究方向的教科书,也可以作为本领域研究人员的技术参考书。
致谢
首先感谢我的导师孟小峰教授,我从2006年起即在孟老师的指导下开始从事个人数据管理的研究工作,记得当时读的第一篇文献是第一届国际个人信息管理技术研讨会(PIM Workshop 2005)发布的会议报告,这个报告首次提出了个人信息空间的概念,并对个人信息管理的一些基本概念和研究问题进行了阐述。后来孟老师又给我推荐了M.Franklin、A. Halevy和D. Maier的论文《From Databases to Dataspaces: A New Abstraction for Information Management》,这篇论文提出了数据空间的概念,并提及了其在个人信息管理领域的应用,以及来自不同领域的学者对于个人数据管理这一问题的深入思考,这使我对这一研究领域产生了浓厚的兴趣。其后,在孟老师的指导下,我与WAMDM实验室的硕士研究生张相於、寇玉波一起对个人数据空间模型、个人数据集成、索引、任务挖掘及查询问题进行了系统化的研究工作,其间纽约州立大学宾汉姆顿分校孟卫一教授多次到访WAMDM实验室,我有幸与其就任务空间等问题进行了交流,孟卫一教授给出了非常好的建议。通过四年的努力我最终完成了博士论文“个人数据空间模型与查询方法研究”。现在回想起来,WAMDM实验室以及Web研究组的例会对于我的研究工作影响很大,那种开放、探究的氛围使人难忘,一个想法的诞生往往源于大家充满激情的讨论。博士研究生毕业后我来到天津理工大学计算机与通信工程学院工作,继续从事个人数据管理方面的研究,先后指导硕士研究生赵喜燕、任标、雷鹏飞等围绕个人数据融合、数据关系识别、个人数据安全等做了一些研究,本书即是作者及合作者在多年研究成果的基础上总结和整理而成的。本书参阅了WAMDM实验室潘晓、王仲远、艾静、杜志娟等在位置隐私、互联网隐私保护、大数据融合方面的研究工作,我指导的研究生廖欢、苏慧丽对本书进行了编辑和校对,此外本书也引用了国内外一些学者的研究工作,在此一并表示感谢。
我的与个人数据空间相关的研究课题得到了国家自然科学基金(项目号:61170027)和天津市自然科学基金(项目号:15JCYBJC46500)项目的资助,由此得以在该领域继续深入开展自己的研究工作。此外,该工作始于作者在孟小峰教授的WAMDM实验室攻读博士学位期间的研究工作,其得到了国家863计划“海量数据空间模型、查询与索引技术研究”项目的支持。在此一并表示衷心感谢。
本书的形成源于孟小峰老师的一个心愿。2015年10月我在成都参加中国数据库年会(NDBC 2015)期间,遇到了孟老师和机械工业出版社华章分社的姚蕾老师,他们针对目前“大数据研究热度很高而普通人又感觉大数据遥不可及”的问题,拟出版一套关于大数据相关技术的丛书。孟老师提出大数据本身就是与人相关的数据,个人数据具备大数据的基本特征,同时又是重要的研究领域且有重要的应用价值,未来精准医疗、精准营销、个性化教育等大数据应用都离不开个人数据管理。于是作者产生了出版本书的想法,在此向孟老师和姚蕾老师表示感谢。
值得指出的是,在全书的撰写和课题的研究中,尽管投入了大量的精力、付出了艰苦的努力,但受知识水平所限,书中不当之处在所难免,恳请读者批评指正并不吝赐教。如果有任何建议或意见,可发电子邮件至liyukun@tjut.edu.cn。

李玉坤
2016年10月于天津理工大学

上架指导

计算机\数据库

作者简介

李玉坤 孟小峰 编著:
李玉坤,天津理工大学计算机学院计算机科学系主任,研究方向是数据集成、Web数据管理、个人信息管理。

图书目录

丛书前言
前言
作者简介
第1章 绪论
  1.1 引言
  1.2 个人数据管理的发展
  1.3 个人数据特征
  1.4 个人数据空间的提出
  1.5 个人数据管理系统框架
  参考文献
第2章 个人数据空间模型
  2.1 引言
  2.2 概念模型
    2.2.1 从数据到模式
    2.2.2 基于图的数据空间模型
  2.3 逻辑模型
    2.3.1 iDM数据模型
    2.3.2 RDF模型
    2.3.3 基于四元组的模型
  2.4 面向主体的数据模型
    2.4.1 核心数据空间
    2.4.2 任务空间
  2.5 小结
  参考文献
第3章 个人数据集成
  3.1 引言
  3.2 个人数据集成概述
    3.2.1 个人数据来源
    3.2.2 集成系统框架
    3.2.3 数据空间演化
    3.2.4 主体访问行为识别
  3.3 个人数据空间构建
    3.3.1 个人数据特征
    3.3.2 个人数据识别
  3.4 任务识别
    3.4.1 任务识别概述
    3.4.2 基于访问模式的算法
    3.4.3 基于稠密块的算法
  3.5 小结
  参考文献
第4章 个人数据融合
  4.1 引言
  4.2 个人同义词识别
    4.2.1 个人同义词概述
    4.2.2 个人实体命名特征分析
    4.2.3 同义词概念模型
    4.2.4 同义词表的构建
  4.3 实体引用关系识别
    4.3.1 个人数据引用关系概述
    4.3.2 基于访问序列的引用模型
    4.3.3 引用关系识别
  4.4 数据版本识别
  4.5 小结
  参考文献
第5章 个人数据存储
  5.1 引言
  5.2 存储模式
    5.2.1 分布式存储模式
    5.2.2 分级数据存储
    5.2.3 访问概率的计算
  5.3 倒排索引技术
    5.3.1 倒排表
    5.3.2 属性倒排表
  5.4 FAX索引
    5.4.1 模式匹配片段
    5.4.2 FAX索引结构
    5.4.3 查询处理
    5.4.4 索引更新
  5.5 UFAX索引
    5.5.1 索引结构
    5.5.2 查询处理与索引更新
  5.6 小结
  参考文献
第6章 查询处理
  6.1 引言
  6.2 查询接口
  6.3 基于同义词的关键字查询
  6.4 多属性组合查询
    6.4.1 数据分类结构
    6.4.2 查询处理算法
  6.5 基于任务的查询方法
    6.5.1 任务关系的识别
    6.5.2 查询处理
    6.5.3 排序方法
  6.6 小结
  参考文献
第7章 个人数据空间系统
  7.1 引言
  7.2 系统概述
  7.3 实现技术
    7.3.1 数据存储
    7.3.2 索引策略
    7.3.3 系统开发技术
  7.4 系统框架
  7.5 系统功能
    7.5.1 灵活的数据更新操作
    7.5.2 关联查询
    7.5.3 基于任务查询
    7.5.4 核心数据空间查询
  7.6 小结
  参考文献
第8章 个人数据管理技术发展
  8.1 引言
  8.2 数据存储
    8.2.1 分布式存储模式
    8.2.2 基于云存储的个人数据管理
    8.2.3 个人数据缓存策略
  8.3 数据安全与隐私保护
    8.3.1 数据安全
    8.3.2 隐私保护
  8.4 数据融合
    8.4.1 数据融合系统框架
    8.4.2 个人数据融合实例
    8.4.3 跨语言数据融合
    8.4.4 跨媒体数据融合
  8.5 新技术发展
    8.5.1 数据访问技术
    8.5.2 评价技术
    8.5.3 个人数据计算
    8.5.4 从个人数据空间到群组数据空间
    8.5.5 个人数据管理与大数据
  8.6 小结
  参考文献

教学资源推荐
作者: 何宁 黄文斌 熊建强
作者: 丁兆云 周鋆 杜振国 著
作者: K.P.Soman;Shyam Diwakar;V.Ajay
参考读物推荐
作者: (美)Lars Bo Vanting,Dirk Schepanek
作者: George Koch
作者: (丹)Sten E.Vesterli