首页>参考读物>计算机科学与技术>综合

社会网络分析:方法与实践
作者 : (美)Maksim Tsvetovat Alexander Kouznetsov 著
译者 : 王薇 王成军 王颖 刘璟 译 阳志平 审校
出版日期 : 2013-06-13
ISBN : 978-7-111-42341-6
定价 : 59.00元
扩展资源下载
扩展信息
语种 : 简体中文
页数 : 190
开本 : 16
原书名 : Social Network Analysis for Startups: Finding connections on the social web
原出版社: OReilly Media, Inc.
属性分类: 店面
包含CD :
绝版 : 未绝版
图书简介

图书特色

社会网络分析(SNA)是一门比Facebook和Twitter等社交网站早30年问世的学科。通过社会网络分析研究,你能够了解到识别社会化媒体、政治团体、企业、文化趋势及人际网络的模式所需的概念和技术。
本书是一本帮助你快速掌握社会网络分析技术要点、核心概念与典型算法示例的优秀著作。本书重点阐释了如何从庞大的社会网络分析学术积累中,挑选最精要的与实用的知识点,帮助你形成关于社会网络分析的知识谱系图。
通过本书,你还可以学习到如何使用Python语言和其他开源工具,如NetworkX、NumPy和matplotlib,以采集、分析并将社交网络数据可视化。本书将社会网络理论和实践完美结合,同时介绍了很多有价值的行业洞见和理念。
■ 概述社会网络分析的背景信息与图论数学基础。
■ 详细介绍如何分析社会网络,并从个体与群体两个层面介绍社会网络的主要测量指标与分析方法。
■ 重点介绍社会网络节点层面的四个核心指标:程度中心性、亲近中心性、居间中心性、特征向量中心性。
■ 详细介绍社群划分的基础知识:如何划分社会网络、利用结构洞、进行三元组普查与分析。
■ 概述二模网络与多模网络的基础知识。
■ 探究信息如何传播,展示分析动态社会网络发展的建模技巧。
■ 概述获取网络数据的入门知识。

作者介绍
  Maksim Tsvetovat是一个跨学科的科学家、软件工程师和爵士音乐家。他从卡内基·梅隆大学获得计算、组织和社会方向的博士学位,专注于社会网络进化、信息和态度扩散、集体智能发生的计算机建模。目前,他在乔治·梅森大学教授社会网络分析。他还是DeepMile Networks公司的联合创始人之一,该公司聚焦于社交媒体影响的图形化。Maksim还教授社会网络分析的管理人员研讨班,包括面向创业公司的“社会网络”和面向决策人员的“理解社交媒体”。
  Alexander Kouznetsov是一名软件设计师和架构师,具有从数据仓库到信号处理的广泛技术背景。他为业界开发了大量的社会网络分析工具,从大规模数据采集到在线分析和演示工具。Alex在得克萨斯大学获得数学和计算科学学士学位。

图书前言

2011年,很多创业公司都在他们的商业计划中提到“social”这个词——虽然事实上并没有人知道如何分析和理解这能够决定公司成败的社交过程。如果你从事如下工作:社交媒体、社交CRM、社交营销、管理咨询等,你应该读一读这本书,它会告诉你社交系统是如何发展、演变以及运转的。
  这本书的内容不仅仅适用于创业公司。实际上,整本书就是一门系统的课程,它囊括了几乎一个学期的理论知识和实际操作材料——阅读以后,你就会对于社会网络分析是“危险的”有足够的理解。如果你是这个研究领域的学生,我们强烈鼓励你去寻找并阅读脚注里提到的每一篇论文或每一本书。这样做会让你非常了解这个领域的经典文献,也可以让你自信地开展研究课题。
  如果你有计算机技术背景,可以从这本书学到主要的社会学概念,并从中提取出可以用来编程的信息和分析数据;如果你有社会学或市场营销背景,你会发现一些熟悉的材料,与此同时也会学到用定量和定性的方法去了解社交背景下的人们。
阅读本书的前提
  由于这本书的受众非常广泛,因此我们尽可能少地使用专业术语,同时为书中的专业术语做出解释。但是,本书会有大量的技术内容(这是O’Reilly出版图书的一项要求)。
  我们希望你至少稍微熟悉Python,即,能自己写脚本、了解语言的基本控制结构和数据结构。如果你不了解技术内容,建议你可以使用Python的在线教程或者参考Paul Barry(O’Reilly出版)写的《Head First Python》开始学习。
本书不会涉及从Twitter、Facebook以及其他数据来源收集数据的详细过程,O扲eilly出版的“Animal Guide”系列的其他书籍已经提供了充分的资料,如Kevin Makice写的《Twitter API: Up and Running》以及Matthew Russell写的《Mining the Social Web》。
开源工具
本书使用开源的Python库,包括:NetworkX、NumPy和MatPlotLib。
NetworkX工具包和相关文档可以在http://networkx.lanl.gov/找到。
参考文献:Aric A. Hagberg, Daniel A. Schult and Pieter J. Swart, 揈xploring network struc-ture, dynamics, and function using NetworkX in Proceedings of the 7th Python in Science Conference (SciPy2008), eds. Gel Varoquaux, Travis Vaught, and Jarrod Millman, pp. 1115, Aug 2008.
NumPy工具包和相关文档可以在http://numpy.scipy.org/找到。
参考文献:Oliphant, Travis E. 揚ython for Scientific Computing Computing in Science & Engineering 9(2007), 10-20 Ascher, D. et al. Numerical Python, tech. report UCRLMA-128569, Lawrence Livermore National Laboratory, 2001.
MatplotLib 可以在 http://matplotlib.sourceforge.net找到。
参考文献:Hunter, J.D. 揗atplotlib: A 2D Graphics Environment Computing in Science & Engineering 9(2007), 90-95.
本书的约定
本书使用了以下排版约定:
斜体(Italic)
用于新术语、URL、电子邮件地址、文件名与文件扩展名。
等宽字体(Constant width)
用于表明程序清单,以及在段落中引用的程序中的元素,如变量、函数名、数据库、数据类型、环境变量、语句、关键字。
等宽粗体(Constant width bold)
用于表明命令,或者需要读者逐字输入的文本内容。
等宽斜体(Constant width italic)
用于表示需要使用用户提供的值或者由上下文决定的值来替代的文本内容。
注意: 这个图标代表一个技巧、建议或一般性说明。
警告: 这个图标代表一个警告或注意事项。
示例代码的使用
本书提供代码的目的是帮你快速完成工作。一般情况下,你可以在你的程序或文档中使用本书中的代码,而不必取得我们的许可,除非你想复制书中很大一部分代码。例如,你在编写程序时,用到了本书中的几个代码片段,这不必取得我们的许可。但若将O’Reilly图书中的代码制作成光盘并进行出售或传播,则需获得我们的许可。引用示例代码或书中内容来解答问题无需许可。将书中很大一部分的示例代码用于你个人的产品文档,这需要我们的许可。
注意: 所有的代码、数据和示例都可以从GitHub下载:https://github.com/maksim2042/SNABook。
如果你引用了本书的内容并标明版权归属声明,我们对此表示感谢,但这不是必需的。版权归属声明通常包括:标题、作者、出版社和ISBN号,例如:“Social Network Analysis for Startups by Maksim Tsvetovat and Alexander Kouznetsov (O’Reilly). 2011 Maksim Tsvetovat and Alexander Kouznetsov, 978-1-449-30646-5”。
如果你认为你对示例代码的使用已经超出上述范围,或者你对是否需要获得示例代码的授权还不清楚,请随时联系我们:permissions@oreilly.com。
联系我们
有关本书的任何建议和疑问,可以通过下列方式与我们取得联系:
美国:
O’Reilly Media,Inc.
1005 Gravenstein Highway North
Sebastopol,CA 95472
中国:
北京市西城区西直门南大街2号成铭大厦C座807室(100035)
奥莱利技术咨询(北京)有限公司
我们会在本书的网页中列出勘误表、示例和其他信息。可以通过http://www.oreilly.com/catalog/0636920020424/访问该页面。
要评论或询问本书的技术问题,请发送电子邮件到:
bookquestions@oreilly.com
想了解关于O扲eilly图书、课程、会议和新闻的更多信息,请访问以下网站:
http://www.oreilly.com.cn
http://www.oreilly.com
还可以通过以下网站关注我们:
我们在Facebook上的主页:http://facebook.com/oreilly
我们在Twitter上的主页:http://twitter.com/oreillymedia
我们在Youtube上的主页:http://www.youtube.com/oreillymedia
感谢
Max Tsvetovat 感谢他的老师:Sergei Fyodorovich Ivanov(High School #367,St. Petersburg, Russia)、Maria Gini(明尼苏达大学)、Kathleen Carley和Katya Sycara(卡内基·梅隆大学),教了一个不守规则的学生许多年,最重要的是,教会了他独立思考、主动学习的能力。他感谢家人的鼓励和耐心,在他深夜写作的时候(尤其是小David,整晚都在睡觉,这样可以让父亲安心地写作)。感谢Miles Davis的音乐、NorthSide Social的咖啡、Wardrobe我像是在开玩笑吗?  
Alex Kouznetsov 要感谢很多朋友、老师和大学同学的帮助。他感谢家人的支持,尤其是他的妻子Natalia,感谢她的悉心照顾。还要感谢Nikolai Afanasievich Kolobov(莫斯科电子和数学学院),在哪里我体验到非正统思想的乐趣、科学的严谨,并使我走上科学研究的道路。感谢老友Javier Sanchez,让我学会了辩证地思考,并主动地为了兴趣和利益去学习。

上架指导

计算机\网络

封底文字

社会网络分析(SNA)是比脸书(Facebook)和推特(Twitter)问世早30年就已经出现的一门学科。通过社会网络分析研究专家,你能够了解到识别社交媒体、政治团体、企业、文化趋势及人际网络的模式所需的概念和技术。
本书是一本帮助你快速掌握社会网络分析技术要点、核心概念与典型算法示例的优秀著作。本书重点阐释了如何从庞大的社会网络分析学术积累中,挑选最精要的与实用的知识点,帮助你形成关于社会网络分析的知识谱系图。
你还可以学习到如何使用Python语言和其他开源工具,如NetworkX、NumPy和Matplotlib,以采集、分析并将社交网络数据可视化。本书是社会网络理论和实践的完美结合,同时介绍了很多有价值的行业洞见和理念。
本书主要内容:
·概述社会网络分析的背景信息与图论数学基础。
·详细介绍如何分析社会网络,并从个体与群体两个层面介绍社会网络的主要测量指标与分析方法。
·重点介绍社会网络节点层面的四个核心指标:程度中心性、亲近中心性、居间中心性、特征向量中心性。
·详细介绍社群划分的基础知识:如何划分社会网络、利用结构洞、进行三元组普查与分析。
·概述介绍二模网络与多模网络的基础知识。
·探究信息如何传播,展示分析动态社会网络发展的建模技巧。
·概述获取网络数据的入门知识。

作者简介

(美)Maksim Tsvetovat Alexander Kouznetsov 著:Maksim Tsvetovat跨学科的科学家、软件工程师和爵士音乐家,社会网络分析领域专家,拥有丰富的数据分析、处理工作经验,专注于社会网络进化、信息和态度扩散、集体智能发生的计算机建模。他拥有卡内基?梅隆大学计算、组织和社会方向博士学位,目前在乔治?梅森大学教授社会网络分析。他还是DeepMile Networks公司联合创始人之一,该公司开展社交媒体影响图形化业务。 Alexander Kouznetsov软件设计师和架构师,社会网络分析专家,拥有从数据仓库到信号处理的广泛技术背景。他为业界开发了大量的社会网络分析工具,从大规模数据采集到在线分析和演示工具。他在得克萨斯大学获得数学和计算科学学士学位。

译者简介

王薇 王成军 王颖 刘璟 译 阳志平 审校:暂无简介

译者序

在一个社交网络中,谁是明星人物?谁是边缘人物?谁是八卦传播者?谁是沟通两个不同网络的搭桥者?谁是真正的实权人物,在社交网络中沉默却拥有极大权力?
  为什么当基地恐怖分子发动攻击时,每组人数不能超过六人?为什么网上病毒传播关键临界节点是7%,当一条微博渗透率突破它,才从线性增长变为病毒传播式增长?
  为什么在脸谱一步一步起家时,都先要在一个小范围内吸引社群关注达到6%的饱和度,才考虑从一个小的社群(如哈佛大学),跃迁到一个更大的社群(如常青藤高校)中去呢?
  本书阐释了帮助我们理解这些现象背后的科学与技术。对各类关系谜题的研究,构成了人类学术史波澜壮阔的一面。始于20世纪30年代,由社会心理学家莫雷诺创立,社会学、经济学研究者发扬光大的学派——社会网络分析(Social Network Analysis,SNA)开启了一条将关系图论化的新道路。
  社会网络分析将社会关系看做节点(node)和连带(tie)组成的网络(network)。节点表示网络内的独立行动者(actor),网络则用来表示行动者之间的关系。行动者主体可以从个体、组织到国家;同样,关系也可以是人际关系、组织关系与国家关系。如果说传统回归分析等统计技术关心的是个体层面各类属性的统计技术,那么社会网络分析致力于分析关系数据。
  推特、脸谱等社交媒体已成为人们生活的一部分,每时每刻,天南海北,都在产生大量实时关系数据。人们第一次在历史上提供了对人类关系图谱在时间与空间上大尺度的取样。社会网络研究者可以轻易地下载分布在全世界数千万甚至上亿红男绿女长达数年的喜怒哀乐。其中蕴涵的价值令每一位社会网络爱好者激动不已。
  然而,社会网络分析庞大的学术积累已制造了一个较高的入门门槛。社会网络分析新增的三块砖头:小世界网络、无标度网络与随机网络,更使得它渐渐与物理科学的复杂性研究、计算机科学的网络科学交错在一起,走向“可计算的社会科学”(Computational Social Science)。
  初学者如何更好地迈过这个门槛?本书是一本帮助你快速掌握社会网络分析技术要点、核心概念与典型算法示例的优秀图书。本书与市面上既有图书不同,它具备一个鲜明特点:基于开源软件(NetworkX)讲授。
  截至今天,还有不少社会网络分析研究者使用UCINET等基于Windows窗口的软件。我们可以将UCINET理解为社会网络分析中的类Excel软件。海量增长的数据、日新月异的计算模型,使得这类商业软件的弊端越来越明显。使用开源软件与商业软件更是在社区支持、知识再生产上差异极大。基于R或Python的开源社会网络分析包,如R语言的SNA或IGRAPH、Python的NetworkX,在设计新模型、开发新算法、分析大数据与进行可重复分析等方面目前已经完胜。
  本书以基于Python的网络分析包NetworkX作为社会网络分析工具,但不是一本NetworkX使用手册。作者将重点放在如何从庞大的社会网络分析学术积累中,挑选最精要与最实用的知识点,以帮助读者形成关于社会网络分析的知识谱系图。全书可以分为四部分。第1章和第2章是基础知识,主要介绍社会网络分析的背景信息与图论基础知识。第3~5章主要介绍如何分析社会网络,分别从个体与群体两个层面,介绍社会网络的主要测量指标与分析方法。其中第3章重点介绍社会网络节点层面的四个核心指标:
  程度中心性:哪些是明星人物?哪些是边缘者?程度中心性回答类似问题。这是最为人们理解的社会网络测量指标。以微博为例,程度中心性就是粉丝的数量,那些程度中心性高的人就是微博中的明星。
  亲近中心性:亲近中心性通过点与其他点的距离来测量。那些在社交网络中经常与人互动、人际关系颇好的人,比如公司中的八卦传播者,往往亲近中心性得分较高。
  居间中心性:节点的居间程度,表示一个网络中经过该点最短路径的数量。在网络中,节点的居间程度越大,那么它在节点相互之间的信息传播起到的作用也就越大。在两个社会网络之间的人,比如跨界者,往往拥有较高的居间中心性。
  特征向量中心性:那些在社交网络中沉默却拥有极大权力的人物,如《教父》中的主人翁柯里昂。社会网络研究者将他们称为“灰衣主教”。特征向量中心性就是找出他们的办法。基本原理是,一个有着高特征向量中心性的行动者,与他建立连接的很多行动者往往也被其他很多行动者所连接。在社交网络中,有这样一种人,很多明星与其做朋友,即使他沉默不语,也可能是一位重要的人物。
  社会网络分析不仅仅在节点层面测量。第4章、第5章介绍如何分析群体。其中,第4章主要介绍社群划分的基础知识:如何将庞大的社会网络划分为小的组块?如何利用社会网络中的结构洞牟利?如何进行三元组普查与分析?例如,如何通过岛屿方法逐步找出推特上埃及革命的成千上万条转发的核心人物?又如,如何评估埃及革命中一个人的信息传播能力?显然,如果你的朋友们相互信任,将比那种一个明星发言,粉丝们单纯收听的星形网络传播能力更强。第5章主要介绍二模网络与多模网络的基础知识。关系还会存在于不同类型的主体之间,比如公司雇佣员工、投资者购买公司股票、人们占有信息与资源等。这些关系称为二模关系。现实生活中的关系往往是二模或多模。比如在微博上,可以通过你的兴趣、地域、使用的标签来为你推荐新的朋友,或者基于你对一些公共事件的看法,将你划分到特定政治群体中,这些都是基于二模或多模网络的分析得出的。
第6章是全书最精彩的部分,关注信息如何传播,初步展示分析动态社会网络发展的建模技巧。一条微博如何从一两个人关注突然成为流行用语?作者在实验中发现,当网络密度接近7%的时候,将从线性增长(每次增加一条连接)转化为病毒式扩散,也就是说,如果转发一条微博、加入一个网络社群等的人数比例达到7%,其他人将会在关键阶段马上跟进。这是一个推动脸谱走出哈佛大学的神奇数字。脸谱一步一步地跃迁,总是遵循一个规则——在一个社群里到达饱和点之后才移入一个更大的社群。作者通过手写Python算法,为读者打开动态社会网络与网络仿真的大门——我们如何用算法来模拟人类社会各类关系的变迁?有了自己亲手实践算法的经验,读者未来使用netlogo等网络仿真软件,将更加得心应手。
  对于初学者来说,第4~6章这三章有一定难度,需要同时理解社会科学与编程技巧两方面知识。第7章则简单明了,主要介绍获取网络数据的入门知识。如果希望深入了解,可以阅读作者推荐的相关资源。附录A介绍收集社会网络分析所需数据的传统方法、伦理准则与相关API。附录B介绍如何安装本书涉及的相关软件,如NetworkX、matplotlib等。
  总而言之,作为一本技术非常新颖的入门读物,本书通俗易懂,基于Python进行分析使得其灵活性变得更高。可以说,本书令学习者从一开始就具有上手实践的能力,除介绍网络数据获取技巧、网络抽样方法、网络在个体与群体两个层面的基本属性之外,还涉及目前日益热门的网络模拟方法,融合基础理论与算法于一身。简约却不简单,上升空间非常大!无论你是对社会网络感兴趣的大众读者,还是社会网络的专业研究者、开发者,相信本书都会在社会网络的理论与实践两方面给予启发!
有趣的是,全书通过基于GitHub网站协作,使用Markdown语法完成。全书第1章、第2章由中科院心理所硕士、北京语言大学心理学教师王颖翻译;第3章由中科院心理所硕士、安人公司同事王薇翻译;第4~6章由香港城市大学媒体与传播系博士候选人、互联网挖掘实验室研究员王成军翻译;第7章由香港城市大学媒体与传播系博士候选人刘翻译;附录A由北京大学教育学硕士、安人公司同事曲元周翻译;附录B由吉林大学心理系学士、安人公司同事牟百会翻译。全书由阳志平审校成书、统一定稿。
  感谢各位参与翻译本书的友人,更感谢协助校阅的豆瓣网友孔明、BOOMER与哈哈哈。最后特别感谢在组织翻译的过程中,机械工业出版社华章分社编辑吴怡老师与秦健老师。在去年杂事甚多的情况之下,他们一再包容与理解我拖延交稿。他们的细致工作,更使得本书增色不少。希望这本书的面市能够帮助更多人迈入一个广阔迷人的社会网络分析世界。
  始生之物,其形必丑。水平有限,不当之处,敬请读者指出。全书如有任何翻译疑问或者关于社会网络分析软件的使用问题,欢迎与我联系。未来有关勘误,也敬请留意机械工业出版社华章分社相关网站。我的联系方式是:
  Email:im@yangzhiping.com
  个人网站:yangzhiping.com
  如果读者希望深度了解社会网络分析,可以阅读我们整理的图书资源:
  阳志平:《社会网络分析入门书目导读》
  网址:http://www.yangzhiping.com/tech/sna-book.html
  王成军整理的豆列:《社会网络和复杂网络研究》
  网址:http://book.douban.com/doulist/212560/
  阳志平整理的豆列:《社会网络分析技术:探索复杂性与自组织性》
  网址:http://book.douban.com/doulist/1380669/
阳志平
2013年5月6日于北京

图书目录

前言 1
第1章 导论 5
分析关系,理解人与群体 6
从关系到网络——超乎所见 7
社会网络与连接分析 8
非正式网络的力量 10
恐怖分子与革命者:社会网络的力量 14
推特上的革命 17
第2章 图论速览 22
什么是图 22
图的遍历与距离 28
图的距离 38
为什么重要 39
六度理论神话 40
小世界网络 40
第3章 中心性、权力与瓶颈 42
样本数据 42
中心性 48
中心性测量不能告诉我们什么 64
第4章 派系、聚类和组元 65
组元和子图 65
子图——自我中心网 69
三元组 71
派系 83
分层聚类 85
三元组、网络密度和冲突 92
第5章 二模网络 97
竞选资金是否影响选举 97
二模网络的理论 100
扩展多模网络 109
第6章 信息扩散:像病毒一样传播开来 112
病毒视频剖析 112
信息如何影响网络 119
Python中的一个简单动态模型 123
网络和信息的共同演化 129
第7章 在现实世界中绘图 138
中等规模数据:传统SQL关系数据库 139
大数据:未来,从今天开始 139
小数据——平面文件表达 139
中等规模数据:数据库表达 143
使用二模数据工作 150
社会网络和大数据 152
运行大数据 157
附录A 收集数据 163
附录B 安装软件 173

教学资源推荐
作者: (加)Dennis Roddy 著
作者: [美]约翰·E.霍普克罗夫特(John E. Hopcroft)拉杰夫·莫特瓦尼(Rajeev Motwani)杰弗里·D.乌尔曼(Jeffrey D. Ullman) 著
作者: (美)Joseph Phillips 著
参考读物推荐
作者: (美)Elfriede Dustin Thom Garrett Bernie Gauf 著
作者: 王杉 孙玲延 张永 等编著
作者: 祝良钰 等编著
作者: (美) David Croslin 著