首页>参考读物>计算机科学与技术>程序设计

从零开始学Python数据分析(视频教学版)
作者 : 罗攀 编著
出版日期 : 2018-08-09
ISBN : 978-7-111-60646-8
定价 : 69.00元
扩展资源
扩展信息
语种 : 简体中文
页数 : 272
开本 : 16
原书名 :
原出版社:
属性分类: 店面
包含CD : 无CD
绝版 : 未绝版
图书简介

本书便是一本“小白”学习Python数据分析的入门图书。书中不仅有各种分析框架的使用技巧,而且也有各类数据图表的绘制方法。本书通过多个案例讲解,让读者可以体验数据背后的乐趣。
本书共11章,核心内容包括Python数据分析环境安装、NumPy基础、pandas基础、数据读取与存储、数据预处理、数据分组与聚合、matplotlib可视化、地图绘制、pyecharts可视化、时间序列、网站日志分析综合案例实战。
本书适合Python数据分析的初学者和爱好者阅读,也适合作为各类院校相关专业的教学用书,同时还适合相关社会培训机构作为Python数据分析培训教材或者参考书。

图书特色

n

图书前言

  互联网的飞速发展伴随着海量信息的产生,而海量信息的背后对应的则是海量数据。如何从这些海量数据中获取有价值的信息来供人们学习和工作使用,这就不得不用到大数据挖掘和分析技术。数据分析作为大数据技术的核心一环,其重要性不言而喻。
  在数据分析领域,Python语言以其简单易用,并提供了优秀、好用的第三方库和数据分析的完整框架而深受数据分析人员的青睐。可以说,Python已经当仁不让地成为了数据分析人员的一把“利器”。程序员想要进入数据分析行业,首先要掌握Python数据分析技术,只有这样才能在严峻的就业市场中具有较强的竞争力。
  目前图书市场上关于Python数据分析的图书主要是几本翻译图书,其定位相对高端,而且翻译质量参差不齐,案例数据不方便下载,阅读难度系数较大,初学者不容易上手,故不适合初学者学习;而国内的几本原创Python数据分析图书质量也良莠不齐,不成系统,也不适合初学者阅读。可以说,图书市场上还鲜见一本通俗易懂且适合“小白”阅读的Python数据分析入门图书,基于此,笔者编写了本书。本书从Python数据分析的基础知识入手讲解,然后结合大量的数据分析案例,系统地介绍了Python数据分析的方法和流程,手把手带领读者掌握Python数据分析的相关知识,并提高读者的项目实践能力。
本书特色
  1.视频教学,高效、直观
  为了便于读者高效、直观地学习,笔者专门为本书的重点内容录制了配套教学视频,读者可以一边看书,一边结合教学视频进行学习,以取得更好的学习效果。
  2.内容全面,讲解系统
  本书不但全面介绍了从Numpy到pandas,从matplotlib到pyecharts的数据分析必学技术,而且还系统地讲解了从数据读取到数据清洗,从数据处理到数据可视化的详细步骤。
  3.给出了数据分析环境的安装和配置步骤
  本书详细介绍了Python数据分析集成环境Anaconda的安装步骤和使用方法,可以大大降低初学者学习Python数据分析的门槛,从而让读者快速跨进Python数据分析的大门。
  4.详细介绍了数据分析的流程
  本书从一开始便对数据分析的流程进行了详细介绍,而且在讲解中结合了多个实用性很强的数据分析项目案例,带领读者掌握Python数据分析的相关知识,以解决实际工作中的数据分析问题。
  5.提供了9个有较高应用价值的项目案例,有很强的实用性
  本书提供了9个实用性很强的数据分析项目案例,这些案例从不同的分析角度切入进行讲解,具有较高的应用价值。读者通过实际操练,可以更加透彻地理解数据分析的相关知识。
  6.提供教学PPT,方便教学和学习
  笔者专门为本书制作了专业的教学PPT,以方便相关院校的教学人员授课时使用;读者也可以通过教学PPT,提纲挈领地掌握书中的内容脉络。
本书内容
  第1章 Python环境搭建与使用
  本章介绍了如何搭建和使用Python数据分析环境,并介绍了如何使用Jupyter Notebook进行数据分析编程。
  第2章 NumPy入门和实战
  本章首先介绍了Numpy的基本数据结构——多维数组;然后介绍了多维数组的创建和基本属性、数组的切片和索引方法,以及数组的运算与存取;最后通过综合案例,演示了如何实现图像的变换功能。
  第3章 pandas入门和实战
  本章首先介绍了pandas中两种基础数据结构的创建和使用方法;然后详细讲解了DataFrame的选取和操作,同时介绍了其算术运算、函数的使用和pandas的可视化方法;最后结合案例,介绍了数据分析流程。
  第4章 外部数据的读取与存储
  本章主要介绍了如何利用pandas库读取外部数据为DataFrame数据格式,并介绍了通过Python进行数据处理后如何将DataFrame类数据存储到相应的外部数据文件中。
  第5章 数据清洗与整理
  本章主要介绍了如何使用pandas进行多源数据的清洗和整理,并给出了针对多源数据的合并和连接方法,以及数据的重塑方法,最后通过一个综合案例演示了数据分析中的数据清洗过程。
  第6章 数据分组与聚合
  本章涵盖的主要内容有:GroupBy的原理和使用方法;聚合函数的使用;分组运算中transform和apply方法的使用;通过pandas创建数据透视表;通过综合案例,巩固数据分组统计的使用。
  第7章 matplotlib可视化
  本章涵盖的主要内容有:利用matplotlib进行图表绘制;学会使用自定义设置,个性化绘制图表;通过综合案例,巩固matplotlib可视化的方法和技巧。
  第8章 seaborn可视化
  本章涵盖的主要内容有:使用seaborn绘图;学会seaborn样式和分布图绘制;通过综合案例泰坦尼克号的生还者数据,巩固seaborn的可视化方法和技巧。
  第9章 pyecharts可视化
  本章涵盖的主要内容有:安装pyecharts库;学会使用pyecharts库绘制基本图表;学会绘制其他图表;通过综合案例,巩固pyecharts的绘制方法和技巧。
  第10章 时间序列
  本章涵盖的主要内容有:时间序列的构造和使用方法;时间序列的频率转换与重采样;通过综合案例,巩固时间序列数据的处理与分析方法。
  第11章 综合案例——网站日志分析
  本章通过一个综合案例,介绍了如何通过Python的第三方库解析网站日志;如何利用pandas对网站日志数据进行预处理;结合前面介绍的数据分析和数据可视化技术对网站日志数据进行分析。
本书配套资源获取方式
  本书提供以下配套资源:
* 本书配套教学视频;
* 超值电子书(地图绘制技术);
* 本书相关素材文件;
* 本书源代码文件;
* 本书教学PPT。
  这些配套资源需要读者自行下载。请登录机械工业出版社华章公司网站www.hzbook.com,在该网站上搜索到本书,然后单击“资料下载”按钮即可找到“配书资源”下载链接。
适合阅读本书的读者
* 数据分析初学者;
* 数据分析爱好者;
* 数据分析从业人员;
* 数据分析培训学员;
* 高校相关专业的学生。
  本书由罗攀主笔编写,蒋仟、陈瑞滕和潘丹三位小伙伴也参与了部分章节的编写工作,在此对他们表示特别的感谢!
  由于作者水平所限,加之写作时间有限,书中可能还存在一些疏漏和不足之处,敬请各位读者斧正。联系我们请发电子邮件到hzbook2017@163.com。
  
罗攀

上架指导

计算机/程序设计/Python

封底文字

从零开始学Python数据分析(视频教学版)
罗攀 编著
书号:978-7-111-60646-8
印张:17(共272页)
书脊:13mm
定价:69元
成品尺寸:186*240mm
印数:3500册
上架:计算机/Python

-----------------------------------------------------------------------------
广告语:
手把手带领小白轻松掌握Python数据分析的3大模块、9个项目实战案例;涵盖数据的读取、清洗、处理、可视化等;详解数据分析的流程、工具、框架和方法;赠送400分钟配套视频、教学PPT等超值资源


编辑推荐:
手把手带领“小白”轻松入门Python数据分析
全面涵盖数据分析的流程、工具、框架和方法,内容新,实战案例多
详细介绍从数据读取到数据清洗,以及从数据处理到数据可视化等实用技术
赠送400分钟配套教学视频、补充学习文档、素材文件、源文件和PPT等超值资源
详解9个有较高应用价值的Python数据分析项目实战案例
详解数据分析的3大模块:NumPy、pandas库和matplotlib库
详解Python数据分析集成环境Anaconda的安装和使用,降低学习门槛


本书精华内容:
Python环境搭建与使用
NumPy入门和实战
pandas入门和实战
外部数据的读取与存储
数据清洗与整理
数据分组与聚合
matplotlib可视化
seaborn可视化
pyecharts可视化
时间序列

9个综合实战案例:
利用NumPy进行图像变换
小费数据集分析
Iris数据集分析
巴尔的摩公务员工资数据集分析
星巴克店铺数据集分析
泰坦尼克号的生还数据分析
糗事百科用户数据分析
自行车租赁数据分析
网站日志数据分析

赠送超值配套资源:
本书配套教学视频(400分钟)
本书实例源代码文件
补充学习文档(地图绘制技术)
本书配套素材文件
本书教学PPT

-----------------------------------------------------------------------------------
作者简介

罗攀 知名论坛Python爬虫专题管理员。擅长Python爬虫、Python数据分析与挖掘等技术。曾经在CSDN等多个知名博客网站上发表了多篇技术文章,深受读者的喜爱。参与编写并出版了《从零开始学Python网络爬虫》一书。目前从事线上Python网络爬虫的培训工作。

---------------------------------------------------------------------------------------
内容简介:
  网络中的信息是很庞大的。如何提取这些信息?如何分析这些信息?这都需要用到数据分析技术。而数据分析技术的首选语言是Python,而本书便是一本适合“小白”学习Python数据分析的入门图书,书中不仅有各种分析框架的使用技巧,而且也有各类数据图表的绘制方法。本书通过讲解多个案例,让读者体验数据背后的乐趣。
  本书共11章,核心内容包括Python数据分析环境安装、NumPy基础、pandas基础、外部数据读取与存储、数据清洗与整理、数据分组与聚合、matplotlib可视化、seaborn可视化、pyecharts可视化、时间序列、网站日志分析综合案例等。
  本书适合Python数据分析的初学者和爱好者阅读,也适合作为各类院校相关专业的教学用书,同时还适合相关社会培训机构作为Python数据分析的培训教材或者参考书。

---------------------------------------------------------------------------------------

图书目录

前言
第1章 Python环境搭建与使用 1
1.1 Anaconda的安装和使用 1
1.1.1 Anaconda的安装 1
1.1.2 Anaconda的使用 3
1.2 Jupyter Notebook的使用 5
1.2.1 更改工作空间 5
1.2.2 界面介绍与使用 7
第2章 NumPy入门和实战 9
2.1 ndarray多维数组 9
2.1.1 创建ndarray数组 9
2.1.2 ndarray对象属性 12
2.1.3 ndarray数据类型 13
2.1.4 数组变换 15
2.1.5 NumPy的随机数函数 18
2.2 数组的索引和切片 20
2.2.1 数组的索引 21
2.2.2 数组的切片 23
2.2.3 布尔型索引 24
2.2.4 花式索引 26
2.3 数组的运算 26
2.3.1 数组和标量间的运算 26
2.3.2 通用函数 27
2.3.3 条件逻辑运算 28
2.3.4 统计运算 30
2.3.5 布尔型数组运算 31
2.3.6 排序 32
2.3.7 集合运算 33
2.3.8 线性代数 34
2.4 数组的存取 34
2.4.1 数组的存储 35
2.4.2 数组的读取 35
2.5 综合示例——图像变换 35
第3章 pandas入门和实战 38
3.1 pandas数据结构 38
3.1.1 创建Series数据 38
3.1.2 创建DataFrame数据 40
3.1.3 索引对象 43
3.2 pandas索引操作 44
3.2.1 重新索引 45
3.2.2 更换索引 46
3.2.3 索引和选取 48
3.2.4 操作行和列 52
3.3 pandas数据运算 53
3.3.1 算术运算 54
3.3.2 函数应用和映射 55
3.3.3 排序 56
3.3.4 汇总与统计 57
3.3.5 唯一值和值计数 58
3.4 层次化索引 59
3.4.1 层次化索引简介 59
3.4.2 重排分级顺序 60
3.4.3 汇总统计 61
3.5 pandas可视化 61
3.5.1 线形图 61
3.5.2 柱状图 63
3.5.3 直方图和密度图 66
3.5.4 散点图 67
3.6 综合示例——小费数据集 68
3.6.1 数据分析流程 68
3.6.2 数据来源 68
3.6.3 定义问题 69
3.6.4 数据清洗 69
3.6.5 数据探索 70
第4章 外部数据的读取与存储 73
4.1 文本数据的读取与存储 73
4.1.1 CSV文件的读取 73
4.1.2 TXT文件的读取 80
4.1.3 文本数据的存储 81
4.2 JSON和Excel数据的读取与存储 82
4.2.1 JSON数据的读取与存储 82
4.2.2 Excel数据的读取与存储 85
4.3 数据库的读取与存储 87
4.3.1 连接数据库 87
4.3.2 读取数据库 88
4.3.3 存储数据库 90
4.4 Web数据的读取 90
4.4.1 读取HTML表格 90
4.4.2 网络爬虫 92
第5章 数据清洗与整理 95
5.1 数据清洗 95
5.1.1 处理缺失值 95
5.1.2 移除重复数据 99
5.1.3 替换值 101
5.1.4 利用函数或映射进行数据转换 101
5.1.5 检测异常值 102
5.1.6 虚拟变量 103
5.2 数据合并和重塑 104
5.2.1 merge合并 105
5.2.2 concat连接 110
5.2.3 combine_first合并 113
5.2.4 数据重塑 114
5.3 字符串处理 116
5.3.1 字符串方法 117
5.3.2 正则表达式 118
5.4 综合示例——Iris数据集 118
5.4.1 数据来源 118
5.4.2 定义问题 119
5.4.3 数据清洗 119
5.4.4 数据探索 123
第6章 数据分组与聚合 125
6.1 数据分组 125
6.1.1 GroupBy简介 125
6.1.2 按列名分组 128
6.1.3 按列表或元组分组 130
6.1.4 按字典分组 130
6.1.5 按函数分组 131
6.2 聚合运算 132
6.2.1 聚合函数 132
6.2.2 多函数应用 134
6.3 分组运算 136
6.3.1 transform方法 137
6.3.2 apply方法 138
6.4 数据透视表 139
6.4.1 透视表 140
6.4.2 交叉表 140
6.5 综合实例——巴尔的摩公务员工资数据集 142
6.5.1 数据来源 142
6.5.2 定义问题 143
6.5.3 数据清洗 143
6.5.4 数据探索 144
第7章 matplotlib可视化 148
7.1 线形图 148
7.1.1 基本使用 148
7.1.2 颜色与线形 149
7.1.3 点标记 151
7.2 柱状图 152
7.2.1 基本使用 152
7.2.2 刻度与标签 155
7.2.3 图例 156
7.3 其他基本图表 158
7.3.1 散点图 158
7.3.2 直方图 159
7.4 自定义设置 159
7.4.1 图表布局 159
7.4.2 文本注解 162
7.4.3 样式与字体 163
7.5 综合示例——星巴克店铺数据集 164
7.5.1 数据来源 164
7.5.2 定义问题 166
7.5.3 数据清洗 166
7.5.4 数据探索 168
第8章 seaborn可视化 172
8.1 样式与分布图 172
8.1.1 seaborn样式 172
8.1.2 坐标轴移除 174
8.1.3 单变量分布图 175
8.1.4 多变量分布图 178
8.2 分类图 181
8.2.1 分类散点图 181
8.2.2 箱线图与琴形图 183
8.2.3 柱状图 186
8.3 回归图与网格 187
8.3.1 回归图 187
8.3.2 网格 190
8.4 综合示例——泰坦尼克号生还者数据 191
8.4.1 数据来源 191
8.4.2 定义问题 192
8.4.3 数据清洗 192
8.4.4 数据探索 195
第9章 pyecharts可视化 202
9.1 基础图表 202
9.1.1 pyecharts安装 202
9.1.2 散点图 203
9.1.3 折线图 204
9.1.4 柱状图 206
9.2 其他图表 209
9.2.1 饼图 210
9.2.2 箱线图 212
9.3 综合示例——糗事百科用户数据 213
9.3.1 数据来源 214
9.3.2 定义问题 214
9.3.3 数据清洗 215
9.3.4 数据探索 217
第10章 时间序列 224
10.1 datetime模块 224
10.1.1 datetime构造 224
10.1.2 数据转换 225
10.2 时间序列基础 228
10.2.1 时间序列构造 228
10.2.2 索引与切片 229
10.3 日期 231
10.3.1 日期范围 231
10.3.2 频率与移动 233
10.4 时期 235
10.4.1 时期基础 235
10.4.2 频率转换 236
10.4.3 时期数据转换 237
10.5 频率转换与重采样 238
10.5.1 重采样 238
10.5.2 降采样 239
10.5.3 升采样 240
10.6 综合示例——自行车租赁数据 241
10.6.1 数据来源 241
10.6.2 定义问题 242
10.6.3 数据清洗 242
10.6.4 数据探索 244
第11章 综合案例——网站日志分析 248
11.1 数据来源 248
11.1.1 网站日志解析 248
11.1.2 日志数据清洗 251
11.2 日志数据分析 252
11.2.1 网站流量分析 252
11.2.2 状态码分析 255
11.2.3 IP地址分析 258

教学资源推荐
作者: 施霞萍 张欢欢 王瑾德 马可幸 编著
作者: Mario Hewardt Daniel Pravat
作者: 谢满德 邵俊 编著
参考读物推荐
作者: Charles Thomas Arrington, Syed H.Rayhan
作者: 王鹏杰 李威 王聪 编著