欢迎来到传智教育旗下图书库

Python数据分析与应用:从数据获取到可视化(第2版)

黑马程序员/编著
定价:¥59.00

出版社:中国铁道出版社

ISBN:978-7-113-30649-6

图书种类:高校教材

出版日期:2024-01

所属学科:Python

页数:294

咨询客服 查看配套资源

关注获取新书发布信息

内容简介

本书以Anaconda为主要开发工具,全面系统介绍了Python数据分析的相关知识。全书共9章,第1章介绍了数据分析的基本概念,以及开发工具的安装和使用;第2~6章介绍了Python数据分析的常用库及其应用,包括如何使用NumPy对一维数组和二维数组进行数值计算和操作,如何使用pandas进行数据获取、预处理以及分组与聚合等一些操作,如何使用Matplotlib、Seaborn与Pyecharts进行数据可视化;第7~8章介绍了时间序列和文本数据的分析;第9章介绍了机器学习的相关概念以及最简单的KNN算法;第10章开发了一个数据分析的综合项目,完整呈现了数据分析及可视化的全过程。

本书附有丰富的教学资源,包括教学大纲、教学设计、教学PPT、教学视频、源代码等,为帮助初学者更好地学习本书内容,我们还提供了在线答疑,希望得到更多读者的关注。

适合群体

本书即可作为高等院校本、专科计算机相关专业及其他工科专业的数据分析教材,也可以作为数据分析爱好者的的入门书籍。

图书特色

特色一:强调实践导向。

本书除了第1、10章以外,每个章节都为知识点配置了大量示例和章节综合案例,涵盖各种实际应用场景,比如数据清洗、可视化、统计分析和机器学习等,另外第10章配置了实战演练。通过这些案例,读者能够深入了解如何在真实世界中应用Python进行数据分析,并且可以通过实践来巩固所学内容。

特色二:注重全面性。

本书不仅深入探讨了NumPy、pandas、Matplotlib等数据分析常用库的使用方法,还扩展介绍了数据分析相关领域的知识,比如时间序列分析、文本数据分析、机器学习,使读者能够全面了解数据分析的方法和技巧。

另外,本书在第一版的基础上进行了改版,主要内容如下:

(1)新增了机器学习一章,读者可以接触机器学习以及KNN算法。

(2)更新了数据可视化一章,删除bokeh库,增加Pyecharts库。

(3)更新Anaconda工具的版本,升级到2022.10版本,紧跟技术发展需求。

(4)优化内容,给抽象的知识点增加示意图或示例,读者更容易吸收。

(5)更新7个章节案例,案例与知识点联系更紧密。

配套资源
图书目录
目录
第1章	数据分析概述	1
1.1	数据分析产生的背景	2
1.2	什么是数据分析	2
1.3	数据分析的应用场景	4
1.4	数据分析的流程	5
1.5	为什么选择Python做数据分析	6
1.6	搭建开发环境	7
1.6.1	Anaconda概述	7
1.6.2	Anaconda的安装	8
1.6.3	通过Anaconda管理包	19
1.7	启用Jupyter Notebook	21
1.7.1	启动Anaconda自带的Jupyter Notebook	21
1.7.2	Jupyter Notebook界面详解	23
1.7.3	Jupyter Notebook的基本使用	25
1.8	常见的数据分析库	29
1.9	本章小结	31
1.10	本章习题	31
第2章	科学计算库NumPy	32
2.1	认识NumPy数组	34
2.1.1	NumPy数组的相关概念	34
2.1.2	NumPy数组的属性	35
2.2	创建数组	37
2.3	数组的数据类型	39
2.3.1	查看数据类型	39
2.3.2	转换数据类型	40
2.4	数组的索引和切片	41
2.4.1	数组的索引方式	41
2.4.2	整数索引和切片	42
2.4.3	花式索引	43
2.4.4	布尔索引	44
2.5	数组的算术运算	46
2.5.1	形状相同的数组间的算术运算	46
2.5.2	形状不同的数组间的算术运算	47
2.5.3	数组与标量的算术运算	49
2.6	通用函数	49
2.7	数组的重塑与转置	52
2.7.1	数组的重塑	52
2.7.2	数组的转置	53
2.8	数组的其他操作	56
2.8.1条件逻辑	56
2.8.2统计运算	57
2.8.3数组元素排序	58
2.8.4检索数组元素是否满足条件	58
2.8.5查找数组的唯一元素	59
2.8.6判断元素是否在其他数组中	59
2.9	线性代数模块	59
2.10	随机数模块	60
2.11	案例:计算股票收益率和波动率	62
2.12	本章小结	64
2.13	本章习题	64
第3章	数据分析库pandas基础	66
3.1	数据结构	67
3.1.1	Series	67
3.1.2	DataFrame	70
3.2	索引和切片操作	73
3.2.1	索引对象	73
3.2.2	重置索引	74
3.2.3	通过索引和切片获取数据	76
3.2.4	通过loc和iloc属性获取数据	78
3.3	读写数据	81
3.3.1	读写CSV和TXT文件的数据	81
3.3.2	读写Excel文件的数据	86
3.3.3	读取网页表格的数据	89
3.3.4	读写数据库	91
3.4	数据排序	95
3.4.1	按索引排序	96
3.4.2	按值排序	97
3.5	算术运算与数据对齐	98
3.6	统计计算与描述	99
3.6.1	统计计算	99
3.6.2	统计描述	101
3.7	分层索引操作	101
3.7.1	创建分层索引	101
3.7.2	创建有分层索引的对象	104
3.7.3	使用分层索引获取数据	106
3.7.4	交换索引层级的顺序	107
3.7.5	分层索引排序	108
3.8	案例:陕西高考分数线统计分析	109
3.8.1 案例需求	110
3.8.2 数据准备	110
3.8.3 案例实现	110
3.9	本章小结	113
3.10	本章习题	114
第4章	数据预处理	116
4.1	数据清洗	117
4.1.1	缺失值的检测	117
4.1.2	缺失值的处理	119
4.1.3	重复值的检测	123
4.1.4	重复值的处理	125
4.1.5	异常值的检测	125
4.1.6	异常值的处理	129
4.1.7	转换数据类型	130
4.2	数据合并	133
4.2.1	堆叠合并	133
4.2.2	主键合并	136
4.2.3	根据索引合并	141
4.2.4	合并重叠数据	143
4.3	数据重塑	145
4.3.1	重塑分层索引	145
4.3.2	轴向旋转	148
4.4	数据转换	149
4.4.1	面元划分	150
4.4.2	哑变量处理	151
4.5	案例:预处理二手房数据	153
4.5.1 案例需求	153
4.5.2 数据准备	153
4.5.3 案例实现	156
4.6	本章小结	160
4.7	本章习题	160
第5章	数据聚合与分组运算	163
5.1	分组与聚合的原理	164
5.2	分组操作	165
5.2.1	通过groupby()对数据进行分组	166
5.2.2	查看分组信息	171
5.3	数据聚合	172
5.3.1	通过统计方法聚合数据	172
5.3.2	通过agg()聚合数据	173
5.4	分组级运算	177
5.4.1数据转换	177
5.4.2数据应用	179
5.5	案例:篮球运动员信息分析	181
5.5.1 案例需求	181
5.5.2 数据准备	181
5.5.3 案例实现	182
5.6	本章小结	192
5.7	本章习题	192
第6章	数据可视化	194
6.1	数据可视化概述	195
6.1.1	什么是数据可视化	195
6.1.2	常见的图表类型	196
6.1.3	图表的辅助元素	200
6.2	使用Matplotlib绘图	201
6.2.1	绘制折线图	201
6.2.2	绘制柱形图	206
6.2.3	绘制直方图	211
6.2.4	绘制散点图	214
6.3	使用Seaborn绘图	217
6.3.1	可视化数据的分布	218
6.3.2	用分类数据绘图	224
6.4	使用Pyecharts绘图	230
6.4.1	Pyecharts简介	230
6.4.2	绘制柱形图	234
6.4.3	绘制词云图	237
6.4.4	绘制气泡图	239
6.4.5	绘制圆环图	242
6.5	案例:电影数据分析	244
6.5.1 案例需求	244
6.5.2 数据准备	244
6.5.3 案例实现	245
6.6	本章小结	251
6.7	本章习题	251
第7章	时间序列分析	253
7.1	时间序列概述	254
7.2	时间序列的基本操作	254
7.2.1	创建带时间戳的时间序列	254
7.2.2	获取时间序列子集	256
7.3	固定频率的时间序列	257
7.3.1	创建固定频率的时间序列	258
7.3.2	时间序列的频率与偏移量	260
7.3.3	时间序列的移动	262
7.4	时间周期与计算	263
7.4.1	创建带时期索引的对象	263
7.4.2	时期的频率转换	265
7.5	重采样	265
7.5.1	重采样方法	266
7.5.2	降采样	267
7.5.3	升采样	268
7.6	滑动窗口	270
7.7	案例:某城市报警记录分析	273
7.7.1	案例需求	273
7.7.2	数据准备	273
7.7.3	案例实现	274
7.8	本章小结	279
7.9	本章习题	280
第8章	文本数据分析	282
8.1	文本数据分析的工具	283
8.1.1 认识NLTK与jieba	283
8.1.2 安装jieba和NLTK语料库	285
8.2	文本预处理	287
8.2.1	基本流程	287
8.2.2	分词	288
8.2.3	词性标注	290
8.2.4	词形归一化	291
8.2.5	删除停用词	293
8.3	文本情感分析	294
8.4	文本相似度	298
8.5	文本分类	301
8.6	案例:商品评论分析	305
8.6.1 案例需求	305
8.6.2 数据准备	305
8.6.3 案例实现	306
8.7	本章小结	310
8.8	本章习题	310
第9章	机器学习入门	311
9.1	机器学习简介	312
9.1.1	什么是机器学习	312
9.1.2	机器学习的基本概念	313
9.1.3	机器学习算法的分类	315
9.1.4	机器学习解决问题的流程	317
9.1.5	认识机器学习库scikit-learn	320
9.2	KNN算法	322
9.2.1	KNN算法的思想	322
9.2.2	使用sklearn实现KNN算法	323
9.2.3	超参数	324
9.2.4	网格搜索与交叉验证	330
9.2.5	归一化	332
9.2.6	使用sklearn实现归一化	334
9.3	案例:预测签到位置	337
9.4.1	案例需求	337
9.4.2	数据准备	337
9.4.3	案例实现	337
9.4	本章小结	342
9.5	本章习题	342
第10章	实战演练——租房数据统计分析	343
10.1	数据收集	344
10.2	数据处理	345
10.3.1	重复值检测与处理	345
10.3.2	数据类型转换	346
10.3	数据分析与展现	347
10.4.1	房源数量分析	347
10.4.2	户型数量分析	350
10.4.3	房源平均租金分析	352
10.4.4	房源面积区间分析	356
10.4	本章小结	357
展开全部内容

热销图书推荐

HBase基础入门

清华大学出版社

定价:¥59.00 咨询客服

Java程序设计任务驱动教程

高等教育出版社

定价:¥55.00 咨询客服