图书介绍

Python数据分析实战【2025|PDF|Epub|mobi|kindle电子书版本百度云盘下载】

Python数据分析实战
  • (印)伊凡·伊德里斯著;冯博,严嘉阳译 著
  • 出版社: 北京:机械工业出版社
  • ISBN:9787111576402
  • 出版时间:2017
  • 标注页数:330页
  • 文件大小:40MB
  • 文件页数:346页
  • 主题词:软件工具-程序设计

PDF下载


点此进入-本书在线PDF格式电子书下载【推荐-云解压-方便快捷】直接下载PDF格式图书。移动端-PC端通用
种子下载[BT下载速度快]温馨提示:(请使用BT下载软件FDM进行下载)软件下载地址页直链下载[便捷但速度慢]  [在线试读本书]   [在线获取解压码]

下载说明

Python数据分析实战PDF格式电子书版下载

下载的文件为RAR压缩包。需要使用解压软件进行解压得到PDF格式图书。

建议使用BT下载工具Free Download Manager进行下载,简称FDM(免费,没有广告,支持多平台)。本站资源全部打包为BT种子。所以需要使用专业的BT下载软件进行下载。如BitComet qBittorrent uTorrent等BT下载工具。迅雷目前由于本站不是热门资源。不推荐使用!后期资源热门了。安装了迅雷也可以迅雷进行下载!

(文件页数 要大于 标注页数,上中下等多册电子书除外)

注意:本站所有压缩包均有解压码: 点击下载压缩包解压工具

图书目录

第1章 为可重复的数据分析奠定基础1

1.1 简介1

1.2 安装Anaconda2

1.3 安装数据科学工具包3

1.4 用virtualenv和virtualenvwrapper创建Python虚拟环境5

1.5 使用Docker镜像沙盒化Python应用6

1.6 在IPython Notebook中记录软件包的版本和历史8

1.7 配置IPython11

1.8 学习为鲁棒性错误校验记录日志13

1.9 为你的代码写单元测试16

1.10 配置pandas18

1.11 配置matplotlib20

1.12 为随机数生成器和NumPy打印选项设置种子23

1.13 使报告、代码风格和数据访问标准化24

第2章 创建美观的数据可视化28

2.1 简介28

2.2 图形化安斯库姆四重奏28

2.3 选择Seaborn的调色板31

2.4 选择matplotlib的颜色表33

2.5 与IPython Notebook部件交互35

2.6 查看散点图矩阵38

2.7 通过mpld3使用d3.js进行可视化40

2.8 创建热图41

2.9 把箱线图、核密度图和小提琴图组合44

2.10 使用蜂巢图可视化网络图45

2.11 显示地图47

2.12 使用类ggplot2图49

2.13 使用影响图高亮数据51

第3章 统计数据分析和概率53

3.1 简介53

3.2 将数据拟合到指数分布53

3.3 将聚合数据拟合到伽马分布55

3.4 将聚合计数拟合到泊松分布57

3.5 确定偏差59

3.6 估计核密度61

3.7 确定均值、方差和标准偏差的置信区间64

3.8 使用概率权重采样66

3.9 探索极值68

3.10 使用皮尔逊相关系数测量变量之间的相关性71

3.11 使用斯皮尔曼等级相关系数测量变量之间的相关性74

3.12 使用点二列相关系数测量二值变量和连续变量的相关性77

3.13 评估变量与方差分析之间的关系78

第4章 处理数据和数值问题81

4.1 简介81

4.2 剪辑和过滤异常值81

4.3 对数据进行缩尾处理84

4.4 测量噪声数据的集中趋势85

4.5 使用Box-Cox变换进行归一化88

4.6 使用幂阶梯转换数据90

4.7 使用对数转换数据91

4.8 重组数据93

4.9 应用logit()来变换比例95

4.10 拟合鲁棒线性模型97

4.11 使用加权最小二乘法考虑方差99

4.12 使用任意精度进行优化101

4.13 使用任意精度的线性代数103

第5章 网络挖掘、数据库和大数据107

5.1 简介107

5.2 模拟网页浏览108

5.3 网络数据挖掘110

5.4 处理非ASCⅡ文本和HTML实体112

5.5 实现关联表114

5.6 创建数据库迁移脚本117

5.7 在已经存在的表中增加一列117

5.8 在表创建之后添加索引118

5.9 搭建一个测试Web服务器120

5.10 实现具有事实表和维度表的星形模式121

5.11 使用Hadoop分布式文件系统126

5.12 安装配置Spark127

5.13 使用Spark聚类数据128

第6章 信号处理和时间序列132

6.1 简介132

6.2 使用周期图做频谱分析132

6.3 使用Welch算法估计功率谱密度134

6.4 分析峰值136

6.5 测量相位同步138

6.6 指数平滑法140

6.7 评估平滑法142

6.8 使用Lomb-Scargle周期图145

6.9 分析音频的频谱146

6.10 使用离散余弦变换分析信号149

6.11 对时序数据进行块自举151

6.12 对时序数据进行动态块自举153

6.13 应用离散小波变换155

第7章 利用金融数据分析选择股票159

7.1 简介159

7.2 计算简单收益率和对数收益率159

7.3 使用夏普比率和流动性对股票进行排名161

7.4 使用卡玛和索提诺比率对股票进行排名162

7.5 分析收益统计164

7.6 将个股与更广泛的市场相关联166

7.7 探索风险与收益169

7.8 使用非参数运行测试检验市场170

7.9 测试随机游走173

7.10 使用自回归模型确定市场效率175

7.11 为股票价格数据库建表177

7.12 填充股票价格数据库178

7.13 优化等权重双资产组合183

第8章 文本挖掘和社交网络分析186

8.1 简介186

8.2 创建分类的语料库186

8.3 以句子和单词标记化新闻文章189

8.4 词干提取、词形还原、过滤和TF-IDF得分189

8.5 识别命名实体193

8.6 提取带有非负矩阵分解的主题194

8.7 实现一个基本的术语数据库196

8.8 计算社交网络密度200

8.9 计算社交网络接近中心性201

8.10 确定中介中心性202

8.11 评估平均聚类系数203

8.12 计算图的分类系数204

8.13 获得一个图的团数205

8.14 使用余弦相似性创建文档图206

第9章 集成学习和降维209

9.1 简介209

9.2 递归特征消除210

9.3 应用主成分分析来降维211

9.4 应用线性判别分析来降维213

9.5 多模型堆叠和多数投票214

9.6 学习随机森林217

9.7 使用RANSAC算法拟合噪声数据220

9.8 使用Bagging来改善结果222

9.9 用于更好学习的Boosting算法224

9.10 嵌套交叉验证227

9.11 使用joblib重用模型229

9.12 层次聚类数据231

9.13 Theano之旅232

第10章 评估分类器、回归器和聚类235

10.1 简介235

10.2 直接使用混淆矩阵分类235

10.3 计算精度、召回率和F1分数237

10.4 检测接收器操作特性和曲线下的面积240

10.5 可视化拟合优度242

10.6 计算均方误差和中值绝对误差243

10.7 用平均轮廓系数评估聚类245

10.8 将结果与伪分类器进行比较247

10.9 确定平均绝对百分误差和平均百分误差250

10.10 与伪回归器进行比较252

10.11 计算平均绝对误差和残差平方和254

10.12 检查分类的kappa系数256

10.13 运用Matthews相关系数258

第11章 图像分析261

11.1 简介261

11.2 安装OpenCV261

11.3 应用尺度不变特征变换(SIFT)264

11.4 使用加速鲁棒特征检测特征265

11.5 量化颜色267

11.6 图像降噪269

11.7 提取图像区域270

11.8 使用Haar级联进行面部识别272

11.9 搜索明亮的星星275

11.10 从图像中提取元数据278

11.11 从图像中提取纹理特征280

11.12 对图像应用层次聚类282

11.13 使用光谱聚类分割图像283

第12章 并行和性能285

12.1 简介285

12.2 使用Numba做即时编译286

12.3 使用Numexpr加速数值表达式288

12.4 使用线程模块运行多线程289

12.5 使用concurrent.futures模块启动多任务291

12.6 使用asyncio模块异步访问资源294

12.7 使用execnet做分布式处理297

12.8 分析内存使用情况299

12.9 计算平均值、方差、偏度和峰度300

12.10 使用最近最少使用算法进行缓存304

12.11 缓存HTTP请求306

12.12 使用Count-min sketch进行流式统计308

12.13 充分利用GPU和OpenGL310

附录A 术语表313

附录B 函数参考317

附录C 在线资源323

附录D 命令行和其他工具的一些提示和技巧326

热门推荐