正版书籍 Python和Dask数据科学杰西·丹尼尔计算机与互联网编程语言与程序设计语言算法分析零基础入门机器学习数据探索性 下载 pdf 百度网盘 epub 免费 2025 电子书 mobi 在线
正版书籍 Python和Dask数据科学杰西·丹尼尔计算机与互联网编程语言与程序设计语言算法分析零基础入门机器学习数据探索性电子书下载地址
- 文件名
- [epub 下载] 正版书籍 Python和Dask数据科学杰西·丹尼尔计算机与互联网编程语言与程序设计语言算法分析零基础入门机器学习数据探索性 epub格式电子书
- [azw3 下载] 正版书籍 Python和Dask数据科学杰西·丹尼尔计算机与互联网编程语言与程序设计语言算法分析零基础入门机器学习数据探索性 azw3格式电子书
- [pdf 下载] 正版书籍 Python和Dask数据科学杰西·丹尼尔计算机与互联网编程语言与程序设计语言算法分析零基础入门机器学习数据探索性 pdf格式电子书
- [txt 下载] 正版书籍 Python和Dask数据科学杰西·丹尼尔计算机与互联网编程语言与程序设计语言算法分析零基础入门机器学习数据探索性 txt格式电子书
- [mobi 下载] 正版书籍 Python和Dask数据科学杰西·丹尼尔计算机与互联网编程语言与程序设计语言算法分析零基础入门机器学习数据探索性 mobi格式电子书
- [word 下载] 正版书籍 Python和Dask数据科学杰西·丹尼尔计算机与互联网编程语言与程序设计语言算法分析零基础入门机器学习数据探索性 word格式电子书
- [kindle 下载] 正版书籍 Python和Dask数据科学杰西·丹尼尔计算机与互联网编程语言与程序设计语言算法分析零基础入门机器学习数据探索性 kindle格式电子书
寄语:
正版图书 品质保障 优质服务 发货及时 售后无忧
内容简介:
主要内容
● 处理大型的结构化和非结构化数据集
● 使用Seaborn和Datashader实现可视化
● 实现自己的算法
● 构建分布式应用
● 打包和部署Dask应用
书籍目录:
目 录
第Ⅰ部分 可扩展计算的基础
第1章 可扩展计算的重要性 3
1.1 Dask的优势 4
1.2 有向无环图 9
1.3 横向扩展、并发和恢复 13
1.3.1 纵向扩展和横向扩展 14
1.3.2 并发和资源管理 16
1.3.3 从失败中恢复 17
1.4 本书使用的数据集 18
1.5 本章小结 19
第2章 Dask入门 21
2.1 DataFrame API初探 22
2.1.1 Dask对象的元数据 22
2.1.2 使用compute方法运行计算任务 25
2.1.3 使用persist简化复杂计算 27
2.2 DAG的可视化 28
2.2.1 使用Dask延迟对象查看DAG 28
2.2.2 带有循环和集合的复杂DAG的可视化 29
2.2.3 使用persist简化DAG 32
2.3 任务调度 35
2.3.1 延迟计算 35
2.3.2 数据本地化 36
2.4 本章小结 38
第II部分 使用Dask DataFrame处理结构化数据
第3章 介绍Dask DataFrame 41
3.1 为什么使用DataFrame 42
3.2 Dask和Pandas 43
3.2.1 管理DataFrame分区 45
3.2.2 “混洗”介绍 48
3.3 Dask DataFrame的局限性 49
3.4 本章小结 50
第4章 将数据读入DataFrame 53
4.1 从文本文件读取数据 54
4.1.1 Dask数据类型 59
4.1.2 为Dask DataFrame创建数据模式 61
4.2 从关系数据库中读取数据 65
4.3 从HDFS和S3中读取数据 68
4.4 读取Parquet格式的数据 72
4.5 本章小结 74
第5章 DataFrame的清理和转换 75
5.1 使用索引和轴 77
5.1.1 从DataFrame中选择列 77
5.1.2 从DataFrame中删除列 79
5.1.3 DataFrame中列的重命名 81
5.1.4 从DataFrame中选择行 81
5.2 处理缺失值 83
5.2.1 对DataFrame中的缺失值计数 83
5.2.2 删除含有缺失值
的列 85
5.2.3 填充缺失值 85
5.2.4 删除缺少数据的行 86
5.2.5 使用缺失值输入多个列 87
5.3 数据重编码 89
5.4 元素运算 93
5.5 过滤和重新索引DataFrame 95
5.6 DataFrame的连接 97
5.6.1 连接两个DataFrame 98
5.6.2 合并两个DataFrame 101
5.7 将数据写入文本文件和Parquet文件 103
5.7.1 写入含分隔符的文本文件 103
5.7.2 写入Parquet 文件 104
5.8 本章小结 105
第6章 聚合和分析DataFrame 107
6.1 描述性统计信息 108
6.1.1 什么是描述性统计信息 108
6.1.2 使用Dask计算描述性统计信息 110
6.1.3 使用describe方法进行描述性统计 114
6.2 内置的聚合函数 115
6.2.1 什么是相关性 115
6.2.2 计算Dask DataFrame的相关性 117
6.3 自定义聚合函数 121
6.3.1 使用t检验测试分类变量 121
6.3.2 使用自定义聚合函数来实现Brown-Forsythe检验 123
6.4 滚动(窗口)功能 134
6.4.1 为滚动函数准备数据 135
6.4.2 将rolling方法应用到一个窗口函数 136
6.5 本章小结 137
第7章 使用Seaborn对DataFrame进行可视化 139
7.1 prepare-reduce-collect-plot模式 141
7.2 可视化散点图与规则图的延伸关系 143
7.2.1 使用Dask和Seaborn创建散点图 143
7.2.2 在散点图中添加线性回归线 146
7.2.3 在散点图中添加非线性回归线 147
7.3 使用小提琴图可视化分类关系 149
7.3.1 使用Dask和Seaborn创建小提琴图 150
7.3.2 从Dask DataFrame随机采样数据 152
7.4 使用热图可视化两个分类关系 154
7.5 本章小结 157
第8章 用Datashader对位置数据可视化 159
8.1 什么是Datashader?它是如何工作的? 160
8.1.1 Datashader渲染流程的五个阶段 161
8.1.2 使用Datashader进行可视化 165
8.2 将位置数据绘制为交互式热图 166
8.2.1 准备用于地图平铺的地理数据 166
8.2.2 创建交互式热图 167
8.3 本章小结 169
第III部分 扩展和部署Dask
第9章 使用Bag和Arrays 173
9.1 使用Bag读取和解析非结构化数据 175
9.1.1 从Bag中选择和查看数据 176
9.1.2 常见的解析错误和解决办法 176
9.1.3 使用分隔符 177
9.2 转换、过滤和合并元素 184
9.2.1 使用map函数转换元素 184
9.2.2 使用filter函数过滤Bag 186
9.2.3 计算Bag的描述统计量 189
9.2.4 使用foldby方法创建聚合函数 190
9.3 从Bag中创建Arrays和DataFrame 192
9.4 使用Bag和NLTK进行并行文本分析 193
9.4.1 二元分析的基础 194
9.4.2 提取token和过滤停顿词 194
9.4.3 分析二元组 198
9.5 本章小结 200
第10章 使用Dask-ML进行机器学习 201
10.1 使用Dask-ML建立线性模型 202
10.1.1 准备二进制向量化数据 204
10.1.2 使用Dask-ML建立Logistic回归模型 210
10.2 评估和调整Dask-ML模型 211
10.2.1 用计分法评估Dask-ML模型 211
10.2.2 使用Dask-ML构建朴贝叶斯分类器 212
10.2.3 自动调整超参数 213
10.3 持续的Dask-ML模型 215
10.4 本章小结 217
第11章 扩展和部署Dask 219
11.1 使用Docker在Amazon AWS上创建Dask集群 220
11.1.1 入门 221
11.1.2 生成安全密钥 222
11.1.3 创建ECS集群 224
11.1.4 配置集群的网络 227
11.1.5 在Elastic文件系统中创建共享数据驱动 231
11.1.6 在Elastic ContainerRepository中为Docker镜像分配空间 236
11.1.7 为调度器、工作节点和Notebook创建和部署镜像 237
11.1.8 连接到集群 244
11.2 在集群上运行和监视Dask作业 246
11.3 在AWS上清理Dask集群 250
11.4 本章小结 252
附录A 软件的安装 253
作者介绍:
Jesse C. Daniel具有5年使用Python编写应用程序的经验,其中包括从事PyData堆栈(Pandas、NumPy、SciPy和scikit-learn)的工作3年。Jesse于2016年进入丹佛大学,担任商业信息和分析学的副教授,讲授Python数据科学课程。他目前领导着丹佛当地的一家科技公司的数据科学家团队。
出版社信息:
暂无出版社相关信息,正在全力查找中!
书籍摘录:
暂无相关书籍摘录,正在全力查找中!
在线阅读/听书/购买/PDF下载地址:
原文赏析:
暂无原文赏析,正在全力查找中!
其它内容:
编辑推荐
《Python和Dask数据科学》详尽介绍使用Dask进行数据准备、数据清理、探索性数据分析和数据可视化,#后介绍使用Dask进行机器学习。通过提供真实的数据、丰富的案例,帮助读者尽快了解和掌握Dask的用法。每个知识点都提供了相应的代码段,帮助读者通过实践强化对知识的理解。每章的开头和结尾对该章的主要内容进行概括和总结。
《Python和Dask数据科学》还提供了示例代码和数据集的下载地址。可以在论坛里对《Python和Dask数据科学》发表评论,提出技术问题,从作者和其他用户那里得到帮助和提高。《Python和Dask数据科学》是迄今为止#详尽介绍使用Dask进行数据科学工作的书籍。
书籍介绍
近几年来,Scala得到广泛运用,在数据科学和分析领域的应用更是如火如荼。基于Scala构建的大数据处理框架Spark获得广泛认可,在产品中得到大量应用。如果你想借助Scala和Spark的卓越能力来处理大数据,本书将是你的理想选择。
本书开篇介绍Scala语言,指导你更好地理解“面向对象”和“函数式编程”等在开发Spark应用时必须掌握的概念。此后转向Spark,介绍Spark的核心抽象概念,如RDD和数据帧。利用这些知识,你可更好地使用Spark SQL、GraphX和Spark结构化流等技术来分析结构化和非结构化数据,开发出具备可伸缩性和容错能力的流式应用。最后,本书探讨一些高级主题,如Spark监控、配置、调试、测试和部署等。
通过本书,你将学会用SparkR和PySpark API来开发Spark应用,用Zeppelin进行交互式数据分析,以及用Alluxio进行内存数据处理等。
在完成本书的学习后,你将全面深入地理解Spark;执行数据分析时,无论数据集有多大,你都具备完成数据分析所需的全栈知识体系。
主要内容
◆ 理解Scala的面向对象和函数式编程概念
◆ 深入理解Scala的集合API
◆ 学习RDD和数据帧等Spark核心概念
◆ 使用Spark SQL和GraphX分析结构化与非结构化数据
◆ 使用Spark结构化流来开发具备可扩展性和容错能力的流式应用
◆ 学习分类、回归、降维和推荐系统等机器学习最佳实践,以便使用Spark ML和Spark MLlib中的流行算法来建立预测模型
◆ 建立聚类模型,以便聚类大量数据
◆ 理解Spark应用的调优、调试和监控技术
◆ 使用独立服务器模式、Mesos和YARN模式在集群上部署Spark应用
网站评分
书籍多样性:4分
书籍信息完全性:8分
网站更新速度:8分
使用便利性:6分
书籍清晰度:8分
书籍格式兼容性:3分
是否包含广告:4分
加载速度:5分
安全性:7分
稳定性:5分
搜索功能:6分
下载便捷性:8分
下载点评
- 无缺页(444+)
- 傻瓜式服务(288+)
- 微信读书(617+)
- 在线转格式(234+)
- 体验满分(577+)
- 中评(209+)
- azw3(128+)
- 已买(137+)
- txt(437+)
- 四星好评(312+)
- 愉快的找书体验(337+)
- 快捷(423+)
下载评价
- 网友 石***致: ( 2025-01-02 04:29:44 )
挺实用的,给个赞!希望越来越好,一直支持。
- 网友 丁***菱: ( 2024-12-26 11:42:57 )
好好好好好好好好好好好好好好好好好好好好好好好好好
- 网友 饶***丽: ( 2025-01-03 00:07:14 )
下载方式特简单,一直点就好了。
- 网友 宓***莉: ( 2024-12-20 14:30:43 )
不仅速度快,而且内容无盗版痕迹。
- 网友 后***之: ( 2025-01-10 02:21:40 )
强烈推荐!无论下载速度还是书籍内容都没话说 真的很良心!
- 网友 权***颜: ( 2024-12-21 05:47:18 )
下载地址、格式选择、下载方式都还挺多的
- 网友 薛***玉: ( 2025-01-06 06:06:33 )
就是我想要的!!!
- 网友 詹***萍: ( 2025-01-11 17:11:45 )
好评的,这是自己一直选择的下载书的网站
- 网友 曾***玉: ( 2024-12-20 11:51:13 )
直接选择epub/azw3/mobi就可以了,然后导入微信读书,体验百分百!!!
- 网友 国***芳: ( 2024-12-30 01:08:09 )
五星好评
- 网友 方***旋: ( 2024-12-21 15:15:53 )
真的很好,里面很多小说都能搜到,但就是收费的太多了
喜欢"正版书籍 Python和Dask数据科学杰西·丹尼尔计算机与互联网编程语言与程序设计语言算法分析零基础入门机器学习数据探索性"的人也看了
催化剂制备及应用技术 下载 pdf 百度网盘 epub 免费 2025 电子书 mobi 在线
合同的现实运行规则与合同法——案例考察和理论阐释 下载 pdf 百度网盘 epub 免费 2025 电子书 mobi 在线
笨蛋没活路 【美】马里奥普佐 著, 陶文佳 译 江苏文艺出版社【正版保证】 下载 pdf 百度网盘 epub 免费 2025 电子书 mobi 在线
学而思秘籍小学数学系统总复习下册五六年级小升初数学基础知识点解题思维培养小升初考点 下载 pdf 百度网盘 epub 免费 2025 电子书 mobi 在线
新世纪高等院校英语专业本科生教材(新):英语学术论文写作纲要 下载 pdf 百度网盘 epub 免费 2025 电子书 mobi 在线
- 《城市规划相关知识》命题点全面解读 下载 pdf 百度网盘 epub 免费 2025 电子书 mobi 在线
- 货币金融学、公司理财知识精要 常道金融431精编 常道教育 厦门大学出版社,【正版保证】 下载 pdf 百度网盘 epub 免费 2025 电子书 mobi 在线
- 专注力训练贴纸书. 鸟类鱼类 下载 pdf 百度网盘 epub 免费 2025 电子书 mobi 在线
- 国际象棋初步 下载 pdf 百度网盘 epub 免费 2025 电子书 mobi 在线
- 基础会计学 下载 pdf 百度网盘 epub 免费 2025 电子书 mobi 在线
- 9787561374856 下载 pdf 百度网盘 epub 免费 2025 电子书 mobi 在线
- 仪器分析(第3版) 下载 pdf 百度网盘 epub 免费 2025 电子书 mobi 在线
- 正版音乐 2014多亮新专辑 多亮 没有更悲的伤(CD 歌词本) 下载 pdf 百度网盘 epub 免费 2025 电子书 mobi 在线
- 亚原子物理学(第3版) 下载 pdf 百度网盘 epub 免费 2025 电子书 mobi 在线
- 神经干细胞基础与培养 下载 pdf 百度网盘 epub 免费 2025 电子书 mobi 在线
书籍真实打分
故事情节:7分
人物塑造:7分
主题深度:4分
文字风格:6分
语言运用:5分
文笔流畅:3分
思想传递:3分
知识深度:8分
知识广度:9分
实用性:5分
章节划分:9分
结构布局:7分
新颖与独特:8分
情感共鸣:7分
引人入胜:5分
现实相关:9分
沉浸感:7分
事实准确性:7分
文化贡献:4分