0人評分過此書

Hadoop+Spark+Python大数据处理从算法到实战

出版日期
2021
閱讀格式
EPUB
書籍分類
學科分類
ISBN
9787301321447

本館館藏

借閱規則
當前可使用人數 100
借閱天數 14
線上看 0
借閱中 0
選擇分享方式

推薦本館採購書籍

您可以將喜歡的電子書推薦給圖書館,圖書館會參考讀者意見進行採購

讀者資料
圖書館 南華大學
* 姓名
* 身分
系所
* E-mail
※ 我們會寄送一份副本至您填寫的Email中
電話
※ 電話格式為 區碼+電話號碼(ex. 0229235151)/ 手機格式為 0900111111
* 請輸入驗證碼
2020年3月,国家提出要加快5G网络,数据中心等新型基础设施(简称新基建)进度。其中,信息化新型基础设施包含了云计算、大数据、人工智能、区块链、5G等内容。本书围绕新基建的云计算、机器学习及人工智能展开讲述大数据处理分析与实战应用,分为如下五个部分。第1部分:介绍了大数据的概念与特点,以及几个典型的产业应用场景。通过这些案例简介,期望读者能够了解大数据的前景,以及作为科技工作者肩负的使命。第2部分:介绍了目前云计算中的一个重要研究与应用领域----容器云。这一部分包含容器技术Docker与容器编排工具Kubernetes。Docker能封装操作系统、应用程序及其执行环境。对于整个大数据来说,Docker是Hadoop、Hbase、Spark这些组件的基础运行平台。一般大数据运行平台规模都比较宏大,因此这里使用了Kubernetes来对容器进行管理。这样,就构建了基于容器云的大数据平台。第3部分:是大数据分析的基础,也是大数据分析技术的重点。首先介绍了Hadoop的框架原理、调度原理、MapReduce原理与编程模型、环境搭建。由于Hadoop的HDFS存在一定的读写局限,因此引入了Hbase以支持实时读写。同样HDFS的数据也存在一定的分析局限,因此引入了Hive来构建数据仓库,以提高分析效率。在本篇最后,还引入了Spark这样的高性能框架,进一步提高了大数据处理能力。第4部分:是机器学习相关算法的应用篇。机器学习是一个复杂的过程,涉及到统计学、微积分、信息论等内容。考虑到学习门槛,在这一环节,首先简单介绍了相关算法的原理,然后介绍相对容易使用的机器学习工具Sklearn,使得读者建立起对机器学习开发流程的基本认知,之后介绍应用于大数据环境下Spark的机器学习库。相信通过对这一部分内容的学习,读者已经掌握了基本的机器学习问题的处理。第5部分:通过第一个实例介绍了如何使用Spark机器学习库中的协同过滤算法,来实现基于Web的推荐系统;通过第二个实例介绍了如何使用OpenCV与TensorFlow构建卷积神经网络来实现基于Web的人脸识别。
本书内容精练、重点突出、实例丰富,是广大数据分析工作者的参考书,同时也非常适合大、中专院校师生学习阅读,还可作为高等院校统计分析及相关专业的教材。
  • 出版地 中國大陸
  • 語言 簡體中文

評分與評論

請登入後再留言與評分
幫助
您好,請問需要甚麼幫助呢?
使用指南

客服專線:0800-000-747

服務時間:週一至週五 AM 09:00~PM 06:00

loading