清华大学出版社-图书详情-《Hadoop+Spark大数据技术（微课版）》

首页 > 图书中心 >图书详情

Hadoop+Spark大数据技术（微课版）

提供PPT课件和源码，250分钟微课视频，咨询QQ：883604（仅限教师）。丰富的实操代码，真实、完整的项目案例

作者：刘彬斌主编，李柏章、周磊、李永富编著
定价：69元
印次：1-9
ISBN：9787302514275
出版日期：2018.11.01
印刷日期：2022.12.26

在线购买

试读样书申请收藏分享

内容简介
前言/序言
资源下载
版权信息

全书内容分为大数据系统基础、Hadoop技术、Spark技术和项目实战4部分。其中，Linux是学习大数据技术的基础，先从Linux入手，打下坚实的基础，之后才能更好地学习Hadoop和Spark。4部分内容分别介绍如下。　　大数据系统基础篇通过大数据概述、Linux系统安装、Linux系统基础命令、Shell编程和MySQL数据操作，为以后编程奠定坚实的基础。　　Hadoop技术篇以Hadoop生态圈为中心，详细介绍Hadoop高可用集群搭建、HDFS技术、MapReduce技术、Hive技术，为读者学习大数据开发技术提供便利，并以实用的方式简单介绍HBase、Sqoop、Flume工具的使用，使读者在精通一门技术的前提下，能扩展了解相关知识，真正成为一专多能的专业型人才。　　Spark技术篇从Spark概述、Scala语言、环境搭建、RDD核心技术、Spark SQL和机器学习等多方面讲解Spark大数据的开发，从基础的Scala语言开始学习，并以Hadoop环境为基础搭建Spark大数据集群，从最基础、最常用、最容易理解的思路出发，帮助读者逐步掌握Spark大数据技术。　　项目实战篇从真实项目“电力能源大数据分析”中抽取一部分业务作为实战解读，通过简洁的流程讲解，使读者了解大数据项目开发的整个过程。

more >

　　随着信息技术的不断发展，以及物联网、社交网络、移动终端等新兴技术与服务的不断涌现和广泛应用，数据种类日益增多，数据的规模急剧增大，大数据时代已悄然来临。由于大数据对政府决策、商业规划和危险预防等方面所起的重大作用，大数据逐渐成为一种重要的国家战略性资源，受到政府、能源及信息领域的普遍关注。大数据的多样性（Variety）、规模性（Volume）和高速性（Velocity）等特点，使得传统的数据存储、管理、分析技术已经无法满足大数据的处理要求。　　时至今日，无论你是来自互联网、通信行业，还是来自金融业、服务业或零售业，相信你都不会对大数据感到陌生。调查显示，32.5%的公司正在搭建大数据平台，29.5%的公司已经在生产环境实践大数据技术，并有成功的用例/产品；24.5%的公司已经做了足够的了解，开发准备就绪；基本不了解的只占调查对象的13.5%。根据某知名数据公司的调查数据，目前国内市场的IT人才缺口已经高达几十万，到2025年，这一数字还会增加至200万，“尤其是大数据技术方面的人才”。在智联、58同城等大型招聘网站最新发布的招聘职位中，大数据相关岗位占比已经超过50%，薪酬比软件工程师高10%以上。由此可见，大数据人才的培养是一份重大的责任和使命。　　1．高校大数据人才培养的背景　　（1）高校教育中，大数据人才培养存在起步晚、规模化不足的问题，而且高校学生从大学入学到研究生毕业需要相当长的一段时间。本书从实用的角度出发，为高校快速培养大数据人才提供可行性。　　（2）如前文所述，大数据人才紧缺的现象在全球越来越突出。在此背景下，本书旨在弥补高校大数据教材的不足，以模拟真实生产环境为教学目标，为企业培养“到岗就能用”的大数据实用型人才。　　（3）经济社会的高速发展，对IT产业（尤其是软件产业）提出了更高的要求，对大数据开发人才从数量和质量方面提出了更高的要求。　　（4）教育技术的进步和移动互联网时代的到来，打破了高校进行知识传播的技术壁垒。大量的资本和风险投资涌进IT培训产业。达内、传智播客等实体IT培训机构，开课吧、慕课网、极客网等在线IT培养机构纷纷引入先进的教学理念、强大的技术支持，再加上商业化运作，对高校IT人才培养带来巨大的挑战和竞争压力。　　（5）教学环境的变化。教室、实验室硬件配置齐全，实现了高速稳定的互联网接入，笔记本电脑和手机等互联网接入设备日渐普及，这些都为先进教学理念和教学模式（如微课）的实施提供了硬件和软件上的准备。　　（6）教育参与者。教师应该树立“教育就是服务”的教育观念，贯彻工程教育的教育理念，从注重“教师教什么”转移到“学生学到了什么”。学生作为“数字原住民”，对新鲜事物、新技术、新教学方式（人性化学习、泛在学习等）有着天然的渴望，教师应尽量多利用新的教学手段，提升课程的吸引力。　　综上所述，IT产业、软件技术以及软件人才培养中的教学理念、教学模式、教学环境、教学对象等因素的发展变化倒逼着高校进行教学改革，教师必须围绕以上因素进行教学创新，传统教材形式的革新也势在必行。　　2．本书内容　　全书内容分为大数据系统基础、Hadoop技术、Spark技术和项目实战4部分。其中，Linux是学习大数据技术的基础，先从Linux入手，打下坚实的基础，之后才能更好地学习Hadoop和Spark。4部分内容分别介绍如下。　　大数据系统基础篇通过大数据概述、Linux系统安装、Linux系统基础命令、Shell编程和MySQL数据操作，为以后编程奠定坚实的基础。　　Hadoop技术篇以Hadoop生态圈为中心，详细介绍Hadoop高可用集群搭建、HDFS技术、MapReduce技术、Hive技术，为读者学习大数据开发技术提供便利，并以实用的方式简单介绍HBase、Sqoop、Flume工具的使用，使读者在精通一门技术的前提下，能扩展了解相关知识，真正成为一专多能的专业型人才。　　Spark技术篇从Spark概述、Scala语言、环境搭建、RDD核心技术、Spark SQL和机器学习等多方面讲解Spark大数据的开发，从基础的Scala语言开始学习，并以Hadoop环境为基础搭建Spark大数据集群，从最基础、最常用、最容易理解的思路出发，帮助读者逐步掌握Spark大数据技术。　　项目实战篇从真实项目“电力能源大数据分析”中抽取一部分业务作为实战解读，通过简洁的流程讲解，使读者了解大数据项目开发的整个过程。　　3．本书特色　　本书不是对相关原理进行纯理论的阐述，而是提供了丰富的上机实践操作和范例程序，极大地降低了读者学习大数据技术的门槛。对于需要直接上机实践的读者而言，本书更像是一本大数据学习的实践上机手册。书中首先展示了如何在单台Windows系统上通过VirtualBox虚拟机安装多台Linux虚拟机，而后建立Hadoop集群，再建立Spark开发环境。搭建这个上机实践的平台并不限制于单台实体计算机，主要是考虑个人读者上机实践的实际条件和环境。对于有条件的公司和学校，参照这个搭建过程，同样可以将实践平台搭建在多台实体计算机上。　　搭建好大数据上机实践的软硬件环境之后，就可以在各个章节的学习中结合本书提供的范例程序逐一设置、修改、调试和运行，从中体会大数据实践应用的真谛——对大数据进行高效的“加工”，萃取大数据中蕴含的“智能和知识”，实现数据的“增值”，并最终将其应用于实际工作或者商业项目中。　　4．本书的使用　　第1篇讲解Linux系统和Linux系统上的软件应用。本篇是学习大数据技术的第一步，就如同你要学习Java开发，必须先学会操作Windows系统一样。　　第2篇讲解Hadoop大数据技术。Hadoop大数据集群要求在CentOS 6.9版本的系统上搭建，JDK版本为JDK 1.8，Hadoop版本为Hadoop 2.6.5，Zookeeper版本为Zookeeper 3.4.10。　　第3篇讲解在Hadoop大数据技术的基础上搭建Spark环境，所以读者在学习本篇内容之前，需要熟悉第2篇中的Hadoop大数据集群搭建的内容。　　第4篇讲解电力大数据项目，是基础HDFS的离线分析项目，读者需要掌握Java知识、Hadoop技术和Web前端知识。　　5．作者与致谢　　本书由刘彬斌主编。参与本书的编写、资料整理、书稿校对、课件制作等工作的还有李永富、李柏章、周磊、汪磊等。另外，感谢清华大学出版社相关编辑专业和严谨的工作，为本书的顺利出版提供了宝贵的意见，并付出了辛勤的劳动。　　　　编者　　2018年3月

more >

课件下载
暂无样章
网络资源

: 扫描二维码
下载APP了解更多

版权图片链接

同系列产品 more >

: Spark基础编程
曹如军
定价：45元
查看详情

: MATLAB人工智能算法实战
丁伟雄
定价：89.80元
查看详情

: 工业互联网技术导论
黄源
定价：59.80元
查看详情

: Python数据挖掘算法与应用
刘金岭、马甲林
定价：59.80元
查看详情

: Python视觉分析应用案例实战
丁伟雄
定价：99.80元
查看详情

图书分类全部图书

计算机与电子信息
- 计算机基础
  - 计算机文化基础
  - 办公自动化
  - 应用基础
  - 公共基础
  - 软件技术基础
  - 计算机导论
  - 计算思维
- 计算机组成与原理
  - 计算机组成
  - 计算机原理
  - 接口技术
  - 操作系统
  - 计算机硬件
  - 嵌入式
  - 单片机
- 算法与程序设计
  - C程序设计
  - 数据结构
  - C++语言
  - 编译原理
  - Visual Basic
  - Java
  - 汇编语言
  - FoxPro
  - Delphi
  - 算法
  - pb
  - 其他
  - C#
  - JSP
- 计算机技术及应用
  - 计算机技术及应用
- 计算机网络
  - Internet
  - TCP/IP
  - 计算机网络
  - 网页制作
  - 电子商务
  - 网络安全
  - 网络工程
  - 物联网
  - 网站开发
  - 移动互联
- 图形图像与多媒体
  - 图形学
  - 多媒体
  - 图形图像
  - 摄影
- 计算机辅助设计
  - 计算机辅助设计
  - AutoCAD
  - CATIA
- 数据库
  - SQL Server
  - FoxPro
  - Access
  - Oracle
  - 数据库原理
  - 数据挖掘
  - PowerBuilder
  - 数据统计
  - 数据检索
- 软件工程
  - 软件工程导论
  - 软件工程
  - 软件测试
- 信息安全
  - 密码学
  - 概论
  - 病毒防护
  - 网络信息安全
- 电子信息
  - 电子信息基础
  - 通信工程
  - 微电子
  - 光电子
  - 自动化
  - 电子信息与计算机
- 计算机--其他
  - 其他
理工
- 数理基础
  - 数字逻辑
  - 离散数学
  - 线性代数
  - 数理基础
- 数学
  - 基础数学教材
  - 数学专业及研究生教材
  - 教辅及考研图书
  - 引进图书
  - 专著、工具书及其他参考书
  - 多媒体课件及网络教学资源
- 物理
  - 基础物理教材
  - 物理专业及研究生教材
  - 教辅及考研图书
  - 引进图书
  - 专著、工具书及其他参考书
  - 多媒体课件及网络教学资源
- 力学
  - 基础力学教材
  - 力学专业及研究生教材
  - 教辅及考研图书
  - 引进图书
  - 专著、工具书及其他参考书
  - 多媒体课件及网络教学资源
- 化学化工
  - 基础化学
  - 化学
  - 化工
  - 引进图书
  - 专著、工具书及其他参考书
  - 多媒体课件及网络教学资源
- 机械材料汽车能源
  - 机械
  - 仪器仪表
  - 材料
  - 汽车
  - 能源与动力工程
  - 引进图书
  - 专著、工具书及其他参考书
  - 多媒体课件及网络教学资源
- 工业工程
  - 国外大学优秀教材-工业工程系列(影印版)
  - 国外大学优秀教材-工业工程系列(翻译版)
  - 物流供应链丛书
  - 其他
  - 普通高等学校物流管理专业系列教材
- 工业设计
  - 工业设计
- 建筑土木水利
  - 建筑学（教材）
  - 建筑设计
  - 土木工程
  - 水利工程
  - 工程管理
  - 装饰装修
  - 建筑文化
  - 风景园林
  - 城市规划
- 环境与给排水
  - 环境科学与环境工程
  - 给排水
  - 引进图书
  - 专著、工具书及其他参考书
  - 多媒体课件及网络教学资源
- 电工基础与电气工程
  - 电工基础
  - 电气工程
  - 专著、工具书及其他参考书
  - 多媒体课件及网络教学资源
- 航空航天
  - 航空航天
- 科幻漫画
- 质量管理
- 科幻小说
经管与人文
- 经济管理
  - 人力资源管理
  - 物流
  - 工商管理
  - 市场营销
  - 经济学
  - 经济读物
  - 金融学
  - 财政学
  - 国际经济贸易
  - 会计学
  - 旅游管理
  - 公共管理
  - 电子商务
  - 考试用书
  - 其他
  - 管理科学与工程
- 人文社科
  - 伦理学
  - 教育学
  - 心理学
  - 哲学
  - 语言文学
  - 史学
  - 新闻传播学
  - 体育
  - 其他
  - 政治学
  - 社会学
  - 清华校史读物
  - 综合
- 社会职业培训
  - 工程技术操作技能类
  - 城市服务业基础技能类
  - 就业素质教育类
  - 其他
- 建筑人文
文化与传播
- 新闻学
  - 新闻史
  - 新闻理论
  - 新闻实务
  - 专题研究
  - 经典文集
  - 其他
- 传播学
  - 传播史
  - 传播理论
  - 媒介研究方法
  - 媒介文化
  - 国际传播
  - 新媒体传播
  - 专题研究【国家形象、传媒工作坊】
  - 其他
- 媒介艺术
  - 影视【影视理论、文化、产业、实务、纪录片】
  - 动漫
  - 数字媒体【游戏、社交媒体、短视频、新媒体艺术】
  - 其他
- 文化艺术
  - 对外汉语
  - 礼仪
  - 美育【绘画、雕塑、建筑】
  - 文学作品
  - 中国传统文化
  - 世界文化
  - 专题研究【艺术与科学、清华美术】
- 写作训练
- 生活自助类（心理自助、日常护理）
- 综合类
法律与艺术
- 法律
  - 司法考试用书
  - 法律知识读物
  - 宪法与行政法
  - 法理法史
  - 刑法
  - 诉讼法
  - 经济法
  - 民商法
  - 国际法
  - 知识产权法
  - 司法案例
  - 比较法
- 艺术
  - 服装艺术设计
  - 工业设计
  - 环境艺术设计
  - 建筑
  - 染织艺术设计
  - 摄影艺术设计
  - 视觉传达艺术设计
  - 书法
  - 陶瓷艺术设计
  - 信息艺术与设计
  - 绘画
  - 雕塑
  - 工艺美术
  - 艺术设计学
  - 艺术类基础教学
生物与医学
- 医学与生物学教材
- 教学辅导及考试用书
- 引进版图书
- 专业工具书和手册
- 医学专业参考书
- 生物学专业参考书
- 大众读物
语言
- 非英语专业本科教材
  - 非英语专业本科教材
- 非英语专业研究生教材
  - 非英语专业研究生教材
- 专升本教材
  - 专升本教材
- 英语专业教材
  - 英语专业教材
- 选修课系列教材
  - 选修课系列教材
- 专门用途英语教材
  - 商务英语
  - 其他
- 娱乐休闲英语
  - 娱乐休闲英语
- 英语学习方法
  - 英语学习方法
- 非英语语种图书
  - 日语
  - 德语
- 外语--其他
  - 其他
科普与少儿
- 科普读物
  - 院士科普第一辑
  - 院士科普第二辑
  - 院士科普第三辑
  - 院士科普第四辑
  - 走进科学殿堂
  - 华裔科学家科普文集
  - 其他
- 少儿
  - 儿童文学
  - 益智游戏
  - 科普百科
  - 低幼启蒙
  - 卡通动漫
  - 少儿英语
  - 其他
辞书工具书学术书
- 辞书
  - 辞书
- 学术类图书
  - 学术类图书
- 工具书
  - 工具书
考试书
- 考试类用书
  - 国内考试用书
  - 国外考试用书
- 计算机考试类图书
  - 计算机等级考试
  - 软件资格水平考试
  - 计算机类认证考试
  - 职称考试
基础与职业教育
- 高职高专--公共基础课
  - 公共基础课系列
- 高职高专--人文社科类
  - 法律专业
  - 新闻
- 高职高专--计算机类
  - 计算机基础教育系列
  - 计算机专业基础系列
  - 计算机应用专业
  - 网络专业
  - 软件专业
  - 数据库专业
  - 多媒体技术专业
  - 电子商务专业
  - 嵌入式设计
- 高职高专--电子信息类
  - 电子信息基础系列
  - 微电子技术专业
  - 通信技术专业
  - 电气自动化专业
  - 应用电子技术专业
- 高职高专--机电类
  - 机电一体化专业
  - 汽车专业
  - 机械基础系列
  - 机械设计与制造专业
  - 数控技术专业
  - 模具设计与制造专业
- 高职高专--工科类
  - 建筑专业
  - 工程管理专业
- 高职高专--经济管理类
  - 经济管理基础系列
  - 市场营销专业
  - 财务会计专业
  - 企业管理专业
  - 物流管理专业
  - 财政金融专业
  - 电子商务专业
  - 国际商务专业
  - 人力资源管理专业
- 高职高专--服务类
  - 旅游专业
  - 饭店管理专业
  - 文秘专业
  - 艺术设计专业
  - 物业管理专业
- 基础教育--英语
  - 教材教辅
  - 课外读物
  - 综合知识
- 基础教育--信息技术
  - 教材教参
  - 课外读物
  - 教师培训
  - 科普读物
- 中职教育--计算机类
  - 计算机基础教育系列
  - 计算机专业基础系列
  - 计算机应用专业
  - 网络专业
  - 软件专业
  - 数据库专业
  - 多媒体技术专业
- 中职教育--公共课
  - 公共基础课系列
- 中职教育--经济管理类
  - 经济管理基础类
  - 物流管理专业
  - 财政金融专业
  - 市场营销专业
  - 企业管理专业
  - 国际商务专业
  - 财务会计专业
- 中职教育--电子信息类
  - 电子信息基础系列
  - 微电子技术专业
  - 通信技术专业
  - 电气自动化专业
  - 应用电子技术专业
- 中职教育--机电类
  - 机械基础系列
  - 机械设计与制造专业
  - 数控技术专业
  - 模具设计与制造专业
  - 机电一体化专业
  - 汽车专业
- 中职教育--服务类
  - 旅游专业
  - 饭店管理专业
  - 文秘专业
  - 艺术设计专业

作者荐语
编辑推荐

more >

内容囊括Linux和MySQL使用基础、Hadoop和Spark集群搭建、Hadoop两大核心的原理与使用、Hadoop生态圈工具（Hive、HBase、Spoop、Flume等）、Scala基础、RDD、Spark SQL、Spark streaming和Spark-ML等知识点，并有配套实例代码。
详细讲解真实的大数据项目“电力能源大数据分析”。

目录
特色介绍
文摘

more >

第1篇  大数据系统基础
第1章  大数据概述 3
1.1  数据的产生与发展 3
1.2  大数据的基础知识 4
1.3  大数据架构 5
第2章  系统的安装与使用 7
2.1  系统安装 7
2.1.1  安装CentOS 6.x 7
2.1.2  安装步骤 7
2.2  基本命令 18
2.2.1  cd命令 18
2.2.2  打包和解压指令 19
2.2.3  其他常用命令 21
2.3  权限与目录 26
2.3.1  权限 26
2.3.2  目录 27
2.4  文件操作 28
2.4.1  文件与目录管理 28
2.4.2  用户和用户组管理 39
2.5  习题与思考 46
第3章  任务命令 47
3.1  脚本配置 47
3.1.1  Shell脚本 47
3.1.2  Shell变量 47
3.1.3  Shell传递参数 48
3.1.4  Shell数组 50
3.1.5  Shell运算符 51
3.1.6  Shell echo命令 55
3.1.7  Shell printf命令 57
3.1.8  Shell test命令 58
3.1.9  Shell流程控制 60
3.2  网络配置 67
3.3  习题与思考 70
第4章  数据库操作 71
4.1  数据库简介 71
4.1.1  MySQL数据库简介 71
4.1.2  安装MySQL 72
4.2  数据库基本操作 72
4.2.1  MySQL的DDL操...

首页 > 图书中心 >图书详情

Hadoop+Spark大数据技术（微课版）

同系列产品 more >

精彩书评 more >