大数

企业大数据处理 Spark、Druid、Flume与Kafka应用实践 完整pdf

资源名称:企业大数据处理 、 、 与 应用实践 完整 第一部分 准备工作 第 章 基础环境准备 第二部分 核心技术 第 章  详解 第 章  原理及部署 第 章  数据摄入 第 章  客户端 第 章 日志收集 第 章 分布式消息队列 第三部分 项目实践 第 章 数据平台 第 章 监控系统 资源截图:

Hadoop Spark 大数据巨量分析与机器学习整合开发实战 完整pdf

资源名称: 大数据巨量分析与机器学习整合开发实战 完整 第 章 大数据与机器学习 第 章 虚拟机软件的安装 第 章 操作系统的安装 第 章 的安装 第 章 的安装 第 章 命令 第 章 第 章 的安装与介绍 第 章 第 章 的集成开发环境 第 章 创建推荐引擎 第 章 数据集 第 章 决策树二元分类 第 章 逻辑回归二元分类 第 章 支持向量机 二元分类 第 章 朴素贝叶斯二元分类 第 章 决策树多元分类 第 章 决策树回归分析 第 章 使用 数据可视化 资源截图:

Spark大数据分析核心概念技术及实践

资源名称: 大数据分析核心概念技术及实践 内容简介: 本书是大数据和 方面的一本简明易懂的手册。它将祝你学习如何用 来完成很多大数据分析人物。它覆盖了高效利用 所需要的一切内容。作者首先介绍 语法,然后介绍作为基石的 再对 的各大组件 、 、 、 进行详细介绍,最后讲解 集群管理。书中不仅给出了丰富的示例代码,还对 的核心概念和基本原理进行了较为全面的介绍,然你不仅知其然且知其所以然。通过本书,你可以快速上手 ,把 应用到实践中。 资源截图:

大数据大创新-阿里巴巴云上数据中台之道

资源名称:大数据大创新 阿里巴巴云上数据中台之道 内容简介: 在 集团内,数据人员面临的现实情况是:集团数据存储已经达到 级别,部分单张表每天的数据记录数高达几千亿条;在 年 双 购物狂欢节 的 小时中,支付金额达到了 亿元人民币,支付峰值高达 万笔 秒,下单峰值达 万笔 秒,媒体直播大屏处理的总数据量高达百亿级别且所有数据都需要做到实时、准确地对外披露 巨大的信息量给数据采集、存储和计算都带来了极大的挑战。《大数据之路 大数据实践》就是在此背景下完成的。本书中讲到的 大数据系统架构,就是为了满足不断变化

架构大数据 大数据技术及算法解析

资源名称:架构大数据 大数据技术及算法解析 内容简介: 本书从大数据架构的角度全面解析大数据技术及算法,探讨大数据的发展和趋势。不仅对大数据相关技术及算法做了系统性的分析和描述,梳理了大数据的技术分类,如基础架构支持、大数据采集、大数据存储、大数据处理、大数据展示及交互,还融合了大数据行业的最新技术进展和大型互联网公司的大数据架构实践,努力为读者提供一个大数据的全景画卷。 资源目录: 第 章 大数据技术概述 大数据的概念 大数据的行业价值 大数据问题的爆发 大数据处理流程 大数据技术 基础架构支持 数据采

驾驭大数据

资源名称:驾驭大数据 内容简介: 本书提供了处理大数据和在企业中培养创新和探索文化所需的工具、流程和方法,描绘了一个易于实施的行动计划,以帮助企业发现新的商业机会,实现新的业务流程,并做出更明智的决策。 本书重点介绍了如何驾驭大数据浪潮,并详细地介绍了什么是大数据,大数据为什么重要,以及如何应用大数据。本书还从具体实用的角度,介绍了用于分析和操作大数据的工具、技术和方法;以及从人才和企业文化的角度,介绍了如何使分析专家、分析团队以及所需的分析原则更加高效,如何通过分析创新中心使得分析更加具有创造力,以及如

Storm技术内幕与大数据实践

资源名称: 技术内幕与大数据实践 内容简介:  《 技术内幕与大数据实践》内容主要围绕实时大数据系统的各个方面展开,从实时平台总体介绍到集群源码、运维监控、实时系统扩展、以用户画像为主的数据平台,最后到推荐、广告、搜索等具体的大数据应用。书中提到的不少问题是实际生产环境中因为数据量增长而遇到的一些真实问题,对即将或正在运用实时系统处理大数据问题的团队会有所帮助。 资源目录: 第 章 绪论     的基本组件     集群组成     核心概念      的可靠性      的特性    其他流式处理框架