大数

大数据Hadoop快速入门教程

教程介绍 实现了一个分布式文件系统,简称 。 有高容错性的特点,并且设计用来部署在低廉的硬件上;而且它提供高吞吐量来访问应用程序的数据,适合那些有着超大数据集的应用程序。本课程是大数据学科的入门教程,将会为您讲述 的具体内容,对大数据感兴趣的一定不要错过!学习地址百度: 天翼: 微云: : 文件信息

尚学堂_大数据_Hbase视频教程

教程名称: 尚学堂 大数据 视频教程 是一个分布式的、面向列的开源数据库,该技术来源于 所撰写的 论文 :一个结构化数据的分布式存储系统 。就像 利用了 文件系统( )所提供的分布式数据存储一样, 在 之上提供了类似于 的能力。

大数据:正在到来的数据革命

资源名称:大数据:正在到来的数据革命 内容简介: 入榜《亚洲周刊》 年度十大好书 ,持续畅销;叫醒中国,领跑大数据时代最好的书。   中国高层人物汪洋,读后非常有启发,针对国人数据意识的淡薄由来已久,中国如何应对大数据时代的挑战,他在工作会议上说: 我希望大家能认真读一读这本书,带着问题读,带着想法读。   哈佛大学商学院访问教授、全球顶尖管理咨询师达文波特,为中国政经两界提示智库建言: 无论是对中国政府,还是就中国的商业组织而言,《大数据》都是一本重要的书。   史学大家、匹兹堡大学历史系荣誉讲座教授许

数据算法:Hadoop/Spark大数据处理技巧 英文pdf原版

资源名称:数据算法: 大数据处理技巧 英文 原版 第 章二次排序:简介 第 章二次排序:详细示例 第 章 列表 第 章左外连接 第 章反转排序 第 章移动平均 第 章购物篮分析 第 章共同好友 第 章使用 实现推荐引擎 第 章基于内容的电影推荐 第 章使用马尔可夫模型的智能邮件营销 第 章 均值聚类 第 章 近邻 第 章朴素贝叶斯 第 章情感分析 第 章查找、统计和列出大图中的所有三角形 第 章 计数 第 章 测序 第 章 回归 第 章 趋势检验 第 章等位基因频率 第 章 检验 第 章皮尔逊相关系数 第

大数据大创新-阿里巴巴云上数据中台之道

资源名称:大数据大创新 阿里巴巴云上数据中台之道 内容简介: 在 集团内,数据人员面临的现实情况是:集团数据存储已经达到 级别,部分单张表每天的数据记录数高达几千亿条;在 年 双 购物狂欢节 的 小时中,支付金额达到了 亿元人民币,支付峰值高达 万笔 秒,下单峰值达 万笔 秒,媒体直播大屏处理的总数据量高达百亿级别且所有数据都需要做到实时、准确地对外披露 巨大的信息量给数据采集、存储和计算都带来了极大的挑战。《大数据之路 大数据实践》就是在此背景下完成的。本书中讲到的 大数据系统架构,就是为了满足不断变化

Storm技术内幕与大数据实践

资源名称: 技术内幕与大数据实践 内容简介:  《 技术内幕与大数据实践》内容主要围绕实时大数据系统的各个方面展开,从实时平台总体介绍到集群源码、运维监控、实时系统扩展、以用户画像为主的数据平台,最后到推荐、广告、搜索等具体的大数据应用。书中提到的不少问题是实际生产环境中因为数据量增长而遇到的一些真实问题,对即将或正在运用实时系统处理大数据问题的团队会有所帮助。 资源目录: 第 章 绪论     的基本组件     集群组成     核心概念      的可靠性      的特性    其他流式处理框架

触手可及的大数据分析工具 Tableau案例集 完整pdf

资源名称:触手可及的大数据分析工具 案例集 完整 第 部分 使用概述第 章数据可视化 用数据讲故事 数据不只是数字 在数据中寻找什么 本章小结 第 章 概述 的发展历程 产品简介 版本新特性 本章小结 第 章 应用优势 简单易用 极速高效 美观交互的视图与界面 轻松实现数据融合 简便的管理 灵活的配置 本章小结 第 章 功能介绍 数据连接 数据文件连接 数据库连接 了解 工作区 本章小结 第 部分新手上路第 章创作第一个仪表板 排序 分层与分组 分层 分组 参数设置 语法操作 主要功能函数简介 快速表计算

Python和HDF5大数据应用 带目录完整pdf_Python教程

资源名称: 和 大数据应用 带目录完整 语言在科学计算和数据处理领域应用前景广阔。大数据时代,催生了人们处理大量数据的实际需求。 应用领域的拓展,越来越多的人将 用于处理大型数值数据集,使用标准格式来进行数据的存储和通信也显得越来越重要,而 也正迅速成为人们存储科学数据的选择。本书会带你迅速了解使用 对大小从 至 的数字数据集进行存档和共享的细节、实践以及陷阱,体验在 语言中用 存储科学数据。通过真实世界的例子以及动手练习,你将依次学习科学数据集、层次性组织的组、用户定义的元数据,以及有互操作性的文件等主