大数

大数据时代的算法:机器学习、人工智能及其典型实例

资源名称:大数据时代的算法:机器学习、人工智能及其典型实例 内容简介: 《大数据时代的算法:机器学习、人工智能及其典型实例》介绍在互联网行业中经常涉及的算法,包括排序算法、查找算法、资源分配算法、路径分析算法、相似度分析算法,以及与机器学习相关的算法,包括数据分类算法、聚类算法、预测与估算算法、决策算法、关联规则分析算法及推荐算法。《大数据时代的算法:机器学习、人工智能及其典型实例》涉及的相关算法均为解决实际问题中的主流算法,对于工作和学习都有实际参考意义。 《大数据时代的算法:机器学习、人工智能及其典型

BIG DATA大数据系统构建:可扩展实时数据系统构建原理与最佳实践

资源名称: 大数据系统构建:可扩展实时数据系统构建原理与最佳实践 内容简介: 随着社交网络、网络分析和智能型电子商务的兴起,传统的数据库系统显然已无法满足海量数据的管理需求。 作为一种新的处理模式,大数据系统应运而生,它使用多台机器并行工作,能够对海量数据进行存储、处理、分析,进而帮助用户从中提取对优化流程、实现高增长率的有用信息,做更为精准有效的决策。 但不可忽略的是,它也引入了大多数开发者并不熟悉的、困扰传统架构的复杂性问题。 本书将教你充分利用集群硬件优势的 架构,以及专门用来捕获和分析网络规模数据

Mesos 大数据资源调度与大规模容器运行最佳实践 完整pdf

资源名称: 大数据资源调度与大规模容器运行最佳实践 完整 第 章运行 现代数据中心 集群计算框架 简介 框架 为什么使用 单节点 集群 安装依赖软件包 构建 启动 运行测试框架 多节点 集群 上的 集群 使用 运行 社区 案例研究 邮件列表 小结 第 章在 上运行 介绍 上的 在 上安装 作业示例 上 的高级配置 任务资源分配 度量报告 认证 容器隔离 其他配置参数 小结 第 章在 上运行 介绍 作业调度 模式 在 上的 在 上 的调优 小结 第 章 上的复杂数据分析 复杂数据和 架构的兴起 上的 配置

Storm实战:构建大数据实时计算 带书签 完整PDF

资源名称: 实战 构建大数据实时计算 带书签 完整 第 章 基础 能做什么 特性 其他流计算系统 应用模式第 章 初体验 本地环境搭建 集群第 章 构建 基本概念 构建 小结第 章 的并行度 并行元素 配置并行度 一个运行中 的例子 如何更新运行中的 的并行度第 章 消息的可靠处理 简介 理解消息被完整处理 消息的生命周期 可靠相关的 高效地实现 选择合适的可靠性级别 集群的各级容错 小结第 章 一致性事务 简单设计一:强顺序流 简单设计二:强顺序 流 的原理 第 章 总体概述 本地模式 远程模式 一个复

大数据大创新-阿里巴巴云上数据中台之道

资源名称:大数据大创新 阿里巴巴云上数据中台之道 内容简介: 在 集团内,数据人员面临的现实情况是:集团数据存储已经达到 级别,部分单张表每天的数据记录数高达几千亿条;在 年 双 购物狂欢节 的 小时中,支付金额达到了 亿元人民币,支付峰值高达 万笔 秒,下单峰值达 万笔 秒,媒体直播大屏处理的总数据量高达百亿级别且所有数据都需要做到实时、准确地对外披露 巨大的信息量给数据采集、存储和计算都带来了极大的挑战。《大数据之路 大数据实践》就是在此背景下完成的。本书中讲到的 大数据系统架构,就是为了满足不断变化

Hadoop大数据处理 中文pdf

资源名称: 大数据处理 中文 章大数据处理概论 什么是大数据 数据处理平台的基础架构 大数据处理的存储 提升容量 提升吞吐量 大数据处理的计算模式 多处理技术 并行计算 大数据处理系统的容错性 数据存储容错 计算任务容错 大数据处理的云计算变革 本章参考文献 章基于 的大数据处理架构 核心云计算技术 并行计算编程模型 分布式文件系统 分布式结构化数据存储 云计算技术及发展 的由来 原理与运行机制 相关技术及简介 技术的发展与演进 基于云计算的大数据处理架构 基于云计算的大数据处理技术的应用 百度 阿里巴巴

Spark大数据分析 核心概念 技术及实践 中文pdf

资源名称: 大数据分析 核心概念 技术及实践 中文 第 章 大数据技术一览 第 章  编程 第 章  第 章 使用 进行交互式数据分析 第 章 编写 应用 第 章  第 章  第 章 使用 进行机器学习 第 章 使用 进行图处理 第 章 集群管理员 第 章 监控 资源截图:

大数据分析:方法与应用

资源名称:大数据分析:方法与应用 内容简介: 本书介绍数据挖掘、统计学习和模式识别中与大数据分析相关的理论、方法及工具。理论学习的目标是使学生掌握复杂数据的分析与建模;方法学习的目标是使学生能够按照实证研究的规范和数据挖掘的步骤进行大数据研发,工具学习的目标是使学生熟练掌握一种数据分析的语言。本书内容由 章构成:大数据分析概述,数据挖掘流程,有指导的学习,无指导的学习,贝叶斯分类和因果学习,高维回归及变量选择,图模型,客户关系管理、社会网络分析、自然语言模型和文本挖掘。 本书可用做统计学、管理学、计算机科