1、Hadoop3.x 从入门到放弃,第一章:概念

Hadoop3.x从入门到放弃,第一章:概念

一、什么是大数据

1、主要解决什么

大数据主要解决:海量数据的“采集”、“存储” 和 "分析计算" 问题

2、大数据特点

1> Volume 大量
2> velocity 高速
3> variety 多样性
     数据分为"结构化数据" 和 "非结构化数据"。结构化数据:数据库/文本为主的数据; 
     非结构化数据:网络日志、音频、视频、图像、地理位置信息等等
4> value 低价值密度
     如何快速对有价值的数据“提纯”成为目前大数据北京下待解决的难题

3、应用场景

一、金融行业
在金融行业,大数据广泛利用,典型例子如利用客户的点击数据集来给客户量身定制服务等。

二、医疗行业
医疗行业坐拥大量的病例、病理报告、医疗方案、药物报告等。对这些数据进行有效的整理和分析,将会给医生和病人带来极大的帮助。在未来,借助大数据平台,
医疗行业可以更系统、更完全地搜集疾病的基本特点、患者病历和医治方案等,建立起来针对各种疾病的数据库,最大限度地帮助医生进行疾病诊断。

三、农牧行业
农牧产品最大的困难就是不容易保存,因此公道地管控种植和养殖农牧产品对农、牧民来讲非常重要。ZF可以借助大数据提供的消费能力和趋势报告,
来为农牧行业生产进行公道引导,根据需求最大化进行生产,以避免产能多余而造成资源和社会财富的浪费。借助大数据技术支持,可以实现农业的精细化
管理和科学决策。具体操作:在大数据技术驱动下,结合无人机技术,农民就可以够全面、快速地搜集农产品生长和病虫害等信息。

四、零售行业
大数据在零售行业的租用主要体现在:零售行业可以通过往客户的购买记录,了解客户们的购买喜好,从而将客户喜欢的,相干的产品放到1起来增加产品销售额。

五、制造业
利用工业大数据提升制造业水平,包括产品故障诊断与预测、分析工艺流程、改进生产工艺,优化生产过程能耗、工业供应链分析与优化、生产计划与排程;

六、汽车行业
利用大数据和物联网技术的无人驾驶汽车,在不远的未来将走入我们的日常生活;

七、互联网行业
借助于大数据技术,可以分析客户行为,进行商品推荐和针对性广告投放;

八、电信行业
利用大数据技术实现客户离网分析,及时掌握客户离网倾向,出台客户挽留措施;

九、能源行业
随着智能电网的发展,电力公司可以掌握海量的用户用电信息,利用大数据技术分析用户用电模式,可以改进电网运行,
合理设计电力需求响应系统,确保电网运行安全;

十、物流行业
利用大数据优化物流网络,提高物流效率,降低物流成本;

十一、城市管理
可以利用大数据实现智能交通、环保监测、城市规划和智能安防;

十二、体育娱乐
大数据可以帮助我们训练球队,决定投拍哪种题材的影视作品,以及预测比赛结果;


二、大数据技术生态体系

三、Hadoop各版本组成

四、Hadoop概述

1、HDFS

2、YARN

3、MapReduce

4、三者关系

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/54007.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

网络层:IP协议/Mac协议

IP协议 主机: 配有IP地址, 但是不进行路由控制的设备; 路由器: 即配有IP地址, 又能进行路由控制; 节点: 主机和路由器的统 称; IP 目标网络(前半部分) 目标主机(后半部分) IP层的核心:IP地址定位主机(定…

Socks IP轮换:为什么是数据挖掘和Web爬取的最佳选择?

在数据挖掘和Web爬取的过程中,IP轮换是一个非常重要的概念。数据挖掘和Web爬取需要从多个网站或来源获取数据,而这些网站通常会对来自同一IP地址的请求进行限制或封锁。为了避免这些问题,数据挖掘和Web爬取过程中需要使用Socks IP轮换技术。在…

《向量数据库指南》——如何持久化存储 LlamaIndex 向量索引?

随着 AGI 时代的到来,越来越多的开发者开始思考如何有效利用大模型,不过,大家在构建 LLM 应用时普遍会面临三大挑战: LLM 的使用成本高昂LLM 无法及时提供最新信息LLM 缺乏特定专业领域的知识 针对上述问题,业界主流的做法是采用两种主要框架:微调和缓存 + 注入。 …

集团MySQL的酒店管理系统

酒店管理系统 概述 基于Spring Spring MVC MyBatis的酒店管理系统,主要实现酒店客房的预定、入住以及结账等功能。使用Maven进行包管理。 用户端主要功能包括: 登录注册、客房预订、客房评论(编写评论和查看评论) 后台管理主要…

如何在 Ubuntu 22.04 下编译 StoneDB for MySQL 8.0 | StoneDB 使用教程 #1

作者:双飞(花名:小鱼) 杭州电子科技大学在读硕士 StoneDB 内核研发实习生 ❝ 大家好,我是 StoneDB 的实习生小鱼,目前正在做 StoneDB 8.0 内核升级相关的一些事情。刚开始接触数据库开发没多久&#xff0c…

Linux 学习记录59(ARM篇)

Linux 学习记录59(ARM篇) 本文目录 Linux 学习记录59(ARM篇)一、IIC总线1. 概念2. IIC总线硬件连接 二、系统框图三、IIC时序1. 起始信号 / 停止信号2. 数据传输信号3. 应答信号 / 非应答信号4. 寻址信号 四、IIC协议1. 主机给从机发送一个字节(写)2. 主机给从机发送多个连续字…

MySQL 的 Join 查询及 Hash Join 优化 | StoneDB 技术分享会 #3

StoneDB开源地址 https://github.com/stoneatom/stonedb 设计:小艾 审核:丁奇、宇亭 编辑:宇亭 作者一:徐鑫强(花名:无花果) 电子科技大学-计算机技术-在读硕士、StoneDB 内核研发实习生 作…

Android 卡顿分析与布局优化

一、什么是卡顿?或者说我们怎么感知APP卡顿? 这里面涉及到android UI渲染机制,我们先了解一下android UI是怎么渲染的,android的View到底是如何一步一步显示到屏幕上的? android系统渲染页面流程: 1&…

重新审视MHA与Transformer

本文将基于PyTorch源码重新审视MultiheadAttention与Transformer。事实上,早在一年前博主就已经分别介绍了两者:各种注意力机制的PyTorch实现、从零开始手写一个Transformer,但当时的实现大部分是基于d2l教程的,这次将基于PyTorch…

使用javax.validation.constraints进行数据验证

使用javax.validation.constraints进行数据验证 在Java应用中,数据的验证是一个很重要的部分,特别是在接收用户输入或处理外部数据时。为了简化和标准化数据验证的过程,Java提供了javax.validation.constraints包,其中包含一系列注…

乳腺癌CT影像数据的深度学习:R语言与ANN神经网络构建高性能分类诊断模型

一、引言 乳腺癌是全球最常见的女性恶性肿瘤之一,也影响着男性的健康。据统计,每年有数百万人被诊断出患有乳腺癌[1]。乳腺癌的早期检测和准确诊断对于治疗和预后至关重要。然而,乳腺癌的早期诊断面临许多挑战,如图像解读的主观性…

uniapp 微信小程序:v-model双向绑定问题(自定义 props 名无效)

uniapp 微信小程序:v-model双向绑定问题(自定义 props 名无效) 前言问题双向绑定示例使用 v-model使用 v-bind v-on使用 sync 修饰符 参考资料 前言 VUE中父子组件传递数据的基本套路: 父传子 props子传父 this.$emit(事件名, …

Linux安装VScode

从本篇开始,打算有时间就写写在VScode中编写一些ros相关的案例程序用于学习记录。本篇是如何在Linux安装VScode的第一篇。 一、下载VScode 在Linux中打开浏览器输入:https://code.visualstudio.com/Download,选择与你电脑相匹配的版本下载&…

AssertionError: CUDA_HOME does not exist, unable to compile CUDA op(s)

安装deepspeed的时候出现如下错误: 检查是否有CUDA: 根据提示安装: 安装完之后检测,重新安装,成功安装。 参考资料 A100单机多卡大模型训练踩坑记录(CUDA环境、多GPU卡住且显存100%)

socket 基础

Socket是什么呢? ① Socket通常也称作“套接字”,用于描述IP地址和端口,是一个通信链的句柄。应用程序通常通过“套接字”向网络发出请求或者应答网络请求。 ② Socket是连接运行在网络上的两个程序间的双向通信的端点。 ③ 网络通讯其实指…

STM32基础回顾

文章目录 单片机编程的原理GPIO中断EXTI外部中断定时器中断、串口中断 定时器定时器中断配置过程通用定时器输出比较功能:PWM波的生成定时器的输入捕获功能主从触发模式PWMI模式 定时器的编码器接口 DMA简介通信接口USART软件配置流程:1、仅发数据的配置…

校园跑腿小程序功能分享

提起校园跑腿小程序大家都不陌生,尤其是对上大学的伙伴们来说,更是熟悉得不能再熟悉了,和我们的生活息息相关,密不可分。 对于现在的年轻人来说,网购是非常简单和方便的一种购物方式,随之快递也会越来越多。在我们国家…

java版本spring cloud 企业工程系统管理 工程项目管理系统源码

 Java版工程项目管理系统 Spring CloudSpring BootMybatisVueElementUI前后端分离 功能清单如下: 首页 工作台:待办工作、消息通知、预警信息,点击可进入相应的列表 项目进度图表:选择(总体或单个&…

self-attention笔记

self-attention 对于self-attention的理解 对于self-attention,我们直觉可能会觉得是从一个大的数据中,将我们的注意力集中在我们感兴趣的区域里, 但通过self-attention的原理可以发现,其原理更像是对于一个区域(一个…

八大排序算法--希尔排序(动图理解)

目录 希尔排序 概念 算法思路 动画演示 代码如下 复杂度分析 时间复杂度测试 运行结果 完整代码 创作不易,如果本篇博客对您有一定的帮助,大家记得留言点赞哦。 希尔排序 概念 希尔排序是插入排序的一种,是对直接插入排序的优化。其…