大数据 - 大数据入门第一篇 | 关于大数据你了解多少?

🐶1.1 概述

大数据(BigData):指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产

大数据主要解决、海量数据的采集、存储和分析计算问题。

按顺序给出数据存储单位:bit,Byte、KB、MB、GB、TB、PB、EB、ZB、YB、BB、NB、DB。

1Byte=8bit 1K=1024Byte 1MB=1024K

1G=1024M 1T=1024G 1P=1024T

🐶1.2 特点

1. Volumn(大量)

以社交媒体为例,全球每天产生的社交媒体内容,包括文字、图片和视频,都形成了巨大的数据量。例如,每天 Facebook、Instagram 和 Twitter 上共享的照片和消息,构成了庞大的数据集,远远超过传统数据库能够轻松处理的范围。

2. Velocity(高速)

在电子商务领域,实时交易数据的产生速度非常快。举例来说,亚马逊每秒处理数千笔交易,而这些交易数据需要即时分析以进行库存管理、个性化推荐等。这种高速的数据产生和处理要求系统能够实时响应,以满足业务需求。

3. Value(低价值密度)

在物联网(IoT)领域,传感器产生的大量数据可能包含很多噪音和冗余信息。

例如,一个智能城市中的传感器网络可能每秒收集大量关于交通、气象和环境的数据。然而,真正有价值的信息可能只占其中的一小部分。因此,从这些海量数据中提取出对城市规划或紧急情况响应有帮助的有用信息变得至关重要。

🐶1.3 大数据应用场景

  • 抖音:推荐的都是你喜欢的视频

  • 电商站内广告推荐:给用户推荐可能喜欢的商品

  • 零售:分析用户消费习惯,为用户购买商品提供方便,从而提升商品销量。经典案例:纸尿布+啤酒。

  • 物流仓储:京东物流,上午下单下午送达、下午下单次日上午送达。

  • 保险:海量数据挖掘及风险预测,助力保险行业精准营销,提升精细化定价能力。

  • 金融:多维度体现用户特征,帮助金融机构推荐优质客户,防范欺诈风险

  • 房产:大数据全面助力房地产行业,打造精准投策与营销,选出更合适的地,建造更合适的楼,卖给更合适的人。

  • 人工智能+5G+物联网+虚拟与现实+智能驾驶(汽车行业)+远程医疗

🐶1.4 大数据部门间业务流程分析

🐶1.5 大数据就业方向

大数据应用场景的广泛发展为大数据开发领域提供了丰富的工作机会。以下是一些与大数据开发相关的工作机会延伸:

1. 大数据工程师:

负责设计、构建和维护大规模的数据处理系统,确保高效地处理大量数据。这包括使用工具如Hadoop、Spark等进行数据处理和分析。

2. 数据架构师:

设计和管理整个数据架构,确保系统能够支持业务需求,并保持可扩展性和性能。

3. 数据科学家:

利用大数据进行深入分析,提取有价值的信息和洞察,为业务决策提供支持。需要掌握统计学、机器学习等相关领域知识。

4. 数据仓库工程师:

构建和维护数据仓库,使业务用户能够方便地访问和分析数据。使用工具如Amazon Redshift、Google BigQuery等。

5. ETL(Extract, Transform, Load)开发者:

负责将不同来源的数据抽取、转换和加载到目标系统中,确保数据的质量和一致性。

6. 实时数据处理工程师:

开发实时数据处理系统,确保系统能够在数据产生的同时进行实时分析和响应,适用于需要快速决策的场景。

7.云计算工程师:

在云平台上构建和管理大数据解决方案,例如使用AWS、Azure或Google Cloud等云服务提供商的大数据服务。

8. 数据安全工程师:

确保大数据系统的安全性,包括数据加密、访问控制、身份验证等方面的工作,以防止数据泄露和滥用。

9. 大数据产品经理:

负责制定大数据产品的战略方向,了解市场需求,并协调开发团队以实现产品目标。

10.机器学习工程师:

利用机器学习算法和模型,开发能够自动学习和适应的系统,用于处理大规模数据并提供智能化解决方案。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/282276.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

2023-12-21 LeetCode每日一题(美丽塔 II)

2023-12-21每日一题 一、题目编号 2866. 美丽塔 II二、题目链接 点击跳转到题目位置 三、题目描述 给你一个长度为 n 下标从 0 开始的整数数组 maxHeights 。 你的任务是在坐标轴上建 n 座塔。第 i 座塔的下标为 i ,高度为 heights[i] 。 如果以下条件满足&a…

[JS设计模式]Prototype Pattern

Prototype pattern Prototype pattern可便于同类型的多个对象共享属性。原型(prototype)是JS原生的对象,其他对象可以通过原型链(prototype chain)来访问原型。单独看这句描述可能还是有点儿抽象,下面通过…

过滤器、拦截器、切面

过滤器、拦截器、切面作用范围 原理不同范围不同具体参考[过滤器、拦截器、切面异同](https://juejin.cn/post/7110104873265758222) 执行顺序:过滤器>拦截器>切面 过滤器、拦截器属于请求层面的拦截;切面属于方法层面的拦截 原理不同 过滤器和拦…

Zookeeper-Zookeeper应用场景实战

1. Zookeeper Java客户端实战 ZooKeeper应用的开发主要通过Java客户端API去连接和操作ZooKeeper集群。 可供选择的Java客户端API有: ZooKeeper官方的Java客户端API。 第三方的Java客户端API,比如Curator。 ZooKeeper官方的客户端API提供了基本的操作…

Select工作原理

I/O多路复用是一种并发处理的机制,允许一个进程通过一种机制监视多个描述符,从而在有多个I/O操作需要处理时选择其中之一进行服务。select 函数是一种常见的实现 I/O 多路复用的系统调用,它允许一个进程同时监视多个文件描述符的可读性、可写…

机器学习:贝叶斯估计在新闻分类任务中的应用

文章摘要 随着互联网的普及和发展,大量的新闻信息涌入我们的生活。然而,这些新闻信息的质量参差不齐,有些甚至包含虚假或误导性的内容。因此,对新闻进行有效的分类和筛选,以便用户能够快速获取真实、有价值的信息&…

全渠道客服系统推荐:选型指南与最佳实践分享

售后服务是影响客户满意度的最直接的因素。有些企业不注重产品的售后服务,不仅是对客户的伤害,更是对企业品牌的损害。所以,做好售后服务对于企业来讲至关重要。 企业谈到做好售后服务,少不了一款好用的客服系统工具。其中&#…

ARM CCA机密计算软件架构之内存加密上下文(MEC)

内存加密上下文(MEC) 内存加密上下文是与内存区域相关联的加密配置,由MMU分配。 MEC是Arm Realm Management Extension(RME)的扩展。RME系统架构要求对Realm、Secure和Root PAS进行加密。用于每个PAS的加密密钥、调整或加密上下文在该PAS内是全局的。例如,对于Realm PA…

ACW741.斐波那契额数列

输入整数 N,求出斐波那契数列中的第 N项是多少。 斐波那契数列的第 0项是 0,第 1项是 1,从第 2 项开始的每一项都等于前两项之和。输入格式 第一行包含整数 T,表示共有T个测试数据。接下来 T行,每行包含一个整数 N。输…

Android长按图标展示快捷方式

if (Build.VERSION.SDK_INT > Build.VERSION_CODES.O) {new Thread(() -> {// 获取ShortcutManager实例ShortcutManager shortcutManager getSystemService(ShortcutManager.class);// 创建要添加的快捷方式ShortcutInfo.Builder shortcutBuilder new ShortcutInfo.Bui…

UGF框架中尝试加载AB资源来运行案例工程失败的解决办法

打开GameFramework场景,在编辑器模式下找到 表示当前资源加载模式是编辑器模式。(个人理解是和正常开发下的资源加载模式无异) CXK补充的内容:需要找到如下图的脚本,把资源加载的模式改为Package模式(单机…

com.microsoft.sqlserver.jdbc.SQLServerException: 驱动程序无法通过使用安全套接字层(SSL)加密与 SQL Server 建立安全连接。错误:“The

配置文件示例: # SQL Server 数据源配置 spring.datasource.dynamic.datasource.sqlserver.urljdbc:sqlserver://100.100.0.0\\shili;databaseNamecs; spring.datasource.dynamic.datasource.sqlserver.usernamesa spring.datasource.dynamic.datasource.sqlserver.password sp…

【LearnOpenGL基础入门——5】着色器

目录 一.简介 二.GLSL 三.数据类型 四.输入与输出 五.Uniform 六.更多属性 一.简介 着色器(Shader)是运行在GPU上的小程序。这些小程序为图形渲染管线的某个特定部分而运行。从基本意义上来说,着色器只是一种把输入转化为输出的程序。着色器也是一种非常独立…

python 1200例——【13】计算阶乘

阶乘是一个数学概念,表示为 n!(读作 n 的阶乘),表示从 1 到 n 的所有正整数的乘积。例如,5! = 5 4 3 2 1 = 120。 在 Python 中,我们可以使用多种方法来计算阶乘。以下是其中的一些方法: 方法一:使用循环 这是最基本的方法,我们通过循环从 1 到 n 依次乘起来。…

【Linux】内核编译 镜像制作

文章目录 一、Ubuntu内核编译1.1 为什么自己编译内核1.2 Ubuntu 内核源码下载1.21 内核的作用1.22 Linux内核与ubuntu内核1.23 Ubuntu内核源码获取 1.3 在Windows系统下编译ubuntu内核1.4 在Linux系统下编译ubuntu内核 二、镜像制作 一、Ubuntu内核编译 1.1 为什么自己编译内核…

拓扑排序

目录 拓扑排序 有向图的拓扑排序 拓扑排序 一个有向图,如果图中有入度为 0 的点,就把这个点删掉,同时也删掉这个点所连的边。 一直进行上面出处理,如果所有点都能被删掉,则这个图可以进行拓扑排序。 举例子&#…

【机器学习】人工智能概述

人工智能(Artificial Intelligence,简称AI)是一门研究如何使机器能够像人一样思考、学习和执行任务的学科。它是计算机科学的一个重要分支,涉及机器学习、自然语言处理、计算机视觉等多个领域。 人工智能的概念最早可以追溯到20世…

vue3框架笔记

Vue Vue 是一个渐进式的前端开发框架,很容易上手。Vue 目前的版本是 3.x,但是公司中也有很多使用的是 Vue2。Vue3 的 API 可以向下兼容 2,Vue3 中新增了很多新的写法。我们课程主要以 Vue3 为主 官网 我们学习 Vue 需要转变思想&#xff0…

[YoloV8目标检测与实例分割——目标检测onnx模型推理]

一、模型转换 1.onnxruntime ONNX Runtime(ONNX Runtime或ORT)是一个开源的高性能推理引擎,用于部署和运行机器学习模型。它的设计目标是优化执行使用Open Neural Network Exchange(ONNX)格式定义的模型,ON…

设备健康管理系统助力制造企业实现数字化转型

在当今快速变革的制造业环境中,数字化转型已成为制造企业保持竞争力和实现可持续发展的关键。在这个数字化转型的浪潮中,设备健康管理系统正发挥着重要的作用。设备健康管理系统通过实时监测、预测分析和智能诊断等功能,为制造企业提供了全面…