大数据简介

  1. 大数据概论和职业规划

  1. Linux服务器系统

  1. Hadoop概论

  1. HDFS分布式文件系统

  1. Hive数据仓库

  1. SparSQL指令

  1. Zepplin框架

  1. Sqoop框架

  1. Superset数据可视化

  1. 大数据数仓实战-didi出行

大数据概念

大数据特点

大数据应用场景

大数据分析业务步骤

大数据职业规划

大数据学习路线。

大数据概念

数据:世界的本质是数据

大数据:是指无法在一定时间范围内用常规软件工具进行捕捉,管理和处理的数据集合,因此需要新处理模式,该处理模式就是大数据。

大数据解决什么问题?

海量数据存储

数据分析的前提是有数据,数据存储的目的是支撑数据分析,究竟怎么去存储庞大的数据量,是开展数据分析的企业在当下面临的问题。

海量数据运算

当解决了海量数据的存储问题,接下来就需要进行海量数据的计算。

大数据的特点

大、多、值、快、信

大:数据体量大

多:种类和来源多样化,结构化、非结构化,来源日志、音频、视频

值:低价值密度,客户量,1000万

快:速度快,数据增长速度快,获取数据的速度快

信:数据的质量,数据的准确性,数据的可信依赖度。

大数据的应用场景

大数据让借贷更放心

在金融行业,以借贷款为例,在贷款前,贷款借出方会先利用大数据对借款人进行贷款审核,以此来保障贷后的还款率。

借出方从各个渠道合法收集借款人的标签信息,如学历、职业、薪资状况,历史借还款,海量数据被放入反欺诈模型,还款模型,身份验证模型等做训练,最终得出是否通过本次贷款申请,贷款的额度,贷款人的还款意愿等评估信息。

借款人数据收集的越多,标签维度越细,数据越真实,则审核效果越全面。

大数据让广告营销更高效

投放前,通过大数据手段大量的整合、分析数据,包括用户的浏览习惯、消费行为、浏览记录、对广告的点击数量,构建全面的用户画像,保证广告定向投放。

广告投放后期,通过实时数据反馈,结合用户所处地域,时间的变化,动态优化广告素材,让同一个用户在不同的场景下享受不一样的广告服务。

大数据在新媒体应用

短视频平台通过大数据平台,分析用户的喜好,根据用户的喜好给用户推荐视频

xx平台会根据你的浏览历史推荐你喜欢或者关注的内容

大数据分析业务步骤

流程

明确数据分析的目的和思路

数据收集(sqoop、flume)

数据处理:提取、清洗、转化、加载(Sqoop、Kettle、Mapreduce)

数据分析:统计、建模、挖掘(Hive、Spark、Flink)

数据可视化:(Superset、Echarts、BI工具)

报告撰写

大数据框架

核心框架:Hadoop、Hive、Spark、Flink、Kafka、Hbase

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/2234.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

基于YOLOv5的舰船检测与识别系统(Python+清新界面+数据集)

摘要:基于YOLOv5的舰船检测与识别系统用于识别包括渔船、游轮等多种海上船只类型,检测船舰目标并进行识别计数,以提供海洋船只的自动化监测和管理。本文详细介绍船舰类型识别系统,在介绍算法原理的同时,给出Python的实…

【系统开发】WebSocket + SpringBoot + Vue 搭建简易网页聊天室

文章目录一、数据库搭建二、后端搭建2.1 引入关键依赖2.2 WebSocket配置类2.3 配置跨域2.4 发送消息的控制类三、前端搭建3.1 自定义文件websocket.js3.2 main.js中全局引入websocket3.3 App.vue中声明websocket对象3.4 聊天室界面.vue3.5 最终效果一、数据库搭建 很简单的一个…

数据结构与算法——二叉树+带你实现表达式树(附源码)

📖作者介绍:22级树莓人(计算机专业),热爱编程<目前在c++阶段,因为最近参加新星计划算法赛道(白佬),所以加快了脚步,果然急迫感会增加动力>——…

ThreadLocal详解

一、什么是ThreadLocal 1、什么是ThreadLocal&为什么用ThreadLocal ThreadLocal,即线程本地变量,在类定义中的注释如此写This class provides thread-local variables。如果创建了一个ThreadLocal变量,那么访问这个变量的每个线程都会有…

C++基础算法④——排序算法(插入、桶附完整代码)

排序算法 1.插入排序 2.桶排序 1.插入排序 基本思想:将初始数据分为有序部分和无序部分;每一步将无序部分的第一个值插入到前面已经排好序的有序部分中,直到插完所有元素为止。步骤如下: 每次从无序部分中取出第一个值&#x…

图像分类卷积神经网络模型综述

图像分类卷积神经网络模型综述遇到问题 图像分类:核心任务是从给定的分类集合中给图像分配一个标签任务。 输入:图片 输出:类别。 数据集MNIST数据集 MNIST数据集是用来识别手写数字,由0~9共10类别组成。 从MNIST数据集的SD-1和…

在Clion开发工具上使用NDK编译可以在安卓上执行的程序

1. 前言 因为工作需要,我要将一份C语言代码编译成可执行文件传送到某安卓系统里执行。 众所周知,使用ndk编译代码有三种使用方式,分别是基于 Make 的 ndk-build、CMake以及独立工具链。以前进行ndk编程都是使用ndk-build进行的,新…

RocketMQ的基本概念、系统架构、单机安装与启动

RocketMQ的基本概念、系统架构、单机安装与启动 文章目录RocketMQ的基本概念、系统架构、单机安装与启动一、基本概念1、消息(Message)2、主题(Topic)3、标签(Tag)4、队列(Queue)5、…

C# 教你如何终止Task线程

我们在多线程中通常使用一个bool IsExit类似的代码来控制是否线程的运行与终止,其实使用CancellationTokenSource来进行控制更为好用,下面我们将介绍CancellationTokenSource相关用法。C# 使用 CancellationTokenSource 终止线程使用CancellationTokenSo…

【Leetcode】-有效的括号

作者:小树苗渴望变成参天大树 作者宣言:认真写好每一篇博客 作者gitee:gitee 如 果 你 喜 欢 作 者 的 文 章 ,就 给 作 者 点 点 关 注 吧! 文章目录前言前言 今天我们再来讲一期关于题目的博客,我挑选的是一道leet…

Git学习与gitlab中央仓库搭建(详细介绍)

环境:centos7.3一,Git的发展史git:分布式版本控制系统,是当前最流行的版本控制软件创始人:林纳斯.拖瓦兹二,部署Git环境1.安装git服务[rootlocalhost ~]# yum -y install git2.配置git环境不一定是data目录…

【C++】初识模板

放在专栏【C知识总结】,会持续更新,期待支持🌹前言在谈及本章之前,我们先来聊一聊别的。橡皮泥大家小时候应该都玩过吧,通常我们买来的橡皮泥里面都会带有一些小动物的图案的模子。我们把橡皮泥往上面按压,…

【性能分析】分析JVM出现的内存泄漏的性能故障

分析JVM出现的内存持续增加的性能故障手册 前言 本文通过常见的性能文件为例,提供简单清晰的思路去快速定位问题根源,从而可以快速解决性能故障。 性能问题介绍 在性能测试工作中针对Java程序最重要的是要关注JVM的内存消耗情况,JVM的内存…

面试错题本

目录2023.3.21 深信服哈夫曼树哈夫曼编码2023.3.21 深信服 ​同一线程共享的有堆、全局变量、静态变量、指针,引用、文件等,而独自占有栈 友元函数不能被继承,友元函数不是成员函数 友元函数不能被继承,友元函数不是当前类的成员…

Vue2项目总结-电商后台管理系统

Vue2项目总结-电商后台管理系统 去年做的项目,拖了很久,总算是打起精力去做这个项目的总结,并对Vue2的相关知识进行回顾与复习 各个功能模块如果有过多重复冗杂的部分,将会抽取部分值得记录复习的地方进行记录 一:项目…

精心整理前端主流框架学习路径

版权声明 本文原创作者:谷哥的小弟作者博客地址:http://blog.csdn.net/lfdfhl 前端主流框架 前端框架指的是用于构建Web前端应用程序的框架,使用框架进行前端开发带来以下显著优势: 提高开发效率:前端框架提供了现成的…

STM32的CAN总线调试经验分享

相关文章 CAN总线简易入门教程 CAN总线显性电平和隐性电平详解 STM32的CAN总线调试经验分享 文章目录相关文章背景CAN总线CAN控制器CAN收发器调试过程硬件排查CAN分析仪芯片CAN控制器调试总结背景 最近负责的一个项目用的主控芯片是STM32F407IGT6,需要和几个电机控…

DWF文件怎么用CAD打开?DWF输入CAD步骤

DWF是一种开放、安全的文件格式,它可以将丰富的设计数据高效率地分发给需要查看、评审或打印这些数据的任何人。那么,DWF文件如何打开呢?下面就和小编一起来了解一下DWF输入浩辰CAD软件中的具体操作步骤吧! DWF输入CAD中步骤&…

安装CentOS系统

打开 Oracle VM VirtualBox 点击新建 输入名称 点击下一步 点击下一步 点击创建 点击下一步 点击下一步 分配30G硬盘 点击创建 创建成功 点击启动按钮 选择 CentOS 系统 iso 镜像文件 点击启动 按键盘方向键 “上键”,选择第一项 按键盘回车键,然后等待 …

QT搭建MQTT开发环境

QT搭建MQTT开发环境 第一步、明确安装的QT版本 注意: 从QT5.15.0版本开始,官方不再提供离线版安装包,除非你充钱买商业版。 而在这里我使用的QT版本为5.15.2,在线安装了好久才弄好,还是建议使用离线安装的版本 在这里…