大数据应用对企业的价值

目录

一、大数据应用价值

1.1 大数据技术分析

1.2 原有技术场景的优化

1.2.1 数据分析优化

1.2.2 高并发数据处理

1.3 通过大数据构建新需求

1.3.1 智能推荐

1.3.2 广告系统

1.3.3 产品/流程优化

1.3.4 异常检测

1.3.5 智能管理

1.3.6 人工智能和机器学习

二、大数据应用价值分析

2.1 数据分析的价值

2.2 大数据技术性能的价值

2.3 构建新需求的价值

三、什么情况下不需要大数据岗位

四、结语


前言:这几年互联网寒冬,时常听到大数据工作者担忧,大数据是开发支持岗位,担心公司业务收缩,先裁大数据岗位;这从侧面说明大数据应用在公司没有体现出该有的价值,大数据应用有哪些价值?为什么没有实现大数据的价值?本文从这两个视角分析。

一、大数据应用价值

       最近几年,到处都能听到大数据这个词,比如大数据推荐,大数据分析,大数据挖掘等;仿佛用大数据这个词就能解释很多没有关联的事;但是大数据到底有哪些应用价值,却没有清晰认识。 一些企业和部门怀着对大数据的期盼,引入了大数据技术开发解决应用场景,发现带来的价值不如预期;大数据的核心特性,是对大数据量的处理能力。什么场景需要,处理能力能干什么?

       对于很多单位或者企业,会有这样的疑惑。笔身深耕在大数据应用一线,从使用者的角度去总结和分析大数据带来的价值,如果无法分析到尽善尽美,希望大家谅解和补充。

上一章基于企业和大数据应用做了详细分析。大数据企业应用场景分析-CSDN博客

1.1 大数据技术分析

      大数据技术就像个新的土地,如何基于新土地优化原有或者构建新东西,大体方向从这两个维度去思考。对于原有技术场景的优化,数据分析、高并发数据处理属于这类;智能推荐、产品/流程优化、异常检测、智能管理、人工智能和机器学习属于第二类,通过大数据技术构建新东西。

1.2 原有技术场景的优化

1.2.1 数据分析优化

       在大数据技术出现以前,数据分析通常在OLTP数据库之上,写SQL用数据库自带引擎做数据分析,数据存储瓶颈分表分库解决,计算性能也得不到保障;大数据技术出现以后,对于业务的分析,可以统一通过数仓产出,且可以跨业务关联分析;除此之外,由于大数据本身的处理能力,以前无法做到的,比如通过日志,或者更细节的埋点分析,都可以通过大数据技术做到业务支持。

对于数据分析的应用优化,这里总结出3个点:

  • 代替OLTP数据库做业务指标计算
  • 解决数据孤岛,跨业务关联分析计算指标
  • 对业务系统运行,构建更细粒度的用户行为分析
1.2.2 高并发数据处理

       在大数据技术出现以前,对于提高业务性能的需求,基本是通过多线程高并发的方式实现,大数据技术将许多高并发的业务场景,简化成几个配置选项,对于一些数据采集、数据处理、数据分析,多数数据驱动的场景,使用大数据技术,能极大的提升业务的性能。

对于数据处理的应用需求,用牺牲部分灵活性的代价,极大的提升了数据处理的性能。

1.3 通过大数据构建新需求

       在大数据技术出现以前,受限于技术性能,许多需求是不合理;得益于大数据技术的出现,可以在高性能的基础上构建一些有价值的新需求,比如产品智能推荐、广告系统、产品/流程优化、异常检测、智能管理、人工智能和机器学习等。

1.3.1 智能推荐

        对于面向市场的产品,内容媒体定制化推荐,能实现更好的用户体验,比如新闻媒体、视屏号等;这些需求要在极快的时间做到人群划分和媒体内容划分,使用大数据技术,实现快速的搜索和准确的推荐功能,交互性能往往在秒级;这样的产品,能在应用市场占据很大的份额。

1.3.2 广告系统

       在巨大的市场用户面前,广告需要满足推荐的精准分析和高效推荐;这需要对产品用户数据的智能管理和分析提出很高的技术要求,和智能推荐的技术架构场景类似,需求场景不同。

1.3.3 产品/流程优化

       这里优化有两个过程,第一个是发现需要优化的部分,第二个是使用大数据技术优化局部性能;比如对于高QPS、快速搜索、快速计算的数据库,使用大数据技术,可以提高业务性能,最简单的场景,将Mysql的详情数据写入ES,使用ES的API提供数据支撑,数据量越大,性能对比效果越好。

1.3.4 异常检测

       得益于大数据技术的数据处理能力,实时性和TPS,对于业务、物联网设备、中间件、产品安全等多种场景,可以使用大数据技术作为核心架构,构建起高效的异常检测系统,为多种场景的安全和运维护航,这对于业务和系统的安全与稳定有很好的作用。

1.3.5 智能管理

       笔者所在的公司,面向市场有上百万的PC电脑,对电脑资产的监控和管理一直是个痛点问题;在APP上埋点SDK工具,使用大数据技术作为采集和分析驱动,定时采集PC状态,将资产信息实时同步到业务系统,很快和稳定的构建起资产管理。

1.3.6 人工智能和机器学习

       对于多数公司,这个应用都是没有落地场景的,但是还是要提一下,大数据和算法的交互:数据特征工程;大数据数据采集、存储和治理是人工智能和机器学习的基石,这个价值按照业界的话来说,价值巨大但落地周期长,在一些基础算法分类、预测、决策的场景经常配合大数据能力一同使用。

二、大数据应用价值分析

对于不同的应用需求,价值的评估角度是不一样的。

2.1 数据分析的价值

       对于数据分析,第一指标的价值,能体现出来的决策支持有效性就是其价值;这需要深入理解业务,并提取出第一性重要性指标,从这个角度,数据开发只是提供大数据的能力支撑,核心是数据分析对业务的理解和指标重要性的评估。

      有些人觉得大数据是业务支持岗位,缺少业务价值,没有岗位安全感;这可能需要从指标的价值上去呈现,大数据应该比业务更理解业务,从中提取出有价值的信息,而不是单独的计算PV、UV这种状态指标,分析指标的变化关系和原因,这是更深一层的价值。

2.2 大数据技术性能的价值

       对于传统后端中间件的性能,已经无法服务大业务场景的需求,引入大数据组件,可以如同之前操作OLTP数据库一样一样,写简单的DSL语句完成业务需求;这依赖了大数据产品的高性能,这一层价值是产品赋予的,是大数据工作者的大数据解决方案。

2.3 构建新需求的价值

       大数据除了数据分析,还能基于大数据技术栈的特新,构建新需求,这些需求的价值,有增加用户体验的智能推荐,或者广告系统,或可以减轻运维压力,或智能异常检查,或安全工程师的风险管理,资产运维等。从大数据技术的视角,这些只能通过大数据技术性能实现的需求,才是大数据工作岗的护城河。

比如智能推荐:需要实现对大量用户的精细化管理,对人群和内容标签分类,对标签人群的快速搜索,对标签内容的快速推荐,这需要极高的接口QPS和搜索推荐性能;这些都是大数据技术擅长的;

比如智能运维:需要实时捕捉大量业务系统、中间件、主机、终端、移动端、供应商等运行的实时日志,实时监控各种系统的稳定性,并对各个模块做到智能检测管理,这是用到了大数据实时吞吐和快速计算检测的能力特性。

比如风险检测:对系统或者终端网络等的安全管理,需要实时监测捕捉大量运行数据,且面对实时变换的风险特征持续更新和增加,这些也依赖大数据技术的高吞吐性能和实时计算能力。

智能管理这些功能类似;

人工智能和机器学习:这些需要依靠大数据的处理能力,替算法构建特征模型,使用算法的能力做分析、决策和预测等应用。

三、什么情况下不需要大数据岗位

       时常在想,为什么大数据岗位有安全感担忧。可能和领导对大数据的期盼有关;

在引入大数据岗位的时候,往往希望大数据能带来有价值的决策支撑,然后落地之后才发现常规的PV/UV计算只能计算指标状态,BI等对决策支撑力度不够,这需要数据分析师赋能;

并且大数据数据库可以直接给后端使用,对应的数据库提供了API接口,可以跳过大数据开发,后端开发者可以直接使用,大数据岗位在中间只做了集成需求,这种岗位需求也不高;

除此之外,数据中台、应用中台的开发,偏向于后端开发,对大数据技术的需求并没有那么大;

这些场景,小数据量的维度计算、对大数据产品的应用、数据中台产品的开发,这些都是对大数据技术的要求没有那么强的要求。

四、结语

       大数据是新的技术生态,技术就是工具,工具就是用来解决问题;对于已有的应用场景,大数据技术提供新的解决方案;对于大数据技术优秀的性能,可以构建新的业务需求;上文提到的应用和应用价值只是思考方向,对于更多的可能性,需要从真实应用需求中挖掘。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/381134.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

Java写标准输出进度条

学Java这么久了,突发奇想写一个 进度条 玩玩,下面展示一下成功吧! Java代码实现如下 public class ProcessBar {public static void main(String[] args) {//进度条StringBuilder processBarnew StringBuilder();//进度条长度int total100;/…

Adb显示第3方应用的包名原理

Android早期版本实现原理请看 Android源码分析-pm命令的实现,列出包名pm list package,列出系统库pm list libraries_pm list packages-CSDN博客 Android12 对adb shell pm 实现原理做了重构:改成了template模式PackageManagerShellCommand …

备战蓝桥杯---动态规划之经典背包问题

看题: 我们令f[i][j]为前i个物品放满容量为j的背包的最大价值。 f[i][j]max(f[i-1][j],f[i-1][j-c[i]]w[i]); 我们开始全副成负无穷。f[0][0]0;最后循环最后一行求max; 负无穷:0xc0c0c0c0;正无穷:0x3f3f3f3f 下面是v12,n6的图示&#xff…

如何开发一个游戏平台?

随着科技的进步和互联网的普及,游戏行业正在迅速发展。游戏平台的开发已成为游戏行业的一个重要组成部分。开发一个游戏平台需要深入了解游戏行业,掌握相关技术,并具备创新思维。以下是一些关于如何开发一个游戏平台的建议: 市场调…

1、学习 Eureka 注册中心

学习 Eureka 注册中心 一、创建 Eureka 微服务0、SpringBoot 和 SpringCloud 版本1、引入 Eureka 服务端依赖2、启动类加 EnableEurekaServer 注解3、配置 yaml 文件,把 Eureka 服务注册到 Eureka 注册中心4、访问 Eureka 服务端,查看注册中心的服务列表…

立体感十足的地图组件,如何设计出来的?

以下是一些设计可视化界面中的地图组件更具备立体感的建议: 使用渐变色: 可以使用不同的渐变色来表现地图的高低差异,例如使用深蓝色或深紫色来表示海底,使用浅绿色或黄色来表示低地,使用橙色或红色来表示高地。 添加…

【linux系统体验】-archlinux折腾日记

archlinux 一、系统安装二、系统配置及美化2.1 中文输入法2.2 安装virtualbox增强工具2.3 终端美化 三、问题总结3.1 一、系统安装 安装步骤人们已经总结了很多很全: Arch Linux图文安装教程 大体步骤: 磁盘分区安装 Linux内核配置系统(基本软件&…

Bean 的六种作用域

Bean 的六种作用域 .Bean的作用域属性注入和content获取Bean单例作用域:http://127.0.0.1:8080/single1多例作用域: http://127.0.0.1:8080/prototype请求作用域: http://127.0.0.1:8080/request会话作用域: http://127.0.0.1:8080/sessionApplication作用域: http://127.0.0.1…

python 爬虫篇(3)---->Beautiful Soup 网页解析库的使用(包含实例代码)

Beautiful Soup 网页解析库的使用 文章目录 Beautiful Soup 网页解析库的使用前言一、安装Beautiful Soup 和 lxml二、Beautiful Soup基本使用方法标签选择器1 .string --获取文本内容2 .name --获取标签本身名称3 .attrs[] --通过属性拿属性的值标准选择器find_all( name , at…

2003-2021年地级市实际利用外资数据/地级市实际利用FDI数据

2003-2021年地级市实际利用外商直接投资数据/地级市FDI数据 1、时间:2003-2021年 2、来源:城市年鉴、统计公报、省统计年鉴,已尽最大程度进行填补 3、指标:省份代码、城市代码、省份、城市、年份、当年实际使用外资金额&#x…

【制作100个unity游戏之23】实现类似七日杀、森林一样的生存游戏15(附项目源码)

本节最终效果演示 文章目录 本节最终效果演示系列目录前言实现树倒下的效果拾取圆木砍树消耗卡路里斧头手臂穿模问题处理源码完结 系列目录 前言 欢迎来到【制作100个Unity游戏】系列!本系列将引导您一步步学习如何使用Unity开发各种类型的游戏。在这第23篇中&…

新春贺词 | 人大金仓笃行不怠,初心不改!

新春贺词 冬至阳生,岁回律转,在这岁律更新的美好时刻,谨向长期以来关心和支持金仓发展的用户、领导和朋友们致以诚挚的问候和感谢!向一年来为了金仓事业发展奋战拼搏的全体金仓人及家属致以美好的新春祝福! 回首2023&a…

Bert下载和使用(以bert-base-uncased为例)

Bert官方github地址:https://github.com/google-research/bert?tabreadme-ov-file 【hugging face无法加载预训练模型】OSError:Can‘t load config for ‘./bert-base-uncased‘. If you‘re trying 如何下载和在本地使用Bert预训练模型 以bert-base-u…

多 split 窗口 in Gtkmm4

文章目录 效果预览实现概要源代码 效果预览 实现概要 使用Gtk::Paned虽然 Paned 只能装两个子控件, 但是我可以嵌套 paned1 装 box1 和 box2 paned2 装 paned1 和 box3 源代码 #include <gtkmm.h> class ExampleWindow : public Gtk::Window { public:ExampleWindow()…

二阶系统的迹-行列式平面方法(trace-determinant methods for 2nd order system)

让我们再次考虑二阶线性系统 d Y d t A Y \frac{d\mathbf{Y}}{dt}A\mathbf{Y} dtdY​AY 我们已经知道&#xff0c;分析这种二阶系统。最主要的是注意它的特征值情形。 &#xff08;此处没有重根的情形&#xff0c;所有是partial&#xff09; 而特征值&#xff0c;也就是系…

Amazon Dynamo学习总结

目录 一、Amazon Dynamo的问世 二、Amazon Dynamo主要技术概要 三、数据划分算法 四、数据复制 五、版本控制 六、故障处理 七、成员和故障检测 一、Amazon Dynamo的问世 Amazon Dynamo是由亚马逊在2007年开发的一种高度可扩展和分布式的键值存储系统&#xff0c;旨在解…

基于Python的HTTP隧道安全性分析:魔法背后的锁与钥匙

当我们谈论基于Python的HTTP隧道时&#xff0c;不禁让人想起那些神秘的魔法门。但是&#xff0c;在魔法背后&#xff0c;我们也需要确保安全性&#xff0c;就像需要确保魔法不会落入邪恶之手一样。那么&#xff0c;基于Python的HTTP隧道在安全性方面表现如何呢&#xff1f;让我…

JPEG图像格式加速神经网络训练--使用DCT训练CNN

JPEG图像格式加速神经网络训练 JPEG图像格式加速神经网络训练工作原理DCT系数与JPEG直接利用DCT系数阶段 1: 数据准备步骤 1: 读取JPEG文件结构步骤 2: 提取量化表和Huffman表步骤 3: 解析图像数据步骤 4: 反量化步骤 5: 获取DCT系数 阶段 2: 输入处理预处理 1: 正规化&#xf…

轻薄型工业平板亿道EM-T195,续航持久高达10小时

时尚而坚固的 10.1英寸EM-T195触摸屏平板电脑融合了高耐力和无与伦比的适应性&#xff0c;可抵御极端天气条件和多重冲击&#xff0c;借助强大的联发科8核处理器&#xff0c;它可以从容面对任何工作挑战。 其读取能力&#xff08;2D 成像器&#xff09;结合其坚固性&#xff0…

波奇学Linux: 文件描述符

文件和操作系统的关系 操作系统控制进程&#xff0c;文件的打开是在进程中进行。意味着用来控制进程的PCB必然有文件的信息&#xff0c;操作系统通过控制PCB的信息来控制文件的读写。 Q1&#xff1a;如何证明文件打开是在进程中进行&#xff1f; 编写c文件调用fopen来操作文件…