数据如何才能供得出、流得动、用得好、还安全

众所周知,数据要素已经列入基本生产要素,同时成立国家数据局进行工作统筹。目前数据要素如何发挥其价值,全国掀起了一浪一浪的热潮。
随着国外大语言模型的袭来,国内在大语言模型领域的应用也大放异彩,与此同时,数据价值在大模型中如何度量也成为了难题。一直以来,区块链被诟病为诈骗工具,在数据要素时代,区块链作为数据流通的权益证据链,可以较好的支撑。得到蔡钰·商业参考3《AIGC会让区块链重焕生机吗?》中提到:

但到了今天,普通人创作的普通内容在预训练AI模型的过程中也可以有了价值,以及各类生成式模型又极大降低了平民创作的门槛,我的观点也开始有了一些改变。未来三年,区块链技术可能会以超乎我们想象的速度成为主流应用。在那之前,你作为普通人,记得好好留言、好好创作,保护好自己的数字版权。

由此可以看出,数据供得出、流得动、用得好需要一种安全机制来保证。对于UGC、PGC而言,因为内容本是公开的,那么通过公开的区块链是可以较好的记录引用、转载的链接,并实现价值链条。

然而,对于政府和企业数据,则问题要复杂得多!且不论复杂情况下的数据如何流动,对于有价值的数据如何发挥价值,也是比较困难的。对于数据提供方而言,首先需要考虑的问题是,是不是真的有价值。这里的价值其实是对收获的价值和所承担的风险+投入成本。

数据“流得动”效用公式

数据收益之和 > 数据供出成本 + 数据交易成本 数据收益之和 > 数据供出成本+数据交易成本 数据收益之和>数据供出成本+数据交易成本

数据收益之和>数据供出成本+数据交易成本
要想数据流动,需要整体流通效益大于成本。数据收益之和大于数据供出成本和数据交易成本之和,数据才能流得动。
数据收益来源于采用数据流通模式获得的价值减去现有旧模式的价值和替换新模式所需成本。要么做大新模式价值,要么探索全新领域。

交易成本由维护市场和基础设施成本构成,只能通过交易量来摊薄成本。一是通过增加供给和需求,二是拓展应用场景,三是拓展服务边界。通过增加数据收益,降低供出成本和交易成本,实现数据流得动。

供得出

数据供得出的条件:
预期收益>预期损失 预期收益>预期损失 预期收益>预期损失
供出成本需要满足数据收益减去投入成本和风险成本。投入成本确定性比较高,风险如果不加分类分级,趋于无穷大。例如:公共数据运营的投入成本不可控,风险成本难估算,需要重点解决。
解决方案:一是通过建设运营移交(BOT)模式减少投入成本,二是通过分类分级压低潜在风险。

供出成本

V 数据 = V 收益 − C 投入 − C 风险 > 0 V_{数据}=V_{收益} - C_{投入}-C_{风险}>0 V数据=V收益C投入C风险>0

收益价值

● 确定性收益
● 未来潜在收益

投入成本

● 数据采购成本
● 数据供出的服务器成本
● 数据加工成本

风险成本

● 数据泄露风险()
● 数据安全风险
● 数据隐私风险

交易成本

C 交易 = C 维护市场 + C 基础设施 C_{交易}=C_{维护市场}+C_{基础设施} C交易=C维护市场+C基础设施
交易成本中基础设施成本和维护市场成本属于硬性成本,只能通过交易量来摊薄。
通过增加供给和需求用户数量,提高数据交易频次;拓展应用场景,扩大交易体量;拓展服务边界,增大交易规模

维护市场成本

● 交易所上架费用
● 广告成本
● 人员成本和管理成本

基础设施成本

数据交易机构需要提供承载数据交易发布的建筑和线上交易场所,这些都属于基础设施投入。相对固定,且边际效用递减。

流得动

数据流得动的条件:
V 数据流动收益压差 = ∑ D ∈ P V C i − V D P = V D P → D C > 0 V C i 表示从第 i 位消费者获得的收益 ∑ D ∈ P V C i 则表示所有从生产者 P 的数据 D 获得的所有收益之和 V D P 表示为提供数据 D ,生产者 P 需要付出的成本 \begin{align} V_{数据流动收益压差} & =\sum_{D \in P} V_{C_i} - V_{D_P}=V_{D_P \to D_C}>0 \\ \\ & V_{C_i} 表示从第i位消费者获得的收益 \\ & \sum_{D \in P} V_{C_i} 则表示所有从生产者P的数据D获得的所有收益之和 \\ & V_{D_P} 表示为提供数据D,生产者P需要付出的成本 \end{align} V数据流动收益压差=DPVCiVDP=VDPDC>0VCi表示从第i位消费者获得的收益DPVCi则表示所有从生产者P的数据D获得的所有收益之和VDP表示为提供数据D,生产者P需要付出的成本
基于上述公式,可以做大消费者的数量,使得总的数据消费收益变大,而生产者付出的成本相对固定,使得数据流通收益压差大于0,这样才能实现数据流得动。

用得好

V 数据价值 = V 新体验 – V 旧体验 – C 替换成本 > 0 V_{数据价值}=V_{新体验}–V_{旧体验}–C_{替换成本}>0 V数据价值=V新体验V旧体验C替换成本>0

按照俞军产品体验公式, 用户价值 = 新体验 − 旧体验 − 替换成本,或者效应 − 成本> 0 用户价值 = 新体验 - 旧体验 - 替换成本,或者 效应 - 成本 > 0 用户价值=新体验旧体验替换成本,或者效应成本>0
成本包括:直接成本和间接成本。
(1)直接成本,包括付出的金钱成本、时间成本、隐私数据、态度等;
(2)交易成本,即为了促成交易,付出的搜寻成本(比如为了找到哪个音乐软件最适合自己,甚至尝试用几个付出的时间)、议价成本(为了买到更便宜的西红柿和摊贩讨价还价付出的时间和口舌)、学习使用的成本、保障成本等。

数据能否用得好,关键在于新体验的增量是否足够。数据要素的交易模式,典型属于新体验模式,旧体验模式可能是目前已经构建的数据使用模式。例如通过爬虫获取数据、通过合同方式购买第三方数据或者模型。新体验主要在效率、实时性、准确性等方面好于就体验模式。

另一方面,如何使得替换成本尽可能的低,也是确保用得好的一个重要方面。例如,通过提升工具能力,降低用户替换成本。

总之,数据要想流得动,需要从供给、流通和消费来思考成本效益最低的解决方案。从数据交易流通的情况分析,是否流得动是关键。只有聚集足够的需求,才能撬动足够的供给,是一个典型的平台交易结果。20年前的淘宝,10年前的美团,都是需要通过补贴使得供需匹配,并提高效率。在数据交易场景中,不同时刻,对供需两方的场景要求不同。现阶段,各大数据交易所还是属于上架供给数据为主,消费者还很难使用目前的数据。

笔者认为,如果有足够的数据供给,应该会有消费者出现。不过基于上述从消费者角度来看,数据收益需要客户旧模式的价值,以及投入替换成本,这个过程往往比较困难。除非,应用场景的新模式具有压倒性的优势。

以上是笔者对于数据如何交易的一些思考,欢迎大家讨论,不妥之处,欢迎拍砖。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/520748.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

使用YOLOv8训练自己的【目标检测】数据集

文章目录 1.收集数据集1.1 使用开源已标记数据集1.2 爬取网络图像1.3 自己拍摄数据集1.4 使用数据增强生成数据集1.5 使用算法合成图像 2.标注数据集2.1确认标注格式2.2 开始标注 3.划分数据集4.配置训练环境4.1获取代码4.2安装环境 5.训练模型5.1新建一个数据集yaml文件5.2预测…

java中的正则表达式和异常

正则表达式: 作用一:用来校验数据格式是否合法 作用二:在文本中查找满足要求的内容 不用正则表达式:检验QQ号是否合法,要求全部是数字,长度在6-20,不能以0开头 public class test {public stat…

手机扫码查看视频如何实现?扫描二维码在线看视频的制作技巧

现在的学校或者幼儿园会需要拍摄学生的视频,然后展示给其他人查看,为了能够方便用户能够快速的获取文件内容,所以经常会通过生成视频二维码的方法,将二维码分享之后手机扫码来获取视频内容,有效提升用户获取内容的体验…

PTA C 1050 螺旋矩阵(思路与优化)

本题要求将给定的 N 个正整数按非递增的顺序,填入“螺旋矩阵”。所谓“螺旋矩阵”,是指从左上角第 1 个格子开始,按顺时针螺旋方向填充。要求矩阵的规模为 m 行 n 列,满足条件:mn 等于 N;m≥n;且…

160.相交链表

题目描述 解题思路 ————看评论区大神的思路———— 设「第一个公共节点」为 node ,「链表 headA」的节点数量为 aaa ,「链表 headB」的节点数量为 bbb ,「两链表的公共尾部」的节点数量为 ccc ,则有: 头节点 …

CSS设置字体样式

目录 前言: 1.font-family: 2.font-style: 3.font-weight: 4.font-size: 5.font-variant: 6.font: 前言: 在网页中字体是重要的组成部分,使用好字体可以让网页更…

第一次在msf控制台中运行search命令提示Module database cache not built yet问题解决

0x00 问题描述 在新装的kali虚拟机中使用msfconsole执行search命令时提示Module database cache not built yet问题,显然,是我们相关的数据库缓存存在问题。 故障现象: 0x01 启动数据库服务 msf中的search功能是基于postgresql来实现的&am…

python学习25:python中的元组(tuple)

python中的元组(tuple) 1.什么是元组? 元组也是容器数据类型的一种,同列表几乎是一样的,都是可以在里面封装多个,不同类型的元素在内;与列表最大的不同就是: 元组一旦被定义,就不能修改 2.元组…

物理层习题及其相关知识(谁看谁不迷糊呢)

1. 对于带宽为50k Hz的信道,若有4种不同的物理状态来表示数据,信噪比为20dB 。(1) 按奈奎斯特定理,信道的最大传输数据速率是多少?(2) 按香农定理,信道的最大传输数据速度…

Java设计模式—享元(FlyWeight)模式

享元模式(Flyweight),运用共享技术有效地支持大量细粒度的对象 public abstract class Piece {protected PieceColor m_color;protected PiecePos m_pos;public Piece(PieceColor color ,PiecePos pos){m_color color;m_pos pos;}public ab…

Java笔试总结

. 操作系统中关于竞争和死锁的关系下面描述正确的是? A 竞争一定会导致死锁 B 死锁一定由竞争引起 C 竞争可能引起死锁 D 预防死锁可以防止竞争 答案: C 进程的控制信息和描述信息存放在()。 A JCB B PCB C AFT D SFT 答案: B 当系统发生抖动(thrash…

元宇宙虚拟空间的场景的渲染(五)

前言 该文章主要讲元宇宙虚拟空间的场景的渲染,基本核心技术点,不多说,直接引入正题。 场景的渲染 下面第二个图中的代码是一个循环渲染逻辑,首先getDelta 获取2次时间的时间间隔,requestAnimationFrame请求我们的一…

Qt Creator 界面

🐌博主主页:🐌​倔强的大蜗牛🐌​ 📚专栏分类:QT❤️感谢大家点赞👍收藏⭐评论✍️ 目录 一、认识 Qt Creator 界面 1、总览 2、左边栏 3、代码编辑区 4、UI设计界面 5、构建区 一、认识 …

99%的人不知道,Oracle resetlogs强制开库需要推进SCN?

📢📢📢📣📣📣 哈喽!大家好,我是【IT邦德】,江湖人称jeames007,10余年DBA及大数据工作经验 一位上进心十足的【大数据领域博主】!😜&am…

算法---分治(归并排序)

T04BF &#x1f44b;专栏: 算法|JAVA|MySQL|C语言 &#x1faf5; 小比特 大梦想 此篇文章与大家分享分治算法关于归并排序的专题 对于归并排序在我个人主页专栏 <排序> 有详细的介绍 如果有不足的或者错误的请您指出! 1.归并排序 题目: 排序数组 1.1解析 关于归并排序…

STM32使用HAL库获取GPS模块HT1818Z3G5L信息(方法1)

1、写在最前 先了解一下GPRMC的格式 格 式&#xff1a; GPRMC,024813.640,A,3158.4608,N,11848.3737,E,10.05,324.27,150706,A*50 说 明&#xff1a; 字段 0&#xff1a;$GPRMC&#xff0c;语句ID&#xff0c;表明该语句为Recommended Minimum Specific GPS/TRANSIT Data&…

Open CASCADE学习|在给定的TopoDS_Shape中查找与特定顶点 V 对应的TopoDS_Edge编号

enum TopAbs_ShapeEnum{TopAbs_COMPOUND,TopAbs_COMPSOLID,TopAbs_SOLID,TopAbs_SHELL,TopAbs_FACE,TopAbs_WIRE,TopAbs_EDGE,TopAbs_VERTEX,TopAbs_SHAPE}; 这段代码定义了一个名为 TopAbs_ShapeEnum 的枚举类型&#xff0c;它包含了表示不同几何形状类型的常量。这些常量通常…

通过学习mayfly-go,我学会了前端如何优雅设计字典值

shigen坚持更新文章的博客写手&#xff0c;擅长Java、python、vue、shell等编程语言和各种应用程序、脚本的开发。记录成长&#xff0c;分享认知&#xff0c;留住感动。 个人IP&#xff1a;shigen shigen在假期的最后一天早晨起来&#xff0c;翻看了一下博客&#xff0c;一个ma…

spring注解驱动系列--声明式事务

一、环境搭建 一、导入依赖 <!-- 数据源、数据库驱动、spring-jdbc模块--> <dependency> <groupId>org.springframework</groupId> <artifactId>spring-jdbc</artifactId> <version>4.3.12.RE…

Dockerfile详解构建镜像

Dockerfile构建企业级镜像 在服务器上可以通过源码或rpm方式部署Nginx服务&#xff0c;但不利于大规模的部署。为提高效率&#xff0c;可以通过Dockerfile的方式将Nginx服务封装到镜像中&#xff0c;然后Docker基于镜像快速启动容器&#xff0c;实现服务的快速部署。 Dockerf…