BIG DATA —— 大数据时代

大数据时代

[英] 维克托 · 迈尔 — 舍恩伯格     肯尼斯 · 库克耶 ◎ 著  盛杨燕     周涛◎译

《大数据时代》是国外大数据研究的先河之作,本书作者维克托·迈尔·舍恩伯格被誉为“大数据商业应用第一人”,他在书中前瞻性地指出,大数据带来的信息风暴正在变革我们的生活、工作和思维,大数据开启了一次重大的时代转型,并用三个部分讲述了大数据时代的思维变革、商业变革和管理变革。

舍恩伯格最具洞见之处在于,指出大数据时代最大的转变就是,放弃对因果关系的渴求,而取而代之关注相关关系。也就是说只要知道“是什么”,而不需要知道“为什么”。这就颠覆了千百年来人类的思维惯例,对人类的认知和与世界交流的方式提出了全新的挑战。

本书认为大数据的核心就是预测,大数据已经成为了新发明和新服务的源泉,而更多的改变正蓄势待发。书中展示了谷歌、微软、亚马逊、IBM、苹果、facebook、twitter、VISA等大数据先锋们最具价值的应用案例。

                                                                                                                                          —— 网络

 读后感

引言

        在一开始作者举例在流感中之所以谷歌可以预测冬季流感的传播。 就是因为谷歌保存了每天来自全球的30亿条搜索指令。奥伦 · 埃奇奥尼通过大数据解释了为什么季节影响飞机票的价格,他把这个发现命名为 “哈姆雷特”。于是他收购了Farecast公司,这时的预测准确率已经高达75%, 平均每张机票节省50美元。

天文学,信息爆炸的起源

信息爆炸的起源可以追溯到多个领域的发展,而天文学是其中的一个重要领域。随着计算机技术的全面融入和社会的发展,天文学在数据收集和处理方面取得了巨大的进步。在这个过程中,天文学家们积累了大量的观测数据,这些数据主要依赖于观测电磁辐射获得。这些数据的增长速度非常快,远超过了传统数据处理和分析的能力,从而形成了信息爆炸的现象。

具体来说,天文学作为信息爆炸的起源之一,主要体现在以下几个方面:

  1. 观测技术的进步:随着望远镜和探测器技术的不断改进,天文学家能够观测到更远的星系、更暗的天体和更精细的结构。这些观测技术的进步使得数据量迅速增长,为信息爆炸提供了丰富的原始素材。
  2. 数据处理技术的发展:随着计算机技术的不断进步,数据处理和分析能力得到了极大的提升。这使得天文学家能够更高效地处理和分析大量的观测数据,从而发现更多的天文现象和规律。
  3. 跨学科的合作与交流:天文学与其他学科的交叉融合,如物理学、数学、计算机科学等,为信息爆炸提供了更多的可能性。这些跨学科的合作与交流促进了数据共享和资源整合,进一步推动了信息爆炸的发展。

                                                                                                                                           ——网络

国际单位制前缀&字节

在书中多次提到国际单位制(SI)前缀

  1. 千(kilo):10³        或者1000
  2. 百万(mega):10⁶ 或者1,000,000
  3. 十亿(giga):10⁹   或者1,000,000,000
  4. 兆(tera):10¹²      或者1,000,000,000,000
  5. 拍(peta):10¹⁵     或者1,000,000,000,000,000
  6. 艾(exa):10¹⁸      或者1,000,000,000,000,000,000
  7. 泽(zetta):10²¹    或者1,000,000,000,000,000,000,000
  8. 尧(yotta):10²⁴    或者1,000,000,000,000,000,000,000,000
  9. 毫(milli):10⁻³     或者0.001
  10. 微(micro):10⁻⁶  或者0.000001
  11. 纳(nano):10⁻⁹   或者0.000000001
  12. 皮(pico):10⁻¹²   或者0.000000000001
  13. 飞(femto):10⁻¹⁵ 或者0.000000000000001
  14. 厄(atto):10⁻¹⁸    或者0.000000000000000001
  15. 兹(Zepto):10⁻²¹ 或者0.000000000000000000001
  16. 幺(Yocto):10⁻²⁴ 或者0.000000000000000000000001

据了解人类在2007年就储存了300艾字节

字节 Byte:

1Byte = 8bit, 俗称1大B = 1小b。

Byte进制是1024,艾字节到泽字节的进位就是1024 = 2¹⁰。

 模拟数据&数字数据

众所周知使用东西是一般分为获取数据——传输数据——处理数据——发挥作用

模拟数据和数字数据是两种主要的数据类型,它们在表示、传输和处理数据时有显著的不同。

模拟数据(Analog Data)是指连续变化的数据,它们可以取任意值,并且在时间和幅度上都是连续的。例如,温度、压力、声音、图像等都属于模拟数据。模拟数据的特点是可以平滑地变化,没有固定的量化级别。这种类型的数据通常通过模拟信号进行传输,如电话线中的语音信号或电视广播中的图像信号。

数字数据(Digital Data)则是以离散的数值形式表示的数据。在计算机科学中,数字数据通常是用二进制代码(0和1)表示的。这种数据类型只能取特定的、离散的数值。0表示恒定的负电压,1表示恒定的正电压。

 作者一直强调量变 = 质变,全数据模式 样本 = 总体这是很正确的, 作者在书中举例一个图片和一个视频有什么区别(量变 = 质变)。

我推荐大家看一下这本书:

谢谢大家,欢迎点赞, 收藏,关注。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/392101.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

2024.2.17日总结(小程序开发)

父子组件之间的通信 父子组件之间通信的3种方式 属性绑定 用于父组件向子组件的指定属性设置数据,仅能设置JSON 兼容的数据属性绑定用于实现父向子传值,而且只能传递普通类型的数据,无法将方法传递给子组件 事件绑定 用于子组件向父组件…

详解自定义类型:枚举与联合体!

目录 ​编辑 一、枚举类型 1.枚举类型的声明 2.枚举类型的优点 3.枚举类型的使用 二、联合体类型(共用体) 1.联合体类型的声明 2.联合体的特点 3.相同成员的结构体和联合体的对比 4.联合体大小的计算 5.用联合体判断大小端 三.完结散花 悟已往之不谏&…

由于找不到MSVCP140.dll无法运行软件游戏,多种解决方法分享

电脑系统在运行过程中,当出现“由于找不到MSVCP140.dll”这一提示时,可能会引发一系列潜在的问题与影响。当电脑无法找到这个特定的dll文件时,意味着相关应用可能无法顺利加载并执行必要的组件,进而导致程序无法启动或运行过程中频…

CCF编程能力等级认证GESP—C++8级—20231209

CCF编程能力等级认证GESP—C8级—20231209 单选题(每题 2 分,共 30 分)判断题(每题 2 分,共 20 分)编程题 (每题 25 分,共 50 分)奖品分配大量的工作沟通 答案及解析单选题判断题编程题1编程题2…

HTTPS网络通信协议基础

目录 前言: 1.HTTPS协议理论 1.1协议概念 1.2加密 2.两类加密 2.1对称加密 2.2非对称加密 3.引入“证书” 3.1证书概念 3.2数据证书内容 3.3数据签名 4.总结 前言: 了解完HTTP协议后,HTTPS协议是HTTP协议的升级加强版&#xff0c…

基于协同过滤的时尚穿搭推荐系统

项目:基于协同过滤的时尚穿搭推荐系统 摘 要 基于协同过滤的时尚穿搭推荐系统是一种能自动从网络上收集信息的工具,可根据用户的需求定向采集特定数据信息的工具,本项目通过研究服饰流行的分析和预测的分析和预测信息可视化时尚穿搭推荐系统…

相机图像质量研究(32)常见问题总结:图像处理对成像的影响--振铃效应

系列文章目录 相机图像质量研究(1)Camera成像流程介绍 相机图像质量研究(2)ISP专用平台调优介绍 相机图像质量研究(3)图像质量测试介绍 相机图像质量研究(4)常见问题总结:光学结构对成像的影响--焦距 相机图像质量研究(5)常见问题总结:光学结构对成…

无人机应用场景和发展趋势,无人机技术的未来发展趋势分析

随着科技的不断发展,无人机技术也逐渐走进了人们的生活和工作中。无人机被广泛应用于很多领域,例如遥感、民用、军事等等。本文将围绕无人机技术的应用场景和发展趋势,从多角度展开分析。 无人机技术的应用场景 无人机在遥感方面的应用&…

文生视频提示词:故事与主题

内容创意 --故事与主题 Story & Theme 这些词汇覆盖了从基本的故事类型到特定的主题和元素,可用于激发创意和定义视频内容的核心主题。 Adventure 冒险 Romance 浪漫 Mystery 神秘 Fantasy 幻想 Science Fiction 科幻 Horror 恐怖 Thriller 惊悚 Comedy 喜剧 Dr…

Ubuntu20.04 安装jekyll

首先使根据官方文档安装:Jekyll on Ubuntu | Jekyll • Simple, blog-aware, static sites 如果没有报错,就不用再继续看下去了。 我这边在执行gem install jekyll bundler时报错,所以安装了rvm,安装rvm可以参考这篇文章Ubuntu …

阿里云服务器ECS租赁费用报价_CPU内存_带宽和系统盘价格表

2024年最新阿里云服务器租用费用优惠价格表,轻量2核2G3M带宽轻量服务器一年61元,折合5元1个月,新老用户同享99元一年服务器,2核4G5M服务器ECS优惠价199元一年,2核4G4M轻量服务器165元一年,2核4G服务器30元3…

Python学习04 --- 函数进阶以及文件相关操作

1.函数的多返回值 1.函数可以有多个返回值,返回值之间用逗号隔开 2.多个返回值之间的类型可以不同 3.函数返回多个返回值时,我们也要用多个变量接收函数返回值,具体语法如上: 根据位置一一对应,x,y,z分别对应返回值…

fusion360 操作总结(不断更新)

平移缩放旋转快捷键 画布选择Windows 组合键macOS 组合键平移按住鼠标中键按住鼠标中键缩放滚动鼠标中键滚动鼠标中键动态观察旋转按住 Shift 键并按住鼠标中键按住 Shift 键并按住鼠标中键绕点动态观察按住 Shift 键单击并按住鼠标中键按住 Shift 键单击并按住鼠标中键撤消Ct…

springboot197基于springboot的毕业设计系统的开发

简介 【毕设源码推荐 javaweb 项目】基于springbootvue 的毕业设计系统的开发 适用于计算机类毕业设计,课程设计参考与学习用途。仅供学习参考, 不得用于商业或者非法用途,否则,一切后果请用户自负。 看运行截图看 第五章 第四章 …

吴恩达深度学习-L1 神经网络和深度学习总结

作业地址:吴恩达《深度学习》作业线上版 - 知乎 (zhihu.com) 写的很好的笔记:吴恩达《深度学习》笔记汇总 - 知乎 (zhihu.com) 我的「吴恩达深度学习笔记」汇总帖(附 18 个代码实战项目) - 知乎 (zhihu.com) 此处只记录需…

SG5032EAN规格书

SG5032EAN 晶体振荡器结合了相位锁定环(PLL)技术和AT切割晶体单元,提供了73.5 MHz至700 MHz的广泛频率范围,以满足高速数字应用的需求。高性能的LV-PECL输出,2.5V和3.3V电源电压,可灵活适配不同设计的电源需…

Springboot 配置使用 Elasticsearch

一、安装Elasticsearch 1、Windows安装 Windows安装比较简单,ES官网Download Elasticsearch | Elastic下载压缩包,解压出来, bin 目录下有个elasticsearch.bat,双击,就运行起来了。 然后在浏览器输入localhost:9200…

【sgCreateTableData】自定义小工具:敏捷开发→自动化生成表格列数据数组[基于el-table]

源码 <template><!-- 前往https://blog.csdn.net/qq_37860634/article/details/136141769 查看使用说明 --><div :class"$options.name"><div class"sg-head">表格数据生成工具</div><div class"sg-container&quo…

蓝桥杯DP算法——背包问题(C++)

目录 一、01背包问题 二、完全背包问题 三、多重背包问题 四、多重背包问题&#xff08;优化版&#xff09; 五、分组背包问题 一、01背包问题 01背包问题就是有N件物品&#xff0c;一个空间大小为V的背包&#xff0c;每个物品只能使用一次&#xff0c;使得背包中所装物品…

阿里云香港服务器cn2速度测试和租用价格表

阿里云香港服务器中国香港数据中心网络线路类型BGP多线精品&#xff0c;中国电信CN2高速网络高质量、大规格BGP带宽&#xff0c;运营商精品公网直连中国内地&#xff0c;时延更低&#xff0c;优化海外回中国内地流量的公网线路&#xff0c;可以提高国际业务访问质量。阿里云服务…