【大数据技术原理与应用(概念、存储、处理、分析与应用)】第1章-大数据概述习题与知识点回顾

文章目录

    • 单选题
    • 多选题
    • 知识点回顾
      • 几次信息化浪潮主要解决什么问题?
      • 信息科技为大数据时代提供哪些技术支撑?
      • 数据产生方式有哪些变革?
      • 大数据的发展历程
      • 大数据的四个特点(4V)
      • 大数据对思维方式的影响
      • 大数据有哪些关键技术?
      • 大数据的常见四种计算模式
      • 大数据产业有哪些产业链环节?
      • 云计算有哪些关键技术?
      • 云计算的三种服务模式分别是什么意思?
      • 什么是云计算数据中心?
      • 物联网有哪些组成部分?
      • 物联网有哪些关键技术?

单选题

  • 1、第一次信息化浪潮主要解决什么问题?

    • A、信息传输
    • B、信息处理 ☑️
    • C、信息爆炸
    • D、信息转换
  • 2、下面哪个选项属于大数据技术的“数据存储和管理”技术层面的功能?

    • A、利用分布式文件系统、数据仓库、关系数据库等实现对结构化、半结构化和非结构化海量数据的存储和管理。 ☑️
    • B、利用分布式并行编程模型和计算框架,结合机器学习和数据挖掘算法,实现对海量数据的处理和分析
    • C、构建隐私数据保护体系和数据安全体系,有效保护个人隐私和数据安全
    • D、把实时采集的数据作为流计算系统的输入,进行实时处理分析
  • 3、在大数据的计算模式中,流计算解决的是什么问题?

    • A、针对大规模数据的批量处理
    • B、针对大规模图结构数据的处理
    • C、大规模数据的存储管理和查询分析
    • D、针对流数据的实时计算 ☑️
  • 4、大数据产业指什么?

    • A、一切与支撑大数据组织管理和价值发现相关的企业经济活动的集合 ☑️
    • B、提供智能交通、智慧医疗、智能物流、智能电网等行业应用的企业
    • C、提供数据分享平台、数据分析平台、数据租售平台等服务的企业
    • D、提供分布式计算、数据挖掘、统计分析等服务的各类企业
  • 5、下列哪一个不属于大数据产业的产业链环节?

    • A、数据循环层 ☑️
    • B、数据源层
    • C、数据分析层
    • D、数据应用层
  • 6、下列哪一个不属于第三次信息化浪潮中新兴的技术?

    • A、互联网 ☑️
    • B、云计算
    • C、大数据
    • D、物联网
  • 7、云计算平台层(PaaS)指的是什么?

    • A、操作系统和围绕特定应用的必需的服务 ☑️
    • B、将基础设施(计算资源和存储)作为服务出租
    • C、从一个集中的系统部署软件,使之在一台本地计算机上(或从云中远程地)运行的一个模型
    • D、提供硬件、软件、网络等基础设施以及提供咨询、规划和系统集成服务
  • 8、下面关于云计算数据中心的描述正确的是:

    • A、数据中心是云计算的重要载体,为各种平台和应用提供运行支撑环境 ☑️
    • B、数据中心就是放在企业内部的一台中心服务器
    • C、每个企业都需要建设一个云计算数据中心
    • D、数据中心不需要网络带宽的支撑
  • 9、下列哪个不属于物联网的应用?

    • A、智能物流
    • B、智能安防
    • C、环保监测
    • D、数据清洗 ☑️
  • 10、下列哪项不属于大数据的发展历程?

    • A、成熟期
    • B、萌芽期
    • C、大规模应用期
    • D、迷茫期 ☑️

多选题

  • 1、第三次信息化浪潮的标志是哪些技术的兴起?

    • A、个人计算机
    • B、物联网 ☑️
    • C、云计算 ☑️
    • D、大数据 ☑️
  • 2、 信息科技为大数据时代提供哪些技术支撑?

    • A、存储设备容量不断增加 ☑️
    • B、网络带宽不断增加 ☑️
    • C、CPU 处理能力大幅提升 ☑️
    • D、数据量不断增大
  • 3、 大数据具有哪些特点?

    • A、数据的“大量化” ☑️
    • B、数据的“快速化” ☑️
    • C、数据的“多样化” ☑️
    • D、数据的“价值密度比较低” ☑️
  • 4、 下面哪个属于大数据的应用领域?

    • A、智能医疗研发 ☑️
    • B、监控身体情况 ☑️
    • C、实时掌握交通状况 ☑️
    • D、金融交易 ☑️
  • 5、 大数据的两个核心技术是什么?

    • A、分布式存储 ☑️
    • B、分布式应用
    • C、分布式处理 ☑️
    • D、集中式存储
  • 6、 云计算关键技术包括什么?

    • A、分布式存储 ☑️
    • B、虚拟化 ☑️
    • C、分布式计算 ☑️
    • D、多租户 ☑️
  • 7、 云计算的服务模式和类型主要包括哪三类?

    • A、软件即服务(SaaS) ☑️
    • B、平台即服务(PaaS) ☑️
    • C、基础设施即服务(IaaS) ☑️
    • D、数据采集即服务(DaaS)
  • 8、 物联网主要由下列哪些部分组成的?

    • A、应用层 ☑️
    • B、处理层 ☑️
    • C、感知层 ☑️
    • D、网络层 ☑️
  • 9、 物联网的关键技术包括哪些?

    • A、识别和感知技术 ☑️
    • B、网络与通信技术 ☑️
    • C、数据挖掘与融合技术 ☑️
    • D、信息处理一体化技术
  • 10、 大数据对社会发展的影响有哪些?

    • A、大数据成为一种新的决策方式 ☑️
    • B、大数据应用促进信息技术与各行业的深度融合 ☑️
    • C、大数据开发推动新技术和新应用的不断涌现 ☑️
    • D、大数据对社会发展没有产生积极影响

知识点回顾

几次信息化浪潮主要解决什么问题?

浪潮发生时间标志解决问题代表企业
第一次浪潮1980年前后个人计算机信息处理Intel、AMD、IBM、苹果、微软、联想、戴尔、惠普等
第二次浪潮1995年前后互联网信息传输雅虎、谷歌、阿里巴巴、百度、腾讯等
第三次浪潮2010年前后物联网、云计算和大数据信息爆炸阿里云、华为云、亚马逊AWS、微软Azure、思科、高通等

信息科技为大数据时代提供哪些技术支撑?

  • 存储设备容量不断增加
  • CPU处理能力大幅提升
  • 网络带宽不断增加

数据产生方式有哪些变革?

  • 运营式系统阶段:主要来自企业和机构的内部运营系统
  • 用户原创内容阶段:互联网用户生成的大量内容
  • 感知式系统阶段:物联网(IoT)设备和传感器生成的数据

大数据的发展历程

萌芽期->成熟期->大规模应用期:

阶段时间内容
萌芽期上世纪90年代至本世纪初数据挖掘理论和数据库技术成熟,商业智能工具和知识管理技术开始应用,如数据仓库、专家系统、知识管理系统等。
成熟期本世纪前十年Web2.0应用迅猛发展,非结构化数据大量产生,传统处理方法难以应对,带动大数据技术快速突破,形成并行计算与分布式系统两大核心技术,谷歌的GFS和MapReduce技术受到追捧,Hadoop平台普及。
大规模应用期2010年以后大数据应用渗透各行各业,数据驱动决策,信息社会智能化程度大幅提高。

大数据的四个特点(4V)

  • Volume(数据量大)
    • 概念:大数据的显著特点之一是数据量巨大。传统的数据处理技术难以处理如此庞大的数据量,需要采用分布式存储和计算技术。
    • 实例:社交媒体平台每天产生数以亿计的帖子、图片和视频,传感器网络每秒生成海量数据等。
  • Variety(数据类型繁多)
    • 概念:大数据不仅包括结构化数据,还包括大量的非结构化和半结构化数据,如文本、图像、视频、日志文件等。
    • 实例:企业数据不仅包括传统的财务数据、销售记录,还包括社交媒体评论、客户反馈、视频监控等多种形式的数据。
  • Velocity(处理速度快)
    • 概念:大数据需要快速处理和分析,以便及时提取有用信息并做出决策。实时处理和流数据处理技术在大数据处理中非常重要。
    • 实例:金融市场的实时交易数据、物联网传感器的实时监控数据、在线广告的实时点击流数据等。
  • Value(价值密度低)
    • 概念:大数据的价值密度低,即从海量数据中提取有价值的信息和知识的难度较大,数据的整体价值相对于其数量来说是较低的。
    • 实例:从社交媒体上的海量用户生成内容中提取出有用的市场趋势和消费者行为数据。

大数据对思维方式的影响

  • 全样而非抽样:在大数据时代,我们不再依赖于少量的数据样本,而是分析与某事物相关的所有数据。这种全面的数据分析使得研究结果更加全面和准确。
  • 效率而非精确:大数据的处理强调速度和效率,而不是追求绝对的精确性。在面对复杂和海量的数据时,迅速得到一个大致准确的结果往往比耗费大量时间去得到一个精确的结果更有实际价值。
  • 相关而非因果:我们逐渐转变了传统的因果关系思维,转而关注事物之间的相关关系。虽然相关关系不能直接证明因果关系,但在很多实际应用中,找到相关性已经足够帮助我们做出有效的决策。

大数据有哪些关键技术?

  • 数据采集与预处理:大数据处理的第一步,它涉及到从各种不同的源头获取数据。这些源头可能包括数据库、文件、API、网络爬虫等。
  • 数据存储和管理:如何有效地存储和管理大量的、各种结构类型的数据。
  • 数据处理和分析:对海量数据的计算和挖掘。
  • 数据隐私和安全:确保个人隐私不被泄露,防止数据泄露和未授权访问。

大数据的常见四种计算模式

  • 批处理计算:针对大规模数据的批量处理模式,适用于处理静态数据集,进行复杂的计算任务。
  • 流计算:针对流数据的实时计算模式,适用于处理持续产生的数据流,进行实时分析和处理。
  • 图计算:针对大规模图结构数据的计算模式,适用于处理图形结构的数据,如社交网络分析、路径计算等。
  • 查询分析计算:一种针对大规模数据的存储管理和查询分析模式,适用于大规模数据的快速查询和分析。

大数据产业有哪些产业链环节?

有6个环节,分别是:

  • IT基础设施层:提供大数据处理所需的硬件、软件和网络基础设施,以及相关的咨询、规划和系统集成服务。
  • 数据源层:提供大数据的基础数据来源,涵盖各种领域的数据。
  • 数据管理层:负责数据的抽取、转换、存储和管理,为数据分析提供基础。
  • 数据分析层:提供分布式计算、数据挖掘、统计分析等服务,对大数据进行深入分析和挖掘。
  • 数据平台层:提供数据分享、分析、租售等平台服务,支持大数据的广泛应用。
  • 数据应用层:提供基于大数据的各种智能应用,涵盖多个行业领域。

云计算有哪些关键技术?

  1. 虚拟化:通过虚拟化技术,将物理资源抽象为多个虚拟资源,提高资源利用率和灵活性。
  2. 分布式存储:将数据分布存储在多个节点上,提供高可用性和数据冗余。
  3. 分布式计算:通过分布式计算技术,支持大规模数据处理和计算任务。
  4. 多租户:在同一物理基础设施上支持多个用户和应用的隔离和管理。

云计算的三种服务模式分别是什么意思?

  • IaaS(基础设施即服务):将计算资源和存储作为服务出租,用户可以按需使用底层基础设施。
  • **PaaS(平台即服务):**提供一个完整的开发和部署环境,包括操作系统和围绕特定应用的必要服务。
  • SaaS(软件即服务):把软件作为服务出租,用户通过互联网访问应用软件,而无需管理或控制底层基础设施。

什么是云计算数据中心?

云计算数据中心是一整套复杂的设施,包括刀片服务器、宽带网络连接、环境控制设备、监控设备以及各种安全装置等。数据中心是云计算的重要载体,为云计算提供计算、存储、带宽等各种硬件资源,为各种平台和应用提供运行支撑环境。

物联网有哪些组成部分?

物联网(IoT,Internet of Things)是指通过局部网络或互联网等通信技术,将传感器、控制器、机器、人员和物等连接在一起,形成一个人与物、物与物相联的网络。物联网利用这种连接方式,实现信息化和远程管理控制,是互联网的延伸和扩展。

物联网体系架构图如下所示:

物联网体系架构图

物联网有哪些关键技术?

  • 识别和感知技术
  • 网络与通信技术
  • 数据挖掘与融合技术

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/742896.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

Android10 Settings系列(六)Settings中toolbar 的基本流程,和Activity如何关联,这可能是比较详细的分析

一、前言 写在前面:一个快捷栏,音量浮窗快捷进入设置界面,点击左上角返回键拉起设置首页问题引发的思考和解决方法 事情的起因是测试报了一个问题。在Android9的一个设备在点击音量键时,在弹出的弹框中,点击设置图标快速进入音量设置中,点击左上角返回按钮是,退出当前界…

GPT-5智能新纪元的曙光

在美国达特茅斯工程学院周四公布的采访中,OpenAI首席技术官米拉穆拉蒂被问及GPT-5是否会在明年发布,给出了肯定答案并表示将在一年半后发布。穆拉蒂在采访中还把GPT-4到GPT-5的飞跃描述为高中生到博士生的成长。 这一爆炸性的消息,震动了整体…

期货交易中的几种常见心态管理

期货交易通常涉及到风险和收益的权衡,因此参与者的心态可以显著影响他们的决策和最终结果。以下是一些炒期货的常见心态: 1. 利润最大化心态:持有这种心态的投资者不关心风险,只考虑高利润。他们可能会盲目追求高回报&#xff0…

第26课 绘制原理图——原理图布局的调整

概述 我们可以根据需要,对原理图上各个图元的位置进行调整,让整个电路图的布局更加舒服。 拖动图元 只需按住鼠标左键,即可拖拽图元。 旋转图元 在原理图上时选中一个图元,之后按一次空格键,即可将图元逆时针旋转90…

怎么把avi转换成mp4?超好用的四种转换方法介绍!

怎么把avi转换成mp4?AVI,这个曾经风光一时的视频格式,如今却像是时代的遗珠,被现代科技潮流逐渐边缘化,在数字化飞速发展的今天,AVI面临着严重的兼容性问题,由于它诞生于一个较早的时代&#xf…

Hive笔记-4

240618-Hive笔记-4 4.2 Insert 4.2.1 将查询结果插入表中 1) 语法 INSERT (INTO | OVERWRITE) TABLE tablename [PARTITION (partcol1val1,partcol2val2 ...)] select_stamement; 关键字说明: (1) INTO: 将结果追加到目标表 (2) OVERWRITE: 用结果覆盖原有数据 2) 案例…

热敏电阻阻值和ADC采集值的转换(附10K(3950)案例)

解释:电阻阻值的转换 resistance (float)(10000 * adc_value) / (4096 - adc_value);是根据电压分压原理和ADC的转换公式来的。假设温度传感器和一个10k欧姆的电阻串联,两端接5V电源,那么温度传感器的电阻值和输出电压之间有如下关系&#…

Cell强势开启真菌组研究新篇章

人体消化系统中居住着各种各样的微生物,包括细菌、古菌、病毒和真菌。除了肠道细菌外,肠道真菌也是肠道健康微生物群的重要组成部分,过去10多年的微生态研究主要聚焦在细菌/古菌,真菌还属于暗物质,完全没有系统性认识。…

新媒体矩阵系统是什么?怎么搭建矩阵系统?

目录 前言: 一、新媒体矩阵分别是什么? 1、横向矩阵 2、 纵向矩阵 二、新媒体矩阵的作用? 1、多元化发展,吸引目标 2、多平台协同,放大宣传效果 3、多平台运营,分散风险 三、怎么做矩阵系统&…

多种驱鸟设备,在电力安全中各显神通

多种驱鸟设备,在电力安全中各显神通 鸟类对电力的危险是一个不容忽视的问题,尤其是在电力设施密集的区域。随着人类对自然环境的不断开发和利用,鸟类与电力设施之间的接触也日益频繁,由此引发的安全隐患和事故也屡见不鲜。 具体…

刷题记录6.24

438. 找到字符串中所有字母异位词https://leetcode.cn/problems/find-all-anagrams-in-a-string/ 这道题乍一看感觉很复杂。因为 异位词指由相同字母重排列形成的字符串,包括相同的字符串,那么就会有很多种组成,增加题目的复杂性。 对于这个…

星戈瑞CY5-DBCO在纳米粒子载体标记与追踪中的应用

随着纳米技术的飞速发展,纳米粒子载体在生物医学领域的应用增多。这些载体能够递送药物、基因和其他生物活性分子到特定的细胞或组织。为了有效监测纳米粒子载体在体内的分布、行为以及与生物分子的相互作用,荧光标记技术成为了一个常见工具。其中&#…

要求全国70%中医院设置康复科!康复科门诊服务这样建设!

近日,国家中医药管理局印发《国家中医药管理局关于进一步加强中医医院康复科建设的通知》提出,中医医院应根据当地人口规模及中医药康复服务需求设置康复科并作为独立科室进行建设和管理。有条件的二级以上中医医院应当按照《中医医院康复科推荐配置标准…

Redis-集群-环境搭建

文章目录 1、清空主从复制和哨兵模式留下的一些文件1.1、删除以rdb后缀名的文件1.2、删除主从复制的配置文件1.3、删除哨兵模式的配置文件 2、appendonly修改回no3、开启daemonize yes4、protect-mode no5、注释掉bind6、制作六个实例的配置文件6.1、制作配置文件redis6379.con…

使用Dropout大幅优化PyTorch模型,实现图像识别

大家好,在机器学习模型中,如果模型的参数太多,而训练样本又太少,训练出来的模型很容易产生过拟合的现象。在训练神经网络时,过拟合具体表现在模型训练数据损失函数较小,预测准确率较高,但是在测…

AI小白的大模型探险之旅:从入门到精通的奇妙旅程

前言 在数字化浪潮汹涌的时代,人工智能(AI)技术如同一位神秘的魔法师,以其强大的力量改变着世界的面貌。而在这魔法世界中,大模型技术无疑是那颗璀璨的明珠,引领着AI技术的新潮流。今天,我们就…

Hi3861 OpenHarmony嵌入式应用入门--LiteOS Semaphore做同步使用

信号量作为同步使用 创建一个Semaphore对象,并指定一个初始的计数值(通常称为“许可”或“令牌”的数量)。这个计数值表示当前可用的资源数量或可以同时访问共享资源的线程数。当一个线程需要访问共享资源时,它会尝试从Semaphore…

Sectigo或RapidSSL DV通配符SSL证书哪个性价比更高?

在当前的网络安全领域,选择一款合适的SSL证书对于保护网站和用户数据至关重要。Sectigo和RapidSSL作为市场上知名的SSL证书提供商,以其高性价比和快速的服务响应而受到市场的青睐。本文将对Sectigo和RapidSSL DV通配符证书进行深入对比,帮助用…

怎么免费SSL证书有效期越来越短了

其实说到SSL证书,很多人的第一印象都是免费SSL证书,主要是由于国内网络发展的历程相对于国外而言较晚,SSL证书的普及程度也远没有国外那么广泛,因此在国内前期的基础SSL证书会由各个云厂商和CA免费提供,之前在国内的一…

谨慎投稿!On Hold 期刊影响因子不降反升?附目前On Hold期刊影响因子变化表

【SciencePub学术】大家有没有发现一个现象,就是现在“on hold”期刊貌似越来越频繁了。一旦期刊在发文量、国人占比、引用异常、撤稿频繁等方面稍微碰触红线,便会喜提一个“on hold”标识~ 近日,2023JCR正式发布,今天小编带大家看…