大数据:SAS数据分析1,数据步,和过程步

大数据:SAS数据分析

2022找工作是学历、能力和运气的超强结合体,遇到寒冬,大厂不招人,可能很多算法学生都得去找开发,测开
测开的话,你就得学数据库,sql,oracle,尤其sql要学,当然,像很多金融企业、安全机构啥的,他们必须要用oracle数据库
这oracle比sql安全,强大多了,所以你需要学习,最重要的,你要是考网络警察公务员,这玩意你不会就别去报名了,耽误时间!
与此同时,既然要考网警之数据分析应用岗,那必然要考数据挖掘基础知识,今天开始咱们就对数据挖掘方面的东西好生讲讲 最最最重要的就是大数据,什么行测和面试都是小问题,最难最最重要的就是大数据技术相关的知识笔试


文章目录

  • 大数据:SAS数据分析
    • @[TOC](文章目录)
  • 大数据多层模型
  • 数据分析常用指标
  • sas数据分析挖掘和分析工具,可视化工具
  • sas数据步,和过程步
  • 数据步的语句
  • 总结

大数据多层模型

在这里插入图片描述
第一层:收集数据,ETL抽取

第二层是数据仓库
如果全部放在数据仓库的话,需要粗加工,然后放进去
OLAP是数据仓库层,存放数据,另外还要一些在线分析查询的一些工具,关系型数据库是物理存储,外加OLAP功能
OLTP是联机事务处理:普通的事务存储,操作,2维平面表,Excel表
OLAP是联机分析处理:计算处理,简单的分析,多维建模和查询,高纬度的切片,钻取,分析

第三层:数据探索
统计量分析,查询,报告
看平均均值,方差,简单的统计

第四层:数据挖掘
仓库是放数据,挖掘是处理过程

第五层,结果展现给大家看,更直观,明了观看

第六层:给老板决策
老板知道了图就好办了。
在这里插入图片描述

数据分析常用指标

在这里插入图片描述
常用算法
在这里插入图片描述

sas数据分析挖掘和分析工具,可视化工具

在这里插入图片描述
sas好东西

做数据分析、建模的过程
并不是sas来做应用
它可以做分类,聚类等等的模型

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
影响和波及的范围
在这里插入图片描述在这里插入图片描述
用户经常关注和点击的地方,因为左边是网页,右边是广告
这是网页设计导致的
在这里插入图片描述
BI不止是报表功能,而是数据存储和抽取功能。

BI包含了所有的这个层。

sas数据步,和过程步

在这里插入图片描述
cards下面都是数据,他会把数据放入student表中

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
类似于2维表单

在这里插入图片描述
分号是必须的,否则一直等你
在这里插入图片描述

在这里插入图片描述
窗口要关掉
其他的逻辑库是内置的
样本

work是临时的逻辑库,中转站呗
也可以手工构建,这些都是永久的
在这里插入图片描述
在这里插入图片描述
user和passd就够了

在这里插入图片描述
sql好像是区分大小写
c语言啥的也是

cr 临时变量,放临时work里面

字符串双引号都是一样的

data cr;一个cr表
建立一些数据,中间的变量就是列,字段,这跟普通的变量不同
在这里插入图片描述
length是定义长度,否则默认8字符
内置cards;开始内置数据,往里面观数据
直到;
就把数据集搬入数据库

开始run;
proc print;打印当前这个sfz
run;结束
在这里插入图片描述
定义数据时,三种时间格式

输出依次制定时间长度

在这里插入图片描述
%let宏变量
f1是文件,已存在的
在这里插入图片描述
data就是定义列
infile读入文件
列明是h w
完事就持续读
打印
在这里插入图片描述
列指针@从第几个位置开始读
读谁变量x几
读几个?

$字符串类型
没有就是数值

在这里插入图片描述
没有指针,那分隔符舒服多了

在这里插入图片描述
在这里插入图片描述

数据步的语句

在这里插入图片描述
在这里插入图片描述
上面的那个就是
在这里插入图片描述
datalines是什么玩意?
student放在work中的表
input列
datalines是cards
等价的,定义内置数据的

懂了
3列数据依次灌进去

再建一个score表
四列字段,不解释了
然后cards,datalines,相当于就是表格分割线

proc print;输出的是当前的最后那个数据集
如果你要指定输出student的话,就单独列
run;就是跑上面的代码

在这里插入图片描述
类似于数据库中 from 默认那个表读,然后我们操作普通的运算

在这里插入图片描述在这里插入图片描述
libname是永久表
在这里插入图片描述
单独读到没有匹配,或者没有的就是.
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
衍生的列
在这里插入图片描述
在这里插入图片描述
num啥意思
看位数,基本就不管你中间数字,中阿金不够的用空格替代


总结

提示:重要经验:

1)
2)学好oracle,即使经济寒冬,整个测开offer绝对不是问题!同时也是你考公网络警察的必经之路。
3)笔试求AC,可以不考虑空间复杂度,但是面试既要考虑时间复杂度最优,也要考虑空间复杂度最优。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/174750.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

2023年DevOps国际峰会暨BizDevOps企业峰会(DOIS北京站)-核心PPT资料下载

一、峰会简介 在数字化转型的大背景下,企业选择实践 DevOps 来提升 IT 效能成为常态,BizDevOps 作为企业自身数字化变革的重要主题之一,需要全行业共同努力促进繁荣和发展。从 DevOps 到 BizDevOps,业务与技术如何融合&#xff1…

JAVAEE---多线程

内核 内核时操作系统的核心 操作系统有内核态和用户态,像我们平时所用到的qq音乐,微信等都属于用户态执行的程序。那么qq音乐播放音乐需要用到扬声器,扬声器的操作就是在内核空间进行操作,用户态不能对其进行操作。 操作系统 …

移远通信推出六款新型天线,为物联网客户带来更丰富的产品选择

近日,移远通信重磅推出六款新型天线,覆盖5G、非地面网络(NTN)等多种新技术,将为物联网终端等产品带来全新功能和更强大的连接性能。 移远通信COO张栋表示:“当前,物联网应用除了需要高性能的天线…

基于卷尾猴算法优化概率神经网络PNN的分类预测 - 附代码

基于卷尾猴算法优化概率神经网络PNN的分类预测 - 附代码 文章目录 基于卷尾猴算法优化概率神经网络PNN的分类预测 - 附代码1.PNN网络概述2.变压器故障诊街系统相关背景2.1 模型建立 3.基于卷尾猴优化的PNN网络5.测试结果6.参考文献7.Matlab代码 摘要:针对PNN神经网络…

雷电模拟器报错:g_bGuestPoweroff.fastpipeapi. cpp_1153_1161

文章目录 一、报错详情:二、解决:【1】设置Windows功能【2】设置cmd(管理员身份)【3】重启电脑 三、windows10其中1809版本出现1153、1161,需要关闭内核隔离 一、报错详情: 二、解决: 【1】设置…

909-2014-T2

文章目录 1.原题2.算法思想3.关键代码4.完整代码5.运行结果 1.原题 二叉树采用二叉链表存储结构,设计算法,判断二叉树是否为满二叉树。叙述算法思想并给出算法实现。 2.算法思想 通过一次遍历,得到结点个数和树的高度。用结点个数和树的高…

什么是高防CDN?有什么优势?

德迅高防CDN技术概述 随着互联网的快速发展,网络安全问题越来越受到人们的关注。高防CDN(Content Delivery Network)作为一种有效的网络安全防御手段,在企业和个人网站中得到了广泛应用。本文将详细介绍高防CDN的技术原理、防御原理、优点和应用场景&am…

TransmittableThreadLocal - 线程池中也可以传递参数了

一、InheritableThreadLocal的不足 InheritableThreadLocal可以用于主子线程之间传递参数,但是它必须要求在主线程中手动创建的子线程才可以获取到主线程设置的参数,不能够通过线程池的方式调用。 但是现在我们实际的项目开发中,一般都是采…

用 HLS 实现 UART

用 HLS 实现 UART 介绍 UART 是一种旧的串行通信机制,但仍在很多平台中使用。它在 HDL 语言中的实现并不棘手,可以被视为本科生的作业。在这里,我将通过这个例子来展示在 HLS 中实现它是多么容易和有趣。 因此,从概念上讲&#xf…

秋招JAVA面经总结

面试的范围是Java基础+Java并发+Java框架+mysql+网络。 Java基础 重载与重写有什么区别? 重载(Overloading)指的是在同一个类中,可以有多个同名方法,它们具有不同的参数列表(参数类型、参数个数或参数顺序不同),编译器根据调用时的参数类型来决定调用哪个方法。 重写…

会声会影2024出来了吗?会声会影2023怎么使用?

会声会影20247中文旗舰版 Corel VideoStudio 是一款功能强大的视频编辑软件,可以帮助用户创建高质量的视频作品。它提供了一系列完善的编辑功能,包括视频编辑、音频编辑、调色、特效、字幕、标题等。它还支持多种视频格式,可以将视频转换为多…

CSDN专栏设置

文章目录 一、规则1.1、专栏数量与等级关联1.2、等级与积分关联1.3、积分1.3.1、积分获取1.3.2、积分被扣 二、配置2.1、入口2.2、新建2.2.1、一级专栏2.2.2、二级专栏 2.3、快捷编辑2.4、拖拽 一、规则 写了一阵子CSDN博客后,发现自己新增专栏的时候提示不能再新增…

Linux调度域与调度组

引入调度域的讨论可以参考这篇文章。这篇笔记重点分析了内核调度域相关的数据结构以及内核用于构建调度域的代码实现,以此来加深对调度域的理解。调度域是调度器进行负载均衡的基础。 调度域拓扑层级 整个系统的调度域组成一个层级结构,内核设计了stru…

909-2015-T2

文章目录 1.原题2.算法思想3.关键代码4.完整代码5.运行结果 1.原题 编写算法,删除二叉搜索树(二叉排序树)的最小元素。叙述算法思想并给出算法实现,分析算法复杂性。二叉树采用链式存储结构,节点结构如下:…

编写函数求定积分的通用函数

归纳编程学习的感悟, 记录奋斗路上的点滴, 希望能帮到一样刻苦的你! 如有不足欢迎指正! 共同学习交流! 🌎欢迎各位→点赞 👍 收藏⭐ 留言​📝 不积跬步无以至千里,…

子虔科技亮相2023工业软件生态大会 以先进理念赋能工业软件发展

作为云化工业软件领先企业,子虔科技携多项全新云原生产品亮相2023工业软件生态大会。 本届大会以“共建新一代工业软件体系,引领制造业高质量发展”为主题,集结行业领先企业、行业专家探究工业软件在核心技术、产业链创新和生态建设等方面创…

navicat --CSV导出数据乱码情况(三种情况解决方式)

CSV导出数据乱码情况分析及处理 在navicat 中有很多导出方式,大家都知道csv导出要比xlse要快很多,但是在使用csv导出时要防止乱码情况, 下面我列出三种处理方式(如有其他方式大家可以帮忙补充一下): 文章目…

seismicunix基础-声波波动方程推导

seismicunix基础-声波波动方程推导 接触波动方程的研究人员都绕不开这个公式,这是在一维状态下波动方程 但是对于这个方程是怎样来的很少有人能说清楚,其中涉及到牛顿第二运动定律,物体的加速度与受到的力有关。 假设一维弦是大量紧密连接的质…

Spark---介绍及安装

一、Spark介绍 1、什么是Spark Apache Spark 是专为大规模数据处理而设计的快速通用的计算引擎。Spark是UC Berkeley AMP lab (加州大学伯克利分校的AMP实验室)所开源的类Hadoop MapReduce的通用并行计算框架,Spark拥有Hadoop MapReduce所具有的优点;但…

.nvmrc 文件使用详解

文章目录 1. 前言2. .nvmrc 是什么3. 创建 .nvmrc 文件4. 使用 .nvmrc 文件5. 终端自动切换版本 1. 前言 当开发多个项目时,每个项目运行环境要求的 node 版本不一样,那么我们就需要给每个项目指定 node 版本,也就是通过终端执行 nvm install…