备赛笔记——2024全国职业院校技能大赛“大数据应用开发”赛项——任务2:离线数据处理

MySQLicon-default.png?t=N7T8https://www.mysql.com/

将下发的ds_db01.sql数据库文件放置mysql中

12、编写Scala代码,使用Spark将MySQL的ds_db01库中表user_info的全量数据抽取到Hive的ods库中表user_info。字段名称、类型不变,同时添加静态分区,分区字段为etl_date,类型为String,且值为当前日期的前一天日期(分区字段格式为yyyyMMdd)。使用hive cli执行show partitions ods.user_info命令,将结果截图粘贴至答案表.docx中对应的任务序号下;
13、编写Scala代码,使用Spark将MySQL的ds_db01库中表sku_info的全量数据抽取到Hive的ods库中表sku_info。字段名称、类型不变,同时添加静态分区,分区字段为etl_date,类型为String,且值为当前日期的前一天日期(分区字段格式为yyyyMMdd)。使用hive cli执行show partitions ods.sku_info命令,将结果截图粘贴至答案表.docx中对应的任务序号下;

软件名称

版本

ubuntu

18.04    64 位

Hadoop:hadoop-3.1.3.tar.gz

3.1.3

Jdk:jdk-8u212-linux-x64.tar.gz

1.8

Spark:spark-3.1.1-bin-hadoop3.2.tgz

3.1.1

Hive:apache-hive-3.1.2-bin.tar.gz

3.1.2

MySQL

5.7

Scala:scala-2.12.x.tgz

2.12

Vue.js

3.2

ECharts

5.1

JDBC驱动:   mysql-connector-java-5.1.37.jar

集成开发工具:IDEA 2022 社区版

子任务一:(解压到的路径千万不要出现中文!!!小北第一次做到一半最后一步安装的时候才发现!!!浪费了很多时间!!!)

一、前言

MySQL5.7的下载安装与Navicat配置:

二、下载步骤

下载地址:MySQLicon-default.png?t=N7T8https://www.mysql.com/

温馨提示:

首页滑到最下面,选择Downloads下的MySQL Community server

点击查看下载历史版本

可手动选择历史版本

点击【No thanks,just start my download】不登录直接下载,等待一会有下载弹窗。如果有(Oracle账户选择直接登录,没有的话点击右侧注册一个)

点击【保存】就好,然后开始下载

zip格式是直接解压,解压缩之后其实MySQL就可以使用了,但是要进行环境变量配置zip格式是自己解压。

(解压到的路径千万不要出现中文!!!小北第一次做到一半最后一步安装的时候才发现!!!浪费了很多时间!!!)

(下载完毕后将文件解压到你想保存到的盘和目录内。我是将文件解压到D:\ProgramData\mysql-5.7.44-winx64目录下面)

以上就完成了下载的全部工作。

三、配置环境变量

1、右键此电脑->属性—>高级系统设置—>环境变量—>系统变量

点击系统变量中的path,编辑

点击新建,添加

(麻烦一点的话[不建议]——其实也可以一开始直接新建)

1、点击新建,变量名为:MYSQL_HOME添加你的mysql-5.7.27-winx64文件夹所在位置。我的是在D:\ProgramData\mysql-5.7.44-winx64

2、复制%MYSQL_HOME%\bin到原有值的后面

(不建议,很麻烦)

my.ini文件的内容为:如果安装目录不一样,记得修改MySQL的安装路径

环境配置结束后别直接退出,请记得一定要一个一个“确定”!!!
我的mysql bin文件夹的路径 :D:\ProgramData\mysql-5.7.44-winx64

2.配置存放数据库数据文件(配置my.ini文件)


配置完环境变量之后,在D:\ProgramData\mysql-5.7.44-winx64目录下配置文件mys.ini 中,修改安装路径,并添加存放数据的data文件夹路径。在bin的同级目录下切记不要手动创建data文件夹,第一次启动后会自动创建,手动创建会报错。

新建一个“.txt”文件,改后缀名为"my.ini",直接确定!!!


(不用的话可以直接跳过)用notepad注意修改其中的文件夹所在路径。

不要自己创建data!不要自己创建!不要自己创建!系统会自动创建,自己创建会报错。

上述图片中的配置文件内容,可从下方复制,记得修改安装目录

[mysql]
# 设置mysql客户端默认字符集
default-character-set=utf8
 
[mysqld]
# 设置3306端口
port = 3306
# 设置mysql的安装目录
basedir=D:\ProgramData\mysql-5.7.44-winx64
# 设置 mysql数据库的数据的存放目录,MySQL 8+ 不需要以下配置,系统自己生成即可,否则有可能报错
datadir=D:\ProgramData\mysql-5.7.44-winx64\data
# 允许最大连接数
max_connections=1000
# 服务端使用的字符集默认为8比特编码的latin1字符集
character-set-server=utf8
# 创建新表时将使用的默认存储引擎
default-storage-engine=INNODB
 修改内容如下:
# 设置mysql的安装目录
basedir=D:\ProgramData\mysql-5.7.44-winx64

# 设置mysql数据库的数据的存放目录
datadir=D:\ProgramData\mysql-5.7.44-winx64

完整安装过程如下,管理员权限运行cmd,运行命令:

完整的安装命令如下:

mysqld --initialize-insecure --user=mysql

mysqld install

net start mysql

mysql -u root -p

mysqladmin -u root -p password root
熟悉复习下mysql的相关命令:

1、初始化data目录
        mysqld --initialize(随机密码)
        mysqld --initialize-insecure(无密码)
2、经过初始化data重置目录,注意my.ini先配置好,mysqld -remove重新安装下,再次运行

        net start mysql
3、3306端口被占用
        mysqld --console 可以查看报错信息
        netstat -ano 看看是端口是否被占用      #netstat -aon|findstr “3306”
        若被占用,PID结束进程,再试试看
4、本地host指向问题
        C:\Windows\System32\drivers\etc\hosts
        查看下本地host是否指向其他域名,如127.0.0.1是否指向localhost

(不用的话可以直接跳过——跳的这一步)

 (正常步骤:my.ini文件的内容为:如果安装目录不一样,记得修改MySQL的安装路径。

[mysqld]
#端口号
port = 3306
#mysql-5.7.44-winx64的路径
basedir=D:\ProgramData\mysql-5.7.44-winx64
#mysql-5.7.44-winx64的路径+\data
datadir=D:\ProgramData\mysql-5.7.44-winx64\data 
#最大连接数
max_connections=200
#编码
character-set-server=utf8
 
default-storage-engine=INNODB
 
sql_mode=NO_ENGINE_SUBSTITUTION,STRICT_TRANS_TABLES
 
[mysql]
#编码
default-character-set=utf8 
 

创建完成后进入下一步。

四、安装MySQL

(1)在输入框内输入cmd,以管理员的身份运行,注意这里一定一定一定要以管理员的身份运行,否则在安装过程中会出现因为管理权限不够而导致的Install/Remove of the Service Denied!(安装/卸载服务被拒绝),这一点非常重要!

错误示范:("Win"+"cmd"打开命令提示符窗口是不行的)


正确步骤:

(2)在cmd中进入到D:\ProgramData\mysql-5.7.44-winx64\bin目录下:

输入安装命令:mysqld  -install,若出现Service successfully installed,证明安装成功;如出现Install of the Service Denied,则说明没有以管理员权限来运行cmd:

然后继续输入命令:mysqld  --initialize,此时不会有任何提示:

再输入启动命令:net start mysql,出现以下提示证明MySQL启动成功

输入以下命令,以root用户连接到mysql,遇见输入密码直接回车!

mysql -u root -p

当命令提示符前变为mysql>,则证明登陆成功!输入以下命令修改root用户密码!

update mysql.user set authentication_string=password('1234') where user='root';

执行成功后,输入以下命令刷新权限!

flush privileges;

重启mysql服务,即可快乐使用!

net stop mysql     
net start mysql

(在配置环境的过程中我也遇到了很多问题,并做了一些总结)

1.执行net start mysql时发生报错,报错提示:
发生系统错误 2。
系统找不到指定的文件。

解决方法:(此方法为通用方法,不一定能解决所有关于这个报错的问题)
1.进入mysql文件夹中bin里(使用管理员权限)
2.执行mysqld remove
3.执行mysqld install
4.执行net start mysql

2、在执行 mysqld --initialize时候

[ERROR] --initialize specified but the data directory has files in it. Aborting.

解决方法:[错误]--指定了初始化,但数据目录中有文件。正在中止

清除掉 数据文件。

对应的目录 :D:\ProgramData\mysql-5.7.44-winx64\data

查看现在目录内容:

把这些都删除掉。

然后重新执行:

mysqld --initialize

可以正常执行了。

3、cmd运行net start mysql
报错:
发生系统错误193 *** 不是有效的 Win32 应用程序。

解决方法:删除bin目录下0KB的mysqld文件

4、发生系统错误 1058。

无法启动服务,原因可能是已被禁用或与其相关联的设备没有启动。

MySQL之前安装好,一直使用正常的,结果第二次又不行了

首先以管理员身份启动 命令提示符,输入

net start mysql

发现提示“mysql 服务无法启动,系统发生1058错误”

解决方法:

1.输入:

mysqld remove

2.继续输入:

mysqld --initialize

3.接着输入:

mysqld --install

4.再次启动mysql:

mysql -u root -p

输入自己的mysql密码

终于启动成功啦!!!

MySQL启动!!  !

(不建议,不要轻易尝试,我用了之后命令提示符直接挡掉了)以跳过验证的方式启动mysql!!!

5、以跳过验证的方式启动mysql,或者在my.ini文件中,[mysqld]节点下,添加skip-grant-tables后,再启动!
mysqld --skip-grant-tables
net start mysql

6、MySQL登录报错:ERROR 1045 (28000): Access denied for user ‘root‘@‘localhost‘ (using password: YES)

对于出现拒绝访问root用户的解决方案:
错误1045(28000):用户'root'@'localhost'(使用密码:YES)拒绝访问

首先解析此英文:ERROR 1045 (28000): Access denied for user 'root'@'localhost' (using password: YES);
解析的地方有两处:1.Access denied(拒绝访问);2.using password:NO/YES

一、出现access denied的原因有如下可能:

1)mysql的服务器停止:
  若MySQL已经没有启动,重启MySQL服务器:systemctl restart mysqld
2)用户的端口号或者IP导致:
  若用户的端口号与IP(3306/3307)不一致,打开my.ini文件进行编辑。全部编辑替换为: port=X
3)mysql的配置文件错误----my.ini等文件:
  my.ini文件误输入无效内容,不知道到何处。复制替换该文件;有人已经对my.ini文件进行解释以及注释:https://blog.csdn.net/lienfeng6/article/details/78140404
4)root用户的密码错误(后面解决)

二、出现 using password的原因如下:

不输入密码:

错误的密码:

​​​

解决方案:

Step 1:跳过MySQL密码验证

​ 找到 MySQL 的配置文件 “my.ini”,找到 [mysqld],在其下面任意一行添加 skip-grant-tables,保存,如下图所示:

skip-grant-tables
注:my.ini”文件可能在目录 D:\ProgramData\mysql-5.7.44-winx64\MySQL 下。
Step 2

重启 MySQL 服务。

sudo systemctl restart mysqld

Step 3:无密码登录MySQL

  • 找到 MySQL 安装目录下的 bin 目录,地址栏输入 cmd,然后回车,如下图所示:

附:如果已经为 MySQL 8.0 配置了环境变量,就可以在任意位置打开 cmd。

mysql -u root -p

输入 mysql -u root -p 回车后会显示输入密码,直接不管,再次回车,不要关闭命令行,如下图所示:

还是启动不成功!!!

解决方法:

  修改my.in配置文件

    进入mysql安装目录

    编辑my.ini

    在[mysqld]下添加skip-grant-tables,保存即可。


  使用管理员身份打开命令行

  ①重启mysql:

    1、net stop mysql    2、net start mysql  


  ②进入mysql,登录
    mysql -u root -p
    不用输入密码,直接回车(出现Enter Password 也一样直接回车,即可登陆成功)


  ③输入use mysql,修改root的密码:
    update user set authentication_string=password('1234') where user='root';
    flush privileges;


  ④退出:

    quit;


  ⑤再次重启mysql:

    1、net stop mysql     2、net start mysql


  ⑥测试是否成功就是是否登陆成功咯:
    mysql -u root -p

    Enter Password>'1234'

  就不会出错,可以登录啦!!!

(另外一种情况就是,,你密码输入错误了,如果是初始化后第一次登录,出现这种情况的话,很大概率就是密码错误,初始化后的密码要认真查看,可能会因为空格、小数点等符号输错)

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/254374.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

提高软件交付速度的6种架构策略

本文向您展示如何评估软件交付性能,并向您介绍可用于提高软件交付性能的六种策略。 如何评估软件的交付速度 软件交付速度能够促进业务发展,那么我们如何评估软件的交付速度呢?主要有以下4个指标 一个功能从开发到上线运营使用需要多久&#…

代码随想Day39 | 62.不同路径、63. 不同路径 II

62.不同路径 每次向右或者向下走两个选择,定义dp数组dp[i][j] 为到达索引ij的路径和,状态转移公式为 dp[i][j]dp[i-1][j]dp[i][j-1],初始状态的第一行和第一列为1,从左上到右下开始遍历即可。详细代码如下: class Sol…

问卷调查结果分析指南:方法与技巧解析

问卷调查是一种常见的数据收集方式,广泛用于市场调研、科研、员工幸福评估等各个领域。但是,问卷的数据收集只是第一步,分析这种数据至关重要。问卷调查该怎么分析结果?首先要进行数据清理,然后对数据展开叙述&#xf…

基于Java Web的“大学生艺术节”管理系统的设计与实现论文

摘 要 互联网发展至今,无论是其理论还是技术都已经成熟,而且它广泛参与在社会中的方方面面。它让信息都可以通过网络传播,搭配信息管理工具可以很好地为人们提供服务。针对“大学生艺术节”方面的信息管理混乱,出错率高&#xff…

自动化测试Selenium node 配置

查看自己chrome浏览器的版本 下载chromedriver对应版本,下载当前版本中最大版本。 https://npm.taobao.org/mirrors/chromedriver 安装java jdk ,版本至少1.7, 并配置jdk环境变量 以下2个文件放在同一个目录下 Cmd地址切换到第四点目录下,然…

Spark基础入门

spark基础入门 环境搭建 localstandlonespark ha spark code spark corespark sqlspark streaming 环境搭建 准备工作 创建安装目录 mkdir /opt/soft cd /opt/soft下载scala wget https://downloads.lightbend.com/scala/2.13.12/scala-2.13.12.tgz -P /opt/soft解压scala…

setXxx getXxx 封装

1.封装介绍 封装(encapsulation)就是把抽象出的数据[属性]和对数据的操作[方法]封装在一起,数据被保护在内部,程序的其它部分只有通过被授权的操作[方法],才能对数据进行操作。 2.封装的理解和好处 (1)隐藏实现细节 方法(连接数据库)<-----调用(传入参数...) 只负责调…

【真情流露】我为什么要写一本OpenCV C++书籍

使用OpenCV契机 大家好&#xff0c;我是贾志刚&#xff0c;OpenCV学堂公众号的号主&#xff0c;从2009年开始搞图像处理到今天我已经十四年了。刚开始搞图像处理做的是生物数据分析与细胞分析&#xff0c;用的是工具跟SDK是ImageJ这个框架&#xff0c;多数算法都是我自己裸写&…

借助图形控件Aspose.Tasks,在 C# 中将 XER 转换为 SVG

Primavera P6 是一款流行的项目管理软件&#xff0c;它使用XER 文件格式来存储项目数据。 SVG&#xff08;即可缩放矢量图形&#xff09;是一种流行的矢量图像格式&#xff0c;可用于为 Web 和打印应用程序创建可缩放图形。在某些情况下&#xff0c;我们可能需要以编程方式将 P…

深度学习笔记_6经典预训练网络LeNet-18解决FashionMNIST数据集

1、 调用模型库&#xff0c;定义参数&#xff0c;做数据预处理 import numpy as np import torch from torchvision.datasets import FashionMNIST import torchvision.transforms as transforms from torch.utils.data import DataLoader import torch.nn.functional as F im…

算法模板之双链表图文详解

&#x1f308;个人主页&#xff1a;聆风吟 &#x1f525;系列专栏&#xff1a;算法模板、数据结构 &#x1f516;少年有梦不应止于心动&#xff0c;更要付诸行动。 文章目录 &#x1f4cb;前言一. ⛳️使用数组模拟双链表讲解1.1 &#x1f514;为什么我们要使用数组去模拟双链表…

全国巡展“2024人工智能展·世亚智博会”3月上海·4月杭州·6月北京

近年来&#xff0c;我国积极布局人工智能产业&#xff0c;竞跑“未来赛道”。随着各行业、各领域对人工智能需求的日益增长&#xff0c;与实体经济深度融合的新模式不断涌现&#xff0c;形成了具有中国特色的研发体系和应用生态&#xff0c;引领着经济社会各领域从数字化、网络…

YOLOv3-YOLOv8的一些总结

0 写在前面 这个文档主要总结YOLO系列的创新点&#xff0c;以YOLOv3为baseline。参考(抄)了不少博客&#xff0c;就自己看看吧。有些模型的trick不感兴趣就没写进来&#xff0c;核心的都写了。 YOLO系列的网络都由四个部分组成&#xff1a;Input、Backbone、Neck、Prediction…

高新技术企业工时管理的挑战与应对策略

随着科技的飞速发展&#xff0c;高新技术企业已成为推动社会进步的重要力量。而在这类企业中&#xff0c;工时管理作为企业管理的重要组成部分&#xff0c;其意义也日益凸显。有效的工时管理不仅关乎企业的项目进度、人力掌控和资源合理配置&#xff0c;还直接影响到企业的研发…

centos7服务器上的文件上传到谷歌云盘(google drive)

1,下载gdrive客户端&#xff0c;Releases glotlabs/gdrive GitHub 2&#xff0c;下载完解压,并移动到cp gdrive /usr/local/bin/ 3&#xff0c;查看是否安装成功 4,添加账户&#xff0c;gdrive account add 根据链接&#xff0c;创建Client id和 Client secret 5,填写Client…

spring boot 配置多数据源 踩坑 BindingException: Invalid bound statement (not found)

在上一篇&#xff1a;《【已解决】Spring Boot多数据源的时候&#xff0c;mybatis报错提示&#xff1a;Invalid bound statement (not found)》 凯哥(凯哥Java) 已经接受了&#xff0c;在Spring Boot配置多数据源时候&#xff0c;因为自己马虎&#xff0c;导致的一个坑。下面&a…

SEO专业人士成功所需的8大技能

你有能力在SEO领域建立职业生涯吗&#xff1f;您需要某些技能才能成功。在这里了解这些技能是什么。 尽管SEO已经存在了几十年&#xff0c;但许多大学仍然没有教授SEO&#xff0c;也没有在大多数营销课程中提及。 SEO专业人士来自不同的背景。有些是程序员&#xff0c;有些是…

IDA PRO 0A - 交叉引用

本文将讨论IDA中的交叉引用的相关知识。 更多c逆向知识可以看B站的课程《C 反汇编基础教程(IDA Pro Visual Studio)》 交叉引用 IDA 中的交叉引用通常简称为xref 。从名字可以看出&#xff0c;使用快捷键就可以找出某个函数或者数据被引用的地方。 在IDA 中有两类基本的交叉引…

NSSCTF第16页(3)

[SWPUCTF 2023 秋季新生赛]ez_talk 上传一句话木马得到 抓包改文件类型 上传成功&#xff0c;只是倒序而已 得到flag [第五空间 2021]PNG图片转换器 这道题采用的是ruby语言&#xff0c;第一次听说 2021-第五空间智能安全大赛-PNG图片转换器 | 管道符与反引号的配合、open…

使用python实现链表

手写代码 class Node(object):def __init__(self, item):self.item itemself.next Noneclass LinkListFunction(object):"""此对象为Node对象的方法类"""def __init__(self):self.linklistlength 0 # 当前链表的长度def create_linklist_he…