1.下列图表中,能够识别异常值的是()
2.下列选项中,用于绘制单变量分布的函数是()
3.下列函数中,可以没置当前图形轴范围的是
4.下列函数中,可以为图表设置标题的是()。
5.下列pyplot模块的函数中,可以绘制散点图的是()。
6.下列图表中,可以清淅地反映出各数据系列的百分比情况的是()
7.下列图表中,适用于比较跨类别数据的是
8.下列函数不是控制坐标轴属性的是()。
9.下列描述有误的是()。
A基本流程:创建画布,绘制图形,保存展示图形
B必须先保存图形才能展示图形
C添加图例必须在绘制图形之后
D创建子图时,默认会根据画布的大小平均分配
10.在不使用辅助库的情况下,Matplotlib不能绘制的图形是(。
11.以下正则表达式中,属于非贪婪匹配,且允许出现0次的是()。
12.正则表达式R[0-9]{4},能匹配出一下哪个字符串()。
13.以下哪个不属于HTTP协议的请求方式()。
14.可以通过哪种方式绕过网站登录()。
15.HTTP常用状态码表明服务器正忙的是()。
16.采用以下()技术可以实现异步加载。
17.下列不属于Scrapy框架的基本组成部分的是()
18.Requests模块中,headers参数的作用是()。
19.下列对于Scrapy常用命令及其作用描述正确的是()。
20.下列对于Scrapy爬虫项目目录说法错误的是()。
21.http协议中有get方法和post方法。()
22.爬虫必须用python编写。()
23.通用网络爬虫通常采用串行工作方式。()
24.需要登录的网站一般通过GET请求就可以实现登录。()
25.requestst中get请求方法的使用为requests..get('网址',data=data)。()
26.所有的异步加载都会向后台发送请求。()
27.htp状态码中表示访问成功的是()。
28.一个网址中的HOST实际上是一个()。
29.下列不属于常见爬虫类型的是()。
30.下列不属于聚焦网络吧虫的常用策略的是
31.下列不属于常用反吧虫手段的是()。
32.下列属于反爬虫目的的是()。
33.下列关于Python爬虫库的功能,描述不正确的是()。
34.下列不属于Socket库中的方法是()。
35.下列属于HTTP必须实现的请求方法的是()。
36.下列关于HTTP状态码类型描述错误的是()。
37.下列有关Cookie机制描述错误的是()。
38.下列关于Chrome开发者工具描述错误的是()。
39.简易采集模式是利用系统内置模板进行数据采集的模式。
40.数据采集器是进行数据采集的机器或者工具。
41.常见的爬虫语言有()。
42.下列关于JSON模块描述错误的是()。
43.下列不属于动态网页的是()。
44.下列Selenium库的方法中,通过元素名称进行多元素定位的是()。
45.下列连接MongoDB数据库的代码中,错误的
46.表单登录需要使用的请求方法是()。
47.使用Requests库配置代理IP发送请求的参数是()。
48.获取代理IP的方法有()。
49.Requests库甲携带Cookie友送请求的参数是cookies,它接收的数据类型包括()。
50.关于LWPCookie]ar对家,下列说法错误的是
51.下列对于Scrapy数据流向描述错误的是
A.引擎仅需要负责打开一个网站,并找到该网站的Spiders,并向该Spiders请求第一个要爬取的URL
B.调度器返回下一个要爬取的URL给引擎,引擎将URL通过下载器中间件(请求方向)转发给下载器(Downloader)
C.Spiders处理响应并返回爬取到的tems及(跟进的)新的请求给引擎解析中间件
D.一旦网页下载完毕,下载器会生成一个该网页的响应,并将其通过下载器中间件(返回响应方向)发送给引擎
E.46
52.下列对于Scrapy的设置说法错误的是()。
A.Scrapy设置允许自定义所有Scrapy组件的行为,包括核心、扩展、管道和爬虫本身
B.DOWNLOAD DELAY设置能够限制爬取的速度
c.HTTPCACHE ENABLED设置能够启用HTTP缓存,并设置路径
D.DOWNLOADER MIDDLEWARES设置能够激活用户定制的下载器中间件
E.47
53.以下选项中合法的是()。
A.爬取百度的搜索结果
B爬取淘宝的商品数据
C.出售同学的个人信息
D.为高利贷提供技术服务
E.48
54.下列关于循环控制语句的说法正确的是()。
A.breaki语句的作用是终止整个程序
B.continue语句的作用是终止整层循坏
C.pass语句的作用是终止一层循环中的某一次循环
D.break和continue语句采用不同方式终止循环,Pass语句仅仅是一个占位符
55.以下选项中不是Python数据分析的第三方库的是
A.numpy
B.scipy
C.pandas
D.requests
56.下列关于groupby(O方法的说法中,描述正确
的是()
A.用于将数据集实现分组与聚合操作
B调用groupby()方法返回一个DataFrameBy对象
C.调用groupby(方法返▣一个GroupBy对象
D.groupby()方法只能将数据集按照纵轴方向进行分组
57.关于apply()方法的功能,下列选项中说法正确的是()
A.apply()方法是对DataFramet每一个元素应用某个函数
B.apply()方法能够实现所有agg方法的功能
C.apply()方法和map方法都能够进聚合操作
D.apply()方法只能够对行列进行操作
58.关于创建ndarray?对象。下列描述错误的是
A.使用list()函数可以创建一个ndarray?对象
B.通过ones(0函数创建元素值都为1的数组
C.ndarrayx对象可以使用array()函数创建
D.通过zeros()函数创建元素值都是0的数组
59.下列关于数据预处理的说法中,描述不正确的是()
A.数据清洗的目的是为了提高数据质量
B.异常值不一定要删除
C.通过drop_duplicates(O方法可以删除重复数据
D.concat()函数可以根据一个或多个键将不同的DataFrame进行合并
60.下列选项中,关于duplicated()方法描述正确的是()。
A.duplicate()方法用于删除重复值
B.duplicate(O方法用于标记重复值
C.duplicate(O方法会改变原始数据
D.duplicate(O方法会将重复的数据标记为False
61.关于Series结构,下列描述正确的是()。
A.Series是一个类似于二维数组的对象
B.Series由一组数据和与之相关的索引两部分构成
C.Series只能保存整数和字符串类型的数据
D.Series的索引默认是从1开始
62.以下选项中,Pyhon使用矩阵运算是调用的第三方库是()。
A.turtle
B.matplotlib
C.numpy
D.time
63.下列关于def语句与lambda语句的说法错误的
是()。
A.def语句允许传入多个参数,输出多个返回值
B.无返回值的def语句也可能输出信息
C.lambda语句只能是单行的形式
D.lambda语句不支持嵌入结构体
64.以下函数中不具备排序功能的是()。
A.sort
B.argsort
C.lexsort
D.extract
65.Series能够接收的数据类型不包括().
A.dict
B.list
C.array
D.Set
66.删除DataFrame数据的方法不包括()。
A.drop
B.pop
C.del
D.remove
67.关于索引对象,下列说法错误的是()。
A.可通过Series:接收索引参数并进行创建
BMultiIndex是层次化索引对象
C.索引对象可以修改
D.isin是索引对象的一种方法
68.关于agg方法,下列说法错误的是O。
A.返回标量值和数组
B.可接收Numpyi函数
C.可对分组的不同列指定作用的函数
D.可同时接收多个函数
69.np.array([1,2,3],[4,5,6])属于几维数组.
A.1
B.2
C.3
70.数据集的划分可以分为哪几个部分()。
A.训练集
B.测试集
C.验证集
D.以上都是
71.不是python中文件写操作方法的是(O。
A.writelines
B.write
C.write和seek
D.writetext
72.关于Python文件处理,以下选项中描述错误的是()
A.Python能处理JPG图像文件
B.Python不可以处理PDF文件
C.Python能处理CSV文件
D.Python能处理Ecel文件
73.关于import圬引用,以下选项中描述错误的是()
A.使用importturtle引入turtle库
B.可以使用fromturtleimportsetup引l入turtle库
C.使用importturtleast引l入turtle库,取别名为t
D.import保留字用于导入模块或者模块中的对像
74.以下文件操作方法中,不能从train.csv格式文件中读取数据的是()。
A.readline
B.readlines
C.read
D.seek
75.关于Series索引方式错误的是()。
A.s[0:2]
B.s[2]
C.s[s>2]
D.s[s=2]
76.关于find和index函数的说法,下列描述错误的是()
A.find函数没有找到时会抛出异常
B.两个都拥有检测某个字符串包含子串
C.都支持指定搜索范围
D.默认查找的范围均为整个长度
77.下列选项中,布尔值为True的是()。
A.1
B.None
C.{}
78.以下关于drop_duplicates函数的说法中错误的是()
A.仅对DataFrame和Series类型的数据有效
B.仅支持单一特征的数据去重
C.数据重复时默认保留第一个数据
D.该函数不会改变原始数据排列
79.以下关于缺失值检测的说法中,正确的是
A.nul和notnull可以对缺失值进行处理
B.dropna方法既可以删除观测记录,亦可以删除特征
C.fillna方法中用来替换缺失值的值只能是数据框
D.pandas库中的linterpolate模块包含了多种插值方法
80.下列不属于数组属性的是()。
A.ndim
B.shape
C.size
D.add
81.下列选项中,用来表示Pandast中的时期的是
A.Period
B.Timestamp
C.Interval
D.Series
82.关于分组聚合过程的说法中,下列描述不正确的是
A.拆分是指将数据集按照一些标准拆分为若干个组
B.应用是指将某个函数或方法应用到每个分组
C.合并是指将产生的新值整合到结果对象中
D.只能对纵轴方向上的数据进行分组
83.关于agg方法的使用中,下列描述错误的是
A.agg()方法中func参数只能传入一个函数
B.agg0方法中func参数可以传入多个函数
C.agg()方法中func参数可以传入自定义函数
D.agg()方法不能对产生的标量值进行广播
84.下列选项中,不属于groupby()方法分组方式的是()。
A.列表或数组
B.DataFrame中某列的名称
C.字典或Series
D.集合
85.关于transform()方法的说法中,下列描述错误的是()
A.transform方法可以使用广播
B.使用transform()方法可以返回一个与分组大小相等的数组
C.transform()方法只能使用内置方法对数据进行转换操作
D.transform()方法对DataFrame和Series都适用
86.关于groupby()方法的返回值,下列说法错误的是()
A.groupby()方法返▣的是一个GroupBy对象
B.返回的GroupByi对象采用的是惰性计算
C.使用or循环可以遍历该对象中的分组信息
D.groupby()方法没有返回值
87.下列关于Pandas)库的说法中正确的是()
A.Pandas中只有两种数据结构
B.Pandas不支持读取文本数据
C.Pandas是在NumPy基础上建立的新程序库
D.Pandas中Series和DataFrame可以解决数据分析中一切的问题
88.在进行算术运算时,如果希望一次性输出多个统计指标可以使用()方法。
A.statistics()
B.describe()
C.all()
D.sresults()
89.关于Pandast中数据排序,下列说法正确的是
A.即可以按照行索引排序,也可以按照列索引排序
B.sort_index()方法表示按照值进行排序
C.sort_values()方法表示按照索引进行排序
D.默认情况下,sort_index)方法按照降序排列
90.下列关于DataFramei说法正确的是()。
A.DataFrames结构是由索引和数据组成
B.DataFrame的行索引位于最右侧
C.创建一个DataFrame对象时需要指定索引
D.DataFrame每列的数据类型必须是相同的
91.下列选项中,不属于ndarray对象属性的是()
A shape
B.dtype
C.ndim
D.map
92.下列关于ndarray对象描述正确的是()。
A.ndarrayx对象中可以存储不同类型的元素
B.ndarray>对象中存诸元素的类型必须是相同的
C.ndarrayi对象不支持广播操作
D.ndarray>对象不具备矢量运算能力
93.在创建ndarrayx对象时,可以使用()参数来指定元素类型。
A.dtype
B.dtypes
C.type
D.types
94.关于数据分析的说法,下列描述错误的是
A.数据分析可以通过计算机工具和数学知识处理数据
B.可以做出具有针对性的决策
C.数据分析没有实际的使用意义
D.在大数据环境下,数据分析能够挖掘出更有价值的信息
95.Period对像不支持参与数学运算。
A.正确
B.错误
96.subplot(323)和subplot(3,2,3)是等价的。
A.正确
B.错误
97.agg()方法可以使用用户自定义的函数。()
A.正确
B.错误
98.使用Series)对象做为分组键时,必须保证Series对象的长度与被分组数组的长度相等。()
A.正确
B.错误
99.只要使用groupby(O方法分组,就会产生一个DataFrameGroupby对象。()
A.正确
B.错误
100.使用transform()方法进行聚合运算,所得对象的行索引与被分组对象的行索引大小一定相
等。()
A.正确
B.错误
101.groupby()方法可以将DataFramer中的某个列名做为分组键。()
A.正确
B.错误
102.使用merge()函数进行数据合并时,不需要指定合并键。()
A.正确
B.错误
103.dropna()方法可以删除数据中所有的缺失值。
A.正确
B.错误
104.rename()方法可以重命名索引名。()
A.正确
B.错误
105.缺失数据
106.通过merge()函数合并数据时可以指定多个键。
107.join方法
108.read_html()函数可以读取网页中所有的数据。()
109.Series是一个类似于一维数组的对象。
110.describe()方法可以一次性输出多个统计指标
111.DataFrame的结构是由索引和数据组成的。
112.Pandas既可以按照索引排序也可以按照数据排序。()
113.ndarray对象的数据类型可以通过type()方法进行转换。()
114.如果两个数组的形状不同,则它们是无法执行算术运算的。()
115.NuPy数组不需要循环遍历,即可对每个元素执行批量的算术运算操作。()
116.如果希望创建一个数组,则只能用array()函数实现。()
117.sort()方法可以对任何轴上的数据进行排序。
118.通过agg()方法进行聚合时只能接收单个函数。()
119.drop_duplicated(O方法可以删除重复值。()
120.Series和DataFrame都支持切片操作。()
121.在操作DataFrame对象时,可以通过指定索名的方式获取数据。()
122.Pandas只有Series和DataFramei两种数据结构。()
123.如果把年份字符串作为索引使用,则可以获取到属于这一年的所有数据。()
124.下列选项中,关于分组聚合描述正确的是
A.拆分是将数据集按照一些标准拆分为若干个组
B.应用是将某个函数或方法(内置和自定义均可)应用到每个分组
C.合并是将产生的新值整合到结果对象中
D.应用函数时只能使用pandasl内置的函数
125.下列关于apply)方法说法不正确的是()。
A.apply()方法是对DataFrame:每一个元素
应用某个函数
B.apply()方法可以实现transform(O方法所有的功能
C.apply()方法只能够对行列进行操作
D.对不同列数据应用不同函数
126.关于GroupByx对象,下列描述正确的是()
A.DataFrame经过分组后得到了一个DataFrameGroupBy>对象
B.Series经过分组后得到了一个SeriesGroupBy对象
C.能够直接查看结果
D.采用惰性计算
127.关于数组统计运算,下列说法中正确的是
A.sum()方法表示对数组中全部或某个轴向的元素求和
B.mean()方法表示计算平均值
C.argmin()方法表示计算数组中的最小值
D.argmax()方法表示计算数组中的最大值
128.下列关于多维数组切片的描述正确的是()
A.在选取元素时可以传入一个切片
B.在选取元素时可以传入多个切片
C.在选取元素时可以将切片与整数索引混合使用
D.在选取元素时不可以传入一个切片
129.下列关于groupby(O方法的使用,描述不正确的是()
A.分组键可以是一个Series对象
B.使用字典做为分组键时,对字典中的数据没有任何要求
C.函数不可以做为分组键
D.返回的结构能够直接查看
130.下列选项中,关于transform()方法描述不正确的是()
A.会对标量值产生广播操作
B.返回的数据可以与被分组数据形状相等
C.可以对每一列数据应用不同的函数
D.可以对不同的数据应用不同的函数
131.下列选项中,属于agg()方法使用方式的是
A.对每一列数据应用同一个函数
B.对某列数据应用不同的数据
C.对不同列数据应用不同函数
D.对结果进行广播操作
132.关于预处理中的数据合并,下列说法中错误的是()
A.concat()函数是最常用的主键合并函数,可以通过内连接和外连接的方式堆叠合并数据
B.merge()函数是最常用的主键合并的函数,但不能够通过左连接和右连接的方式合并数据
C.join()方法是最常用的主键合并方法之一,但不能够通过左连接和右连接的方式合并数据
D.combine_first()方法只适用于DataFrame对象
133.关于loc的说法不正确的是()。
A.既可以行索引,又可以列索引
B.不能使用标签索引
C.当传入的行索引位置或列索引位置为区间时其为前闭后开区间
D.可以接收Series
134.mergel函数用于主键合并,下列说法错误的是
A.on参数用于指定主键
B.sot参数为True时将对合并的数据进行排序
C.suffixes参数用于对重叠列加尾缀
D.join参数表示表连接的方式
135.关于drop_duplicatesi函数,下列说法中错误的是()
A.对Dataframe的数据有效
B.仅支持单一特征的数据去重
C.数据有重复时默认保留第一个数据
D.该函数不会改变原始数据排列
136.关于数据集划分,下列说法正确的是()。
A.训练集的数据总是越多越好
B.训练集与测试集的理想划分比例是5:5
C.庞大数据集的训练集与测试集的划分比例可以为9:5
D.训练集的数据量越大模型的泛化能力越好
137.表示数组维度的元组命令是()。
A.ndarray.ndim
B.ndarray.shape
C.ndarray..size
D.ndarray.dtype
138.创建指定数量等差数组的命令是()。
A.np.linspace()
B.np.arrange()
C.np.logspace()
D.np.array()
139.数组去重的命令正确的是()。
A.np.unique()
B.np.unipue()
C.np.uniqua()
D.np.uniquc()
140.数组类型修改的命令正确的是()。
A.ndarray.T
B.ndarray.resize()
C.ndarray.astype()
D.ndarray.reshape()
141.计算数组中间值的命令正确的是()。
A.min()
B.max()
C.mean()
D.median()
142.关于Matplotlib的说法中,下列描述正确的是
A,Matplotlib是一个Python3D绘图库
B.它使用简单,仅用几行代码就能生成各种图表
C.仅仅适用于IPython平台
D.只能输出PNG或PDF格式
143.绘图时显示图例的命令是()。
A.plt.plot
B.plt.legend
C.plt.legemd
D.plt.show
144.下列函数中,可以为图表设置图例的是()
A.legend()
B.xlim()
C.xlabel()
D.title()
145.下列参数中,调整后显示中文的是()。
A lines.kinestyle
B.lines.linewidth
C.font.sans-serif
D.axes.unicode_minus
146.描述全校男女同学的比例关系,最好使用()
A.柱形图
B.条形图
C.折线图
D.饼图
147.如果希望一次性创建一组子图,则可以通过
subplot()函数进行实现。()
148.直方图可以利用方块的高度来反映数据的差异。()
149.()处理的对像是非结构化的数据。所以,非结构化数据可视化通常是将非结构化数据转化为结构化数据再进行可视化显示。
A.科学可视化
B.信息可视化
C.图表可视化
D.数据可视化
147.()最简单的科学可视化方法是颜色映射法,它将不同的值映射成不同的颜色。
A.科学可视化
B.信息可视化
C.图表可视化
D.数据可视化
151.数据采集的数据对象类型包括()。
A.结构化数据
B.半结构化数据
C.非结构化数据
D.以上都是
152.数据采集的主要性能要求不包括以下的()。
A.全面性
B.安全性
C.多维性
D.高效性
153.大数据采集相对于传统数据采集的优势不包括
A.数据源广泛
B.安全性
C.速度有限
D.数据类型丰富
154.下面不属于Scrapy的组件的是()。
A.传感器
B.引擎
C.下载器
D.Spider
155.根据Web页面组成结构中的信息内容的生成方式不同,可将Web页面分为()大类。
A.静态页面
B.动态页面
C.伪静态页面
D.以上都不是
156.下列不属于HTTP头部类型的是()。
A.通用头
B.回复头
C.请求头
D.响应头
E.1
157.下列不属于HTTP请求过程的是()。
A.生成请求
B.超时设置
C.请求重定向
D.搜索文档
E.2