详情请咨询QQ:3494317897 微信:aopy98
《大数据计算技术Ⅱ》课程在线作业2 试卷总分:100 得分:100 一、单选题 (共 4 道试题,共 20 分) 1.美国政府在哪一年推出“大数据的研究和发展计划”: A.2010 B.2011 C.2012 D.2013
2.下列哪一个大数据属性是用来衡量价值的: A.volume B.Variety C.Velocity D.Value
3.下列不属于列存储格式特征的: A.基于主键存储 B.基于键值对存储 C.采用非关系型模型 D.查询效率优于按行存储
4.下列不属于NOSQL数据库的是: A.SQL数据库 B.列存储数据库 C.文档数据库 D.图形数据库
二、多选题 (共 3 道试题,共 15 分) 5.下列属于数据噪声处理方法的是: A.分箱算法 B.平滑算法 C.聚类算法 D.回归算法
6.下列属于缺失值处理方法的是: A.忽略该记录 B.使用默认值 C.使用同类样本平均值 D.随机产生缺失值的补充
7.下列关于监督学习的描述,不正确的是 A.在监督学习中,输入变量与输出变量可以是连续的,也可以是离散的 B.在监督学习中,输入变量与输出变量只能是连续的 C.在监督学习中,输入变量与输出变量只能是离散的 D.若输入变量与输出变量均为连续变量,则称为分类
三、判断题 (共 13 道试题,共 65 分) 8.merge默认对数据表进行内连接
9.读取CSV文件不可以采用读取txt文件的函数
10.replace方法不支持一次性替换多个值
11.DataFrame每一列必须都是类型相同的值
12.scikit-learn 是机器学习领域的一个商用库
13.HDFS提供了HBase的底层数据存储结构
14.join默认对数据表进行内连接
15.ndarray对象的属性包括数组轴的个数
16.在创建数组类型时,可以按照特定的格式进行显示
17.NumPy运算符dot函数是按元素相乘进行计算的
18.完全不拷贝可以简单地对数组进行赋值,而不需要拷贝数组对象的数据。
19.Pandas只能处理按照时间序列排列的数据
20.Mapper执行map task,将输出结果写入中间文件 奥鹏,国开,广开,电大在线,各省平台,新疆一体化等平台学习
详情请咨询QQ:3494317897 微信:aopy98 |