详情请咨询QQ:3494317897 微信:aopy98
《大数据计算技术Ⅱ》课程在线作业1 试卷总分:100 得分:100 一、单选题 (共 5 道试题,共 25 分) 1.下列哪一个大数据衡量单位最大: A.EB B.ZB C.PB D.TB
2.下列哪一个大数据属性是用来衡量价值的: A.volume B.Variety C.Velocity D.Value
3.下列不属于大数据计算体系三个基本层次的: A.数据存储系统 B.数据处理系统 C.数据应用系统 D.数据传输系统
4.下列不属于NOSQL数据库的是: A.SQL数据库 B.列存储数据库 C.文档数据库 D.图形数据库
5.下列不属于大数据开源技术解决方案的 A.HDFS B.Hbase C.MapReduce D.Colossus
二、多选题 (共 2 道试题,共 10 分) 6.下列属于数据处理算法的 A.回归分析 B.聚类算法 C.关联规则算法 D.排序算法
7.下列属于缺失值处理方法的是: A.忽略该记录 B.使用默认值 C.使用同类样本平均值 D.随机产生缺失值的补充
三、判断题 (共 13 道试题,共 65 分) 8.ICDM会议评选的十大经典算法包括C4.5算法、k-均值算法、支持向量机、Apriori算法、EM算法、PageRank算法、AdaBoost算法、k-临近算法、朴素贝叶斯算法和回归树算法。
9.读取CSV文件不可以采用读取txt文件的函数
10.ndarray对象的属性包括数组轴的个数
11.DataFrame每一列必须都是类型相同的值
12.Hadoop基于HDFS/HBase的数据存储系统
13.一个HDFS文件可以按Split形式进行物理存储
14.KNN算法无需通过学习得到决策函数。
15.PageRank用来解决链接分析中网页排名的问题
16.读取文本常用函数包括write
17.要把数据写入txt文件,必须创建file对象
18.连接数据库时需要设置服务器的名称
19.连接数据库时需要设置服务器的地址
20.merge默认对数据表进行内连接 奥鹏,国开,广开,电大在线,各省平台,新疆一体化等平台学习
详情请咨询QQ:3494317897 微信:aopy98 |