【作业】
1.19世纪以来,当面临大量数据时,社会都依赖于采样分析。但是采样分析是( )时代的产物。
A. 计算机
B. 青铜器
C. 模拟数据
D. 云
2.长期以来,人们已经发展了一些使用尽可能少的信息的技术。例如,统计学的一个目的就是( )。
A. 用尽可能多的数据来验证一般的发现
B. 用尽可能少的数据来验证尽可能简单的发现
C. 用尽可能少的数据来证实尽可能重大的发现
D. 用尽可能少的数据来验证一般的发现
3.因为大数据是建立在( ),所以我们就可以正确地考察细节并进行新的分析。
A. 掌握所有数据,至少是尽可能多的数据的基础上的
B. 在掌握少量精确数据的基础上,尽可能多地收集其他数据
C. 掌握少量数据,至少是尽可能精确的数据的基础上的
D. 尽可能掌握精确数据的基础上
4.直到今天,我们的数字技术依然建立在精准的基础上,这种思维方式适用于掌握( )的情况。
A. 小数据量
B. 大数据量
C. 无数据
D. 多数据
5.当人们拥有海量即时数据时,绝对的精准不再是人们追求的主要目标。当然,( )。
A. 我们应该完全放弃精确度,不再沉迷于此
B. 我们不能放弃精确度,需要努力追求精确度
C. 我们也不是完全放弃了精确度,只是不再沉迷于此
D. 我们是确保精确度的前提下,适当寻求更多数据
6.为了获得更广泛的数据而牺牲了精确性,也因此看到了很多无法被关注到的细节。( )。
A. 在很多情况下,与致力于避免错误相比,对错误的包容会带给我们更多问题
B. 在很多情况下,与致力于避免错误相比,对错误的包容会带给我们更多好处
C. 无论什么情况,我们都不能容忍错误的存在
D. 无论什么情况,我们都可以包容错误
7.以前,统计学家们总是把他们的兴趣放在提高样本的随机性而不是数量上。这是因为( )。
A. 提高样本随机性可以减少对数据量的需求
B. 样本随机性优于对大数据的分析
C. 可以获取的数据少,提高样本随机性可以提高分析准确率
D. 提高样本随机性是为了减少统计分析的工作量
8.研究表明,在少量数据情况下运行得最好的算法,当加入更多的数据时,( )。
A. 也会像其他的算法一样有所提高,但是却变成了在大量数据条件下运行得最不好的
B. 与其他的算法一样有所提高,仍然是在大量数据条件下运行得最好的
C. 与其他的算法一样有所提高,在大量数据条件下运行得还是比较好的
D. 虽然没有提高,还是在大量数据条件下运行得最好的
9.如今,要想获得大规模数据带来的好处,混乱应该是一种( )。
A. 不正确途径,需要竭力避免的
B. 非标准途径,应该尽量避免的
C. 非标准途径,但可以勉强接受的
D. 标准途径,而不应该是竭力避免的
10.研究表明,只有( )的数字数据是结构化的且能适用于传统数据库。如果不接受混乱,剩下( )的非结构化数据都无法被利用。
A. 95%,5%
B. 30%,70%
C. 5%,95%
D. 70%,30%
11.寻找( )是人类长久以来的习惯,即使确定这样的关系很困难而且用途不大,人们还是习惯性地寻找缘由。
A. 相关关系
B. 因果关系
C. 信息关系
D. 组织关系
12.在大数据时代,我们无需再紧盯事物之间的( ),而应该寻找事物之间的( ),这会给我们提供非常新颖且有价值的观点。
A. 因果关系,相关关系
B. 相关关系,因果关系
C. 复杂关系,简单关系
D. 简单关系,复杂关系
13.所谓相关关系,其核心是指量化两个数据值之间的数理关系。相关关系强是指当一个数据值增加时,另一个数据值很有可能会随之( )。
A. 减少
B. 显现
C. 增加
D. 隐藏
14.通过找到一个现象的( ),相关关系可以帮助我们捕捉现在和预测未来。
A. 出现原因
B. 隐藏原因
C. 一般的关联物
D. 良好的关联物
15.大数据时代,专家们正在研发能发现并对比分析非线性关系的技术工具。通过( ),相关关系帮助我们更好地了解了这个世界。
A. 探求“是什么”而不是“为什么”
B. 探求“为什么”而不是“是什么”
C. 探求“原因”而不是“结果”
D. 探求“结果”而不是“原因”