当前位置: 主页 > 认证中心 > 报考指南 >

CDA数据分析师等级考试模拟题库

时间:2014-12-27 来源:广东数据分析师网 浏览数:
Level 1

1、分析教师和会计师之间收入的差异,选择什么分析方法最合适?
A、卡方分析
B、方差分析
C、两样本T检验
D、相关系数
答案C
 
2、分析购买不同产品的频次时,使用以下哪个任务?
A、列表数据
B、汇总表
C、汇总统计量
D、单因子频数
答案D 
 
2、分析购买不同产品的频次时,使用以下哪个任务?
A、列表数据
B、列表报表
C、汇总统计量
D、单因子频数
答案D
 
3、以下哪个语句可以将字符型数值date(示例:“2001-02-19”)转换为数值类型?
A、INPUT(date,YYMMDD10.)
B、PUT(date,YYMMDD10)
C、INPUT(date,YYMMDD10.)
D、PUT(date,YYMMDD10)
答案A
 
4、来自于总体的样本最主要的属性是什么?
A、随机
B、有代表性
C、正态分布
D、连续分布
答案B
 
5、D—W统计量用于什么检验?
A、异方差
B、自相关
C、解释变量线性相关
D、扰动项不服从正态分布
答案B
 
6、什么统计量用于检验解释变量之间线性相关?
A、标准化的残差
B、D—W统计量
C、Cook's D
D、膨胀系数
答案D
 
7、连续变量右偏的情况下,中位数在均值的?
A、左边
B、右边
C、相等
D、无法判断
答案A
 
8、代表变量离散程度的指标是?
A、均值
B、标准差
C、最大值
D、中位数
答案B
 
9、解释变量是多分类变量,被解释变量是连续变量,使用什么分析方法?
A、卡方分析
B、方差分析
C、两样本T检验
D、相关系数
答案B
 
10、如果在方差分析中有20个观察值,你要计算残差。那么以下哪个值会是残差和?
A、-20
B、0
C、400
D、从已知信息中无法推断
答案B
 
11、要进行一项研究,比较男女月均信用卡支出。可能使用哪一种统计方法?
A、双样本T检验
B、双样本T检验和单因素方差分析
C、单因素方差分析
D、双因素方差分析
答案B
 
12、你运用线性回归任务进行回归,Y是因变量,X1是唯一解释变量。如果X1的参数估计(斜率)是0,那么当X1=13时,Y的最佳预测值是?
A、13
B、Y的均值
C、0
D、X1的均值
答案B 
 
13、方差分析表中哪个统计量是用于检验总体模型假设的?
A、F
B、t
C、R2
D、Adjusted R2
答案A 
 
14、当你用跑步时间(RunTime)、年龄(Age)、跑步时脉搏(Run_Pulse)以及最高脉搏(Maximum_Pulse)作为预测变量来对耗氧量(Oxygen_Consumption )进行回归时,年龄(Age)的参数估计是-2.78. 这意味着什么?
A、年龄每增加一岁,耗氧量就增大2.78.
B、年龄每增加一岁,耗氧量就降低2.78.
C、年龄每增加2.78岁,耗氧量就翻倍。
D、年龄每减少2.78岁,耗氧量就翻倍。
答案B
 
15、在不同解释变量数量不同的模型中,以下哪个指标对选择模型没有作用?
A、R2
B、Adjusted R2
C、Mallows’Cp
D、AIC
答案A 
 
16、在线性回归模型中,假设预测变量是正态分布的。
A、对      
B、错
C、不知道
答案B
 
17、在标准正态分布的属性下,预期95%的学生化残差处于哪两个值之间?
A、-3 和 3
B、-2 和 2
C、-1 和 1
D、0 和 1
答案B
 
18、共线性违反了以下哪一假设?
A、误差独立
B、方差不变
C、误差正态分布
D、以上均不是
答案D 
 
19、当样本量减小时,以下哪个情况会发生?
A、卡方值增大。
B、P值增大。
C、Cramer’s V 增大。
D、Odds Ratio增大。
答案B 
 
20、研究者想测量两个二元变量间的相关性强度。他该使用以下哪个统计量?
A、Hansel 和 Gretel 相关系数
B、Mantel-Haenszel 卡方检验
C、Pearson卡方检验
D、Spearman 相关系数
答案D 
 
21、ROC曲线凸向哪个角,代表模型约理想?
A、左上角
B、左下角
C、右上角
D、右下角
答案A
 
22、添加”分配项目逻辑库“在哪个菜单下?
A、文件
B、编辑
C、任务
D、工具
答案D
 
23、来自于总体的样本最主要的属性是什么?
a.随机
b.有代表性
c.正态分布
d.等概率
(B)
 
24、如果硬币是均匀的,掷100,有可能100次都是正面吗?
a.是
b.否
c.不确定
(A)
 
25、满足以下什么条件可以保证样本均值渐进服从正态分布?
i总体服从正态分布
ii样本量足够大
iii样本的标准差很小
a.i&ii
b.i&iii
c.ii&iii
d.i&ii&iii
(A)
 
26、在假设检验中,什么因素影响alpha的取值
a.检验的P-VALUE
b.样本量
c.以上两者
d.以上都不是
(D)
 
27、数据分析能力有几个层次?
a.5
b.6
c.7
d.8
(D)
 
28、数据挖掘模型有几大类?
a.1
b.2
c.3
d.4
(B)
 
29、客户画像可以使用哪种分析方法?
a.聚类
b.因子分析
c.两者都可以
d.两者都不可以
(C)
 
30、逻辑回归属于哪个数据挖掘方法类别?
a.有监督
b.无监督
c.两者都是
d.两者都不是
(C)
 
30、个体之间的相似性主要用哪种数据挖掘方法?
a.聚类
b.因子分析
c.关联规则
d.社交网络分析
(A)
 
31、变量之间的相关性主要用哪种数据挖掘方法?
a.聚类
b.因子分析
c.关联规则
d.社交网络分析
(B)
 
32、商品之间的相关性主要用哪种数据挖掘方法?
a.聚类
b.因子分析
c.关联规则
d.社交网络分析
(C)
 
33、客户之间的联系主要用哪种数据挖掘方法?
a.聚类
b.因子分析
c.关联规则
d.社交网络分析
(D)
 
34、线性回归和逻辑回归的主要区别?
a.解释变量类型不同
b.被解释变量类型不同
c.两者都不同
(B)
 
35、变量测量类型有几种?
a.1
b.2
c.3
d.4
(C)
 
36、民族是什么测量类型的变量?
a.名义
b.等级
c.连续
d.以上都不是
(A)
 
37、身高是什么测量类型的变量?
a.名义
b.等级
c.连续
d.以上都不是
(C)
 
38、等级变量和连续变量的区别?
a.排序是否有意义
b.差值是否有意义
c.是否有绝对的“0”点
d.以上都不是
(B)
 
39、连续变量用什么图形描述其分布情况?
a.直方图
b.盒须图
c.以上都是
d.以上都不是
(C)
 
40、累积频次和累积百分比对什么变量有意义?
a.连续变量
b.等级变量
c.名义变量
d.以上都不是
(B)
 
41、盒须图的中间粗线代表什么统计量?
a.均值
b.中位数
c.众数
d.以上都不是
(B)
 
42、连续变量的什么统计量对中心水平最有代表意义?
a.均值
b.中位数
c.众数
d.以上都不是
(B)
 
42、反映连续变量离散程度的是什么统计量?
a.均值
b.方差
c.偏度
d.峰度
(B)
 
43、什么统计量反映连续变量的中心水平?
a.均值
b.方差
c.偏度
d.峰度
(A)
 
44、什么统计量对评估连续变量的中心水平的代表能力?
a.均值
b.方差
c.偏度
d.峰度
(B)
 
45、什么统计量用于决策选择均值还是中位数作为中心水平的统计量?
a.均值
b.方差
c.偏度
d.峰度
(C)
 
46、连续变量右拖尾,其偏度如何?
a.大于0
b.小于0
c.以上都有可能
d.以上都不是
(A)
 
47、标准差的量纲是什么?
a.原始变量量纲的平方
b.原始变量量纲
c.没有量纲
d.以上都不是
(B)
 
48、正态分布2倍标准差曲线下面积是多少?
a.99%
b.68%
c.95%
d.以上都不是
(C)
 
49、以下哪个分布的右偏最严重?
a.正态分布
b.泊松分布
c.伽玛分布
d.对数正态分布
(D)
 
50、保险理赔数额分析经常用到哪个分布?
a.正态分布
b.泊松分布
c.伽玛分布
d.对数正态分布
(C)
 
51、分析网页点击数量经常用到哪个分布?
a.正态分布
b.泊松分布
c.伽玛分布
d.对数正态分布
(B)
 
52、收入变量分布一般的偏度如何?
a.大于0
b.小于0
c.以上都有可能
d.以上都不是
(A)
 
53、股票收益变量分布一般的峰度如何?
a.大于0
b.小于0
c.以上都有可能
d.以上都不是
(A)
 
54、精准营销模式和传统营销模式的主要区别体现在?
a.以产品为中心
b.以客户为中心
c.以上都是
d.以上都不是
(A)
 
55、客户生命周期一般分几个阶段?
a.2
b.3
c.4
d.5
(D)
 
56、RFM方法中的M指什么?
a.最近一次消费时间到统计时间的间隔
b.统计区间的购买频次
c.统计区间的消费金额
d.以上都不是
(C)
 
57、探索两个连续变量之间关系的图形方法是?
a.散点图
b.分类盒须图
c.经验Logit曲线
d.分类条形图
(A)
 
58、探索一个分类变量对一个连续变量之间关系的图形方法是?
a.散点图
b.分类盒须图
c.经验Logit曲线
d.分类条形图
(B)
 
59、两个连续变量之间没有关系的图形散点图是?
I.圆球状分布
II.水平或纵向的带状分布
III.斜向上的椭圆
IV.斜向下的椭圆
a.I ; b.II; c.I、II; d.II、IV
(C)
 
60、两个连续变量之间的散点图是完整的二次曲线,则皮尔森相关系数为?
a.大于0
b.小于0
c.等于0
d.以上都有可能
(C)
CDA快速通道