网友您好, 请在下方输入框内输入要搜索的题目:
题目内容
(请给出正确答案)
4、在实际环境下,很多数据集都包含缺失数据,对于缺失数据的处理常用的方法包括以下哪几种?
A.删除缺失记录
B.固定值填充
C.未缺失平均值填充
D.未缺失众数
参考答案和解析
缺失作为属性的一个取值;利用模型预测缺失值
更多 “4、在实际环境下,很多数据集都包含缺失数据,对于缺失数据的处理常用的方法包括以下哪几种?A.删除缺失记录B.固定值填充C.未缺失平均值填充D.未缺失众数” 相关考题
考题
若处理调查数据时发现有缺失数据,且样本量很大,有缺失数据的个案比例较小,有缺失数据的个案与无缺失数据的个案在分布上无显著差异时,可以( )。
A. 将有缺失的个案整个删除B. 将有缺失的个案保留,仅在计算时删除相应变量的缺失值C. 使用均值代替、回归估计、随机抽取、最近距离确定等方法代替缺失值D. 通过对调查中的回答数据使用加权因子,对数据进行调整,减少缺失值的影响
考题
对于脱落/缺失数据的应对,以下说法错误的是()。
A、在方案或者SAP中提前考虑缺失数据的处理B、医学监查,数据审核,统计师参与判断受试者,能否进入最终的分析集C、在统计分析时候,根据缺失数据的缺失机制,考虑数据的填补规则D、基于原方案的设计,揭盲后评价追加样本量
考题
在对历史数据集进行分区之前进行数据清洗(缺失值填补等)的缺点是什么()A、违反了建模的假设条件B、加大了处理的难度C、无法针对分区后各个数据集的特征分别做数据清洗D、无法对不同数据清理的方法进行比较,以选择最优方法
考题
单选题在TRAS系统中,对于指定的若干报表期,筛选出其报表户的交集——也就是这些期都包含的报表户,组成一个单独的数据集,称为()。A
汇总数据集B
普通数据集C
同户数据集D
主数据集
考题
单选题在对历史数据集进行分区之前进行数据清洗(缺失值填补等)的缺点是什么()A
违反了建模的假设条件B
加大了处理的难度C
无法针对分区后各个数据集的特征分别做数据清洗D
无法对不同数据清理的方法进行比较,以选择最优方法
热门标签
最新试卷