网友您好, 请在下方输入框内输入要搜索的题目:

第3章聚类分析答案

常用的聚类分析法有( )、系统聚类法、模糊聚类法等。

A.序贯聚类法

B.样品聚类法

C.相关聚类法

D.时间聚类法


正确答案:B


常用的聚类方法有样品聚类法、系统聚类法和( )

A、B两选项暂时没有

C.回归聚类分析

D.平共处模糊聚类法


正确答案:D


对离散变量进行聚类分析,确定类别数目可使用快速聚类法。()

此题为判断题(对,错)。


正确答案:正确


基于聚类结构的分类有()。

A.分解方式

B.凝聚方式

C.R型聚类

D.Q型聚类


正确答案:CD


聚类分析是常用商情分析工具中的一种,常用的聚类分析方法有()。

  • A、样品聚类法
  • B、系统聚类法
  • C、抽查聚类法
  • D、模糊聚类法
  • E、相关聚类法

正确答案:A,B,D


第三章 聚类分析一、填空题1.在进行聚类分析时,根据变量取值的不同,变量特性的测量尺度有以下三种类型: 间隔尺度 、 顺序尺度 和 名义尺度 。2Q型聚类法是按_样品_进行聚类,R型聚类法是按_变量_进行聚类。3Q型聚类统计量是_距离_,而R型聚类统计量通常采用_相似系数_。4在聚类分析中,为了使不同量纲、不同取值范围的数据能够放在一起进行比较,通常需要对原始数据进行变换处理。常用的变换方法有以下几种:_中心化变换_、_标准化变换_、_规格化变换_、_ 对数变换 _。5距离一般应满足以下四个条件:对于一切的i,j,有、 时,有、对于一切的i,j,有、对于一切的i,j,k,有。6.相似系数一般应满足的条件为: 若变量与 成比例,则、 对一切的i,j,有 和 对一切的i,j,有。7.常用的相似系数有 夹角余弦 和 相关系数 两种。8.常用的系统聚类方法主要有以下八种: 最短距离法 、最长距离法、中间距离法、重心法、类平均法、可变类平均法、可变法、离差平方和法。9快速聚类在SPSS中由_K-mean_过程实现。10.常用的明氏距离公式为:,当时,它表示 绝对距离 ;当时,它表示 欧氏距离 ;当趋于无穷时,它表示 切比雪夫距离 。11聚类分析是将一批 样品 或 变量 ,按照它们在性质上 的 亲疏、相似程度 进行分类。12明氏距离的缺点主要表现在两个方面:第一 明氏距离的值与各指标的量纲有关 ,第二 明氏距离没有考虑到各个指标(变量)之间的相关性 。13马氏距离又称为广义的 欧氏距离 。14,设总体为维总体,均值向量为,协差阵为,则样品与总体的马氏距离定义为 。15使用离差平方和法聚类时,计算样品间的距离必须采用 欧氏距离 。16在SPSS中,系统默认定系统聚类方法是 类平均法 。17在系统聚类方法中, 中间距离法和 重心法 不具有单调性。18离差平方和法的基本思想来源于 方差分析 。19最优分割法的基本步骤主要有三个:第一,定义类的直径 ;第二, 定义目标函数 ;第三, 求最优分割 。20最优分割法的基本思想是基于 方差分析的思想 。二、判断题1.在对数据行进中心化变换之后,数据的均值为0,而协差阵不变,且变换后后的数据与变量的量纲无关。 ( )2根据分类的原理,我们可以把聚类分为样品聚类和变量聚类。 ( )3兰氏距离不仅克服了明氏距离与各指标的量纲有关的缺点,而且也考虑了变量间的相关性。 ( )4.当各变量之间相互独立时,马氏距离就退化为欧氏距离。 ( )5在几种系统聚类法中,最短(长)距离法、(可边)类平均法、重心法和离差平方和法都具有单调性,只有中间距离法不具有单调性。 ( )6.重心法比离差平方和法使空间扩张。 ( )7.离差平方和法的思想来源于方差分析.如果类分得比较合理,同类样品之间的离差平方和应当较大,类与类之间的离差平方和应当较小. ( )8.使用离差平方和法时,计算样品间的距离必须采用欧氏距离. ( )9.快速聚类法又称为动态聚类法,是一种非谱系聚类法,它可以应用于比系统聚类法大得多的数据组. ( )10明氏距离的优点在于考虑了各个指标之间的相关性,而缺点在于它的值与各指标的量纲有关。 ( )11马氏距离考虑了便了之间观测变量之间的相关性。 ( )12兰氏距离对大的奇异值不敏感,适合高度偏倚的数据,但是它没有克服与各指标的量纲有关的缺点。 ( )三、简答题1简述聚类分析的基本思想和基本步骤2.系统聚类法的基本思想是什么3.系统聚类法的基本步骤是什么4简述最长聚类法的聚类步骤。5.简述快速聚类的基本思想及主要步骤。6.简述最优分割法的步骤7.简述Ward离差平方和法的基本思想.8.在数据处理时,为什么通常要进行标准化处理9简述最优分割法的基本思想和基本步骤。四、计算题1.假设有一个二维正态总体,它的分布为:,并且还已知有两点和, 要求分别用马氏距离和欧氏距离计算这两点A和B各自到总体均值点的距离.2.设有5个样品,已知各样品之间的距离矩阵为:试分别用最短距离法和最长距离法聚类。3为研究全国31个省区城镇居民生活消费的分布规律,根据2003年统计资料利用SPSS软件中的系统聚类法做类型划分,其谱系图如下,你认为从全国各省区的消费情况看,分为几类较合适,结合我国区域社会及经济发展情况,对分类结果作简要分析。* * * * * * H I E R A R C H I C A L C L U S T E R A N A L Y S I S * * * * * *Dendrogram using Average Linkage (Between Groups) Rescaled Distance Cluster Combine C A S E 0 5 10 15 20 25 Label Num +-+-+-+-+-+ 青海 29 宁夏 30 河南 16 甘肃 28 河北 3 四川 23 陕西 27 湖北 17 湖南 18 内蒙古 5 新疆 31 吉林 7 黑龙江 8 山西 4 辽宁 6 云南 25 安徽 12 贵州 24 江西 14 江苏 10 重庆 22 山东 15 福建 13 广西 20 海南 21 天津 2 西藏 26 浙江 11 广东 19 上海 9 北京 1 4下面给出了八个样品的两个指标数据指标品样指标12345678X1X2244701311239511214316试用中间距离法进行聚类,样品间的距离采用欧氏距离。五、SPSS操作题1某校从高中二年级女生中随机抽取16名,测得身高和体重数据如下表:序号身高(cm)体重(kg)序号身高(cm)体重(kg)1234567816015916016916216516515449464149504852439101112131415161601601571631611581591614544435051454848试分别利用最短距离法、最长距离法、重心法、类平均法、中间距离法将它们聚类(分类统计量采用绝对距离),并画出聚类图。2从不同地区采集了七块花岗岩,测其部分化学成分如下:1234567SiO2TiO2FeOCaOK2O试作如下分析:(1)样本间用欧氏距离,并用系统聚类的诸方法对样本进行聚类。(2)将数据标准化后,仍用欧氏距离,然后用系统聚类的诸方法对样本进行聚类。(3)对五个变量进行聚类。


常用的聚类分析法有()、系统聚类法、模糊聚类法等。

  • A、序贯聚类法
  • B、样品聚类法
  • C、相关聚类法
  • D、时间聚类法

正确答案:B


聚类分析包括哪两种类型()。

  • A、指标之间的聚类和变量之间的聚类
  • B、变量之间的聚类和样品之间的聚类
  • C、样品之间的聚类和总体之间的聚类
  • D、指标之间的聚类和总体之间的聚类

正确答案:B


聚类分析包括哪两种类型()。

  • A、指标之间的聚类和变量之间的聚类
  • B、变量之间的聚类和样品之间的聚类
  • C、样品之间的聚类和总体之间的聚类
  • D、指标之间的聚类和总体之间的聚类

正确答案:B


常用的聚类方法有样品聚类法、系统聚类法和()

  • A、图论聚类法
  • B、动态聚类法
  • C、回归聚类分析
  • D、平共处模糊聚类法

正确答案:D


以下哪个聚类分析的方法是利用统计学定义的距离进行度量()

  • A、层次聚类法
  • B、快速聚类法(K-Mans)
  • C、基于密度的聚类法
  • D、基于网格的聚类法

正确答案:A,B


更多 “第3章聚类分析答案” 相关考题
考题 单选题常用的聚类分析法有()、系统聚类法、模糊聚类法等。A 序贯聚类法B 样品聚类法C 相关聚类法D 时间聚类法正确答案: D 解析: 暂无解析

考题 聚类分析也有不同的分类:按聚类变量可分为样品聚类和()。A、指标聚类B、系统聚类C、动态聚类D、产品聚类正确答案:A

考题 多选题层次聚类的聚类方式有()A凝聚方式聚类B分解方式聚类CQ型聚类DR型聚类正确答案: C,D 解析: 暂无解析

考题 填空题常见的聚类分析方法有()、模糊聚类法、动态聚类法等。正确答案: 系统聚类法 解析: 暂无解析

考题 多选题以下哪个聚类分析的方法是利用统计学定义的距离进行度量()A层次聚类法B快速聚类法(K-Mans)C基于密度的聚类法D基于网格的聚类法正确答案: C,A 解析: 暂无解析

考题 单选题定义聚类问题最重要的是()。A 选择聚类分析变量B 决定类的个数C 选择聚类方法D 选择距离尺度及数据正确答案: D 解析: 暂无解析

考题 填空题聚类分析中Q型聚类是对()进行聚类,R型聚类是对变量进行聚类。正确答案: 样品 解析: 暂无解析

考题 问答题简述R型聚类统计量正确答案: 考虑对样品进行聚类,描述变量之间的接近程度常用“相似系数”来度量。两个变量之间的相似系数的绝对值越接近于1,表示两者关系越密切;绝对值越接近于0,关系越疏远。常用相似距离有:夹角余弦和相似系数。 解析: 暂无解析

考题 填空题聚类分析是分析如何对样品或变量进行量化分析,通常分为()和R型聚类。正确答案: Q型聚类 解析: 暂无解析

考题 多选题聚类分析是常用商情分析工具中的一种,常用的聚类分析方法有()。A样品聚类法B系统聚类法C抽查聚类法D模糊聚类法E相关聚类法正确答案: D,C 解析: 暂无解析