模糊聚类案例分析.doc

上传人:夺命阿水 文档编号:18830 上传时间:2022-07-04 格式:DOC 页数:6 大小:200.81KB
返回 下载 相关 举报
模糊聚类案例分析.doc_第1页
第1页 / 共6页
模糊聚类案例分析.doc_第2页
第2页 / 共6页
模糊聚类案例分析.doc_第3页
第3页 / 共6页
模糊聚类案例分析.doc_第4页
第4页 / 共6页
模糊聚类案例分析.doc_第5页
第5页 / 共6页
点击查看更多>>
资源描述

《模糊聚类案例分析.doc》由会员分享,可在线阅读,更多相关《模糊聚类案例分析.doc(6页珍藏版)》请在课桌文档上搜索。

1、-模糊聚类分析方法1.1距离和相似系数为了将样品或指标进展分类,就需要研究样品之间关系。目前用得最多的方法有两个:一种方法是用相似系数,性质越接近的样品,它们的相似系数的绝对值越接近1,而彼此无关的样品,它们的相似系数的绝对值越接近于零。比拟相似的样品归为一类,不怎么相似的样品归为不同的类。另一种方法是将一个样品看作P维空间的一个点,并在空间定义距离,距离越近的点归为一类,距离较远的点归为不同的类。但相似系数和距离有各种各样的定义,而这些定义与变量的类型关系极大,因此先介绍变量的类型。由于实际问题中,遇到的指标有的是定量的如长度、重量等,有的是定性的如性别、职业等,因此将变量指标的类型按以下三

2、种尺度划分:间隔尺度:变量是用连续的量来表示的,如长度、重量、压力、速度等等。在间隔尺度中,如果存在绝对零点,又称比例尺度,本书并不严格区分比例尺度和间隔尺度。有序尺度:变量度量时没有明确的数量表示,而是划分一些等级,等级之间有次序关系,如*产品分上、中、下三等,此三等有次序关系,但没有数量表示。名义尺度:变量度量时、既没有数量表示,也没有次序关系,如*物体有红、黄、白三种颜色,又如医学化验中的阴性与阳性,市场供求中的“产和“销等。不同类型的变量,在定义距离和相似系数时,其方法有很大差异,使用时必须注意。研究比拟多的是间隔尺度,因此本章主要给出间隔尺度的距离和相似系数的定义。设有个样品,每个样

3、品测得项指标变量,原始资料阵为其中为第个样品的第个指标的观测数据。第个样品为矩阵的第行所描述,所以任何两个样品与之间的相似性,可以通过矩阵*中的第K行与第L行的相似程度来刻划;任何两个变量与之间的相似性,可以通过第列与第列的相似程度来刻划。1.2 F相似关系1.2.1定义设,如果具有自反和对称关系,则称为上的一个相似关系表示模糊当论域为有限时,相似关系可以用矩阵表示。具有F相似关系的矩阵,称为相似矩阵。在实际应用时,通常只能得到自反矩阵和对称举证,即相似矩阵。现在的问题是对具有相似关系的元素怎样进展分类,也就是如何将相似矩阵改造为等价矩阵。1.2.2 定理假设,则称为对称矩阵。1假设是单位矩阵

4、,则称为自反矩阵。2假设,则称为传递的关系。3假设满足上面三点则称为等价矩阵。定理1:相似矩阵的传递闭包是等价矩阵,且。证 只需要证明是自反的、对称的。因是自反的,故,。不难得到不减,因此,即是自反的。因为,故是对称的。有定理1可见,要想将相似矩阵改变为等价矩阵,只需求相似矩阵的传递闭包。定理2:设是自反矩阵,则任意自然数,都有证由自反性推得当时,有1.3 聚类分析所谓聚类分析,就是用数学的方法对事物进展分类,它有广泛的实际应用。在模糊数学产生之前,聚类分析已是数理统计多元分析的一个分支,然而现实的分类问题往往伴有模糊性。例如,环境污染分类、春天连阴雨预报、临床病症资料分类、岩石分类,等等。对

5、这些伴有模糊性的聚类问题,用模糊数学语言来表达更为自然。模糊聚类分析的步骤:第一步:数据标准化数据矩阵设论域为被分类的对象,每个对象由m个指标表示其性状,即于是得到原始数据矩阵为数据标准化在实际问题中,不同的数据一般有不同的量纲。为了使有不同的量纲的量也能进展比拟,通常需要对数据作适当的变换。但是,即使这样,得到的数据也不一定在区间0,1上。因此,这里说的数据标准化,就是要根据模糊矩阵的要求,将数据压缩到区间0,1上。通常需要作如下集中变换。1) 平移标准差变换2) 平移极差变换3) 对数变换第二步标定建立模糊相似矩阵设为待分类的全体。其中每一待分类对象由一组数据表征如下:现在的问题是如何建立

6、和之间的相似关系。这有许多方法这里选一些,列在下面,我们可以按照实际情况,选其中一种来求与的相似关系。1形似系数法数量积法其中M为一适中选择之正数,满足夹角余弦法相关系数法其中 最大最小法算术平均最小法几何平均最小法绝对值指数法绝对值减数法其中,适中选取,使。2距离法1直接距离法海明距离欧几里得距离切比雪夫距离2) 倒数距离法3) 指数距离法选择上述哪一个方法好,要按实际情况而定。在实际应用时,最好采用多种方法,选取分类最符合实际的结果。第三步聚类求动态聚类图。由第一步得到的矩阵一般只满足自反性和对称性,即是相似矩阵,需将它改造成模糊等价矩阵。为此,采用平方法求出的传递闭包,便是所求的模糊等价

7、矩阵。通过便可对进展分类。实际应用具体问题如下:地区生产总值(当年价格)(亿元);:第一产业增加值;:第二产业增加值;:第三产业增加值;:地方财政一般预算收入;:工业企业数(个);:工业总产值(当年价格)(万元);:从业人员年平均人数(万人);:流动资产年平均余额(万元) ;:主营业务收入(万元):利润总额(万元);:移动年末用户数(万户);:国际互联网用户数(户);:公路里程;:普通中学学生数(万人);:医院、卫生院数(个);:医生数(执业医师+执业助理医师)(个)。17项指标来描述省11各市区经济开展水平情况。现将11个不同经济开展水平的市区进展聚类。标准差变换下夹角余弦法构造相似矩阵R采用传递闭包法进展聚类,得到的动态聚类图如下:标准差变换下相关系数法构造相似矩阵R采用传递闭包法进展聚类,得到的动态聚类图如下:极差变换下夹角余弦构造相似矩阵R采用传递闭包法进展聚类,得到的动态聚类图如下:极差变换下相关系数法构造相似矩阵R采用传递闭包法进展聚类,得到的动态聚类图如下:. z.

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 在线阅读 > 生活休闲


备案号:宁ICP备20000045号-1

经营许可证:宁B2-20210002

宁公网安备 64010402000986号