kmeans聚类算法优缺点

2024-08-15 13:48:31 来源：网络

kmeans聚类算法优缺点

kmeans聚类算法优缺点?？
2🦄🌒————🐣🀄、缺点对K值敏感🎍||🐌。也就是说😅🦖_——🌩，K的选择会较大程度上影响分类效果😽——|🌧。在聚类之前🤬-🤪，我们需要预先设定K的大小🌎——_🧵，但是我们很难确定分成几类是最佳的🌩🦡-☺️，比如上面的数据集中🐉🧸——🐚，显然分为2类🦝——-🦊😨，即K = 2最好🙂-🌒🐏，但是当数据量很大时🐷*-|🍁，我们预先无法判断🎋-☘。对离群点和噪声点敏感🦋🦔-🐏🙄。如果在上述数据集中添加一个噪音点🦃——😮，这个后面会介绍🀄——_🦬🎣。
由于具有出色的速度和良好的可扩展性☁️_😡，Kmeans聚类算法算得上是最著名的聚类方法🐏🐏——-🤩。Kmeans算法是一个重复移动类中心点的过程🐇|☘🐊，把类的中心点♦——|🧐🐤，也称重心(centroids),移动到其包含成员的平均位置😸-|🦓，然后重新划分其内部成员🌺_🕷🙂。k是算法计算出的超参数🦕🐽——-🦅🤐，表示类的数量😫*‍❄_🤫；Kmeans可以自动分配样本到不同的类🦁🎮-——🐨，但是不能决定究竟要分几个类后面会介绍🦚-🤤🤨。

kmeans聚类算法优缺点

聚类算法?？
2🕹-_🎯、K-Means算法对初始选取的质心点是敏感的🪡——|🐈😉，不同的随机种子点得到的聚类结果完全不同🌲🪱|🐄，对结果影响很大⚾-🐄🦘。3🦃👺-😹🐕、对噪音和异常点比较的敏感🐂😦_-🪁🐡。用来检测异常值🍄_——😛。4🤨😑——🐔、采用迭代方法*——😬，可能只能得到局部的最优解😎|😚，而无法得到全局的最优解🐜🦮-|🦁。
🦠🦇_🌖。直到中心点的位置不动了🥏🧧_🦜，聚类完毕😳||🐈‍⬛。#160; 原理中一直贯穿着中心的概念🏏🐚-|🦈😔，这就是means的含义😏-——🎖😞。接下来我们来分析一下K-means的优缺点🎐🙁_|🐳*‍❄。#160; 1.对分布类似希望你能满意🎄_——🥈。
八:聚类算法K-means(20191223-29)?？
5,结果不一定是全局最优🎰🐸——*🥈，只能保证局部最优6,对球形簇的分组效果较好🦉——🤥，对非球型簇🍂😒|🌘🦙、不同尺寸😗🪁-⛈、不同密度的簇分组效果不好🐰🦡-☺️🤖。K-means算法简单理解🏒——🐗🐩，易于实现(局部最优),却会有对初始点😫🌴——|🌳、噪声点敏感等问题🏒🐟|🐅；还容易和监督学习的分类算法KNN混淆🐰-😂。参考阅读😉——🦂🐬： 1.《深入理解K-Means聚类算法》2.《K-Means 》等我继续说🦫🍃_⛅️🌕。
分配🐵🤨-🦓：对于每个数据点😳🦠||🦓*，计算其到k个质心的距离😇|-🐨，将其分配给距离最近的质心所表示的簇🐂🤕——-😥。重新计算质心🐀*-|😷：对于每个簇🎐🦉-🕸🎈，重新计算其所有点的均值🦙|🐝*，得到新的质心位置🎳——|🎋🪄。重复2和3步🌲🐸_🪡🦄，直到质心位置不再改变或达到预定的迭代次数😛🦅--🐁。K-means算法的不足包括😈🤓--🌝：对于数据分布较为复杂或存在异常值的情况🐁*|——🦬，K-means算法的聚还有呢？
kmeans聚类算法是什么??？
K-means算法是最为经典的基于划分的聚类方法🦆🪱——_🦅🧿，是十大经典数据挖掘算法之一😉😖——🐿*。K-means算法的基本思想是👽🎉-🎍：以空间中k个点为中心进行聚类🎣🌷_|🐜，对最靠近他们的对象归类🎈🐵|😷。通过迭代的方法😀😄————🦂🐄，逐次更新各聚类中心的值🦝-_🙊，直至得到最好的聚类结果🪶_🌩😝。聚类属于无监督学习🐐——🐙，以往的回归🪢🌱——🌙🐐、朴素贝叶斯😆🕹_🥈😌、SVM等都是有类别标签y的🍃😈|_*😮，也好了吧🐌_——😉😣！
指定类别数为K🐭🐰_🦘，对样本集合进行聚类😯🐁_|🏉，聚类的结果由K 个聚类中心来表达🏅-🌵，基于给定的聚类目标函数（或者说是聚类效果判别准则）🐚——-🌺🦄，算法采用迭代更新的方法🌑--🌩⛸，每一次迭代过程都是向目标函数值减小的方向进行🎗🧿——-😐🏉，最终的聚类结果使目标函数值取得极小值🐫*-🤑😲，达到较优的聚类效果🌿——🦍🥎。使用平均误差准则函数E作为聚类结果好坏的等会说💮🐘|*。
k-means聚类算法一定要指定聚类个数吗?？
一🎖-——🌾🙊，K-Means聚类算法原理k-means 算法接受参数k 🦊😋|🌦；然后将事先输入的n个数据对象划分为k个聚类以便使得所获得的聚类满足🤕——😽：同一聚类中的对象相似度较高🎎🙂|-🐞；而不同聚类中的对象相似度较小.聚类相似度是利用各聚类中对象的均值所获得一个“中心对象”（引力中心）来进行计算的.K-means算法是最为经典希望你能满意💮-🌗🐝。
其步骤是预将数据分为K组🎳🐡-🎑，则随机选取K个对象作为初始的聚类中心🏏——🐝🐲，然后计算每个对象与各个种子聚类中心之间的距离🪰🎄——🥌，把每个对象分配给距离它最近的聚类中心🐟——😮🤗。聚类中心以及分配给它们的对象就代表一个聚类🐕‍🦺——🦓。每分配一个样本😯♟|🐄，聚类的聚类中心会根据聚类中现有的对象被重新计算🌾——|😑。这个过程将不断重复直到满足某个等会说🪆_😄。

看一看：>>查看更多你感兴趣的