k近邻算法的优缺点

2024-07-21 10:38:38 来源：网络

k近邻算法的优缺点

k近邻算法的优缺点?？
k近邻算法的优缺点😟-_🥀🏐：KNN方法主要靠周围有限的邻近的样本🌒🌷——🐇🐟，而不是靠判别类域的方法来确定所属类别的🕸🌳--🪄🐅，因此对于类域的交叉或重叠较多的待分样本集来说🐅_😿，KNN方法较其他方法更为适合🪄🐇-|*。该算法比较适用于样本容量比较大的类域的自动分类☀️_-🐌🦒，而那些样本容量较小的类域采用这种算法比较容易产生误分😌--🦝🦒。当样本不平衡等会说🐯🤣|——🦚。
k近邻算法优点很明显🦈🥎-|🐦，简单易用🪄|_🌪，可解释性强🐩——🐍🐤，但也有其不足之处🐷-|🦝。例如🌲🐄_——🎖，“多数表决”会在类别分布偏斜时浮现缺陷🌿-_🐉。也就是说🐆-|💮🐰，k值的选取非常重要🐙🌓-🤔🦨，出现频率较多的样本将会主导测试点的预测结果😾--🎉🦘。2.邻居距离的度量🤕🦢——🐭⛳：不量化🦗-_🦝，无以度量远近😜🥈_🐾😵。k近邻算法要计算“远亲近邻”*🦖|🌧，就要求样本的所有特征都能做到可比等我继续说🏐__🌸🍃。

k近邻算法的优缺点

k近邻算法特征值非数字?？
k-近邻算法采用测量不同特征值之间的距离来进行分类🦊——😂。优点🪆🧩_-🦎🐜：精度高*-🐳，对异常值不敏感🏑-🦮🐯，无数据输入假定🦆-|☺️🪢。缺点🌲-👺：计算复杂度高🐤🌨——_🐺、空间复杂度高*✨——🦭。适用数据范围☺️🦔_🌼🦊：数值型和分类型😡🥇--😙。原理🦡🐄|-🐄：首先🐩|🥀，我们必须得有一份含有分类标签的数据集🤥-🎇🐐，为训练数据集🐳|-😝。比如我们要预测用户是否会流失🎽——🤥🌴，那么分类标签就是流失和未流失🌩-🐅。..
2🥇-|♣、分类准确率高🦖——😙♥：K近邻算法在许多实际问题中具有较高的分类准确率🤯|🦚🎯。这是因为K近邻算法能够充分利用训练数据的信息🦓——-🤒🐜，尤其是当数据分布较为复杂时🤒😆——🤪🪆，能够获得较好的分类效果🦠——😻☺️。在许多实际应用场景中🙉🐬_🎐🐨，K近邻算法的表现往往优于其他机器学习算法🌻🦒||🤪🐗。3😤🐓_-🐕🐅、对参数选择不敏感🐡|💐：K近邻算法是一种惰性学习算法🐦🦁|-😼，即学习过程有帮助请点赞🧿-——🦠😬。
k近邻算法是有监督还是无监督?？
k近邻算法是有监督💥|🦠。K最近邻分类算法🏸🐝|_🐳，是一个理论上比较成熟的方法👹🦔——🐓🦊，也是最简单的机器学习算法之一😸——🐯。该方法的思路是😫🎳——🎍😨：在特征空间中🦌*——🦒🦍，如果一个样本附近的k个最近（即特征空间中最邻近）样本的大多数属于某一个类别🐚||😰🐔，则该样本也属于这个类别🤖🎿--🦆。用官方的话来说🎁——🦌🤔，所谓K近邻算法🍃-——🦇🤣，即是给定一个训练数据集🐘——🦇😓，对到此结束了？🌷--🌈。
一般来说😊🌛|🐖，一个较好的K值可通过各种启发式技术来获取🥈😿——-*🕸，比如说交叉验证🐷————💥🐋。另外噪声和非相关性特征向量的存在会使K近邻算法的准确性减小🤨-🐳😈。近邻算法具有较强的一致性结果🦋🦄_😢，随着数据趋于无限🎨🪄_-🥉🦁，算法保证错误率不会超过贝叶斯算法错误率的两倍🤫🦛————🐥🌲。对于一些好的K值🦝-🌑🌻，K近邻保证错误率不会超过贝叶斯理论误差率🏆_-🐩。那么KNN后面会介绍🎏🎐——-🦂🐘。
K-近邻算法简介?？
1.K-近邻(KNearestNeighbor,KNN)算法简介☘️-🪁🪱：对于一个未知的样本🦘🪅|🌼，我们可以根据离它最近的k个样本的类别来判断它的类别*🦧_🧐。以下图为例🦋--🐓，对于一个未知样本绿色小圆🌟_*，我们可以选取离它最近的3的样本🦋|🦏🪅，其中包含了2个红色三角形🤯🦁-🎋💐，1个蓝色正方形🧩🤿|——🐩，那么我们可以判断绿色小圆属于红色三角形这一类☀️🕸__🐘🐝。我们也可以是什么🐁|-🌦。
（1）计算量太大🪄🎳——_🍃，尤其是特征数非常多的时候🥉——🦙🦡。每一个待分类文本都要计算它到全体已知样本的距离👽|_🌩，才能得到它的第K个最近邻点🎗——😑🦑。（2）可理解性差😿——🐂😹，无法给出像决策树那样的规则🎁🦥-🐱。（3）是慵懒散学习方法🐹😘|🦕，基本上不学习🐑🌴——🦁🐿，导致预测时速度比起逻辑回归之类的算法慢🤢🏑-*🐸。（4）样本不平衡的时候🏐🐘_🌴🦌，对稀有类别的等我继续说🌸_*🕸。
请比较k近邻,决策树和朴素贝叶斯这三种分类算法之间的异同点
如果训练集很小🕸_🥀，那么高偏差/低方差分类器（如朴素贝叶斯分类器）要优于低偏差/高方差分类器（如k近邻分类器）😐_-🐙，因为后者容易过拟合🦏|🐤。然而⛳——🤔🐪，随着训练集的增大🐈|-🪄，低偏差/高方差分类器将开始胜出（它们具有较低的渐近误差）🎍——🐹，因为高偏差分类器不足以提供准确的模型🐓🦑--🐵。一些特定算法的优点🎋🦈|——🐔：朴素贝叶斯的优点🕊🌲-🌸🐦：..
决策树的优点是直观易懂🎨||🐗🥊，可以直接呈现决策逻辑🪁——🙃；缺点是容易过拟合🐾——|🦑，对连续性的数据处理不够平滑♦-🐄。例如🐺🐰_——🐀😲，在判断一个水果是否是苹果时🌴😇||🐂😲，决策树可能会通过询问“颜色是否为红色”🌵🎐||😍🐸、“形状是否为圆形”等问题来进行分类🐄🦒|_🏒🐅。2. K近邻算法（KNN）*😉——🦔👹：K近邻算法是一种基于实例的学习🐉🪰_🌝，或者是局部逼近和将所有计算是什么🐹😎_🦄🪡。

看一看：>>查看更多你感兴趣的