当前位置：首页 > news >正文

【k近邻】 K-Nearest Neighbors算法原理及流程

news 2025/6/28 18:47:29

【k近邻】 K-Nearest Neighbors算法原理及流程

【k近邻】 K-Nearest Neighbors算法距离度量选择与数据维度归一化

【k近邻】 K-Nearest Neighbors算法k值的选择

【k近邻】 Kd树的构造与最近邻搜索算法

【k近邻】 Kd树构造与最近邻搜索示例

k近邻算法（K-Nearest Neighbors，简称KNN）是一种常用的监督学习算法，可以用于分类和回归问题。在OpenCV中，KNN算法的函数为`cv.ml.KNearest_create()。

k近邻算法原理

K近邻算法，即是给定一个训练数据集，对新的输入实例，在训练数据集中找到与该实例最邻近的K个实例，这K个实例的多数属于某个类，就把该输入实例分类到这个类中。

例如下图展现了两类样本数据，分别由正方形和三角形表示，待分类数据由圆形表示，算法的目的是依据已知的样本数据判断待分类数据的类别，即对圆形数据分类。

我们考虑几种不同的K值：

如果K=1，圆点的最邻近的1个点是1个三角形，少数服从多数，基于统计的方法，可以判定这个待分类点属于三角形一类。
如果K=3，圆点的最邻近的3个点是2个三角形和1个正方形，少数服从多数，基于统计的方法，可以判定这个待分类点属于三角形一类。
如果K=5，圆点的最邻近的5个点是2个三角形和3个正方形，少数服从多数，基于统计的方法，可以判定这个待分类点属于正方形一类。
依此类推，k近邻算法的思路十分清晰，一言蔽之，即由最近的k个邻居决定待判别点的归属。

k近邻算法流程

对未知类别的数据集中的每个点依次执行以下操作

计算已知类别数据集众多点与当前点之间的距离
按照距离递增次序排序
选取与当前点距离最小的k个点
确定前k个点所在类别的出现频率
返回前k个点出现频率最高的类别作为当前点的预测分类

http://www.lqws.cn/news/550729.html

相关文章：

机器学习3——参数估计之极大似然估计

C++并发编程-4.unique_lock,共享锁和递归锁

详解HashMap底层原理

电脑远程控制另一台电脑无法连接怎么办

PostgreSQL 容器化分布式技术方案

基于51单片机-蜂鸣器演奏《飞雪玉花》

什么是故障注入测试

强化联邦学习的车联网 DDoS 攻击检测

【图像处理入门】12. 综合项目与进阶：超分辨率、医学分割与工业检测

FLUX.1 Kontext(Dev 版）训练lora基础教程

TiDB AUTO_RANDOM 超大主键前端精度丢失排查：JavaScript Number 限制与解决方案

内测开启！看海量化回测系统V2.0版本更新，基于miniQMT的回测系统问世！

Threejs开发指南（第七篇利用AI进行threejs开发）

封装nuxt3的SSR请求和CSR请求方法

1 Studying《Is Parallel Programming Hard》6-9

双指针技巧深度解析

C#系统学习第二章——第一个C#程序

P27：RNN实现阿尔茨海默病诊断

华为云Flexus+DeepSeek征文｜基于Dify+ModelArts开发AI智能会议助手

本地部署 WordPress 博客完整指南（基于 XAMPP）

nt!MiFlushSectionInternal函数分析从nt!IoSynchronousPageWrite函数到Ntfs!NtfsFsdWrite函数

三阶落地：腾讯云Serverless+Spring Cloud的微服务实战架构

React中的ErrorBoundary

【经验】新版Chrome中Proxy SwitchyOmega2已实效，改为ZeroOmega

车载诊断架构 --- 诊断与ECU平台工作说明书

SQL Server for Linux 如何实现高可用架构

【策划所需编程知识】

中国双非高校经费TOP榜数据分析

【记录】Ubuntu｜Ubuntu服务器挂载新的硬盘的流程（开机自动挂载）

SQL学习笔记4