当前位置：首页 > news >正文

KNN算法（K近邻算法）

news 2025/6/26 15:49:47

含义

代码

含义

knn（k近邻）算法就像它的名字一样，使用邻居而且是近的邻居来确定某个样本的类别，就好像物以类聚这种意思。

为了理解的更直观，观看下面的图片，模拟knn算法把中间的星星归类成正方形或则是圆形。

当k=3时，可以发现就是小圈的情况找到最近的三个图形，两个正方形，一个圆形，那么此时星星就被划分到正方形的分类

当k=7的，找到最近的7个图形，有三个正方形，四个圆形，那么此时星星就被划分到圆形的类别

图例1-1

代码

from keras.datasets import mnist
import numpy as np
(x_train, y_train), (x_test, y_test) = mnist.load_data()# 归一化处理
x_train = x_train.astype(np.float32) / 255.0
x_test = x_test.astype(np.float32) / 255.0print(x_train.shape, y_train.shape)def distance(a, b):return np.sqrt(np.sum(np.square(a - b)))class KNN:def __init__(self, k, label_num):self.k = kself.label_num = label_num # 类别的数量def fit(self, x_train, y_train):# 在类中保存训练数据self.x_train = x_trainself.y_train = y_traindef get_knn_indices(self, x):# 获取距离目标样本点最近的K个样本点的标签# 计算已知样本的距离dis = list(map(lambda a: distance(a, x), self.x_train))# 按距离从小到大排序，并得到对应的下标knn_indices = np.argsort(dis)# 取最近的K个knn_indices = knn_indices[:self.k]return knn_indicesdef get_label(self, x):# 对KNN方法的具体实现，观察K个近邻并使用np.argmax获取其中数量最多的类别knn_indices = self.get_knn_indices(x)# 类别计数label_statistic = np.zeros(shape=[self.label_num])for index in knn_indices:label = int(self.y_train[index])label_statistic[label] += 1# 返回数量最多的类别return np.argmax(label_statistic)def predict(self, x_test):# 预测样本 test_x 的类别predicted_test_labels = np.zeros(shape=[len(x_test)], dtype=int)for i, x in enumerate(x_test):predicted_test_labels[i] = self.get_label(x)return predicted_test_labelsknn=KNN(5, 10)
knn.fit(x_train, y_train)sum=0.0
for i,v in enumerate(knn.predict(x_test[:100])):if(v==y_test[i]):sum+=1
print(sum/100)

查看全文

http://www.lqws.cn/news/523369.html