昇思25天学习打卡营第16天|K近邻算法实现红酒聚类
KNN 是一种基于距离的分类和回归算法,通过计算测试样本与训练样本之间的距离来预测测试样本的类别。KNN 的三个基本要素:K 值、距离度量、分类决策规则。
·
1. 实验目的
- 理解 KNN 的基本概念。
- 学习如何使用 MindSpore 进行 KNN 实验。
2. KNN 算法原理介绍
- KNN 是一种基于距离的分类和回归算法,通过计算测试样本与训练样本之间的距离来预测测试样本的类别。
- KNN 的三个基本要素:K 值、距离度量、分类决策规则。
3. 实验环境
- 需要熟练使用 Python 并具备机器学习理论知识。
- 使用 MindSpore 2.0 版本,支持 win_x86 和 Linux 系统,可运行于 CPU/GPU/Ascend。
4. 数据处理
- 使用 Wine 数据集,包含 178 个样本,每个样本有 13 个属性。
- 数据集从官网下载或从华为云 OBS 下载。
- 数据集的属性包括酒精、苹果酸、灰分等化学成分。
5. 模型构建
- 构建 KNNNet 类,使用 MindSpore 的操作来计算输入样本与训练样本之间的距离,并找出最近的 K 个邻居。
- 定义 knn 函数来执行 KNN 算法。
6. 模型预测
- 使用 KNN 算法对验证集进行预测,设置 K 值为 5。
- 输出验证精度,实验结果显示算法在红酒分类任务上的有效性。
7. 实验小结
- 总结 KNN 算法在红酒分类任务上的应用和效果。
鲲鹏昇腾开发者社区是面向全社会开放的“联接全球计算开发者,聚合华为+生态”的社区,内容涵盖鲲鹏、昇腾资源,帮助开发者快速获取所需的知识、经验、软件、工具、算力,支撑开发者易学、好用、成功,成为核心开发者。
更多推荐

所有评论(0)