25丨KNN(下):如何对手写数字进行识别?
你好,我是悦创。 今天我来带你进行 KNN 的实战。上节课,我讲了 KNN 实际上是计算待分类物体与其他物体之间的距离,然后通过统计最近的 K 个邻居的分类情况,来决定这个物体的分类情况。 这节课,我们先看下如何在 sklearn 中使用 KNN 算法,然后通过 sklearn 中自带的手写数字数据集来进行实战。 之前我还讲过 SVM、朴素贝叶斯和决策...

AI悦创原创
  • 数据分析
  • 数据分析实战 45 讲
  • 数据分析
  • 数据分析实战 45 讲
大约 10 分钟
01-最近邻算法KNN
在学习机器学习的时候,接触的第一个算法大都是 KNN。不过在介绍之前,请先允许我讲一下个别名词: 交叉验证:将原始数据 随机 分成两组,一组作为训练集,一组作为验证集。训练集训练分类器,验证集验证分类器的效果,并将最后的准确率作为分类器的性能指标。; 特征缩放:将特征的取值控制在某一范围内,保证每个特征占据的权重一致。常用的是归一化和标准化。; 原理介...

AI悦创原创
  • 数据分析
  • 机器学习
  • 数据挖掘
  • 机器学习算法
  • 数据分析
  • 机器学习
  • 数据挖掘
  • 机器学习算法
大约 8 分钟
24丨KNN(上):如何根据打斗和接吻次数来划分电影类型?
img 你好,我是悦创。 今天我来带你进行 KNN 的学习,KNN 的英文叫 K-Nearest Neighbor,应该算是数据挖掘算法中最简单的一种。 我们先用一个例子体会下。 假设,我们想对电影的类型进行分类,统计了电影中打斗次数、接吻次数,当然还有其他的指标也可以被统计到,如下表所示。 img 我们很容易理解《战狼》《红海行动》《碟中谍 6》是动...

AI悦创原创
  • 数据分析
  • 数据分析实战 45 讲
  • 数据分析
  • 数据分析实战 45 讲
大约 10 分钟
18丨决策树(中):CART,一棵是回归树,另一棵是分类树
img 你好,我是悦创。 上节课我们讲了决策树,基于信息度量的不同方式,我们可以把决策树分为 ID3 算法、C4.5 算法和 CART 算法。今天我来带你学习 CART 算法。CART 算法,英文全称叫做 Classification And Regression Tree,中文叫做分类回归树。ID3 和 C4.5 算法可以生成二叉树或多叉树,而 CA...

AI悦创原创
  • 数据分析
  • 数据分析实战 45 讲
  • 数据分析
  • 数据分析实战 45 讲
大约 9 分钟
17 丨决策树(上):要不要去打篮球?决策树来告诉你
img 你好,我是悦创。 想象一下一个女孩的妈妈给她介绍男朋友的场景: 女儿:长的帅不帅? 妈妈:挺帅的。 女儿:有没有房子? 妈妈:在老家有一个。 女儿:收入高不高? 妈妈:还不错,年薪百万。 女儿:做什么工作的? 妈妈:IT 男,互联网公司做数据挖掘的。 女儿:好,那我见见。 在现实生活中,我们会遇到各种选择,不论是选择男女朋友,还是挑选水果,都是...

AI悦创原创
  • 数据分析
  • 数据分析实战 45 讲
  • 数据分析
  • 数据分析实战 45 讲
大约 19 分钟
02-标准差和方差「Standard Deviation and Variance」
差的意思是离正常有多远 Deviation just means how far from the normal 标准差 标准差是数值分散的测量。 标准差的符号是 σ (希腊语字母 西格马,英语 sigma) 公式很简单:方差的平方根。那么…… "方差是什么?” 方差 方差的定义是:离平均的平方距离的平均。 按照以下的步骤来计算方差: 求数值的 平均 ...

AI悦创原创
  • 数据分析
  • 数据分析
大约 2 分钟
2
3
4