Class 4 - Convolutional Neural Networks cont.
1.ImageNet挑战赛与深度学习的革命 1.1. K-最近邻(K-Nearest Neighbors, K-NN)算法 1.1.1. CIFAR-10 数据集 CIFAR-10数据集 * 它包含60000张非常小的彩色图片(32×32 像素)。 * 这些图片共分为10个类别,例如飞机、汽车、鸟、猫等。 这个数据集在机器学习领域非常经典,可以把它想象成是图像分类任务的“新手村”。我们的目标就是训练一个模型,让它能够正确识别出任意一张CIFAR-10图片属于哪个类别。 K-NN的思想非常直观,可以概括为“近朱者赤,近墨者黑”。要判断一个新样本(测试图片)属于哪个类别,我们不进行复杂的“学习”,而是直接在所有已知样本(训练图片)中找到和它最相似的K个邻居,然后采取“少数服从多数”的原则,看这K个邻居中哪个类别的数量最多,就把新样本归为那一类。 要实现这个算法,有两个关键问题需要解决: 1. 如何衡量两张图片之间的“…