上QQ阅读APP看书,第一时间看更新
1.6 练习题
回答以下问题非常重要。你正在构建ML基础,不要跳过此步骤!
1.给定一个包含1000个带有标签的示例的数据集,如果想在训练、验证和测试阶段测试有监督学习算法的性能,同时又要使用准确率作为唯一度量指标,该怎么办?
2.有监督学习和无监督学习有什么区别?
3.精度和召回率有什么区别?
4.高召回机制中的模型比低召回机制中的模型产生更多或是更少的假阳性?
5.混淆矩阵只能用于二分类问题吗?如果不是,我们如何在一个多分类问题中使用它?
6.一分类问题是有监督学习问题吗?如果是,为什么?如果不是,为什么?
7.如果二元分类器的AUC为0.5,可以从中得出什么结论?
8.写出精度、召回率、F1分数和准确率的公式。为什么F1很重要?精度、准确率和召回率之间有关系吗?
9.用真阳性率和假阳性率绘制ROC曲线。ROC曲线的目的是什么,真阳性率/假阳性率与精度/召回率之间有没有关系?提示:用数学来描述。
10.什么是维度诅咒?
11.什么是过拟合和欠拟合?
12.模型的学习能力是什么?是否与过拟合/欠拟合有关?
13.写出Lp范数公式——这是测量点间距离的唯一方法吗?
14.我们怎么能说一个数据点与另一个数据点相似呢?
15.什么是模型选择?为什么它很重要?