【ML】分类模型的评估

#混淆矩阵 Confusion Matrix
B站入门讲解
sklearn中混淆矩阵(confusion_matrix函数)的理解与使用
运行博客二中的代码:

from sklearn.metrics import confusion_matrix

y_true = ["cat", "ant", "cat", "cat", "ant", "bird"]
y_pred = ["ant", "ant", "cat", "cat", "ant", "cat"]
confusion_matrix(y_true, y_pred, labels=["ant", "bird", "cat"])
array([[2, 0, 0],
       [0, 0, 1],
       [1, 0, 2]], dtype=int64)

labels表示,行,列的标签顺序为["ant", "bird", "cat"]。通过观察对角线(预测正确的次数),第一个数据是ant被预测为ant的次数,为2次,bird被预测为bird的次数为0次,cat被预测为cat的次数为2次.

debug
ValueError: At least one label specified must be in y_true

准确率 (Accuracy) 精确率 (Precision) 召回率 (Recall) F1值

B站
(模型)准确率:所有正确预测分类的数据 / 所有数据
精确率:预测正确的正样本 / 所有预测为正的样本
召回率:预测正确的正样本 / 测试集中所有正样本数