(博客主亲自录制视频教程,QQ:231469242)
python脚本
"""项目合作QQ:231469242这个系数的取值范围是[-1,1],实际应用中,一般是[0,1]这个系数的值越高,则代表模型实现的分类准确度越高"""def kappa(matrix): n = np.sum(matrix) sum_po = 0 sum_pe = 0 for i in range(len(matrix[0])): sum_po += matrix[i][i] row = np.sum(matrix[i, :]) col = np.sum(matrix[:, i]) sum_pe += row * col po = sum_po / n pe = sum_pe / (n * n) # print(po, pe) return (po - pe) / (1 - pe)#其中,matrix是一个方阵,若共有i个类别,则matrix.shape = (i,i). #用下面的代码进行测试:import numpy as npmatrix = [ [239,21,16], [16,73,4], [6,9,280]]matrix = np.array(matrix)print(kappa(matrix))
参考链接:
引言
分类是机器学习中监督学习的一种重要应用,基于统计的机器学习方法可以使用SVM进行二分类,可以使用决策书,梯度提升树等进行多分类。 对于二分类模型,我们通常可以使用ROC曲线来评估模型的预测效果。这里,我们介绍一下在多分类中衡量模型评估准确度的一种方法–kappa系数评估方法。
Kappa系数
首先,我们介绍一下kappa系数: kappa系数是用在统计学中评估一致性的一种方法,我们可以用他来进行多分类模型准确度的评估,这个系数的取值范围是[-1,1],实际应用中,一般是[0,1],与ROC曲线中一般不会出现下凸形曲线的原理类似。 这个系数的值越高,则代表模型实现的分类准确度越高。kappa系数的计算方法可以这样来表示: