roc曲线制作具体步骤 roc曲线教程


roc曲线制作具体步骤 roc曲线教程

文章插图
大家好,小跳来为大家解答以上的问题 。roc曲线教程,roc曲线制作具体步骤这个很多人还不知道,现在让我们一起来看看吧!
1、正因为我们比较关注正例的情形,所以设置了两个相应的指标:TPR与FPR 。
2、TPR:True Positive Rate,将实际的1正确地预测为1的概率,d/(c+d) 。
3、FPR:False Positive Rate,将实际的0错误地预测为1的概率,b/(a+b) 。
4、TPR也称为Sensitivity(即生物统计学中的敏感度) , 在这里也可以称为“正例的覆盖率”——将实际为1的样本数找出来的概率 。
5、覆盖率是重要的指标,例如若分类的目标是找出潜在的劣质客户(响应变量取值为1),则覆盖率越大表示越多的劣质客户被找出 。
6、类似地,1-FPR其实就是“负例的覆盖率”,也就是把负例正确地识别为负例的概率 。
7、TPR与FPR相互影响,而我们希望能够使TPR尽量地大,而FPR尽量地小 。
8、影响TPR与FPR的重要因素就是上文提到的“阈值” 。
9、当阈值为0时,所有的样本都被预测为正例,因此TPR=1,而FPR=1 。
10、此时的FPR过大,无法实现分类的效果 。
11、随着阈值逐渐增大,被预测为正例的样本数逐渐减少,TPR和FPR各自减小,当阈值增大至1时,没有样本被预测为正例,此时TPR=0,FPR=0 。
【roc曲线制作具体步骤 roc曲线教程】12、由上述变化过程可以看出,TPR与FPR存在同方向变化的关系(这种关系一般是非线性的),即,为了提升TPR(通过降低阈值),意味着FPR也将得到提升,两者之间存在类似相互制约的关系 。
13、我们希望能够在牺牲较少FPR的基础上尽可能地提高TPR,由此画出了ROC曲线 。
14、ROC曲线的全称为“接受者操作特性曲线”(receiver operating characteristic)当预测效果较好时 , ROC曲线凸向左上角的顶点 。
15、平移图中对角线,与ROC曲线相切,可以得到TPR较大而FPR较小的点 。
16、模型效果越好,则ROC曲线越远离对角线,极端的情形是ROC曲线经过(0,1)点,即将正例全部预测为正例而将负例全部预测为负例 。
17、ROC曲线下的面积可以定量地评价模型的效果,记作AUC,AUC越大则模型效果越好 。
18、由于ROC曲线描述了在TPR与FPR之间的取舍,因此我一般将其理解为投入产出曲线 , receive of cost 。
19、(事实上我理解错了 。
20、相对而言lorenz曲线更适合这个名字 。
21、当然啦其实FPR可以理解为另一种cost 。
22、2010.10.15)当我们分类的目标是将正例识别出来时(例如识别有违约倾向的信用卡客户),我们关注TPR,此时ROC曲线是评价模型效果的准绳 。
本文到此分享完毕,希望对大家有所帮助 。