课程主要是在于更好的优化data transform的时候data本身的优化处理:
Permutation importance:通过随机排列参数,凸显出哪些feature才是更重要的:随机排列之后,对validation影响比较大的是比较重要的,而几乎没什麽影响的就是不重要的;
Partial plots:查看不同的feature对预测的影响结果;结果很直观;
Shap values:查看所有的feature对预测的影响结果;结果可以得出多个推导;
查了一下partial plots和shap values到底有什麽区别:
https://medium.com/@scottmlundberg/good-questions-21052a61b808
partial plots:通过改变参数来改变预测结果的方式,来判断feature的重要性的;
Shap values:通过测试某些feature对特定sample的影响的方式,来判断feature的重要性;