在上一篇文章中,我们介绍了作者最终挑选模了Elastic net (L1+L2) penalty regularization(弹性网路正规化)作为最后的预测模型,那么我们现在有了特徵值跟预测模型这么明确的目标,那么我们一定要来实测看看究竟运用在运彩上是不是能够得到优异的结果呢?
数据前处理
1.资料抓取与整理
首先我们必须要先处理好所需的数据,我们先去爬取与计算需要的特徵值,我们的数据期间是以2015年赛季到2021年赛季共7年的比赛,并按照作者筛选掉先发投手平均首发低于12场的比赛
2.特徵重要性
我们也进行了特徵重要性的观察,发现的确就算我们抓取到最新2021年的数据,「上垒率」仍然是影响比赛胜负中最重要的因子
3.模型準确度
我们以2015年到2020年6年的期间作为模型训练,而2021年整赛季的数据则做为我们模型最终要实战的数据,但我们实测的结果在2021年模型的準确度其实只有57.24%,是低于期刊中所显示的61.77%,这也有可能跟我们训练的期间长短或是最终验证的期间差异有关,因为作者是以2016年到2019年4年的数据做出61.77%,可能刚好在2021年的表现只能获得57.24%,但不论57.24%或是61.77%,我们都必须要能实际运用在运彩投注上才行
没看过中上篇的人可以去看看唷!!
利用大数据分析预测MLB胜负(上)
利用大数据分析预测MLB胜负(中)
想要阅读完整内容可以浏览原文
原文出处 : Guess365