本文将要介绍由Andrew Y. Cui撰写的《Forecasting Outcomes of Major League Baseball Games Using Machine Learning》,其主要是利用机器学习对MLB(美国职棒)进行赛事胜负预测,在最终结果上获得了61.77%的胜率,但究竟能不能实际运用在运彩当中呢?我们将在介绍完该篇期刊后,为各位实测看看结果!!
以预防读者一次受到太多资讯的冲击,而无法有效吸收,本介绍将分为上、中、下三篇,分别为:
资料的前处理与特徵值的筛选
模型的建构与选择
实测结果
资料的前处理与特徵值的筛选
1.模型预测基準
我们进行模型的预测通常需要一个基準机率,大多在做球类运动的研究者都会先以人们常说的「主队优势」做为参考,也就是球队在主场获胜的机率作为一个基準,本篇作者也做了一样的方式,作者利用2000年到2019年的数据计算每年的「主队获胜机率」究竟为多少,可以发现这19年来主队的胜率最高曾来到56%之多,但近几年的数据可以看到,「主队优势」的机率逐渐下降,约来到只剩下53%左右,但不论56%或是53%,这都将成为模型预测的基準,也就是至少要做出能够高于该胜率的模型,我们才能算是成功。
2.MLB队伍强弱会分明吗?
球队的强弱分明容易影响模型的预测,我们从下方作者做出从2000年到2019年各球队胜场数(每一个蓝点代表一个球队该年的胜场数)来看,球队的强弱分明在近几年有相对明显一点,这很可能跟整个MLB的生态有关,强者都容易聚集在强队上,这也表示我们在预测上或许能够容易一些,但如果运用在运彩上或许就不是那么的乐观,这部份我们之后的篇章再作解释。
想看更详细的请到下面连结
原文出处:Guess365