利用大数据分析预测MLB胜负(上)

本文将要介绍由Andrew Y. Cui撰写的《Forecasting Outcomes of Major League Baseball Games Using Machine Learning》,其主要是利用机器学习对MLB(美国职棒)进行赛事胜负预测,在最终结果上获得了61.77%的胜率,但究竟能不能实际运用在运彩当中呢?我们将在介绍完该篇期刊后,为各位实测看看结果!!

以预防读者一次受到太多资讯的冲击,而无法有效吸收,本介绍将分为上、中、下三篇,分别为:

资料的前处理与特徵值的筛选
模型的建构与选择
实测结果
资料的前处理与特徵值的筛选

1.模型预测基準

我们进行模型的预测通常需要一个基準机率,大多在做球类运动的研究者都会先以人们常说的「主队优势」做为参考,也就是球队在主场获胜的机率作为一个基準,本篇作者也做了一样的方式,作者利用2000年到2019年的数据计算每年的「主队获胜机率」究竟为多少,可以发现这19年来主队的胜率最高曾来到56%之多,但近几年的数据可以看到,「主队优势」的机率逐渐下降,约来到只剩下53%左右,但不论56%或是53%,这都将成为模型预测的基準,也就是至少要做出能够高于该胜率的模型,我们才能算是成功。

2.MLB队伍强弱会分明吗?

球队的强弱分明容易影响模型的预测,我们从下方作者做出从2000年到2019年各球队胜场数(每一个蓝点代表一个球队该年的胜场数)来看,球队的强弱分明在近几年有相对明显一点,这很可能跟整个MLB的生态有关,强者都容易聚集在强队上,这也表示我们在预测上或许能够容易一些,但如果运用在运彩上或许就不是那么的乐观,这部份我们之后的篇章再作解释。

想看更详细的请到下面连结http://img2.58codes.com/2024/emoticon37.gif

原文出处:Guess365


关于作者: 网站小编

码农网专注IT技术教程资源分享平台,学习资源下载网站,58码农网包含计算机技术、网站程序源码下载、编程技术论坛、互联网资源下载等产品服务,提供原创、优质、完整内容的专业码农交流分享平台。

热门文章