科技行者

道奇队夺冠!是AI主导了棒球世界大赛的决策流程

道奇队的球迷苦苦等待了32年才见证这支队伍重新拿下世界大赛冠军。这32年之间,棒球运动无疑发生了巨大的变化。随着大量数据的涌现、先进的计算机与分析技术,如今基于数字的策略制定已经成为体育领域的核心力量。具体而言,AI(人工智能)正在主导其中的决策流程。

道奇队夺冠!是AI主导了棒球世界大赛的决策流程

在本届棒球世界大赛第六场比赛上,这种决策影响力得到再一次证明。当时,坦帕湾光芒队经理Kevin Cash毅然换下了当时在场上表现完美的投手Blake Snell。

Cash的决定似乎确实来自数据,但他的判断并未奏效。最终,道奇队在这场比赛中以3-1战胜了光芒队。

从这个角度来看,数据分析带来的不只有惊喜,同时也有风险与挑战。

带着这个问题,采访了AI领域的几位顶尖人士,下面来看他们的回应:

Sheldon Fernandez, Darwin AI公司CEO:

只有马后炮才能百分之百命中,但Cash临时决定换下Snell的举动确实说明将分析结果凌驾于常识判断之上可能带来的问题。在人工智能领域,我们有时会讨论“混杂变量”。这类变量掩盖了影响因素之间的正确关系,导致由纯数据驱动的决策效果受到影响。以本场比赛为例,数据本身也许表明Snell的自责分(ERA)要比替补队员Anderson更高,但其中还有某些样本量或者其他趋势性因素未能得到充分考虑。

当然,“直觉”本身也有严重的弊端。Terry Collins也做出过不够明智的决定——在2015年世界大赛第5场第9局的比赛中坚持让Matt Harvey上场。大都会队的球迷后来为此抱怨了好几年,并认为正是这项错误决定导致他们将冠军拱手赠予堪萨斯城队。

再有,即使是单从分析的角度出发,这项决定也同样难以理解:Snell当时状态正佳,而替补投手在过去五场比赛中都表现不佳。事实上,Cash回到替补席后,道奇队的替补们明显都松了一口气。这不禁让我想起一句格言:“分析的意义在于指导决策,而不是替你做出决策。”

Kathy Brunner, Acumen Analytics公司创始人:

击球手Corey Seager在过去整个赛季对左利手球员保持着0.218的得分,如果单从数字来看,那他就是一位过去6局比赛中打出73个好球的神人。但单从之前两周来看,他又连续6击未能得分。这两项数据哪个更准确?其实都不准确,也可以说都准确。棒球比赛本身就充满变数,随着数据的持续积累,当前赛季的赛场表现将被逐渐冲淡。面对类似的情况,坦帕湾光芒队明显认为整个赛季的数据比以往几场比赛的数据更重要。事实证明他们判断有误,相信在新一年中他们会重新调整模型,努力做出更准确的预测。

Tim Baumgartner, Laughlin Constable公司分析副总裁:

魔球理论彻底改变了棒球运动。事实证明,精打细算的普通球队确实可以利用数据分析的力量充分发挥自身优势,利用科学的阵容与各大传统强队一较高下。

但棒球运动本身既是科学又是艺术。体育竞技不是冷冰冰的电子表格,坦帕湾队的数据策略告诉他们,首发投手在第三次面对对方击球手时往往表现不佳。整个棒球大联盟的数据支持这一结论,不少球队也将此作为不容置疑的真理。

但在第6场冠军争夺赛中,这支由数据驱动的球队无疑过分依赖这一策略。他们的固执与僵化,最终让自己的领先优势与冠军希望付诸东流。

要说教训,球队们应该反省如何以及何时将定性与定量两大方法结合使用。更重要的是,传统强队也在利用自己的丰富资源进行同样的分析,所以未来的对抗除了球员自身以外、也将体现在谁对数据趋势吃得更透方面。

Omri Orgad, Luminati Networks公司北美地区总经理:

就像是《回到未来》里的场景,我们只能在现实中看到一个结果。但必须承认,数据分析本身仍然只是一种统计工具。虽然某些决定看似能够增加光芒队的获胜几率,但其永远不会是100%的保障。我们不应粗暴忽略其他选择:(1)Snell留在场上,光芒队仍然落败;(2)Snell留在场上,光芒队获胜。

数据与分析是管理人员的工具,但如何使其发挥积极作用——包括将光芒队送上冠军宝座,则是一项严峻的挑战。毕竟最终赢下比赛的只能是球员,而不是这些数据。

Michael Berthold, KNIME公司联合创始人兼CEO:

本轮比赛带来的教训其实很简单:使用大量数据点得出的决策,并不适合用于预测独立事件的未来走向,特别是像棒球世界大赛这类要么赢、要么输的有限结果场景。这类预测指向的只是几率,而非确切结果。

Cash先生可能掌握着大量统计数据,所以他的决策能够提高球队的获胜几率,但也就仅此而已。很遗憾,事情的走向与他的预期不同,进展不太顺利。但如果继续关注数据,他整个职业生涯中赢下的比赛肯定比其他只靠直觉的人多。如果放眼于未来十年,相信他仍然是一位非常成功的职业经理人。

Saif Ahmed, Kinetica公司机器学习产品负责人:

随着我们将分析技术应用于更多现实场景,大家必须消除对于数据科学可预测性问题的普遍误解。与其他科学方法一样,数据分析也是通过可重复的实验检验自身假设,而后生成关于几率的统计信息。注意,只是几率而非统一结果。如果Kevin Cash单凭数据模型做出决策,即使影响因素与他的模型完全匹配,成功的几率也仍然只是个统计数字——换言之,就算高达99%,实际结果也很可能落入余下这1%。归根结底,大家之所以热爱体育竞技,就是喜欢其中那种不可预测的魅力。

数据科学在这方面起不到决定性作用,但这并不影响我们将其作为值得依赖的好伙伴。我们可以质疑任何单一决策模型,但只要模型中的特征合理且能够准确反映过往情况,就应该把它纳入置信范围。另外,模型的透明度是关键,我们应该有能力观察模型使用了哪些变量。如果单一模型做出的决策值得怀疑,那么我们应该把握机会,重新审视模型本身并引入更多变量以准确捕捉决定性因素。与其他科学实验一样,数据科学也应该是一个动态的迭代过程。

Joe DosSantos, Qlik公司首席数据官:

我们这个行业很难单纯依靠数据分析,而体育行业似乎在这条路上走得太远、太急了。Cash换下Blake Snell只是体育领域“神奇”决策的又一次例证。美国橄榄球联盟球队陷入“让分”魔咒,AWS发布商业广告的决策流程也几乎没人能够理解……这一切,都让数据分析逐渐沦为一种玄学。

魔球理论确实存在,但要在162场比赛这样庞大的样本空间内才能奏效。统计学很重要,但心理学也同样重要。粗暴换下Snell虽然在数字层面有其意义,但却给粉丝和球员们带来严重的心理打击。过度依赖数字,不仅可能丢掉比赛,更可能丢掉人们的理解与支持。

关注科技行者公众号

即将跳转至电脑版页面您确认跳转吗?
取消 跳转