别人看球,我让 AI 算球


世界杯期间,全世界都在看球、聊球、下注。

而我,一个连越位规则都搞不太清的人,正一个人埋头折腾 AI。

刷手机的时候,满屏都是世界杯——谁赢了、谁爆冷、谁该买。那一刻我突然冒出一个念头:既然所有人都在用自己的方式参与世界杯,那我能不能也掺和一脚——用我自己的玩法?

不是看球,不是聊球,更不是下注。是让 AI,把每一场比赛的结果,给我算出来。

这个专题,就是这个念头的产物。它不替你预测某一注该怎么买(我也没那个渠道,无意于此)。它只想老老实实地回答一个问题:

AI 到底能不能算准一场足球比赛?

而这篇文章,是我想在连载开始前,先跟你说清楚的三件事:我在做什么,我为什么做,以及——这件事,到底有没有意义。


第一部分:这套预测系统,是怎么搭出来的

进球,凭什么能被计算?

要预测比分,得先回答:进球这种又随机又稀少的事,凭什么能算?

答案藏在一个冷门的数学工具里——泊松分布。它的出身堪称黑色幽默。

1837 年,法国数学家泊松在研究一个奇怪的问题:普鲁士军队里,每年被战马踢死的士兵人数,遵循什么规律? 被马踢死,多么偶然、多么无厘头。可泊松发现,就连这种事,放到足够大的尺度上看,都服从一个稳定得吓人的数学规律。

进球,正是这样一种事件——稀少、随机,但每支队有一个”平均进球数”。把这个值交给泊松公式,它就能算出”进 0 球、1 球、2 球……”各自的概率。主客队一相乘,就是一张完整的比分概率矩阵

(顺带一个反直觉的事实:职业足球里,最常见的比分不是 0-0,而是 1-1。足球看着乱,骨子里铺着一层看不见的秩序。)

一个用来算”被马踢死”的公式,意外地成了足球预测的基石。

双向奔赴:我和 AI,一砖一瓦

我不会写代码。但我有一个想法,和一个愿意陪我把它实现的 AI。

这不是”我指挥 AI 打字”,也不是”AI 全自动帮我搞定”。是一场双向奔赴——我出想法和判断,它出知识和实现。

我说”我想算进球”,它告诉我有泊松分布;我问”平局老算不准怎么办”,它引出 Dixon-Coles 修正——两位英国统计学家发现纯泊松会低估平局,因为现实中两队进球会互相影响,于是加了修正项。它懂这些知识,但要不要用、为什么用,是我在判断。

最能体现这种”双向”的,是一个决定:我要求这套系统不能只活在自己的世界里,必须同时参考外部那些汇集了大量预测的数据,做交叉验证。这个判断不是 AI 想到的,是我提的——一个只信自己的预测器是危险的。而把它落地成代码,是 AI 的活。一个出方向,一个出实现,系统才真正立住。

还有一次,我想当然地用某种方法算胜负,是回测数据”打了我的脸”——AI 帮我跑了上千场历史比赛的严格检验(只用赛前数据、绝不偷看结果),结果显示另一种更简单的方法反而更准。于是我们改成双引擎分工:一个专算胜负,一个专绘比分

这是我学到最重要的一课:在陌生领域里,别信直觉,信回测。 而 AI,就是那个能在几小时内,帮你把直觉扔进上千场数据里检验的伙伴。

中间没少翻车——某个数学库的新版本会让程序莫名崩溃,得把它钉死在旧版本;图表的中文全变成乱码方框,只好改用英文……这些坑一个个填过来。奇妙的是,我一行代码没写,却清楚每一个坑是怎么来的。AI 没有替我”绕过”理解,而是带着我”穿过”了理解。


第二部分:然后,它把我带到了一个更大的问题前

系统搭好了,看着它吐出”法国 85% 赢""阿根廷大概率小胜”这些数字,我心里浮起一个挥之不去的念头。

拉普拉斯妖

1814 年,数学家拉普拉斯提出过一个著名设想,后人叫它**“拉普拉斯妖”**:假设有一个智者,知道宇宙此刻每一个粒子的状态,那么对它来说,未来和过去一样清晰——它能算出之后的一切。

如果这个”妖”真的存在,那意味着:从宇宙诞生那一刻起,一切就都定了。 你此刻的每一个念头,都只是那盘大棋里,一步早被算好的落子。

我搭的这套足球预测系统,本质上就是一只微缩的拉普拉斯妖。它在做的事一模一样——用已知的过去,推算未知的未来。

而这逼出了那个让人头皮发麻的问题:如果一场球能被算出来,那场上 22 个人的拼搏,是不是只是”实力数据”这个剧本的必然演出?再往下——把球员换成你。如果有一台足够强的机器,掌握你全部的过去,它是不是也能算出你下一秒的选择?那”你以为是你自己做的决定”,会不会只是一段还没运行到的代码?

它的答案:算不准。而这是最好的消息。

我跑了上万场数据,做了上千次回测。最终结论却让我松了口气:这套系统,算不准。

它能把”法国会赢”算到八九不离十。但它永远算不出那剩下的部分——第 90 分钟那脚 30 米外的世界波、门将一次匪夷所思的脱手、一个谁也没料到的瞬间。它能告诉你法国 85% 赢,但那 15% 里藏着什么,没有任何机器算得出来。

我曾诚实地把这个结论,连同模型的种种局限,一起写进了它的报告——承认它有算不到的地方,不是失败,恰恰是它最可信的地方。

而那算不出的 15%,我现在愿意叫它另一个名字:自由

如果足球 100% 能被算准,它就是一部提前知道结局的电影,没人会看。正因为最强的数据、最聪明的模型,依然摁不住那一片混沌,绿茵场上才有奇迹,弱队才敢做梦,我们才会为一个绝杀疯掉。 那只拉普拉斯妖也许理论上成立,但现实的复杂,远超任何机器能计算的边界。那超出的部分,是足球的自由意志,也是我们的。

我们不是被运行的程序。我们是那 15%。


第三部分:但请注意——算不准,不是让你去信玄学

这是最容易被误解、也是我最想说清的一点。

“机器算不准”这句话,很容易被引向一个危险的方向:“你看,再科学也算不准,所以别算了,凭感觉、信玄学吧。”

这是彻头彻尾的误读。

每逢大赛,总有各种声音冒出来:“某队有剧本""强队会控分""这场背后有人安排”……这些说法的共同点是:它们用一个无法验证、也无法证伪的’阴谋’,去替代真正的思考。 它们不是在面对不确定性,而是在逃避它——把一切看不懂的东西,塞进”有内幕”这个万能黑箱。

这恰恰是”算不准”的反面。

我搭这套系统的全部意义,不是证明”算不准所以认命”,而是示范另一种态度:世界有可以计算的部分,那就老老实实算清楚——用数据、用模型、用回测,逼近那 85% 的规律。世界也有算不尽的部分,那就诚实地承认它、敬畏它,把它标成一个概率,而不是编一个’剧本’糊弄自己。

理性的人,计算可算的,敬畏不可算的。 玄学的人,放弃计算可算的,再把不可算的,幻想成一个有人操控的阴谋。

那 15% 的混沌,不是玄学的入口,恰恰是理性的边界——你只有先认真计算过 85%,才有资格谈论剩下的 15% 到底是”自由”还是”意外”。那些连算都没算、上来就喊’有内幕’的人,谈的不是不确定性,是他们自己的偷懒。

所以,越是承认机器算不准,我们越要去计算。


这个专题,接下来会做什么

说回正题。

从现在起,每个比赛日,这套系统都会给当天的比赛出一份预测——胜平负的概率、最可能的比分。赛后,我会公开打分、公开认错:它对了几场,错在哪,和市场比谁更准。所有数据,累积在战绩看板里,谁都能查。

我不喊单,不荐彩。我只做一件事:让一套 AI 预测系统,在所有人面前,老老实实地接受现实的检验。

它大概率赢不了市场——这我早有心理准备。但这趟旅程真正颠覆我的,从来不是足球的输赢,而是 AI 本身

一个不懂球、不会编程的人,靠着和 AI 一句句对话,竟真的把一个完全陌生的领域,理解到了能动手建模、能做回测、能诚实给出概率的深度。这在三年前不可想象。

AI 给普通人最大的礼物,不是替你思考,而是当你想搞懂一个陌生世界时,它能成为你认知的杠杆。 足球今天能这么搞,明天,任何一个你想认真弄明白的领域,都能这么搞。

它不替你下结论,但它能陪你,把一团混沌,照成清晰的概率和规律——然后诚实地指给你看那条边界:这里之外,是谁都算不尽的。

学会用理性逼近世界,又坦然接受理性之外的惊喜。我想,这种”既清醒又谦卑”的能力,才是 AI 时代给我们每个人,最好的礼物。

那么——

如果世界杯的结果真能被算出来,我们还为什么要看球?

因为它算不出来。我们看的,正是那算不出的部分。

别人看球。我让 AI 算球。

接下来的每一个深夜,我们用数据见。