在Kaggle AI展览国际象棋决赛的决定性对决中,OpenAI的o3模型以4-0击败了由埃隆·马斯克的xAI开发的Grok 4。这场比赛以萨姆·阿尔特曼的创作为胜,结束时的比分是4-0。两个系统在进入决赛之前,已经战胜了来自谷歌、Anthropic、DeepSeek和Moonshot AI的对手。
这场对决因创始人之间的波折历史而备受关注。阿尔特曼和马斯克十年前共同创立了OpenAI,但后来分道扬镳。在马斯克未能成功回购OpenAI后,阿尔特曼批评他的做法“过于激进”。马斯克在X上淡化了Grok的失利,称“xAI几乎没有投入资源于国际象棋”,并称其国际象棋技能是“副产品”。
现任国际象棋世界冠军马格努斯·卡尔森在评论决赛时给出了一个谦虚的评分评估:他将Grok的评分定在800 Elo左右,而o3则接近1200。作为参考,卡尔森自己的最高评分为2882。具有讽刺意味的是,当在X上被问及其实力时,Grok自我评估为1600-1800。
自从IBM的深蓝在1997年击败加里·卡斯帕罗夫以来,计算机在国际象棋中已经超越了人类。后来,谷歌的DeepMind开创了自学成才的游戏掌握。但Kaggle AI展览标志着现代LLM(如ChatGPT)的首次重大比赛。