一个引人入胜的 实验正在进行中 ,在Twitch上,Claude 3.7 Sonnet,一个由Anthropic开发的人工智能,正在以不同的成功率挑战《口袋妖怪 红版》,这是它连续第三天的尝试。观众们正在实时见证它的“思维过程”。早在2014年,数百万玩家通过聊天共同控制一个角色,参与Twitch Plays Pokémon项目。现在,局势发生了变化,一个孤独的人工智能正在缓慢而有条不紊地解决为90年代孩子设计的难题。
任务的开始对人工智能来说同样具有挑战性,就像对许多童年玩家一样。之前的版本Claude 3.5 Sonnet甚至无法离开起始房屋。相比之下,“高级”版本3.7 Sonnet在其前24小时内成功获得了三个道馆徽章。然而,它的胜利中夹杂着一些有趣的失误:人工智能花了几个小时卡在一堵石墙前,才弄明白如何绕过它,而在小茂的实验室里,它两次把小茂误认为是另一位穿白大褂的NPC。
对于Twitch的老玩家来说,这个直播是对2014年标志性实验的怀旧致敬,当时成千上万的聊天指令共同控制角色,创造了超现实的游戏体验。Anthropic选择这个游戏并非偶然:《口袋妖怪 红版》的机制要求顺序行动,使其成为人工智能“推理”的完美测试场。与其前任不同,Claude 3.7 Sonnet不仅仅是对刺激做出反应;它制定多步骤计划——尽管速度像一只跳舞的呆呆兽。
然而,即使这个先进的算法也面临着人类玩家不熟悉的挑战,例如需要“理解”没有独特精灵的NPC不是关键角色。虽然一些人将这个直播视为技术突破,但另一些人则将其视为现代游戏的苦乐参半的隐喻。十年前,Twitch通过混乱的合作将人们团结在一起。现在,这个平台展示了人工智能的成就,突显了技术的进步——以及游戏环境的变化。
帖子已翻译 显示原文 (EN)
Arkadiy Andrienko

