埃隆·马斯克的xAI推出了Grok 4,这是其旗舰人工智能的最新版本。开发者宣布Grok 4在逻辑推理和处理学术任务方面取得了显著进展,核心增强集中在其分析信息和解决复杂问题的能力上。根据xAI的说法,该模型现在在涵盖数学、物理和编程的测试中表现达到博士水平。
Grok 4的主要特点:
多智能体模式(仅限重型层):为了应对复杂问题,多个AI“助手”可以并行工作,交换数据以完善答案并提高准确性。在具有挑战性的“人类最后考试”基准测试中,这种方法的正确答案率达到了44.4%(而标准模式为25%)。
学术能力:Grok 4在2025年美国邀请数学考试(AIME)中的问题上得到了完美的100%。在测试抽象推理的严格ARC-AGI基准测试中,其结果几乎是竞争模型的两倍。
增强语音模式:更新的语音聊天功能现在支持多种语调、低语甚至唱歌。
新功能:一个实验性功能允许根据文本描述创建简单的视频游戏。该模型还可以分析数据以预测体育赛事的结果,尽管这些预测的准确性尚未披露。
基础版本的月费为30美元。Grok 4重型层的月费为300美元。虽然Grok 4的公告宣传了其卓越的能力,但xAI通常在新模型发布时不提供完整的数据或演示访问以供独立验证。用户在订阅付费计划后被邀请评估AI的表现。