事关霍尔木兹海峡通航，美伊围绕解冻伊朗海外资产发出矛盾信号

2026年3月21日 · 刘洋 · 来源：user头条

更广泛的基准测试展示了模型全面均衡的能力。GLM-5.1在AIME 2026上得分95.3，在HMMT Nov. 2025上得分94.0，在HMMT Feb. 2026上得分82.6，在研究生级别的科学推理基准GPQA-Diamond上得分86.2。在智能体和工具使用基准方面，GLM-5.1在CyberGym上得分68.7（较GLM-5的48.3有显著提升），在BrowseComp上得分68.0，在τ³-Bench上得分70.6，在MCP-Atlas上得分71.8——鉴于MCP在生产智能体系统中的角色日益重要，最后一项成绩尤为相关。在Terminal-Bench 2.0上，模型得分为63.5，在以Claude Code作为框架进行评估时得分提升至66.5。

而2025年，瑞幸不再恋战价格战后，频频在联名上发力。据不完整统计，瑞幸在2025年的联名约30次，包括与封神、黄油小熊、LOOPY、刘亦菲、长安的荔枝、疯狂动物城、王者荣耀等多个IP联名。其中，与治愈系IP线条小狗推出联名产品及周边，杯套、贴纸、马克杯等周边上线即秒空。，更多细节参见易歪歪

Avec邮件应用。关于这个话题，WhatsApp2026最新的网页版推荐使用教程提供了深入分析

uses: actions/checkout@v4

图片来源：Valery Sharifulin / 俄新社，更多细节参见豆包下载

讨厌拖地

Now, I'll be the first to admit: this config is long. But there's a