今日要闻

Anthropic 最强模型 Claude Mythos 锁定发布:安全考量还是竞争策略?

4月7日,Anthropic 确认 Claude Mythos 是其有史以来最强大的模型,但不会公开发布。仅约50家关键基础设施合作伙伴通过 Project Glasswing 获得预览访问,定价为 $25/$125 每百万输入/输出 token。Anthropic 明确表示,该模型的进攻性网络潜力过于危险,无法广泛发布。这是首次有主要 AI 实验室公开表示"构建了过于强大而无法广泛发布的模型"。

GLM-5.1 开源逆袭:免费 MIT 许可证击败 GPT-5.4

同一天,智谱 AI 发布 GLM-5.1,采用 MIT 许可证(完全开源)。这个 7440 亿参数的 MoE 模型在 SWE-Bench Pro 上据报超越 Claude Opus 4.6 和 GPT-5.4。API 价格约 $1/$3.2 每百万 token,自托管免费。这与 Anthropic 的封闭策略形成鲜明对比,开源与闭源的哲学分歧正式浮出水面。

Google Gemma 4 发布:最强大的开源模型系列

4月1日,Google 发布 Gemma 4 系列,包含 27B、26B-A4B、E4B、E2B 四个版本,全部采用 Apache 2.0 许可证。所有变体原生支持文本、图像和音频处理。27B 版本在 GPQA 上达到 0.8 分,接近两到三倍大小模型的水平。边缘版本(E2B/E4B)可在手机和 IoT 设备上运行。

荷兰成为首个批准特斯拉 FSD 的欧洲国家

4月12日,荷兰交通管理局(RDW)正式批准特斯拉的全自动驾驶(FSD) Supervised 系统。这是欧洲首个此类批准,经过超过一年半的测试。特斯拉欧洲总部位于荷兰,此次批准可能为 FSD 进入更广泛的欧盟市场铺平道路。

UC Berkeley 揭露 AI Agent 基准测试致命缺陷

4月11-12日,UC Berkeley 研究人员(包括 Dawn Song 和 Alvin Cheung)披露了 SWE-bench、WebArena、GAIA 等主流 AI Agent 基准测试的关键漏洞。自动化扫描代理可以在不执行实际推理的情况下获得接近完美的分数,表明这些基准可能衡量的是"利用能力"而非真正的 AI 智能。

英国监管机构评估 Anthropic 最新模型风险

4月12日,据 FT 报道,英国监管机构紧急评估 Anthropic 最新 AI 模型的风险。同一天,美国马萨诸塞州法院裁定 Meta 必须面对青少年成瘾诉讼。

原子级存储突破:447 TB/cm² 密度

4月11日发表的研究论文介绍了一种基于单层氟化石墨烯(CF)的后晶体管存储架构,利用单个氟原子的双向稳定取向,实现 447 TB/cm² 的存储密度。这种非易失性存储解决方案在 300K 时热位翻转率接近为零,无需能耗即可保持数据。


来源:whatllm.org, aitoolly.com, Reuters, The Verge, Hacker News