本文整理了2026年春节期间新发布的大模型、技术报告/ArXiv论文
今年年初发了不少新模型,感觉Seed和GLM的技术报告都写的不错,值得阅读,尤其是Seed从产品的角度介绍模型,有意思。🧐
Seed 2.0
字节Seed:https://seed.bytedance.com/zh/seed2
技术报告:https://seed.bytedance.com/zh/blog/seed-2-0-official-launch 技术报告PDF
- 大多数人用Seed还是debug多一点。(我觉得也可能是因为字节自己的coding工具调用seed太多导致)
- 从榜单来看,Seed在多模态领域更好一点,其他的一般。
字节Seeddance2.0(视频生成):https://seed.bytedance.com/zh/seedance2_0
GLM-5
智谱GLM:https://z.ai/blog/glm-5
技术报告:https://arxiv.org/abs/2602.15763

- GLM-5完成了国产七大GPU的适配。
- GLM-5重点是做通用Agent的基座,这和智谱公司的定位一致。

Qwen3.5
Qwen3.5: https://qwen.ai/blog?id=qwen3.5
技术报告:未发布
DeepSeek
25年12月发布V3.2后,似乎在网站上有更新新模型,但未公开发布技术报告
