Arena.ai (LMArena)mediumconfig v3
GLM-5.2 Max 在 Text Arena 总榜列第25,细分项目较前代在多轮与专业场景提升
摘要与判断
Arena.ai 发布的对比称,GLM-5.2 Max 在 Text Arena 总排名第25,整体表现与 GLM-5.1 接近,但在 Expert Arena、多轮对话,以及生命科学、物理与社会科学、创意写作、医疗健康等职业类目中提升更明显。该结果说明新模型虽未带来总榜位次跃升,但在复杂交互和专业任务上的能力优化更直接影响模型选型与场景落地判断。
Topics
大模型公司新进展
引用和原文
Trace
- Raw Item
- raw_a9ab582a2858496d
- Processed Item
- processed_218ba5102c2d4a08
- Source
- source_x_arena
- LLM Logs
- llm_459d908c86874585
- Coze Loop
- 3fcac575747b2a56134db2a507b40f83