Arena.ai (LMArena)mediumconfig v3

GLM-5.2 Max 在 Text Arena 总榜列第25,细分项目较前代在多轮与专业场景提升

摘要与判断

Arena.ai 发布的对比称,GLM-5.2 Max 在 Text Arena 总排名第25,整体表现与 GLM-5.1 接近,但在 Expert Arena、多轮对话,以及生命科学、物理与社会科学、创意写作、医疗健康等职业类目中提升更明显。该结果说明新模型虽未带来总榜位次跃升,但在复杂交互和专业任务上的能力优化更直接影响模型选型与场景落地判断。

Topics

大模型公司新进展

引用和原文

Trace

Raw Item
raw_a9ab582a2858496d
Processed Item
processed_218ba5102c2d4a08
Source
source_x_arena
LLM Logs
llm_459d908c86874585
Coze Loop
3fcac575747b2a56134db2a507b40f83