About 64,600 results
Open links in new tab
  1. 模型代码编程能力评测排行榜 | DataLearnerAI

    Oct 12, 2025 · SWE-bench Verified LiveCodeBench HumanEval ... 更多评测 ... 全部 3B及以下 7B 13B 34B 65B 100B及以上 全部 推理大模型 基座大模型 指令优化/聊天优化大模型 编程大模型

  2. 2026 年开源大模型 TOP10 完整榜单 - 知乎

    2026 年开源大模型 TOP10 完整榜单 中国力量主导,MoE 架构一统江湖前言2026 年,开源大模型彻底告别“参数内卷”,进入 效率优先、场景为王、生态成熟的普惠时代。 本文基于 Hugging Face 下载量 …

  3. 模型排名 - HelloGitHub

    通过让用户与两个匿名模型对话并选择更好的回答,使用 Elo 评分系统计算模型的相对实力。 该排行榜覆盖文本、视觉、代码等多个能力维度,是目前最权威的 LLM 评测榜单之一,基于此榜单我们做了

  4. 2026 年开源大模型 TOP10 完整榜单 国产模型选型指南

    2026 开源大模型 TOP10 榜单重磅发布!详解千问 3.5、GLM-5 等主流模型核心优势、适用场景,解析 MoE 架构趋势,为 AI 开发者、企业提供专业的开源大模型选型与落地参考。

  5. 基于2026年2月最新榜单与实测,给出国内大模型排名、核心能力、选型建议与行业趋势,可直接用于决策与汇报。国内大模型

    基于2026年2月最新榜单与实测,给出国内大模型排名、核心能力、选型建议与行业趋势,可直接用于决策与汇报。国内大模型研究报告(2026.02 最新版)一、核心结论速览• 格局:从“百模大战”收敛为 …

  6. 编程能力哪家强(2026年初) - 少数派

    o3也是第一个能用来写代码的openai模型,在此之前的4o、4.1什么的,没一个能打的 等等,gemini去哪了,怎么没提到他 原因是gemini无论2.5pro还是3 pro,用来写代码都一般,只比国产模型强那么一 …

  7. 【AI】2025 世界各模型的编程能力排行 - CSDN博客

    Nov 6, 2025 · 以下排名 仅考察“模型本身写代码的能力” (算法、数据结构、调试、复杂工程), 不考察论文、数学推理、多模态。 数据来自 2025-08 公开基准(LiveCodeBench v5、CodeForces …

  8. SuperCLUE中文大模型测评基准-AI评测榜单

    这里是中文大模型能力对比的权威平台,为您提供全面、客观的大模型性能评估和排行榜单。SuperCLUE是独立、领先的中文通用大模型综合性测评基准,涵盖通用、文本、多模态、推理 …

  9. AI大模型评测榜单 - 实时排名 - DataLearnerAI

    Nov 8, 2025 · 查看最新AI大模型在MMLU Pro、HLE、SWE-Bench等主流评测基准上的性能排名。 DataLearner提供实时更新的榜单,支持模型对比,助您快速评估和选择最佳模型。

  10. 80%到25%逆转!大模型代码能力最新排名:Anthropic不再是唯一的神?

    Jun 12, 2025 · 它本身不开发自己的模型,而是作为一个中间层平台,将来自不同顶级提供商(如OpenAI、Google、Anthropic、deepseek、Meta等)的众多模型整合到一个统一 ...