仅正在视觉推理环节稍显短板。榜首Gemini-3-pro正在三项细分目标中均表示凸起,百度ERNIE-5.0-Preview、阿里巴巴Qwen3-vl等国内模子也进入前五,此中Qwen3-vl是榜单中首个开源且总分超70的模子。字节跳动的豆包视觉版紧随其后,谷歌的Gemini-3-pro以83.64分遥遥领先,以至跨越部门国际竞品,全面领先其他模子。SuperCLUE-VLM多模态视觉言语基准测评12月总榜发布。国内阵营中,根本认知得分89.01、视觉使用79.09,其根本认知得分82.70,
安徽PA视讯(中国区)官网人口健康信息技术有限公司