千问3.5实现了底层模型架构的全面革新,此次发布的Qwen3.5-Plus版本总参数为3970亿,激活仅170亿,以小胜大,性能超过万亿参数的Qwen3-Max模型,部署显存占用降低60%,推理效率大幅提升,最大推理吞吐量可提升至19倍。Qwen3.5-Plus的API价格每百万Token低至0.8元,仅为Gemini 3 pro的1/18。
千问3.5在文本和视觉的混合数据上预训练,实现了原生多模态的新突破,在推理、编程、Agent智能体等全方位基准评估中均表现优异,并在视觉理解能力的权威评测中斩获数项性能最佳。
据悉,千问APP、PC端已第一时间接入Qwen3.5-Plus模型。开发者可在魔搭社区和HuggingFace下载新模型,或通过阿里云百炼直接获取API服务。
阿里巴巴Qwen团队9月8日在OpenRouter上架了Qwen Plus 0728的两款模型,分别为不带思考和带思考的版本,可以通过API使用。
官方介绍:Qwen Plus 0728基于Qwen3基础模型,是一个性能、速度、成本组合均衡的拥有100万上下文的混合推理模型。
来自阿里云页面的介绍:Qwen Plus能力均衡,推理效果、成本和速度介于Max和Flash之间,适合中等复杂任务。
价格:
输入0.4美元/每百万tokens
输出1.2美元/每百万tokens
OpenRouter链接:
Qwen Plus 0728
Qwen Plus 0728(thinking)
via 匿名
阿里巴巴Qwen今日在官网和OpenRouter上线了最新的Qwen-3-Max-Preview模型。根据官网描述,该模型是Qwen系列中最强大的模型。
有关地址如下:
● 官网:Qwen Chat
● OpenRouter
该模型在OpenRouter上的介绍和价格如下:
Qwen3-Max是基于Qwen3系列的更新,与2025年1月版本相比,在推理、指令跟随、多语言支持和长尾知识覆盖方面提供了重大改进。它在数学、编码、逻辑和科学任务中提供更高的准确性,更可靠地遵循中文和英文的复杂指令,减少幻觉,并为开放式问答、写作和对话生成更高质量的响应。
该模型支持超过100种语言,具有更强的翻译和常识推理能力,并针对检索增强生成(RAG)和工具调用进行了优化,尽管其不包括专门的“思考”模式。
● 输入:1.20 美元(现汇率约合 8.6 元人民币)/每百万 tokens
● 输出:6 美元(现汇率约合 42.8 元人民币)/每百万 tokens
via 匿名