快科技4月30日消息,日前,阿里巴巴发布并开源新一代通义千问模型Qwen3,参数量仅为DeepSeek-R1的1/3,成本大幅下降,性能则全面超越DeepSeek-R1、OpenAI-o1等全球顶尖模型,登顶全球最强开源模型。
Qwen3发布当天,摩尔线程宣布,其率先完成了Qwen3全系列模型在全功能GPU上的高效支持。
摩尔线程表示,这一成果充分验证了MUSA架构和全功能GPU的技术成熟度与可靠性。
目前,主流推理引擎均可基于摩尔线程MUSA平台运行Qwen3系列模型。
摩尔线程称,MUSA平台能够作为vLLM、Ollama、GPU Stack等各类主流开源推理引擎的后端,为Qwen3系列模型的高效运行提供强大动力。
例如,QWen3-235B-A22B(Qwen3系列最大参数量模型),基于vLLM-MUSA引擎在摩尔线程全功能GPU上稳定运行。
据了解,此次开源的两款MoE模型是Qwen3-235B-A22B和Qwen3-30B-A3B;同时还包括六个Dense模型:Qwen3-32B、Qwen3-14B、Qwen3-8B、Qwen3-4B、Qwen3-1.7B和Qwen3-0.6B。
【本文结束】如需转载请务必注明出处:快科技
责任编辑:拾柒
0 条