Alibaba'nın bulut departmanı, resmi WeChat hesabında yaptığı duyuruda şunları söyledi: "Qwen 2.5-Max, neredeyse her alanda GPT-4o, DeepSeek-V3 ve Llama-3.1-405B'yi geride bırakıyor." Burada bahsedilen modeller, OpenAI ve Meta'nın en gelişmiş açık kaynaklı yapay zeka modelleri.
Modelin ölçeklenebilirliği ile ön plana çıkıyor. Qwen 2.5 Max 20 trilyondan fazla tokenla eğitildi ve insan geri bildirimleriyle düzenlendi. Ayrıca Deepseek-R1 gibi takviyeli öğrenme yoluyla daha da rafine edildi.