QwQ-32B - 数字经济网

多家海外AI平台接入阿里千问QwQ-32B

自3月6日发布以来，通义千问QwQ-32B稳居全球最大AI开源社区HuggingFace趋势榜榜首，成为当前最受欢迎的开源大模型之一，多家海外AI平台宣布接入。AI平台SambaNova Systems全…

近期的研究表明，强化学习可以显著提高模型的推理能力。例如，DeepSeek-R1 通过整合冷启动数据和多阶段训练，实现了最先进的性能，使其能够进行深度思考和复杂推理。这一次，我们探讨了大规模强化学习（R…