中国DeepSeek通过R1模型升级提升人工智能竞争
周四,中国人工智能初创公司DeepSeek发布了其R1推理模型的升级版,加剧了与OpenAI等美国公司在代码生成领域的竞争。
新版本名为R1-0528,在开发者平台hug Face上悄然发布,没有官方公告或技术文档。
尽管发布低调,但该模型在出现在LiveCodeBench排行榜(由加州大学伯克利分校、麻省理工学院和康奈尔大学的研究人员开发的基准排行榜)后迅速引起了关注。
升级后的R1在代码生成性能上仅次于OpenAI的o4 mini和o3,但领先于xAI的Grok 3 mini和阿里巴巴的Qwen 3。
DeepSeek的代表将此次发布描述为一个私人微信小组的“小规模试用升级”,并补充说用户可以立即开始测试该模型。
今年1月,DeepSeek首次推出了R1模型,引起了全球的关注,该模型的性能与美国领先的模型相当,但所需的计算能力和成本却大大降低。
这一举措令中国以外的人工智能相关公司股价暴跌,并挑战了大规模投资和基础设施对人工智能竞争规模至关重要的假设。
作为回应,OpenAI和b谷歌旗下的Gemini等主要公司已经调整了定价和型号。OpenAI发布了o3 mini,而Gemini则推出了折扣访问层。
包括阿里巴巴(9988.HK)和腾讯(0700.HK)在内的中国科技巨头也推出了新机型,其中一些声称其性能超过了DeepSeek的R1。
业内观察人士继续关注R2的发布,这是DeepSeek预期的R1的继任者。据报道,该公司最初计划在5月发布R2。
除了推理模型,DeepSeek还在3月份发布了V3大型语言模型的更新。
周四,中国人工智能初创公司DeepSeek发布了其R1推理模型的升级版,加剧了与OpenAI等美国公司在代码生成领域的竞争。
新版本名为R1-0528,在开发者平台hug Face上悄然发布,没有官方公告或技术文档。
尽管发布低调,但该模型在出现在LiveCodeBench排行榜(由加州大学伯克利分校、麻省理工学院和康奈尔大学的研究人员开发的基准排行榜)后迅速引起了关注。
升级后的R1在代码生成性能上仅次于OpenAI的o4 mini和o3,但领先于xAI的Grok 3 mini和阿里巴巴的Qwen 3。
DeepSeek的代表将此次发布描述为一个私人微信小组的“小规模试用升级”,并补充说用户可以立即开始测试该模型。
今年1月,DeepSeek首次推出了R1模型,引起了全球的关注,该模型的性能与美国领先的模型相当,但所需的计算能力和成本却大大降低。
这一举措令中国以外的人工智能相关公司股价暴跌,并挑战了大规模投资和基础设施对人工智能竞争规模至关重要的假设。
作为回应,OpenAI和b谷歌旗下的Gemini等主要公司已经调整了定价和型号。OpenAI发布了o3 mini,而Gemini则推出了折扣访问层。
包括阿里巴巴(9988.HK)和腾讯(0700.HK)在内的中国科技巨头也推出了新机型,其中一些声称其性能超过了DeepSeek的R1。
业内观察人士继续关注R2的发布,这是DeepSeek预期的R1的继任者。据报道,该公司最初计划在5月发布R2。
除了推理模型,DeepSeek还在3月份发布了V3大型语言模型的更新。