
在OpenAI最新推出的旗舰语言模型GPT-5发布后,中国AI新创企业DeepSeek就要出招了。12日市场上突然传出,DeepSeek-R2大模型的预计发布时间为2025年8月15日至8月30日,但具体日期尚未官宣。
快科技报导,DeepSeek-R2是一款基于华为升腾910B(Ascend 910B)芯片集群训练的模型,在FP16精度下达到512PetaFLOPS的计算能力,芯片使用效率为82%。
据华为实验室统计,这个性能相当于辉达上一代A100训练集群的91%左右。至于这些是不是真实的,还有待观察,但看起来确实更强大、更自主了。
有分析师预计,DeepSeek-R2的定价可能显著低于OpenAI同类产品,预示着其可能颠覆现有AI服务的定价模式。
此外,还有相关消息显示,DeepSeek-R2预计比GPT-4成本下降97%;并且是在华为升腾AI芯片上做的训练,主打一个全方位全产业链的自主可控,性能不输辉达。
据相关人士透露的情况,DeepSeek-R2的总参数量可能会达到1.2兆,比DeepSeek-R1的6710亿参数增加大约一倍。
不过,此前今年曾多次传出DeepSeek-R2将发布的消息,但最终都没有下文。DeepSeek-R2早期计划指向2025年5月发布,但因技术进度和市场竞争因素被推迟。后来又有资讯指,发布时间被推至7月初。