DeepSeek的徽标于2025年1月29日。
安德烈·鲁达科夫(Andrey Rudakov)|彭博|盖蒂图像
中国初创公司DeepSeek今年在整个市场上引起了冲击波,悄悄地发布了其人工智能推理模型的升级版本。
该公司没有官方宣布,但DeepSeek R1的升级是在AI模型存储库Hugging Face上发布的。
DeepSeek今年在其免费的开源R1推理模型优于包括Meta和Openai在内的竞争对手的产品上脱颖而出。低成本和短时间的发展时间震惊了全球市场,引发了人们担心美国科技巨头在基础设施上超支,并消除了数十亿美元的美国主要科技股票,例如AI Stalwart Nvidia。从那以后,这些公司已广泛康复。
就像DeepSeek R1的首次亮相一样,升级的模型也很少张贴。这是一个推理模型,这意味着AI可以通过分步逻辑思维过程执行更复杂的任务。
升级后的DeepSeek R1模型位于livecodebench上OpenAI的O4-Mini和O3推理模型的落后,该网站对不同的指标进行了基准模型。
尽管美国试图限制该国获得芯片和其他技术的访问,但DeepSeek已成为中国人工智能如何发展的海报孩子。本月,中国技术巨头 百度 腾讯揭示了他们如何使他们的AI模型更有效地处理美国半导体出口路缘。
Jensen Huang,首席执行官 Nvidia,设计了培训大型AI型号所需的图形处理单元,并在周三抨击了我们的出口控件。
黄说:“美国基于中国无法制作AI芯片的假设。” “这个假设总是值得怀疑的,现在显然是错误的。”
黄补充说:“问题不是中国是否会有AI。” “已经做到了。”
(Tagstotranslate)美国(T)Nvidia Corp(T)Baidu Inc(T)Tencent Holdings Ltd(T)Tencent Holdings Ltd(T)技术(T)生成AI(T)人工智能(T)人工智能(T)商业新闻
关键词: