您的位置:主页 > 看点 > 科技 > 正文：

中国初创企业开发低成本大模型性能比拟ChatGPT

时间:2024-12-29 10:10 来源:联合早报 ■ 佚名点击: 次

（香港综合讯）中国一家初创企业成功以较低成本开发出能比拟ChatGPT的大语言模型（LLM）。
总部位于杭州的DeepSeek星期四（12月26日）在微信公众号称，DeepSeek-V3在多项评测成绩中超越了Meta开发的Llama-3.1，并在性能上与OpenAI开发的闭源模型GPT-4o不分伯仲。
据《南华早报》报道，在较高性价比的新训练架构下，DeepSeek的训练成本仅558万美元（758万新元），训练时长仅两个月，远低于GPT-4o逾1亿美元的成本及约三个月的训练时长。
DeepSeek在训练过程中仅使用2048个英伟达为中国市场定制的H800晶片，而据估算GPT-4o至少使用了上万个更先进的H100晶片来训练。

免责声明：华夏传媒网本栏目发布信息，目的在于传播更多信息，丰富网络文化，稿件仅代表作者个人观点，与华夏传媒网无关。其原创性以及文中陈述文字和内容未经本网证实，对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本网不作任何保证或承诺，请读者仅作参考，并请自行核实相关内容。凡注明为其他媒体来源的信息，均为转载自其他媒体，转载并不代表本网赞同其观点，也不代表本网对其真实性负责。您若对该稿件内容有任何疑问或质疑，请即华夏传媒网联系，本网将迅速给您回应并做处理。华夏传媒网客服热线：QQ1979263030

我要推荐

错误报告

打印

责任编辑：华夏传媒网