客服联系:QQ:1979263030
华夏传媒网
今天:

中国初创企业开发低成本大模型 性能比拟ChatGPT

时间:2024-12-29 10:10 来源:联合早报  ■  佚名 点击:
 (香港综合讯)中国一家初创企业成功以较低成本开发出能比拟ChatGPT的大语言模型(LLM)。
  总部位于杭州的DeepSeek星期四(12月26日)在微信公众号称,DeepSeek-V3在多项评测成绩中超越了Meta开发的Llama-3.1,并在性能上与OpenAI开发的闭源模型GPT-4o不分伯仲。
  据《南华早报》报道,在较高性价比的新训练架构下,DeepSeek的训练成本仅558万美元(758万新元),训练时长仅两个月,远低于GPT-4o逾1亿美元的成本及约三个月的训练时长。
  DeepSeek在训练过程中仅使用2048个英伟达为中国市场定制的H800晶片,而据估算GPT-4o至少使用了上万个更先进的H100晶片来训练。

 

   免责声明:华夏传媒网本栏目发布信息,目的在于传播更多信息,丰富网络文化,稿件仅代表作者个人观点,与华夏传媒网无关。其原创性以及文中陈述文字和内容未经本网证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本网不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。凡注明为其他媒体来源的信息,均为转载自其他媒体,转载并不代表本网赞同其观点,也不代表本网对其真实性负责。您若对该稿件内容有任何疑问或质疑,请即 华夏传媒网联系,本网将迅速给您回应并做处理。华夏传媒网客服热线:QQ1979263030
责任编辑:华夏传媒网

相关推荐

网友评论:

验证码: 点击我更换图片

评论仅代表网友看法!请遵守国家相关法律法规!
    新闻投稿联系    QQ:48304305
关于我们 | 免责声明 | 本网招商 | 联系我们 | 法律顾问 | 广告服务