当前位置: 首页 > news >正文

基于wordpress学校网站微信附近人推广引流

基于wordpress学校网站,微信附近人推广引流,免费网站java源码大全不下载,做的好的手机网站有哪些内容在前面文章《LLaMA 系列模型的进化(二)》中提到了Stanford Alpaca模型。 Stanford Alpaca 基于LLaMA (7B) 进行微调,通过使用 Self-Instruct 方法借助大语言模型进行自动化的指令生成,Stanford Alpaca 生成了 52K 条指令遵循样例数…

在前面文章《LLaMA 系列模型的进化(二)》中提到了Stanford Alpaca模型。
Stanford Alpaca 基于LLaMA (7B) 进行微调,通过使用 Self-Instruct 方法借助大语言模型进行自动化的指令生成,Stanford Alpaca 生成了 52K 条指令遵循样例数据(Alpaca-52K)用于训练。
在这里插入图片描述
据说,这个训练成本不到600美元。那这个成本是如何计算的呢?
训练成本:在8个80GB A100 上训练了3个小时,不到100美元;
数据成本:生成数据使用OpenAl的API,500美元。这里就是通过使用 Self-Instruct 方法,使用了OpenAl的接口的调用成本。

在前面文章《英伟达ChipNeMo,一个领域大模型的训练案例》里,介绍了领域大模型的训练过程。如下图:
在这里插入图片描述
对应的训练时长为:
在这里插入图片描述

使用 128 个 A100 GPU 进行了训练。ChipNeMo 的领域适配预训练成本(包括基于领域数据的继续预训练和SFT),具体见下表,单位是A100 GPU hours
ChipNeMo 的领域适配预训练成本,对比从头开始预训练基础模型的总成本不到 1.5%。
在这里插入图片描述
以LLaMa 7B模型的训练来说,总训练时长=2710,按照前面“在8个80GB A100 上训练了3个小时,不到100美元”的成本折算,成本应该小于11300美金
13B模型,总训练时长=5100,成本应该小于21250美金
70B模型,总训练时长=21340,成本应该小于88920美金

至于数据,ChipNeMo 的领域适配预训练需要24B以上的数据,这个可能与相应的数据积累有很大关系,不好计算了。

http://www.shuangfujiaoyu.com/news/47349.html

相关文章:

  • 网站制作软件都是什么百度怎么搜索关键词
  • 网站后台图片滚动效果怎么做seo品牌优化
  • 做网站卖大闸蟹网络推广工作好做不
  • 微网站开发手机模拟器seo接单平台
  • 购买网站百度搜索 手机
  • 工业园网站建设百度网盟推广怎么做
  • 网站建设合同简单建个网站需要多少钱?
  • 免费空间分享揭阳百度快照优化排名
  • 杭州网站制作推荐怎么优化自己公司的网站
  • 网站建设靠什么赚钱北京网络营销公司排名
  • 公司网站维护如何操作电商引流推广方法
  • 汕头网页怎么制作武汉seo公司哪家好
  • php+mysql网站开发全程实例.pdf兰州网络推广电话
  • 网站建设费的税率中关村在线app
  • wordpress使用QQ头像山东seo网页优化外包
  • 嘉兴做网站优化的公司销售课程培训视频教程
  • 深圳企业推广网站排名螺蛳粉营销策划方案
  • cnnic网站百度客服在线咨询电话
  • 网站怎么做站长统计网站策划书模板范文
  • 金山快盘为什么停止服务潍坊seo建站
  • wordpress分类的feed免费下载优化大师
  • 站长统计 网站统计站长工具网站查询
  • 专门做网站代购的盈利路子手机seo关键词优化
  • 闵行做网站综合查询
  • 官方网站重要性百度怎么创建自己的网站
  • wordpress首页多图片昆明网站seo优化
  • 做北美市场的外贸网站河南郑州网站顾问
  • wordpress主题演示站小程序开发平台有哪些
  • 嘉善做网站郑州网络推广代理顾问
  • 网站建设模板制作是什么意思注册商标查询官网入口