当前位置: 首页 > news >正文

南京做网站dmooo教育培训网

南京做网站dmooo,教育培训网,郑州做网站的公司有哪些,做网站时怎么选择数据库类型NLP学习与踩坑记录(持续更新版) OSError: Cant load tokenizer for bert-base-uncased.google.protobuf.message.DecodeError: Error parsing messageDeepspeed 本博客记录了博主在学习NLP时遇到了各种各样的问题与解决方法,供大家参考&#…

NLP学习与踩坑记录(持续更新版)

  • OSError: Can't load tokenizer for 'bert-base-uncased'.
  • google.protobuf.message.DecodeError: Error parsing message
  • Deepspeed

本博客记录了博主在学习NLP时遇到了各种各样的问题与解决方法,供大家参考,希望踩过的坑不踩第二次!

OSError: Can’t load tokenizer for ‘bert-base-uncased’.

tokenizer = BertTokenizer.from_pretrained("bert-base-uncased", truncation_side=truncation_side)

博主在调用上述代码时出现此报错,原因是在国内因为网络问题无法下载huggingface上的模型。
解决办法一:检查自己的网络,在国内需要使用VPN保证可以访问huggingface,然后重新运行代码。若不行,将模型下载到本地,再重新运行代码。

huggingface-cli download --resume-download google-bert/bert-base-cased --local-dir /home/user/bert-base-cased

解决办法二:使用modelscope上的镜像,速度较快,但可能存在一些huggingface上的模型modelscope上没有。

# pip install modelscope
from modelscope.hub.snapshot_download import snapshot_download
llm = snapshot_download('AI-ModelScope/bert-base-uncased')
tokenizer = BertTokenizer.from_pretrained(llm, truncation_side=truncation_side)

解决办法三:Colab下载转移至Google Drive上,再从Google Drive上下载。

google.protobuf.message.DecodeError: Error parsing message

原因是通过git clone命令直接下载,并没有下载到正确的模型参数文件,只是一个文本文档,解决方法是下载huggingface上的模型需要使用huggingface-cli工具。

# 错误的下载方式
git clone https://huggingface.co/bert-base-uncased
# 正确的下载方式
pip install huggingface_hub
huggingface-cli download --resume-download [model_name] --local-dir [local path] 
# eg: huggingface-cli download --resume-download google-bert/bert-base-cased --local-dir /home/user/

Deepspeed

  • Deepspeed 在训练代码中如果单卡无法加载,初始化需要用init context,参考huggingface的trainer(training argument在模型加载前)https://huggingface.co/docs/transformers/v4.34.1/en/main_classes/deepspeed#constructing-massive-models
  • 数据并行data parallelism (zero3 cuts model horizontally)、流水线并行pipeline parallelism (cuts model vertically)
    https://huggingface.co/docs/transformers/v4.35.2/en/perf_train_gpu_many#zero-data-parallelism–pipeline-parallelism–tensor-parallelism
  • zero++ 优化通信策略 https://www.deepspeed.ai/tutorials/zeropp/#three-components-of-zero
http://www.shuangfujiaoyu.com/news/52241.html

相关文章:

  • 建筑型专业网站有哪些北京百度seo工作室
  • 做数据权威的网站沈阳专业seo
  • 网站建设方案书网络营销推广策划
  • 网址导航网址大全彩票网站大全厦门百度广告
  • 网站开发项目挣钱吗seo网站推广价格
  • 沙坪坝做网站企业seo优化服务
  • 企业网站设计方式个人介绍网页制作
  • 门户网站建设需要多少钱做销售有什么技巧和方法
  • 大学网站建设与功能开发网络营销员岗位的职责与要求
  • 做简历网站 39广告免费推广网
  • wordpress 产品网站搜索引擎优化论文
  • 做网站用html推广自己的网站
  • 各大网站的名字网址怎么创建
  • 中小企业网站建设公司可以免费打广告的网站
  • 如何优化网站结构百度网站链接提交入口
  • 吉林省电力建设总公司网站百度指数查询app
  • 外贸建站平台哪家好seo关键词词库
  • 广州大型网站建设公司排名站长工具seo综合查询可以访问
  • wordpress网页设计步骤前端seo优化
  • 广州网站设计公司西安百度关键词推广
  • 做文献综述用什么网站精品成品网站入口
  • 网站建设背景介绍杭州seo泽成
  • 做网站字体用什么格式5118数据分析平台官网
  • 亚马逊做超链接的网站最新新闻头条
  • 单页面营销网站株洲网站设计外包首选
  • 做外贸进大公司网站十大接单平台
  • 做论坛网站需要什么备案企业查询平台
  • h5技术的网站seo营销推广
  • 网站页面设计说明知乎营销推广
  • 做标签刷单平台网站品牌宣传推广方案