当前位置: 首页 > news >正文

国外网站做淘宝客品牌运营策略

国外网站做淘宝客,品牌运营策略,重庆专业网站建设费用,广州市建设工程安全监督站网站在PDF解析中,目前主流的开源工具包括Minuer、GOT OCR等。主要都是通过飞桨等OCR套件组装的一套pipeline,或者直接通过VLM解析图像。 #一、 olmOCR是使用VLM进行的端到端的PDF文档解析 二、document-anchoring 与上述的不同在于,olmOCR使用…

在PDF解析中,目前主流的开源工具包括Minuer、GOT OCR等。主要都是通过飞桨等OCR套件组装的一套pipeline,或者直接通过VLM解析图像。

#一、 olmOCR是使用VLM进行的端到端的PDF文档解析
在这里插入图片描述

二、document-anchoring

与上述的不同在于,olmOCR使用了document-anchoring,文档锚定方法。针对PDF中的页码信息、图像信息等元数据和文字,使用pyPDF库进行解析。
在这里插入图片描述
通过在提示词里加入这些文字位置、图像位置、元数据等信息,VLM的幻觉大大减少。
加上位置信息,VLM应该能够定位到具体区域,然后专注于这部分的解析。
仅用页面图像进行提示容易出现未完成的句子,或者在图像数据模糊时产生不忠实的输出。

三、模型微调

数据集:构建了olmOCR-mix-0225数据集
训练:在Qwen2-VL-7B-Instruct上微调
评估:
1.与教师模型GPT-4o计算对齐得分,具体是文档相似性度量,该度量将文档拆分为单词,使用Hirschberg算法对这些单词进行对齐,并计算匹配的比例
2.人类评估:ELO分数
3.下游任务评估

项目:https://github.com/allenai/olmocr

http://www.shuangfujiaoyu.com/news/60485.html

相关文章:

  • 自己的电脑做服务器 并建网站seo专业培训费用
  • 哪个网站可以做会计分录建站abc网站
  • 建10个网站开发一个app平台大概需要多少钱?
  • 交友网站免费建设销售的技巧与口才
  • 大淘客做的网站可以吗陕西网络推广介绍
  • 网上商城网站开发公司营销到底是干嘛的
  • 专业版装修用什么网站做导航条短视频代运营方案策划书
  • 自己没有货源怎么开网店seo网站自动推广
  • 有好的学网站建设的书吗岳阳seo
  • 东莞网站关键词优化公司网络营销渠道建设方案
  • 营销类网站建营销类网站建设怎样注册个人网站
  • 怎么做视频还有网站吗查域名备案信息查询
  • 英文网站建设目的深圳营销推广公司
  • 58做网站一年多少钱简述搜索引擎优化的方法
  • js 转wordpressseo教程搜索引擎优化入门与进阶
  • 网站建设服务有哪些方面外链购买交易平台
  • 广西网站建设天津建站网
  • 做网站css网站媒体推广方案
  • 深圳专业做网站哪家好如何做一个自己的网页
  • 家庭宽带做网站服务器自己怎么开发app软件
  • 东阳做网站seo系统培训哪家好
  • app界面设计优秀案例夫唯seo怎么样
  • 企业网站用户群个人网站设计作品
  • 公司网站的详细步骤网络营销实践总结报告
  • 网络会议系统公司优化推广网站怎么做最好
  • 网站图片设置做百度推广代运营有用吗
  • 政府网站建设事例制作公司网站的公司
  • 有链接的网站怎么做百度竞价点击神器
  • 注册海外公司廊坊seo排名优化
  • 网站不收录的技术原因澳门seo关键词排名