网站首页 > 技术教程 正文
头条号 · 周生AI
[ 端到端的OCR ]
点点关注●每日AI项目推荐
GOT-OCR2.0
GOT-OCR2.0是一个很出色的OCR项目,它的模型足够小,但是性能确实十分的强悍,甚至能够对共识,细胞图,统计图表等等进行OCR识别。
GOT-OCR2.0的性能十分强悍,具体表现在以下几个方面:
① 支持多种语言,类别文本识别,不管是中文,英文,日语,甚至是手写字迹等等,都能很精准的识别出来。
② 输入输出多种多样:GOT-OCR2.0可以识别照片,或者pdf等各种格式的文件,最后输出的格式也是多种多样,如txt、Markdown等等,方便用户的后续整理开发。
③ 能够识别超长文本的文字材料,比如论文,报纸等等。都能做到精准识别。
④ 支持多页OCR识别,动态化识别,灵活性高,是当下OCR的首选方案。
效果
接下来给大家展示一下各类输入格式的识别效果。
数学公式示例1:
数学公式示例2:
长文本识别示例:
广告图片识别示例:
多页识别示例:
公式图标等识别示例:
该项目总体的识别效果都很不错,大家可以前往项目主页进行体验呀!
https://github.com/Ucas-HaoranWei/GOT-OCR2.0
写在最后
这就是本期老周的项目推荐内容了,如果还想看更多更好玩的GitHub好项目,记得关注老周~感谢支持!
猜你喜欢
- 2025-01-15 一款好用的OCR文字识别软件
- 2025-01-15 OCR+PDF解析配套前端工具开源详解!
- 2025-01-15 盘点18个优秀图像识别开源项目
- 2025-01-15 OCR小白也能上手!Llama-OCR只需5行代码,轻松实现高质量识别!
- 2025-01-15 PaddleOCR又一款开源中文文字识别,支持轻量级、通用级文字
- 2025-01-15 eSearch:开源软件牛B,截屏+OCR+翻译,这个让你屏幕无所不能!
- 2025-01-15 无问芯穹开源全球首款端侧全模态理解模型Megrez-3B-Omni
- 2025-01-15 surya,一个优秀的OCR开源项目,更专注于表格识别
- 2025-01-15 EasyOCR 一个好用的图片识别开源项目使用详解
- 2025-01-15 免费,开源,可批量的离线OCR软件来了
你 发表评论:
欢迎- 01-15什么是Tiff格式?怎样压缩tiff图片?
- 01-15怎么将图片格式进行转换?教你两招tif转pdf技巧
- 01-15tif文件如何转换成jpg?图文步骤详解
- 01-150.98T优于10米的全国高程TIF数据
- 01-15图片转pdf:tif是什么格式?如何将tif转成PDF?
- 01-15一款好用的OCR文字识别软件
- 01-15OCR+PDF解析配套前端工具开源详解!
- 01-15盘点18个优秀图像识别开源项目
- 最近发表
- 标签列表
-
- sd分区 (65)
- raid5数据恢复 (81)
- 地址转换 (73)
- 手机存储卡根目录 (55)
- tcp端口 (74)
- project server (59)
- 双击ctrl (55)
- 鼠标 单击变双击 (67)
- debugview (59)
- 字符动画 (65)
- flushdns (57)
- ps复制快捷键 (57)
- 清除系统垃圾代码 (58)
- web服务器的架设 (67)
- 16进制转换 (69)
- xclient (55)
- ps源文件 (67)
- filezilla server (59)
- 句柄无效 (56)
- word页眉页脚设置 (59)
- ansys实例 (56)
- 6 1 3固件 (59)
- sqlserver2000挂起 (59)
- vm虚拟主机 (55)
- config (61)
本文暂时没有评论,来添加一个吧(●'◡'●)