分享免费的编程资源和教程

网站首页 > 技术教程 正文

相当炸裂!这个开源的OCR项目,什么都能识别?

goqiw 2025-01-15 12:52:20 技术教程 1 ℃ 0 评论

头条号 · 周生AI


[ 端到端的OCR ]


点点关注●每日AI项目推荐


GOT-OCR2.0


GOT-OCR2.0是一个很出色的OCR项目,它的模型足够小,但是性能确实十分的强悍,甚至能够对共识,细胞图,统计图表等等进行OCR识别。


GOT-OCR2.0的性能十分强悍,具体表现在以下几个方面:


支持多种语言,类别文本识别,不管是中文,英文,日语,甚至是手写字迹等等,都能很精准的识别出来。


输入输出多种多样:GOT-OCR2.0可以识别照片,或者pdf等各种格式的文件,最后输出的格式也是多种多样,如txt、Markdown等等,方便用户的后续整理开发。


能够识别超长文本的文字材料,比如论文,报纸等等。都能做到精准识别。


支持多页OCR识别,动态化识别,灵活性高,是当下OCR的首选方案。


效果


接下来给大家展示一下各类输入格式的识别效果。

数学公式示例1:


数学公式示例2:


长文本识别示例:


广告图片识别示例:


多页识别示例:


公式图标等识别示例:


该项目总体的识别效果都很不错,大家可以前往项目主页进行体验呀!

https://github.com/Ucas-HaoranWei/GOT-OCR2.0


写在最后

这就是本期老周的项目推荐内容了,如果还想看更多更好玩的GitHub好项目,记得关注老周~感谢支持!


Tags:

本文暂时没有评论,来添加一个吧(●'◡'●)

欢迎 发表评论:

最近发表
标签列表