网站首页 > 技术教程正文

相当炸裂!这个开源的OCR项目，什么都能识别?

goqiw 2025-01-15 12:52:20 技术教程 45 ℃ 0 评论

头条号 · 周生AI

[ 端到端的OCR ]

点点关注●每日AI项目推荐

GOT-OCR2.0

GOT-OCR2.0是一个很出色的OCR项目，它的模型足够小，但是性能确实十分的强悍，甚至能够对共识，细胞图，统计图表等等进行OCR识别。

GOT-OCR2.0的性能十分强悍，具体表现在以下几个方面：

① 支持多种语言，类别文本识别，不管是中文，英文，日语，甚至是手写字迹等等，都能很精准的识别出来。

② 输入输出多种多样：GOT-OCR2.0可以识别照片，或者pdf等各种格式的文件，最后输出的格式也是多种多样，如txt、Markdown等等，方便用户的后续整理开发。

③ 能够识别超长文本的文字材料，比如论文，报纸等等。都能做到精准识别。

④ 支持多页OCR识别，动态化识别，灵活性高，是当下OCR的首选方案。

效果

接下来给大家展示一下各类输入格式的识别效果。

数学公式示例1:

数学公式示例2:

长文本识别示例:

广告图片识别示例:

多页识别示例:

公式图标等识别示例:

该项目总体的识别效果都很不错，大家可以前往项目主页进行体验呀！

https://github.com/Ucas-HaoranWei/GOT-OCR2.0

写在最后

这就是本期老周的项目推荐内容了，如果还想看更多更好玩的GitHub好项目，记得关注老周～感谢支持！