光学字符识别附加组件(OCR SDK Add-on)
Dynamic .NET TWAIN OCR 附加组件可用于由 C# 或 VB.NET 编写的 .NET 桌面应用程序。其易用的 OCR API 有助于您快速将 PDF 文件和图像转换成可以编辑、搜索或归档的文字。
通过此 OCR 附加组件,您可以轻松地将以下图像功能集成到您的 .NET 桌面应用程序(WinForms 和 WPF)中:
-
从兼容 TWAIN 的扫描仪中扫描文档
-
从兼容 DirectShow 的网络摄像仪中捕捉图像
-
通过 OCR 技术将图片上的文字转换成文本文件、可搜索的 PDF 文件或字符串
查看示例 →
功能
-
支持多种语言
支持包括英文、阿拉伯语、中文在内的40多种语言
下载语言包 →
-
高性能
支持多线程处理及指定区域内的 OCR 识别以加速对扫描文档的文字识别
-
多种输出格式
支持将 OCR 处理结果保存至以下格式:
- 可搜索的 PDF 文件(包括 PDF/A 1-b)
- 文本文件
- 字符串
此外,该双层 PDF 技术(在 PDF 原始图像层上创建文字层)支持多种图像压缩格式,以减小 PDF 文件的大小
-
精确的字符、字体识别
此 SDK 返回 OCR 识别结果、文字的位置信息及格式信息,包括字体名称、字体大小、行宽等