Microsoft Gold Certified Partner

Dynamsoft wins the ComponentSource Top 25 Publisher Awards 2019 Dynamsoft wins the ComponentSource Top 50 Product Awards 2019


Dynamic Web TWAIN logo

Dynamic Web TWAIN OCR Basic 附加组件(本附加组件支持简(繁)体中文识别)

通过 Dynamic Web TWAIN OCR Basic 这一快速、完善的光学字符识别附加组件,您只需几行代码,即可在您的网络应用程序中实现从图像中提取文字的功能。OCR Basic是基于Tesseract开发的。

结合 Dynamic Web TWAIN 的图像捕捉模块,您可以轻松地在网络应用程序中实现下列功能:

指南和示例代码 →

接口文档 →

功能

  • 支持所有服务端语言
    您可以将 OCR 库用于任何网络应用程序,例如 ASP.NET、PHP、JSP 等
  • 支持简(繁)体中文及西方语言
    本 OCR 库目前支持简(繁)体中文、英语和其他二十几种西方语言及阿拉伯语
    请在指南中查看支持的语言列表 →
  • 支持多种形式的输入及输出
    本 OCR 引擎支持从以下文件类型中提取文字:
    TIF、JPEG、PDF、BMP、PNG
    本 OCR 引擎可将识别结果保存为以下格式:
    • 可搜索的含文本,保持原格式PDF(包括 PDF/A)
    • 可搜索的只含文本 PDF(包括 PDF/A)
    • 文本文件 – TXT
    • 字符串
    您可以获取文字的位置信息,该位置信息可以被用于其他应用程序,例如对某些关键字进行高亮处理。
  • 高效率及高精度:
    支持特定区域内的文字识别(OCR)。显著提高从扫描文档中识别文字的速度
    高精度 OCR 识别。自动检测字体
  • 环境要求
    • 客户端OCR:客户端只支持Windows操作系统,对服务器端操作系统没有限制。
    • 服务器端OCR:只支持Windows服务器,对客户端操作系统没有限制。

优点

  • 缩短开发时间及花费
    可以迅速在您的网络应用程序中开发完善的 OCR 模块,用于从图像中提取文字。
  • 易集成
    即可在客户端也可在服务器端处理文字识别(OCR)。对于服务器端语言没有限制,支持 ASP.NET、PHP、JSP 等后端语言。
  • 强大的扩展性
    您可以将多种文档成像功能集成在一个应用程序在中,包括文档扫描及上传,从摄像头中捕获图像一维码及二维码解析,OCR 及 PDF 光栅扫描
  • 一流的技术支持
    为顾客提供最好的服务及多种技术支持渠道:电话、在线聊天、邮件、在线会议、论坛、知识库(Knowledge Base)等。 阅读更多 →