Microsoft Gold Certified Partner

Dynamsoft wins the ComponentSource Top 50 Publisher Awards 2014-2015


Dynamic Web TWAIN logo

Dynamic Web TWAIN OCR Basic 附加组件(本附加组件支持简(繁)体中文识别)

通过 Dynamic Web TWAIN OCR Basic 这一快速、完善的光学字符识别附加组件,您只需几行代码,即可在您的网络应用程序中实现从图像中提取文字的功能。OCR Basic是基于Tesseract开发的。

结合 Dynamic Web TWAIN 的图像捕捉模块,您可以轻松地在网络应用程序中实现下列功能:

指南和示例代码 →

接口文档 →

功能

  • 支持所有服务端语言
    您可以将 OCR 库用于任何网络应用程序,例如 ASP.NET、PHP、JSP 等
  • 支持简(繁)体中文及西方语言
    本 OCR 库目前支持简(繁)体中文、英语和其他二十几种西方语言及阿拉伯语
    请在指南中查看支持的语言列表 →
  • 支持多种形式的输入及输出
    本 OCR 引擎支持从以下文件类型中提取文字:
    TIF、JPEG、PDF、BMP、PNG
    本 OCR 引擎可将识别结果保存为以下格式:
    • 可搜索的含文本,保持原格式PDF(包括 PDF/A)
    • 可搜索的只含文本 PDF(包括 PDF/A)
    • 文本文件 – TXT
    • 字符串
    您可以获取文字的位置信息,该位置信息可以被用于其他应用程序,例如对某些关键字进行高亮处理。
  • 高效率及高精度:
    支持特定区域内的文字识别(OCR)。显著提高从扫描文档中识别文字的速度
    高精度 OCR 识别。自动检测字体
  • 环境要求
    • 客户端OCR:客户端只支持Windows操作系统,对服务器端操作系统没有限制。
    • 服务器端OCR:只支持Windows服务器,对客户端操作系统没有限制。

优点

  • 缩短开发时间及花费
    可以迅速在您的网络应用程序中开发完善的 OCR 模块,用于从图像中提取文字。
  • 易集成
    即可在客户端也可在服务器端处理文字识别(OCR)。对于服务器端语言没有限制,支持 ASP.NET、PHP、JSP 等后端语言。
  • 强大的扩展性
    您可以将多种文档成像功能集成在一个应用程序在中,包括文档扫描及上传,从摄像头中捕获图像一维码及二维码解析,OCR 及 PDF 光栅扫描
  • 一流的技术支持
    为顾客提供最好的服务及多种技术支持渠道:电话、在线聊天、邮件、在线会议、论坛、知识库(Knowledge Base)等。 阅读更多 →