• OCR SDK 模块用于在应用程序中添加光学字符识别技术。使用LEADTOOLS OCR模块, 编程人员可以对文档图像进行字符识别,并能把识别出的字符输出到20多种文件格式中,包括DOC、RTF、HTML、TXT、XLS,以及其它更多。LEAD的OCR工具提供了API、COM和.Net支持,PDF OCR插件则扩展了LEADTOOLS OCR模块对PDF输出的支持

    特征综述 About Feature

    LEADTOOLS 使OCR在自动区域内检测、手工区域创建、自动定位、文档图像清除等方面的开发更方便,并对普通文档图像采用预设值以提高认别效果。LEADTOOLS的OCR模块支持100多种语言、输出文档选项(如文档边界、段落选项等)以及新的输出格式。

    输出格式支持:

    • 可编辑的 Adobe PDF 文档 
    • Open eBook 1.0  
    • XML  
    • 2G Type 2  
    • 2G Type 3  
    • 以及更多

    其它特征:

    • 认别5到72点任何可能字体的文字。
    • 在文档页面自动检测可能的文字区域。
    • 一次即可对多个文档页面进行认别,并保存识别结果到单个文件中。OCR引擎能识别多种语言的文档。
    • 可以选择从文本、文字处理、数据库、电子表格等多种文件格式(包括MS Word、PDF、MS Excel)进行文字识别和输出。
    • 针对双面的书和杂志在“两页”模式进行文档处理。
    • 以及更多。

    ,