• OCR Xpress向使用.NET以及ActiveX COM工具包的软件开发人员提供了快速和准确的全页面视觉特性识别(OCR)功能。用OCR Xpress能将全页面文本识别、自动轮显以及创建可搜索的文档功能添加到你的应用程序。该软件开发工具包同样支持deskew、binarization、字符位置信息以及文档到图片与文本的分割。它支持输出到多文本以及文本加图片的格式,包括与Microsoft® Word®兼容的RTF文件以及标准的Adobe®PDF文件。 

    特征综述 About Feature 

            识别13种语言的文本:英语、法国、德语、意大利语、西班牙语、葡萄牙语、丹麦语、荷兰语、瑞典语、挪威语、匈牙利语、波兰语以及芬兰语。OCR Xpress为每一种语言都提供了词典并且也支持应用程序专用的用户自定义的词典。

      OCR Xpress中的自动轮显功能可检查图片里的文本的正确方向并按照正确方向轮显整个页面。它也可以调整在扫描过程中变倾斜的文档。

      字符位置信息允许OCR Xpress的用户通过使用OCR Xpress中的NotateXpress控件编校或加亮在原始图片上的文字。用户也可以自己创建PDF文件并使用位置信息将隐藏的文本放置到正确的位置。通过对每个字符的识别信心,OCR Xpress可联合其它的OCR引擎进行使用,就像使用SmartZone进行投票,因此可以提高识别精确度。

      OCR Xpress标记出了识别出的不确定的字符,这样能让开发人员在他们的程序中创建文本验证与字符替换功能。这使用户可以在输出前重新检查和修改文本。

      OCR Xpress引用了高级分割功能以标记出输入图片的位置以及识别图片(可保留其颜色)或包含可识别文本的区域。可访问不同的区域以进行个别处理或自动合并具备完整格式的文档。Binarization功能可将彩色文档转换为黑白文档以在不影响非文本区域的情况下提高识别率。为非文本区域能再插入到输出文档里,它的色彩可被保留。

      通过提供全页面的OCR、自动轮显以及可搜索的文本输出功能,OCR Xpress可对Pegasus Imaging的产品功能进行补充。建议使用Pegasus Imaging的SmartZone产品对结构完整的表格(zonal OCR)上的英语文本进行区域识别。在zonal OCR应用程序中,可使用OCR Xpress对欧洲语言进行识别。

    包括的控件

    每一个OCR Xpress的版本都使用相同的.NET控制组件以及COM控制组件。按照版本可使用特定的不同功能。

    OCR Xpress 专业版 – 包括OCR Xpress v1组件,还包括ImagXpress Document v8、NotateXpress v8、ThumbnailXpress v1、TwainPRO v4与PrintPRO v3 components

    OCR Xpress 标准版 – 除了PDF输出功能外,具备OCR Xpress专业版的所有功能。