产品  >  OCR 服务器  >  功能
 

功能

- 导入、观察文件夹、批次文件夹及影像预先处理
- 排序
- 编制索引
- 自动化处理
- 辨识 (OCR)、文件建立和压缩
- 输出连接器
- 简易安装及应用
- 支持和网络研讨会
- 系统需求

导入、观察文件夹、批次文件夹及影像预先处理

导入文件类型

JPEG (*.jpg, *.jpeg), JPEG 2000 (*.j2c, *.j2k, *.jp2), TIFF images (*.tif, *.tiff ), Windows® bitmaps (*.bmp), Adobe® Acrobat® PDF (*.pdf ), DCX fax (*.dcx), DjVu (*.djv, *.djvu), GIF images (*.gif ), Photoshop® images (*.psd), PICT (Mac OS® format) (*.pct), Portable Bitmaps (*.pbm), Gem Paint (*.img), ZSoft Paintbrush (*.pcx), Portable Network Graphics (*.png)

观察文件夹

根据您的要求设立多个观察文件夹,助您转换新加入影像为完全可搜索和编辑的文件。
每个文件夹都具有特定的设置,例如 OCR 设置、输出文件类型、输出文件夹位置、优先处理顺序级别等。

另一个应用方式是在服务器中设置用户文件夹,可为多位用户提供 OCR 服务。
最后,还可以将观察文件夹模式设为 Windows® 服务般使用。

批次文件夹

可将大批扫描文件轻松转换为文本文件,将用户介入程度降到最低。配置文件可透过用户接口进行一次性设定,您每次处理文件影像时皆会加载。不同的项目可储存并使用不同的配置文件。

预先图像处理

优化图像文件案,令扫描仪更进一步。

- 歪斜校正: 校正影像中歪斜的文字
- 方向检测: 旋转影像
- 去除斑点: 删除噪声像素
- 平滑影像: 合并彩色影像可删除 JPEG 压缩结构并有利于字符辨识

排序

定义输出文件内容和批次文件结构。

- 建立一批文件、影像文件夹、导入档案、导入文件 (e.g. 从 IRISPowerscan™ 导入)
- 分隔文件,通过检测条形码或空白页 (可选择保留空白页与否)

编制索引

- 为每张影像建立整页文字索引
- 辨识条形码值
- 以 XML 格式的索引档案导出该信息
- 以已编制索引的信息为档案重新命名

自动化处理

IRISDocument™ Server 9 提供 OCR 准确性报告,可助您定义参数以获得最佳的 OCR 文件效果 。
只需使用批处理模式或将其拖放在观察文件夹中便可启动处理程序。其后,所有过程将会自动化并无需操作人员操作。

基于服务器处理

为优化扫描和处理性能,我们建议以服务器为基础作处理。此配置允许使用 IRISPowerscan™ 或其他扫描软件在一个或多个扫描站上进行扫描。而辨识过程将同时在 IRISDocument™ Server 9 上执行。IRISDocument™ Server 9 无间地连接到多个扫描站。

以服务器为基础的结构,让你获得最高的扫描效益,亦同时保留资源作辨识之用。此外,任何连接到网络的用户都能够把档案放在 IRISDocument™ Server 9 的共享观察文件夹中。所有辨识工作于服务器进行,用户可保留足够资源完成其它工作。



OCR 准确性报告

OCR 准确性报告提供所有文件类型的 OCR 准确性结果的图像分析。有助用户优化扫描软件从而获得最佳的 OCR 结果。通过此新增功能,用户便可评估文件上 OCR 的质量,根据结果来修改 IRISDocument™ Server 9 及扫描仪的设置并获取最佳效果。

不停运作

IRISDocument™ Server 9 可 24 小时不停地处理文件,并同时在多个来源接收多达130 种不同语言的档案。

辨识 (OCR)、文件建立和压缩

辨识 (OCR)

优化 OCR 引擎
- 由于 I.R.I.S. 精练多年而且支持多语言的生产型 OCR 技术,所以 I.R.I.S. 的 OCR 技术比大多数的 OCR 引擎速度更快。
- 每一种语文都有独立的宇典和字符集。
- 准确性报告:根据不同设置的 OCR 处理比较质量,找出能助您从文件中获得最佳 OCR 结果的参数。
- 根据您对文件扫描质量的要求,可以选择快速扫描或高准确性扫描。

- 支持超过 137 种语言
支持所有欧洲语言,包括中欧、波罗的海、希腊和斯拉夫语 ( 俄罗斯 ) 。亚洲插件模块可用于识别 4 种亚洲语言:繁体和简体中文、日语、韩语。希伯来文和阿拉伯文插件模块亦可供选择。

- 多种语言辨识
IRISDocument™ Server 9 可同时辨识 5 种混合语言。

- 可于一批文件上进行局部辨识
选择文件上部分页数作 OCR ,而其余文件则保持为图像文件。这样便可加快进程,并减少存储的数据量。

条形码辨识

支持超过 28 种不同类型条形码的强大辨识能力:
Codabar, Code 128, Code 39, Code 39 extended, Code 39 HIBC, Code 93, Datalogic 2 of 5, Discrete 2 of 5, EAN-13, EAN-2, EAN-5, EAN-8, IATA 2 of 5, Interleaved 2 of 5, MSI pharmaceutical, MSI-Plessey, PDF-417, PostNet, PostNet 32, PostNet 52, PostNet 62, QR Code, Reverse 2 of 5, UCC-128, UPC-A, UPC-E and UPC-E extended.

输出格式

- 多种输出格式
可从一个影像文件和单一进程中,可产生多个不同文件格式的输出文件。

- 众多的文件输出格式
有以下的输出格式可供选择:

>> PDF (4 种不同档案模式:影像、影像 - 文字、文字、文字 - 影像,和多种选项:依从PDF/A以便长期保存、证书、加密)
>> PDF-iHQC™ 高度压缩文件案 (3 个不同的压缩级别,和多种选项:依从PDF/A以便长期保存、证书、加密)
>> XPS 档案 (4 种不同的档案模式:影像、影像 - 文字、文字、文字 - 影像)
>> XPS-iHQC™ 高度压缩文件案 (3 个不同的压缩级别和多种选项)
>> 普及的文件格式,如 TXT 、 RTF 、 DOC 、 OpenDocument text 、 HTML 、 XML 、 WordML 、 SpreadsheetML
>> 图像文件案格式,如 TIFF (一页或多页) 、 BMP 、 JPEG 、 JPEG2000 或 PDF 图像 (也许可以使用 iHQC™ 高度压缩)

- 其他可选择的输出格式
>> PDF/A-1b: 比普通 PDF 格式更严格,这是一种作长期存盘的理想 PDF 格式。(注: 当使用亚洲语言时,PDF/A 是不能被选择。)
>> PDF 加密方式:建立受保护的 PDF 文件,文件需要密码才能进行显示、修改、打印等。
>> OpenDocument 文本 (*odt) : OpenDocument Text 是一个基于 XML 的完全开放的格式。它可以让 OpenOffice 和 StarOffice 读取。

 

- XML 输出
有两种类型的XML文件:简洁和详细。简洁文件包含导入和输出文件路径、条形码和文字内容。详细文件中包含每一个字符,其坐标以及它的置信水平。

- 格式选项
许多格式化参数可选择以应付最常见的需要。对于 Word 和 RTF 的输出格式文件:「保留文字的颜色」、「保留背景颜色」、「保持纸张尺寸」等。

- 标准影像压缩
不论建立有没有文字的 PDF 档案, 都可以修改JPEG 压缩率和影像分辨率,并可以以 JPEG2000 技术高压缩所有影像。

- 影像输出
保存已处理文件于不同的图像文件案格式: TIFF (多页 TIFF 亦可)、 JPEG 、 BMP 或 PDF 格式影像 (包括 PDF-iHQC™)。

- 文件命名: IRISDocument™ Server 9 提供多种选项来命名您的文件:自动化递增编号、索引字段 (只可用于 IRISPowerscan™、 eCopy ShareScan® 或 Kodak Capture Software®) 、依从第一张影像的名称、影像文件夹、条形码内容或字符辨识的第一句。

- 复制导入文件夹结构: 绝不浪费辨识文件的时间,IRISDocument™ Server 9 确保上游所定义的档案结构会和下游的相同。

- 复制原影像至输出: 可选择放弃原扫描影像或保留以作进一步参考。



高度压缩技术

iHQC™ (高质量智能压缩枝术) 是 I.R.I.S. 的高度压缩技术。这功能件在不损害彩色图像质量和易读性的情况之下,将彩色或黑白 PDF 格式的文件容量大大减少。您将获得比 JPEG2000 的质量更好而容量更少的 PDF 文件。

iHQC™ 提供了 3 个压缩级别。 IRISDocument™ Server 9 已包括无限数量的第一级压缩。

下表说明在不同种类的彩色图像下iHQC™的压缩表现。有两项设置是建议使用的,优化图片质量 (最佳质量) 或优化档案容量 (最小容量):

影像

压缩前
档案
容量

JPEG 压缩

TIFF 黑白 Group 4
PDF - IHQC
最小容量
(影像 + 文字)
PDF - IHQC
最佳质量
(影像 + 文字)

 

Kbytes

Kbytes

压缩
比率

Kbytes

压缩
比率

Kbytes

压缩
比率

Kbytes

压缩
比率

byte_a

19,978

1,445

14

119

168

350
232
sojournc_son
19,158
23
211
325
218

eos03noise

33,836

1,024

33

89

380

583
338

fnac01

7,795

474

16

30

260 

312
223
lion_a

8,196

759

11

35

234

273
186
park_a

4,303

436

10

30

143

172
134
scenic_b

13,540

619

22

76

178

315
222
time_france

19,429

904

21

106

183

341
243
invoiceTDI

26,092

1,259

21

29

900

502
307
 

126,236

7,744

16

605

209

406
311
611
207

表格中显示在iHQC™的协助下,建立出来的PDF和XPS文件(包含彩色图像和全文索引—可完整检索),其容量更可少于原彩色图像或黑白Tiff Group 4图像(这些图像并不包括全文索引)容量的200倍。

输出连接器

- 发送文件至任何外部应用程序
直接从 IRISDocument™ Server 9 呼叫任何外部可执行应用程序 (在批次 OCR 或观察文件夹模式亦可),它将接收 XML 索引档案作为参数。

- 连接和发送文件到 Microsoft® SharePoint®
IRISDocument™ Server 9 可直接连接到任何 Microsoft® SharePoint® 服务器并自动地输出文件。为优化与 SharePoint® 的连接能力,建议合并使用 I.R.I.S. 的 IRISDocument ™ Server 9 和扫描应用程序 IRISPowerscan™。根据扫描前定义的设置,IRISPowerscan™ 将会辨识的文件类型并撷取索引。文件会连同索引被直接输出到 SharePoint® 并根据它们的类型自动被发送到正确的文档库。

- 影像输出
保存已处理的文件在不同的影像文件格式:TIFF (亦包括多页 TIFF) 、 JPEG 、 BMP 或 PDF 影像 (包括 iHQC™ 高质量智能压缩技术)。

- IRISCapture™ Pro
IRISDocument™ Server 9 可以容易地与 IRISCapture Pro 软件套装整合,以 I.R.I.S. 的专业解决方案进行排序、编索引、编码和输出所有扫描文件数据。

简易安装及应用

安装简便

IRISDocument™ Server 9 和其他软件选项是刻录在自动运行的光盘上,并连带一个加密锁 。 只需完成安装过程便可使用。安装 IRISDocument™ Server 9 不需要任何技术知识,如任何传统软件一样简单。

使用方便

IRISDocument™ Server 9 提供详尽的用户指南帮助您开始使用。只需数分钟的简易设置便可开始处理第一批文件!我们会举办网络研讨会,让您与产品专家研讨更高级的功能,更加充分地利用您的产品。

支持和网络研讨会

技术支持

我们的技术支持团队,可帮助您解决开始使用时的任何麻烦。我们亦会举办网络研讨会让您与专家讨论进阶使用时的问题。

网络研讨会

我们的产品专家会在网络研讨会上教导您使用 IRISDocument™ Server 9 并助您从 IRISDocument™ Server 9 中得到最多。任何人都可以出席,无时间、地点限制。

> 预约网络研讨会
> 请与我们联络


系统需求

建议系统设备
处理器︰Intel® Pentium® IV 2 GHz 或同等
内存︰1 GB (建议使用于处理灰阶和彩色图像)
            2 GB (当使用多核心处理器模块时,建议使用)
磁盘空间︰2 GB
操作系统︰Windows Vista®、Windows® XP、2000
其他︰USB 插槽 (用作连接硬件加密锁)



产品 | 下载 | 合作伙伴 | 关于 I.R.I.S. | 支持 | 人材招募 | 网上商店
© 2009 - I.R.I.S. s.a. - All rights reserved     客户私隐政策 | 一般销售条件 | 网站地图