ODC ( Oracle Document Capture ) 的基本配置和使用

版本号10.1.3.5.1.

安装后的配置


第一次运行ODC的时候需要配置一些基础信息,主要包括:

  • 配置Batch Folder,用于存放录入的临时文件。
  • 配置Commit Folder,用于存放提交成文件格式的文件。
  • 配置Capture Database,主要就是ODBC数据源的配置,上一篇牢骚都用在这里了。
  • 点击”Test Connection”, 确认数据库链接没有问题。
  • 点击“Initialize DB”, 创建用于ODC配置的基本数据结构。
  • 配置安全性,我选择了“Capture”,直接配置用户名/密码就好了。
  • 选择“oracle.sql”,执行数据初始化。

到这里才能看到ODC的主界面,还需要做一些基本配置。

  • System->Settings,配置用于Index的字体,Index 数据库的存放位置,OCR的语言和编码。编码默认ANSI,我修改成了UTF-8。
  • 没有用到Recognize Server,因为它是需要license的,可惜。

OK,基本搞定。

ODC概述

援引一段Administration Guide上的话来说明ODC的主要功能和模块。

■ The Scan component allows users to scan and import pages into batches. Users
scan images using settings administrators save in scan profiles. See “About Scan”
on page 1-2.
■ The Index component allows users to index batches of scanned images, by
assigning values to them in index fields. Users index documents using settings
administrators save in index profiles. See “About Index” on page 1-13.
After indexing batches, users commit them, which creates documents from the
images and archives them so they can be accessed in the document management
system. Documents are committed using the settings selected in their assigned
commit profile. You create and assign commit profiles in Capture administration.
■ In addition to commit profiles, administrators use the Capture Administration
component as a centralized area for managing file cabinets, index fields, users,
pick-lists, database lookups in Capture components. See “Capture Administration
Overview” on page 2-1 for overview information.
■ The Commit Server, Recognition Server and Import Server components provide
expanded functionality for Oracle Document Capture, as described in “About the
Servers” on page 1-17. For example, organizations that want to perform scheduled
batch commit processing on a separate server use the Commit Server component.
■ Use the Batch Manager component to view all Capture batches on the network.

简单的总结一下。

  • Import Server通过Scan,Folder,FTP等各种途径录入图片或者电子文档,生成Batches。
  • Index组件对录入的Batches,主要是按照配置的规则添加Index值,对各个文档进行分类汇总。
  • 在Indexing过程中,可以通过链接Recognize Server对特定的Field动态的填写值。
  • Commit Server将处理好的Batches,按照配置提交到档案库中(可以是UCM,IPM或者本地目录)。

其中Import Server, Recognize Server(收License), Commit Server都可以配置Job,定时在后台运行。

配置Commit Profile/Server

打开ODC,输入配置的帐号密码。点击Admin->File Cabinets.

File Cabinets是整个Capture过程的配置集合,所有的Import, Index, Commit都是围绕着File Cabinets来做的。

  • 创建一个新的File Cabinets, 给它命名。
  • 点击该“File Cabinets”, 会显示当前Cabinets的Index列表。ODC提供了丰富的Index配置类型,我这里只添加了一个通过当前日期自动填值的Index。
  • 点击“Commit Profiles”, 默认会有一个“Commit Text Files”,就是把处理好的文档提交到本地文件夹。下面我会详细描述配置UCM,IPM的过程。

添加UCM 11g Commit Profile

  • 右键”Commit Profiles”, 选择“New Commit Profile”,输入名称。
  • 在Commit Driver下拉框中选择“Oracle UCM 11g Commit Driver”, 点击右边的Configure。
  • 输入你UCM的用户名,密码和链接,需要注意的是Service URL的链接格式如下http://192.168.56.101:16200/cs/idcplg
  • 点击Login,如果登陆成功,则右边的三个Tabs会变亮。
  • 选择Check In, 配置Document Title,这会变成UCM中的Content ID,可以配置Title的生成规则。
  • 选择Field Mappings,选择Capture Index和UCM Field的自动对应关系。UCM的Field可以通过UCM Configuration Manager配置。

OK,UCM 11g的Commit Profile的配置就好了。

添加IPM 11g Commit Profile

  • 右键”Commit Profiles”, 选择“New Commit Profile”,输入名称。
  • 在Commit Driver下拉框中选择“Oracle IPM 11g Commit Driver”, 点击右边的Configure。
  • 输入你UCM的用户名,密码,Basic Security和链接,需要注意的是Service URL的链接格式如下http://192.168.56.101:16000/imaging/ws
  • 点击Connect测试链接。
  • 选择Field Mappings,选择对应的Application,选择Capture Index和IPM 应用程序的自定义字段的对应关系。

配置Commit Server
Commit Server的配置相对简单一点。

  • 运行Commit Server,选择Setup->Batch Job.
  • General,新建一个Batch Job,选择你的File Cabinets。
  • 点击Save。
  • Server->Schedule配置定时任务。
  • Server->Activate激活任务。

配置Import Server

输入之前配置的帐号密码进入Import Server,如果已经有Job在重复执行需要通过Server->Pause先暂停才能进行Batch Job的配置。点击Setup->Batch Job,见到下面的图。

我选择了”Folder”,新建一个Job,然后进行了下面一些配置。

  • General,选择File Cabinets.
  • Folder, 选择导入的目录名,文件后缀名,以及导入的后续操作,为了方便我选择了更改文件名。
  • 点击Save。
  • Server->Schedule配置定时任务。
  • Server->Activate激活任务。

用户流程

大致描述一下用户的操作流程。

  • 将TIFF(Import中配置文件后缀名过滤)放到指定目录下。Import Server会定时处理成Batch。
  • 打开ODC,选择Open Batch Manager,可以在你的Cabinets下看到生成的Batch信息,此时Page的index信息都是空的。
  • 双击Batch,会对每一个Page进行Indexing操作,我这就自动填入了当天的日期。
  • 点击Commit,这步不是必要的,Commit Server会定时进行Commit。
  • Commit完成后,Batch会被删除。
  • 察看UCM,Document已经提交,自定义字段已经按照对应的规则填入了。

大致的流程就是这样,遗留的问题基本上都是在这个流程的基础上进行了扩展。

遗留问题

本文只是对基本的配置和使用分享了一些经验和心得,留下一些高级话题以后有机会再深入。

  • Field Index Settings, 特别是Sticky Index。
  • Scan Files, 没有扫描仪,苦。
  • Recognize Server,用于Index的动态设置。
  • OCR,这个优先级比较高。

参考链接

Oracle® Document Capture Administrator’s Guide
Oracle® Document Capture Installation Guide



Tags: odc, oracle, Oracle Document Capture

无觅相关文章插件,快速提升流量