<?xml version="1.0" encoding="UTF-8"?> <filenetBridgeConfiguration version="1"> <server> <url>http://localhost:9080/wsi/FNCEWS40DIME</url> <username>user</username> <password>password</password> </server> <domain></domain> <objectStore>MyObjectStore</objectStore> <documentSelection> <folders> <folder>/docs/analyze</folder> </folders> </documentSelection> <contentMapping name="DocumentContent"> <textContentPattern encoding="MS932">text/plain</textContentPattern> <textContentPattern encoding="UTF-8">text/html</textContentPattern> <binaryContentPattern>^application/pdf$</binaryContentPattern> </contentMapping> <propertyMappings> <propertyMapping> <symbolicName>DocumentTitle</symbolicName> <mappingTarget> <title /> </mappingTarget> </propertyMapping> <propertyMapping> <symbolicName>DateCreated</symbolicName> <mappingTarget> <date /> </mappingTarget> </propertyMapping> <propertyMapping> <symbolicName>Comment</symbolicName> <mappingTarget> <text name="Comment" /> </mappingTarget> </propertyMapping> </propertyMappings> <outputATML> <basename>filenet_data</basename> <maxDocuments>2000</maxDocuments> </outputATML> <categoryRecord property="Category"> <serialOperation ignoreError="false" /> </categoryRecord> </filenetBridgeConfiguration>この設定ファイルでは、以下の指定しています。
takmi_filenet2atml config.xmlこのATMLファイルをテキスト解析した後、生成されたMIMLファイルのカテゴリ情報を以下のコマンドで書き戻せます:
takmi_miml2filenet config.xml filenet_data_XXXX.mimlLinuxおよびAIXでは、コマンド名に.shを加えてください。
XML要素 | 説明 |
---|---|
url | FileNet P8サーバのWebサービスインターフェイスのURLです。 |
username | FileNet P8サーバにログインするユーザ名です。 |
password | FileNet P8サーバにログインするパスワードです。 |
XML要素 | XML属性 | 説明 | 多重度またはデータ型 |
---|---|---|---|
folders | 内部に1つ以上のfolder要素を指定します。 | 0 — 1 | |
folder | 対象となるFileNetフォルダのパスです。 | 0 — n | |
recursive | サブフォルダの文書を再帰的に取得するかどうかを指定します。 | Boolean、デフォルトはtrueです | |
querySQL | FileNet文書を選択するカスタムのSQLクエリです。文書IDを生成するために、このクエリはSELECTリストに「Id」列を指定しなければなりません。 SQLクエリの詳細はFileNetのマニュアルを参照してください。 | 0 — 1 |
XML要素 | XML属性 | 説明 | 多重度またはデータ型 |
---|---|---|---|
contentMapping | テキスト抽出指定のトップレベル要素です。このXML要素はこの表にあるすべてのXML要素およびXML属性を含みます。 | 0 — 1 | |
name | 抽出されたテキストの名前です。この名前はText Minerで表示されます。 | string | |
maxLength | 抽出するテキストの長さの最大値です。テキストはこの値より長くなることはありません。 | integer、デフォルトは65535です | |
contentReplacement | Java™正規表現を用いて抽出されたテキストの特定の文字を置換します。 | 0 — 1 | |
pattern | 置換対象となる正規表現パターンです。 | string | |
replacement | 置換後のパターンです。これはpattern要素内の正規表現グループを指す前方参照を含むことができます。 | string | |
textContentPattern | テキストファイルとみなすMIMEタイプを指定する正規表現パターンです。 | 0 — n | |
encoding | テキストファイルのエンコーディングです。 | string、デフォルトは「UTF-8」です | |
binaryContentPattern | バイナリファイルとみなすMIMEタイプを指定する正規表現パターンです。 | 0 — n |
XML要素 | XML属性 | 説明 | 多重度またはデータ型 |
---|---|---|---|
propertyMappings | プロパティ変換方法のトップレベル要素です。この要素はゼロ個以上のpropertyMapping要素を含みます。 | 0 — 1 | |
propertyMapping | ひとつのプロパティの変換を表します。これはFileNet文書のひとつのプロパティを変換元として指定し、ひとつ以上の変換先を子要素として含みます。 子要素は、この表の下部に記述されています。 | 0 — n | |
symbolicName | 変換元となるFileNetプロパティの名前です。表示名(Display name)ではなく、正規化された名前(Symbolic name)が用いられます。 | 1 | |
mappingTarget | 変換先を指定します。ひとつの変換指定が複数の変換先をもてるため、このXML要素は子要素として複数のXML要素を含むことができます。 | 1 | |
standardFeature | 変換先としてIBM Content Analyzerの定型情報を指定します。 | 0 — 1 | |
category | 定型情報のカテゴリパスを指定します。 | string | |
dynamicPath | プロパティの値によってカテゴリパスを変える指定です。 | 0 — n | |
value | FileNetプロパティの値です。プロパティの値がこの設定値と一致すると、指定されたカテゴリパスの定型情報が生成されます。 プロパティの値はこの生成された定型情報の値になります。 | string | |
category | 生成される定型情報のカテゴリパスです。 | string | |
text | このXML要素は、FileNetプロパティの値をATML文書のテキストに変換します。テキストは、他の変換先とは違い、テキスト解析の対象となります。 ATML文書は複数のテキストをもてるため、複数のFileNetプロパティをATMLテキストとして指定することができます。 | 0 — 1 | |
name | Text Minerで表示される、テキストの名前です。 | string | |
date | FileNetプロパティの値をATML文書のdateに変換します。プロパティのデータ型はDateTimeまたはString(IBM Content Analyzerのdateを表す文字列) でなければなりません。 | 0 — 1 | |
title | FileNetプロパティをATML文書のタイトルに変換します。 | 0 — 1 |