IBM Content Analyzer インストールガイド
本書には、IBM の専有情報が含まれています。その情報は、使用許諾条件に基づき提供され、 著作権により保護されています。 本書に記載される情報には、いかなる製品の保証も含まれていません。 また、本書で提供されるいかなる記述も、製品保証として解釈すべきではありません。 お客様の環境によっては、資料中の円記号がバックスラッシュと表示されたり、バックスラッシュが円記号と表示されたりする場合があります。

© Copyright IBM Corp. 2007, 2008. All Rights Reserved.

この文書では、IBM Content Analyzer のインストール方法について解説します。
1 概略
この章では、IBM Content Analyzer のインストールの概略を解説します。
1.1 システム構成と動作環境
IBM Content Analyzer は以下のモジュールから構成されています。

モジュール 処理内容
前処理 言語処理・情報抽出、インデックス作成などのバッチ処理を行います。
TEXT MINER さまざまな分析をするためのエンタープライズ・アプリケーションです。
ALERTING SYSTEM アラーティング情報を表示、設定するためのエンタープライズ・アプリケーションです。
DICTIONARY EDITOR 辞書の作成、メンテナンスを行うためのエンタープライズ・アプリケーションです。
DOCAT 分類抽出の設定を行うためのエンタープライズ・アプリケーションです。
MANUAL マニュアルを表示します。
ブラウザ IBM Content Analyzer のエンタープライズアプリケーションに接続し、マイニング結果を表示します。

(TAKMI DOCAT は日本語版のみに含まれます)。

最小構成としては全てを1台のマシン上で動作させることも可能ですが、負荷分散の観点からは、
  • 前処理
  • エンタープライズ・アプリケーション(TEXT MINER、ALERTING SYSTEM、DICTIONARY EDITOR、DOCAT、MANUAL)
  • ブラウザ
をそれぞれ別のマシンで動作させることが推奨されます。全てを1台のマシンで動作させる場合の動作環境は以下のようになります。

オペレーティング・システム ハードウェア ソフトウェア
Windows 2003 Intel 32bit or AMD 32bit CPU
6GB メモリ(最小 2GB)
60GB ハードディスク
Microsoft Windows Service Pack 2
IBM WebSphere Application Server 6.1.0
IBM Java Runtime Environment , Java 2 Technology Edition, Version 5.0
AIX 5.3 Power 64bit CPU
6GB メモリ(最小 2GB)
60GB ハードディスク
IBM WebSphere Application Server 6.1.0
IBM Java Runtime Environment , Java 2 Technology Edition, Version 5.0
Red Hat Enterprise Linux 4 日本語環境 : 32bit x86 又は 64bit x86 CPU
英語環境 : 64bit x86 CPU
6GB メモリ(最小 2GB)
60GB ハードディスク
IBM WebSphere Application Server 6.1.0
IBM Java Runtime Environment , Java 2 Technology Edition, Version 5.0
注:クライアントはMicrosoft Internet Explorer 6が必要です。
1.2 環境変数
IBM Content Analyzer で利用する環境変数を以下に記します。

環境変数 意味
TAKMI_HOME IBM Content Analyzer の導入ディレクトリを指定します。
  • 運用時に設定ファイルを読み込むために参照します。
PATH TAKMI_HOME の bin ディレクトリを追加します。
日本語の解析を行う場合は TAKMI_HOME の uima/components/jsa/lib ディレクトリも追加されている必要があります。
  • 言語処理で用いるネイティブコードの呼び出しで参照します。
TAKMI_HOME(WebSphere Application Server システムプロパティ) システム環境変数 TAKMI_HOME と同じ値を指定します。
  • エンタープライズ・アプリケーションが参照します。
uima.home(WebSphere Application Server システムプロパティ) TAKMI_HOME の uima ディレクトリを指定します。
  • エンタープライズ・アプリケーションが参照します。
ws.ext.dirs(WebSphere Application Server システムプロパティ) TAKMI_HOME の lib ディレクトリ、 uima/lib ディレクトリ、uima/components/TAKMI_NLP/lib ディレクトリ、 uima/components/jsa/lib ディレクトリとuima/components/LW/lib ディレクトリを指定します。
  • ws.ext.dirs は WebSphere Application Server の setupCmdLine.bat の WAS_EXT_DIRS で設定することも可能です。
1.3 ブラウザ設定
クライアントソフトウェア(Webブラウザー)として Microsoft Internet Explorer 6が必要です。 ブラウザの設定はお使いの環境でのセキュリティーポリシーに従って行ってください。
Webブラウザーではポップアップウィンドウの機能が有効になっている必要があります。ポップアップブロッカーの設定によりポップアップ機能が無効になることがありますので、必要に応じて無効にしてください。
2 インストール手順
この章では、IBM Content Analyzer のインストール手順を解説します。
2.1 インストール
2.1.1 GUIモードでインストール
Windows の場合はtakmisetupwin32.exe、AIX の場合は takmisetupaix.bin コマンド、 Linuxの場合は takmisetuplinux.bin コマンドを実行してインストーラを起動します。
下記はWindowsでのGUIモードのインストールの例です。
コマンド
takmisetupwin32.exe
  • ウェルカム画面が表示されます。



    「次へ」ボタンを押して次に進んでください。

  • プログラムの使用条件が表示されます。



    使用条件に同意する場合は「使用条件の条項に同意します。」を選択して、「次へ」ボタンを押して処理を続けてください。

  • IBM Content Analyzer をインストールするディレクトリを指定する画面が表示されます。



    ディレクトリを指定して、「次へ」ボタンを押してください。

  • インストール・タイプを選択する画面が表示されます。



    インストール・タイプを選択して、「次へ」ボタンを押してください。

  • インストール・タイプを選択する画面で「カスタム」を選択した場合、インストールするフィーチャーを選択する画面が表示されます。



    インストールするフィーチャーを選択して、「次へ」ボタンを押してください。

  • インストール内容を確認する画面が表示されます。



    「インストール」ボタンを押してインストールを開始してください。

  • インストール結果を確認する画面が表示されます。



    「終了」ボタンを押してインストールを終了してください。
2.1.2 コンソールモードでインストール
Windows の場合はtakmisetupwin32.exe、AIX の場合は takmisetupaix.bin コマンド、 Linuxの場合は takmisetuplinux.bin コマンドにオプション"-console"をつけて、インストーラを起動します。
下記はWindowsでのコンソールモードのインストールの例です。
コマンド
takmisetupwin32.exe -console
  • ウェルカム画面が表示されます。



    Enter キーを押して次に進んでください。

  • プログラムの使用条件が表示されます。



    使用条件に同意する場合は"1"を押して処理を続けてください。

  • IBM Content Analyzer をインストールするディレクトリを指定する画面が表示されます。



    ディレクトリを指定して、"1"を押してください。

  • インストール・タイプを選択する画面が表示されます。



    インストール・タイプを選択して、"0" を押してください。

  • インストール・タイプを選択する画面で「カスタム」を選択した場合、インストールするフィーチャーを選択する画面が表示されます。



    インストールするフィーチャーを選択して、"0" を押してください。

  • インストール内容を確認する画面が表示されます。



    Enter キーを押してインストールを開始してください。

  • インストール結果を確認する画面が表示されます。



    "3" を押してインストールを終了してください。

2.2 設定ファイルの更新
IBM Content Analyzer を導入したディレクトリ下の

   conf/global_config.xml

を導入環境に合わせて更新します。
データベース・エントリは database_entry のタグ内で

    <database_entry name="SAMPLE" path_type="absolute" path="C:/Program Files/IBM/takmi/databases/sample"/>

のように

   name = データベース名(データベースの選択画面で表示されるもので自由に設定できます)
   path_type = データベース・ディレクトリへのパスのタイプ(相対パスの場合は "relative"、絶対パスの場合は "absolute" を指定します)
   path = データベースディレクトリへのパス(ディレクトリのセパレータは "/" を使用します)

で指定します。
インストール時にサンプル・データベースを選択した場合、サンプル・データベースのエントリが追加されます。
2.3 アンインストール
アンインストーラーは IBM Content Analyzer を導入したディレクトリ下の _uninst ディレクトリに作成されます。
IBM Content Analyzer のライプラリーは WebSphere Application Server の拡張クラスローダーにロードされているため、「プログラム・ファイル」をアンインストールする場合はアンインストーラーの起動前に WebSphere Application Server を停止してください。

2.3.1 GUI モードでアンインストール
Windows の場合はuninstaller.exe、AIX 又は Linux の場合は uninstaller.bin コマンドを実行してインストーラを起動します。
下記はWindowsでのGUIモードのアンインストールの例です。
コマンド
uninstaller.exe
  • ウェルカム画面が表示されます。



    「次へ」ボタンを押して次に進んでください。

  • アンインストールするフィーチャーを選択する画面が表示されます。



    アンインストールするフィーチャーを選択して、「次へ」ボタンを押してください。

  • アンインストール内容を確認する画面が表示されます。



    「アンインストール」ボタンを押してアンインストールを開始してください。

  • アンインストール結果を確認する画面が表示されます。



    「終了」ボタンを押してアンインストールを終了してください。
2.3.2 コンソールモードでアンインストール
Windows の場合はuninstaller.exe、AIX 又は Linux の場合は uninstaller.bin コマンドにオプション"-console"をつけてインストーラを起動します。
下記はWindowsでのGUIモードのアンインストールの例です。
コマンド
uninstaller.exe -console
  • ウェルカム画面が表示されます。



    "1" を押して次に進んでください。

  • アンインストールするフィーチャーを選択する画面が表示されます。



    アンインストールするフィーチャーを選択して、"0" を押してください。

  • アンインストール内容を確認する画面が表示されます。



    "1" を押してアンインストールを開始してください。

  • アンインストール結果を確認する画面が表示されます。



    "3" を押してアンインストールを終了してください。

3 WebSphere Application Server 設定
この章では、WebSphere Application Server の設定手順を解説します。
3.1 wsadmin コマンドの実行
AIX 又は Linux で、wsadmin コマンドを実行する前、TAKMI_HOME の uima/components/jsa/lib ディレクトリは環境変数 LIBPATH (AIXの場合)、 又は環境変数 LD_LIBRARY_PATH (Linux の場合)に設定されているかを確認する。設定されていなければ、ログアウトしてから、コマンド
    su - [username]
で再ログインします。

AIX:
    echo $LIBPATH
    /opt/IBM/takmi/uima/components/jsa/lib

Linux:
    echo $LD_LIBRARY_PATH
    /opt/IBM/takmi/uima/components/jsa/lib

IBM Content Analyzer を導入したディレクトリ下の ear ディレクトリに移動し、Windows の場合は

    C:\Program Files\IBM\WebSphere\AppServer\bin\wsadmin.bat -f .\TAKMI.jacl

AIX 又は Linux の場合は

    /usr/IBM/WebSphere/AppServer/bin/wsadmin.sh -f ./TAKMI.jacl

コマンドを実行します。
TAKMI.jacl ファイルはアプリケーション・サーバー "server1" に対する設定を行うことを前提にしていますので、他のサーバーに対する設定を行う場合は事前に TAKMI.jacl ファイルを修正してコマンドを実行してください。
このコマンドは 3.2 アプリケーション・サーバーの設定3.3 エンタープライズ・アプリケーションのインストール の処理を自動で実行します。

WebSphere Application Server の設定でグローバル・セキュリティーを使用可能にしている場合は、wsadmin コマンドの実行時に -user パラメータと -password パラメータを指定する必要があります。
wsadmin コマンドの詳細については WebSphere Application Server のマニュアル等を参照してください。
3.2 アプリケーション・サーバーの設定
以下の手順でアプリケーション・サーバーの設定を行います。
TAKMI で利用する環境変数の意味については 1.2 環境変数 をご覧ください。
  • WebSphere Application Server を起動し、管理コンソールにログインします。
  • 「サーバー」→「アプリケーション・サーバー」→「server1」→「Java およびプロセス管理」→「プロセス定義」→「Java 仮想マシン」→「カスタム・プロパティ」を選択します。
  • 「新規作成」ボタンを押し、「名前」に TAKMI_HOME、「値」に IBM Content Analyzer の導入ディレクトリ(Windows のデフォルトでは C:\Program Files\IBM\takmi、AIX と Linux のデフォルトでは /opt/IBM/takmi)を入力し、「OK」ボタンを押します。
  • 「新規作成」ボタンを押し、「名前」に uima.home、「値」に UIMA の導入ディレクトリ(Windows のデフォルトでは C:\Program Files\IBM\takmi\uima、AIX と Linux のデフォルトでは /opt/IBM/takmi/uima)を入力し、「OK」ボタンを押します。
  • 「新規作成」ボタンを押し、「名前」に ws.ext.dirs、「値」に TAKMI_HOME の lib ディレクトリ、uima/lib ディレクトリ、 uima/components/TAKMI_NLP/lib ディレクトリ、 uima/components/jsa/lib ディレクトリとuima/components/LW/lib ディレクトリを入力し、「OK」ボタンを押します。

    Windows のデフォルトでは
       C:\Program Files\IBM\takmi\lib;C:\Program Files\IBM\uima\lib;C:\Program Files\IBM\uima\components\TAKMI_NLP\lib;C:\Program Files\IBM\uima\components\jsa\lib;C:\Program Files\IBM\uima\components\LW\lib

    AIX と Linux のデフォルトでは
       /opt/IBM/takmi/lib:/opt/IBM/uima/lib:/opt/IBM/uima/components/TAKMI_NLP/lib:/opt/IBM/uima/components/jsa/lib:/opt/IBM/uima/components/LW/lib

    になります。
  • 「保管」をクリックし、変更をマスター構成に保管します。
3.3 エンタープライズ・アプリケーションのインストール
IBM Content Analyzer を導入したディレクトリ下の .ear ファイルを WebSphere Application Server にインストールします

    ear/TAKMI_MINER.ear
    ear/TAKMI_ALERT.ear
    ear/TAKMI_DIC.ear
    ear/TAKMI_DOCAT.ear
    ear/TAKMI_MANUAL.ear

(TAKMI_DOCAT.ear は日本語版のみに含まれます)。
  • WebSphere Application Server を起動し、管理コンソールにログインします。
  • 「アプリケーション」→「新規アプリケーションのインストール」を選択します。
  • 「アプリケーション・インストールの準備」の画面でインストールする .ear ファイルを選択し、「次へ」ボタンを押します。
  • 「アプリケーション・インストールの準備」の画面で「次へ」ボタンを押します。
  • 「ステップ 1: インストール・オプションの選択」の画面で「次へ」ボタンを押します。
  • 「ステップ 2: サーバーにモジュールをマップ」の画面で「次へ」ボタンを押します。
  • 「ステップ 3: Web モジュールの仮想ホストをマップの画面で「次へ」ボタンを押します。
  • TAKMI_MANUAL.ear 以外の場合は「ステップ 4: セキュリティー役割をユーザー/グループにマップ」の画面でセキュリティー役割をユーザー/グループにマップし、「次へ」ボタンを押します。
    WebShpere Application Server のセキュリティ設定については 3.4 セキュリティ設定 を参照してください。
  • 「ステップ5: 要約」(TAKMI_MANUAL_EAR.ear の場合は「「ステップ4: 要約」)の画面で「終了」ボタンを押します。
  • アプリケーションが正常にインストールされたことを確認し、マスター構成に保管してください。
エンタープライズ・アプリケーションのインストールの詳細については WebSphere Application Server のマニュアル等を参照してください。

全てのアプリケーションのインストール完了後、WebSphere Application Server の再起動を行います

3.4 セキュリティ設定
インストールしたエンタープライズ・アプリケーションをユーザー認証で保護する場合は以下のセキュリティ設定を行います。
  • WebSphere Application Server を起動し、管理コンソールにログインします。
  • 「セキュリティ」→「グローバル・セキュリティー」を選択します。
  • 「アクティブ・ユーザー・レジストリー」で指定するユーザー・レジストリーを構成し、そのプロパティを設定します。
  • 一般プロパティの「グローバル・セキュリティーを使用可能にする」をチェックします。「Java 2 セキュリティーを強制する」も同時にチェックされますが、こちらのチェックは外します。
  • 「アクティブ・ユーザー・レジストリー」オプションから構成済みユーザー・レジストリー・タイプを選択し、「OK」ボタンを押します。
  • 「アプリケーション」→「エンタープライズ・アプリケーション」を選択します。
  • インストール済みのエンタープライズ・アプリケーションを選択します。
  • 追加プロパティの「セキュリティ役割をユーザー/グループにマップ」をクリックし、セキュリティー役割をユーザー/グループにマップして、「OK」ボタンを押します。
    エンタープライズ・アプリケーションに対応するセキュリティ役割は以下の通りです。

    エンタープライズ・アプリケーション セキュリティ役割
    TAKMI_MINER_EAR takmi_miner
    TAKMI_ALERT_EAR takmi_alerting_system
    TAKMI_DIC_EAR takmi_dictionary_editor
    TAKMI_DOCAT_EAR takmi_docat

  • 「保管」をクリックし、変更をマスター構成に保管します。
  • WebSphere Application Server を再起動します。
セキュリティ設定の詳細については WebSphere Application Server のマニュアル等を参照してください。
4 動作確認
この章では IBM Content Analyzer の動作確認手順を解説します。
4.1 エンタープライズアプリケーションの動作確認
WebSphere Application Server を再起動し、ブラウザより各エンタープライズ・アプリケーションにアクセスして動作を確認します。

各エンタープライズ・アプリケーションの URL は以下の表のようになっています。

モジュール URL
TEXT MINER http://ホスト名:ポート/TAKMI_MINER/
ALERTING SYSTEM http://ホスト名:ポート/TAKMI_ALERT/
DICTIONARY EDITOR http://ホスト名:ポート/TAKMI_DIC/
DOCAT TEXT MINER より接続します。
MANUAL http://ホスト名:ポート/TAKMI_MANUAL/

例えば WebSphere Application Server のデフォルト server1 で、ローカルホストで起動している TAKMI MINER にアクセスする場合の URL は

    http://localhost:9080/TAKMI_MINER/

になります。

ホスト名とポートは環境によって異なりますので、WebSphere Application Server の管理者に確認してください。
  • TEXT MINER
    http://ホスト名:ポート/TAKMI_MINER/(例:http://localhost:9080/TAKMI_MINER/)にアクセスし、以下のような画面が表示されることを確認します。

    TEXT_MINERのスクリーンショット

    TEXT MINER の使用方法については、TEXT MINER 画面右上の「マニュアル」メニューをクリックして、オンライン・マニュアルを参照してください。

  • ALERTING SYSTEM
    http://ホスト名:ポート/TAKMI_ALERT/ (例:http://localhost:9080/TAKMI_ALERT/)にアクセスし、以下のような画面が表示されることを確認します。

    ALERTING_SYSTEMのスクリーンショット

  • DICTIONARY EDITOR
    http://ホスト名:ポート/TAKMI_DIC/ (例:http://localhost:9080/TAKMI_DIC/)にアクセスし、以下のような画面が表示されることを確認します。

    DICTIONARY_EDITORのスクリーンショット

  • DOCAT
    http://ホスト名:ポート/TAKMI_MINER/ (例:http://localhost:9080/TAKMI_MINER/)にアクセスし文書一覧ビューを選択し以下を実施し、TAKMI_DOCAT の別画面が開くことを確認します。

    (1)外部接続ボタンを押します。
    (2)ポップアップ画面で「TAKMI_DOCAT に接続」をクリックします。

    TEXT_MINERからTAKMI_DOCATへの接続

    次に以下を実施します。

    (1)カテゴリを一つ選択します
    (2)カテゴリパレットで登録ボタンを押します
    (3)シミュレーション実行ボタンを押します

    TAKMI_DOCATのスクリーンショット

    シミュレーション実行でエラーが起きた場合は WebSphere Application Server の設定 が正しく行われていることを確認してください。
4.2 前処理の動作の確認
サンプル・データベースを使用し、前処理(データ変換言語処理インデキシング)が正しく動作することを確認します。
前処理の詳細については 運用マニュアル を参照してください。
  • WebSphere Application Server を停止します。
  • IBM Content Analyzer を導入したディレクトリ下の databases/INDEXED_DATA_SAMPLE_JA/bin ディレクトリに移動し、Windows の場合は takmi_preprocess_all.bat、AIX の場合は takmi_preprocess_all.sh コマンドを実行します。
  • 画面の指示に従い 'Y' を入力します。



  • データの削除データ変換言語処理インデキシングが順に実行されます。
  • 画面の指示に従い、何かキーを入力して処理を終了します。



  • WebSphere Application Server を起動します。
  • 作成された INDEXED_DATA_SAMPLE_JA データベースのインデックスを TAKMI_MINER で確認します。
5 旧バージョンからの移行
この章では IBM Content Analyzer の旧バージョンからの移行手順を解説します。
5.1 旧バージョンのアンインストールと新バージョンのインストール
既に旧バージョンのOmniFind Analytics Edition が導入されている環境に新しいバージョンの IBM Content Analyzer をインストールする際には、旧いバージョンのアンインストールを行なってから新しいバージョンのインストールを行なってください。

サンプルデータベース以外のデータベースを使用している場合は、旧いバージョンのアンインストール時に global_config.xml ファイルを削除せずに新しいバージョンでそのままご使用ください。OmniFind Analytics Edition V8.4 のデータベースを OmniFind Analytics Edition V8.4.1 で使用する際に必要な作業 を実行する必要があります。 また、OmniFind Analytics Edition V8.4.1 のデータベースを OmniFind Analytics Edition V8.4.1 Hotfix 及び IBM Content Analyzer V8.4.2で使用する際に必要な作業 を実行する必要があります。

新しいバージョンのインストール完了後に WebSphere Application Server の設定 を実行し、エンタープライズ・アプリケーションの更新を行なってください。
5.2 OmniFind Analytics Edition V8.4 のデータベースを OmniFind Analytics Edition V8.4.1 で使用するために必要な作業
OmniFind Analytics Edition V8.4 のデータベースを OmniFind Analytics Edition V8.4.1 で使用する際には database_config.xml ファイルの修正が必要です。データベース・ディレクトリ下の

    conf/database_config.xml

ファイルをテキスト・エディタ等で開き、以下の手順に従って修正してください。
  1. common パラメータの mining_function_entries に以下の mining_function_entry を追加します。

        <mining_function_entry name="com.ibm.takmi.mining.topview.TopViewFunction" impl="com.ibm.takmi.impl.std.mining.topview.StandardTopViewFunction"/>

  2. standard パラメータの category_entries と date_format_entries を common パラメータに移動します。
以下は OmniFind Analytics Edition V8.4 の INDEXED_DATA_SAMPLE_JA サンプルデータベースを OmniFind Analytics Edition V8.4.1 で使用するために database_config.xml ファイルを修正した場合の例です。

  • OmniFind Analytics Edition V8.4 の database_config.xml

    <?xml version="1.0" encoding="utf-8"?>
    <database_config>
    <!-- common -->
    <params>
    <param name="language" value="ja"/>
    <param name="date_category_yyyymmdd" value=".date/yyyymmdd"/>
    <param name="date_category_yyyy" value=".date/yyyy"/>
    <param name="date_category_yyyymm" value=".date/yyyymm"/>
    <param name="date_category_yyyyww" value=".date/yyyyww"/>
    <param name="date_category_day_of_week" value=".date/dow"/>
    <param name="date_category_day_of_month" value=".date/dd"/>
    <param name="date_year_start_month" value="1"/>
    <param name="max_doc_length_to_display" value="10000"/>
    <param name="max_keyword_length" value="255"/>
    <param name="max_category_name_length" value="63"/>
    <param name="max_category_path_length" value="255"/>
    <param name="max_category_depth" value="20"/>
    <!-- parameters for NLP -->
    <param name="max_doc_length_for_nlp" value="65535"/>
    <param name="max_id_length" value="255"/>
    <param name="max_title_length" value="5000"/>
    <param name="max_text_name_length" value="63"/>
    </params>
    <application_entries>
    <application_entry name="Dictionary" impl="com.ibm.takmi.impl.std.dic.edit.config.StandardDictionaryFactoryImpl"/>
    <application_entry name="Indexer" impl="com.ibm.takmi.impl.std.idx.config.StandardIndexerFactoryImpl"/>
    <application_entry name="AlertingSystem" impl="com.ibm.takmi.impl.std.alerting.config.StandardAlertingFactoryImpl"/>
    <application_entry name="NLPResource" impl="com.ibm.takmi.impl.std.nlprsc.config.StandardNLPResourceFactoryImpl"/>
    </application_entries>
    <search_function_entries>
    <search_function_entry name="com.ibm.takmi.impl.common.search.CategorySearchFunction" impl="com.ibm.takmi.impl.std.search.StandardCategorySearchFunction"/>
    <search_function_entry name="com.ibm.takmi.impl.common.search.KeywordSearchFunction" impl="com.ibm.takmi.impl.std.search.StandardKeywordSearchFunction"/>
    <search_function_entry name="com.ibm.takmi.impl.common.search.NumberSearchFunction" impl="com.ibm.takmi.impl.std.search.StandardNumberSearchFunction"/>
    <search_function_entry name="com.ibm.takmi.impl.common.search.InvalidSearchFunction" impl="com.ibm.takmi.impl.std.search.StandardInvalidSearchFunction"/>
    </search_function_entries>
    <mining_function_entries>
    <mining_function_entry name="com.ibm.takmi.mining.doclistview.DocListViewFunction" impl="com.ibm.takmi.impl.std.mining.doclistview.StandardDocListViewFunction"/>
    <mining_function_entry name="com.ibm.takmi.mining.iddocview.IdDocViewFunction" impl="com.ibm.takmi.impl.std.mining.iddocview.StandardIdDocViewFunction"/>
    <mining_function_entry name="com.ibm.takmi.mining.categoryview.CategoryViewFunction" impl="com.ibm.takmi.impl.std.mining.categoryview.StandardCategoryViewFunction"/>
    <mining_function_entry name="com.ibm.takmi.mining.timeseriesview.TimeSeriesViewFunction" impl="com.ibm.takmi.impl.std.mining.timeseriesview.StandardTimeSeriesViewFunction"/>
    <mining_function_entry name="com.ibm.takmi.mining.topicview.TopicViewFunction" impl="com.ibm.takmi.impl.std.mining.topicview.StandardTopicViewFunction"/>
    <mining_function_entry name="com.ibm.takmi.mining.twodmapview.TwoDMapViewFunction" impl="com.ibm.takmi.impl.std.mining.twodmapview.StandardTwoDMapViewFunction"/>
    </mining_function_entries>
    <frequently_used_category_entries>
    <frequently_used_category_entry path=".tkm_ja_base_word"/>
    <frequently_used_category_entry path=".tkm_ja_base_phrase"/>
    </frequently_used_category_entries>
    <infrequently_used_category_entries>
    <infrequently_used_category_entry path=".date"/>
    </infrequently_used_category_entries>
    <!-- standard -->
    <impl name="standard">
    <params>
    <param name="number_of_groups" value="3"/>
    <param name="number_of_keywords_per_group" value="1000000"/>
    </params>
    <category_entries>
    <!-- Specifies subroot categories for system-reserved categories. -->
    <category_entry name="reserved_by_system" value=".date"/>
    <category_entry name="reserved_by_system" value=".date/dd"/>
    <category_entry name="reserved_by_system" value=".date/dow"/>
    <category_entry name="reserved_by_system" value=".date/yyyy"/>
    <category_entry name="reserved_by_system" value=".date/yyyymm"/>
    <category_entry name="reserved_by_system" value=".date/yyyyww"/>
    <category_entry name="reserved_by_system" value=".date/yyyymmdd"/>
    <category_entry name="reserved_by_system" value=".tkm_ja_base_word"/>
    <category_entry name="reserved_by_system" value=".tkm_ja_base_phrase"/>
    <category_entry name="reserved_by_system" value=".usr/1"/>
    <category_entry name="reserved_by_system" value=".usr/2"/>
    <!-- Specifies the auto generated category pathes by a regular expression to avoid recursive generation.
    The following regular expression represents exclusive pathes which end with
    ".base_phrase",
    ".base_phrase.-M-npred",
    ".base_phrase.-M-verb",
    ".base_phrase.-M-adjs", and
    ".base_phrase.adjs-M-",
    ".appl_voc_phrase",
    ".appl_voc_phrase.-M-bad",
    ".appl_voc_phrase.-M-good",
    ".appl_voc_phrase.-M-request",
    ".appl_voc_phrase.-M-thanks", and
    ".appl_voc_phrase.-M-question",
    -->
    <category_entry name="auto_generated_path_pattern" value="\.((base)|(appl_voc))_phrase(\.((-M-npred)|(-M-verb)|(-M-adjs)|(adjs-M-)|(-M-good)|(-M-bad)|(-M-thanks)|(-M-request)|(-M-question)))?$"/>
    <!-- Specifies subroot categories for DOCAT -->
    <category_entry name="non_dictionary" value=".0"/>
    </category_entries>
    <file_indexer_entries>
    <file_indexer_entry name="com.ibm.takmi.impl.std.idx.keyid.KeyIdIndexWriter"/>
    <file_indexer_entry name="com.ibm.takmi.impl.std.idx.date.DateIndexWriter"/>
    <file_indexer_entry name="com.ibm.takmi.impl.std.idx.cattodoc.CatToDocIndexWriter"/>
    <file_indexer_entry name="com.ibm.takmi.impl.std.idx.doctokey.DocToKeyIndexWriter"/>
    <file_indexer_entry name="com.ibm.takmi.impl.std.idx.keytodoc.KeyToDocIndexWriter"/>
    <file_indexer_entry name="com.ibm.takmi.impl.std.idx.numtodoc.NumToDocIndexWriter"/>
    <file_indexer_entry name="com.ibm.takmi.impl.std.idx.idtodoc.IdToDocIndexWriter"/>
    <file_indexer_entry name="com.ibm.takmi.impl.std.idx.metadata.MetadataIndexWriter"/>
    </file_indexer_entries>
    <index_file_merger_entries>
    <index_file_merger_entry name="com.ibm.takmi.impl.std.idx.cattodoc.CatToDocIndexFileMerger"/>
    <index_file_merger_entry name="com.ibm.takmi.impl.std.idx.doctokey.DocToKeyIndexFileMerger"/>
    <index_file_merger_entry name="com.ibm.takmi.impl.std.idx.keytodoc.KeyToDocIndexFileMerger"/>
    <index_file_merger_entry name="com.ibm.takmi.impl.std.idx.numtodoc.NumToDocIndexFileMerger"/>
    <index_file_merger_entry name="com.ibm.takmi.impl.std.idx.idtodoc.IdToDocIndexFileMerger"/>
    <index_file_merger_entry name="com.ibm.takmi.impl.std.idx.metadata.MetadataIndexFileMerger"/>
    </index_file_merger_entries>
    <index_group_merger_entries>
    <index_group_merger_entry name="com.ibm.takmi.impl.std.idx.cattodoc.CatToDocIndexGroupMerger"/>
    <index_group_merger_entry name="com.ibm.takmi.impl.std.idx.doctokey.DocToKeyIndexGroupMerger"/>
    <index_group_merger_entry name="com.ibm.takmi.impl.std.idx.keytodoc.KeyToDocIndexGroupMerger"/>
    <index_group_merger_entry name="com.ibm.takmi.impl.std.idx.numtodoc.NumToDocIndexGroupMerger"/>
    <index_group_merger_entry name="com.ibm.takmi.impl.std.idx.idtodoc.IdToDocIndexGroupMerger"/>
    <index_group_merger_entry name="com.ibm.takmi.impl.std.idx.metadata.MetadataIndexGroupMerger"/>
    </index_group_merger_entries>
    <path_entries>
    <path_entry name="index_root" value="db/index"/>
    <path_entry name="keyword_id" value="keyword_id"/>
    <path_entry name="doc_to_key" value="doc_to_key"/>
    <path_entry name="key_to_doc" value="key_to_doc"/>
    <path_entry name="cat_to_doc" value="cat_to_doc"/>
    <path_entry name="num_to_doc" value="num_to_doc"/>
    <path_entry name="id_to_doc" value="id_to_doc"/>
    <path_entry name="metadata" value="metadata"/>
    </path_entries>
    <data_entries min_doc_id="0" max_doc_id="39">
    <data_entry path_type="relative" path="db/miml/sample_1.miml" type="miml" min_doc_id="0" max_doc_id="25"/>
    <data_entry path_type="relative" path="db/miml/sample_2.miml" type="miml" min_doc_id="26" max_doc_id="39"/>
    </data_entries>
    <date_format_entries path=".date">
    <date_format_entry value="yyyyMMdd" locale="ja_JP"/>
    <date_format_entry value="yyyy MMM" locale="en_US"/>
    </date_format_entries>
    </impl>
    </database_config>

  • OmniFind Analytics Edition V8.4.1 の database_config.xml

    <?xml version="1.0" encoding="utf-8"?>
    <database_config>
    <!-- common -->
    <params>
    <param name="language" value="ja"/>
    <param name="date_category_yyyymmdd" value=".date/yyyymmdd"/>
    <param name="date_category_yyyy" value=".date/yyyy"/>
    <param name="date_category_yyyymm" value=".date/yyyymm"/>
    <param name="date_category_yyyyww" value=".date/yyyyww"/>
    <param name="date_category_day_of_week" value=".date/dow"/>
    <param name="date_category_day_of_month" value=".date/dd"/>
    <param name="date_year_start_month" value="1"/>
    <param name="max_doc_length_to_display" value="10000"/>
    <param name="max_keyword_length" value="255"/>
    <param name="max_category_name_length" value="63"/>
    <param name="max_category_path_length" value="255"/>
    <param name="max_category_depth" value="20"/>
    <!-- parameters for NLP -->
    <param name="max_doc_length_for_nlp" value="65535"/>
    <param name="max_id_length" value="255"/>
    <param name="max_title_length" value="5000"/>
    <param name="max_text_name_length" value="63"/>
    </params>
    <application_entries>
    <application_entry name="Dictionary" impl="com.ibm.takmi.impl.std.dic.edit.config.StandardDictionaryFactoryImpl"/>
    <application_entry name="Indexer" impl="com.ibm.takmi.impl.std.idx.config.StandardIndexerFactoryImpl"/>
    <application_entry name="AlertingSystem" impl="com.ibm.takmi.impl.std.alerting.config.StandardAlertingFactoryImpl"/>
    <application_entry name="NLPResource" impl="com.ibm.takmi.impl.std.nlprsc.config.StandardNLPResourceFactoryImpl"/>
    </application_entries>
    <search_function_entries>
    <search_function_entry name="com.ibm.takmi.impl.common.search.CategorySearchFunction" impl="com.ibm.takmi.impl.std.search.StandardCategorySearchFunction"/>
    <search_function_entry name="com.ibm.takmi.impl.common.search.KeywordSearchFunction" impl="com.ibm.takmi.impl.std.search.StandardKeywordSearchFunction"/>
    <search_function_entry name="com.ibm.takmi.impl.common.search.NumberSearchFunction" impl="com.ibm.takmi.impl.std.search.StandardNumberSearchFunction"/>
    <search_function_entry name="com.ibm.takmi.impl.common.search.InvalidSearchFunction" impl="com.ibm.takmi.impl.std.search.StandardInvalidSearchFunction"/>
    </search_function_entries>
    <mining_function_entries>
    <mining_function_entry name="com.ibm.takmi.mining.topview.TopViewFunction" impl="com.ibm.takmi.impl.std.mining.topview.StandardTopViewFunction"/>
    <mining_function_entry name="com.ibm.takmi.mining.doclistview.DocListViewFunction" impl="com.ibm.takmi.impl.std.mining.doclistview.StandardDocListViewFunction"/>
    <mining_function_entry name="com.ibm.takmi.mining.iddocview.IdDocViewFunction" impl="com.ibm.takmi.impl.std.mining.iddocview.StandardIdDocViewFunction"/>
    <mining_function_entry name="com.ibm.takmi.mining.categoryview.CategoryViewFunction" impl="com.ibm.takmi.impl.std.mining.categoryview.StandardCategoryViewFunction"/>
    <mining_function_entry name="com.ibm.takmi.mining.timeseriesview.TimeSeriesViewFunction" impl="com.ibm.takmi.impl.std.mining.timeseriesview.StandardTimeSeriesViewFunction"/>
    <mining_function_entry name="com.ibm.takmi.mining.topicview.TopicViewFunction" impl="com.ibm.takmi.impl.std.mining.topicview.StandardTopicViewFunction"/>
    <mining_function_entry name="com.ibm.takmi.mining.twodmapview.TwoDMapViewFunction" impl="com.ibm.takmi.impl.std.mining.twodmapview.StandardTwoDMapViewFunction"/>
    </mining_function_entries>
    <frequently_used_category_entries>
    <frequently_used_category_entry path=".tkm_ja_base_word"/>
    <frequently_used_category_entry path=".tkm_ja_base_phrase"/>
    </frequently_used_category_entries>
    <infrequently_used_category_entries>
    <infrequently_used_category_entry path=".date"/>
    </infrequently_used_category_entries>
    <category_entries>
    <!-- Specifies subroot categories for system-reserved categories. -->
    <category_entry name="reserved_by_system" value=".date"/>
    <category_entry name="reserved_by_system" value=".date/dd"/>
    <category_entry name="reserved_by_system" value=".date/dow"/>
    <category_entry name="reserved_by_system" value=".date/yyyy"/>
    <category_entry name="reserved_by_system" value=".date/yyyymm"/>
    <category_entry name="reserved_by_system" value=".date/yyyyww"/>
    <category_entry name="reserved_by_system" value=".date/yyyymmdd"/>
    <category_entry name="reserved_by_system" value=".tkm_ja_base_word"/>
    <category_entry name="reserved_by_system" value=".tkm_ja_base_phrase"/>
    <category_entry name="reserved_by_system" value=".usr/1"/>
    <category_entry name="reserved_by_system" value=".usr/2"/>
    <!-- Specifies the auto generated category pathes by a regular expression to avoid recursive generation.
    The following regular expression represents exclusive pathes which end with
    ".base_phrase",
    ".base_phrase.-M-npred",
    ".base_phrase.-M-verb",
    ".base_phrase.-M-adjs", and
    ".base_phrase.adjs-M-",
    ".appl_voc_phrase",
    ".appl_voc_phrase.-M-bad",
    ".appl_voc_phrase.-M-good",
    ".appl_voc_phrase.-M-request",
    ".appl_voc_phrase.-M-thanks", and
    ".appl_voc_phrase.-M-question",
    -->
    <category_entry name="auto_generated_path_pattern" value="\.((base)|(appl_voc))_phrase(\.((-M-npred)|(-M-verb)|(-M-adjs)|(adjs-M-)|(-M-good)|(-M-bad)|(-M-thanks)|(-M-request)|(-M-question)))?$"/>
    <!-- Specifies subroot categories for DOCAT -->
    <category_entry name="non_dictionary" value=".0"/>
    </category_entries>
    <date_format_entries path=".date">
    <date_format_entry value="yyyyMMdd" locale="ja_JP"/>
    <date_format_entry value="yyyy MMM" locale="en_US"/>
    </date_format_entries>

    <!-- standard -->
    <impl name="standard">
    <params>
    <param name="number_of_groups" value="3"/>
    <param name="number_of_keywords_per_group" value="1000000"/>
    </params>
    <file_indexer_entries>
    <file_indexer_entry name="com.ibm.takmi.impl.std.idx.keyid.KeyIdIndexWriter"/>
    <file_indexer_entry name="com.ibm.takmi.impl.std.idx.date.DateIndexWriter"/>
    <file_indexer_entry name="com.ibm.takmi.impl.std.idx.cattodoc.CatToDocIndexWriter"/>
    <file_indexer_entry name="com.ibm.takmi.impl.std.idx.doctokey.DocToKeyIndexWriter"/>
    <file_indexer_entry name="com.ibm.takmi.impl.std.idx.keytodoc.KeyToDocIndexWriter"/>
    <file_indexer_entry name="com.ibm.takmi.impl.std.idx.numtodoc.NumToDocIndexWriter"/>
    <file_indexer_entry name="com.ibm.takmi.impl.std.idx.idtodoc.IdToDocIndexWriter"/>
    <file_indexer_entry name="com.ibm.takmi.impl.std.idx.metadata.MetadataIndexWriter"/>
    </file_indexer_entries>
    <index_file_merger_entries>
    <index_file_merger_entry name="com.ibm.takmi.impl.std.idx.cattodoc.CatToDocIndexFileMerger"/>
    <index_file_merger_entry name="com.ibm.takmi.impl.std.idx.doctokey.DocToKeyIndexFileMerger"/>
    <index_file_merger_entry name="com.ibm.takmi.impl.std.idx.keytodoc.KeyToDocIndexFileMerger"/>
    <index_file_merger_entry name="com.ibm.takmi.impl.std.idx.numtodoc.NumToDocIndexFileMerger"/>
    <index_file_merger_entry name="com.ibm.takmi.impl.std.idx.idtodoc.IdToDocIndexFileMerger"/>
    <index_file_merger_entry name="com.ibm.takmi.impl.std.idx.metadata.MetadataIndexFileMerger"/>
    </index_file_merger_entries>
    <index_group_merger_entries>
    <index_group_merger_entry name="com.ibm.takmi.impl.std.idx.cattodoc.CatToDocIndexGroupMerger"/>
    <index_group_merger_entry name="com.ibm.takmi.impl.std.idx.doctokey.DocToKeyIndexGroupMerger"/>
    <index_group_merger_entry name="com.ibm.takmi.impl.std.idx.keytodoc.KeyToDocIndexGroupMerger"/>
    <index_group_merger_entry name="com.ibm.takmi.impl.std.idx.numtodoc.NumToDocIndexGroupMerger"/>
    <index_group_merger_entry name="com.ibm.takmi.impl.std.idx.idtodoc.IdToDocIndexGroupMerger"/>
    <index_group_merger_entry name="com.ibm.takmi.impl.std.idx.metadata.MetadataIndexGroupMerger"/>
    </index_group_merger_entries>
    <path_entries>
    <path_entry name="index_root" value="db/index"/>
    <path_entry name="keyword_id" value="keyword_id"/>
    <path_entry name="doc_to_key" value="doc_to_key"/>
    <path_entry name="key_to_doc" value="key_to_doc"/>
    <path_entry name="cat_to_doc" value="cat_to_doc"/>
    <path_entry name="num_to_doc" value="num_to_doc"/>
    <path_entry name="id_to_doc" value="id_to_doc"/>
    <path_entry name="metadata" value="metadata"/>
    </path_entries>
    <data_entries min_doc_id="0" max_doc_id="39">
    <data_entry path_type="relative" path="db/miml/sample_1.miml" type="miml" min_doc_id="0" max_doc_id="25"/>
    <data_entry path_type="relative" path="db/miml/sample_2.miml" type="miml" min_doc_id="26" max_doc_id="39"/>
    </data_entries>
    </impl>
    </database_config>

5.3 OmniFind Analytics Edition V8.4.1のデータベースを OmniFind Analytics Edition V8.4.1 Hotfix及びIBM Content Analyzer V8.4.2で使用するために必要な作業
OmniFind Analytics Edition V8.4.1 のデータベースを OmniFind Analytics Edition V8.4.1 Hotfix及びIBM Content Analyzer V8.4.2で使用する際には database_config.xml ファイルの修正が必要です(修正部分はサンプル中の青字です)。データベース・ディレクトリ下の

    conf/database_config.xml

ファイルをテキスト・エディタ等で開き、以下の手順に従って修正してください。
  1. タグ <index_file_merger_entries>の最初に以下の index_file_merger_entry を追加します。
        <index_file_merger_entry name="com.ibm.takmi.impl.std.idx.keyid.KeyIdIndexFileMerger"/>
  2. タグ <index_group_merger_entries>の最初に以下の index_group_merger_entry を追加します。
        <index_group_merger_entry name="com.ibm.takmi.impl.std.idx.keyid.KeyIdIndexGroupMerger"/>
以下は OmniFind Analytics Edition V8.4 の INDEXED_DATA_SAMPLE_JA サンプルデータベースを OmniFind Analytics Edition V8.4.1 Hotfix 及び IBM Content Analyzer V8.4.2 で使用するために database_config.xml ファイルを修正した場合の例です(赤字は OmniFind Analytics Edition V8.4.1 で修正した部分で、青字は OmniFind Analytics Edition V8.4.1 Hotfix 及び IBM Content Analyzer V8.4.2で追加した部分です)。

<?xml version="1.0" encoding="utf-8"?>
<database_config>
<!-- common -->
<params>
<param name="language" value="ja"/>
<param name="date_category_yyyymmdd" value=".date/yyyymmdd"/>
<param name="date_category_yyyy" value=".date/yyyy"/>
<param name="date_category_yyyymm" value=".date/yyyymm"/>
<param name="date_category_yyyyww" value=".date/yyyyww"/>
<param name="date_category_day_of_week" value=".date/dow"/>
<param name="date_category_day_of_month" value=".date/dd"/>
<param name="date_year_start_month" value="1"/>
<param name="max_doc_length_to_display" value="10000"/>
<param name="max_keyword_length" value="255"/>
<param name="max_category_name_length" value="63"/>
<param name="max_category_path_length" value="255"/>
<param name="max_category_depth" value="20"/>
<!-- parameters for NLP -->
<param name="max_doc_length_for_nlp" value="65535"/>
<param name="max_id_length" value="255"/>
<param name="max_title_length" value="5000"/>
<param name="max_text_name_length" value="63"/>
</params>
<application_entries>
<application_entry name="Dictionary" impl="com.ibm.takmi.impl.std.dic.edit.config.StandardDictionaryFactoryImpl"/>
<application_entry name="Indexer" impl="com.ibm.takmi.impl.std.idx.config.StandardIndexerFactoryImpl"/>
<application_entry name="AlertingSystem" impl="com.ibm.takmi.impl.std.alerting.config.StandardAlertingFactoryImpl"/>
<application_entry name="NLPResource" impl="com.ibm.takmi.impl.std.nlprsc.config.StandardNLPResourceFactoryImpl"/>
</application_entries>
<search_function_entries>
<search_function_entry name="com.ibm.takmi.impl.common.search.CategorySearchFunction" impl="com.ibm.takmi.impl.std.search.StandardCategorySearchFunction"/>
<search_function_entry name="com.ibm.takmi.impl.common.search.KeywordSearchFunction" impl="com.ibm.takmi.impl.std.search.StandardKeywordSearchFunction"/>
<search_function_entry name="com.ibm.takmi.impl.common.search.NumberSearchFunction" impl="com.ibm.takmi.impl.std.search.StandardNumberSearchFunction"/>
<search_function_entry name="com.ibm.takmi.impl.common.search.InvalidSearchFunction" impl="com.ibm.takmi.impl.std.search.StandardInvalidSearchFunction"/>
</search_function_entries>
<mining_function_entries>
<mining_function_entry name="com.ibm.takmi.mining.topview.TopViewFunction" impl="com.ibm.takmi.impl.std.mining.topview.StandardTopViewFunction"/>
<mining_function_entry name="com.ibm.takmi.mining.doclistview.DocListViewFunction" impl="com.ibm.takmi.impl.std.mining.doclistview.StandardDocListViewFunction"/>
<mining_function_entry name="com.ibm.takmi.mining.iddocview.IdDocViewFunction" impl="com.ibm.takmi.impl.std.mining.iddocview.StandardIdDocViewFunction"/>
<mining_function_entry name="com.ibm.takmi.mining.categoryview.CategoryViewFunction" impl="com.ibm.takmi.impl.std.mining.categoryview.StandardCategoryViewFunction"/>
<mining_function_entry name="com.ibm.takmi.mining.timeseriesview.TimeSeriesViewFunction" impl="com.ibm.takmi.impl.std.mining.timeseriesview.StandardTimeSeriesViewFunction"/>
<mining_function_entry name="com.ibm.takmi.mining.topicview.TopicViewFunction" impl="com.ibm.takmi.impl.std.mining.topicview.StandardTopicViewFunction"/>
<mining_function_entry name="com.ibm.takmi.mining.twodmapview.TwoDMapViewFunction" impl="com.ibm.takmi.impl.std.mining.twodmapview.StandardTwoDMapViewFunction"/>
</mining_function_entries>
<frequently_used_category_entries>
<frequently_used_category_entry path=".tkm_ja_base_word"/>
<frequently_used_category_entry path=".tkm_ja_base_phrase"/>
</frequently_used_category_entries>
<infrequently_used_category_entries>
<infrequently_used_category_entry path=".date"/>
</infrequently_used_category_entries>
<category_entries>
<!-- Specifies subroot categories for system-reserved categories. -->
<category_entry name="reserved_by_system" value=".date"/>
<category_entry name="reserved_by_system" value=".date/dd"/>
<category_entry name="reserved_by_system" value=".date/dow"/>
<category_entry name="reserved_by_system" value=".date/yyyy"/>
<category_entry name="reserved_by_system" value=".date/yyyymm"/>
<category_entry name="reserved_by_system" value=".date/yyyyww"/>
<category_entry name="reserved_by_system" value=".date/yyyymmdd"/>
<category_entry name="reserved_by_system" value=".tkm_ja_base_word"/>
<category_entry name="reserved_by_system" value=".tkm_ja_base_phrase"/>
<category_entry name="reserved_by_system" value=".usr/1"/>
<category_entry name="reserved_by_system" value=".usr/2"/>
<!-- Specifies the auto generated category pathes by a regular expression to avoid recursive generation.
The following regular expression represents exclusive pathes which end with
".base_phrase",
".base_phrase.-M-npred",
".base_phrase.-M-verb",
".base_phrase.-M-adjs", and
".base_phrase.adjs-M-",
".appl_voc_phrase",
".appl_voc_phrase.-M-bad",
".appl_voc_phrase.-M-good",
".appl_voc_phrase.-M-request",
".appl_voc_phrase.-M-thanks", and
".appl_voc_phrase.-M-question",
-->
<category_entry name="auto_generated_path_pattern" value="\.((base)|(appl_voc))_phrase(\.((-M-npred)|(-M-verb)|(-M-adjs)|(adjs-M-)|(-M-good)|(-M-bad)|(-M-thanks)|(-M-request)|(-M-question)))?$"/>
<!-- Specifies subroot categories for DOCAT -->
<category_entry name="non_dictionary" value=".0"/>
</category_entries>
<date_format_entries path=".date">
<date_format_entry value="yyyyMMdd" locale="ja_JP"/>
<date_format_entry value="yyyy MMM" locale="en_US"/>
</date_format_entries>

<!-- standard -->
<impl name="standard">
<params>
<param name="number_of_groups" value="3"/>
<param name="number_of_keywords_per_group" value="1000000"/>
</params>
<file_indexer_entries>
<file_indexer_entry name="com.ibm.takmi.impl.std.idx.keyid.KeyIdIndexWriter"/>
<file_indexer_entry name="com.ibm.takmi.impl.std.idx.date.DateIndexWriter"/>
<file_indexer_entry name="com.ibm.takmi.impl.std.idx.cattodoc.CatToDocIndexWriter"/>
<file_indexer_entry name="com.ibm.takmi.impl.std.idx.doctokey.DocToKeyIndexWriter"/>
<file_indexer_entry name="com.ibm.takmi.impl.std.idx.keytodoc.KeyToDocIndexWriter"/>
<file_indexer_entry name="com.ibm.takmi.impl.std.idx.numtodoc.NumToDocIndexWriter"/>
<file_indexer_entry name="com.ibm.takmi.impl.std.idx.idtodoc.IdToDocIndexWriter"/>
<file_indexer_entry name="com.ibm.takmi.impl.std.idx.metadata.MetadataIndexWriter"/>
</file_indexer_entries>
<index_file_merger_entries>
<index_file_merger_entry name="com.ibm.takmi.impl.std.idx.keyid.KeyIdIndexFileMerger"/>
<index_file_merger_entry name="com.ibm.takmi.impl.std.idx.cattodoc.CatToDocIndexFileMerger"/>
<index_file_merger_entry name="com.ibm.takmi.impl.std.idx.doctokey.DocToKeyIndexFileMerger"/>
<index_file_merger_entry name="com.ibm.takmi.impl.std.idx.keytodoc.KeyToDocIndexFileMerger"/>
<index_file_merger_entry name="com.ibm.takmi.impl.std.idx.numtodoc.NumToDocIndexFileMerger"/>
<index_file_merger_entry name="com.ibm.takmi.impl.std.idx.idtodoc.IdToDocIndexFileMerger"/>
<index_file_merger_entry name="com.ibm.takmi.impl.std.idx.metadata.MetadataIndexFileMerger"/>
</index_file_merger_entries>
<index_group_merger_entries>
<index_group_merger_entry name="com.ibm.takmi.impl.std.idx.keyid.KeyIdIndexGroupMerger"/>
<index_group_merger_entry name="com.ibm.takmi.impl.std.idx.cattodoc.CatToDocIndexGroupMerger"/>
<index_group_merger_entry name="com.ibm.takmi.impl.std.idx.doctokey.DocToKeyIndexGroupMerger"/>
<index_group_merger_entry name="com.ibm.takmi.impl.std.idx.keytodoc.KeyToDocIndexGroupMerger"/>
<index_group_merger_entry name="com.ibm.takmi.impl.std.idx.numtodoc.NumToDocIndexGroupMerger"/>
<index_group_merger_entry name="com.ibm.takmi.impl.std.idx.idtodoc.IdToDocIndexGroupMerger"/>
<index_group_merger_entry name="com.ibm.takmi.impl.std.idx.metadata.MetadataIndexGroupMerger"/>
</index_group_merger_entries>
<path_entries>
<path_entry name="index_root" value="db/index"/>
<path_entry name="keyword_id" value="keyword_id"/>
<path_entry name="doc_to_key" value="doc_to_key"/>
<path_entry name="key_to_doc" value="key_to_doc"/>
<path_entry name="cat_to_doc" value="cat_to_doc"/>
<path_entry name="num_to_doc" value="num_to_doc"/>
<path_entry name="id_to_doc" value="id_to_doc"/>
<path_entry name="metadata" value="metadata"/>
</path_entries>
<data_entries min_doc_id="0" max_doc_id="39">
<data_entry path_type="relative" path="db/miml/sample_1.miml" type="miml" min_doc_id="0" max_doc_id="25"/>
<data_entry path_type="relative" path="db/miml/sample_2.miml" type="miml" min_doc_id="26" max_doc_id="39"/>
</data_entries>
</impl>
</database_config>

5.4 日本語言語処理に関する注意事項
OmniFind Analytics Edition V8.4.1 では以下のように日本語の言語解析結果が改善されているため、統一的な結果を得るためにすべてのデータの言語処理を再実行することをおすすめします。
  • 英文字にはさまれたピリオドは文を区切らなくなりました。
  • スラッシュなどの記号で単語が区切られるようになりました。

6 付録
商標

ここでは、IBM の商標と、特定のIBM 以外の商標をリストします。 IBM の商標について詳しくは、http://www.ibm.com/legal/copytrade.shtml を参照して下さい。 以下は、それぞれ各社の商標または登録商標です。

Java およびすべてのJava 関連の商標およびロゴは、Sun Microsystems, Inc. の米国およびその他の国における商標または登録商標です。 Microsoft、Windows、Windows NT およびWindows ロゴは、Microsoft Corporationの米国およびその他の国における商標です。 Intel、Intel Inside (ロゴ)、およびPentium は、Intel Corporation の米国およびその他の国における商標です。 UNIX は、The Open Group の米国およびその他の国における登録商標です。 Linux は、Linus Torvalds の米国およびその他の国における商標です。 他の会社名、製品名およびサービス名等はそれぞれ各社の商標です。

©Copyright IBM Corp. 2007, 2008. All Rights Reserved.

特記事項

本書でIBM 製品、プログラム、またはサービスに言及していても、そのIBM 製品、プログラム、またはサービスのみが使用可能であることを意味するものではありません。 これらに代えて、IBM の知的所有権を侵害することのない、機能的に同等の製品、プログラム、またはサービスを使用することができます。 ただし、IBM 以外の製品とプログラムの操作またはサービスの評価および検証は、お客様の責任で行っていただきます。

IBM は、本書に記載されている内容に関して特許権(特許出願中のものを含む) を保有している場合があります。 本書の提供は、お客様にこれらの特許権について実施権を許諾することを意味するものではありません。

この情報には、技術的に不適切な記述や誤植を含む場合があります。本書は定期的に見直され、必要な変更は本書の次版に組み込まれます。 IBM は予告なしに、随時、この文書に記載されている製品またはプログラムに対して、改良または変更を行うことがあります。

本書においてIBM 以外のWeb サイトに言及している場合がありますが、便宜のため記載しただけであり、決してそれらのWeb サイトを推奨するものではありません。 それらのWeb サイトにある資料は、このIBM 製品の資料の一部ではありません。それらのWeb サイトは、お客様の責任でご使用ください。

IBM は、お客様が提供するいかなる情報も、お客様に対してなんら義務も負うことのない、自ら適切と信ずる方法で、使用もしくは配布することができるものとします。

本プログラムに関する上記の情報は、適切な使用条件の下で使用することができますが、有償の場合もあります。 本書で説明されているライセンス・プログラムまたはその他のライセンス資料は、IBM所定のプログラム契約の契約条項、IBM プログラムのご使用条件、またはそれと同等の条項に基づいて、IBM より提供されます。

この文書に含まれるいかなるパフォーマンス・データも、管理環境下で決定されたものです。そのため、他のオペレーティング環境で得られた結果は、異なる可能性があります。 一部の測定が、開発レベルのシステムで行われた可能性がありますが、その測定値が、一般に利用可能なシステムのものと同じである保証はありません。 さらに、一部の測定値が、推定値である可能性があります。実際の結果は、異なる可能性があります。お客様は、お客様の特定の環境に適したデータを確かめる必要があります。

IBM 以外の製品に関する情報は、その製品の供給者、出版物、もしくはその他の公に利用可能なソースから入手したものです。 IBM は、それらの製品のテストは行っておりません。したがって、他社製品に関する実行性、互換性、またはその他の要求については確証できません。 IBM 以外の製品の性能に関する質問は、それらの製品の供給者にお願いします。 IBM の将来の方向または意向に関する記述については、予告なしに変更または撤回される場合があり、単に目標を示しているものです。