・PDICテキスト形式
PDICテキスト形式は、PDICで使用されるデータ交換用のテキストファイルです。拡張子は*.TXTです。
見出し
1行、
説明文
1行の繰り返しで一つの項目を表します。
【例】
Automatic Data Acquisition
自動データ収集
Automatic Data Processing
自動データ処理
見出し行は自動的に検索項目の見出しになり、前方一致・後方一致・クロス条件検索インデックスに登録されます。見出し語の単語(英単語、
n
字以上の漢字・カタカナ)は分解してクロス条件検索インデックスに登録します。
複合検索インデックスを作成する場合、別途
複合検索定義ファイル
を定義する必要があります。GENE95用の定義ファイルの例がsample/cplxgene.xml に定義されているので、参考にしてください。
オンラインで流通しているPDICテキスト形式辞書の見出しは表記検索用であり、読み仮名は含まれていません。仮名インデックス用の読み仮名を指定したい場合は、(オリジナルのPDICの仕様ではありませんが、)【…】の形式で読み仮名を指定することができます。【…】内の文字列は仮名インデックスに登録されます。
【例】 かな検索インデックス用に読み仮名を指定する場合
桜【さくら】
バラ科の落葉高木。