「電子ブック漢字インデクサ」(EBXA kanji indexer)
●概要
「電子ブック漢字インデクサ」は、電子ブックタイトル(EBXA,S-EBXA,EBXA-C)に、漢字による表記検索インデックス(前方一致および後方一致)を付加する辞書拡張ツールです。
- 電子ブックは一般にかな検索と英字検索のインデックスのみが記録されており、漢字を含むキーワードでの検索ができません。これは電子ブックが8cmCDに記録されるために記録容量に制限があること、また、電子ブックプレーヤに「かな漢字変換」機能がないことが原因です。
- パソコン利用を前提とした規格であるEPWINGは漢字での検索ができるため、同じタイトルでEPWINGと電子ブックがある場合には、EPWINGを選択すれば漢字表記による検索ができます。
しかし電子ブックには、EPWINGにはない独自のタイトルが数多くあり、これらを漢字表記で検索できれば大変に便利です。
- そこで「電子ブック漢字インデクサ」では、日本語電子ブックタイトルの「前方一致かなインデックス」から、漢字の「表記インデックス(前方一致と後方一致)」を作成し、漢字表記による検索ができるようにします。
《効果》
- 本来は「かな」でしか検索できない電子ブックで、漢字による前方一致検索、後方一致検索ができます。
- 漢字を含むキーワードで、EPWINGタイトルと電子ブックタイトルの串刺し検索ができるようになります。
●利用規程
- 本ソフトウェアはフリーウェアです。
- 本ソフトウェアは無保証で現状のまま提供されます。本ソフトウェアの使用または使用不能から生じるいかなる損害
(逸失利益、事業の中断、事業情報の喪失その他の金銭的損害を含む)に関して、
作者は一切責任を負いません。
- 本ソフトウェアの雑誌への掲載・収録、インターネット上での転載を許可します。
掲載される場合は、事後報告で結構ですので作者まで掲載紙についてご連絡下さい。
- 電子ブックタイトルの著作権の扱いには十分に注意をお願いします。本ソフトウェアによる辞書の改変は、「製品の正式な所有者が私的利用に供する場合」にのみ正当と解釈できます。本ソフトウェアによって改変した辞書を配布する等は、絶対になさらないようにお願いします。
●インストール・アンインストール
- 配布ファイルを解凍し、適当なディレクトリに置いて下さい。
- アンインストールする場合は、ディレクトリごと削除してください。
●電子ブックをハードディスクで使う基礎知識
漢字インデクサで変換した辞書を使うためには、電子ブックをハードディスクに複写して使うことが前提になります。
これまで電子ブックをCD-ROM装置や仮想CD-ROMで使用していた方は、辞書をハードディスクで使うための設定が必要になります。
- 辞書を格納するためのディレクトリを作ります。(例:C:\DICT)
- CD-ROMから、全てのファイルを1.のディレクトリ下に複写します。
C:\ |
|
|
|
|
DICT\ |
|
|
|
|
CATALOG |
|
|
|
LANGUAGE |
|
|
|
<dir_name1> \ |
|
|
|
|
START |
|
|
<dir_name2> \ |
|
|
|
|
START |
|
- <dir_name>は辞書タイトル毎に異なった名称が付けられます。
- STARTが辞書の本体です。電子ブック漢字インデクサは、このSTARTファイルを置き換えます。
- CATALOGとSTARTが必須です。LANGUAGEはないこともあります。
- 「本文」と「凡例」など、STARTが2個以上あることもあります。全て複写してください。
- 検索ソフトでハードディスク上の辞書を検索できるように指定します。
- DDwin
- メニューから[ファイル(F)]→[辞書をサーチする(S)]を選択
[指定したドライブ]に、辞書が存在するドライブを指定(例:C)
[サーチする深さ]CATALOGが存在するディレクトリ階層の深さ(例:1)
[OK]を押す
- Jamming
- メニューから[オプション(O)]→[辞書の追加と削除(N)]を選択
[電子ブック(EB・EBG・EBXA)・EPWING・システムソフト]を押す
ハードディスク上のCATALOGを選択
[保存]を押す
●利用方法
- 「電子ブック漢字インデクサ」(EBKIdx.exe)を実行してください。
- 「変換元ファイル」には、変換元の電子ブックの辞書ファイル(ファイル名はSTART)を指定します。
- 「変換先フォルダ」には、変換後の辞書ファイルを作成するディレクトリを指定します。標準では START.NEW という名前のファイルを作成しますが、「変換先ファイル名」で変更できます。
- EBXA-Cの場合、[EBXA-C]ボタンをチェックします。(変換元ファイルのパス名に"ZHONG_RI"が含まれている場合は、自動的にチェックされます)
- [変換]ボタンを押すと変換が始まります。
- 変換が終わって作成された START.NEW を、オリジナルのSTARTの代わりに使用します。
(オリジナルの START を START.ORG などのファイル名に変更し、START.NEW を START に変更する)
- DDwinやJammingで検索できることを確認してください。
●警告メッセージ
- 「前方一致表記インデックスが存在します。漢字インデックスを追加しますか?」
-
このメッセージが出る場合は、二つの可能性が考えられます:
- かな検索インデックスの他に、英字検索用の表記インデックスを持っているタイトル
例:「電子ブック版広辞苑」「岩波仏教辞典」「小学館百科全書」
※広辞苑では、Arkansas(アーカンソー)のように固有名詞や外来語の英字検索が行えます。
- パソコンでの利用を考慮して漢字表記インデックスを始めから持っているタイトル
例:「仏教名言辞典」
1.の場合は実行しても問題がないので、[はい]を押して処理を続行してください。原本の英字の表記インデックスに漢字の表記インデックスを加えた新しい表記インデックスを生成します。
2.の場合は本ソフトウェアで変換する必要はありません。
- 「ERROR: かなインデックスがないため、処理を中断します。」
このタイトルは前方一致かなインデックスを持たないため、処理することができません。
- 「ERROR: 文字列バッファ領域が不足しました;オプションで初期値を増やして下さい」
画面の [文字列バッファ領域の初期サイズ] を増やして再度試みてください。
●検索キーワードの取り出し方
●注意事項
- 本ソフトウェアで改変した電子辞書は、パソコン上で利用することを前提としており、8cmCD-Rに書き込んでも電子ブックプレーヤ上で漢字検索をすることはできません。
- 前方一致かなインデックスを持たない電子ブック(たとえば海外版タイトル等や英英辞典等)は、本ソフトウェアで変換することはできません。(この場合警告が表示されます)
- EBXA規格の電子ブックのみを対象としており、S-EBXAタイトルで動作する保証はありません。(ただしS-EBXAでも圧縮辞書でなければ、適用できる可能性はあります。)
- 「電子ブック漢字インデクサ」はオリジナルの辞書ファイルの末尾に表記インデックスを加えるのみで、それ以外の本文・インデックス・図版等には改変を加えません。このため、オリジナルの辞書の機能は全てそのまま利用することができます。
●動作確認済みタイトル
漢字検索の追加が確認された電子ブックタイトル
No | タイトル名称 | 報告(敬称略) |
1 | 「広辞苑 第四版 電子ブック版」 | hishida |
2 | 「電子ブック版 岩波仏教辞典」 | hishida |
3 | 「三省堂辞書パック10」
( 現代国語辞典+外来語辞典、 必携故事ことわざ+慣用句辞典) |
hishida |
4 | 「小学館日本大百科全書」(EBXA版) | thakata |
5 | 「ブリタニカ国際大百科事典(小項目版)」 | thakata |
6 | 「漢字源」 | 峰村 均 |
7 | 「大辞林&デイリー英和・和英」 | 籠宮 隆之 |
8 | 「福武国語事典」 | 渡辺 真 |
9 | 「プロシード和英辞典」 | 渡辺 真 |
10 | 「研究社和英中辞典」 | 渡辺 真 |
11 | 「現代用語の基礎知識」 | 渡辺 真 |
12 | 「ぴあCINEMA CLUB」 | 渡辺 真 |
13 | 「データパル1996年版」 | benchan |
14 | 「岩波書店広辞苑第5版(EBXA)」 | Buckingham EB Player掲示板 |
15 | 小学館JR・私鉄全線全駅各駅停車の旅(第3版)「北へ」(S-EBXA)
| Buckingham EB Player掲示板 |
16 | 小学館JR・私鉄全線全駅各駅停車の旅(第3版)「南へ」(S-EBXA)
| Buckingham EB Player掲示板 |
17 | 「IP電気電子情報用語対訳」(文字列バッファを増やすこと)
| Shaun Yeo |
18 | 「IP建築土木用語対訳辞典」
| Shaun Yeo |
19 | 「コンピュータ用語辞典第2版」
| Shaun Yeo |
20 | 「ビジネス・技術実用英語辞典」
| Shaun Yeo |
21 | 大修館「世界ことわざ大事典」
| hishida |
22 | 小学館「中日/日中辞典」統合版(EBXA-C)
| hishida |
23 | DD-S35「広辞苑第五版」(S-EBXA) | hishida |
24 | DD-S35「リーダーズ第2版+研究社新和英」(S-EBXA) | hishida |
25 | DD-S35「漢字源」(S-EBXA) | hishida |
26 | DD-S1000「小学館日本大百科全書」(S-EBXA) | hishida |
予め漢字表記インデックスを持っているため、適用する必要のない電子ブックタイトル
1 | 「仏教名言辞典」 |
2 | 「データパル8年分'91〜98」 |
3 | 「日本語大辞典 第2版 EB版」講談社(書籍初版にバンドル) |
4 | 有斐閣経済辞典第3版(EBXA) |
5 | DD-S35「マイペディア」 |
適用できない電子ブックタイトル
1 | 「EB科学技術用語大辞典」(文字列バッファ不足) |
2 | 「IPビジネス用語対訳辞典」(かなインデックスがない) |
3 | 「ニューアンカー英和・和英」(和英の見出しに漢字がない) |
新たな辞書での動作に成功された方は、是非作者までご一報ください。
- 本ソフトウェアで漢字表記インデックスを追加した辞書は、下記ソフトウェアで動作確認を行っています。
- DDwin2.59
- Jamming1.4
●サポート
本ソフトウェアのサポートは、
http://ebstudio.info/home/
にて行っております。質問、障害の報告、要望は、上記ホームページの掲示版までお願いします。
E-Mail :
hishida@bg.mbn.or.jp
●謝辞
thakata氏(
http://members.jcom.home.ne.jp/2141138101/
)は、「電子ブックに表記検索を追加する」という基本的アイデアを発案して下さり、いくつかの辞書の動作確認にもご協力いただきました。ここに心より感謝申し上げます。
●履歴
- Ver1.04a (05/09/04)S-EBXA圧縮形式の一部で文字化けが起きるbugを修正(DD-S35『漢字源』etc)
- Ver1.04 (05/08/30)S-EBXA圧縮形式の場合、自動的に伸長する。ebunzipは不要になった。(DD-S1000,DD-S35で検証)
- Ver1.03 (05/08/08)EBXA-Cに対応。
- Ver1.02 (04/04/22)小学館JR・私鉄全線全駅各駅停車の旅(第3版)「北へ」「南へ」で
後方一致表記検索ができなbugの修正('_'を無視するようにした)
- Ver1.01 (02/01/07)「かなよみ 表記」の順の見出しを持つタイトルに対応。
- Ver1.00 (01/10/26)公開版
- Ver0.90 (01/10/24)
- 作業開始 (01/10/14)
●用語
- 電子ブック:
- ソニー株式会社の提唱した電子出版規格。8cmCDに書籍や辞書の情報を記録し、専用の電子ブックプレーヤーで検索・表示できる。約250タイトルが市販されている。専用キャリーからCDのみを取り出せば、パソコンでも利用できる。(http://www.ebxa.gr.jp/)
電子ブックの種類
EB | 1994年までに出版された電子ブックの中で、文字のみ、もしくは文字・画像対応しているもの(日本国内のみ) |
EBG | 1994年までに出版された電子ブックの中で、文字のみ、もしくは文字・画像対応しているもの(日本を除く全世界) |
EBXA | '95以降の統一規格。 |
EBXA-C | 中国文字表示に対応したEBXA。 |
S-EBXA | '98に拡張された仕様。圧縮形式、JPEG画像等。 |
- EPWING:
- EPWINGコンソーシアムの提唱した電子出版規格。12cmのCDに書籍や辞書の情報を記録するもので、電子ブックよりも大量の情報を記録できる。EPWING 1.0の規格の一部は、JIS-X4081-1996(日本語電子出版検索データ構造)として公開されている。(http://www.epwing.or.jp/)
- 電子ブック・EPWINGの検索方法:
-
日本語電子出版検索データ構造JIS X4081では、次の検索方式が定められている。
機能名称 | 概要 |
仮名検索 | 一般の国語辞典や百科事典と同様に読み表記文字列に対応した項目の検索を実現。 |
表記形検索 | 言葉の漢字仮名混じり表記に対応した検索を実現。これによって、読みが分からない言葉を検索したり、電子データとして受け取った文書の中の記述そのものを指定して該当項目を検索することができる。 |
前方一致検索 | 言葉の後ろ部分が不明確な場合及び言葉の前の部分が共通な言葉を探して一覧することができる。 |
後方一致検索 | 言葉の前の部分が不明確な場合及び言葉の後ろの部分が共通な言葉を探して一覧することができる。 |
複合語の検索 | 複数語をその言葉を構成する基本語の組合せで検索することができる。 |
関連語検索 | 検索結果と関連する項目を参照する。 |
条件検索 | ある項目に対して,設定された複数のキーワードの組合せで項目を探し出すことができる。 |
メニュ一検索 | 冊子の目次と同様に,項目リストの中から該当項目に対応する表題を選択することによって該当項目に到達することができる。 |
複合検索 | 検索キーワードをカテゴリ分類できる場合,その分類ごとのキーワードの組合せで検索項目の絞り込みを行う。 |