EdicConv.rb - 『E-DIC』JIS X4081変換スクリプト(ruby版)

●はじめに

『E-DIC 英和・和英』(朝日出版社)のデータを変換して、EBStudio用の入力ファイルを作成するRubyスクリプトです。本スクリプトは、『asahi press SENTENCE』変換スクリプトAsahiLib.rb(nomad氏)をもとに開発したものです。

【注意】2010年3月に発売されたE-DIC第2版は、形式が変更されたために変換できません。

●ダウンロード

●特徴

●圧縮ファイルの内容

●辞書変換に必要なもの

●説明の前提

E-DIC本体、Ruby、EBStudioは入手して導入が済んでいるものとします。 ※E-DICはCD-ROMから直接変換することも可能です。

●辞書全体の変換手順

  1. 変換スクリプトのダウンロード

    ダウンロード後、適当な場所にアーカイブを展開します。ここでは「D:\work」に展開したものとします。

  2. 変換スクリプトの実行

    コマンドプロンプトを開きます。E-DICのインストール先が「C:\Program Files\E-DIC\DATA」、出力先が「d:\work」とすると、次のように入力します。

    ruby -Ks EdicConv.rb "C:\Program Files\E-DIC\DATA" d:\work
    

    これで基本辞書と、増量データが変換されます。

    *.html			EBStudio入力ファイル
    edicSingle.ebs		EBStudio作業環境定義ファイル - 単一辞書用(推奨)
    edic.ebs		EBStudio作業環境定義ファイル - 個別辞書用
    edicUpdate.ebs		EBStudio作業環境定義ファイル - 増量データ用
    

  3. EBStudioの実行

    まず基本データを処理します。

    d:\workにあるedicSingle.ebsファイル(またはedic.ebs)を使用してEBStudioを実行します。

    edicSingle.ebsを使用すると、単一のHONMONが作成されます。(※推奨)
    edic.ebsを使用すると、辞書毎に個別のHONMONが作成されます。

    EBStudioの起動後、[ファイル]>[開く]でedicSingle.ebsを指定します。または、 EBStudioの起動後、書籍リスト欄にedicSingle.ebsをドラッグします。
    出力先などを必要に応じて修正したあと、辞書の作成処理を実行します([ファイル]>[実行]またはツールバーの実行ボタン)。

    -------------------------
    開始時刻:2007/07/29 11:52:38
    [E-DIC]
      著作権情報…done
      本文…
      (1)d:\work\EIWA.html
      (2)d:\work\WAEI.html
      (3)d:\work\SEN.html
      (4)d:\work\A.html
      (5)d:\work\I.html
      (6)d:\work\ZOKU.html
      (7)d:\work\KAI.html
      (8)d:\work\TAI.html
      (9)d:\work\HYOU.html
      (10)d:\work\BI.html
      (11)d:\work\NEWS.html
      (12)d:\work\GEN.html
      (13)d:\work\KAG.html
      (14)d:\work\GI.html
      (15)d:\work\KOU.html
      (16)d:\work\OFFICE.html
      (17)d:\work\IGAKU.html
      done
      図版総数=(0)個
      音声総数=(0)個
      メニュー…(17)
      前方一致表記インデックス…(1452815)個
      後方一致表記インデックス…(1452815)個
      クロス条件検索インデックス…(4038134)個
      前方一致仮名インデックス…(571234)個
      後方一致仮名インデックス…(571234)個
      外字(8x16)…(253)個 done
      外字(16x16)…(6)個 done
      アンカー総数…(815754)個
      リンク総数…(101821)個
      d:\EPWING\EDIC\DATA\HONMON ( 943812608 bytes )
    終了時刻:2007/07/29 12:59:31
    -------------------------
    カタログを作成しました。
    処理を完了しました。
    

    増量データがある場合は、引き続き増量データを処理します。使用するebsファイルはedicUpdate.ebsです。

    出力先は基本データとは別のディレクトリにします。すでに「d:\work」のようになっているはずですので必要に応じて修正してください。同じディレクトリにすると基本データ用のカタログが書き換えられてしまいます。

    辞書の作成処理を実行します。

    -------------------------
    開始時刻:2007/07/29 12:59:31
    [増量データ]
      著作権情報…done
      本文…
      (1)d:\work\EXT1.html
      (2)d:\work\EXT2.html
      (3)d:\work\EXT3.html
      (4)d:\work\EXT4.html
      (5)d:\work\EXT5.html
      (6)d:\work\EXT6.html
      (7)d:\work\EXT7.html
      (8)d:\work\EXT8.html
      done
      図版総数=(0)個
      音声総数=(0)個
      メニュー…(8)
      前方一致表記インデックス…(13883)個
      後方一致表記インデックス…(13883)個
      クロス条件検索インデックス…(103639)個
      前方一致仮名インデックス…(3516)個
      後方一致仮名インデックス…(3516)個
      外字(8x16)…(253)個 done
      外字(16x16)…(6)個 done
      アンカー総数…(8461)個
      リンク総数…(4930)個
      D:\EPWING\ADD\DATA\HONMON ( 25894912 bytes )
    終了時刻:2007/07/29 13:10:06
    -------------------------
    カタログを作成しました。
    処理を完了しました。
    

    ★注意★ EBStudioでの変換時に次のエラーメッセージが出ますが、[OK]をクリックしてください。

    Error in <filename>(Line=####):Click OK to continue. ;title too long
    

    以上で完了です。

●増量データのみの変換手順

  1. 変換スクリプトのダウンロード

    ダウンロード後、適当な場所にアーカイブを展開します。ここでは「D:\work」に展開したものとします。

  2. 変換スクリプトの実行

    コマンドプロンプトを開きます。E-DICのインストール先が「C:\Program Files\E-DIC\DATA」、出力先が「d:\work」とすると、次のように「-update」を指定して実行します。

    ruby -Ks EdicConv.rb -update "C:\Program Files\E-DIC\DATA" d:\work
    

    d:\workに以下のファイルが出力されます。

    *.html			EBStudio入力ファイル
    edicUpdate.ebs		EBStudio作業環境定義ファイル - 増量データ用
    

  3. EBStudioの実行

    d:\workにあるedicUpdate.ebsを使用してEBStudioを起動します。

    EBStudioの起動後、[ファイル]>[開く]でedicUpdate.ebsを指定します。または、 EBStudioの起動後、書籍リスト欄にedicUpdate.ebsをドラッグします。
    出力先などを必要に応じて修正します。出力先は基本データとは別のディレクトリにしてください。同じディレクトリにすると基本データ用のカタログが書き換えられてしまいます。

    辞書の作成処理を実行します([ファイル]>[実行]またはツールバーの実行ボタン)。

    ★注意★ EBStudioでの変換時に次のエラーメッセージが出ますが、[OK]をクリックしてください。

    Error in <filename>(Line=####):Click OK to continue. ;title too long
    

    以上で完了です。

●作成される索引

日本語見出しと日本語例文は、前方一致、後方一致、クロス検索(2文字以上の漢字・カタカナのみ)の索引が作成されます。

英語見出しと英語例文は、前方一致、後方一致、クロス検索の索引が作成されます。

見出し語内や例文内の単語を検索する場合は、クロス検索を使用してください。

●活用のヒント

●履歴

v1.00 2007/07/30 hishida

●謝辞

このスクリプトの作成にあたり、nomad氏の『asahi press SENTENCE』変換スクリプトAsahiConv.rb、pcs氏のEdicConv.cppを参考にさせていただきました。両氏に感謝申し上げます。