スーパーニッポニカ Toolkit
■概要
「小学館スーパーニッポニカ日本大百科全書+国語大辞典」をJIS X4081(EPWING)化するツールキットです。変換には、EBStudioを使用します。
■このツールの特徴
■配布ファイル
Convert1999LE.bat | スーパーニッポニカ・ライト版(1999刊)変換 |
Convert2001LE.bat | スーパーニッポニカ2001〔ライト版〕変換 |
Convert2001.bat | スーパーニッポニカ2001〔DVD-ROM版〕変換 |
Convert2002.bat | スーパーニッポニカ2002〔DVD-ROM版〕変換 |
Convert2003.bat | スーパーニッポニカ2003〔DVD-ROM版〕変換 |
MakeEbs.bat | .ebs生成バッチファイル |
SSN2.exe | HiBase汎用テキスト抽出ツール |
SSN2Html.exe | 抽出テキスト→HTML変換ツール |
imgconv.exe | GIF→BMP画像変換ツール |
extinl.exe | 1999版専用インライン画像変換ツール |
xor.exe | 2ファイルの排他的論理和をとる |
README.html | マニュアル |
fig/* | フォントで代用されている数式等画像 |
skel/* | 各種スケルトンファイル |
doc/* | 開発者向けドキュメント |
src/* | VisualC++6.0用ソースファイル |
■他に必要なソフトウェア
- 小学館スーパーニッポニカの以下のバージョンのいずれか。
- 2003〔DVD-ROM版〕(Win)
- 2002〔DVD-ROM版〕(Win)
- 2001〔DVD-ROM版〕(Win)
- 2001〔ライト版〕(Win)
- 〔ライト版〕1999年刊(Win)
- 1998年総合版(Win) (→ noptyさんが
スーパーニッポニカ 1998年総合版をEPWING化するで公開されているスクリプトで
変換できます)
- EBStudio
(Ver1.61以降)
シェアウェア(¥1,000)
※ただしフリーライセンス版で前方一致検索を作成可能です。
- 2003〔DVD-ROM版〕の場合は、PNGをBMPに一括変換できるユーティリティが必要(
IrfanViewを推奨)
- 動画を使用する場合、QuickTimeをMPEGに一括変換できるユーティリティが必要(
EO Video を推奨[30日間試用可])
■動作環境
対応OS
Windows95 / 98 / Me / 2000 / XP
作業領域
スーパーニッポニカのインストールに必要な領域とは別に、下表の大きさの空き容量が必要です。作業ファイルは、JIS X4081に変換した後は削除することができます。
| 動画なし | 動画あり |
作業ファイル ※JIS X4081に変換後は削除可能 |
850MB | 850MB 1.2GB(*.mov) 500MB(*.mpg) |
国語大辞典(JIS X4081変換後) | 130MB | 130MB |
日本大百科全書DVD版(JIS X4081変換後) |
550MB | 1GB |
合計 |
1.6GB | 3.6GB(*1) |
*1 EBStudioで変換する前にQuickTime動画(*.mov)を削除すれば、2.4GBですみます
■著作権
- スーパーニッポニカToolkitはフリーソフトです。
- 配布される全ファイルの著作権はhishidaに帰属します。
- 本ソフトウェアは無保証で現状のまま提供されます。本ソフトウェアの使用または使用不能から生じるいかなる損害(逸失利益、事業の中断、事業情報の喪失その他の金銭的損害を含む)に関して、作者は一切責任を負いません。
- このツールの使用は著作権法第30条(私的使用のための複製)および第47条の2(プログラムの著作物の複製物の所有者による複製等)の範囲内で行ってください。
本ソフトウェアでスーパーニッポニカ製品を変換することは、製品の正当な所有者(購入者本人)以外許可されません。
コンテンツの第三者への貸与、変換前および変換後のデータのネット等を通じての配布、サーバー・クライアント環境での不特定多数による利用は著作権侵害となりますので、厳に慎んでいただくようお願いいたします。
■使用方法
●注意事項
- 小学館スーパーニッポニカがハードディスクにインストールされている必要があります。
- DVD-ROM版で標準インストールの場合(完全インストールでない場合)は、あらかじめDVD-ROMメディアを装置にセットしておく必要があります。マルチメディアデータをハードディスクにフルインストールしている場合は、DVD-ROMは必要ありません。
- 「小学館国語辞典Toolkit0.1」をご利用の方は、0.1で作成したJIS X4081データを削除して下さい。
●具体的手順
- 配布パッケージを任意のディレクトリに解凍します。
- スーパーニッポニカのバージョンによって実行するスクリプトが異なりますので、使用するスクリプトを確認して下さい。
Convert2003.bat | 2003〔DVD-ROM版〕用 |
Convert2002.bat | 2002〔DVD-ROM版〕用 |
Convert2001.bat | 2001〔DVD-ROM版〕用 |
Convert2001LE.bat | 2001〔ライト版〕用 |
Convert1999LE.bat | ライト版[1999刊]用 |
- 使用する ConvertXXXX.bat をエディタで開き、1〜3行目のパスをユーザの利用環境に合わせて変更します。
※スーパーニッポニカを標準の場所にインストールしている方は、SSNPATH= を修正する必要はありません。
set SSNPATH=C:\Program Files\Shogakukan\SuperNipponica2001LE
set BASE=C:\ssn
set EPWING=C:\ssn
|
SSNPATH | - スーパーニッポニカのインストールディレクトリ |
BASE | - EBStudio用ファイルを作成する基準ディレクトリ |
EPWING | - JIS X4081辞書を作成するディレクトリ |
※パスの末尾の \ は付けません
- エクスプローラから、ConvertXXXX.bat をダブルクリックして実行します。
BASE で指定したディレクトリに以下のファイルが作成されるはずです。
ssn.txt | スーパーニッポニカのテキスト抽出結果 |
kok.txt | 国語大辞典のテキスト抽出結果(2003DVDの場合、ssn.txtに含まれるため無し) |
Copyright.html | EBStudio用:著作権情報ファイル |
SPLASH.BMP | スーパーニッポニカ起動時画像(著作権表示に使用) |
Gaiji.xml | EBStudio用:外字イメージファイル |
GaijiMap.xml | EBStudio用:外字マッピング定義ファイル |
kok.html | EBStudio用:HTML変換後・国語大辞典 |
ssn.html | EBStudio用:HTML変換後・日本大百科全書(+新語探検) |
ssn.ebs | EBStudio用:作業環境定義ファイル |
png/*.png | (2003DVD)インライン用png画像。(JIS X4081(EPWING)化にはBMPに変換必要。) |
gif/*.gif | (2002以前)インライン用gif画像。 |
bmp/ | (空ディレクトリ) |
wav/ | (空ディレクトリ) |
fig/*.bmp | 国語大辞典用インライン画像 |
gr2/*.gr2 | (DVD)ぐるぐるフォト。 |
jpg/*.jpg | (DVD)静止画像。標準サイズとサムネイルがある。 |
mid/*.mid | (DVD)国家や楽器などMIDIデータ |
mov/*.mov | (DVD)QuickTime Movie
※初期設定では*.movは出力しません。ssn2.exe -v=1を指定すると、movを出力します。ただし1.2GBを消費します。
|
swf/*.swf | (2003DVD)ショックウェーブデータが1個だけ(世界貿易センタービル爆破テロ) |
- 2003〔DVD-ROM版〕のばあい、PNG画像をBMPに変換する必要があります。
変換後のBMP画像は、%BASE%/bmp/ に保存して下さい。
【※2003〔DVD-ROM版〕のみの作業です】
変換する画像ユーティリティには、IrfanViewを推薦します
(
http://cvnweb.bai.ne.jp/~kusumoto/iview/)。
- IrFanViewを起動
- メニューから[ファイル(F)] → [一括変換 形式/名前(B)]
[ファイル形式の一括変換]という画面がひらきます。
- 右側の[ファイルの場所]で %BASE%/png のディレクトリを選択
- [ファイルの種類]を [PNG - Portable Network Graphics]にします。
- [保存フォルダ]を、%BASE%/bmp にします。
- [変換後の形式]を [BMP WindowsBitmap] にします。
- 左側のボタンの[すべて追加]を押します。
- [実行]を押します。
|
- EBStudioでJIS X4081に変換します。
- EBStudioを起動します。
- ファイル(F)→開く(O)で ssn.ebs を開きます。
- JIS X4081ファイルを作成する出力先を指定します。(省略時はBASE)
- ファイル(F)→実行(G)で変換を実行します。
〔参考:変換ログ2001LE〕
〔参考:変換ログ2003DVD〕
サムネイル画像使用時
- EPWINGビューア(DDWin、Jammingなど)の検索場所に追加します。操作方法はお使いのEPWINGビューアのマニュアルをご参照下さい。
- 検索して結果をご確認ください。
- BASE ディレクトリに作成された作業ファイルを、ディレクトリ毎削除してください。
★外字が正常に表示されていない場合、skel/Gaiji.lzhを解凍して、Gaiji.xmlとGaijiMap.xmlを置き換えてください。もう一度 6. まで戻り、EBStudioを実行してください。
■活用のヒント
●サムネイル画像を使用して辞書を小さくするには(〔DVD-ROM版〕)
●とにかく辞書を小さくするには
- マルチメディアデータを使用しない( -v=0 -s=0 -m=0 )
- クロス条件検索を作成しない。
- URLリンクや関連情報を削除する。《手順》.ini ファイルから該当箇所を削除。
- ztenやBuckingham EB Playerを使用するのであれば、Buckingham EB Compresserで辞書を圧縮する。
以上を全てやると、日本大百科全書は100MBくらいになります。
●動画データを変換するには
- DVD-ROM版にはQuickTime形式(.MOV)の動画データが含まれています。外部ツールでMPEG形式に変換できれば、JIS X4081(EPWING)化が可能です。
- 変換には十分なハードディスクの空き容量が必要です。QuickTime Movieに約1.2GB、変換後のMPEGに約500MBが必要です。QuickTime MovieはMPEG変換後は削除することができます。
- 変換手順:
- ConvertXXXX.batの中の、ssn2 と ssn2html コマンドで使用されている -v=0 オプションを、エディタで -v=1 に変更して下さい(2箇所)
Convert2003.bat の場合
ssn2 -v=1 -f skel\SSN2003DVD3.ini -o %BASE%
|
ssn2html -v=1 -s=0 -m=2 -t=SSN+ -o %BASE% %BASE%\ssn.txt %BASE%\ssn.html
|
-v=0 動画を使用しない
-v=1 動画を使用する
- MOV→MPG変換を行うソフトを入手し、MOV/*.movを MPG/*.mpg に一括変換してください。
例) EO Video(30日間試用可)
http://www.eo-video.com/
● EO Videoの推奨設定:
※音声がないQuickTime Movieは、Audioのチェックを外すとサイズが小さくなります。
(アニメーションなど)
●音声データを変換するには
- DVD-ROM版にはMIDI形式(.MID)の音源データが含まれています。内容は国歌、楽曲などです。
外部ツールでMIDI形式をWAV形式に変換できれば、JIS X4081(EPWING)化が可能です。
※MIDIをWAVに変換するとサイズが極端に大きくなります。
音声データの変換は自己責任でお願い致します。
- 変換手順:
- ssn2htmlの-sオプションをエディタで変更して下さい。
ssn2html -v=0 -s=1 -m=2 -t=SSN+ -o %BASE% %BASE%\ssn.txt %BASE%\ssn.html
|
-s=0 音声を使用しない
-s=1 音声を使用する(wavデータへのリンクを作成する)
- MID→WAV変換を行うソフトを入手し、MID/*.midを WAV/*.WAV に一括変換してください。
●「新語探検」を変換したくないときは(2003〔DVD-ROM版〕)
- 2003DVD-ROM版には「新語探検」2千語が含まれており、当ツールでは『日本大百科全書』に「新語探検」の項目を含めて出力しています
(「新語探検」の項目が「日本大百科全書」の中に辞書式順序で混じります)。
『日本大百科全書』に「新語探検」を含めたくない場合、ssn2htmlの-tオプションを変更すると『日本大百科全書』だけを出力することができます。
ssn2html -v=0 -s=0 -m=2 -t=SSN+ -o %BASE% %BASE%\ssn.txt %BASE%\ssn.html
|
-t=KOK | 「国語大辞典」のみ |
-t=SSN | 「日本大百科全書」のみ |
-t=SSN+ | 「日本大百科全書」+「新語探検」 |
-t=ST | 「新語探検」のみ |
■制限事項
【日本大百科全書】
- マルチメディアデータのうち、標準では画像のみ対応しています。
QuickTime動画を使用するには、別途変換ソフトを入手してMOV→MPG変換を行う必要があります。
MIDI音声(国歌等)を使用するには、別途変換ソフトを入手してMIDI→WAV変換を行う必要があります。
※グルグルフォトや動画が使用されている箇所には、サムネイル画像を表示します
- 年表、地図、分野別検索には対応していません。
【国語大辞典】
- 書籍版に含まれる「発刊に当たって」「凡例」「図版」などの情報は含まれません。
- 参照リンクは(現バージョンでは)実装していません。
■履歴
ver1.05 |
2003/11/09
- 関連資料の「データ・ノート」の検索に対応
- 動画に対応(外部ツールでmov→mpg変換が必要)。※EBStudio1.61以降が必要
|
ver1.04 |
2003/08/27
|
ver1.03 |
2003/08/18
- 「新語探検」の項目間のリンクが変換されていなかったので修正。
|
ver1.02 |
2003/08/13
- 1999刊ライト版対応。
- 2001〔DVD-ROM版〕暫定対応。
- 著作権情報に画像を入れるのをやめる。( 著作権情報に画像があるとBuckinghamで不具合あり )
|
ver1.01 |
2003/08/10
- Windows98ではssn.ebsが作成されないbug修正
- 日本大百科全書で、一行に複数のキーワードがカンマ(,)やスラッシュ(/)で定義されている項に対応。
例) mountain climbing , mountaineering
_______ ____ / Russkiy yaz_k ロシア語
- GIF→BMP変換ユーティリティ imgconv を同梱。2001年版の場合、IrFanViewは不要に。
|
ver1.00 |
2003/08/06
- スーパーニッポニカ2001〔ライト版〕、2003〔DVD-ROM版〕の日本大百科全書に対応。
スーパーニッポニカ Toolkitに改称。
「小学館国語大辞典Toolkit」は当ツールに統合する。
国語大辞典の改良点:
- Active Perlは使用しない。
- 辞書式順序で出力する。
- (英encyclopedia,encyclopaedia)のようなケースでは、キーワードをカンマ(,)で分割し、
"encyclopedia" でも "encyclopaedia" でも検索できるようにする。
|
ver0.1 |
2003/07/09
- 小学館国語大辞典 Toolkit0.1公開。テキスト抽出にはssnuk-0.2(藤井 宏憲氏作)を使用。
|
|
■謝辞
- 本作の開発にあたり、藤井 宏憲氏の解析情報を参照させて頂きました。
この解析情報がなければ開発できなかったと思われます。心より感謝の意を表します。
→
http://hp.vector.co.jp/authors/VA023689/ssn/
- ヤーム氏は、スーパーニッポニカ・ライト版[1999刊]の動作確認にご協力いただきました。
- KingKazu氏、narishin氏は、スーパーニッポニカ2001〔DVD-ROM版〕の動作確認にご協力いただきました。
- 佐藤修氏は、スーパーニッポニカ2002〔DVD-ROM版〕の動作確認にご協力いただきました。
■コンテンツについて
●『日本大百科全書』
書籍版は全26巻、総頁数約2万3千頁、約13万項目からなり、平凡社の『世界大百科事典』と双璧をなす日本最大の百科事典。早くからSONY電子ブック用コンテンツを提供するなど、電子化にも積極的に取り組んでいる。
〔電子辞書版〕
●『小学館国語大辞典』
『小学館国語大辞典(新装版)』は、『日本国語大辞典』の旧版(全二十巻・縮刷版
全十巻)を縮約した辞書として1988年に刊行された辞典。古語から現代語まで、
類書中最大規模の25万語を収録し、今日でも十分使用に耐える本格的な国語辞典である。
→
http://skygarden.shogakukan.co.jp/skygarden/owa/ISBNEntry21c?isbn=4095010029
〔電子辞書版〕
- Microsoft Bookshelf2.0
- Microsoft Bookshelf2.0 Basic(MS Office2000に付属)
(※Bookshelf3.0では収録辞書が『三省堂新明解国語辞典第五版』に変更された)
●スーパーニッポニカ版「小学館国語大辞典」とBookshelf2.0の比較
スーパーニッポニカ版は本文テキストのみであり、Bookshelf2.0の方が辞書の機能として優れている。
Bookshelf2.0のみの特徴は:
- 「発刊に当たって」「凡例」などが含まれている
- 書籍に含まれる2500点の図版付
- 小見出し検索(ひらがなでも検索できる)
- 参照リンク
- 外字をWordに貼り付け可能
ただしBookshelfの外字は「MS PR2ゴシック」という独自フォントを使用。
■FAQ
Q1.外字が表示されない、または化けています。
A1.
スーパーニッポニカのフォントがインストールされていないか、使用できない状況にあります。
skel/Gaiji.lzhを解凍し、Gaiji.xmlとGaijiMap.xmlを置き換えてください。
Q2.スーパーニッポニカ 200X は変換できますか。
A2.
テストにご協力頂ければ、変換できるかもしれません。
hishidaまでご連絡下さい。
■開発者向情報
SuperNipponica Toolkit
Copyright © 2003, hishida
http://ebstudio.info/home/ssnktk.html