学研「Super日本語大辞典」Toolkit

| 概要 | 配布条件と著作権 | 使用上の注意 | 必要なもの | 動作環境 | 配布ファイル | 変換手順 | 制限事項 | 活用のヒント | 既知の問題点 | 技術資料 | 履歴 | 謝辞 |

概要

学研「Super日本語大辞典」CD-ROMの辞書データをJIS X4081(EPWING)化するソフトウェアです。EPWINGへの変換には、EBStudioを使用します。

「古語辞典」古典参考図録
「漢和大字典」
「国語大辞典」

配布条件と著作権

使用上の注意

本Toolkitによる辞書の変換は、著作権法第30条(私的使用のための複製)、および第47条の2(プログラムの著作物の複製物の所有者による複製等)で認められた範囲内で行ってください。

必要なもの

動作環境

配布ファイル

skp2html.exe Toolkit本体
skp.ini 変換定義ファイル(パスやオプションを定義)
README.html このファイル
skel/gaiji.tbl 外字置換テーブル
skel/unicode.tbl 補助漢字-Unicode対応表
skel/hangaiji.txt 半角外字(Gaiji.xmlのスケルトン)
skel/hangaijimap.txt 半角外字定義ファイル(GaijiMap.xmlのスケルトン)
skel/zengaiji.txt 全角外字(Gaiji.xmlのスケルトン)
skel/zengaijimap.txt 全角外字定義ファイル(GaijiMap.xmlのスケルトン)
skel/X0212.xml 補助漢字(Gaiji.xmlのスケルトン)
skel/complex.xml 複合検索定義ファイル(「漢和大字典」用)
skel/complex1.xml 複合検索定義ファイル(「国語大辞典」用)
doc/ 技術情報補遺
src/ VisualC++6.0用ソースファイル

変換手順

 ※始めにマニュアル全体に目を通して、作業の概要を頭に入れて下さい。

 ※製品付属のフォント「MM漢辞源1」「MM漢辞源5(こちらは全JIS漢字版のみ存在)」を使用しますので、予め「Super日本語大辞典」をインストールする必要があります。 ただし辞書・マルチメディアデータ自体は、CD-ROM上のデータを参照することもできます。

  1. 配布パッケージを任意の場所に解凍します。(デスクトップ等でかまいません)
  2. 解凍したディレクトリにある skp.ini を任意のエディタまたはメモ帳で編集します。 エクスプローラでダブルクリックすると「メモ帳」が開きますので、編集の後、[ファイル(F)]→[上書き保存(S)]を実行します。
  3. [環境に合わせて修正すべき箇所]

     ★ - ご利用の環境に合わせて、※必ず※設定して下さい。
     ☆ - 音声、動画を使用する場合に設定してください。

        ※標準の定義では、マルチメディアデータは図版のみが変換されます。


    ★	VER=1			# 1:無印・PC Success版
    				# 2:全JIS漢字版
    	FIGURE=1		# 0:画像を使用しない
    				# 1:画像を使用する(デフォルト)
    ☆	SOUND=0			# 0:音声を使用しない(デフォルト)
    				# 1:音声を使用する
    ☆	MOVIE=0			# 0:動画を使用しない(デフォルト)
    				# 1:動画を使用する
    	MAGNIFYKANJI=96		# 「漢和大字典」漢字拡大図のサイズ(ドット数指定・16の倍数)
    				# 0なら拡大図を作成しない
    	KOKUGO=1		# 「国語大辞典」を変換する
    	KOGO=1			# 「古語辞典」を変換する
    	KOJI=1			# 「故事ことわざ辞典」を変換する
    	KANWA=1			# 「漢和大字典」を変換する
    	inlineX0213=0		# 全JIS漢字版で追加された第3・4水準外字をインライン画像にする
    
    ★	BASEPATH=C:\skp\	# EBStudio用HTMLファイルの出力パス
    ★	EPWINGPATH=C:\skp\	# JIS X4081辞書の出力パス
    ★	DICPATH=C:\Program Files\GAKKEN\SNJ\DIC\	# *.DICの場所
    ★	DATAPATH=D:\skp\DATA\	# マルチメディアデータのパス
    	※無印・PC Success版はHDインストール不可のため、DATAPATH=は必ずCD-ROM。
    
    ☆	#MPGPATH=%BASEPATH%DATA\	# MPEGデータを格納したデータパス(の基点)
    ☆	#SNDPATH=%BASEPATH%DATA\	# WAVデータを格納したデータパス(の基点)
    

    対象製品とパスの指定(以下は例ですので、実際にデータのあるパスを指定して下さい)

    無印・PC Success版全JIS漢字版
    VER=1
    DICPATH=C:\Program Files\GAKKEN\SNJ\DIC\
    DATAPATH=D:\skp\DATA\

    ※コンパクトでインストールした場合、
    DICPATH=D:\SKP\DIC\
    のようにCD-ROMを指定します。

    VER=2
    DICPATH=C:\Program Files\GAKKEN\Skp2\DIC\
    DATAPATH=C:\Program Files\GAKKEN\Skp2\DATA\

    ※DATAPATH=は完全インストールの場合。

    動画を使用する場合

    無印・PC Success版全JIS漢字版
    MOVIE=1
    MPGPATH=%BASEPATH%DATA\

    ※ コメント行の#を削除して有効にします
    ※*.MOVを*.MPGに変換し、上記ディレクトリに転送します。
    MOVIE=1
    #MPGPATH=%BASEPATH%DATA\

    音声を使用する場合

    DDWin以外のビューアDDWin
    SOUND=1
    SNDPATH=%BASEPATH%DATA\

    ※ コメント行の#を削除して有効にします
    ※*.WAVを非圧縮WAVに変換し、上記ディレクトリに転送します。
    SOUND=1
    #SNDPATH=%BASEPATH%DATA\

  4. skp2html.exe を実行します。
    ※エクスプローラから直接ダブルクリックして実行できます。
    ただし終了メッセージが確認できないため、DOSコマンドプロンプトからの実行をお勧めします。
    skp.ini のBASEPATH= で指定したディレクトリに、以下のファイル群が作成されます。
  5. skp.ebs EBStudio用定義ファイル(個別HONMON用・辞書間の参照不可)
    skp_uni.ebs EBStudio用定義ファイル(統合HONMON用・辞書間の参照可)
    1*.html 国語大辞典・HTML
    2*.html 古語辞典・HTML
    3*.html 漢和大字典・HTML
    4*.html 故事ことわざ辞典・HTML
    6*.html 参考図録・HTML
    [A-F]*.html メニュー検索・HTML
    map.txt 外字頻度表
    Gaiji.xml 外字ファイル
    GaijiMap.xml 外字定義ファイル
    Copyright[1-4].html 著作権表示ファイル(個別HONMON用)
    Copyright.html 著作権表示ファイル(統合HONMON用)
    complex.xml 複合検索定義ファイル
    DATA/MA/ QuickTime動画をMPEGに変換して格納するためのディレクトリ(この段階では空です)
    DATA/S?/ ADPCMを非圧縮WAVに変換して格納するためのディレクトリ (この段階では空です)
    DATA/BMP/*.bmp 「漢和大字典」拡大図

    0_*.bmp - JIS X0208(第1・2水準)
    1_*.bmp - JIS X0212-1990(補助漢字)
    5_*.bmp - JIS X0213(第3・4水準・全JIS漢字版のみ)

    DATA/INL/*.bmp JIS X0213のインライン画像(inlineX0213=1の時のみ)

  6. 動画の変換〜無印・PC Success版の場合〜
  7. ●EO Videoを使用する場合

     動画の変換にEO Videoを使う場合、PV600MHzで約3時間かかります。

     推奨の変換パラメータは以下の通りです。


    	"Converter View"タブ
    	[Profile Page(1画面目)]
    	"Output format": MPEG
    	"Video"
    		Compression	: MPEG1
    		Output Size	: Adopt picture size
    				    Analyze all clips and use maximum values
    		Picture Fitting	: Maintain Aspect
    				  Resize Quality
    				    Bicubic(default)
    		Frame rate	: 24
    				  Frame intervals
    					I to I frame : 32
    					P to P frame : 1
    		Quality/Bit Rate: Variable(2-pass)
    					90%
    	"Audio"
    		Data Rate	: 8 kBytes/s
    
    	[Output Page(2画面目)]
    	"Convert each Playlist item into separate output file"	:on
    	"Destination Folder"	:変換先ディレクトリ
    	"Same name as source"	:on
    	"Suffix"		:空白
    
    	[Convert Page(3画面目)]
    	"On name collosion, always overwrite existing file":On
    

     筆順ムービーには音声が入っていないため、Audioのチェックを外すとサイズを小さくできます。

    ●TMPGEnc Plusを使用する場合

    TMPGEnc Plusの方が、画質、サイズ、変換時間の全てで良好な結果が得られますが、バッチエンコードリストを作成する必要があります。Super日本語大辞典用のバッチエンコードリストを、きよPさんが公開されています。

     → http://www.freewebs.com/kiyop/index.htm

  8. 音声の変換〜DDWin以外のビューアを使用する場合〜
  9. EBStudioでJIS X4081に変換します。
    1. EBStudioを起動。
    2. [ファイル(F)]→[開く(O)…]で skp.ebs または skp_uni.ebs を開く。
      ※EBStudio用の変換定義ファイルは、次の二つがありますので選択して下さい。

      skp.ebs「国語大辞典」「古語辞典」「古語ことわざ事典」「漢和大字典」を個別のHONMONに変換する。
      ・辞書間の参照検索ができない
      skp_uni.ebs全辞書を一つのHONMONに変換する
      ・辞書間の参照検索が出来る

    3. 出力先を変更する必要があれば変更。
    4. [ファイル(F)]→[実行(G)]
  10. EPWINGビューアで変換結果を確認します。

制限事項

活用のヒント

標準で変換されないデータについて

BASEPATH=に出力される次のデータは、標準の*.ebsには組み込まれません。お使いになりたい場合、EBStudioで変換するときに追加して下さい。

F1.html スタートアップ故事成語・新春
F2.html スタートアップ故事成語・春
F3.html スタートアップ故事成語・夏
F4.html スタートアップ故事成語・秋
F5.html スタートアップ故事成語・冬
6C.html 百人一首
拡大図について

「漢和大字典」の字母の拡大図は、標準では96x96のサイズで作成していますが、好みに応じてサイズを変更できます。
skp.ini の MAGNIFYKANJI=96 の数字を変更して下さい。数字は16の倍数を指定します。
ちなみに、EPWING版広辞苑第五版の漢字拡大図は64x64ドット、EPWING版漢字源は128x128ドットです。 48ドット以上あれば充分認識できます。

メニューについて
  統合
HONMON
国語大辞典 古語辞典 故事ことわざ辞典 漢和大字典
古典への誘い 古典文学事項編      
古典文学書名編    
古典文学人名編  
日本の名歌      
日本の名句      
枕詞・歌枕      
季語一覧    
中国の漢詩      
色一覧    
家紋  
古典の動植物    
古典読解参考図録  
古典読解地図  
年表(日本)    
年表(中国)      
漢字への誘い 状況別故事成語      
国字一覧      
名数一覧      
難読地名一覧      
難読性      
学習漢字一覧      
人名漢字・常用漢字      
読みから引く名前一覧      
単語家族      
筆順の決まり      
個別HONMONと統合HONMONのどちらを選ぶか

個別HONMON方式と統合HONMON方式にはどちらも一長一短がありますので、 利用者の使用方法に合わせて選択してください。

 統合HONMON個別HONMON
メリット ○辞書間の参照リンクが使える。
○Super日本語大辞典のコンセプトを最大限に活用できる。
○検索範囲を辞書毎に限定できる。
○モバイル用途に特定の辞書だけを使用できる。
(例:広辞苑に学研古語辞典を組み合わせる)
デメリット ×特定の辞書だけに限定した検索ができない。
×検索に一致した辞書がどれかわかりにくい。
×辞書間の参照リンクができない。
×変換後のサイズの総計が若干大きい
高度な検索(EBStudioプロフェッショナルライセンスのみ)

条件検索

本文中の参照項目(リンク)は、条件検索に登録されます。「漢和大字典」で"論語"をキーワードに条件検索を行うと、論語に関連する項目を検索することが出来ます。

複合検索

既知の問題点

技術資料

  1. Super日本語大辞典 全JIS漢字版 (学研) 辞書ファイルの構造(by nomad)
    http://www.vector.co.jp/authors/VA005784/superj.zip
  2. 「Super日本語大辞典」解析補遺(by hishida)

履歴

2006/02/16 Ver1.07
  • 漢和大辞典で「メートル」のような長音が検索できないbug修正
2005/02/ Ver1.06
  • 複合検索で一部の部首の検索ができないbug修正
2004/02/01 Ver1.05
  • 補助漢字の外字の視認性向上。下記フリーフォントを使用:
    ●「JIS補助漢字16」 16x16 dot 電子辞書用
    http://www.vector.co.jp/soft/win95/writing/se314644.html
  • 拡大図の一部の領域(補助漢字の9873h〜989Eh(ShiftJIS))が文字化けするbug修正
  • DDWinの場合、「全JIS漢字版」の全ての外字を表示できない問題への対策。
    MM漢辞源5の844字をインライン画像にするオプションを追加。skp.ini に inlineX0213=1を指定。
    ただしこの方法でも検索一致候補リストに外字を表示できない問題は残る。
  • 漢和大字典の《音読み》からのかな検索インデックスの変換をより完全にする。
  • 「色一覧」「色系統順」が表示されないbug修正
2004/01/26 Ver1.04
  • 状況別故事成語をメニュー検索に変換。
  • 「漢和大字典」の拡大図に対応。skp.iniの magnifyKanji=96 でサイズを変更可。
  • 「日本語百科」の「季語一覧」「読みから引く名前一覧」が途中で切れているbug修正。
  • 全JIS漢字版の第3・4水準の文字化け修正。
2004/01/22 Ver1.03
  • 「日本語百科」をメニュー検索に変換(ただし状況別故事成語を除く)
2004/01/15 Ver1.02
  • 全JIS漢字版の動画のリンクのbugを修正
  • 古典読解参考図録の読み仮名の濁点がないbug修正
  • 色見本にCMYK,RGBを追加
  • 複合検索に「マルチメディア」追加
  • JIS X0212-1990の漢字は、HTMLソース上で正しいUnicodeをマッピングする
  • 環境によって[国][古][漢]などのマークが化ける問題対処
2004/01/12 Ver1.01
  • 全JIS漢字版の漢和大辞典が変換できないbugの修正
  • 【表記】部分がなく、〔歴史的かな遣い"や〔現代的かな遣い〕が使われている見出しで、かな検索ができないbugの修正
    例)	えぐし〔歴史的かな遣い〕ゑぐし
    	あはれ〔現代かな遣い〕あわれ
    
2004/01/12 Ver1.00
  • Super日本語大辞典 Toolkit 1.00公開。

謝辞