■開発者向情報
(1)フォントについて
・スーパーニッポニカの外字コードとフォントのコードポイントの対応は、
C:\Program Files\Shogakukan\SuperNipponica*\GAIJI.csvに定義されている。
・2001版と2003版でコードポイントの変更はないが、若干外字が追加されている。
[2001年版と2003年版]
002609,TEXT,8FBD
151320,Shomg,9358
151769,Shomg,9359
153408,Shomg,935A
500001,Nip40,8C
500002,Nip99,55
500003,Nip99,55
(中略)
!9040,Shomg,9F6A
!9041,Shomg,9F6B
#0002,Shomg,9EC7
#0030,Shomg,9CBF
#0039,Shomg,9CC0
#005D,Shomg,9CC1
#00BA,Shomg,9F4C
#00BB,Shomg,9F4D
(中略)
-------------------
[1999年版] Nip01〜Nip23がある。
002609,TEXT,8FBD
151320,Nip11,58
151769,Nip11,59
153408,Nip11,5a
500001,Nip40,8C
500002,Nip99,55
500003,Nip99,55
500004,Nip99,55
500005,Nip99,55
500006,Nip99,55
-------------------
[凡例]
外字定義,フォント,ShiftJISコード
外字定義:
定義 本文中での参照方法
--------------------------
002609 002609
!9040 [!9040]
#0039 [#0039]
フォント:
TEXT 「小学館明朝4Dpb」
Shomg 「小学館明朝4Dp外字」
Nip00,Nip36〜99 同名の半角フォント
Nip01〜Nip23 1999年版のみで2001以降はない。ダミーか?
各フォント名が小学館明朝4Dp外字の1区画に相当する。
Nip01 40〜FE =小学館明朝4Dp外字 8940〜89FE
Nip02 40〜FE =小学館明朝4Dp外字 8A40〜8AFE
..
Nip15 40〜FE =小学館明朝4Dp外字 9740〜97FE
Nip16 40〜FE =小学館明朝4Dp外字 9940〜99FE
..
Nip23 40〜FE =小学館明朝4Dp外字 E040〜E0FE
(2)本文テキスト中の特殊文字
【日本大百科全書】
003978 外字
750001 外字
[$6261] 外字
悉曇{しったん} ルビ
[▼ク] 下付
[▲2] 上付
オン[_ナ]イ 下線
[* ] 小見出し
[&〔あ〕] 小見出し
… 著者
…
章見出し1
…
章見出し2
…
章見出し3
[@0001262900→アービング@] リンク
[@0009079400国際責任@] リンク(矢印記号がないパターン)
[$00012497000101→図A$] 別表・図
【新語探検(2003DVD)】
[仮面就職] 新語探検内のリンク
… 強調
… 日付
【国語大辞典】
002E5D 外字
[$6261] 外字
[!9015] 外字
~C1…~ 上付文字
~C3…~ 下付文字
【例】C~C313~H~C39~N
(3)HiBaseについて
・スーパーニッポニカはホロン(株)開発の国産データベースHiBaseを使用している。
(検索エンジンがHiBaseであることはパッケージ・マニュアルにも記載されている)
ホロン(株)のホームページからHiBaseライブラリのトライアル版が評価目的で
ダウンロード可能だが、このライブラリを使用するとスーパーニッポニカのデータが
取り出せる。
http://www.hln.co.jp/download/index.html
以下のURLで、HiBaseのデータ構造の解析結果と、HiBaseライブラリを使用して
スーパーニッポニカ2001LEからテキストを取り出すCソースが公開されている。
http://hp.vector.co.jp/authors/VA023689/ssn/
※HiBaseライブラリ評価版を使用したプログラムのバイナリは、ライセンスの関係で
配布することはできない。本作ではHiBaseを使用せずにテキスト抽出を行っている。
---------------------------------------------------------
※HiBaseトライアル版をMicrosoft VC++6.0で使用する方法
・ http://hp.vector.co.jp/authors/VA023689/ssn/ のCソースをVC++で読み込む。
プロジェクトは自動生成される。
・ライブラリとインクルードファイルの場所の指定が必要
プロジェクト(P)→設定(S)
[一般]
Microsoft Foundation Class(M)
→共有DLLでMFCを使用 or MFCのスタティックライブラリを使う
[C/C++]
カテゴリ(Y)→プリプロセッサ
インクルードファイルのパス(N)
HiBase415_Trial\include
[リンク]
カテゴリ(Y)→インプット
オブジェクト/ライブラリモジュール(M)
HBSW32_MSC.lib
追加ライブラリのパス(D)
HiBase415_Trial\lib
---------------------------------------------------------
(4)データベースについて
●スキーマ
・データベース名、表名等は年次毎に異なっている。当Toolkitでは、年次に依存する
情報を*.iniで指定するようにした。
・2001年版では国語大辞典と日本大百科全書が別のデータベースに格納されているが、
2003年版では同じデータベースに格納されるようになった。
・1999年版以前は、マルチメディアデータはファイルとして保存されており、データベ
ースの中には格納されていない。
C:\Program Files\Shogakukan\SSN_LE\media\*.jpg - リンク画像
C:\Program Files\Shogakukan\SSN_LE\inline\COMPRESS.bin
- GIF画像が連結されている。各画像の位置情報は SSN_DB1\@f005
●暗号化
・国語大辞典と日本大百科全書の本文は暗号化されている。
暗号化は年次毎に全て違う。(ただし1999年ライト版と2001版は同じ)
・2002DVD版以降は、マルチメディアデータ(JPEG、MIDIなど)も暗号化されている。
・今後のスーパーニッポニカの改訂毎に暗号化の方法は変わる可能性がある。
●マルチメディアデータ
スーパーニッポニカで使用されているマルチメディアデータと対応状況:
○ 参照画像 JPG
○ インライン画像(数式、化学式、動物の歯式など)2001版はGIF、2003版はPNG
△ 音声 MIDI(国家、楽器)
× 動画 MOV(QuickTime)、ショックウェーブ、ぐるぐるフォト
○…標準で対応
△…外部ツールで変換することでJIS X4081(EPWING)化可能
×…未対応
(5)【別解】FreePWINGによるJIS X4081(EPWING)化について
・スーパーニッポニカ百科事典からFreePWING を使用してJIS X4081(EPWING)化するスクリプトが
電子辞書オープンラボで公開されている。
大和慎一氏オリジナルソース
http://news.ring.gr.jp/news/openlab.edict/1525?Source
長谷川 真史氏によるパッチ
(1) http://news.ring.gr.jp/news/openlab.edict/1750?Source
(2) http://news.ring.gr.jp/news/openlab.edict/1895?Source
参考:「小学館 スーパーニッポニカ2001 LightEdition」をPDIC形式に変換する
(霜月 橘水氏)
http://www.ikushimo.com/edic/nippodic.html