『ブリタニカ国際大百科事典 Quick Search Version』の解析情報 by hishida 第3版 2004/06/06 2004年版の記述を追加 第2版 2004/05/26 ITEMLIST.IDX,NENP.IDXの記述追加 第1版 2004/05/09 ■『ブリタニカ国際大百科事典 Quick Search Version』について http://www.britannica.co.jp/hometop/jiten/jiten.html ・『ブリタニカ国際大百科事典 Quick Search Version』は,Encyclopaedia Britannica (ブリタニカ百科事典)を元に製作されたマルチメディア百科事典です。 ・英語版のEncyclopaedia Britannica DVD/CD-ROM版がブリタニカ大百科事典全32巻を完全  収録しているのに対して、Quick Search Versionは項目内容を縮約した小項目版です。  実際、書籍版『ブリタニカ国際大百科事典』に付属するWindows対応小項目版、及び電  子ブック小項目版と、テキストの内容はほぼ同一です。 ・Windows対応小項目版とQuick Search Versionはファイル構造が似ており、  暗号化方法も同じです。ただしHTMLのタグには違いがあります。 ・当方が調査したQuick Search Versionは2001年刊行版です。この文書の解析情報が  他の年次のCD-ROMにも共通するかどうかは、定かではありません。 ・Quick Search Versionを使用するには、Netscape、QuickTime、ShockWaveが必要です。  なお、2001年版はWindowsXPで動作しません(パッケージに記載あり)。 http://www.britannica.co.jp/hometop/jiten/xp.html  からWindowsXP対応モジュールがダウンロードできますが、トップページから辿れません。 ■Quick Search VersionとWindows対応小項目版の違いについて ・Windows対応小項目版(1997)にあって、Quick Search Version(2001)で無くなっている機能があります (1)年表検索 (2)書籍「大項目版」の該当項目への参照情報(巻・頁番号) ・Quick Search Versionでは、関連WebSiteへのリンクが追加されています。ただし直接 リンクではなく、ブリタニカのホームページのCGIを参照するようになっています。 ・動画はWindows対応小項目版はAVI動画とWAV音声、Quick Search VersionではQuickTimeと ShockWaveになっています。 ・画像は全体の個数ではQuick Search Versionの方が増量されていますが、同じ項目でも 画像が差し替えられていたり、画像が無くなっている項目があります(「ルソー」、 「バッハ」、「ファーブル」など)。 ・Quick Search Versionには、2001年版、2003年版、2004年版があります。  Windows対応小項目版には複数のバージョンがあるようですが、詳細は不明です。 ■大項目辞典と小項目辞典について ・ブリタニカ大百科事典は、1974年の第15版で、プロペディア (総論・手引) 1巻,マイク ロペディア (小項目事典) 10巻,マクロペディア (大項目事典) 19巻の計30巻構成となる。 ・日本語版のブリタニカ国際大百科事典は第15版の翻訳に新たな原稿を加えたもので、 初版は1972‐75の刊行。大項目辞典20巻+小項目辞典10巻構成だった。 ・1990年代に小項目辞典は電子化されて「電子ブック小項目版」「Windows対応小項目版」 が同梱されるようになり、小項目版の印刷版はなくなる。「電子ブック小項目版」は 単独で販売されていたが、現在は販売終了。 ・「Windows対応小項目版」は2001年に「Quick Search Version」に改訂され、 ユーザーインターフェースを一新。 ・2001年時点では、大項目版は「Deep Search Version」の名称で公開予定だったが、 2004年現在でも公開されていない。 ■ファイル構造 ・本文ファイルは暗号化された単一のHTMLである。  基本的に、Everest.ddf に全ての本文情報が含まれる。  ただし参照のみの項目(「〜を見よ」項目)はitemlist.idxを参照する必要有り ・Quick Search Versionのインストール後の本文のパスは: C:\Program Files\Brirannica Japan\JBCD2001\data\Everest.ddf ・Everest.ddf、itemlist.idxの暗号化の方法は、ファイル全体を 0xFF で排他的論理和。  なお、Windows対応小項目版も同様。 ・Quick Search VersionはCD-ROM2枚組で、1枚目はセットアップディスク、2枚目が  マルチメディアデータ。Windows対応小項目版はCD1枚のみ。 ・CD-ROM上のイメージは圧縮されておらず、インストール後のファイルと同一。 \data\data\Everest.ddf Quick Search Version(2001) \RGROM\Everest.ddf Windows対応小項目版(1997) ■ディレクトリ構造 【Quick Search Version(2001年版)】 ◎CD1枚目 "JBCD2001_1"     /AUTORUN/     /data/ →※インストールディレクトリと同じ        Everest.ddf 164MB 本文ファイル        itemlist.idx 19MB 項目インデックス        /HONMON/ EVEREST.{ADD,IDX,INI,PRA}        /OTHER/ EVEREST.{ADD,IDX,INI,PRA}        /top/        /topics/        /whatday/     /HTML/ →※インストールディレクトリと同じ        /orghtml/        /images/     /SETUP/        /Files/        /soft/          /netscape/ Netscape 4.x          /QuickTimeInstaller5/          /Shockwave/ ◎CD2枚目 "JBCD2001_2"     /BOJ/       /data/         /flag/ 国旗         /images/ 様々な画像         /letter/ 外字         /map/ 地図         /math/ 数式(子ディレクトリあり)         /photo/ 写真(子ディレクトリあり)           /movies/ mov動画         /picture/ 図         /top/ 表紙用画像 ◎Quick Search Version(2001年版)のインストールディレクトリ C:/Program Files/Brirannica Japan/JBCD2001     /*.* 実行モジュール、DLL等     /data/        Everest.ddf 164MB 本文ファイル(ビット反転)        itemlist.idx 19MB 項目インデックス(ビット反転)        /HONMON/            EVEREST.INI 1KB            EVEREST.IDX 6MB            EVEREST.ADD 139MB            EVEREST.PRA 1KB        /OTHER/            EVEREST.INI 1KB            EVEREST.IDX 4MB            EVEREST.ADD 102MB            EVEREST.PRA 1KB        /top/ 表紙の人物、項目(テキストファイル)            top_n.dat 5kb            top_a.dat 5kb            top_p.dat 5kb        /topics/            *.* TOPICSのファイル(HTML)        /whatday/            01-01.body 今日生まれた人物、今日の出来事(HTML)            01-01.top 同、見出し(HTML)            (以下、12-31.*まである)     /HTML/        /orghtml/*.html ヘルプのHTML        /images/*.{jpg,gif} ヘルプで使用する画像     /Templates/ 【Windows対応小項目版】 ◎CDの内容 "TBS_B"     /RGROM/        EVEREST.DDF 110MB 本文ファイル(ビット反転)        ITEMLIST.IDX 19MB 項目インデックス(ビット反転)       /HONMON/ EVEREST.{ADD,IDX,INI,PRA}       /MM1/ GIF画像       /MM2/ JPEG,WAV,AVI       /NENPYOU/ EVEREST.{ADD,IDX,INI,PRA}            NENP.IDX 年表(ビット反転)            NENP_JP.IDX 年表(ビット反転)       /OTHER/ EVEREST.{ADD,IDX,INI,PRA}     /SETUP/       /GOODS/       /MENU/       /QUEST/       /NETSCAPE/ Netscape2.x       /VFW/ Video for Windows ◎Windows対応小項目版のインストールディレクトリ ※CD-ROMを挿入して使用することが前提のため、データはコピーされない。 C:/TBS_B ←SETUP/のファイルが複写される     /GOODS/     /HTML/     /MENU/     /QUEST/ ■本文ファイル(EVEREST.DDF) ・ファイル全体は0xFFで排他的論理和。(ビット01の反転) 【Quick Search Version】 「アイ(藍)」の項目全体のサンプル: -------------------------------------------------------------------------------
アイ(藍)

アイ
@Persicaria @tinctoria (@Polygonum @tinctorium)
  
タデ科の一年草。高さ 50〜70@cmになり,茎は紅紫色を帯びる。中国原産で古く日本に入 った。葉,茎から染料をとり,東洋では古来,ムラサキ,ベニバナ,アカネなどとともに 染料として重用された。ヨーロッパでは 16世紀に東洋から輸入して使用されるようになり ,のちにはヨーロッパ諸国のアジア植民地で栽培された。日本では奈良・平安時代から栽 培され,正倉院宝物中の藍染織物や『 延喜式』の藍染法などの規定はその重用のさまを示している。江戸時代中期までは各 地方で自給されたが,その後,阿波藩で奨励と販売統制を行い,大坂市場を独占するにい たり,阿波藍が全国的に商品として流通した。主産地は阿波と摂津。元文1 (1736) 年大坂 集荷の藍玉は 48万貫 (1800@t) 。 1897年頃までその生産は増加するが,明治末年,ドイ ツから輸入の人工藍 (アニリン染料) の圧迫によって衰えた。しかし,品質の良いところ から現在でも高級品としての需要があり,生産は続けられている。

------------------------------------------------------------------------------- (1)半角文字列 [例]  @Elizabeth @Bomford/@Ardea [解説]  @は半角文字列の開始。 (2)リンク [例]  マダガスカル島 [解説]  searchrecN=132571は項目番号。項目は1から始まる連番。(先頭項目の「アア」が1)  項目番号200000以上は、拡大図、動画への参照を表し、に対応する。 (3)画像 [例]   [解説]  src=はCD-ROM(2枚目)の画像の絶対パスそのもの。 実際の場所: \BOJ\data\photo\eb0\oa\oayeaye001p4.jpg  画像はJPEG、またはGIFであり、圧縮や暗号化はされていない。 (4)外字 [例] @Ai-@guo @xue-@she; @Ai-@kuo @hs @eh-@sh [解説]  外字はGIF画像。 \BOJ\data\letter\*.gif  なお、外字ファイル名は、電子ブック版の外字コードと完全に一致する。 電子ブック版の書籍定義文字 A121 の外字は、Quick Search Versionでは a121.gifに相当。 電子ブック版 書籍定義文字 Quick Search Version ------------------------------------------------------- 16x16ドット A121〜A242 a121.gif〜a242.gif 8x16ドット A321〜A562 a321.gif〜a562.gif なお、Quick Search Versionのみの外字は4つあり、b001.gif〜b004.gif。 【Windows対応小項目版】 比較のため、「アイ(藍)」の項目のサンプルを挙げる。 ------------------------------------------------------------------------------- アイ(藍)

アイ(藍)

アイ
@Persicaria @tinctoria (@Polygonum @tinctorium)

タデ科の一年草。高さ 50〜70@cmになり,茎は紅紫色を帯びる。中国原産で古く日本に入 った。葉,茎から染料をとり,東洋では古来,ムラサキ,ベニバナ,アカネなどとともに染料と して重用された。ヨーロッパでは 16世紀に東洋から輸入して使用されるようになり,のち にはヨーロッパ諸国のアジア植民地で栽培された。日本では奈良・平安時代から栽培され, 正倉院宝物中の藍染織物や『延喜式』の藍染法などの規定はその重用のさまを示している。 江戸時代中期までは各地方で自給されたが,その後,阿波藩で奨励と販売統制を行い,大坂市 場を独占するにいたり,阿波藍が全国的に商品として流通した。主産地は阿波と摂津。元文1 (1736)年大坂集荷の藍玉は 48万貫(1800@t)。 1897年頃までその生産は増加するが,明治末 年,ドイツから輸入の人工藍(アニリン染料)の圧迫によって衰えた。しかし,品質の良いとこ ろから現在でも高級品としての需要があり,生産は続けられている。
------------------------------------------------------------------------------- タグの形式は違うが、基本的にQuick Search Versionと同じ。 リンクの例:  カーマ 外字の例  @El-@Aain 画像の例   ■項目インデックス ITEMLIST.IDX ・ファイル全体は0xFFで排他的論理和。(ビット0,1の反転) ・一項目128バイトの固定長。項目番号1,2,3,…がレコード番号0,1,2,…に対応 ・内容は、項目名+"◇"+項目概要。レコードの末尾は0x00埋め。 (以下はビット反転後のファイルのダンプです) ADDRESS 00 01 02 03 04 05 06 07 08 09 0A 0B 0C 0D 0E 0F 0123456789ABCDEF ------------------------------------------------------------------------------ 00000000 83 41 83 41 81 9E 83 6E 83 8F 83 43 82 CC 90 E6 アア◇ハワイの先 00000010 8F 5A 96 AF 82 CC 8C BE 97 74 82 C5 81 43 83 41 住民の言葉で,ア 00000020 83 41 97 6E 8A E2 82 F0 82 B3 82 B7 81 42 8C BA ア溶岩をさす。玄 00000030 95 90 8A E2 8E BF 82 CC 89 F2 8F F3 97 6E 8A E2 武岩質の塊状溶岩 00000040 81 42 00 00 00 00 00 00 00 00 00 00 00 00 00 00 。.............. 00000050 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 ................ 00000060 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 ................ 00000070 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 ................ 00000080 83 41 83 41 81 5B 81 9E 83 47 83 57 83 76 83 67 アアー◇エジプト 00000090 90 5F 98 62 82 C9 82 A8 82 AF 82 E9 8C 8E 90 5F 神話における月神 000000A0 81 42 8C C3 91 E3 82 CC 8C 8E 90 5F 82 CC 8E ED 。古代の月神の種 000000B0 81 58 82 CC 8C 60 91 D4 82 CC 82 A4 82 BF 82 CC 々の形態のうちの 000000C0 88 EA 82 C2 00 00 00 00 00 00 00 00 00 00 00 00 一つ............ 000000D0 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 ................ 000000E0 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 ................ 000000F0 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 ................ ・参照のみの項目(〜を見よ)は、項目名+"▽"+項目番号[,項目番号…] ADDRESS 00 01 02 03 04 05 06 07 08 09 0A 0B 0C 0D 0E 0F 0123456789ABCDEF ------------------------------------------------------------------------------ 00000780 49 52 81 A4 30 30 38 37 32 39 2C 30 31 31 34 34 IR▽008729,01144 00000790 39 2C 30 36 36 31 36 33 00 00 00 00 00 00 00 00 9,066163........ 000007A0 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 ................ 000007B0 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 ................ 000007C0 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 ................ 000007D0 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 ................ 000007E0 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 ................ 000007F0 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 ................ ・ITEMLIST.IDX中の外字の表現は、"@@"+外字コード4桁。 ADDRESS 00 01 02 03 04 05 06 07 08 09 0A 0B 0C 0D 0E 0F 0123456789ABCDEF ------------------------------------------------------------------------------ 00007680 88 A4 90 F5 96 BE 89 A4 81 9E 91 E5 88 A4 97 7E 愛染明王◇大愛欲 00007690 91 E5 E6 C3 90 F5 82 CC 8E 4F 96 86 82 C9 8F 5A 大貪染の三昧に住 000076A0 82 DE 96 BE 89 A4 81 42 91 E5 93 FA 94 40 97 88 む明王。大日如来 000076B0 82 DC 82 BD 82 CD 8B E0 8D 84 8E 46 40 40 41 31 または金剛薩@@A1 000076C0 33 45 82 CC 95 CF 89 BB 90 67 00 00 00 00 00 00 3Eの変化身...... 000076D0 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 ................ 000076E0 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 ................ 000076F0 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 ................ ■年表 NENP_JP.IDX, NENP.IDX ・Windows対応小項目版のみ存在する。 ・ファイル全体は0xFFで排他的論理和。(ビット0,1の反転) ・一項目500バイトの固定長。レコードの末尾は0x00埋め。 ・内容は次のようなタグ付テキスト(ビット反転後のテキストを適宜改行しています): -------------------------------------------- -12000
縄文時代 この頃からか(〜前3世紀頃).竪穴住居,採集・狩猟生活. 縄文土器磨製石器を使用 -------------------------------------------- ■エラータ (1)2001年版の標準のインストールパスは"Britannica"の綴りミス C:\Program Files\Brirannica Japan\JBCD2001 × Brirannica ○ Britannica (2)2001年版のEVEREST.DDFは、3070276行目のコメントが閉じていない。 HTMLパーサーの多くは、直後のまでコメントとして認識してしまう。 に本文 ・2004年版
に本文 (5)日本の市区町村の人口等の統計は、2000年国勢調査の値に改訂されている。  ちなみに、2001年版、Windows対応小項目版の市区町村統計は、1995国勢調査に基づく。 (6)マルチメディアデータにwav形式の音声が追加されている。鳥の鳴き声など。 (7)CD2枚目に、BOJ\data\images\フォルダがない (8)全角外字が20個追加されている。内18個は補助漢字。名前の規則は意味不明。 補助漢字 UNICODE 0047.gif 4754 6DBF 0054.gif 5540 7FEC 009d.gif 383F 5889 00be.gif 5451 7E47 025a.gif 513D 7A39 02a4.gif 645E 9321 02c1.gif 4F29 777A 02e6.gif 3E3F 6113 036c.gif 4861 6F7D 0376.gif 622A 90DD 0390.gif 4C66 74B5 039e.gif 5D67 8A75 03bb.gif 582B 8398 0612.gif ‐ ? 061f.gif 5878 84C0 066a.gif 645D 931F 069f.gif 5053 794F 06a1.gif ‐ ? 0d17.gif 6040 8E7B 0d33.gif 6A50 9B79 ■2003年版について(2004/9/2 しふぉん様による情報) 2001年版との相違は: インストールディレクトリは :\Program Files\Britannica Japan\JBCD2003 動画データが、:\BOJ\data\ph1\movies\*.mov に存在。 ■2005年版について 2004年版とデータ形式は同じらしい ■2006年版について 暗号化形式が変わっている。 EBシリーズサポート掲示板に変換方法が投稿された。抜粋を、britannica2006.htm として添付。