KWIC索引

「KWICって何の意味? Quickの間違いじゃないの?」と必ず質問されるので、 KWIC索引について説明しておきましょう。

は検索結果を、KWIC(keyword in context, 文脈付キーワード)の形式で表示します。

KWIC索引は巡回索引とも呼ばれます。もともとは文献の索引や目録を自動生成するために、1959年にIBMのルーン(Luhn, H.)が考案した手法です。 KWIC索引では文章中の単語を巡回させて、全ての単語からの索引を作成します。

例:"This is a pen."からKWIC索引を作る:
This is a pen.
This is a pen.
This is a pen.
This is a pen .

ただし ではあらかじめ索引を作成してから検索しているわけではなく、 検索一致語を中央に配置してKWIC索引風の検索表示を行っています。

このように語句を中央に配置して前後の文脈を表示する形式をKWICコンコーダンスといいます。コンコーダンス(concordance)とはある語句がどのような文脈で用いられるかを示すもので、コンコーダンスを作成するソフトウェアをコンコーダンサー(concordancer)といいます。 は検索ソフトという側面だけでなく、 日本語KWICコンコーダンサーとしての側面を持っています。

KWICコンコーダンスは、 一致語の前後の文脈で自由に並び替えることができます。 メニュー→[表示(V) ]→検索結果ソート順(O)のメニューで、行番号順、先行語順、キーワード順、後続語順を選択できます。

なお、通常コンコーダンサーでは各種の文章統計機能がついていますが、 はタブ区切り形式でデータを出力できますので、 文章の分析はExcel等の表計算ソフトを用いて行います。