記事No | : 836 |
タイトル | : Re^3: 表示しなくても全文検索に出る本文テキスト |
投稿日 | : 2015/11/26(Thu) 00:05:42 |
投稿者 | : hishida |
> お返事ありがとうございます。ですが、何かの誤解がありましたようで、改めて説明してみましょう。
>
> | ああ | いいいい | ううう
> ――――――――――――――――――――――――――
> ええええ | かかかか | きききき | くくくく
> | かかかか | | くくく
> | かかか | |
> ――――――――――――――――――――――――――
> おお | ささささ | ししし | すすすす
> | | | すすすす
>
> 例の表をJPEGに変換すれば、表の内容、つまり「かかかかかかかかかかか」「ししし」などを何とか全文検索で見つかるようにしたいんです。行と列のタイトル「ああ」などは見出し語として登録されているのに、内容のほとんどは見出し語に不適当です。表の数は何百です。こんな内容を標準的方法で見つかるようにすることは可能でしょうか?よろしくお願い致します。
JPEGで画像として表現した文字を、PDFの「透明テキスト」のように検索したいということでしょうか。
全文検索で、ということでしたら、非表示のテキストという概念がEPWING ではないので、標準的な方法はないと思います。
最初の投稿にあったように1F02〜1F03に入れるというのは案外いい方法かもしれません。
EPWING的に正当な方法としては、条件検索としてキーワードに入れるという方法でしょうか。広辞苑などは本文中のテキストを条件検索インデックスで検索できますが、透明テキスト部分をキーワードに分解して条件検索に登録すれば、ちゃんとしたEPWINGビューアなら検索できると思います。
理解が違っていたらごめんなさい。