[リストへもどる]
一括表示
タイトルEBWin 4.1.3 全文検索インデックス
記事No2281
投稿日: 2015/03/07(Sat) 15:22:41
投稿者hishida
EBWin4.1.3 をHPでリリースしました。
・全文検索インデックス
・フォントを拡大したときにリスト表示の文字欠けが起きる問題修正

全文検索インデックスは、オリジナルのHONMON より大きくなることはありません。
ただし、wikipediaのように大きなサイズの場合インデックスを作成できません。
広辞苑や青空文庫、英辞郎クラスなら余裕で作成できます。
n-gramだとどうしてもサイズが大きくなるので、wikipediaクラスに対しては形態素解析型のほうがいいかもしれません。
wikipediaを除けば実用になりますので、ここでいったんリリースします。

タイトルRe: EBWin 4.1.3 全文検索インデックス
記事No2282
投稿日: 2015/03/07(Sat) 19:33:58
投稿者ohkubo-k
早速のご対応ありがとうございました!

やっぱり全文検索の瞬時化はいいですね。
またリスト表示の文字欠けも正しくなりました。ありがとうございました。

本日更新公開した青空文庫のEPWING版で、早速全文検索を試しました。
  http://aozorawing.sourceforge.jp/
インデックス作成が5分ほどでした。以前Logophileで試したときは1時間近くかかったので、たった一度の作業とはいえ、助かります。
  http://sourceforge.jp/projects/aozorawing/forums/31089/34706/

ちょっと気になったのは、全文検索で大量(数万件とか)にヒットした場合の振る舞いです。ファイル→設定の Max Hit で検索打ち切りにはならないようですね。いや、打ち切りにならない方がよいのかもしれません。そういう場合は「検索の中断」ボタンでとめるのですね。
とはいえ、通常は瞬時で終わり、本当に結果が面白いですし助かります。

タイトルRe^2: EBWin 4.1.3 全文検索インデックス
記事No2283
投稿日: 2015/03/08(Sun) 07:39:31
投稿者hishida
> 早速のご対応ありがとうございました!
>
> やっぱり全文検索の瞬時化はいいですね。
> またリスト表示の文字欠けも正しくなりました。ありがとうございました。
>
> 本日更新公開した青空文庫のEPWING版で、早速全文検索を試しました。
>   http://aozorawing.sourceforge.jp/
> インデックス作成が5分ほどでした。以前Logophileで試したときは1時間近くかかったので、たった一度の作業とはいえ、助かります。
>   http://sourceforge.jp/projects/aozorawing/forums/31089/34706/
>
> ちょっと気になったのは、全文検索で大量(数万件とか)にヒットした場合の振る舞いです。ファイル→設定の Max Hit で検索打ち切りにはならないようですね。いや、打ち切りにならない方がよいのかもしれません。そういう場合は「検索の中断」ボタンでとめるのですね。
> とはいえ、通常は瞬時で終わり、本当に結果が面白いですし助かります。

早速検証いただき、ありがとうございます。
確かに、検索結果が膨大になることがあるので、MaxHitで切った方がよさそうですね。Vectorに上げる公式版では対応したいと思います。
数百件だと一瞬ですが、数千件になると数秒かかることがあり、まだパフォーマンスを改善する余地がありそうです。
次はMacへの移植を検討中です。