■掲示板に戻る■ 全部 1- 最新50

巨大テキスト検索の専門化集合!HELP!

1 :名無しさん@お腹いっぱい。 :2001/07/21(土) 18:49
UNIXで巨大テキスト(220M)からAND OR検索を高速で行いたいのですが、なかなかどうしてうまくいきません。
MYSQLのあいまい検索を使っても実行速度10秒。SUFARYは早いんですがAND検索が出来ないし・・。
巨大テキストファイルから高速検索できるような方法やソフトなどをご存知でしたら教えてください。

「デリミタがタブで改行コードにて一行とみてくれて、AND・OR検索が出来て、表示行数の指定ができる。」
というような方法(ソフト)を教えてください!。

2 :名無しさん@お腹いっぱい。 :2001/07/21(土) 19:47
自分でプログラム書けよ。
漏れは自分で作ったが快適

3 :名無しさん@お腹いっぱい。 :2001/07/21(土) 21:24
>>1
そんなことしないからわかんないんだけど、
namazuじゃだめ?
それがだめならIBMのメインフレームでも使ってちょ。

4 :名無しさん@お腹いっぱい。 :2001/07/22(日) 11:22
libsary つかって AND は自前で実装、ってのはどうよ。
http://sary.namazu.org/

5 :名無しさん@お腹いっぱい。 :2001/07/22(日) 18:02
1です。m(__)m
saryやsafuryを組み込んでAND検索してみました。(C言語バージョン)
ANDはやはり、ループでまわして一つ一つ照合しないとダメなのでしょうか。
ループだと複数になると、時間がかかってしまいます。

ループ以外のアルゴリズムなどあったら是非ご教授おねがいいたします。

6 :nobody@65535 :2001/07/22(日) 22:44
単語ごとの行への出現ビットマップを作る。
あとはANDとるだけ。
1行何フィールドで何行、何種類の単語が出現するのか知らんが、
全部オンメモリで処理すればこれは速ぇーぞー(笑)。


続きを読む

掲示板に戻る 全部 次100 最新50
名前: E-mail (省略可) :

read.cgi ver5.26+ (01/10/21-)