2011年12月1期WebProg27: 【全文検索】groonga【senna後継】 (28) TOP カテ一覧 スレ一覧 2ch元 削除依頼
・ 次のスレ
28: こんなCGI探してます 23 (952)
29: Eclipse質問スレ (246)
30: 正規表現道場 (851)
31: Zend Framework Part5 (461)

【全文検索】groonga【senna後継】


1 :11/11/01 〜 最終レス :11/12/06
ないようなので立ててみました
* groonga
http://groonga.org/ja/
* mysqlに組み込むgroongaストレージ(mroonga)
http://mroonga.github.com/
関連スレ
組み込み型全文検索エンジンSenna
http://hibari.2ch.net/test/read.cgi/php/1118762053/

2 :
トリトンのように、テーブル作成時にcharsetを指定すればujisが使えると思っていたのですが
invalid utf8 string(1) on grn_str_charlen_utf8というエラーが出て、
結果も思ったようなものになりません。
mroongaでujisのテーブルを使うには何か特別な処理が必要なのでしょうか?
CentOS5のRPMを使っています。

3 :
期待あげ

4 :
Apache Solrでいいじゃん。
みんな使ってるし。
終了

5 :
ソーラーってmysqlに全文検索を追加できるの?
使い方は別物じゃね

6 :
名前に-を含んだデータベースを作る
→groongaのテーブルを作る
→テーブルを削除しようとする
→エラーで削除できない
俺だけ?

7 :
SQLだとどうやっても削除できないから手でファイルを直接いじったよ

8 :
solrって最小のvpsで動かなかった
tritonnとhyperestraierでうまくいった

9 :
マシンスペックが必要ってこと?
javaだっけ

10 :
ラッパーモードのmyisamでdrop indexしたらエラーになる?
innodbならOKだった
色々検索したらmyisamはあんまり推奨じゃない感じかな
そもそもmyisamとの相性が悪いからgroonga開発したらしいし

11 :
まだこれつかうには危険な感じが...
ソーラーはmysqlで追加できないと思った

12 :
ストレージモードでグルーンガファイルをバックアップ→いったん削除→リストア
ってやったらmysqlへのアクセスではエラーになった
groongaのdbをmysqlのテーブル定義に後から紐づけるのはどうしたらいいんだろ

13 :
>>11
たしかに若干バギーな感じはある
でもトリトンももうmysqlのバージョンが古いしなぁ

14 :
ログファイル置き場を指定できるようにして欲しい
/var/log/mysql/にまとめたいだろJK

15 :
まだ実用になるレベルではないな
とりあえずtritonnを置き換えられるようになってほしい

16 :
とりあえず使えはするんだよね
運用の際のメンテとかまで考え出すと
まだ煮詰まってないなーって思う

17 :
>>14
お、書き込み時間が2ならび

18 :
php、perlはNAMAZUを使って。
レコメンドはvogooでも使えよ。
javaはLucenceでレコメンドはmahountでよくない?

19 :
SQL_CALC_FOUND_ROWSとlimitとorder byを同時に使うと
limitで制限した行数が全行数になるね
order byがないと全行数が正確に取れる。
groongaだけなのか、デフォルトの全文検索もそうなのかは検証してないけど
とりあえず普通のmyisamは、order byがあっても全行数が変わることはなかった

20 :
268 名前:nobodyさん[sage] 投稿日:2011/06/01(水) 17:59:58.68 ID:???
limit a,b 指定で b の抽出件数指定は効くんだけど、a がゼロから効かない。
100,10 や 1000, 10 と指定しても、0, 10 と同じ結果。
フルテキストインデックス再構築したけど同じ。
インストした頃はちゃんと表示されたはずなんだが…。
sennaスレのこれと同じ現象かな?

21 :
2ind機能はやくサポートしてほしい

22 :
ここにいる人たちは、全文検索を利用している人たちだと思うので質問させてください
(別スレにて誘導されました)
皆さんは日本語の全文検索をどのようにされていますでしょうか?
Tritonnをみると、MySQLのバージョンが結構古いみたいなのでどうなのかなと思うのですが、
どのように対策をされていますでしょうか?
>>15のように、まだ実用的ではないという事は、Tritonnの方がいいのでしょうか?
また、中には自分でN-gramによって対策をしている人などもいるようですが、日本語の全文検索に対する対策は、N-gramとかで自分で実装する、Tritonnなどを入れる以外にはないのでしょうか?

23 :
だからSolr使えって。

24 :
groongaとトリトンのベンチマークはかった人いる?
なんとなく、体感だけどgroongaが遅い感じがする
0.5秒くらいかかってる
もう一度検索したら、0.000数秒でめっちゃ速い
それはキャッシュが効いているのか、
一回目の検索でインデックス的なものが整理されたのか分からないけど。

25 :
>>22
唯一の答えはないと思いますよ
俺はトリトンからgroongaへの移行を進めていますが
今のところ、どっちかの方があきらかにいい、と言える状況ではないと思います

26 :
もしかして日本語の全文検索に関してはpostgresqlのほうがいい?

27 :
groongaを語る夕べ #2 November 29, 2011 12:18 PM
http://www.ustream.tv/recorded/18817014
めも

28 :11/12/06
バージョンアップしてたから
mysql動かしたままupdateしたら
groongaがストレージから消えた
updateする時はサービス止めてからやらないといけないのかって当たり前か
TOP カテ一覧 スレ一覧 2ch元 削除依頼
・ 次のスレ
28: こんなCGI探してます 23 (952)
29: Eclipse質問スレ (246)
30: 正規表現道場 (851)
31: Zend Framework Part5 (461)