1read 100read
2013年06月ソフトウェア582: 2ちゃんねるスレッド全文検索・・・ThreadSearch (514) TOP カテ一覧 スレ一覧 2ch元 削除依頼
Songbird Part03 (539)
■オープンソース■ Regnessem Part23 (195)
欠陥ソフト★+Lhaca★を改善させるスレ (401)
パスワード管理ツール Part4 (166)
SKKとその派生入力メソッド (151)
【QCD】Quintessential Player Part6【QMP】 (171)

2ちゃんねるスレッド全文検索・・・ThreadSearch


1 :2008/02/27 〜 最終レス :2013/05/18
ttp://www.geocities.jp/cen_hp
他の2chブラウザと連携できるといいな

2 :
Styleの作者ならパクってくれると信じてる

3 :
取得してるdatから検索するだけじゃないか
つまりただのgrepソフトじゃないか
そうならそうと書いておけよファック!

4 :
よく見たらどの2chブラウザでもいいっぽいのかこれは

5 :
cenのソフトか
本人もいることだし、ここでいいでしょ
MonoView Part1
http://pc11.2ch.net/test/read.cgi/software/1120578352/l50

6 :
JaneNidaの検索部分を抜き出したようなソフトだ

7 :
おや、こんなスレが。。
>>3
そうです。
取得済みdatから検索します。
>>4
datファイルのあるフォルダならブラウザは何でもいいです。

8 :
>>5
あきらかに趣旨が違うから、ここでもいい気が。

9 :
これ、まとめ屋さんに便利な気がする。
そういや、2chツール系はブラウザとかクライアントばっかでこういうのは少ないね
htmlに吐き出すことができればなおいいと思う。

10 :
地味に便利な予感

11 :
>>9
>htmlに吐き出す
できたぞ

12 :
“2ちゃんねる”専用ブラウザで閲覧したスレッドを全文検索できるソフト「スレッド全文検索」v1.00公開
http://namidame.2ch.net/test/read.cgi/news/1204783364/
ボロクソ言われてんぞ

13 :
>>12
どうもです
携帯で見てみましたが、.NET重いとか遅いとかありますね。
まあ確かにそうです。
こっちに記事がでてますね。
http://www.forest.impress.co.jp/article/2008/03/06/threadzenbun.html

14 :
まあ、2chブラウザ自体に検索機能あるしね

15 :
誰もマイクロソフトの.netに夢を見ていないから
独自で作ったほうがいいな

16 :
言い忘れたけどこのソフト名前変えたほうがいいと思いますよ。
おそらく勘違いされるんじゃないでしょうか。

17 :
専ブラのボードデータ読んで欲しいものだ

18 :
似たようなソフトが二つあるけど、その違いは?

19 :
>>18
もう一つは?

20 :
スレッド全文検索
http://www.geocities.jp/cen_hp/threadsearch.html
datファイル全文検索ソフト
http://www.geocities.jp/cen_hp/program2.html

21 :
Googleデスクトップでdatが検索できればいいんだけどなぁ

22 :
>>20
>>1のトップ見ると、スレッド全文検索は
datファイル全文検索ソフトの次のバージョンだって

23 :
age

24 :
板名の項目と正規表現が欲しい。
あと、スレタイ・日時を指定した場合、一致しないdatは検索しないようにして欲しい。

25 :
>>21
使えるかは知らんが
Jane Log Indexer
ttp://www.geocities.jp/hiko_bae/janelogindexer.html

26 :
>>25
おおー、これはすばらしい!
ついでに質問したいんだけど・・・
見つかったdatを簡易ブラウズするいい方法ってあるかな?
dat2htmlを内部的にやってくれて、サクっと表示してくれればうれしいんだけど

27 :
バッチ書けばなんとかなりそう。
やってみるべさ。こういうのはあまり得意ではないけど。
思いっきりスレ違いだけど、このスレあまり活動してなさそうだから別にいいか。

28 :
あっ、バッチじゃダメか…(^^;

29 :
レジストリか…さじ投げする。
すまない。NGしてくれい。

30 :
index作成型じゃないの?
すごくのろい。

31 :
>>24
板名で絞込みをどうしようかと思いましたが、ブラウザによって管理方法が
違うので迷いました。
今はどのフォルダでも同じように検索できるようになってます。
日時ではしてないですが、スレタイを指定して一致しない時は検索しない
ようになってます。

32 :
>>25
へえ。こういうのあるんですね。
>>30
なるほど。
index作れば速くなりそうですね。
あまり考えないで作ってました。

33 :
>32
最初のログ容量次第でindexの作成にバカ時間食いそうだけど、
その後がチマチマ増えたログのindex作成はたいして時間かからないだろうし
快適な気がしますです。

34 :
NamazuとかPerlとかkakasiとか判らないので
マジindex作成型もお願いします。

35 :
そんな数検索するなよって話なんだろうけど
約15000個あるdatから全文検索かけたら凄い時間かかったから消した。
この機能は凄いありがたいんでどうにか高速化して欲しい

36 :
これ結構便利だ

37 :
cenさんありがとう、これ物凄い便利です
要望ってここで書いちゃっていいのかな?
追加を検討してほしい機能があります
検索後の結果でレスが読めますがやっぱり周辺のレスやら流れが読みたい事があります
そこで検索結果表示のスレタイをクリックしてそのスレ全部表示できたら良いなぁと
最近bbs2chreaderに乗り換えたのですが検索が無い、板フォルダ名がJaneと非互換なので
検索、後で読む、用にJaneにインポートさせるのも面倒だったりします
しかも現在bbs2chreaderは管理が変わり他専用ブラウザからのインポートもできません。。。
御一考頂ければなぁ、と思います

38 :
>>33-35
インデックス作るのには時間かかるかもしれないですが、
それがあると検索が速くなりそうですね。
考えてみます。

39 :
>>37
なるほどです。
結果の前後のレスも気になるといえば、なる時もありますね。
そういうのがあれば便利かもしれないですね

40 :
>>39
レスありがとうございます
需要がありそうでしたら御一考くださいませ

41 :
期待age

42 :
index作成型 期待
ついでに各ブラウザから板リスト持ってきて、ドロップダウンリストっていうのかな?
検索する板も指定出来るといいな。
現行だと検索板を指定したくてフォルダ指定しようとすると大量ログがあるせいで
なかなかフォルダが開かないです。
まあindex作成型なら板指定なんかする必要は無いとも思いますが。

43 :
index作成には特別興味ないけど、スレやレスのurlが分からないのは困る。
せっかく結果をファイルで保存できるのもったいない。

44 :
>>42
インデックス方式は方法をぼちぼち考えて、テストのプログラム作っています。
板を選べるのもいいと最初思いましたが、ブラウザによってログの管理方法が
違うので対応をどうしようかと思い、結局はその機能はつけませんでした。
>>43
確かにそうですね。
後で見たときにその方がわかりやすいですね。

45 :
>インデックス方式
楽しみーに待ってるです

46 :
あげ

47 :
インデックスは独自?
それともnamazuとか使うの?

48 :
>>47
独自の方法でする予定です。

49 :
おはようございます。
スレッド全文検索を更新しました。
Ver 1.50になりました。
http://www.geocities.jp/cen_hp
更新点は以下です。
・インデックス方式にしました。
・結果にログファイルのパスを表示しました。

50 :
インデックスを使うことで高速に検索できるようになりました。
http://www.geocities.jp/cen_hp/threadsearch.html#7
HPに載せている結果の場合、約3倍・約34倍 高速になっています。
検索語句によって速度がかなり変わります。
ユニークな言葉だと速く検索できます。

51 :
それから、検索結果はVer1.00と同様の結果が出ます。

52 :
あと、方法は独自と書きましたがほぼngram法です。

53 :
Vista SP1(64bit)で動かしてみたんだけど、
ステータスバーに
「インデックス作成中・・・ファイルリスト作成中」
と表示されたまま、CPU使用率も上がらず、HDDアクセスも無いまま
インデックス作成が終わらない・・・

54 :
>>53
どうもです。
一度終了して、インデックスを削除しても同じですか?
それと、検索フォルダにログのフォルダを指定して、作成していますか?
それでも出来ないならフォルダのパスを変えてみてください。
一応、動作確認として、Vista SP1(32bit)と、XP SP2(32bit)でしています。
あと、正常にインデックスが出来たら、「index」の名前のフォルダに
以下のファイルができます。
・file_list.txt
・index_0.txt 〜 index_xx.txt(xxは数字)
・path.txt

55 :
>>53
さっき調べてみましたら、dllを作成するコンパイラが64bitに
対応していませんでした。
ですので、すみませんが64bitの環境では動作しません。

56 :
>>50
キタ━━━━━━(゚∀゚)━━━━━━ !!!!
とても乙です!
うちの非力2chノートでのレポ
CeleronM1.3G/Mem1.2G/XPSp2
DATフォルダサイズ 3.09G
DATファイル数 48902
INDEX作成時間 2時間
(↑他のそこそこ重い作業しながら、あんまり目安にもならないw)
検索はかなり速くなりました、ヌルヌルとヒットが出てくる感じ
検索結果からDATへのリンクですぐ該当DATにアクセスできるので相当便利です

57 :
>>55
.dat ファイルのパスをダブルクリックで「メモ帳」や>>nn 等の右クリックで 開く場合
「IE 」とキメウチされているようですが任意の(テキスト)ビュアーや
既定のブラウザーを使うか、各自指定できる様になると使いが手がより良いと思います。

58 :
>>56
失礼「メモ帳」は Win の設定によるのでした...失礼しました。
ブラウザーに関しては「規定のブラウザー」を IE 以外にしていても
ヤハリ IE で開いてしまいます。

59 :
>>55
あと、ウインドウ・サイズも覚えておいて欲しい。
.NET Framework ソフトとしては軽いので結構期待してる。

60 :
うほっ
index版 キテタ-
なにやらまだ不完全ぽいですが、さっそく使わせてもらいます。
祭日中にとっても乙

61 :
>>60
>不完全ぽい
kwsk

62 :
>>50
本文を含まない場合インデックスが利かないので一寸実用に耐えないなあl.

63 :
index作成開始2時間半後で45%
まだまだ先は長いな。

64 :
使って頂いてありがとうです。
>>58
検索結果の部分はIEコンポーネントなので、そこから開くものはIEになります。
結果を保存したときのHTMLは任意のブラウザで見れます。
>>59
それもいいかもしれないですね。
>>62
本文でしかインデックスは考えてませんでした。
そういえば、本文以外で名前とかメール欄とかは、スレでほとんど
一緒で、それで何かできそうな気もします。

65 :
5万1千程のdatで4時間半かかった。

66 :
初回indexを作ってからちゃんブラでログ取得して又indexを作らせて
みたら、初回と同じ位に時間が掛かっちゃいますね。
indexを作るってのはどのindex型でも、対象の追加があったらindexは
ゼロから作り直しになっちゃうのでしょうか?

67 :
>>66
他の方法はそこまで詳しく知らないのです。
今のバージョンは、indexの作成と読み込みが出来ることを目指してたので、
更新まで力が及びませんでした。
なので、更新=作成になります。
次は更新も考えて見ます。

68 :
乙です
確かにそれはちょっと欲しい、ぜひご一考を
そうすれば常に専ブラのフォルダダイレクト読める。。。
もっとわがまま書かせて頂くと複数フォルダパス設定をiniに書く形でも良いので欲しいです
一つのthreadseaerchから退避フォルダと現行専ブラフォルダを読めると最高です

69 :
>67
今でもハングアップしてんじゃないか?ほんとに検索してんのかよ?
って他の検索と比べたらとってもありがたいです。(-人-)

70 :
>>64
成る程、IE のメニューが出てるんですものね...
IE 側に別のブラウザでリンクを開くコンテクストメニューを追加する事で
>>XX を IE 以外で見れるようになりました。

71 :
>>68
設定読み込みで、iniファイルを選べるからそれでしてみたら?

72 :
どうもありがとうです
>>68
iniは任意の名前で保存できて、読み込めますが、そうではなくて、
一度の検索で2つのフォルダを設定したいということですか。
>>70
そういう方法もあるとは

73 :
あと、窓の杜で記事が掲載されました。
http://www.forest.impress.co.jp/article/2008/05/08/threadzenbun150.html

74 :
>>71
>>72
ありがとうございます、任意ini読み込みさえ気付いてなかった。。。
とりあえず、それで分けます
>一度の検索で2つのフォルダを設定
です、退避フォルダと現行専ブラのフォルダと記憶が曖昧だったりするときに
使いたいなと思いました、bbs2chreaderはgrepをかけるくらいしか全文検索が無いですんで。。。
>>73
窓の杜も細かく拾いますねw

75 :
俺も3つの2chブラウザ使ってるから、順番に検索してくれたら助かるな

76 :
ああ、よく考えたらログフォルダ作って全部その下に移動させればいいのか

77 :
.NETじゃなくVCじゃ無理なの?
起動時、糞重くてしょうがないんだが

78 :
VCは.NETに比べて手間が10倍くらいに増えるからな。
起動速度だけのためにそんな手間はかけてられないって感じじゃね?

79 :
8.4ギガ程のログで3ギガ程のindexが出来ますた。

80 :
DesktopHE
ttp://freemind.s57.xrea.com/desktophe/index.html
↑datはサポート外で、datファイルの表示は固まるかと思うほど遅いすが
探してくるのは速いしインデックスの作り方とか参考にならないでしょうか

81 :
>>74>>75
ログフォルダが複数あるときですか。
それは思いつきませんでした。
>>77
大体>>78さんの通り、重いですが作るのが割と楽なので.NETを使っています。
>>80
そういうのもあるんですか。
ちょっと見てみます。

82 :
age

83 :
+   +   ワクワクテカテカ
  ∧_∧  +
 (0゜・∀・)
 (0゜∪ ∪ +   index追加型、急かしてないよ?        
 と__)__) +

84 :
急がせてるwwwwwwwwwwww

85 :
+   +   ワクワクテカテカ
  ∧_∧  +
 (0゜・∀・)
 (0゜∪ ∪ +   急かしてないよ、ホントだよ?        
 と__)__) +

86 :
Janeログをインデックス化して高速検索する「dat検索」 :教えて君.net
ttp://www.oshiete-kun.net/archives/2008/05/janedat.html
Datファイル全文検索ソフト DatE
ttp://frozenlib.net/DatE/
こっちが2.0ならむこうは3.5か…
誰かユーザーの事考えたC++製の全文検索ソフト作れよ

87 :
Jane系に限定するならJaneViewでも使ってりゃいいじゃない
インデックスサーチなら他の100倍は早い

88 :
ずっとJane使ってたら、メモリ使用量が300Mになった…
V2Cくらいメモリ使用量決められたらいいんだけどなぁ

89 :
週末きたけどそろそろバージョンくる?

90 :
週末くるけどそろそろバージョンくる?

91 :
「バージョンくる」の意味が分からなかったのでグッてみた
ver・sion
━━ n. 翻訳, 訳書; (時にV-) (聖書の)…訳[版]; 解釈; 異説; (個人的な観点からの)説明; 翻案, 編曲.

92 :
たぶん「そろそろバージョン」っていう新しいバージョンが来るんじゃマイカ?

93 :
>86
バージョンこないから試してみようとしたけど起動しないや・・・

94 :
俺は白鴎院理人(はくおういんりひと)。 御茶ノ水に事務所を構える私立探偵だ。
俺は帝都を騒がす怪人物、蜘蛛男を追っている。 奴が目撃され始めたのは数週間前のこと。
はじめは酔客の間で交わされる噂話に過ぎなかった。 夜の帝都を飛び回る不気味な怪人物がいる。
路地裏で人を喰らっているところを見た。 こうした噂話は、帝都では珍しいものではない。
近代化を成し遂げ、震災から復興しても尚、 人々は夜の闇に怯え、怪しげな噂を作り出す。
だが、蜘蛛男の噂は一時に止まらず増え続けた。 それが低級雑誌で取り上げられるようになり、
最近では大新聞までもが蜘蛛男の記事を載せている。 こうなると警察も黙ってはいない。
多くの人員を割いて捜査に当たっているらしい。 しかし、今のところ蜘蛛男の逮捕には至っていない。
それどころか奴が何者で何の目的があるのかさえも、 未だ判明していないのだ。
奴が何者であったとしても、 帝都を騒がす怪人物を放っておくことはできまい。
そこで私立探偵である俺もまた、蜘蛛男を追っていた。 この俺が蜘蛛男を捕えてみせる。
\_____ _________________________________/
         ∨
           ___                _
       / ____ヽ           /  ̄   ̄ \
       |  | /, −、, -、l           /、          ヽ きみ頭だいじょうぶ?
       | _| -|○ | ○||         |・ |―-、       |
   , ―-、 (6  _ー っ-´、}         q -´ 二 ヽ      |
   | -⊂) \ ヽ_  ̄ ̄ノノ          ノ_ ー  |     |
    | ̄ ̄|/ (_ ∪ ̄ / 、 \        \. ̄`  |      /
    ヽ  ` ,.|     ̄  |  |         O===== |
      `− ´ |       | _|        /          |
【 南極堂...断罪アイアンメイデン 】  http://www42.atwiki.jp/ironmaiden/

95 :
どうもです。
ちょっと忙しくてできていないですが、
今はインデックスの方式を考え直しているところです。

96 :
待ってます

97 :
待っています。

98 :
みみずん検索とかは一瞬に近い状態で検索結果が出るけど
これは意外と時間かかるよね?
これってハードウェア性能の違い?それともindexの方式違い?
どっちが原因として大きいんだろ。
indexをRAMディスクに置いて、DATをRAID0・5・6に置いても
とても一瞬じゃ表示出来なそうだけど。

あ、従来の検索と比べたら遥かに恩の字ですから
ケチ付けてるんじゃなく素朴な疑問です。

99 :
>>98
何言ってる

100read 1read
1read 100read
TOP カテ一覧 スレ一覧 2ch元 削除依頼
ソフトウェア板の1001を決めよう (139)
アウトラインプロセッサ 「NanaTerry」 (953)
【The Movie Player】MPlayer Part1 (250)
■Silverlight■高速グラフィック■AdobeFlash■ (110)
【ネットラジオ】 radiko関連ソフト総合 Part14 (695)
アウトラインプロセッサ 「NanaTerry」 (953)
--log9.info------------------
新しい宗教を作ろう! (151)
NAS6 ◆YbjyWDyXSc 専用スレ  (138)
人を殺した数 キリスト教>>>他宗教 (172)
【根本仏教】中観仏教について語ろう【龍樹】 (143)
★ヨハン教会以外は教会にあらず★ (106)
■■■ヨハン教会に500万円奪われました■■ (143)
【紹介】心に響く仏語や参考書籍【書評】1 (138)
液クロサイエンス【天理教強要】2 (121)
無神論のユダヤ人物理学者 (107)
スピリチュアリズムはうんこ・2 (156)
何故神は存在するのか? (165)
【聖書】AZ 千年王子の預言講座【ノストラ】 (162)
聖書配布協力会3【キリスト】 (954)
こどもにもわかる「オウムしんりきょう」 (197)
御宝号を毎日三回唱えるスレ00001 (137)
草なぎ剛は「現人神」である (351)
--log55.com------------------
はじめの一歩●Round678●
ダイヤのAネタバレスレ51
【 二階堂ヒカル】あおざくら 走水14丁目 【 TVドラマ&舞台化】
ワンピース懸賞金一覧表 2019
【栗山ミヅキ】保安官エヴァンスの嘘 10発目【サンデー】
【信者が基地害】鬼滅の刃アンチスレ Part6
【小高和剛】ギャンブラーズパレード【中山敦支】 Part.4
【細川雅巳】 逃亡者エリオ 逃亡1日目【チャンピオン】