1read 100read
2013年06月ソフトウェア582: 2ちゃんねるスレッド全文検索・・・ThreadSearch (514)
TOP カテ一覧 スレ一覧 2ch元 削除依頼 ▼
BUFFALO RAMDISK 2GB (137)
日本人が作った中で一番凄いと思うソフトは? (113)
GMail Drive part1 (466)
VMwareESX/ESXi専用スレPart12 (211)
PC-98エミュを語ろう11 (214)
madVR Part3 (207)
2ちゃんねるスレッド全文検索・・・ThreadSearch
- 1 :2008/02/27 〜 最終レス :2013/05/18
- ttp://www.geocities.jp/cen_hp
他の2chブラウザと連携できるといいな
- 2 :
- Styleの作者ならパクってくれると信じてる
- 3 :
- 取得してるdatから検索するだけじゃないか
つまりただのgrepソフトじゃないか
そうならそうと書いておけよファック!
- 4 :
- よく見たらどの2chブラウザでもいいっぽいのかこれは
- 5 :
- cenのソフトか
本人もいることだし、ここでいいでしょ
MonoView Part1
http://pc11.2ch.net/test/read.cgi/software/1120578352/l50
- 6 :
- JaneNidaの検索部分を抜き出したようなソフトだ
- 7 :
- おや、こんなスレが。。
>>3
そうです。
取得済みdatから検索します。
>>4
datファイルのあるフォルダならブラウザは何でもいいです。
- 8 :
- >>5
あきらかに趣旨が違うから、ここでもいい気が。
- 9 :
- これ、まとめ屋さんに便利な気がする。
そういや、2chツール系はブラウザとかクライアントばっかでこういうのは少ないね
htmlに吐き出すことができればなおいいと思う。
- 10 :
- 地味に便利な予感
- 11 :
- >>9
>htmlに吐き出す
できたぞ
- 12 :
- “2ちゃんねる”専用ブラウザで閲覧したスレッドを全文検索できるソフト「スレッド全文検索」v1.00公開
http://namidame.2ch.net/test/read.cgi/news/1204783364/
ボロクソ言われてんぞ
- 13 :
- >>12
どうもです
携帯で見てみましたが、.NET重いとか遅いとかありますね。
まあ確かにそうです。
こっちに記事がでてますね。
http://www.forest.impress.co.jp/article/2008/03/06/threadzenbun.html
- 14 :
- まあ、2chブラウザ自体に検索機能あるしね
- 15 :
- 誰もマイクロソフトの.netに夢を見ていないから
独自で作ったほうがいいな
- 16 :
- 言い忘れたけどこのソフト名前変えたほうがいいと思いますよ。
おそらく勘違いされるんじゃないでしょうか。
- 17 :
- 専ブラのボードデータ読んで欲しいものだ
- 18 :
- 似たようなソフトが二つあるけど、その違いは?
- 19 :
- >>18
もう一つは?
- 20 :
- スレッド全文検索
http://www.geocities.jp/cen_hp/threadsearch.html
datファイル全文検索ソフト
http://www.geocities.jp/cen_hp/program2.html
- 21 :
- Googleデスクトップでdatが検索できればいいんだけどなぁ
- 22 :
- >>20
>>1のトップ見ると、スレッド全文検索は
datファイル全文検索ソフトの次のバージョンだって
- 23 :
- age
- 24 :
- 板名の項目と正規表現が欲しい。
あと、スレタイ・日時を指定した場合、一致しないdatは検索しないようにして欲しい。
- 25 :
- >>21
使えるかは知らんが
Jane Log Indexer
ttp://www.geocities.jp/hiko_bae/janelogindexer.html
- 26 :
- >>25
おおー、これはすばらしい!
ついでに質問したいんだけど・・・
見つかったdatを簡易ブラウズするいい方法ってあるかな?
dat2htmlを内部的にやってくれて、サクっと表示してくれればうれしいんだけど
- 27 :
- バッチ書けばなんとかなりそう。
やってみるべさ。こういうのはあまり得意ではないけど。
思いっきりスレ違いだけど、このスレあまり活動してなさそうだから別にいいか。
- 28 :
- あっ、バッチじゃダメか…(^^;
- 29 :
- レジストリか…さじ投げする。
すまない。NGしてくれい。
- 30 :
- index作成型じゃないの?
すごくのろい。
- 31 :
- >>24
板名で絞込みをどうしようかと思いましたが、ブラウザによって管理方法が
違うので迷いました。
今はどのフォルダでも同じように検索できるようになってます。
日時ではしてないですが、スレタイを指定して一致しない時は検索しない
ようになってます。
- 32 :
- >>25
へえ。こういうのあるんですね。
>>30
なるほど。
index作れば速くなりそうですね。
あまり考えないで作ってました。
- 33 :
- >32
最初のログ容量次第でindexの作成にバカ時間食いそうだけど、
その後がチマチマ増えたログのindex作成はたいして時間かからないだろうし
快適な気がしますです。
- 34 :
- NamazuとかPerlとかkakasiとか判らないので
マジindex作成型もお願いします。
- 35 :
- そんな数検索するなよって話なんだろうけど
約15000個あるdatから全文検索かけたら凄い時間かかったから消した。
この機能は凄いありがたいんでどうにか高速化して欲しい
- 36 :
- これ結構便利だ
- 37 :
- cenさんありがとう、これ物凄い便利です
要望ってここで書いちゃっていいのかな?
追加を検討してほしい機能があります
検索後の結果でレスが読めますがやっぱり周辺のレスやら流れが読みたい事があります
そこで検索結果表示のスレタイをクリックしてそのスレ全部表示できたら良いなぁと
最近bbs2chreaderに乗り換えたのですが検索が無い、板フォルダ名がJaneと非互換なので
検索、後で読む、用にJaneにインポートさせるのも面倒だったりします
しかも現在bbs2chreaderは管理が変わり他専用ブラウザからのインポートもできません。。。
御一考頂ければなぁ、と思います
- 38 :
- >>33-35
インデックス作るのには時間かかるかもしれないですが、
それがあると検索が速くなりそうですね。
考えてみます。
- 39 :
- >>37
なるほどです。
結果の前後のレスも気になるといえば、なる時もありますね。
そういうのがあれば便利かもしれないですね
- 40 :
- >>39
レスありがとうございます
需要がありそうでしたら御一考くださいませ
- 41 :
- 期待age
- 42 :
- index作成型 期待
ついでに各ブラウザから板リスト持ってきて、ドロップダウンリストっていうのかな?
検索する板も指定出来るといいな。
現行だと検索板を指定したくてフォルダ指定しようとすると大量ログがあるせいで
なかなかフォルダが開かないです。
まあindex作成型なら板指定なんかする必要は無いとも思いますが。
- 43 :
- index作成には特別興味ないけど、スレやレスのurlが分からないのは困る。
せっかく結果をファイルで保存できるのもったいない。
- 44 :
- >>42
インデックス方式は方法をぼちぼち考えて、テストのプログラム作っています。
板を選べるのもいいと最初思いましたが、ブラウザによってログの管理方法が
違うので対応をどうしようかと思い、結局はその機能はつけませんでした。
>>43
確かにそうですね。
後で見たときにその方がわかりやすいですね。
- 45 :
- >インデックス方式
楽しみーに待ってるです
- 46 :
- あげ
- 47 :
- インデックスは独自?
それともnamazuとか使うの?
- 48 :
- >>47
独自の方法でする予定です。
- 49 :
- おはようございます。
スレッド全文検索を更新しました。
Ver 1.50になりました。
http://www.geocities.jp/cen_hp
更新点は以下です。
・インデックス方式にしました。
・結果にログファイルのパスを表示しました。
- 50 :
- インデックスを使うことで高速に検索できるようになりました。
http://www.geocities.jp/cen_hp/threadsearch.html#7
HPに載せている結果の場合、約3倍・約34倍 高速になっています。
検索語句によって速度がかなり変わります。
ユニークな言葉だと速く検索できます。
- 51 :
- それから、検索結果はVer1.00と同様の結果が出ます。
- 52 :
- あと、方法は独自と書きましたがほぼngram法です。
- 53 :
- Vista SP1(64bit)で動かしてみたんだけど、
ステータスバーに
「インデックス作成中・・・ファイルリスト作成中」
と表示されたまま、CPU使用率も上がらず、HDDアクセスも無いまま
インデックス作成が終わらない・・・
- 54 :
- >>53
どうもです。
一度終了して、インデックスを削除しても同じですか?
それと、検索フォルダにログのフォルダを指定して、作成していますか?
それでも出来ないならフォルダのパスを変えてみてください。
一応、動作確認として、Vista SP1(32bit)と、XP SP2(32bit)でしています。
あと、正常にインデックスが出来たら、「index」の名前のフォルダに
以下のファイルができます。
・file_list.txt
・index_0.txt 〜 index_xx.txt(xxは数字)
・path.txt
- 55 :
- >>53
さっき調べてみましたら、dllを作成するコンパイラが64bitに
対応していませんでした。
ですので、すみませんが64bitの環境では動作しません。
- 56 :
- >>50
キタ━━━━━━(゚∀゚)━━━━━━ !!!!
とても乙です!
うちの非力2chノートでのレポ
CeleronM1.3G/Mem1.2G/XPSp2
DATフォルダサイズ 3.09G
DATファイル数 48902
INDEX作成時間 2時間
(↑他のそこそこ重い作業しながら、あんまり目安にもならないw)
検索はかなり速くなりました、ヌルヌルとヒットが出てくる感じ
検索結果からDATへのリンクですぐ該当DATにアクセスできるので相当便利です
- 57 :
- >>55
.dat ファイルのパスをダブルクリックで「メモ帳」や>>nn 等の右クリックで 開く場合
「IE 」とキメウチされているようですが任意の(テキスト)ビュアーや
既定のブラウザーを使うか、各自指定できる様になると使いが手がより良いと思います。
- 58 :
- >>56
失礼「メモ帳」は Win の設定によるのでした...失礼しました。
ブラウザーに関しては「規定のブラウザー」を IE 以外にしていても
ヤハリ IE で開いてしまいます。
- 59 :
- >>55
あと、ウインドウ・サイズも覚えておいて欲しい。
.NET Framework ソフトとしては軽いので結構期待してる。
- 60 :
- うほっ
index版 キテタ-
なにやらまだ不完全ぽいですが、さっそく使わせてもらいます。
祭日中にとっても乙
- 61 :
- >>60
>不完全ぽい
kwsk
- 62 :
- >>50
本文を含まない場合インデックスが利かないので一寸実用に耐えないなあl.
- 63 :
- index作成開始2時間半後で45%
まだまだ先は長いな。
- 64 :
- 使って頂いてありがとうです。
>>58
検索結果の部分はIEコンポーネントなので、そこから開くものはIEになります。
結果を保存したときのHTMLは任意のブラウザで見れます。
>>59
それもいいかもしれないですね。
>>62
本文でしかインデックスは考えてませんでした。
そういえば、本文以外で名前とかメール欄とかは、スレでほとんど
一緒で、それで何かできそうな気もします。
- 65 :
- 5万1千程のdatで4時間半かかった。
- 66 :
- 初回indexを作ってからちゃんブラでログ取得して又indexを作らせて
みたら、初回と同じ位に時間が掛かっちゃいますね。
indexを作るってのはどのindex型でも、対象の追加があったらindexは
ゼロから作り直しになっちゃうのでしょうか?
- 67 :
- >>66
他の方法はそこまで詳しく知らないのです。
今のバージョンは、indexの作成と読み込みが出来ることを目指してたので、
更新まで力が及びませんでした。
なので、更新=作成になります。
次は更新も考えて見ます。
- 68 :
- 乙です
確かにそれはちょっと欲しい、ぜひご一考を
そうすれば常に専ブラのフォルダダイレクト読める。。。
もっとわがまま書かせて頂くと複数フォルダパス設定をiniに書く形でも良いので欲しいです
一つのthreadseaerchから退避フォルダと現行専ブラフォルダを読めると最高です
- 69 :
- >67
今でもハングアップしてんじゃないか?ほんとに検索してんのかよ?
って他の検索と比べたらとってもありがたいです。(-人-)
- 70 :
- >>64
成る程、IE のメニューが出てるんですものね...
IE 側に別のブラウザでリンクを開くコンテクストメニューを追加する事で
>>XX を IE 以外で見れるようになりました。
- 71 :
- >>68
設定読み込みで、iniファイルを選べるからそれでしてみたら?
- 72 :
- どうもありがとうです
>>68
iniは任意の名前で保存できて、読み込めますが、そうではなくて、
一度の検索で2つのフォルダを設定したいということですか。
>>70
そういう方法もあるとは
- 73 :
- あと、窓の杜で記事が掲載されました。
http://www.forest.impress.co.jp/article/2008/05/08/threadzenbun150.html
- 74 :
- >>71
>>72
ありがとうございます、任意ini読み込みさえ気付いてなかった。。。
とりあえず、それで分けます
>一度の検索で2つのフォルダを設定
です、退避フォルダと現行専ブラのフォルダと記憶が曖昧だったりするときに
使いたいなと思いました、bbs2chreaderはgrepをかけるくらいしか全文検索が無いですんで。。。
>>73
窓の杜も細かく拾いますねw
- 75 :
- 俺も3つの2chブラウザ使ってるから、順番に検索してくれたら助かるな
- 76 :
- ああ、よく考えたらログフォルダ作って全部その下に移動させればいいのか
- 77 :
- .NETじゃなくVCじゃ無理なの?
起動時、糞重くてしょうがないんだが
- 78 :
- VCは.NETに比べて手間が10倍くらいに増えるからな。
起動速度だけのためにそんな手間はかけてられないって感じじゃね?
- 79 :
- 8.4ギガ程のログで3ギガ程のindexが出来ますた。
- 80 :
- DesktopHE
ttp://freemind.s57.xrea.com/desktophe/index.html
↑datはサポート外で、datファイルの表示は固まるかと思うほど遅いすが
探してくるのは速いしインデックスの作り方とか参考にならないでしょうか
- 81 :
- >>74>>75
ログフォルダが複数あるときですか。
それは思いつきませんでした。
>>77
大体>>78さんの通り、重いですが作るのが割と楽なので.NETを使っています。
>>80
そういうのもあるんですか。
ちょっと見てみます。
- 82 :
- age
- 83 :
- + + ワクワクテカテカ
∧_∧ +
(0゜・∀・)
(0゜∪ ∪ + index追加型、急かしてないよ?
と__)__) +
- 84 :
- 急がせてるwwwwwwwwwwww
- 85 :
- + + ワクワクテカテカ
∧_∧ +
(0゜・∀・)
(0゜∪ ∪ + 急かしてないよ、ホントだよ?
と__)__) +
- 86 :
- Janeログをインデックス化して高速検索する「dat検索」 :教えて君.net
ttp://www.oshiete-kun.net/archives/2008/05/janedat.html
Datファイル全文検索ソフト DatE
ttp://frozenlib.net/DatE/
こっちが2.0ならむこうは3.5か…
誰かユーザーの事考えたC++製の全文検索ソフト作れよ
- 87 :
- Jane系に限定するならJaneViewでも使ってりゃいいじゃない
インデックスサーチなら他の100倍は早い
- 88 :
- ずっとJane使ってたら、メモリ使用量が300Mになった…
V2Cくらいメモリ使用量決められたらいいんだけどなぁ
- 89 :
- 週末きたけどそろそろバージョンくる?
- 90 :
- 週末くるけどそろそろバージョンくる?
- 91 :
- 「バージョンくる」の意味が分からなかったのでグッてみた
ver・sion
━━ n. 翻訳, 訳書; (時にV-) (聖書の)…訳[版]; 解釈; 異説; (個人的な観点からの)説明; 翻案, 編曲.
- 92 :
- たぶん「そろそろバージョン」っていう新しいバージョンが来るんじゃマイカ?
- 93 :
- >86
バージョンこないから試してみようとしたけど起動しないや・・・
- 94 :
- 俺は白鴎院理人(はくおういんりひと)。 御茶ノ水に事務所を構える私立探偵だ。
俺は帝都を騒がす怪人物、蜘蛛男を追っている。 奴が目撃され始めたのは数週間前のこと。
はじめは酔客の間で交わされる噂話に過ぎなかった。 夜の帝都を飛び回る不気味な怪人物がいる。
路地裏で人を喰らっているところを見た。 こうした噂話は、帝都では珍しいものではない。
近代化を成し遂げ、震災から復興しても尚、 人々は夜の闇に怯え、怪しげな噂を作り出す。
だが、蜘蛛男の噂は一時に止まらず増え続けた。 それが低級雑誌で取り上げられるようになり、
最近では大新聞までもが蜘蛛男の記事を載せている。 こうなると警察も黙ってはいない。
多くの人員を割いて捜査に当たっているらしい。 しかし、今のところ蜘蛛男の逮捕には至っていない。
それどころか奴が何者で何の目的があるのかさえも、 未だ判明していないのだ。
奴が何者であったとしても、 帝都を騒がす怪人物を放っておくことはできまい。
そこで私立探偵である俺もまた、蜘蛛男を追っていた。 この俺が蜘蛛男を捕えてみせる。
\_____ _________________________________/
∨
___ _
/ ____ヽ /  ̄  ̄ \
| | /, −、, -、l /、 ヽ きみ頭だいじょうぶ?
| _| -|○ | ○|| |・ |―-、 |
, ―-、 (6 _ー っ-´、} q -´ 二 ヽ |
| -⊂) \ ヽ_  ̄ ̄ノノ ノ_ ー | |
| ̄ ̄|/ (_ ∪ ̄ / 、 \ \. ̄` | /
ヽ ` ,.|  ̄ | | O===== |
`− ´ | | _| / |
【 南極堂...断罪アイアンメイデン 】 http://www42.atwiki.jp/ironmaiden/
- 95 :
- どうもです。
ちょっと忙しくてできていないですが、
今はインデックスの方式を考え直しているところです。
- 96 :
- 待ってます
- 97 :
- 待っています。
- 98 :
- みみずん検索とかは一瞬に近い状態で検索結果が出るけど
これは意外と時間かかるよね?
これってハードウェア性能の違い?それともindexの方式違い?
どっちが原因として大きいんだろ。
indexをRAMディスクに置いて、DATをRAID0・5・6に置いても
とても一瞬じゃ表示出来なそうだけど。
あ、従来の検索と比べたら遥かに恩の字ですから
ケチ付けてるんじゃなく素朴な疑問です。
- 99 :
- >>98
何言ってる
- 100read 1read
- 1read 100read
TOP カテ一覧 スレ一覧 2ch元 削除依頼 ▲
2ちゃんねる用ブラウザ「Live2ch」part109 (177)
【Vorbis/FLAC】Ogg統合18【Theora/etc...】 (819)
madVR Part3 (207)
多画面タブファイラ Avesta Part5 (304)
なんでPS2のエミュは少ないの? (161)
【Jane】 2chブラウザは危険だから使うな 【Live】 (248)
--log9.info------------------
佐藤亜紀20 (154)
なんとなくクリスタルと上智大学の秘密の関係 (191)
【Daddy】浅井夢路【非日常】 (165)
【革】 本の装丁 【布】 (126)
西村寿行はここでいいですか (152)
7つの習慣 成功には原則があった!【スティーブンRコヴィー】 (126)
高校生の私に、オヌヌメのおしえて (107)
【堂 本 剛を】菊 池 亜 希 子の本や連載【刺激】 (117)
四国四県の図書館事情 (151)
ウェブ本棚総合2【蔵書管理/読書記録】 (198)
平凡社東洋文庫・平凡社ライブラリー (164)
お言葉ですが。高島俊男はいい。3。 (163)
さだまさしの小説を語るスレ (141)
闘病作家 福田実 (125)
齋藤智裕KAGEROUが1円本になる時期を予想 (140)
経済書 (189)
--log55.com------------------
ヨドバシポイントってあんま使い道無くない? [725533158]
都心の3畳ワンルームの部屋が人気 家賃もリーズナブル [331464139]
大阪桐蔭6点目。金足農は1点を返す 【現在5回】 [627732429]
佐々木希(金足農業中退) をマスコミが隠ぺい [604048985]
【悲報】貧困まんさん、友達との電話に「黒電話」を使ってしまうwww [213659811]
大阪桐蔭 試合に勝ったのに勝負に負けてしまう 金足農業に日本全国から惜しみない称賛の声 [274493323]
【甲子園】第100回記念大会決勝戦は大阪桐蔭が13-2で金足農を下して4年ぶり5度目の優勝!史上初の2度目の春夏連覇 [439232695]
NHKさん、金足の裏でJCの生足を中継 [455679766]