2011年10月1期WebProg検索エンジンつくりたい
TOP カテ一覧 スレ一覧 削除依頼 ▼
・ 次のスレ
゚。o SOAP o。゚
JSP/Servletで構築されたサイト
JavaScript コメントの謎
【仕様】荒らし対策掲示板【実装】
検索エンジンつくりたい
- 1 :03/09/14 〜 最終レス :08/11/14
- 17才の高校生です。
無料スペースつかってCGIを使った検索エンジンつくりたいのですが
ガキなんでまったくなにもわからないので教えてほしいのですが。
詳しいひといませんか?
- 2 :
- 初めまして、エロイ人です。
仕事で検索エンジンの作成やチューニングもやっています。
何を聞きたいのですか?
- 3 :
-
- 4 :
- なんで>>1みたいな糞がちょくちょく現れるのかなぁ
- 5 :
- >>1
なにもわからないやつには無理。
基本的なことを学んでから出直して来い。
- 6 :
- >>4さんが毎日排泄するように
日夜を問わず製造されているのでは無いでしょうか?
- 7 :
- >>5
そういう排他的な考えではいけませんね。
何事も最初は知識0から始めるものです。
まず検索エンジンとはどういう仕組で成り立っているのか考えてみては如何でしょうか?
仕組みを分割していくと幾つかに分類できていくことができると思います。
- 8 :
- >>7
後半2行は>>1に言ってやれ
- 9 :
- >>1
そんなのフリーで配布してるやつ使え
- 10 :
- >>7
失礼しました。
リンクをはるのを失念していました。
- 11 :
- >>2
えっと、具体的にはYomi-Searchみたいなのをやりたいんですけど、
まったくわからないんです。
どうしたらいいんですか?
- 12 :
- Yomi-Searchのソースは配布されてますよね。
それをダウンロードして中を見ても、全く分からないということですか?
分からない原因は何でしょうか?
perlで書かれているがperl自体を知らないというのであれば、
perlを勉強するのが一番でしょう。
perlは知らないが他の言語なら分かるというのであれば、
perlのリファレンスを見つつ他の言語に書き直してみるのもいいかも知れません。
言語なんてどうでもいいんだ、オレはディレクトリ型サーチが何を目指しているのか知りたいんだ、
という場合は哲学への道を進んでみるのも手だと思います。
>>1に作りたいとあったので、まずperlなりphpなり必要な手段(言語)を身に付けるところから始めてみては如何でしょうか?
- 13 :
- >>12
同意
- 14 :
- 概論
http://www.searchengineoptimization.jp/seo_foundation/index.html
- 15 :
- 誰も書いてないから書くけど、共有サーバを使うのはやめようね。
- 16 :
- ホームディレクトリ(ここでは public_htmlディレクトリとします)の下に、「naviディレクトリ」を作成し、さらにその下にロックファイル用ディレクトリの「lockディレクトリ」を作成します。
全体のディレクトリ構成とファイル位置の設置例は以下のとおりです。(かっこ内はパーミッションの設定値)
【構成例】
public_html / index.html (トップページ)
|
+-- navi / navi.cgi [755]
| navi.log [666]
| jcode.pl [644]
| bkup.dat [666]
| A.bak [666]
| B.bak [666]
| C.bak [666]
| new.gif
| recom.gif
|
+-- lock [777] /
↑これがよくわかりません。だれか教えてください。
- 17 :
- >>16
>>5
- 18 :
- なるほど。yomi-searchは内部が複雑なので
簡単そうなCOSMO NAVIで来ましたか。いい選択です。
さて本題ですが、「これ」というのはパーミッションのことでしょうか?
単純にアップロードすれば表示されるHTMLと違い、
CGIの場合はプログラムを実行した結果を表示します。
そのための準備の一つにパーミッションの設定があります。
面倒なので略。
- 19 :
- ◎CGIのご利用方法
CGIを利用される場合には、cgi-binというディレクトリを作成し、その中に
CGIを設置してください。拡張子は必ず.cgiとし、属性を700にしてくだ
さい。PerlのPATHは /usr/bin/perl となります。
HTMLファイルからCGIを参照する場合は次のように指定してください。
/blcs/cgi-bin/CGIファイル名
↑なんかマニュアル通り設定だとダメみたいなんですけど、どうすればいいのでしょうか。。。
- 20 :
- なんでみんなこんな優しいの? 過疎だから?
- 21 :
- >20
高校生だからだろw
- 22 :
- >>20
こども相手にあんまキツイことをいってもアレだろw
- 23 :
- >>1が高校3年生「たけし」でも、そのやさしさでレス出来たかな?
- 24 :
- つーか、スレ違いだろうが単質だろうが相手にする教えたがり厨がいるよな
- 25 :
- >>23
なんで、男にやさしくしなきゃならんのだ?
- 26 :
-
/ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄
/基礎的な知識がやや不足気味のような気がします。
∧_∧ / 参考になるような本を一冊読み終わってから始めてみては如何でしょうか?
( ・∀・)< Web上の情報としては、yahooの
( 建前 ) \ トップ > コンピュータとインターネット > インターネット > WWW > CGI
| | | \カテゴリが参考になると思います。
__(__)_)______________
( _)_)
| | |
( 本音 ) / ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄
( 。A。)< 即実装の話に入れるたけし君カモーン
∨ ̄∨ \_______________
- 27 :
- Yomiよりいい感じの検索エンジン作ろう
- 28 :
- いい感じの意味が曖昧ですね。
がんがってください。
- 29 :
- マジな話、検索ページをHTMLで生成される
検索エンジンが欲しいのだが、そういうのって可能?
製作するならぶっちゃけいくら必要になる?
- 30 :
- 打ち捨てられたこのスレへようこそ。
幾つか確認させてください。
検索ページをHTMLで生成 というのは、検索結果一覧をHTMLファイルにするということですか?
つまり、想定されるあらゆるキーワードに対して検索結果をあらかじめ静的なファイルとして生成しておくと?
- 31 :
- >>30
検索されるたびにキャッシュしていくとか
あんまり意味ない気がするんだが
- 32 :
- >検索ページをHTMLで生成 というのは、検索結果一覧をHTMLファイルにするということですか?
>つまり、想定されるあらゆるキーワードに対して検索結果をあらかじめ静的なファイルとして生成しておくと?
Googleは、これをやっているのでは? でなきゃ、なんで
あんなに速いんだ?
- 33 :
- HTMLページの表示にどれだけ時間がかかるっていうんだよ
検索結果の一部はキャッシュしてるだろうが、ページの生成は
動的だろ
- 34 :
- >>32
Googleのでータベースはメモリ上に常駐してるって聞いたが
- 35 :
- >>30
まぁ、そういう事ですかね。
普通のフリーの検索エンジンCGIなら
登録画面や検索結果表示画面は.cgiになります。
が、表示の速さやエラーの問題もあって.htmlである必要があるのです。
というわけでマジ見積もりお願いします。
- 36 :
- 想定されるあらゆるキーワードに対して検索結果をあらかじめ静的なファイルとして生成しておくのは無理
-----end
- 37 :
- >>35
>登録画面や検索結果表示画面は.cgiになります。
HTMLにすりゃいいじゃん
- 38 :
- >>37
それをできるかどうか聞いているのですが。
それともJavascriptかなにかで代用することを
言いたいのですか?
- 39 :
- >>38
例えば2chの板にindex.「html」が表示されるでしょ?
カキコするとbbs.cgiにPOSTするでしょ?
そしたらそのカキコがまたindex.「html」に表示されるでしょ?
- 40 :
- >>39
まぁ、形はどうあれ登録サイトがhtmlで表示されていればいいんです。
あなたがそういう形式の検索エンジンを作成できるなら
だいたいいくらで請け負うか教えていただけませんか?
参考にしますので。
- 41 :
- >40
登録サイトの想定件数はいかほどですか?
- 42 :
- >>41
返事遅れてすみません。。
1万が目標です。現在600です。
- 43 :
- > 1万が目標です。現在600です。
…
- 44 :
- http://daikon72.hp.infoseek.co.jp/cgi-bin/lock/renbari2813.mpg
これなんだ?
- 45 :
- >>42
カテゴリ分けしてるYahooみたいなのとは違うの?
つーか、確認しときたいけど拡張子がhtmlのcgiを作ってくれって事じゃないよね?
それなら.htaccessいじくりゃすむ話・・・・
登録の単語は手動で行なうのかな?
例えば、俺があるサイトの管理人で、その登録をしようとする。
その時に、
1.サイトのアドレスと、登録したいWordをいくつか一緒に書く。
そしたら、その登録Wordで検索した時のみそのサイトが表示される・・・
2.サイトのアドレスのみ書く。
そしたら、そのサイトを見た管理者が、そのサイトに適当なワードをいくつか並べて、
そのWordで検索した時のみそのサイトが表示
3.同じくサイトのアドレスのみ書く。
すると、ロボットがそのサイト内を検索し、重要そうな単語を拾う。
その単語でのみ検索可。
1と2はそんなに変わるもんでもないけど、3はメンドクサイな。
当然そこで値段も変わってくるわけだが。
ぶっちゃけ、依頼する場所によって値段は大幅に変わるだろうけど、
まともなとこに依頼するとして、1とか2ならデザイン抜きで150万。
3ならその倍くらいかと。
保守は当然別料金。
- 46 :
- >>45
簡単に言うとYomi-searchを軽くして
データが増えても検索したら1秒ぐらいで表示されるものですかね。
ランキングとかはいらなくて。
で、拡張子が.htmlというのはとりあえずGoogleなどの
検索エンジンで各検索結果のページがロボットに拾われるようにしたいんです。
だから表示画面は.htmlがいいわけで。
.htaccessを使うと出来ると言うのは知らなかったです。
で、上記のようなものがフリーであればその制作者に
かけよって権利を譲っていただく交渉しようと考えていたし
無ければ独自で制作依頼をしたいなっと思っていました。
コスト的に結構、かかるんですね。参考にします。ありがとうございました。
- 47 :
- >>46
おいおい、検索の結果なんて他のロボットは拾わないだろ。
検索のボットが自動で検索する訳じゃあるまいし。
例えば「2ch cgi」で検索した結果をリンクとして貼ってあったとして
それを拾ってもらいたいなら*.phpにすればいい。
Googleなら拡張子phpは拾ってくれるから。
後ろに引数が付いてる場合はどうかは知らんが。
- 48 :
- なんか>>42はいろいろ勘違いしてそうだな
- 49 :
- ↓こんなんでいいか?
ttp://cgi.cyborg.ne.jp/~hironori/cgi-bin/
- 50 :
- 2003年9月20日 全文検索ソフト G-Search Personal - ベクターソフトニュース - http://www.vector.co.jp/magazine/softnews/030917/n0309174.html
全文検索ソフト G-Search Personal
ハードディスク内のWord/Excel/PowerPoint/TXT/HTML/PDFファイルを全文検索するソフト
--------------------------------------------------------------------------------
● 全文検索ソフト G-Search Personal Ver.1.12
作 者 : ゆうき さん
対応OS : Windows XP/2000/98/95/NT
種 別 : フリーソフト
作者のホームページ : http://www36.tok2.com/home/yuuki05/
■Windows XP/2000/98/95/NT ■フリーソフト 検索キーワードが含まれているファイルがリストアップされる
ハードディスクなどに保存されている、Word/Excel/PowerPointファイル、テキストファイル、HTMLファイル、Acrobat PDFファイルを対象に全文検索を行えるソフト。
検索対象はドライブ/フォルダ単位で指定する。ローカルディスクのほか、ネットワークドライブやCD-ROMドライブなども検索対象に含めることができる。
指定したフォルダより下の階層のフォルダは自動的に検索対象となる。
検索するファイル形式はユーザが選択することが可能。
初期設定ではDOC/XLS/PDFファイルが検索対象となっているが、PPT/TXT/HTML(HTM)を追加することも可能で、指定形式のファイルのみを対象に検索できる。
- 51 :
- >>50
板違い
- 52 :
- すみません、、激しく勘違いしていました。。
基本的にYomi-searchで望むことは大体出来ました。
あとは、Yomi-Searchより高速で処理の速い+αの
検索エンジンを作れないものですかね?
単純にYomi-SearchのPHP版を使用したらいいというわけではないし。
- 53 :
- 今の君には無理だから勉強しなさいな
- 54 :
- >>53
いや、自分で作るのではないです。外注するのです。
その場合のコスト見積もりを29から聞いているわけで...
- 55 :
- 外注ならそういう仕様で見積もり依頼すりゃいいじゃないの。
- 56 :
- 引越しじゃないけど、>>55の言う通り複数の業者に見積もり依頼すればいいよ。
見積もりもできないようなとこには発注しない。
不況で買い手市場(多分)なはずだから、値切ったりもできるかもよw
- 57 :
- コンペ開始↓
とりあえず50万でどうさ?
- 58 :
- 検索エンジン作成に関してのスレは
こちらにまとめましょう。
検索エンジンをつくりたい
http://pc2.2ch.net/test/read.cgi/php/1009030584/l50
- 59 :
- サーチエンジン
http://umasql.netkeiba.com/db/horse.php?hid=2000101537
- 60 :
- こんなスレが一年もあるとは・・・しかも3つ上の日付が一年以上前だ
- 61 :
- age
- 62 :
- まだあった、ここ・・・
とりあえず、巷で使われてる検索エンジンでも分類してみてはどう?
中小でも独自エンジンで使い勝手の良さそうなエンジンがある。
そこのコンタクト取るのが一番早い。
得てして非公開だがね
- 63 :
- 漏れも手伝ってやるよっ!
まずは高速手動型エンジンね
http://www.8823.net/
- 64 :
- 補足
ここはエンジン内部公開してるようですねえ
http://www.8823.net/new/koukai.html
- 65 :
- 形態素解析・n-c・フルサーチ
まじめに作ってみたいなぁ・・・
- 66 :
- 皆さんはどこで運営、作成していますか?
- 67 :
- 皆さんはどこで運営、作成していますか?
- 68 :
- 第2回検索エンジンアンケート実施中!
http://hp6.0zero.jp/anq/anq.php?uid=1696&dir=84
- 69 :
- ロボット型検索エンジン作ればいんじゃん
- 70 :
- >>1
そんなん作ったらあっと言う間にアカウント消されるよ
一応作り方は
sql+php
----------------------はい終わり--------------------------
- 71 :
- 検索エンジンは鯖に負担かかりますからねw
- 72 :
- グーグルのを借りれば?
ライブドア見たいに
- 73 :
- 費用はどのくらいかかるんですかね?
- 74 :
- 無料だよ
- 75 :
- 単に使いたいだけなのか、作る事に興味があるのか分からんな。
- 76 :
- 人口無能検索エンジンを作ります。
全然キーワードとマッチしないサイトを拾い上げるロボット型検索エンジン
- 77 :
- かつてない検索エンジンをつくらないと、人気がでないよ
- 78 :
- 画像検索創ってよ、あったようなきもするけど
- 79 :
- ヒント:グーグル
- 80 :
- 画像で検索ってどこに載ってる?ググル
- 81 :
- 私は13歳の中1です。
Naku’s Japanの設立者です。
検索エンジンの作り方おしえてください。
できればロボット型のほうを・・・・・
- 82 :
- 昔、中学生が作ったロボット型サーチエンジンがあったぞ
(いまもあるのかもしれんが)
namazu使ってたんだったけか
ロボットの走らせ方は検索すれば出てくるだろ
まあがんばれやw
- 83 :
- 2ちゃんねらーはねこだいすき
http://makimo.to/cgi-bin/cache/index.cgi?img=http://www.uploda.org/uporg666494.jpg
- 84 :
- ちゅうがくせいでもできる ぶろぐ あふぃりえいと
- 85 :
- 誰か教えてください ある会社に勤めていますが
そこでPC4台を使って仕事の資料ホームページを作成しました
その中に検索システムを作成したいのですが
外部ネットワークに繋ぐのは不可能なんです
(会社の情報もあるのでPC4台内だけで動かしたい)
PC4台はハブでつながっています 可能なのか不可能なのか
わかる方教えてください もし出来るならどのような言語から覚えたら良いですか?
HTMLくらいしかわかりません お願いします
- 86 :
- >>85
可能
習得が早いphpでもやっときゃおk
- 87 :
- >>85
こっから探せ
http://www.kusastro.kyoto-u.ac.jp/~baba/wais/other-system.html#free_jp
- 88 :
- なんだ?ここ
- 89 :
- あのね ここはね 2ちゃんねるっていってね
そこそこの規模の掲示板なんだよ
- 90 :08/11/14
- http://www.seo-ch.com/raku-search
TOP カテ一覧 スレ一覧 削除依頼 ▲
・ 次のスレ
゚。o SOAP o。゚
JSP/Servletで構築されたサイト
JavaScript コメントの謎
【仕様】荒らし対策掲示板【実装】