2013年17Web制作103: 【Robots】Googleアーカイブが嫌い【NoArchive】 (969) TOP カテ一覧 スレ一覧 2ch元 削除依頼
こんな携帯サイトあったらいいな♪ (111)
Dreamweaver CS3 (809)
今時CSSを別ファイルに分離している奴いるの?w (206)
Web制作者が愚痴るスレ 15クレーム目 (224)
Yahoo!アクセス解析 (365)
【ラクできず】楽天RMS【儲からないシステム】 (365)

【Robots】Googleアーカイブが嫌い【NoArchive】


1 :02/07/08 〜 最終レス :2013/08/14
Googleにアーカイブされるのが嫌で
<meta name="Robots" content="NoArchive">
を書いている人いる?

2 :
<meta name="Robots" content="NONE">

3 :
<meta name=">>1" content="itteyoshi">

4 :
robots.txt 置いてみたら?
User-agent: *
Disallow: /

5 :
http://kaba.2ch.net/test/read.cgi/saku/1025132313/35

6 :
>2&4
そうすると検索にひっかからくなるような

7 :

グーグルのキャッシュって、著者に無断で複製を作っているわけだよねぇ。
著作権法的には問題ないのか?

8 :
>>5
現行のスレッド?どれだよ(w
何か最近、意気揚々と手当たり次第に削除依頼を出す
初心者厨房が多いね。藁

9 :
GoogleやWeb Archiveを著作権侵害で訴える人はいないのかな?
訴訟大国アメリカあたりで係争されていてもよさそうだが

10 :
Googleとか卑怯だよな。
ほとんど無断リンクばっかの検索エンジンみたいな。

11 :
いや、無断リンクはいいんだけど・・・

12 :
content属性の値をnoarchiveにすると、htmlチェッカから怒られるんだけどー
??

13 :
無断リンクが駄目な世の中になったら
ネットは終わりだ。

14 :
無断リンクは何の問題もないだろうが
キャッシュ(アーカイブ)はどうだろう?
無断で複製を作る点において違法性が高そうだが

15 :
>>10
無断リンクが嫌ならローカルでやれ

16 :
さぁ、どこまで許せる?
 1. パーソナルコンピュータに残り、個個人が再度閲覧するかもしれないキャッシュ。
 2. プロキシサーバに残り、それを介した人に閲覧されるかもしれないキャッシュ。
 3. Google に残り、検索結果に興味を持った人が閲覧するかもしれないキャッシュ。
どれも利用者に便宜をはかるためのもの。そもそも閲覧=ファイルのコピー。
元のデータのありかを明示しているなら構わないと思う。
もちろん、自分の著作物は自分でコントロールしたいという気持ちもわかるのですが.
というわけで、Googleのキャッシュを嫌う方はなぜそう思うのかお伺いたいしたい。
自分は逆にありがたいと思っているので(笑)。

17 :
個人用のコンピュータに残ったキャッシュは
個人的な用途で使う分にはOK。

18 :
大嫌い

19 :
キャッシュのスレでいいな?
無断リンクの話は↓ですれ
http://pc.2ch.net/test/read.cgi/hp/1025447626/l50
混同すると話がかみ合わん

20 :
>>15
やだ。
他の選択を選ぶからいい。

21 :
>>15
( ゚д゚)ハァ?

22 :
>>13-15
R。知ったかぶりのゴミ虫。

23 :

この中にGoogleキャッシュの世話になったことの無い奴なんて居ない

24 :
お世話になってます( ´д`)ハァハァ...

25 :
嫌われてても利用されまくるGoogleタン・・(・∀・)モエェ!!

26 :
自分のサイトはグーグルキャッシュさせない

27 :
Web Archiveつぶさない?
マジムカツクンダケド…

28 :
>>27
なんで?

29 :
サァ?

30 :
>>29
おいおい、しっかりしろよ。

31 :
>>20-22
自作自演うざい

32 :
Web Archiveは古い時期に削除されたページとかも残ってて便利。
33 :あぼーん:あぼーん
あぼーん

34 :
;゚д゚) <>>1は「ウェブサイト=私のお家・聖域」だと思ってるらしいよ…


               Σ(゚Д゚;エーッ!

35 :
>>7
Googleにしてもarchive.orgにしても、
正当な権利者からの要請による削除には応じてるし、
robots.txtにも対応しているから、訴訟沙汰にはなりようがない。

それから、アメリカの著作権法だと、
原著作者の許諾を得ていない著作物について、
第三者が自由に利用してよいことになっているから、
原作者の許可を得ずにネット上で公開されているパロディ物について、
キャッシュで公開されても、
そのサイトの製作者は原著作者の許諾をえない限り法的に対抗できない。

36 :
>>35
アメリカの著作権法が適用されるのってどの場合?

37 :
まあ出典が記述されていれば引用となるわけではないのか

38 :
<meta name="Robots" content="NoArchive">のサイトはちょっと不便だよな。
Googleの検索結果の画面で、どいう文脈でその単語が出てるか判らないのが痛い。
まぁそういうところにGoogleからは逝く機会は、、、無。

39 :
>>36
Googleやarchive.orgが訴えられた場合。

40 :
>>34みたいな煽りは放っておいて(んな事思ってる馬鹿いるわけないじゃん!)
「嫌い」と言う理由がマジで知りたいのだけれども。
今まで>>1から>>37までその理由書いた人いないでそ?
煽らないしw、価値観が違うんだろうから論破しようとも試みない。
ただ、どうしてそう思うのか教えて欲しい。

最新の情報が反映されないのがイヤだから?
Googleは検索サイトなんだから、
閲覧する人はGoogleがキャッシュした時のその情報を求めているわけで、
これを契機にあなたのサイトに興味を持ってもらえるかもしれない。
だいたい、キャッシュを見て最新の情報と勘違いする人はいないよ。
能動的に「キャッシュ」をクリックして表示された結果なんだから。

41 :
>正当な権利者からの要請による削除には応じてる
MXの場合は?警察来てから削除すればいいのか?

42 :
>>41
なんでここでMXが出てくるんだ?

43 :
>>31
お前う材。

44 :
> だいたい、キャッシュを見て最新の情報と勘違いする人はいないよ。
キャッシュの概念が一般の人にも普及してるとは思えないが。
漏れは「嫌い」派じゃないけど、世間の論理って基本的にアフォが基準だし。

45 :
>>40
誤った情報をのっけた後、訂正してもずーっと
自分の誤りがのってるのが嫌だから。
のっけられても削除を要請することもできるけど、
即座に削除されるわけじゃないし。
さらに、GoogleやWBのように、自分が知っている
公開倉庫なら削除依頼で事後的な処置もできるけど、
ウェブ上に他に公開倉庫がないとはいいきれないから、
全ての倉庫に削除依頼できるわけではない。
よって、robots.txtやmeta要素で未然に倉庫化を防ぐのが吉。

46 :
>>45
いくら誤った情報を訂正したとしても
利用者がその訂正を見なければ、与えてしまった情報は更新されない。
情報を流すって、そういうことだ。

47 :
>>46
そんなことどーでもいいんだよ。
自分のチョンボがずーっと(少なくとも削除依頼が通るまで)
晒されるのが嫌なだけ。w
WBやGoogleにアーカイブされてない限り、訂正しちゃえば
チョンボの決定的な証拠はなくなるじゃん。
一方、アーカイブされてたら訂正しても、チョンボは残るわけで。

48 :
だったら公開するな
オンライン上に何か情報を流すのだったら多少のリスクは覚悟しろ

49 :
>>48
馬鹿かお前何様つもりだ?偉そうに。
R。

50 :
>>48
かっこわりー。
だったら公開するな(フッ ツギノヒトコトデキメテヤルゼ。
オンライン上に何か情報を流すのだったら多少のリスクは覚悟しろ(キッ キマッター!

51 :
よほど悔しかったんかな、この人
顔、真っ赤にしすぎ

52 :
>>48
だから、リスクを軽減するための
robots.txt/meta要素なんだが?w

53 :
<meta name="Robots" content="NoArchive">のタグを書くと、グーグルのキャッシュに残らないの?
検索にも引っかからなくならない?

54 :
>>53
前半は正解。
Googleのキャッシュに残らなくなる。
none等ではないので、検索対象から外されることはない。

55 :
>54
ありがと
>48
行動にリスクが伴うのは当然だけど、回避可能なリスクを甘受するのは愚か
最近問題の個人情報漏洩にも同じ事がいえる
この件に関して、その論は的外れだと思う

56 :
>>51
ごめん。面白いと思ったんだ。
このとおりです。
許してください。
>>48
あほ。

57 :
>>55
どういたまして。
Googleで検索をして、「キャッシュ」が表示されない
ページの多くは、robot.txtやmeta要素でキャッシュ対策を
しているところみたいだね。

58 :
>54
noneだけではInfoSeekにキャッシュされる罠。

59 :
noarchiveじゃだめなの?

60 :
>>59
HTML4.01/XHTMLなら大文字・小文字どちらでもいいはずだ。

61 :
googleは大好きですが、
かなり古い削除したページがえんえんgoogleで残ってしまい、
そこをキャッシュとして読んで飛んできた人がちょっとした誤解をした体験があります。
テーマの方向性をがらりとかえた後だったので、客にもこちらにも迷惑なことでした。
それを防ぐにはgoogleの更新を早くしてもらうか、削除依頼をするか・・
どちらもちょっと。

62 :
削除が通るまで何日くらいかかるの?

63 :
>>55
だから48はネット上にアップするからには責任持てって言ってんだろ。
55の言いたいことと食い違いがあるとは思えんぞ。

64 :
>>63
48の書いた事は普通にみんな理解してると思うよ。
あの書き方と答え方は間違いなくおかしいと思う。
こんな事を書くつもりじゃなかったのにな、、、。

65 :
>>45
自分のミスを隠したいからキャッシュ反対ですか。

66 :
そもそもキャッシュって変更されたり削除されたりする前のページを取っておくために
あるんでは

67 :
>>65
なんかそういうのってあると
情報が変に伝わっちゃう場合とかあるでしょ。
そういう自分が恥ずかしいからとかじゃないと思う。

68 :
キャッシュはキャッシュと書いてあるけど・・・

69 :
まぁボロボロボロボロと誤りだらけの情報を流した挙句に
自分の情報がものすごい重要なのだと自意識過剰に浸ってる人間は好きにしろって感じかなw

70 :
>>67
それは無知や勘違いする人が悪いだけであって、キャッシュという観念を
否定する理由にはならない。
法律違反をして、「そんな法律知らなかった」と言っても言い訳にはならない。

71 :
>>70
たとえが変だしそれに理由になるよ。
だって、誤った情報が流れると困るでしょ?
作者も閲覧者も。
>>61のような事があっても否定する理由にはならないの?

72 :
【衝撃!】消し去ったはずのWebページga保管する
http://pc.2ch.net/test/read.cgi/hp/1004183621/-100
26 :Name_Not_Found :01/10/28 00:47 ID:YH9hBtu1
一度は公にしたものなんだから、男らしく自分の過去を背負ってゆきませう。
31 :Name_Not_Found :01/10/28 01:10 ID:YH9hBtu1
間違った記述に気づいても決して削除せず、<del>の抹消線で済ませるのが男子の心意気ぢゃ。

73 :
ごめんなさい、私は球と棒が付いてないんです

74 :
私はどうなるの?

75 :
http://pc.2ch.net/test/read.cgi/hp/1004183621/26-33
31 :Name_Not_Found :01/10/28 01:10 ID:YH9hBtu1
>>27-28
女々しいぞ。
間違った記述に気づいても決して削除せず、<del>の抹消線で済ませるのが男子の心意気ぢゃ。
婦女子は去れ。
33 :Name_Not_Found :01/10/28 06:00 ID:zmi01GR/
>28
それが痛いサイトをうぷした人間の背負うべき十字架だ。
これを機に無益な情報発信をやめてくれる厨房が増えると助かるな。

76 :
たしかに「間違ってたら消せばいいや」っていう考え方でサイトを作るのはよくない

77 :
私もRしかありません。

78 :
>>77
臭そ〜。

79 :
これこれ、性別に拘泥するでない。
女性にも良い意味での「男らしさ」を求めていいのでは?
いや、女々しい女性なんて「女らしさ」からも程遠いものなのだ。

80 :
>>121
俺もCSSファイルが243行あったよ

81 :
誤爆

82 :
go,gobakuda!

83 :
>>982
俺はスクリプトの見本を絶対にKENTにはしていないが?

84 :
誤爆

85 :
>>79
sineyokasu

86 :
>>85
女々しいぞ。
腐女子は去れ。

87 :
私のサイトは1000hit/1dayですが何か?

88 :
誤爆

89 :
>>71
否定する理由にならないというか、結果として削除してもらえなかったり
削除まで時間がかかったりしたとしても文句は言えないって感じ。


90 :
>>45
過去のあやまちに責任を持つ覚悟が必要です。
訂正したからって口ぬぐって済ませようってのはちょっとナ……。

91 :
やっぱりRは臭いな

92 :
>>91
嗅、嗅いだのか...。臭ッ...。

93 :
>>67 >>71 >>73はニセモノだね。
なんでそんなことするんだろ?

94 :
IDが変わる前にトリップつけとこ

95 :
何故そこまでコテハンに執着するかがわからん。
って、言動見てりゃ解るか。

96 :
>>76
それは貴方の価値観として尊重するけど、
俺はそうは思わない。
誤った情報を発信することで恥をかくのが
嫌だから。これって人間として自然なこと
だと思う。
それに>>61のような事例もある。
世の中には色んな価値観の人がいるのだから
俺様ルールを押し付けるのはいかがなものか。
価値観の違いがあるからこそ、robots.txt/meta要素による
キャッシュ規制が準備されてるわけだから。
>>63
軽減できるリスクがあるのなら、軽減してもいいんじゃないか?
それに48は「リスク」と書いているのであって、
「責任」を論じているわけではない。
話を摩り替えないように。

97 :
うお、各レスを始めた!
じ、自治か、自治が始まるのかッ!

98 :
なんか誤爆が多いね。わざと?

99 :
TBCやらノッツェやらの漏洩データがグーグルキャッシュされてたら
被害者としては嫌かと。
漏れはいいけど。(藁)

100 :
100

101 :
>>45
> 誤った情報をのっけた後、訂正してもずーっと
> 自分の誤りがのってるのが嫌だから。

なるほどね。そういう考え方は俺にはなかったわ。
キャッシュであれ何であれ、正しい/間違っているの取捨選択は、
閲覧した人が行うはずだと思っていたもので。
それが自己責任ワールド、インターネット、と。
でも影響力が大きくなってくるとそこまで気をつかうのかもね。
俺程度だとてきとうに修正して放っぽっとくだけだ(駄目じゃねえか)。

キャッシュをさせないというのは、ユーザの利便と交換条件になるわけだけど、
そうしなけばならないほど、たびたび大きい間違いってするものかな?
逆に文書の信頼性を貶める、なーんてことにならないといいけど…。

>>61 について。
キャッシュされた文書はその独立した文書として完結しているので、
その人には実際に役に立ったんでしょうよ。
役立った物が削除されてしまったのは残念な限りだけれども。

102 :
>>101
そんなに大げさなもんでもないんよ。
自分が恥をかきたくないだけ。w
たとえば、2chで誤字脱字や小矛盾をすると
それ以後、延々に煽られたりするでしょ?
そういうのが嫌だなって。
もちろん、誤った情報が他人を害する場合、
取り除かないとという義務感もないわけでは
ないけど、たいした情報を出してるわけでも
ないしね。

103 :
このスレには商業サイトを作る香具師はいないのか?
商業系のサイトのクライアントは、利用者に、過去の商品価格、過去の商品内容を
知られたくない場合が多い。
「このモールは毎年9月に一割引セールをしてるな。買い控えよう。」
「このジムは毎月入会金無料にしてるな。だったら急ぐ必要ないか。」
「セールと銘打ってるけど、ほとんど安くなってないじゃん。」
こんな分析をされたら、営業利益がダウンしてしまう。
商品の購入者からしてみれば便利なのかもしれないけれども、逆に運営者としては
知られたくないのだ。
そのようなサイトを運営する側としては、キャッシュ&アーカイブ対策は
死活問題なのです。

104 :
そもそも、WWW自体が金儲けには向いていない。

105 :
>104
それはない。ウェブの対費用宣伝効は大きい。

106 :
>>105
その結果バナー広告やSPAMメールが氾濫

107 :
全然話が違う方向に進んでるんだけど?
わざと?

108 :
ブヒブヒ

109 :
>>1>>1>>1
>>1>>1>>1
>>1>>1>>1
>>1>>1>>1
>>1>>1>>1
>>1>>1>>1
>>1>>1>>1
>>1>>1>>1
>>1>>1>>1
>>1>>1>>1
>>1>>1>>1
>>1>>1>>1
>>1>>1>>1
>>1>>1>>1
>>1>>1>>1
>>1>>1>>1
>>1>>1>>1
>>1>>1>>1
>>1>>1>>1
>>1>>1>>1
>>1>>1>>1
>>1>>1>>1
>>1>>1>>1
>>1>>1>>1

110 :
>>103
商業系の場合、戦略的に必要なわけね。
確かに俺は消費者側に立ったら、過去の比較のために
キャッシュ利用しちゃうかもな。w

111 :
グーグル関係者が荒らしてます!!

112 :
>>111
とゆーか、自分と異なる価値観を認められない
痛い中学生かと。w

113 :
>>112
>自分と異なる価値観を認められない
>痛い中学生
自己紹介?

114 :
釣れた釣れた。w

115 :
こんな裏技があったとは
早速使わせて頂きます

116 :
>>115
表技だよ。
Googleのヘルプにちゃーんと書いてある。
http://www.google.com/intl/ja_ALL/remove.html#uncache

117 :
なんか痛い45が居るな…
こいつの目標はこの<meta>表記を浸透させる事なのか?
なんか意図が解らん。

118 :
>>45の次のレス予想
>>117
釣れた釣れた。w」

119 :
粘着うざ

120 :
>>117-118
俺の意図は40への回答およびGoogleキャッシュ
回避派としての論を展開すること。
どこでmetaの表記法を浸透させようと
しているのかね?
この表記は当然の知識であり、浸透の必要など
ないと思っていたが?
んで、お前の意図は何?
荒らし?粘着?w

121 :
46=48=109=117=118=痛い厨房=グーグル擁護

122 :
>>45>>90に対して返答はしないの?
一度は公にしたものなんだから、
「過去のあやまちに責任を持つ覚悟が必要です」よ。

123 :
>>121
そーゆーレッテル貼りはやめよーよ。
Googleキャッシュに好意的解釈をする人でも
論理を展開できる人はいるんだから。
とゆーか、痛い中学生と指摘されたのが
よっぽど悔しかったらしいね、粘着は。w
反対意見があるなら堂々と書けばいいのに。

124 :
>>103
>「セールと銘打ってるけど、ほとんど安くなってないじゃん。」
そういうのを誇大広告という。ウェブとかキャッシュとかいう以前の問題。

125 :
>>123
君も充分レッテル貼りをしている

126 :
ていうかお前ら理論が逆
削除されたり閉鎖されたりしたページが保存してあるからやだ?
削除されたり閉鎖されたりするページがあるからキャッシュが役に立つんだ

127 :
>>122
責任って?抽象的すぎるんだが。
101も書いてるけど、Webの情報は利用者の
危険において解釈すべきもの。
それを訂正したところで、責任回避にはならないだろ?

128 :
その程度の誇大広告は合法。
つかどこもやってる。
そんくらいで誇大広告とのたまうガキは
小学生ですか?

129 :
誇大広告を合法と主張する連中が、舌の根も乾かぬうちにキャッシュは違法と
言い出すのだから、2chというのは面白いところだ。

130 :
>>127
誤りを訂正したからって責任を取ったことにもなりませんね。
過去に誤った情報を流した責任は、それはそれとして残るのです。
キャッシュ削除で過去に頬かむりするつもりなら感心しないナ。

131 :
>>125
え?荒らしを痛い中学生と客観的に表現する
ことがレッテルを貼ることになるの?
俺が>>121に対して書いたのは、
「痛い厨房=グーグル擁護」という部分だよ。
つまり、特定の行為者=特定の思想という
レッテル貼りに苦言しているのであって、
荒らし行為を非難することとはまったく
同列ではないんだけど、何か?
気に障ったんなら、上っ面で謝るよ。w

132 :
>>131
反対意見を「荒らし」と言いきるところが「気に障った」んだよ。

133 :
>>130
>誤りを訂正したからって責任を取ったことにもなりませんね
ここの「責任」を定義した上で
貴方自身が考える責任を論じてくれないと
話にならないと思うんだが。
確かに重大な違法行為への責任なら、
取ったことにはならんよ。
過去において名誉毀損があったので抗議があって
削除したとしても、刑事的・民事的な違法性の
追及には耐えられないだろう。
しかし、「at your own risk」を明言している
サイト上で、些細な誤字があったとして、それを
訂正する行為が、なぜ責任を放棄したことになる?

134 :
>>108-109が反対意見?
俺には荒らしにしか見えないが。
大丈夫ですか?w

135 :
右クリック禁止厨房
ディープリンク禁止厨房
そして、
NOARCHIVE厨房

やれやれ…

136 :
>>135
右クリック禁止厨房
ディープリンク禁止厨房
そして、
NOARCHIVE反対厨房
やれやれ…

ともいえるわけだね。
まあ、価値観が違うだけだから、
俺はそれが正しいとは言わないけど。w

137 :
135は厨房

138 :
>>134
>>117-118も荒らしか?
そもそも>>108-109程度でいちいち「荒らし」なんて騒いでいたら、2chで
会話できないよ。

139 :
俺には、>>114の方がよっぽど煽りに見える

140 :
>>138
それに一々突っかかる貴方も、2chムキではないね

141 :
>訂正する行為が、なぜ責任を放棄したことになる?
責任放棄なんて言ってませんが。
責任を取ったことにはならない、と申しました。
あなたの態度が、自分を現在の自分でだけ評価してくれって甘えた態度に見えたので、
一言した次第。もちろん、誤ったりした過去をも含めて自分ってもんがあるわけです。
どうもWebは「お前は永遠の現在に過ぎない」(テレビ論の古典の題から)ってとこが
ありますね。過去の蓄積を生かせるのがコンピューターの強味のはずなんですが。

142 :
125=108=109

143 :
>>141
>過去の蓄積を生かせるのがコンピューターの強味のはずなんですが
それはケースバイケースでは?
過去の蓄積を消せるのがコンピュータの強みともいえるね。

144 :
>>142
俺も45も、そういうのを「レッテル貼り」と言っている。
というか、本当の荒らしは「○○=○○」系のレスをしている君ではないのか。

145 :
>>143
過去の蓄積を無にしてしまってナゼ強味になるのか、理解を絶するナ。
過去が失敗ばかりの人なのかな。
ところで「自分を現在の自分でだけ評価してくれって甘えた態度」については
是認するのかい?

146 :
>>145
過去が失敗ばかりでなく、過去の誤りが
あったら消したいだけ。
正しい過去の情報は残しておいていいんだよ。
(あくまでも俺の価値観だがな)
貴方の話はどうも極論な気がするが。
>「自分を現在の自分でだけ評価してくれって甘えた態度」
この定義自体がおかしい。
なぜ現在の自分(最新の情報)で勝負するのが
甘えた態度になるの?
説明してくれ。

147 :
誇大広告にも程度があるの。
合法な誇大広告はどこでもやってるの。
ヨドバシでもやってるでしょ。
競合店と1円しか違わないのに「他店より大安値!!」とか。

148 :
GOOGLEにキャッシュ置いてる奴は厨房

149 :
>>148
じゃあ世の中の九割以上は厨房ですね

150 :
>149
何をいまさら
和塩の95%は厨房頁だろ

151 :
>>146
悪いけど、わかんない奴に説明してやるほど親切ではないんだ。
最近の人はコマンドZがどこでも通用すると思ってるのかな。
ま、「お前は永遠の現在に過ぎない」――この言葉でも噛みしめてね。
「過去の誤り」は訂正することはできても
誤りをした過去そのものは「消す」ことはできません。

152 :
>>151
説明じゃなくて論理と定義を展開させて
ほしいのだが?
もしかしてそんなものなくして
書いてたんじゃあるまいな。
>「過去の誤り」は訂正することはできても
>誤りをした過去そのものは「消す」ことはできません
んなことはわかっとる。
でも、「過去の誤り」は訂正することができるのなら
それだけはやっておきたいだけ。
別に押し付けてるわけじゃないから。

153 :
151=粘着親父

154 :
なぜ情報を最新版に保つことが「甘え」なのですか?
122の主観の押付けでは?

155 :
151は粘着した過去を消すことができません。

156 :
>>154
いちいち君達につきあって最新版をフォローしなきゃいけないのか?
それを他人に求めるのは過大な要求(=甘え)だよ。
過去に一度見たきりのコンテンツで評価されても、
それが確かに自分が公開したものであった以上、仕方がない。

157 :
キャッシュされると過去を訂正できなくなって困るとか言うくらいなら、
うpする前にもっと慎重になれよ、とは思うな。
それが大切な時間を使ってページを見てくれているかもしれない閲覧者と、
その情報を必要としているかもしれない人に対する責任だ罠。

158 :
IDを隠す椰子が過去を説いても説得力ないな

159 :
>>158
ところでWeb板って、いつからsageでIDが隠されることになったの?

160 :
>>157
誰でも誤りがないか慎重に見直して
アップしていると思うが?
それでも、誤字脱字・思い込みは
誰でもあるんだから、それを非難するのは
筋違い。
>>103みたいな事例もあるのだから、
貴方の価値観で定義される「責任」で
どーこー言っても仕方ないじゃん。

161 :
>>160
誤字脱字は誰しもある。
それに気づいたら訂正するがよいさ。(誰もそれを非難しとらん)
だが訂正前の自分を恥とするあまり、
隠して無かったことにしようって根性がね……。

162 :
>>161
貴方がその根性が嫌いなら、
貴方がキャッシュ対策を
しておけばいいだけ。
俺はキャッシュがない方が
都合がいいから、そうしてるだけ。
価値観の相違だよ。

163 :
sageは反論に自信のない証拠
キャッシュ肯定派は一人何役?

164 :
「価値観の相違」って便利な遁辞だよね。>>162
ageる程の話題かよ。>>163

165 :
ところで、アーカイブ賛成派は、リファラ隠し目的のime.nuをどう思う?
あれも根性なしか?

166 :
>>165
ime.nuウザイ@web製作板
http://pc.2ch.net/test/read.cgi/hp/1014317559/l50

167 :
>>164
便利も何も、価値観に拠っているのが
事実だからしょうがないじゃん。
価値観を超えて話そうとすれば
用語の定義を明らかにする必要があるが、
122が逃げるんだもん。
それとさ、下げても意味ないよ。
俺があげるから。w

168 :
は?>>163 漏れ何処でもsage書きだから噛みつかんでよw
そういや昔、どっかのスレで「日記を書き換えたい」っつー書き込みがあったな。
変えるのは本人の勝手だが、Archiveに突っかるとしたらお門違いだな。

169 :
>>165
うちにもたまにinu.meからアクセスがあるが、
かなりいやんな感じ。
でも、いざとなれば、ime.nuからのアクセスのみ
拒否すればいいから、便利ではある。
っつっても、refererでアクセス拒否なんて
子供だましだがな。

170 :
いつも最新のボクを見て、ボクのいいとこだけ見て――ってか。
「認めたくないものだな、自分の若さ故のあやまちを。」

171 :
170=168=粘着親父

172 :
>>171
その手のレス秋田よ

173 :
>>170
当たり前だろ。w

174 :
>>160
103あたりは商人と消費者の駆け引きの問題でしょ。
商売人が“キャッシュのせいで……”とかこぼしてる時点で終わってるよ。
>>163
別に隠す気なんかないよ。sageたいだけ。
つか、お前みんながキャッシュ否定派だと思ってるの? あほか。
大半はキャッシュどーでもいい派だよw

175 :
ああ、今一番ダサい騙り

176 :
>>キャッシュ賛成派
都道府県によってはもう夏休みなんじゃないか。


177 :
>大半はキャッシュどーでもいい派だよw
まったくもってそれだ。

178 :
>>173
「当り前」なのかよ……。もはや言葉も無いな。

179 :
>>174
キャッシュへの対策も消費者との駆け引きを有利に進めるための方法。
103は間違ってない。

180 :
>>178
君は過去の誤りを認めたいわけ?
そーゆー優等生的な意見もあっていいと思うよ。
俺にはわからんけど。

181 :
あからさまにキャッシュ隠して値段の推移を誤魔化してるところは利用しない事。

182 :
>>179間違っているいないつーか、当たり前ジャン。

183 :
あげ

184 :
<META name="robots" content="noindex,nofollow,noarchive">
<META HTTP-EQUIV="Pragma" CONTENT="no-cache">
いいじゃん、個人HPなんだからさ。
やるもやらぬもアナタ次第よん(w

185 :
>>179
そうだね。間違ってるとは思ってないよ。

186 :
求められて〜♪
捨てられて〜♪
もーどぉにでもしてぇ〜♪

187 :
>184
自分はnoarchiveだけ
かといって他の値を追加したい人を否定はしない

188 :
俺もcontent="noarchive"だな。
つーか、content="noindex,nofollow"とだけ書けば
アーカイブされることはないんじゃないの?
違ったらゴメンね。

189 :
私も、キャッシュを隠す奴が
「間違ってるとは思ってない」(>>185)し、
それを「否定はしない」(>>187)。
ただ、信用できないだけだ。

190 :
つまり、検索すらされないのだから、
アーカイブされないのでは?と思ってみた。

191 :
どうせ上がるのに下げでIDを隠すお前は
もっと信用できないな

192 :
>>191
イマドキ複数IPアドレスくれるISPなんて普通にあるだから
ID晒したって何の意味もなくない?
つか、何でそこまでIDにこだわる? 心の病気か??

193 :
ID隠しは間違いでも否定対象でもないが、複数プレーだと疑うだけだ

194 :
むしろ、矢鱈とID晒して自作自演でないことを強調する奴の方があやしい

195 :
ID以外のことで主張できるものがない方って可哀想ですわトホホ...

196 :
あげ

197 :
あげんな

198 :
w

199 :
>>198
てめぇ!・・・

200 :
200

201 :
>>193
ただ、半分荒れはじめているスレをいちいち上げるのはドウか・・・
俺はキャッシュ許容派
>>66,>>126が正解。
キャッシュは欲しい情報が書いてあるらしいページが無くなってた場合のためにある
別に君らの間違いを永遠に晒そうとしてるわけではない


202 :
201=66=126

203 :
そうか、いわゆる被害妄想が強いだけか?

204 :
キャッシュはあってもいいが、ページの作成者がコントロールできるべき。
削除を依頼しても放置される現状では、結果的に間違いを半永久的に晒していることには変わりない。
したがって201は不正解。

205 :
>>204
削除を依頼すれば削除されるけど・・・?

206 :
>>202
面白いと思ってやってるのかもしれないけど、つまらないよ。

207 :
>205
そうとは限らないらしい
特にWay Backは

208 :
>>204
一度公開した以上、どこで保存されてるかわからない。
だからキャッシュ削除しても「半永久的に晒していることには変わりない」。
その覚悟がないなら公開するなってこった。(ループ)

209 :
>>206
図星つかれたらつまらないよね。。

210 :
>>209
なんだこいつ?

211 :

だからキャッシュを事前に防止することに意義がある。
それでもキャッシュされたら、それであきらめるだけだ。

212 :
>>204
最新のページで正しい情報になってれば別にいいんじゃねーの?

213 :
>>212
同感。だのに、そこまでキャッシュに神経質になるのは
よほど過去に後暗いことがあって隠してるんだなあ――って感じる。

214 :
>>212 よくない

215 :
>>213 心の病気?

216 :
>>214-215
被害妄想は心の病気です。

217 :
>>216 漏れが何の被害を妄想してるんですか?(´ー`)

218 :
否定派の理由
・著作権にかんする問題
・自分のサイトの古い情報が晒される
・間違った情報を訂正できない
容認派の理由
・見たいサイトが無くなってた時に便利
理由に関しては以上でOK?
両陣営の皆様方

219 :





220 :
閉鎖してネットと縁を切る。これ最強。

221 :
だ、誰かが、ボ、ボクの過去のあやまちを、キャッシュからほじくり出してきやがるんだ〜。

222 :
>>220 何もそこまで極端な

223 :
ごめん、間違った。>>217=214?、ね。

224 :
>>221 漏れは214=215であって216ではないですぽ

225 :
本人がが気にするほど周りは気にしてないよ。
自意識過剰も程々に〜。

226 :
>>225
うむ。
そんな事が理由でキャッシュが無くなることの方が問題

227 :
>>221 それを被害妄想といったら、DIR一覧を閲覧させないためのindex.htmlも妄想の産物?

228 :
>>227
それはセキュリティ上の問題もあるだろ

229 :
キャッシュはなくならんだろ。
危機感のない人間がゴロゴロいるんだから。
被害妄想もいい加減になさい!!

230 :
アーカイブされても平気なキミらは
ネットヲチ板で日常茶飯事となっている「アーカイブさらし」を
やられてぁぅぁぅしていればよろしい

231 :
>230そんな環境で生きてるちみに合掌

232 :
>>230
アーカイブされてイヤになるものなら初めから公開するなって。(ループ)

233 :
>>230
ネットヲッチ板で晒されるようなサイトじゃないので・・・

234 :
晒しの基準がオチ板っつー時点で(略

235 :
>>232
アーカイブされないように対策を施せばいいだけの話

236 :
たしかに、キャッシュ否定派がどんなサイトを作っているのか知りたいな

237 :
むしろキャッシュ肯定派を

238 :
>237いや、その意味わからんw

239 :
>>235
わかってないな。
アーカイブされたくない様なものをもともと公開するのがヘンだってこった。

240 :
http://lion.zero.ad.jp/inn/html/01/html072.html

241 :
>>239
アーカイブされないよう希望することをヘンだと決め付けるお前の考えがヘン

242 :
☠ฺⒻฺⓤฺⓒฺⓚฺⓎฺⓞฺⓤฺ☠ฺ

243 :
公開しつつもアーカイブを回避する方法があるのに、
それを行うと変だと言われても困ってしまうのだが。

244 :
cacheがプライバシー侵害とか害を及ぼす場合などの特例ならアーカイブ回避も理解できる。
それ以外はなんでそんなに避けたがるのか、理解できん。
よっぽど疚しい過去でもあるのか? 被害妄想なんでないの。

245 :
>241それだけは同意。保護される権利はある。

246 :
お前らそんな事どうでもいいだろ。
くだらん事言い争ってる暇が有ったら風呂入れ。臭いぞ。

247 :
ほんとだ。臭うw

248 :
うむ。今日は暑かったからな。>>246

249 :
否定派を見ていると、
公開したい(見せたい)のはあることに関する情報じゃなくて、
情報を発信してる自分じゃないかって勘繰りたくなる。
>>245
だから、キャッシュされるのを回避する方法はあるってのは既出だと思うが・・・。

250 :
被害妄想ではなくて隣り合わせの現実。
どうせクラックされないから、index.htmlを置かなくてもいいや
パーミションも適当でいいや、そんなの被害妄想だと
笑うのは自由。そんな奴に限ってクラックされて泣く羽目に。

251 :
>>249
それ、>>170も言ってるね。
>いつも最新のボクを見て、ボクのいいとこだけ見て――ってか。

252 :
>>250
アーカイブされるとクラックされる程の被害でも出るのか?

253 :
>>170
キャッシュ賛成派って「過去の自分も見て」って感じ?
自己顕示欲が強いね

254 :
>>250
キャッシュとパーミションなんかとは別問題だろが。
あ、それを一緒くたにするのが正に被害妄想なのかな。

255 :

同意(ワラ

256 :
回避策以外に、拒否・削除申請を受け付けない倉庫ってあるのか?

257 :
index.htmlを置くのは被害妄想です!!!

258 :
>>250
マテ
index.htmlを置くのとパーミッションを適切に設定するのは全然性質が違う操作だぞ。
つか、index.htmlなんてクラック対策のうちに入らない。
ましてやキャッシュなんて……

259 :
>>253
ワラタ

260 :
パーミションを777以外にするのは、被害妄想です!!!

261 :
過去の自分を見られることに無頓着なのと、
自分の過去像まで操作したがるのと。
どっちが自意識過剩かね。

262 :

>>261
過去像?情報だろ?

263 :
過去を操作してると思うのは妄想で自己満足に過ぎないよ。
真実はいつでも一つd(>ー')

264 :
他人がRobots.txtを置くことにギャーギャー言うのは
間違いなく自意識過剰の我侭甘えん坊という噂

265 :
>>263
だね。妄想で自己満足のためのcache避け、か。ヤレヤレ。

266 :
いいえ

267 :
>264ワラタ。アンタまさに自意識過剰。
何について話てるか分かってるか?

268 :
またグーグルキャッシュ肯定派による抽象的なイメージ作戦が始まった。
そんなことを言ったら、個人でサイトを運営すること自体自意識過剰の自己満足じゃん。

269 :
結局は「なんとなく嫌だから」レベルなんだよな。

270 :
>>268話の幅を広げて煙に巻こうとするなよw

271 :
>>264のどこが自意識過剰?
何でも自意識過剰とか被害妄想とか書けば
批判になると思ってない?

272 :
>>268
1行目と2行目の繋がりを述べよ

273 :
やめませう、一般論による論理のすり替へは。 >>268

274 :
>>269
肯定派も何となく嫌でないから、だろ

275 :
>>269
>>218

276 :
パーミションを777以外にするのは、被害妄想です!!!


277 :
>>274
World Wide Webの理念を分かっていますか?

278 :
おおっと>>268>>270>>272>>273の三連打で撃沈かぁ?

279 :
って言うか肯定派一人だろ

280 :
>>271
自意識過剰というより、自分のルールに反することが許せない子供みたい。

281 :
そういえば、googleキャッシュって検索語がハイライトされるから便利なんだよな
いちいち再度ページ内を検索する手間が省ける

282 :
実質的な、もしくは個人的に不快と感じる被害に遭うと人は過剰反応するんだよ。
否定派は運が悪かったと思うしかない。
人間、他人事は「そんなこと位で」と思うもんだ。

283 :
って言うか否定派一人だろ

284 :
あげ

285 :
要するに、このスレは2人で進んでいる、と。

286 :
あげんなハゲ

287 :
>>283
ホントにそう思ってるかw

288 :
>>283
あっ
肯定派が被害妄想してるw

289 :
だから風呂入れよ

290 :
>>279
あっ
否定派が被害妄想してるw

291 :
うむ。7,8人はいるなw

292 :
>>281
他のページがキャッシュされるのは便利だけど、自分のページはさせない。
だからrobots.txtを愛用してます。許せ

293 :
さっきから自作自演だな一人芝居だのと言ってる人がいるけど、それって
議論の本質と関係ないと思うんだけど。
俺は肯定派でも否定派でもないよ。

294 :
だからナルシー君は勝手にやってろよ

295 :
あげ

296 :
>292だから別にそういうのは自由だからいいんじゃん?

297 :
ところで。
迫害者が多数でなく一人だけだと信じたがるのも被害妄想なのかね?
普通、被害妄想患者はみんなが自分の迫害者だと信じ込むんでないの?

298 :
Web Archiveされてる
過去のアタシも見て!!!

299 :
>>298
あげんなhage

300 :
>>293
そもそもこれが議論に見えてるのかお前は

301 :
>298わらた

302 :
ワラタ

303 :
>>300
さあ?
やたらと「w」付けたり自演と連呼している煽り厨以外は議論になってると思うよ。

304 :
>>297
被害妄想というより誇大妄想と言った方がいいだろうな

305 :
むしろアーカイブされないページが多いのが問題。>>298
どうしたら登録させられる?(自他いづれも)

306 :
あげ

307 :
>>305
ほっとく

308 :
>>305
確かに。

309 :
>297その違いについて大いに騙りたいがヤめとく

310 :
>>292
だから、君がそう思うのはなぜ?って話をしてるんだろ?
#話をしていればだけどな
その理由を他者ができるだけ納得できるように話してみてくれよ

311 :
IDが出なくなると自作自演妄想患者が出てくるのはWEB板の風物詩。
そういった妄想患者に構うと下のスレみたいになっちまうぞ。
http://natto.2ch.net/hp/kako/987/987083959.html

312 :
>>309
そんな出し惜しみせんと、一つよろしく。

313 :
>305
糞ページはアーカイブされません

314 :
肯定派の40、否定派の45、両者が言うように各人の価値観の問題でしょ。
お互いに納得のできる結論なんてないよ。
お互いに自意識過剰、被害妄想と罵り合って沈む、どっちもお互い様な駄スレ。

315 :
>>310
なんとなく

316 :
>>310

>>218

317 :
>>314
延々と上がり続けるだけに、単発質問スレより糞スレだな

318 :
>>314
だからロボット除けでもなんでもやりたい奴は勝手にやってろ
まともな神経してる人間はそんなんするな、で結論づいてるんだけどね

319 :
そういう発言こそが糞スレにしている事に気付かないか?>>314>>317

320 :
>>313
糞かどうかはこっちで判断するから、
とにかく一通りアーカイブしておいてほしい。
現状では遺漏が多すぎる。

321 :
>>318
まともな神経してる人間はNoArchiveで決まり

322 :
>318
自分に都合のいい結論を持ってこないように。

323 :
>>318>>321 も まともな神経していないという罠

324 :
と言う訳で1000まで互いに罵りあうのがこのスレの醍醐味です

325 :
ウンコ!と言われてションベン!と言い返す様に似ています

326 :
まともな人間はsageたりしないわ!!!

327 :
46 :Name_Not_Found :02/07/09 10:43 ID:???
>>45
いくら誤った情報を訂正したとしても
利用者がその訂正を見なければ、与えてしまった情報は更新されない。
情報を流すって、そういうことだ。

47 :Name_Not_Found :02/07/09 11:03 ID:M+hY6x1z
>>46
そんなことどーでもいいんだよ。
自分のチョンボがずーっと(少なくとも削除依頼が通るまで)
晒されるのが嫌なだけ。w
WBやGoogleにアーカイブされてない限り、訂正しちゃえば
チョンボの決定的な証拠はなくなるじゃん。
一方、アーカイブされてたら訂正しても、チョンボは残るわけで。

48 :Name_Not_Found :02/07/09 11:38 ID:???
だったら公開するな
オンライン上に何か情報を流すのだったら多少のリスクは覚悟しろ

328 :
とりあえずage厨を抱えるのが最悪な現状

329 :
このスレを見ると、明らかにキャッシュ対策をしている香具師の方が
マトモっぽい。
以上、煽りでした。

330 :
もういい加減終われや、このスレ。
「お前のかーちゃんデベソ!」レベルの罵り合いが続くだけ。
定期的にagaってきてうざいったらありゃしない。

331 :
48の見事に外しまくった反論にならない捨て台詞に萌え

332 :
>>330おやすみ

333 :
過去のアタシを否定しないで!!!!

334 :
>333それはもういいw

335 :
>>47の自分勝手なお子樣ぶりに萎え。

336 :
>>331
?

337 :
いやよ!!
Web Archiveされてる
過去のアタシも見て!!!


338 :
>337漏れは今のお前が好きだったのに・・・さようなら

339 :
このスレッドをあげてる馬鹿は釣り師。放置汁

340 :
52 :Name_Not_Found :02/07/09 12:45 ID:M+hY6x1z
>>48
だから、リスクを軽減するための
robots.txt/meta要素なんだが?w

55 :53 :02/07/09 13:01 ID:wkWXkFSn
>54
ありがと
>48
行動にリスクが伴うのは当然だけど、回避可能なリスクを甘受するのは愚か
最近問題の個人情報漏洩にも同じ事がいえる
この件に関して、その論は的外れだと思う

341 :
> 釣り師


342 :


343 :
何、さっきからやたら騒いでるのは>>48の煽りに対しての過剰反応なワケ?
なんじゃそりゃ

344 :
いやんいやあん!!!
キャッシュを残せって言ったのはあなたじゃないの!!!

345 :
古記事引っぱり出すほうが余程あほ。おまえはArchiverか!

346 :
【衝撃!】消し去ったはずのWebページga保管する
http://pc.2ch.net/test/read.cgi/hp/1004183621/l50

347 :
すごい粘着っぷりだな
どの板出身なんだ?

348 :
>>345
過去ログを生かして、既出やループは避けませう。

349 :
>344それは単なるキープだ。さっさと新しいキャッシュ拾ってこい!

350 :
なんか自己矛盾してきてる奴が居るな

351 :




352 :
>>347とか>>350とか、誰に対して言ってるのかワカランぞ。

353 :





354 :
解る奴には解る感じ

355 :
で、何だ、全員血圧は下がったのか

356 :


357 :
>>351 >>353 >>356
すごい粘着っぷりだな
どの板出身なんだ?

358 :
オウム返しウザイ
>>348がいい事言ってるからちょっと見て来い

359 :
358=348(・∀・)

360 :
でした。

361 :
キャッシュを残す奴は厨房未満

362 :
>>361
激しく胴衣

363 :
>>361-362
一人芝居、虚しくないか?

364 :
>>363
妄想って虚しくない?

365 :
Noarchiveこそ正義

366 :
>>361 >>365
もはや宗教信条だね。
なにムキになってるのさ。

367 :
↑出たよ、煽り豚。一生そうやってブーブー鳴いてろ。

368 :
最初から読んだけど、100あたりで結論出てるだろ。
なんでこんなにレスついてんだ?

369 :
>>368
坊やだからさ(>>45が)。

370 :
>>45 を見てると、若かった頃の自分を見ているようで歯痒い。

371 :
Googleってディープリンクになってるよね。

372 :
>>371
どこでもそうだけどな。

373 :
検索エンジンの検索結果にまでリンクしてるGoogleって、、、。

374 :
>>372
ごめん。どこでもだった。
でもそう考えると結構すごい事してるよね。

375 :
>>374
その感想に時代を感じる。

376 :
ハニー、俺が悪かった。戻ってきてくれ。

377 :
↑出たよ、煽り豚。一生そうやってブーブー鳴いてろ。

378 :
なんだか荒れちゃったナア……。祭りの後、って感じ。

379 :
<meta name="robots" content="none">さえ書いとけば
最強なんだろ?
<meta name="robots" content="noarchive">なんていらねえんだろ?

380 :
>>379
初心者スレで聞くべきなのかなあ。
<meta name="robots" content="none">書いとけば
ググルも含めて弾けますか?

381 :
ってかそれだと検索すらされないじゃん。
検索はされたいけどアーカイブはされたくないときは
noarchive。WayBack Machine対策にはRobots.textが必要。

382 :
>>381
あっ、そか。失礼しますた。ありがとう。

383 :
結論
>>361
>>365
これがわからんやつはアホ

384 :
>>46が粘着荒らしなんですか?

385 :
>>383
ローカルでドグマティックワールド構築して独りで引き篭もっていろ。

386 :

うるせー莫迦

387 :
あげんなハゲ

388 :
こ の ス レ あ げ る と 
過 剰 反 応 す る や つ
い る ん だ よ な ー ワラ

389 :
人のサイトをパクって商売する。
それがウェブアーカイブ。

390 :
>>389
スレ違ひ。
↓こっち読め。あれは「商売」ではなく、無償だってば。
【衝撃!】消し去ったはずのWebページga保管する
http://pc.2ch.net/test/read.cgi/hp/1004183621/l50

391 :
パクるとかいう言葉が出てくる時点でWWWの理念を理解していないよねー

392 :


393 :
漏れのPCにはここ5年に漏れが見て回って採取した
Webキャッシュが8GB程保存されているんだけど、
元のサイト作者に無断で公開してよいんだよね?

394 :
>>393
その手のクダラナイ反論も既出。

【衝撃!】消し去ったはずのWebページga保管する
http://pc.2ch.net/test/read.cgi/hp/1004183621/

395 :
>>393-394
WebArchiveスレによれば、全くの合法。
全然問題なし。

396 :
あのー、他人が作ったWebページをそっくりそのままアップした
会社員が書類送検されたんですけどー、合法と言ってるのは
馬鹿ですか?それともネタですか?

397 :
あくまでこのスレ http://pc3.2ch.net/test/read.cgi/hp/1004183621/l50
によればの話ですから。
クレームはあのスレの住人に。

398 :
>>395>>397は日本語が読解できない人らしい。

399 :
検索には掲載されたくないでつ。

400 :
そうね

401 :
age

402 :
>>45の人格がもうちょっとまともならここまで荒れなかったかもしれないスレはここですか?

403 :
保守

404 :
保守

405 :
このスレの内容、かなり有益だと思うんだけど、919がまとめてくれるかな(w

406 :
age

407 :
FAQサイトにどこを抜粋すると?

408 :

岡田克彦ファンクラブからのご案内です。ご高承のとおり、岡田克彦氏の卒業した早稲田大学政治経済学部
と、ひろゆきの卒業した中央大学文学部は比較にならないほど差があります。中央大学文学部のような
ヘボい大学に共通しているのは、文化水準が低いという事です。18歳から22歳をヘボい大学で過ごすという
ことは、感受性において致命傷と言えます。2ちゃんねらーの大半は岡田克彦氏に比べて、著しい低学歴で
頭が悪いだけでなく、感受性も愚鈍で腐っているという、取り返しのつかない状態なのです。
せめて、http://www.geocities.co.jp/MusicHall-Horn/1091/で、岡田氏の作品に触れましょう。


409 :
age

410 :
(^^)

411 :

【衝撃!】消し去ったはずのWebページga保管する
http://pc2.2ch.net/test/read.cgi/hp/1004183621/

412 :
robots.txt

413 :
それより、何度URL登録してもキャッシュが更新されないページがあって
困ってるんだが。どうすればいい?

414 :
昨晩、やっとキャッシュが最新の物に更新されたと思ったら、
先刻見たらまた古い時の状態に戻ってしまってた。
(だから加筆した部分の語彙では検索に引っかからない。)
何なの、一体?

415 :
検索エンジンのキャッシュは著作権侵害か?
http://slashdot.jp/article.pl?sid=02/03/18/0234235&mode=thread
検索エンジンのキャッシュは著作権侵害か?
http://yotaro.bird.to/words/2002/0320b.html
インターネットは特別なんだ!だからいいんだ!
http://aglaia.c.u-tokyo.ac.jp/~yamamoto/diary/?200303b&to=200303150#200303150

416 :
>>413
>>414
サーチエンジンスレに行ってみそ。

417 :
METAもhtaccessも入れてるのにいんふぉしーくに検索引っ掛かってる模様。
なんでだろー、と調べていたら。
CGI少年、ぬっ頃す。

418 :
>>417
詳細きぼん

419 :
皆さんはウェブマスター初心者ですか?
アップ前にNA(NoArchive)の登録しないと危険ですよ。
NAの登録せずにアップした場合、
あなたのウェブサイトの過去の情報が他人に見られる恐れがあります。
そして、簡単にあなたの過去の内容等抜かれ、パクリ情報まで公開された人も数多くおり
社会的に抹殺されてしまう。それがインターネットの隠れた素顔でもあります
NAを登録しておけばまず抜かれるキャッシュ情報自体が無効になってしまうので
どんなにスキルがある人でもぐーぐるでキャッシュを抜くことが不可能になります
NAを登録する方法は、メタタグで、
「<META NAME="ROBOTS" CONTENT="NOARCHIVE">」と入れる。
これでNAの登録は完了します。
一度登録すれば、メタタグ記述を変えない限り継続されます。
インターネットはルールさえ守れば危険な場所ではありません。
しかし悪意を持った人間も確かに存在します。気を付けて下さいね。
NAは、正式にはNOARCHIVEコマンド、
又はネーチブと読みます。
元々はアメリカの学生達の間で、検索の時に
サーバーダウンを強化する為に開発されたシステムです。
メタタグをHTMLに組み込むのは結構面倒なのですが、
盗用してたらパクリ先に抗議されたとか、
著作権が侵害された等の抗議がうざったくなったロボット型検索エンジンが、
仕方なく導入しました。
悪意のある人間に晒される前にNAを施す事をお勧めします。

420 :
自分から世界に公開しておいて"悪意のある人間に晒される"とは、
これまたひどく頭の弱いお方がいらっしゃいますね

421 :
>>420
ネタにマジレ(以下略

422 :
(^^)

423 :
   ∧_∧
  (  ^^ )< ぬるぽ(^^)

424 :
googleのキャッシュは手動で削除できるよ。
漏れはサイトを引っ越したときなんかは手動で全部削除してる。

425 :
     ∧_∧
ピュ.ー (  ^^ ) <これからも僕を応援して下さいね(^^)。
  =〔~∪ ̄ ̄〕
  = ◎――◎                      山崎渉

426 :
どっかの厨は自サイトのリンクページででかでかと、
「閉鎖されたしまったサイトの見方♪」
とアーカイブを自慢げにあげていた…
フォントでかすぎ、色は赤!
だ、誰か!!

427 :
>>27
昔、FBIが関与してるって噂が、一部で・・・

428 :
【衝撃!】消し去ったはずのWebページga保管する
http://pc2.2ch.net/hp/kako/1004/10041/1004183621.html
インターネットアーカイブ:ホームページよ、よみがえれ!
http://dhr.tripod.co.jp/simple_webarchive.htm
ウェブ・アーカイビングとInternet Archive Wayback Machineについて
http://www.h5.dion.ne.jp/~wing-x/webarchive/index.html
ZDNN:インターネットの過去を保管,Webアーカイブが公開される
 http://www.zdnet.co.jp/news/0110/27/b_1026_08.html
Internet Watch:過去5年間の100億ページものWebページを保管したWebアーカイブが公開
 http://www.watch.impress.co.jp/internet/www/article/2001/1029/wayback.htm
インターネットアーカイブの必要性
 http://edb.miyakyo-u.ac.jp/ugawa/20001201/iArchive.html
インターネットアーカイブサービスの問題
 http://www.gabacho-net.jp/whims/whim0118.html
武邑光裕『記憶のゆくたて デジタル・アーカイヴの文化経済』東京大学出版会
http://www.utp.or.jp/shelf/200302/063452.html
担当編集者から
 HPのサイトがいつのまにか消えてなくなっていた,という経験をされた方は少なく
ないと思います.毎日大量に生産されては消えてゆく,膨大なデジタル情報.離散し
流動するこれらの「記録」を組織化し,「記憶」として永遠性をもたせるには,どう
したらよいのでしょうか?

429 :
もっと晒してくれ

430 :
>>429 晒せって、何を?

431 :
漏れら極悪非道のageブラザーズ!
今日もネタもないのにageてやるからな!
 ̄ ̄∨ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄
  ∧_∧   ∧_∧    age
 (・∀・∩)(∩・∀・)    age
 (つ  丿 (   ⊂) age
  ( ヽノ   ヽ/  )   age
  し(_)   (_)J

432 :
ホイ、ネタね。
通信・放送:
米グーグルのキャッシュ機能は著作権侵害?
2003年7月10日(木) 14時21分
http://japan.cnet.com/news/com/story/0,2000047668,20059840,00.htm

433 :
http://homepage.mac.com/hiroyuki44/jaz09.html

434 :
http://www.isis.ne.jp/
http://www.maromaro.com/
http://www.tomita.net/
本を読もう

435 :
http://homepage.mac.com/hiroyuki44/

436 :
http://www.zdnet.co.jp/news/0307/11/ne00_google.html
ZDNN 2003年7月11日 07:00 PM 更新
Googleに新たな懸念――キャッシュ機能はWeb出版の敵

437 :
http://homepage.mac.com/hiroyuki44/hankaku09.html

438 :

 __∧_∧_
 |(  ^^ )| <寝るぽ(^^)
 |\⌒⌒⌒\
 \ |⌒⌒⌒~|         山崎渉
   ~ ̄ ̄ ̄ ̄

439 :
>>27
UA:ia_archiverでアクセス拒否にすればよろし

440 :
糞みてーなサイトなんかグーグルだってお断りだよ。




441 :
ハッキリ言ってアメリカなどの多民族国家では黒人の方がアジア人よりもずっと立場は上だよ。
貧弱で弱弱しく、アグレッシブさに欠け、醜いアジア人は黒人のストレス解消のいい的。
黒人は有名スポーツ選手、ミュージシャンを多数輩出してるし、アジア人はかなり彼らに見下されている。
(黒人は白人には頭があがらないため日系料理天などの日本人店員相手に威張り散らしてストレス解消する。
また、日本女はすぐヤラせてくれる肉便器としてとおっている。
「○ドルでどうだ?(俺を買え)」と逆売春を持ちかける黒人男性も多い。)
彼らの見ていないところでこそこそ陰口しか叩けない日本人は滑稽。

442 :
【ネット】平成国立ネット図書館設立へ。削除ページも閲覧OK…300億かけ巨大鯖構築
http://news2.2ch.net/test/read.cgi/newsplus/1059287503/

443 :
(^^)

444 :
    (⌒V⌒)
   │ ^ ^ │<これからも僕を応援して下さいね(^^)。
  ⊂|    |つ
   (_)(_)                      山崎パン

445 :
もう既に、自分ではどうしようもできないのを archive.org から
削除してもらうのってどうしたらいいでつか
垢削除したから、METAタグにどうこうできないし
archive.org って何年ぐらい晒され続けるの?

446 :
>>445
とりあえずアーカイブに削除依頼してみれ。
wayback2@archive.org
lenny@archive.org
アーカイブに保存されてるページのurlを書いて
「削除を希望します」と英文で書く。
念のために元のサイト名とurl、名前を添えれば
2,3日で対応してくれると思う。

447 :
googleは対応しているようだけど、archive.orgもmetaタグによるロボット避けに
対応しているの?

448 :
>>447
対応してる。archive.orgにも書いてあるはず。

449 :
>>446
ありがとうございまつ

450 :
>>448
サンクスです。早速、metaタグ入れてみました。

451 :
>>450メタを無視してくれるありがた〜〜いロボット君もいることをアドバイスしておく

452 :
初心者板に行くべき内容だったらすみません。
metaタグによるロボット避けというのは、
検索エンジンごとに設定するのですか?
一つで全部のエンジンに対応するのですか?
フロントページエクスプレスで作ったので、
タグというもの自体になじみがありません・・・

453 :
グーグルはいいけど、インターネットアーカイブ
には収録されたくないということです。

454 :
Google五周年age

455 :
>>452
そういう場合は、また別のタグの書き方があったような。
「とほほのwww入門」あたりに載ってなかったっけ。
>>451
そのようだね。robots.txt置けない環境は辛いよ。
archive.org対策ってことで、metaタグの他には、自分はフレームを多用している。
気休めだけど。
フレームを使ってたり、JSのボタンで次のページに行かせるような構成にしてあると
璧には収蔵されにくかったりするじゃない。
なんかもっと良い方法ないかなぁ。

456 :
璧には→完璧には

457 :
ほんとミスしてアップして、
間違い探し好きなアホ二チャンねらーに見つかると
大変だよね。いやまじで。

458 :
ミスしたら、直せばいいだけ。
保存されるのがイヤなら初めからアップロードしなければよいヨ。

459 :
保存ならぜんぜんいいけど、祭りになると手がつけられんのよ。
企業のミスだってそうでしょ。周りが静かに、運営元に連絡して
やりゃいいのに、かってにでかくして、被害者増やして、
ログを保存して骨の髄まで貪り祭る。
もう、ハイエナ系ちゃんねらーはうぜー。
まぁ、企業の場合の方が楽かもね。ある意味。
個人サイトがこれにあうとほんとつらいぜよ。
著作権関係はもうあきらめた。
警告しても次から次とでてくるから、もう放置だよ。

460 :
安心汁、喪前のサイトごとき誰も騒がんよ

461 :
ある程度ヒットするサイトつくってみ。
否が応でもここが(2ch)ネックになってくるから。
誰もが感じてる事だろう思うけど。

462 :
評判されるのが怖ければサイトなんて作りなさんなってことだ。

463 :
>>461
そりゃ厨が集まるようなサイトだからだろ

464 :
>>461
被害妄想ではなくて?
そもそもInternet Archiveを使ってまでミスを指摘して騷ぐ奴なんて見かけるか?
騷ぎ立てる馬鹿者どもは、Wayback Machineとか見たこともない無知な連中ではないのかな。

465 :
■日本人プログラマーよGoogleを攻略せよ 2003年09月24日 CNET Japan - 梅田望夫・英語で読むITトレンド: http://blog.cnetnetworks.jp/umeda/archives/000697.html
Google Code Jamというプログラミングコンテスト(CNET Japan速報記事「米グーグル:「プログラミングコンテスト出場者を求む」」をご参照)が10月から11月にかけて開かれる。
参加資格は18歳以上(世界中の誰でも)。予選はオンラインで、決勝(トップ25人)はシリコンバレーのGoogle本社で行なわれる。
腕自慢の日本人プログラマーたちには、この機会にぜひその実力を発揮してほしい。
Google Code Jamのファイナリストといえば、これから腕一本でプロとして生きていきたい若い人にとっての大きな勲章になる(中途半端な学歴なんかよりうんと価値がある)。
ファイナリストに残る日本人がいれば、日本人プログラマーの実力が世界でもトップレベルにあるという事実を、広くアピールできるだろう。
さて、コンテストの仕組みとスケジュールであるが、
参加者全員から500人にふるい落とす「Qualification Rounds」、
500人を250人に絞る「Online Elimination Rounds 1」、
250人から25人に落とす「Online Elimination Rounds 2」。
ここまではすべてオンラインなので、自宅から参加できる。
そして、ファイナリスト25人はGoogle本社での「Onsite Championship Round」に進むことができる。
★google code jam 公式サイト(excite翻訳) http://www.excite.co.jp/world/url/body?wb_url=http%3A%2F%2Fwww.topcoder.com%2Fpl%2F%3F%26module%3DStatic%26d1%3Dgoogle%26d2%3Dgoogle_overview&wb_lp=ENJA&wb_dis=2

466 :
昔やっていたサイトがとあるサイトの劣化コピー品で、著作権所有者に怒られて閉鎖しました。(謝罪は行い、許しも頂けました)
そのサイトがWebArchiveにまだ残っていて、非常に困っています・・・
存在する事はWebArchiveが出てきたばかりのころに気付いていたのですが、
愚かな自分の愚行を見たくなく、精神的に逃げてしまい、削除依頼も出していませんでした。
何とか消してもらいたいのですが、
どの様なメールを出せば削除又は非公開にしてもらえるのでしょうか?
英語はほとんど解りません…
いくら罵倒されてもかまいません。どなたかご教授下さいお願いします。

467 :
Rばいいんじゃん?


なんちゃって

468 :
メリケンが削除なんかするわけ無いだろ

469 :
参考になったので保守

470 :
http://recall.archive.org/
Internet Archiveの110億ページを検索できるサーチエンジン「Recall」
 http://internet.watch.impress.co.jp/cda/news/2003/09/08/377.html
Internet Archive を検索できる検索エンジン Recall ベータ版公開
 http://www.sem-research.jp/sem/search_engine_news/20030909001857.html

471 :
みなさん教えてください。
googleのキャッシュを手動で消そうと思い、ユーザ登録を行いました。
ユーザ登録のURLはこちらです。
http://services.google.com:8882/urlconsole/controller?cmd=reload&lastcmd=login
登録を行って1時間は経ったのはずですが、登録確認メールが来ません。
どなたか同じような現象や対処方法をご存知の方はいませんか?
よろしくです。

472 :
経ったのはず

473 :
自己レスですが解決しました

474 :
>>471-473
なんなのだ(w

475 :
robots.txtを置いてGoogleキャッシュ削除の手続きをしたのですが、
robots.txtの場所を入力して削除ボタンを押すと以下のようなメッセージが
あらわれました。
robots.txt ファイルの管轄外にある URL には、次の規則が適用されます。
DISALLOW /
これって正常に削除されているんですか?削除ステータスには何もあがってこない
のですが…。手順が間違っていたら教えてください。

476 :
archive.org に削除してもらおうと思ったらwayback2@archive.org
にメールすると戻ってきちゃう(つД`)  
info@archive.orgにメールでも大丈夫かな?

477 :
477 名前:Name_Not_Found[sage] 投稿日:04/03/25 21:03 ID:???
>>476
>>446で紹介されてるlenny@archive.orgに送ったら、対処して貰えたよ。

478 名前:476[sage] 投稿日:04/03/26 12:43 ID:???
>477
メール送ったら、すぐに返事がきて「削除したよ」とのことです。
確認したらきちんと削除してありました。
ありがとうございました。

478 :
保守

479 :
【衝撃!】消し去ったはずのWebページga保管する
http://pc2.2ch.net/hp/kako/1004/10041/1004183621.html
一度は公開したページを消したがるのは、卑怯者。男らしくないぞ。

480 :
消したがるのって腐女子が多い気がするから確かに男ではないのだろう

481 :
Web制作板とか言って厨多すぎですね

482 :
そうですね

483 :
<meta name="Robots" content="NoArchive">
これをファイルごとにかいてアップロードすればキャッシュが残らないんですか?
それともrobots.txtってファイル作って
↓をかいてうpしておけばいいの?
User-agent: *
Disallow: /


484 :
俺の恥を残したくない。
最初作ったHPをローカルに置いてあるが3年前それを見て驚愕して
最初のページだけ見てエクスプローラーの×を押し目を伏せたことがある。
あれから3年・・・恐ろしくて開けないってのにそんなもんを未だに
全世界に向けて保存しとくなバカ

485 :
>>484
だったら最初から公開しなければよかったのに。
インターネットはもともと公の場だよ。

486 :
>>485
最初からすげー洗練されたページ作れりゃ誰も苦労はしない。
そんな事も感覚的にわからんのか?

487 :
洗練されてから公開すればいいんです。

488 :
>>484
わかるわかる。
何かものを作るってのは、そういうもんだ。
>>487
それだと一生何も物を作れない罠。

489 :
>>486
そんなことはわかっている。そんな問題じゃなくて
インターネットが本来どういう場所でどうあるべきなのか考えたほうがいい。
何もすげー洗練されたものを最初から作る必要はないが
公の場だということを踏まえて作るべきではあると思うよ

490 :
>>489
リアル消防に官が企画的に作り方教えるのが必修な今の世で
んな自分だけを正当化してる馬鹿丸出しな発言されてもなあ。
何も金もらって作ってるわけじゃねえし最初から洗練されたもの作れりゃ誰も
苦労しないってことがわかってないから>>485みたいなピンボケ発言できるんだよ。
まぁ煽り抜きで全部痛烈なるマジレスな。

491 :
>>489
http://homepage1.nifty.com/kanda/net42.htm
まぁもう少し世の中ってものを勉強してから出直して来い

492 :
後から恥ずかしいと文句言うなら公開するなってことでしょ。

493 :
>>492ってマジレスするのも呆れるほどマヌケなレスだな。
こういう曲げ厨の相手すんのってめんどくさい事この上ない。。。

494 :
技術用語「cache」が政治的な言葉として拡大利用される
http://d.hatena.ne.jp/HiromitsuTakagi/20040912#p1

495 :
検索・登録対象から除外しているディレクトリの特定のファイルを
検索・登録対象にする場合のrobots.txtの記述は下のような感じでOKですか?
User-Agent: *
Disallow: /example/
Allow: /example/test.html
(空行1行)

496 :
質問なのでageさして下さいね

497 :
理論上はそれでいいはずだけど
ロボットがAllow:に対応してるとは思わないほうがいいよ

498 :
>>497
レスdクス
一晩待ってレスが無かったので、別スレで問合せた所、
AllowはGoogleに対しては、効果がない、との回答もらいました

499 :
Googleから回答が来ましたので、報告
---------------------------------------------------------------------------------------
Googleへご連絡いただきありがとうございました。
ロボットがクロールできるようにrobots.txtを作成するには、
以下のように「Allow:」で始まる記述を「Disallow:」で始まる記述の前に記載していただく必要があります。
---------------------------------------------------------------------------------------
User-Agent: *
Allow: /example/test.html
Disallow: /example/
(空行1行)
上のような記述であれば、OKみたいです

500 :
archiveに削除依頼したら
担当した人によって対応の仕方がちがうのか
本当に貴方のサイトなのか?という返事が返ってきた・・・
サーバーのメルアドで丁寧な英語メールを出したのに・・・
少しムッとしたがドメインとサーバー使用の領収書を添付して
きつーい言葉で削除しろともう一度メールしたら朝一で消されていた
強気の方が対応が早いのか?

501 :
499>>(空白1行)には何の意味があるのですか・・・?

502 :
>>501
何も書かない行を1行入れておくって意味でしょ。

503 :
Recallアクセスできなくなってる

504 :
Recallはよく落ちてるよ

505 :
>>483
要するに、METAに
meta name="Robots" content="NoArchive"
とさえ書いておけばgoogleだろうがweb archiveだろうが絶対にHPを保存されないわけだ。
アーカイブアーカイブって言っても、それほど怖くないじゃん。

506 :
なんで怖がるのか、何故そんなに過去を湮滅したがるのか、不可解。

507 :
>>505
ネイバーにはアーカイブされる予感

508 :
>>505
>>451

509 :
知識無かったらまずいね。
これ、意外と知られてない事実じゃない?
中学生の頃遊びで作ったHPがネイバーなどに知らないうちに一字一句年代順に完璧にコピーされ
半永久的に出回り続ける・・・
更新しようが何しようが、とにかくたったの一瞬でもネット上に情報が出回ったら取り消す事は出来ない。
著作権法を盾に禁止しようにも、ネットは世界中と繋がっているから、たとえ日本国内で制限しても
法律なんか知ったこっちゃ無いような国がゴロゴロいるので不可能。
その著作権法ですら現行のままではグレーゾーン。
最初からそんなものを出すなと言われそうだが、誰しもただの日記にまで一字一句気を付けて書く事等できないわけで。
現実ではそんなことを知らされずにHPを作ってしまった人はこのスレッドにもたくさんいるが
どうしようもない…
web製作者にこのことをちゃんと知らせる決まりを作った方がいいのでは。
それがされてないのなら、「気軽に」HPを作ってみよう!なんて番組や雑誌、プロバイダは詐欺と一緒だよ。
HPを作ることは、未来に対して相当のリスクを背負っている事を実感する。
もしこのスレにそうした運動(HP製作など)が出来る人がいれば協力してほしい。
少なくともrobots.textの作り方などは詳しく書いておくべき。

510 :
最初からそんなものを出すな。何でそんなに過去を消したがるのかね。

511 :
>>509
がんばってくださいね(プゲラ

512 :
間違っていようが入るまいが知りません自己責任で

513 :
>>451
例えばどんなロボット君ですか?

514 :
で、どのタグが正しいの?
Googlebot? Robots?

515 :
>>509
Archive.orgの問題に関しては、一昔前に割とあちこちで議論になってたけど、
ウェブサイト作成初心者の目に触れていたかどうかは疑問だな。
ネットリテラシーをちゃんと教えずに、便利さばかりを強調する商業出版物は
淘汰されていかなくちゃな。
ただ現在の時点で、漠然と「なんとなくインターネットには怖い側面もあるらしい」ってことは
印象としてネットに疎い人にも伝わっていると思うから、むしろそういうことをちゃんと記事に
入れ込めるほうが、信頼度は上がると思うよな。

516 :
国会図書館、webサイト保存を06年から開始
http://news19.2ch.net/test/read.cgi/newsplus/1102405883/l50

517 :
<meta name="robots" content="noindex,nofollow,noarchive">
<meta name="googlebot" content="noindex,nofollow,noarchive">

518 :
metaタグ入れたけど
キャッシュは残らないものの検索にはひっかかる

519 :
何も知らない頃に作ったぼくのほおむぺえじを卑怯にもコソーリ保存しとくと言う
卑屈且つ姑息な手段が許せん。今ならいくらでもかかってこい状態だがなw

520 :
卑屈とか姑息とか意味解って使ってるかチミー?

521 :
姑息ってのは大半が間違って使っていた&覚えていたってのが
最近のニュースであったな

522 :
>>520-521
融通が利かない

523 :
融通などきかせるな

524 :
>>515
まったくの正論だ。
で、さしあたってはweb製作板あたりに立てるのが一番だと思うが
どういうタイトルにするかなど難しい点が多い。
http://pc5.2ch.net/hp/

525 :
>>509
洩れ自身は、Net上から「日記コーナー」とかbぉgとか、役に立たんものは消えて無くなれとか思ってるけど、
現状社会は逆に動いてるでしょ。
そも、Archiveの役割がよく解らん。
Net上の物を記録してどうしようってのよ?
後で恥かしい文章やFileを見せて人を脅迫しようってのか?
多人数が必要だと思う情報なんて、
収集業者が無理しなくても、誰かが保存して役立てようとするか商売に使うもんだろ。
著作者が収集回避出来ない仕組みなんて論外だな。

526 :
>>525
23世紀くらいに「20世紀のインターネット」なんていう
展示会をやるときにでも使うんでしょ。アーカイブっていうくらいだから。
もう著作者は死んでるだろうから、問題ナシです。
博物館に江戸時代の絵巻が展示されていて、
みせものにされたり、研究材料に使われたりするのと同じ感覚かと。

527 :
>>526
それが「未来に対しての無限大のリスク」の
ほんの一部だね。

528 :
これでも読めや。
http://www.ndl.go.jp/jp/aboutus/preservation.html

529 :
>>484タソは、同じファイル名で別の内容もう一回うpすればいいんじゃ?

530 :
http://www.toonippo.co.jp/news_too/nto2003/0103/nto0103_4.html
のソースは、
<meta name="robots" content="noindex,nofollow,noarchive">
<meta name="googlebot" content="noindex,nofollow,noarchive">
になってるから、これが正しい記述&最強の回避方法?
<meta name="robots" content="noindex,nofollow">
ならしょっちゅう見るが。

531 :
グーグルはじいたら、訪れるやついなくなるぜ。

532 :
身内だけにしか知られたくない場合それでいいんじゃない?
グーグル弾き+パスワード制で。

533 :
>>530
nameは大文字が正しいんじゃないの?小文字でもOKなのは拡大解釈してもらえるだけで。
contentは NONE ALL NOINDEX INDEX NOFOLLOW FOLLOW を , で区切って記述。
NONEはNOINDEX,NOFOLLOWと、ALLはINDEX,NOFOLLOWと等価。
contentのNOARCHIVEはアーカイブするロボットの勝手な拡張。
あとどっかのNから始まるロボットはDoSアタックしてくるから
パケットフィルタレベルで拒否w

534 :
しかしrobotstxt.org的にはcase-insensitiveなんだよな

535 :
>>533
要するに何なんだ?
そんなに小難しく説明するより、あんたが
模範的な記述をここに書いた方が速いぞ

536 :
<META NAME="robots" CONTENT="noindex,nofollow,noarchive">
<META NAME="googlebot" CONTENT="noindex,nofollow,noarchive">
↑これが模範例じゃないかな?

>>533の日本語を正確に再現すると
<META NAME="robots" CONTENT="NONE,ALL,NOINDEX,INDEX,NOFOLLOW,FOLLOW">
ってことだが。矛盾しちゃう。
多分、↓こうしろということをいいたのだろうけど。
<META NAME="robots" CONTENT="NONE,NOARCHIVE">

537 :
権威の論証みたいになっちゃうけど、
プロの人でも小文字で
メタを記述してるから小文字でもいいんじゃないの?
拡大解釈してもらえるなら結局はいっしょなわけだし。
http://www.wdd.jp/index.html

538 :
content内を大文字が正解
<meta name="robots" content="NOINDEX,NOFOLLOW">

539 :
NOINDEX,NOFOLLOWは大文字のほうがいいんだっけか

540 :
実際には小文字でも通用するけどね

541 :
大文字小文字を間違えるとまずいのはDTD宣言。
それ以外はハッキリ言ってどちらもでいい。
作成ソフトやエディタでも小文字で吐くやつもあれば大文字で吐くやつもあるし。

542 :
>>541 XHTMLではタグは小文字と決まってるんだが。

543 :
弾きたい人は弾いておいたほうがいいかもね。
202.217.35.12
ndl-japan-research-robot-1.0 (http://www.ndl.go.jp/jp/aboutus/bulkresearch20
04/index.html)(http://e-public.nttdata.co.jp/bulkresearch2004/index.html)

544 :
            

545 :
    

546 :
保守

547 :
どちらの書き方が正しいのでしょうか?
@----------------------------
User-agent: searchpreview
User-Agent: ia_archiver
Disallow: /
A----------------------------
User-Agent: ia_archiver
Disallow: /
User-agent: searchpreview
Disallow: /
googleで検索すると、Aは効果がないらしいとの事ですが
ある複数のロボットを指定したい場合どちらが効果があるのでしょうか
よろしくお願いします

548 :
質問なら上げてみてはどうか

549 :
>>547
Aの方法の場合、間に一行開けると良いと聞いた。こういう風に
User-Agent: ia_archiver
Disallow: /
User-agent: searchpreview
Disallow: /

で、やってみたが効果はなかった。
@はやったことはない。
grub-clientも俺は弾きたい。
三つ弾きたい。どうやったものか。


550 :
発想を変えてみる。
Googleとslurpだけ許可したいとき。
User-Agent: *
Disallow: /
User-Agent: Googlebot
Disallow: /hoge/
User-Agent: slurp
Disallow: /hoge/
/hoge/ は存在しないディレクトリを指定する。

551 :
Googleから削除されない・・

552 :
Google
削除要請出して、削除完了 となっているのに未だにインデックスされてる。
迷惑この上なし。
不人気サイトは掲載されないし、人気サイトは削除してくれっつっても掲載
される。削除依頼にも応じない。なんか、上場してからおかしくなってきたね。

553 :
>>552
うーん。
robots.txtちゃんと設定してる?

554 :
削除完了 となっている

555 :
>>553
metaタグに noindex noarchive 入れてる。そして完了となった。

556 :
>>555
とりあえず、もう2ヶ月ほどまってみなよ。
それで駄目なら、自動 URL 削除システムとやらを使って消しちゃおう。

557 :
>>556
その自動URL削除システムを使って削除したんですよ。
そして、削除完了 とステータスがなっているにも関わらず未だに掲載中。
さらに、未だに掲載されているのでもう一回削除システムに削除依頼だしたら
受け付けてくれなかった。
それなりに人気があるサイトなんだけど、人気サイトは削除しませんってこと
なんだろうか。
逆に掲載してほしいのにいつまでたっても掲載してくれないサイトもあるし・・・

558 :
>>557
あれは確か、受け付けてから実際に消えるまで、多少時間がかかるよ。

559 :
質問なのであげさせて下さい。
Internet Archiveに削除依頼を出したのですが
返信に そのHPにあなたの使ってるメアドを載せてくれ
というような内容がありました。
つまり本人確認をしたいという感じの内容でした。
ですがそのHPはもうアカウントも削除していて
現在は存在してないのでできません。他の方法を
ぐぐっても削除に成功した方の例は皆現在も
そのままHPを運営している方々達の話ばかりでした。
本人確認ができないと却下されそうな感じの内容
だったので返信に困っています。
今は存在しない過去のサイトの削除依頼に成功した方
いらっしゃいましたらアドバイスお願いします。

560 :
なんでそんなに過去を消したがるのかねえ。

561 :
>>559
相手に聞いてみたら?

562 :
>>557,558
即、消すなら、robots.txtが必要じゃないかな。
ほら、
注意: 緊急を要し、Google が次回サイトをクロールするまで待てない場合は、
自動 URL 削除システムをご使用ください。 この自動プロセスが機能するためには、
Web マスターがまず robots.txt を作成して問題のサイトに配置する必要があります。
って書いてある。

563 :
ただ、これ使うと使った記録がいつまでも残りやがる。

564 :
>>559
前に同じ状況で依頼した事あるけど、すぐ消してくれたよ。
メアドも何も聞かれなかった。
鯖移転したのでrobots.txt置けない(サイト弄れない)とか書いてメールした気がする。

565 :
>564
そうなんですか、そういう事例聞けると励みになります(TДT)
(何で自分の時は身元証明求められるんだ…orz)
本人証明できる手段はないけど消してくれというような文を
とりあえず再度送ってはいるのですが
承諾されるのかどうか返事待ちの状態です。
(1回目の依頼の時すぐ返信来たのに2回目は中々来ない)
あと無断使用禁止の注意文を載せていたページも
キャッシュされていたのでそのページと文を主張して
前から意思表示している事も伝えました。
これでなんとかなればいいのですが。

566 :
Googleはカスラックに通報されてください

567 :
今グーグルって死んでる?
アクセスできないのだけれども。

568 :
URL自動削除システムで削除完了となっているにも関わらずしつこく掲載。。
つまり人気サイトにボイコットされるのを怖がっている検索エンジン各社。
不人気サイトは掲載すらしない、人気サイトは削除してくれない。お行儀悪い!
不人気サイトでも質が高ければそのうち人気サイトになるんだから、掲載してやれよ。
人気サイトでも、これ以上人を増やしたくないサイトもあるんだから、削除してやれよ。

569 :
>>562
robot.txtがなくても、metaタグに記載すれば削除する と書いてある。
実際に普通のサイトだとすぐにそれでも削除される。
今回分かったのは人気サイトは削除依頼をして、ステータスが{削除完了}
となっても人気サイトは削除されないということ。

570 :
>robots.txtが必要
metaタグに記入してURL削除システムで申請。それでいいんだって。

>あれは確か、受け付けてから実際に消えるまで、多少時間がかかるよ。
だからぁ、いつまで経っても消えない。以前はすぐに消えたのに。。

571 :
559=565です。
一応報告。無事今日消されました。
英語は苦手だったから神経使って凄い疲れたorz

572 :
あったお(゚ρ゚)
>Internet Archiveに削除依頼を出したのですが
>返信に そのHPにあなたの使ってるメアドを載せてくれ
>というような内容がありました。
>つまり本人確認をしたいという感じの内容でした。
アーカイブしえっ

573 :
誤爆すみません

574 :
どこの誤爆かわかった

575 :
テニスの王子様サークルヲチスレ
http://aa5.2ch.net/test/read.cgi/nanmin/1112846205/424

576 :
俺もGoogleから削除されなくて困ってる。
全くもって誰も訪れないファイルなんだけど。
もう最初の申請してから半年経つのに。

577 :
http://www.asahi.com/national/update/0501/TKY200504300227.html
>国会図書館、ネット情報収集へ 保存して一般公開
>収集対象とするのは、日本を示す「.jp」が末尾に付くウェブサイトなど日本発の情報のうち、
>一般に公開されていて、だれでも入手できるもの。メールやインターネット電話、放送などは該当せず、
>パスワードなどで管理された制限アクセス情報なども対象外だ。

578 :
orgなうちのサイトは対象外か

579 :
.npは?w

580 :
.npは終了
http://www.itmedia.co.jp/news/articles/0504/26/news034.html

581 :
>>578
IPアドレスがJPNIC管理のサイトも対象
http://www.ndl.go.jp/jp/aboutus/internet_view.html
> ◎「日本国内において発信された」とは、 JPドメインを持つサイト及びJPNIC管理の
> IPアドレスを持つサイトから発信されたものとします。

582 :
Googleって何で糞なんだ?
Googleで違法ファイルはバンバンDLできるし。どおりで
Google使ってる奴って厨だらけなんだな

583 :
国会図書館、情報保存はお堅いサイト限定 反対多く転換
http://www.asahi.com/national/update/0630/TKY200506290346.html
>「jp」の前に「go」「lg」「ac」「ed」「or」がつくサイトのみを収集対象と
>することにした。

584 :
>>583
フェアユース規定がある米国とない日本の越えられない壁だな

585 :
>>583
フェアユース規定がある米国とない日本の越えられない壁だな

586 :
俺のバカサイトは収集対象なんだな

587 :
過去にも同じ内容のカキコがありますが、質問させてください。
Internet Archiveの削除依頼の件で困っています。
依頼をメールで出したのですが、一向に反応がありません。
通常はどのくらいで削除してもらえるのでしょう…。

588 :
>>587
削除依頼専用フォームから出したか?

589 :
無料鯖だと、ろくに.htaccessもrobots.txtも置けないから、はじくの難しいんだよね。
特にweb.archive.orgが一番困る。
漏れは今のところ、metaタグはデフォとして
・ハイパーリンクに、flashやjsを使う
・サイト内にフレームなどを多用して、なるべく1枚のhtmlにすべての情報をおかないようにする(収集確率が少し減る?)
とかやって、少しでも収集確率減らそうとあがいてるけど、他に何か良い手はある?

590 :
>>589
有料鯖に引っ越す

591 :
ァ  ∧_∧ ァ,、
 ,、'` ( ´∀`) ,、'`
  '`  ( ⊃ ⊂)  '`
     ∧_∧ ミ ギャーッハッハッハッ! >>590め、何言ってんだかー!!
 o/⌒(. ;´∀`)つ
  と_)__つノ  ☆ バンバン

592 :
web.archive.orzは文章中のURLっぽい文字列も拾うからなぁ
location.href='http://www.2ch.net/';
程度じゃ無意味。

593 :
>>587
すぐやってもらえたのは3年前位までだよ。
その時もlennyタンは協力してくれなくて悲しいよって反応だったし、
頼めば消してもらえると思われてることを知っちゃったみたいだね。

594 :
ちゃんと探せば無料鯖で.htaccess使えるところあるし

595 :
最近はサブドメイン仕様でrobots.txt置ける無料鯖も多いし

596 :
Googleにrobots.txtを使ったURL削除申請をした後で、そのURLを復活させるのはどうすればいいのだろーか。。。
いったん削除申請して完了されてしまうと、金輪際それを含むURLはヒットしないのかなぁ。。。orz...

597 :
>>596
robots.txtを戻してURL申請してみなされ

598 :
>>597
状況かわんねっす。。。
180日間の喪があけるのを待つしかないのかなぁ。。。

599 :
URLの削除の申請から180日経過してもまったく状況が変わりません。
URLの削除のところにログオンしてもステータスは「完了」のまま。
2003年のキャッシュの削除の申請については「期限切れ」になっているんだけど。
Googleの問い合わせられるフォームやらメールやらは英文も含めて全部問い合わせたけど、音沙汰無し。
まあ、Yahoo!やらMSNやらでは普通に検索ヒットするから別にいいんだけど、
今の状態だとGoogle AdSenseが使えないというのがなかなか痛い。。。

600 :
この件ですが、何日か遅れて期限切れ扱いとなり、無事表示されるようになりました。
ただ、Googleから「こっちでサーチしたら引っ掛かるよん」という返信メールがあって確認したらそうなっていたので、
ひょっとしたらGoogle側で何かダマテンで作業をしてくれて、そのお蔭で復活したのかも知れません。

601 :
作成時にrobots.txtをおいて
metaタグまで記入したのにグーグルから検索できたんだけどどういうこと?

602 :
スペルミスとか。

603 :
web.archive.orgやalexaでhomepage2.nifty.comなど一部のドメインがブロックされてる模様。

604 :
blocked site error

605 :
         ,. -─‐- 、
         , '´        ヽ
       /  /ヽ\     ヽ
     /  /   `、 \ ヽ   ゙,
      .i   i     ヽ、`ヽ、 \ ',
     i   !.  ==、  `ヽ、`ヽ、!
     |  l丁 ̄ ̄`i-f´ ̄`ヽ、ヽ !
     |  !.ヽ --‐'  `ー‐一1ヽi
     |  i     i  丶   ! ,'
      !  !    `ー '"   ,' i      ホームページのダウンロードや印刷は禁止します
     i  /ヽ    ー一'  /ヽ、!       アーカイブも禁止します
       V   \ ,、     .// ヽ 、_
  .r'"´ ̄ |.   /,へっ‐'" /  i  ``'‐- 、
 /  / | / く★へ ,. へ、. l         ヽ
./   ⌒ /     /`)   ヽ/        i

606 :
dobai

607 :
あどふぃ
武運

608 :
このスレ初めて読んだ。
まあWebArchiveだとかGoogleCacheだとか嫌がる人はいるだろうなとは想像できるけど、
ネットに公開している以上そんなの気にしていられない、というのが個人的感想。
はっきり言って、世の中の大半の人にとっては
俺たちが過去にどんなサイトを作っていたのかなんて全く興味ないわけで。
なんだかとっても自意識過剰っていう感じ。

609 :
>>608
同意。問題は著作権なんだよな。
転載みたいなものだし…

610 :
>>609
URLで出所が明示されているわけだし転載じゃなくて引用でしょ。
引用は著作権的にOKだから問題ないと思うけど。

611 :
自分のサイト内の該当ページを既に削除していたとしても、
検索エンジンに該当ページがキャッシュとして残っていた場合、
そのキャッシュが原因で企業からヤバイ警告とか来ますか?

612 :
Googleのキャッシュはまだしも、Webarchiveみたいに自分が削除しても半永久的に残るのは嫌。

613 :
>>610
日本の法律での引用の条件を満たさないので、引用とはみなされない。
出典の明示だけじゃなくていろいろ条件があるから調べてみれ。
普通に考えれば、まるごと転載して「引用です」なんて通るわけがないわな。

614 :
>>610
あれは、引用ではなくて「まるごと転載」…。
転載も出典を表示してれば問題ない…ということはない。
613も言ってるように、引用と転載はまるっきり違う。

615 :
Yahoo!検索の[ウェブ検索]で利用しているインデックスクローラー(検索エンジン用ロボット)は
Yahoo! Inc.が管理、運営しています。なお、Yahoo! JAPANでは個別のサイトや検索結果に表示
される内容について削除のご依頼をいただいても、依頼内容の正当性や、削除権限の有無を確か
めることができないため、ご依頼を受け付けておりません。
http://help.yahoo.co.jp/help/jp/search/indexing/indexing-12.html
ってあるんだけど404を返すdeadlinkについては正当性も糞もないよね
プライバシー上の理由で早急に削除しないといけない場合もあるのに
これはきつい

616 :
キャッシュ(アーカイブ=書庫)って何のためにあるの?
リソースが削除されても見れるように?

617 :
そうそう……
でも一応「次回のクロール時にnot foundなら削除」とは書いてあるのね
で、いつ次回のクロールが来るかはyahooが決めるわけ
これっておかしくない?
その文書の著作権者がcacheも管理すべき

618 :
ファイル自体を消すより内容を空白に書き換えたほうが
実質的に速くキャッシュから消せるということ?

619 :
全然違う

620 :
昔作っていたHPがググルのキャッシュに残っている事を知り、
今日の朝、緊急で削除申請したらキャッシュは無事削除された・・・
でもまだ検索結果にページタイトルと以前ページに書いてた文章が表示されるんだよね
この表示結果も削除したいんだけどどうすればいいの?

621 :
もっと待て。
それから、過去を隠すな、女々しいゾ。

622 :
女々しいとかそういう問題じゃないだろ?
なんでそういう根性論精神論に持ってく馬鹿ばっかなんだろう
やってらんないね

623 :
冗談のわからん奴よな。>>75既出。

624 :
既出ってか自分の書き込みだろw

625 :
>>624 いまさら何を。女々しいぞ、ト。

626 :
差別語を連呼

627 :
キ○ガイさんはスルー。
議論もできない腰抜けか
どっちが女々しいんだか

628 :
>>615
Rしろ。前例を作るのだ。

629 :
でらえもん調査局の話しようぜ

630 :
         ,. -─‐- 、
         , '´        ヽ
       /  /ヽ\     ヽ
     /  /   `、 \ ヽ   ゙,
      .i   i     ヽ、`ヽ、 \ ',
     i   !.  ==、  `ヽ、`ヽ、!
     |  l丁 ̄ ̄`i-f´ ̄`ヽ、ヽ !
     |  !.ヽ --‐'  `ー‐一1ヽi
     |  i     i  丶   ! ,'
      !  !    `ー '"   ,' i      ホームページのダウンロードや印刷は禁止します
     i  /ヽ    ー一'  /ヽ、!       アーカイブも禁止します
       V   \ ,、     .// ヽ 、_       法律は糞くらえだ俺が嫌だと言っている
  .r'"´ ̄ |.   /,へっ‐'" /  i  ``'‐- 、
 /  / | / く★へ ,. へ、. l         ヽ
./   ⌒ /     /`)   ヽ/        i

631 :
アーカイブ使えばフラッシュ取り放題だぜー

632 :
ぅーん…。
ずっとこのままなのかな?
嫌って思う人の方が多いんだったら、
アドレス入れて削除ボタン押したら削除できるように…
とか、しなきゃいけなくなると思うんだけどなぁ〜…
Archive.orgとかの存在を知ってる人が増えるほど…
読まれたくない・読まれて嫌な思いをした…って人も増えるし…
「消したくなったら消せるから」って気持ちだって、大事にしてあげよう?

633 :
>嫌って思う人の方が多いんだったら、
>アドレス入れて削除ボタン押したら削除できるように…
はっきり言って気にしてる奴は圧倒的に少ないと思われ。
ネットに公開する時点でそんなの気にしてられん。
まあ、
>「消したくなったら消せるから」って気持ちだって、大事にしてあげよう?
この意見には賛成だけどね。
保存されない自由というのもあって然るべきだとは思う。
ただしそうなると本人の確認手段が必要になるね。
サイトを持ってる段階ではその主張もできるけど(GoogleSitemapのようなチェックで)
サイトを消した後での本人確認は非常に難しいわけで。
それらを考えていくと結局、
archiveとしてとっておくメリット>archiveを消すメリット
になってしまうんだと思うよ。企業側からすれば。

634 :
ドバイ

635 :
載せたなら消すな
消すなら載せるな

636 :
Wayback Machine 止まってる?

637 :
たぶん
使えないと不便

638 :
Page not found
We’re sorry, the page you have requested is not available.

639 :
やはりそうか
早く復旧しないかな

640 :
>>636-639
復活したようだ

641 :
>>640
見られるページと見られないページに分かれてないか?
見られるページも文字化けばかりだし見られないページは開いても真っ白だし

642 :
文字化けは、エンコードを日本語にしてやれば読めた。
しかし、たしかに前はそんな手間は要らなかったな。

643 :
Robots.txt置いてもう2週間経つけどWayback Machineからまだ消えない・・・
8週間以内に本当に消えますか?

644 :
載せたなら消すな
消すなら載せるな

645 :
今、Wayback Machine 止まっている?
しれとも他の人はアクセスできてる?

646 :
今、止まってますね。“HTTP 400”になるよ。
http://web.archive.org/collections/web/advanced.html

647 :
英語できる人強制的にUTF-8にすんなってフォーラムに書いてきて

648 :
Googleのキャッシュ死んでね?

649 :
【ネット】すでに閉鎖された貴重なホームページ、国会図書館で10日から利用可能に
http://news19.2ch.net/test/read.cgi/newsplus/1152443555/

650 :
>>642
リンク開く度に文字化けするね

651 :
webarchive見られないぞ!?止まってんの???

652 :
最近調子悪いな

653 :
そうなんだ。そのまま消滅してくれても構わんっていうか、消えて
しまえと思うことが時々あるけどなw

654 :
誰かgoogleに有用な検索ワード入れてコピって
このページはグーグルのキャッシュのキャッシュです。
っていうのやらないか?
最近のgoogleは広告多いし、検索精度落ちてる気がする。

655 :
>>654
「googleは広告多いし、検索精度落ちてる」以上、そのキャッシュもいずれ
精度が落ちるね。
なので、グーグルのキャッシュのキャッシュのキャッシュが必要になる罠。

656 :
Google検索っておかしくないか。。。w
「php」で検索してすぐに”国境なき医師団日本”だの”FM802”ってw

657 :
なんかGoogleからメールが来た。
robots.txtがあるからクロールできないので、クロールできるように書き換えてくれって。
いや、クロールされたくないからrobots.txt置いてるんだけど。

658 :
まじで?Googleからそんなメールが本当に来るんか・・・?詳しくきぼん

659 :
件名: Google インデックス登録お願い
こんにちは、お客様のサーバーでは robots.txt ファイルを使って検索エンジン
からのアクセスを制御しているため、現在、Google では、お客様のサイトをク
ロールすることができません。 そのため、携帯電話をお使いのユーザーが、
Google を使ってお客様のサイトを見つけることができません。 インターネット
ユーザーの大多数は Google を使用して検索を行っており、検索エンジンからの
参照のうち 50 % 以上は Google からの参照です。 Google の使命は、Google
独自の検索エンジンにより、世界中の情報へのアクセスを可能にし、ウェブ上の
検索経験をより実りのあるものにすることです。 Google では、ユーザーや顧客
がお客様のサイトを簡単に検索できるようお客様のサイト
xxx.xxx.co.jp を Google のインデックスに登録したいと考えて
おります。 Google からのクロールを許可していただける場合は、robots.txt
ファイルに次の行を追加していただくようお願いいたします。 User-agent:
GooglebotDisallow: クロールを許可していていただいてから 4 〜 6 週間後に、
Google のインデックスにお客様のサイトが登録されます。 Google のインデッ
クスにお客様のサイトを登録する方法の詳細については、下記の URL をご覧く
ださい。http://www.google.co.jp/webmasters/. Google がお客様のサイトをよ
り効率良くクロールするようにするには、サイトマップを作成することをお勧め
します。 詳細については、下記の URL をご覧ください。
http://www.google.com/webmasters/sitemaps/docs/ja/about.html今後とも
Google をよろしくお願いいたします。今後、Google インデックスへの登録に関
するメールが不要な場合は、メールにてご連絡ください。お客様のメール アド
レスを Google のメーリング リストより削除いたします。ChrisGoogle クロー
ラーチーム

このメールアドレスは、以前サイトの削除依頼(インデックスからの)を
したときに使ったもので、その時リストに登録されたのかも。
ただ、依頼したサイトと今回のサイトは違うところなんだが。
サイトもメールアドレスもinfoseekのものなので、そっち絡みかもしれん。

660 :
ひぇ〜 検索される価値のあるサイトってことか…

661 :
ネタだよ、ネタ。
今は、英語による回答のみだよ。

662 :
Googleは高度な機械化がモットーなのに、そんなメールを送信してるとでも?

663 :
ノリ悪いなw

664 :
自分もそのメール来たよ。移転跡地とはいえクロールしてほしくないから
放置してたら、返事の催促メールみたいなのも来た。
今回メールの対象になってるアドレスがinfoseekなんだが、やっぱり
>>659の言うようにinfoseek関連なんだろうかね?

665 :
このスレにとってある意味最悪の嫌がらせ
ttp://megalodon.jp/?url=http://pc8.2ch.net/test/read.cgi/hp/1026114886/&date=20061014192427

666 :
>>587
Internet Archiveに何としても削除させたい奴は行動を取れ。
うちは口調の厳しい英文で数回抗議して削除させた。
90年代の、METAタグでアーカイブ除けをしてなかった頃のページをな。
相手は横柄な外人だ。
生易しい「お願い」では無視される。
多少厳しい口調で抗議しても一回目は
「ようジャップお前本当にそのサイトの管理人か?」とからかわんばかりの返事が来た。
うちは昔から無断転載禁止と明記していたので
「何勝手に載せてんだこれが読めねぇのかゴルァさっさと消せ」という意味の抗議文を送ってやっと削除された。

667 :
>>666
よっぽど残されてほしくないコンテンツ持ってたんだな。
>>1-665
みんなで集団突撃してウェブ魚拓潰そう!

668 :
>>630
ネタレスなんだけどスレ住人の総意はマジそれだよな

669 :
魚拓ってBasic認証下のページって取れるの?

670 :
age

671 :
検索はして欲しいんだけどキャッシュは表示しないで欲しいんだ
robots.txtでNOARCHIVEと同等の設定ってできないのかな

672 :
         ,. -─‐- 、
         , '´        ヽ
       /  /ヽ\     ヽ
     /  /   `、 \ ヽ   ゙,
      .i   i     ヽ、`ヽ、 \ ',
     i   !.  ==、  `ヽ、`ヽ、!
     |  l丁 ̄ ̄`i-f´ ̄`ヽ、ヽ !
     |  !.ヽ --‐'  `ー‐一1ヽi
     |  i     i  丶   ! ,'
      !  !    `ー '"   ,' i      ホームページのダウンロードや印刷は禁止します
     i  /ヽ    ー一'  /ヽ、!       アーカイブも禁止します
       V   \ ,、     .// ヽ 、_       法律は糞くらえだ俺が嫌だと言っている
  .r'"´ ̄ |.   /,へっ‐'" /  i  ``'‐- 、
 /  / | / く★へ ,. へ、. l         ヽ
./   ⌒ /     /`)   ヽ/        i

673 :
>>669
htaccessが効いていたので、多分取れないとオモ。

674 :
<meta name=”robots” content=”noindex,nofollow”>
<meta name="Robots" content="NoArchive">
ここでは下段のメタタグが上げられていますが、
上段のタグとの違いは何でしょうか。
http://www.archive.org/web/web.php
また、上記でアーカイブされちゃっているページを削除願う方法を
どなたか伝授下さい。

675 :
>>674
別スレに書いてあるよ

676 :
InternetArchiveにしつこくメールしてやっと消してもらえた。
>>666を参考に毅然と。
OK Robots.txt置いてありますねーわかりましたそのうち消しますね
的な返事が来て、でもいつまで経っても消されないからまたメール送る
→そのうち消しますねーという返事→メール送る→返事→・・・
を4,5回繰り返した。
info@archive.org じゃなくて wayback2@archive.org にメールしたら
やっと消してもらえるっぽい対応の返事が来た
(でも送るアドレス変えたことが本当に対応してもらえるきっかけだったかどうかはわからない)
>>666みたいなの、そのサイトの管理人だと証明しろっていう内容
証明方法は自鯖にそのサイトの管理人でありArchiveから早く削除しろってtxtをうp
今は解約しちゃってもううpできない古いサイトも一緒に消してもらいたかったんで
「解約しちゃったから証明文うpできないけど、古いサイトに書いてある管理人名も
 今のサイトの管理人名も一緒でしょ」って説明したらわかってもらえたらしく削除成功

677 :
>>676
日本語でおk?

678 :
なんでそんなに過去を消したがるのか、理解に苦しむ。

679 :
>>677
英語で。メール内容はこんなかんじのを送りつけた
翻訳エンジンで英語にしたものそのまま貼り付けただけだけど
私のサイトデータを消しなさい
二度とクロールするな
Robots.txtを置いたから早く見ろ
出来る限り早く削除しろ

680 :
so-netってRobots置けないんだけど、これがインデックスされない原因かな?

681 :
>>680
インデックスされないのと、 robots.txt は関係ない。

682 :
私のサイトデータを消しなさい
二度とクロールするな
Robots.txtを置いたから早く見ろ
出来る限り早く削除しろ

683 :
>>678
本人に無断で、しかも商用で使われてるのが気にいらないだけ。しかも公にも公表してない。
過去を消す云々はどうでもいい。
一言「あなたのサイトを保存して半永久的に商用に利用していいですか?」
というメールがこれば少しは納得するかもな。
でも答えは「No」だがな。

684 :
削除依頼送ったがどの程度で返信が来るのやら。

685 :
>>683
つまり>>672と言いたいわけだね。

686 :
激しくすれ違いだけど他にアーカイブスレがないので、ここで聞かせてください。
ウェブアーカイブで検索結果のうらるに「sr_nr_」を反映させるには、
フォームタグ内にどんなvalue= name= を既述したらいいのかなあ(´・ω・`)

687 :
日本語でおk

688 :
>>688
スマソ(´・ω・`)

689 :
>>686>>688
自己解決しました(´・ω・`)

690 :
marsflag.comとかいうリファラが残っててクロールされてることを知ったが
こいつを拒否する方法がさっぱり分からん。
サイトにも拒否方法はまったく書いてないし、偽装してるのかアクセスログからもそれらしき物が見つからない。
とりあえずリファラを弾いておいたが、何か知っている人いたら情報求む。

691 :
ttps://www.marsflag.com/contact/other.html
各種お問い合わせ その他
MARS FLAG では、たくさんのご利用者様からのご意見などの
お問い合わせを受け付けております。 お気軽にお問い合わせください。

692 :
IPで弾け

693 :
>>一言「あなたのサイトを保存して半永久的に商用に利用していいですか?」
>>というメールがこれば少しは納得するかもな。
>>でも答えは「No」だがな
↑ 
ギャグです。
笑ってあげてください。

694 :
にはは

695 :
>>693
>>一言「あなたのサイトを保存して半永久的に商用に利用していいですか?」
コンテンツを金で売る企業があるのか。
2chのdatなら買ってやってもいいがw

696 :
勝手にいい加減なタグを書き加えてデタラメなHTMLにされるのが嫌だからnoarchiveしてる。
そんなくだらない理由で?って思われるだろうけどね。

697 :
うん、思う。
神経質っていうか病的って言うか、キモい。

698 :
世間じゃGoogle八分にされたとか喚いてる人もいるが・・・
robots.txtで拒否し、NOINDEXと書いてても、Googlebot君は熱心に
巡回に来ては、検索結果に載る俺のサイト。。。

699 :
>>698
うちもそう。いくらrobots.txtで拒否、NOINDEXと書いてもスルー。
あらゆる検索エンジンに登録されまくり。index削除をお願いしても無視。
もう、.htaccessしかないね。
でも近いうちにGoogleにだけは弾くのを止めるつもり。検索エンジンの中では
もっともタグ指定に素直だし更新頻度も早く、アクセスして欲しいキーワードで
きっちりと上位に来るから。
ぐぐれは最強やね。

700 :
うちも。
いちおう、noarchiveが効いているのか、キャッシュはされないし
titleの表示やbodyのダイジェストは表示されないものの、
きっちり検索結果に載る・indexはされている んだよなぁ。謎。

701 :
ウェブ魚拓うぜえな

702 :
前弾き方を紹介してるサイトを見つけたんだけどなくなってるみたいだから転載
やり方メモっておいただけなんでほんとうにこれで弾けるかどうかは知らない

利用しているサイトのディレクトリトップに、
こういった名前のファイルをまず作る。
.htaccess
これが何かはとりあえず無視しておいてくれ。
ファイルの内容に以下の文を記述する。
Deny From 216.237.124. 59.106.19.92
少し幅を取っているが、
これで魚拓されなくなる。
少し解説しておこう。
.htaccessとはApacheというWebサーバのディレクトリ単位の設定ファイル。
さくらインターネットの様なレンタルサーバを使っている場合、
大体これが搭載されている。

703 :
Deny Fromというのは
「ここからのアクセスは禁止しますリスト」のことで、
IPアドレスやドメイン名を指定することが出来る。
SPAMを排除したりする場合に利用される。
まぁ、ようするに「ウェブ魚拓」をSPAMリストに入れるって事だ。
ウェブ魚拓のIPアドレスは
216.237.124.114
その他のサービスは
59.106.19.92
で行っているようだ。
59.106.19.92はさくらインターネットのアドレスのようなので、
苦情はさくらインターネットにした方が良いかもしれない。
「〜がやっているサービスで迷惑してます」的な内容をさくらインターネットに送ってあげると良い。

704 :
igWebCapもウゼェ。baiduやnaverより酷い。

705 :
そして「ニコニコブックマークうぜえ」とは誰も言わないのが2ch的だなw

706 :
そもそも存在感がない

707 :
marsflag 怖ぇよ。文面1,2行しか出てこない。
画面のキャプからは、元の文面なんか当然読み取れない。
利用者勘違いするって。
で、登録の削除を依頼しようとすると、名前だのメールアカウントだの要求してくんのな。

708 :
robots.txtもmeta(noindex,nofollow,noarchive)も無視しておいて
利用者向けにはごちゃごちゃと規制を掲げてやがるし、まじウザイよな。

709 :
俺の心境はまさしく>>672だわ。
ブラウザでの閲覧以外認めたくないし、手元に残されたくもない。
つかみんなで魚拓潰さない?
どうでもいい大容量のページの魚拓とらせまくってディスク浪費させるのはどうよ。

710 :
marsflagの足跡を確認している人、IPを報告してもらえたら助かる。
そうすれば禁止できるIP範囲を把握できると思うから。
ウチはまだ形跡が無いんで協力できないが…。

711 :
【くやしいのう】  はだしのゲン公式サイトがグーグル八分  【ギギギ…】
http://news23.2ch.net/test/read.cgi/news/1187336779/
はだしのゲン公式サイトがグーグル八分?
「くやしいのう。くやしいのう。」で有名な(っていうか、原作読んだこと無い)、「はだしのゲン」の
公式サイトがグーグル八分されているらしい。
http://www.kamatatokyo.com/home.html
調べてみると確かに検索にはヒットしないし、「サーバーの設定でキャッシュを禁止」するなど、
技術的にGoogleに嫌われる要素も存在しないようだ。グーグル八分表示は出ないが、アメリカ
Googleで検索しても表示されないため、全世界グーグル八分が行われている可能性がある。
すなわち、それは「アメリカの法律に反している」ということを意味する。
原爆の悲惨さを伝えるのは、アメリカでは違法なのかな?
http://beyond.cocolog-nifty.com/akutoku/2007/08/post_4be4.html
「はだしのゲン」でググった結果は↓
http://www.google.co.jp/search?hl=ja&q=%E3%81%AF%E3%81%A0%E3%81%97%E3%81%AE%E3%82%B2%E3%83%B3&btnG=%E6%A4%9C%E7%B4%A2&lr=

712 :
とりあえず「Google 宛に送られた法的要請に応じ(ry」の文面は出ないっぽいな

713 :
うちが使ってるWeb魚拓弾きおいとくわ
#Web魚拓
deny from 216.237.112.0/12

714 :
>>710
marsflagにアーカイブされているのを見つけたんでアクセスログを漁ったが
特定が出来なかった。どうもほかのbotみたく特徴的なHost名やUA吐いては
居ない気がする。画像じゃなく普通にページのキャッシュを閲覧できるのなら
ページに埋め込んでいるunix timeで特定できたんだがな・・・・

715 :
質問です。
/index.php?page=1, 同page=2, 同page=3 ...というURLのファイルをrobots.txtで拒否するとき、
「pageではじまる全てを拒否する」ように指定するには、どう書いたらよいでしょうか?
全てのjpgファイルならば、
User-agent: *
Disallow: /*.jpg$
でよいようですが、それとも一つ一つ書くしかないのでしょうか?

716 :
METAタグ書けば?

717 :
レスどうもです。やはり正規表現ではできませんか。
meta要素でも一つ一つ書いていくしかないような?

718 :
鯖設定で弾いた方が早そうだ。

719 :
>>715
Googleのロボットは、
User-agent: Googlebot
Disallow: /*.jpg$
は理解できるはずだよ。
だけど、ロボット全部に対応するなら、htaccessの方がいいと思う。

720 :
>>718
あ、たしかに。
思えばphpで吐いてるんだから、meta要素を挿入するのもそんな手間でもないんでした…

721 :
困ったらなんでも仕様書見るといいですよん。
http://www.robotstxt.org/wc/robots.html
見れば分かるけど、こった事なんて全然出来ない。正規表現やワイルドカードだって
規定されてない。
http://www.robotstxt.org/wc/norobots-rfc.html
ってのも有るけど提案のレベルらしい(1997年に提出された案なのにその段階
にとどまっているという事は…)。
W3Cのまとめた物もある。
http://www.w3.org/TR/1999/REC-html401-19991224/appendix/notes.html#h-B.4.1.1

正規表現は現状Googlebot独自ルール状態。更にrobots.txtは紳士協定なので
従わないbotだってゴマンといる。.htaccessで処理した方が早いと思うよ。
Googleだけで良いのなら、Googlebotの解説を読めばよろし。
http://www.google.co.jp/support/webmasters/bin/topic.py?topic=8843
あなたの例なら以下の記法でいけます(実際ウチは似たような設定で成功している)。
User-agent: Googlebot
Disallow: /index.php?page=*

722 :
googleに限って言えば、
sitemap生成してるんなら、あとは全部ブロックしてもよくね?

723 :
全部ブロックしたらクローリング出来ないじゃん

724 :
ああ、sitemapも獲れんかw

725 :
バカスw

726 :
User-agent: ia_archiver
Disallow: /

727 :
http://web.archive.org/ が、昨日からずっとつながらないよ。どうしたんだ一体。
……と思ったら、たったいま復活した。

728 :
このところ接続悪いな。 http://web.archive.org/

729 :
検索避け支援wiki
http://www34.atwiki.jp/norobot/

730 :
162 名前: ekken [simauma_dx@mail.goo.ne.jp] 投稿日: 2007/07/18(水) 12:38:17 ID:eO6yKRYW
いいじゃないか
アンタらのブログはアクセス数にこたわらなければならないほど、立派なないようなのか?
↓コイツ、バカだねぇ
70 名前: 名無しさん@八周年 投稿日: 2007/07/18(水) 12:31:04 ID:wL1uswPu0
http://ibuling.blogspot.com/
2007年7月14日
Googleの広告審査能力は0に等しいのね(´・ω・)
名もなきネット人狙い撃ちで陰口を叩き、独り悦に入る魂の障害者、それがekken
時流に乗った新興産業の個担当者部分に媚を売り、おこぼれに預かろうとするコバンザメネット業者、それがekken
現在ネット上には八百萬のekkenがいる…
投稿者 ? 場所 16:52
つーことで、 どいつもこいつも
http://d.hatena.ne.jp/mobanama/20070911#p1
http://18.dtiblog.com/n/nekora/file/22362134.htm
http://d.hatena.ne.jp/kana-kana_ceo/mobile?date=20070928
http://homer2007.blog86.fc2.com/
http://ahonosatoshi.blog82.fc2.com/
http://3.dtiblog.com/h/homer2006/file/21470389.htm
自らはブログサービス提供はおろかパーツひとつ貸し出しもせず、登録者がオール他社サービスで作成したブログ記事をPING送信させて広告掲載頁に表示し座したまま広告収入を得、
ひとたび広告に対する苦情がでるや広告元を悪者にしていい子になり、更にはうっとうしいスパムメールを送りつけるだけでは飽き足らず自らの管理義務の一部を登録者に押し付けた挙句、権限濫用で都合のいいように頁を改竄し外面をよくして新規登録者を誘い、
あまつさえ無料サービスだと大威張りで恩を着せる「にほんブログ村」ことムラウチドットコム。
匿名であろうと実名であろうと、図々しい人が得をする。

731 :

俺はグーグルADを踏まないように、
↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓
C:\WINDOWS\system32\drivers\etc\hosts
hosts をメモ帳で開く
127.0.0.1 localhost
0.0.0.0 pagead2.googlesyndication.com
保存
↑↑↑↑↑↑↑↑↑↑↑↑↑↑↑↑↑↑↑
ってしてんだけど、みんなは?

もちろん、TV新聞雑誌に広告を出してる会社は
何か悪いことをしてるから口封じにアドを使って
糞カスゴミ・広告代理店に献金してるんだと思うよ。


732 :
ttp://web.archive.org/collections/web.html
これにキャッシュとられっちゃったらもう消す方法ないですか??

733 :
robots.txtで消える

734 :
キャッシュ取られたサイトはもうないんです・・・

735 :
諦めるがよい

736 :
このサイトって管理人にメール送れないんですかね・・・

737 :
サイト作るときは必ず<meta name="Robots" content="NoArchive">入れてる

738 :
         ,. -─‐- 、
         , '´        ヽ
       /  /ヽ\     ヽ
     /  /   `、 \ ヽ   ゙,
      .i   i     ヽ、`ヽ、 \ ',
     i   !.  ==、  `ヽ、`ヽ、!
     |  l丁 ̄ ̄`i-f´ ̄`ヽ、ヽ !
     |  !.ヽ --‐'  `ー‐一1ヽi
     |  i     i  丶   ! ,'
      !  !    `ー '"   ,' i      ホームページのダウンロードや印刷は禁止します
     i  /ヽ    ー一'  /ヽ、!       アーカイブも禁止します
       V   \ ,、     .// ヽ 、_       法律は糞くらえだ俺が嫌だと言っている
  .r'"´ ̄ |.   /,へっ‐'" /  i  ``'‐- 、
 /  / | / く★へ ,. へ、. l         ヽ
./   ⌒ /     /`)   ヽ/        i
元ネタよくわからんがいい言葉だよね。

739 :
裏ワザ?バグ?Googleで検索した画像が踊りだす技
http://news.ameba.jp/hl/2007/11/8504.html

740 :
何がバグだwwwwwwwwwwwwwwwwwwww

741 :
教えてください。
インターネットの、過去に消されたページを見ることができるらしいいのですが、
その方法を教えてください。
アドレスをどうすれば、そのアドレスの過去を見ることができるのでしょうか?

742 :
スレチ

743 :
>>741
Internet Archive
http://www.archive.org/index.php

744 :
アンチアーカイブスレで何紹介してんだw

745 :
ここInternet Archiveの話題もおK?
削除済みの古いコンテンツ拾われてたの気付いて
慌ててロボテキ入れたら、無料鯖だけどすぐブロックされてほっとした
それはよかったけど、半年くらい置いてサイトごと削除したら
またキャッシュ復活しちゃうんだろうか?

746 :
>>745
他板に専用スレがある。
Internet Archive総合 (web.archive.org) #1
http://pc11.2ch.net/test/read.cgi/esite/1189771222/

747 :
ウェブアーカイブというサイトで、
昔消えたサイトを復元できますが、それをされないようにサイトを作ることはできますか?
HPの製作者が消した後なら、
ウェブアーカイブに残らない、なんてことを聞いたこともありますが、
そんなことありえないですよね?
あるいは、文字化けして、どっちみち見れないようなものとして表示される、
とも聞きましたが、それも間違いですよね?

748 :
>747
なんですぐ一つ上のレスも読めないのかと。
さすがGK。

749 :
任豚きめえ

750 :
↓対策はスレ違いですか?
ttp://www.existingproof.jp/

751 :
>>738
ちょwオサレ先生www
元ネタは、ジャンプ連載漫画「ブリーチ」の作者が、
Webサイトで絵を公開してたときの日記。
>法律もウェッブルールもクソ喰らえだ。 俺が嫌だと言ってる。
少し改変されてるな。

752 :
>>750
ウェブ魚拓臭漂うサービスだね
リモートホスト:www.existingproof.jp
IP:210.250.55.120
UA:Java/1.5.0_11
キャッシュする時にこれらを吐いてくるからdenyするとよろし
リファラは吐かなかった

753 :
ウェブ魚拓も>>750のところも自分の所は保存できなくしてるな

754 :
検索避けwikiが死んどる

755 :
webarchiveさー、robots.txt置いて、何度もクローラー読み込ませてるのに
普通に過去のデータが出るんですけど…
たまにRobots.txt Query Exclusion.が出るだけで…
なんなんだこのサイト運営してる連中は…?
本人確認できないと削除しないとか…
サーバ契約延長期限ギリギリに気づいてよかった…

756 :
魚拓のFAQに、
(1) 以下のMETAタグをHEADタグ内に書く
<meta name="robots" content="noindex,nofollow">
(2) ルートディレクトリにrobots.txtを設置して、"Megalodon"が取得不可能なパスを指定する
なお、robots.txtはキャッシュしておりますので、変更が反映されるまで長くて3日かかります。
って書いてあるんだが、

---------------------------
User-agent: Megalodon
Disallow: /
---------------------------
これで弾けると思う?
てか、魚拓のUAって一定だったっけ?
魚拓はじきの情報が載ってるのって、検索避け支援WIKIだけだったからな……

757 :
しかしむかつくのは、レンタルブログなどの場合、ロボテキもHTACCESSも設置出来ないから、
メタタグを仕込むことになるけれど、(1)のタグだと他のまともな検索エンジンまで巻き添えで
弾くことになっちゃうじゃないか。どんだけ悪質なんだよ魚拓。

758 :
>>756
ちょとと違う話だが、
ルートディレクトリをさわる権限が無くrobots.txtはおけず、Google等には
indexされて欲しいけど、魚拓は拒否りたい…って場合でも
<meta name="robots" content="noindex,nofollow,noarchive">
しか受け付けてくれないんだよなぁ。
<meta name="Megalodon" content="noindex,nofollow,noarchive">
に対応して欲しいが、問い合わせも無視され中。

759 :
>>758
deny from 216.98.130.25
deny from 216.98.130.26
deny from 71.6.145.82
deny from 71.6.145.92
今はこれで弾けるみたい

760 :
ごめん、>>756に対してだった
ちなみにウチにくる魚拓はFirefoxを偽装してくるんだがこんなもんなのか?

761 :
>>759
.htaccess使えればいいんだけどねぇ

762 :
>>755
削除してもらえよ

763 :
>>762
日本語でおk

764 :
>763
削除依頼メール出して手動で削除してもらえって意味だろ。
日本語でおkって返すほどのレスじゃない。

765 :
>>755 本人確認できないと削除しないとか…

766 :
サーバ契約中なら削除できるぞ

767 :
>>759
それだけじゃないぞ
ttp://megalodon.jp/?url=http%3A%2F%2Fwww.ugtop.com%2Fspill.shtml&type=simple

768 :
OrgName: Google Inc.
OrgID: GOGL
Address: 1600 Amphitheatre Parkway
City: Mountain View
StateProv: CA
PostalCode: 94043
Country: US
NetRange: 66.249.64.0 - 66.249.95.255
CIDR: 66.249.64.0/19
NetName: GOOGLE
NetHandle: NET-66-249-64-0-1
Parent: NET-66-0-0-0-0
NetType: Direct Allocation
NameServer: NS1.GOOGLE.COM
NameServer: NS2.GOOGLE.COM
NameServer: NS3.GOOGLE.COM
NameServer: NS4.GOOGLE.COM
Comment:
RegDate: 2004-03-05
Updated: 2007-04-10
OrgTechHandle: ZG39-ARIN
OrgTechName: Google Inc.
OrgTechPhone: +1-650-318-0200
OrgTechEmail: arin-contact@google.com
# ARIN WHOIS database, last updated 2008-04-30 19:10
# Enter ? for additional hints on searching ARIN's WHOIS database.

769 :
http://bookmarks.yahoo.co.jp/promo-about
Myブックマークをほかの利用者に公開することもできるので、情報・知識を共有でき、新しい発見が生まれる!

770 :
魚拓みたいなのをとられるのが嫌でこんかい初めてrobots.txtなるものを
自サイトにも上げて、とりあえずウェブ魚拓からのアクセスは禁止にしたん
だけど、他に似たようなサイトはどんなのがありますか?
そういうの嫌いなんで片っ端から拒否したいんですけど、よければ
みなさんのrobots.txtの設定を教えてくださいませんか。

771 :
>>770
もううざいから拒否型じゃなく許可型にしてる
どうせgoogle.yahoo,msぐらいだからな

772 :
ものすごく本末転倒感が

773 :
ブログで魚拓を拒否するにはどんなタグを入力したら良いんでしょうか?
普通のサイトみたいにrobots.txtをアップロードするというやりかたができないので
よくわからなくてちょっと困ってます。

774 :
noindex

775 :
>>771-772
Basic認証にする方が手間かからなくていいよね

776 :
「ウェブ魚拓」に音声投稿機能、「音声を証拠として残すために」
ttp://internet.watch.impress.co.jp/cda/news/2008/05/28/19728.html
懲りない連中だ

777 :
「丸ごと」はGoogleやYahooなどの検索エンジンのキャッシュと同レベルの強さしかありません。
それらのキャッシュと同様に、「インターネットに公開されているコンテンツは、より広く知られることを望まれているはずだ」という
暗黙の前提のもとに無断利用しているだけなので、本人から削除依頼が来たら原則的に削除しなくてはなりません。
「引用」はそうではありません。
「引用する」で取得する場合の「範囲を絞る」「特定のリンク元からのアクセスでしか表示しない」は、日本の著作権法を
考慮して本人から削除依頼が来ても合法的に削除を断れるように考えられています。
どうすれば魚拓を削除せずに済むのかを考えて作った機能なので、ぜひ利用していただきたいです。
あまりにも素敵過ぎるQ&Aに( ゚д゚)ポカーン

778 :
>>777
その手の物言いしてると、民事じゃなくていきなり刑事でやられるかもね。

779 :
魚拓の中の人って、きっと過去に
おっと、誰か来たようだ。

780 :
ページの丸ごと転載やら音声のアップロードやら、鬱陶しいことばかりしてるな
ところで魚拓の中の人のブログが昔はあった気がするんだが誰か知らない?

781 :
要領の悪い、いじめられっこだった。てとこか?

782 :
         ,. -─‐- 、
         , '´        ヽ
       /  /ヽ\     ヽ
     /  /   `、 \ ヽ   ゙,
      .i   i     ヽ、`ヽ、 \ ',
     i   !.  ==、  `ヽ、`ヽ、!
     |  l丁 ̄ ̄`i-f´ ̄`ヽ、ヽ !
     |  !.ヽ --‐'  `ー‐一1ヽi
     |  i     i  丶   ! ,'
      !  !    `ー '"   ,' i      ホームページのダウンロードや印刷は禁止します
     i  /ヽ    ー一'  /ヽ、!       アーカイブも禁止します
       V   \ ,、     .// ヽ 、_       法律は糞くらえだ俺が嫌だと言っている
  .r'"´ ̄ |.   /,へっ‐'" /  i  ``'‐- 、
 /  / | / く★へ ,. へ、. l         ヽ
./   ⌒ /     /`)   ヽ/        i
師匠に100%同意!!!

783 :
http://www.netart.jp/homuhen/gyotaku.htm
ウェブ魚拓回避回避ってのがあったんだけど
よくわからん

784 :
引用には要件があるからそれを満たしてないと引用にすらならんのに。
一部だけを抽出したものは引用とはいわんだろ。
質的にも量的にも、引用先が「主」、引用部分が「従」の関係にあること。
引用を独立してそれだけの作品として使用することはできない。

785 :
利用規約とかに作者のお人柄がにじみ出ているようですねw
これ使うとホム変というところに過去の作品としてURLが晒されるんだな
netart.jp
202.172.28.53
s52.coreserver.jp
202.172.28.53
これだけdenyすれば弾けると思うけど確信は無い
弾けるか試してみようにも、自分のサイトのURLが晒されるからなんか嫌だな・・・

786 :
魚拓がやってる丸ごとと引用は実質一緒だけどな。
引用っていったって引用部分だけ外部に提供してるからただの部分転載。
引用ってのなら引用してる部分も含めて保存しないと引用にならん。

787 :
>>785
202.172.28.53で間違いないぽいよ。
http://www.netart.jp/homuhen/proxy-402.htm
あとこのタグで回避できるって
<meta name='manko' content='chinko'>
あほw

788 :
おまいらtumblrはどうでもいいのか

789 :
>>787
確認ありがとうございます。引き続きアク禁リストに加えておく事にします。
このサービスは放置していてもあまり害は無さそうだが、作者の言葉が癇に障るから好きになれんよ。

790 :
.htaccess使用不可&robots.txt置けないブログやってる
リファラにWebarchiveがあって見に行ったらうちのサイトはまだアーカイブされてなかった
<meta name="Robots" content="NoArchive">
メタタグこう入れてるんだけど大丈夫ですよね?

791 :
>>790
<META NAME="ROBOTS" CONTENT="NOINDEX,NOFOLLOW,NOARCHIVE">
にしたほうが良い。
三つの効果があり、それに普通は大文字だ。

792 :
インターネット・アーカイブに保存された、自分の昔のHPを削除できる方法があるなら、
教えてください。
また、保存されたのが今も続いているHPなら、HTMLにロボット禁止のタグを入れると、
削除できると聞きましたが、それは可能ですか?

793 :
過去ログ嫁

794 :
>>793
具体的なレスはありませんよ?

795 :
>>794
あるじゃねーかよハゲ。読まないで無いとか言ってんじゃねーよ。

796 :
dat落ちの前スレとかっていうならまだしも(その場合でも読める仕組みはあるし)
現スレ内で何度か出てるわけで、現スレくらいはちゃんと読んでくださいね。

797 :
>>795 >>796
いや、それを訊いて、結局答えになっていないレスはありますが、
実際に解決したレスは無いでしょう。

798 :
メタタグを入れると削除されるのでは?
そうレスにあるはずですが。
解決していないのは、一度キャッシュされたウェブをロボット拒否で消しても、
そのサイトを消すと、また以前にキャッシュされた内容が保存されてしまう、
という問題でしたね。

799 :
>>797
あるっつーの。グタグタ言ってないで頭から読み返せクソ野郎

800 :
<META NAME="ROBOTS" CONTENT="NOINDEX,NOFOLLOW,NOARCHIVE">
を入れるとキャッシュなどを拒否できるらしいですが、
これを入れておくと、以前にアーカイブなどに保存されたものも消えるのでしょうか?
そのような話を聞いたのですが、どうなのでしょうか?

801 :
617 :Name_Not_Found:2006/01/21(土) 20:14:27 ID:u1WfF9rt
そうそう……
でも一応「次回のクロール時にnot foundなら削除」とは書いてあるのね

↑もう削除してから7年以上経っても消えていないサイトがありますよ。

802 :
<META NAME="ROBOTS" CONTENT="NOINDEX,NOFOLLOW,NOARCHIVE">
を入れるとキャッシュなどを拒否できるらしいですが、
これを入れておくと、以前にアーカイブなどに保存されたものも消えるのでしょうか?
そのような話を聞いたのですが、どうなのでしょうか?
保存されたのを消す方法があれば教えてください

803 :
>>801
インターネット・アーカイブの話を振ってたくせに、
なんでヤフーに関するレスを引っ張ってきてんだよ、おまえ。
真性の間抜けだったのか。付き合いきれんわ。

804 :
>>802
過 去 ロ グ 嫁
終了。ウザイから二度と書き込むんじゃねークソが。R

805 :
>>804
読みました。
メールで削除要請するしかない、ということですか?
タグ挿入でどうにかならないのでしょうか?

806 :
グーグルは削除されたページを何年でも出し続けますよ
インデックス数の水増しのためでしょうけど
更新されたページでもキャッシュはほとんど変えません
もし自分のブログに変なこと書いてしまったら
グーグルが永久に出し続けます
その後訂正してもグーグルは訂正してくれません
あなたが取り消したい記事であればあるほど
グーグルは残そうとします
グーグルはサイトオーナーの評価が最も低くなるような形で検索結果を操作しています
実際ググればわかりますが他人をほめるような記事は絶対に上に出てきません
ネガティブなキーワードを優先的に拾うなどしているのでしょう

807 :
妄想乙w

808 :
>>806
やっぱりそうか!
俺も漠然とそう思ってた

809 :
このスレの水面下にあった結論を>>806が見事表現してくれた
ありがd
グーグル工作員の態度の悪さもムカツク

810 :
>>809
誰が見ても自作自演の自己レスすんなw

811 :
と必死な工作員なのでした
俺も>>806に禿同

812 :
ここはアーカイブが嫌いな人が集まるスレなんだから、
802のような質問には真剣に答えるのが当然だろう。

813 :
質問する前に過去ログを確認したり、ググるのが当然なのでは?
安易に訊いて、簡単に教えて貰おうとする姿勢が透けて見えるから
答えてもらえないんだと思うけれど・・・。

814 :
んだ

815 :
何言ってんのクソ工作員
べつに安易に聞いたっていいじゃん
知ってる人がいたらそのほうが早い
だいいちググれと言われてググるほどみんなバカじゃない
環境変数グーグル社に持ってかれるから
ここに書き込む奴はそのくらいわかってるよ

816 :
>>815
仮に知ってたとして、何でお前に教えてやらなきゃいけねーの?
お前の検索ワードをググルに持っていかれようが、
こっちの知ったことじゃないんだが。

817 :
顔真っ赤にしてやがる。おもすれーww

818 :
>>815
ゆでダコだなw
16歳以上だとしたら哀れみを感じずにいられない

819 :
だから答える気もないなら書き込むなよクソ工作員

820 :
火病?

821 :
工作員だ何だと決め付けて煽るだけの奴もRよ。
インターネットアーカイブはキャッシュされる前に対策するのが当たり前。
ちなみにmetaに書いただけですぐに消える保証なんて当然ない。
メールで連絡を試みても依然とは比べ物にならんほど対応も遅い。

822 :
工作員だなんだ言ってるやつが、答えをもらえない質問者でしょ

823 :
いいから答える気もないなら書き込むなクズ

824 :
なんで急に荒れたかというと>>802が本質を突いてしまったからだ
グーグルは絶対にアーカイブは消さない
一時的に非表示にすることはあっても決して消さない
だから態度の悪いグーグル工作員と思しき奴も>>802に答えられないし
必死に話をそらそうとしている
>>806が正しい
もし消えないなら東京地裁に著作権侵害を訴えて掲載削除の仮処分申請をするといい
(グーグル日本法人の本社は東京都渋谷区)

825 :
>>823
>>823

826 :
マジかよ
鬼畜犯罪企業Googleイラネ

827 :
http://pc11.2ch.net/test/read.cgi/hp/1212507582/
378 :Name_Not_Found:2008/07/08(火) 16:10:17 ID:???
社長逮捕に工作員が反応したのかw
でも実際に著作権者がyoutubeの件で刑事Rしたらグーグルは終わりだろ
Winnyの作者は営利でやってなかったけどグーグルは営利企業だからさらに悪質
今のところは事後的に金払って揉み消してるけどあくまで事後的になw
ホント薄汚い企業だよ
そのうち金額で折り合いが付かなくなって大事になるぞw
389 :Name_Not_Found:2008/07/08(火) 23:01:27 ID:bS5+vImF
違法サイトと違法動画がないと潰れてしまうグーグルって哀れだ・・・

828 :
Internet Archiveの話なのかGoogleキャッシュについての相談なのか
そもそも>>802はどっちなん?

829 :
>>828
どっちもです。
とにかく、過去に保存されたのを消したいんです。

830 :
>>829
だから法的手続を執るしかないんだって
グーグルはそういう会社
他のアーカイブは気にしなくていいよ
グーグルが出しさえしなければ事実上何の問題もない
とにかくグーグルが諸悪の根源だからよく覚えておくように

831 :
とりあえずGoogleの方はキャッシュされたのと同じファイル名で
特に意味のない内容のファイルを生成しなおしてうpしてはどうか。
キャッシュが新しい無意味な内容のに切り替われば目的は達成できるんじゃね。

832 :
ねーよw
いくら無意味な内容に切り換えても無視されるだけ
グーグルはあくまで誰かにとって都合の悪い記事を残そうとする
そういうふうにアルゴリズムができている
しかもネガティブなキーワードを拾うだけでなく
社員が絶えず見て回ってネガティブな記事を残そうと努力している
だからこそ他社と比べて上位が圧倒的な中傷記事で占められる
上に書いてあるように法的措置をとるしかない

833 :
だからいまだに『ケンタッキー』でゴキブリがあんなに出るのか。。。
今ググって来たが相変わらず酷いもんだ

834 :
例えば、レンタル掲示板にスレを立てられて誹謗中傷されたり
個人情報を晒された場合、掲示板の鯖管の判断でスレが削除
されても、そのスレは検索にヒットし続けて、キャッシュで中身も
見れると言う事?

835 :
802はグーグル叩きじゃなくてなんとかする方法やアイディアを希望してるんだと思うのだが

836 :
831さんのを試すと良さそうですね。
でも、ロボットを禁止にしておけば、
次に回ってきたときにキャッシュが消えるのではないのでしょうか?

837 :
>>835
そうです。ただ自分のキャッシュを消したいだけです。

838 :
削除リクエストじゃだめなの?

839 :
禁止しただけじゃ消えないことも。
その辺は試してみればわかる。

840 :
>>834
まさにその通り
被害者が大量にいるからこれだけグーグルが叩かれる

841 :
>>837-838
5年以上前に消えたページもGoogleでは平気でヒットするぜ
まず消せないと思え

842 :
831さんの方法だとどうでしょうか?

843 :
Googleの場合は、既に自分の管理下に無いサイト(アドレス)なら別だが、
管理下にあるサイトならWebmaster tools使えば、自力で削除等可能だね。

844 :
ダメなんだなそれがw

845 :
とりあえず>>802はやれそうな対策から試せや

846 :
>>844
なんでだよ、おれんとこ消せるよ。

847 :
グーグルは個人情報も消さないしな

848 :
843で消せるよな。
844は釣り

849 :
http://mamono.2ch.net/test/read.cgi/newsplus/1215743862/l50
【毎日・変態報道】「robots.txt」で、毎日新聞英語版が「Web引きこもり」設定中
1 名前: 窓際店長見習φ ★ 投稿日: 2008/07/11(金) 11:37:42 ID:???0
 熱が収まるどころか、ネットではますます盛り上がってしまっている、毎日新聞の低俗英語
サイト問題。「Mainichi Daily News」で削除済みの「WaiWai」のWebページには、メタタグに
「hentai」とあったものだから、「毎日変態新聞」との表現もネットで頻繁に見かける。問題の
記事については、毎日新聞は訂正することなく、Webサイトから完全に削除してしまったため
に、ネットユーザーには証拠隠滅と映り、反感をますます買ってしまった。念の入ったことに、
検索エンジンがWebページを収集する「ロボット」の動きをコントロールする「robots.txt」にも、
「User-agent: *」「Disallow: /」と、すべてを拒否する設定が書き込まれている。タイムスタンプを
見ると、6月27日の深夜に書き換えたことになっている。この記述がどういう意味なのか、Google
の説明が詳しい。つまり、MainichiDaily Newsはどこで検索しても結果に表れない、引きこもり
状態なのだ。ただし、2行の間に不要な空行が入っているため、設定が有効かどうかは怪しい。
robots.txtはブックマークするようなファイルではないのだけれど、はてなブックマークでは、
人気の「IT戦士」を取り上げた日刊サイゾーの記事を超えるブックマーク数になっている。
http://internet.watch.impress.co.jp/static/yajiuma/2008/07/10/

850 :
このスレにある魚拓対策をhtaccessに書いて、全文取得をブロックすることはできたんだが、
引用とかいうふざけた機能はブロックできない。
一部とかいって、ページ単位ならほぼ全部保存することができるし。
これをブロックできている人いるかな?

851 :
robots.txtじゃなくて.htaccessで魚拓のIPとかドメインを拒否しててダメなの?

852 :
>>759で弾けるんじゃない?

853 :
グーグルはキャッシュの更新はほとんど行わないから
どんなツール使っても無駄ですよ

854 :
キャッシュの削除指定もWebmaster toolsで。
すでに存在しない(管理下を離れた)サイトだったら_

855 :
サイト閉鎖したって著作権あるんだぜ
犯罪企業グーグルさんよぉ
勝手に使うんじゃねーよ
あ?

856 :
ネット弁慶さん、ようこそ^^

857 :
つまりグーグルは過去に存在したページだと嘘を言えば
どんなデマ情報もキャッシュの名目でばらまくことが出来るわけだな
しかしこんだけネットで嫌われてよくやってられるなw

858 :
サイト管理者が表示したくないからページを削除したのに
グーグルが勝手にキャッシュに出し続けるってのは
犯罪なんじゃないの?
どうよこの犯罪体質のグーグル社
米国でも裁判起こされまくってるし

859 :
>>858
ここはキャッシュ対策を話し合うスレであって
グーグルに対する恨み辛みをぶちまけるスレではない。
よそでやれ。

860 :
>>859
スレタイよく見やがれ池沼

861 :
ネット弁慶さん、ようこそ^^

862 :
グーグルではトップページに表示されても
クズサイトに囲まれてるからぜんぜん来てくれないんだよな
むしろサイトオーナーに迷惑かけてるんだから
ページ使用料と損害賠償金を払ってほしいよな
特にキャッシュを残すというのであれば
不特定多数への配布が可能になるわけだから
書籍に換算して最低十万部くらいの値段をサイトオーナーに払うべきだね
他の検索エンジンは無料で構わないよ
むしろ宣伝になるから有り難い

863 :
こんなところで喚いて満足なら安いものだね。Googleは痛くも痒くもなかろう。

864 :
>>860
スレタイよく見やがれ池沼

865 :
>>862
さっさと訴訟すれば?

866 :
少額訴訟なら個人でも簡単に起こせるんだから、ぜひやってよ。
画期的な前例となるよ。
世界からも注目されると思う。

867 :
つーかグーグル掲載拒否しているサイト大杉だろw
だからこそゴミサイトばかり出てくるわけで

868 :
グーグルって典型的なネット弁慶だと思ってたけどどうやら違うみたいだな
>>865-866見ると相当追い詰められて弱気になっていることがわかるw

869 :
>>868
ネット弁慶の意味が分からないなら使うなよw

870 :
ワラ

871 :
俺持ってるサイト全部NOARCHIVEだが

872 :
簡単なBasic認証での制限もしないで、そういう紳士協定に依存して、違反したらファビョって…なんなんだよそれ。

873 :
>>872
そんな制限したらせっかく来てくれる客に迷惑だろjk

874 :
robots.txtで拒否し、META NOINDEXも書いてても、被リンクがたっぷりある
サイトだと、検索結果の堂々1位を飾ってくれちゃってたよ・・・
ただし、<title>の中の半角アルファベットはすべて小文字になってたり、
NOINDEX,NOSNIPPET同様にダイジェストは載らなかったり、いろいろ半端な
対応だったな・・・

875 :
グーグルワロス
いくら人気ページが出ないとまずいからって
手動登録はないだろw

876 :
サイト消した後もずっと残るってのがあれだよな
痛いプロフとか書いてた場合、永遠にそれが全世界に晒され続ける
まあそういうの書いてた奴の自業自得なんだが

877 :
自業自得じゃねえだろ
人の弱みを永久に晒し続けるグーグルこそが異常だと知れ
まあその結果グーグル自身も世界に晒されてるわけだが
こっちはまさに自業自得だなw

878 :
夏だなぁ

879 :
         ,. -─‐- 、
         , '´        ヽ
       /  /ヽ\     ヽ
     /  /   `、 \ ヽ   ゙,
      .i   i     ヽ、`ヽ、 \ ',
     i   !.  ==、  `ヽ、`ヽ、!
     |  l丁 ̄ ̄`i-f´ ̄`ヽ、ヽ !
     |  !.ヽ --‐'  `ー‐一1ヽi
     |  i     i  丶   ! ,'
      !  !    `ー '"   ,' i      ホームページのダウンロードや印刷は禁止します
     i  /ヽ    ー一'  /ヽ、!       アーカイブも禁止します
       V   \ ,、     .// ヽ 、_       法律は糞くらえだ俺が嫌だと言っている
  .r'"´ ̄ |.   /,へっ‐'" /  i  ``'‐- 、
 /  / | / く★へ ,. へ、. l         ヽ
./   ⌒ /     /`)   ヽ/        i

880 :
いやだから自サイトの使用制限は合法だから
×法律は糞くらえ
○グーグルは糞くらえ

881 :
だよね
リンク禁止だってこっちの管理者の勝手だよね

882 :
教えてください
グーグルにキャッシュされた場合、
キャッシュされても良い内容にHPを書き換えてから、
次にロボットが回ってくると、キャッシュは書き換えたないように変わりますか?
あるいは、次ロボットが回ってくるときにロボット禁止にしていると、
以前にキャッシュされた内容は消えますか?

883 :
>>882
書き換えた内容にキャッシュが更新された事は普通にある。
それ以外については自動では中々消えないかも試練。
自分で色々工夫して結果報告よろ。

884 :
いじりようがない過去のサイトとかじゃないのなら、Webmaster toolsを使うと楽っつーか話が早い。

885 :
一応、まとめて質問します。
以前にグーグルにキャッシュされた内容を変えたいのですが、
その場合、ロボットが次に回ってくるまでに内容を書き換えておけば良いのですか?
その場合、ロボットを禁止にしていると、以前にキャッシュされた内容が消えるのか、
あるいはロボットが回ってこずに、以前の内容だけが残ったままなのか、
どちらでしょうか?

886 :
>>883
いろいろ試してはみますが・・・
>>884
それも調べてみます

887 :
もし885の方法を取る時、
ロボット禁止にして、内容を書き換えた場合、
キャッシュに残るのは以前の内容のままってことになりますか?
一度ロボットに新しいキャッシュを取らせる必要があるのでしょうか?

888 :
クロールはしても更新はしないよ
グーグルはそんな技術力も良心もやる気もない

889 :
とりあえずウェブマスターToolsを使ってみ
ttp://www1.axfc.net/uploader/He/so/120386.png (google)

890 :
>>888
無責任ですよね。金儲けの都合でしょうが...
>>889
すいません。検索してますが、その画像のようなページは見つかりません。
ソフトをダウンロードする場所も見つかりませんし、いったいどこでどうするのでしょうか?
初心者ですいません。

891 :
https://www.google.com/webmasters/tools/docs/ja/about.html

892 :
炎上した発言を揉消すためにアーカイブ反対なわけですね。わかります。

893 :
>>891
それのどこに画像のページがあるのでしょうか?
もしかして、登録しなければ駄目ですか?
しかも英語サイトですが・・・

894 :
グーグルに自分のサイトをキャッシュされてないかどうかを調べるにはどうすればいいですか?
検索欄にアドレスを入れてもページが見つかりません、と出ます。

895 :
>>893
日本語でおk

896 :
>>894
つまりキャッシュもされてない

897 :
>>895
以前にアップされたウェブマスターツールの操作画像のページに行けません。
そこに行くまでにはどうすれば良いのでしょうか?
891のサイトでどうすれば?
教えてください・・・

898 :
882が何を言っているのか
教えてください・・・

899 :
                           ヽ
              _,,.,、、,.ィ-- ti- 、、、....,,,,_   ',
         ,,..、、ri':'゙/~   レ     '  ゙ヘ:l : : : :~,>
   _,...r:::''"::/ l/ .l:/-=ニ二,'_ー- 、、   !l!;: r '"
'''<:::::::::::::;、r'          `'' ‐-`.、 /
-、 l::::::::::::l           <"゙'i;ソ'   ',
~.ヽ l:::::::::::l             ~'     '、
/ .) .l::::::::::!                    '、
 ヽ .l:!l:::::l ヽ                  '、
\ '  l! l::!l! ヽ                    ,'
  ゙    ヾ               ‐'" ,. r ゙
ー-‐i               ,.r,,iilll鬚髯ヲ    そんなに何も見えてないんじゃ
.   l            `''' ‐‐ ---t‐'     
 ̄ ̄ ̄ ̄ ̄ ̄~"''、' ‐ 、       ー‐ノ      生きてても面白くないでしょう
             ',  ヽ       l
               l   l       l
              l    l     ノ

900 :
要するにグーグルはサイトオーナーから情報だけ勝手に盗み取って
サイトオーナーの利益を侵害するような使い方をしている犯罪企業ってこと

901 :
Q.
GoogleのキャッシュとYahooのキャッシュの違いを述べよ(文字数は自由)

902 :
答えると何かくれるのか?

903 :
答えるとグーグル社長の刑期が縮むのか?

904 :
縮みこんでるのは削除されねーと吠えてる奴の玉袋くらいなもんJARO

905 :
ωωω

906 :
他人の著作物を永久に勝手に利用するまでの権利はグーグルにはないぜ
まあ泥棒にはわからねえか

907 :
今日もネット弁慶ご苦労さん

908 :
         ,. -─‐- 、
         , '´        ヽ
       /  /ヽ\     ヽ
     /  /   `、 \ ヽ   ゙,
      .i   i     ヽ、`ヽ、 \ ',
     i   !.  ==、  `ヽ、`ヽ、!
     |  l丁 ̄ ̄`i-f´ ̄`ヽ、ヽ !
     |  !.ヽ --‐'  `ー‐一1ヽi
     |  i     i  丶   ! ,'
      !  !    `ー '"   ,' i      他人の著作物を永久に勝手に利用するまでの権利はグーグルにはないぜ
     i  /ヽ    ー一'  /ヽ、!       まあ泥棒にはわからねえか
       V   \ ,、     .// ヽ 、_       
  .r'"´ ̄ |.   /,へっ‐'" /  i  ``'‐- 、
 /  / | / く★へ ,. へ、. l         ヽ
./   ⌒ /     /`)   ヽ/        i

909 :
(・∀・)ニヤニヤ

910 :
ヤフーのロボットがFirefoxにUA偽装してくることがある
非常にウザイ

911 :
いまこそ Google に立ち向かおう!
来週あたりから血祭りになるよ。
http://changi.2ch.net/test/read.cgi/ms/1219225690/

912 :
うちのサイトなんだけどさ、.htaccessでGoogleとYahooを拒否したんだ。
そしたらどうなったと思う。Googleは素直にクロールするのをやめて消えたんだ。
Yahooはといえば、サイトのURLでアクセスに拒否されたページを取得してる。
おいおいどこまで粘着なんだよ。Yahoo! Japan! ww

913 :
素直にrobots.txtで教えてやれよ

914 :
>>14
おまえのような奴は市役所に勤めて
まな板みたいなオッパイの女とせっせと子作りしていればいいのさ。

915 :
誤爆?

916 :
だって>>14みたいな事言ってたら、他人のメールの内容をスキャンして興味ありそうな広告を表示しようなんてアイデアは実現しないもん。

917 :
そうだな。

918 :
有力サイトのオーナーはグーグルにコンテンツ使用料を請求したほうがいいぞ

919 :
100$/ページが最低限だな

920 :


921 :
紳士協定だから、Googleは何ヵ月か後に有効になったけど、
百度(Baidu)は平気で無視して情報集めてるみたい。
全部、中国からの百度(Baidu)を.htaccessで拒否していたら、
いつの間にか日本にあるサーバでも集め始めた。びっくり!
拒否、拒否・・・

922 :
百度w

923 :
確かに勝手に複製され、許可なく公開しているのはおかしい
世の中の利便性を考えれば、このままでいてほしいけどやっぱりおかしい

924 :
利便性があるのにできないほうがおかしいんだ。

925 :


926 :
Baiduspiderウザすぎ!! ヽ(`Д´)ノ
http://pc11.2ch.net/test/read.cgi/hp/1171240129/

927 :
【中国】グーグルから軍事機密守れ、隠ぺい新技術を開発[01/05]
http://gimpo.2ch.net/test/read.cgi/news4plus/1231112455/
グーグルから軍事機密守れ、隠ぺい新技術を開発―中国
http://headlines.yahoo.co.jp/hl?a=20090105-00000004-rcdc-cn

928 :
ttp://internet.watch.impress.co.jp/cda/news/2009/01/14/22093.html

929 :
魚拓とはてなブックマークアク金にしたら
マジで魚拓もスクリーンショットもブックマークも取れなくなってて笑ったw
魚拓ざまあww
アク金きもちいいわ

930 :
>>929
という香具師に限ってページはパスワードもかけてないんだよな

931 :
魚拓は取られていいことないから徹底的にアクセス禁止するべき
オンラインブックマークとか気持ち悪すぎる
はてなとか犯罪者が出るくらいブックマーク中傷の宝庫だし

932 :
よう腐女子

933 :
htp://www.yomiuri.co.jp/national/news/20090225-OYT1T00066.htm
http://anchorage.2ch.net/test/read.cgi/bizplus/1235530516/
http://mamono.2ch.net/test/read.cgi/newsplus/1235546684/
ホムペ運営者としても防衛策を強化する必要がありそうだ。

934 :
BackupUrl.com - Create a cached copy of any url!
http://backupurl.com/

こんなのができたみたい。
どうすれば防げるか教えて。

935 :
環境変数を取得するページを取得してみた。
http://backupurl.com/cache/zm2rn7.html
特徴は「UAが空白」(!)、「IPは66.71.253.25」、「それ以外は全く環境変数がない」。
この辺で弾ける条件を絞り込めばいいと思う。IPで弾くのが無難か。

936 :
>>934
認証かけろ

937 :
>>935
0.0.0.0/0 で弾くのがいいな
見られたくない奴には絶対に見られないぞ

938 :
診断くん Ver 0.80a
Home/Feedback/N/Vote
一般的な情報
REMOTE_HOST 66.71.253.25 
REMOTE_ADDR 66.71.253.25 
HTTP_REFERER (none) 
HTTP_ACCEPT . */*
HTTP_HOST . taruo.net
その他の情報
HTTP_CONNECTION . (none) 
判定
66.71.253.25 (66.71.253.25)
判定:プロクシです proxy判定箇所が 1箇所、疑惑点が 0箇所ありました。
漏れ判定:漏れてはいないようです
総合評価:A+
極めて物静かなproxyです。proxy経由であることを示す情報がほとんどありません。

939 :
>>935
deny from 66.71.253.25
でとりあえず防げたみたい。どうもありがとう!

940 :
>>939
まあ、漏れが手でぶっこぬいてうpろだに上げれば防げないがな

941 :
ttp://pc11.2ch.net/test/read.cgi/esite/1189771222/171-
171 名前:98[sage] 投稿日:2009/04/22(水) 21:00:27
>>170
元々キャッシュされてないとか、
robots.txt で撥ねられてたら無理だな。
172 名前:名無しさん@お腹いっぱい。[sage] 投稿日:2009/04/22(水) 22:47:15
robots.txtは地味にうざい
174 名前:名無しさん@お腹いっぱい。[sage] 投稿日:2009/04/23(木) 13:04:52
特に、ページは読めてもファイルが置いてあるところはrobots.txtでブロックされていると目茶苦茶にがっかりする

942 :
Internet Archive総合 (web.archive.org) #1
http://pc11.2ch.net/test/read.cgi/esite/1189771222/

943 :


944 :


945 :
>>814
【ストレージ】MEGAUPLOAD メガ被害者の会【総合】
http://pc11.2ch.net/test/read.cgi/esite/1260002862/20,29
この人?俺質問答えた野郎だけど。

946 :
保守

947 :
保守

948 :
そもそも、いまのネット空間はアメ公の創作空間。
そのアメ公の空間でアメ公の大きな会社を批判することは無駄。
アメ公空間の創設になんの貢献もできない>>1は身の程を知るべし。
アメ公空間のルールはアメ公が作るのが常識だww

949 :


950 :


951 :


952 :


953 :


954 :


955 :


956 :
                           ヽ
              _,,.,、、,.ィ-- ti- 、、、....,,,,_   ',
         ,,..、、ri':'゙/~   レ     '  ゙ヘ:l : : : :~,>
   _,...r:::''"::/ l/ .l:/-=ニ二,'_ー- 、、   !l!;: r '"
'''<:::::::::::::;、r'          `'' ‐-`.、 /
-、 l::::::::::::l           <"゙'i;ソ'   ',
~.ヽ l:::::::::::l             ~'     '、
/ .) .l::::::::::!                    '、
 ヽ .l:!l:::::l ヽ                  '、
\ '  l! l::!l! ヽ                    ,'
  ゙    ヾ               ‐'" ,. r ゙  そんなに何も見えてないんじゃ
ー-‐i               ,.r,,iilll鬚髯ヲ   
.   l            `''' ‐‐ ---t‐'     生きてても面白くないでしょう
 ̄ ̄ ̄ ̄ ̄ ̄~"''、' ‐ 、       ー‐ノ
             ',  ヽ       l
               l   l       l
              l    l     ノ  

957 :
2011

958 :


959 :


960 :
>>800
チンレスだけどググルウェブマスターツールでキャッシュ削除。あとは
meta name="robots" content="NOARCHIVE,NOIMAGEINDEX,NOIMAGECLICK,NOSNIPPET"
で今後のキャッシュ拒否、説明文とインスタントプレビュも拒否
がいしゅつならスマソ。

961 :
自己レス:NOIMAGEINDEX,NOIMAGECLICKは画像拒否ね。
これで検索結果にインデックスはされるが他は拒否できる。ただし俺の経験だと、
NOSNIPPETを入れると検索は補足検索結果に追いやられてしまうようだ。

962 :
>>960
亀レスや遅レスとはいうが
チンレスってなんだ?
っていうか亀にも限度があるだろw

魚拓
キャッシュ
アーカイブ
ってどう違うの?

963 :


964 :


965 :
創価R
創価R
創価R
創価R
創価R
創価R
創価R
創価R
創価R
創価R 
創価R 
創価R
創価R
創価R
創価R 
創価R 
創価R
創価R
創価R

966 :
創価R
創価R
創価R
創価R
創価R
創価R
創価R
創価R
創価R
創価R
創価R
創価R
創価R
創価R
創価R
創価R
創価R
創価R
創価R
創価R
創価R 
創価R 

967 :
a

968 :


969 :2013/08/14

TOP カテ一覧 スレ一覧 2ch元 削除依頼
404 Not Found (Err.2) (661)
CSS(スタイルー大柴シート)質問スレ51日目 (487)
有名リモホ(RemortHost)/偽装UA(UserAgent) 2訪目 (671)
HTML5はなぜ失敗したのか (121)
芸能事務所から損害賠償のメールが来て (429)
+ JavaScript の質問用スレッド vol.109 + (329)
--log9.info------------------
【バンブー】Loaded〜ローデッド【フレックス】 (767)
埼玉のストリートスポット2 (259)
ヒーリーズ(ローラーシューズ)の展望は? (256)
limp bizkit (177)
【名無し】新板誕生にあたって【看板ロゴ】 (426)
お前等が履いてるデニムってどれよ? (347)
カイトマウンテンボード (117)
モマエラのXスポ以外の趣味を是非聞きたい (382)
インラインスケート、SK8、BMXやってる人々!! (176)
スケボー上級者スレ1日目 (304)
【NEW】キャップ【ERA】 (300)
§§§エンジン系 X-スポーツ§§§ (148)
ロドニーミューレンになりきって1000を目指すスレ (108)
( ´_ゝ`)流石だよな俺ら@X板(´<_`  ) (193)
△▼△▼FREESTYLE MOTOCROSS 2nd STAGE△▼△▼ (817)
      奈良  N A R A      (163)
--log55.com------------------
【山陽】山咲さくら【飯塚】
【優勝】飯塚29期/阿部 仁【したい】
【客、来る来る詐欺師】松本容疑者【32期】
広瀬登喜夫選手
まずは鈴木と青山どっちが悪いのか
2ちゃん見てそうな選手は?
※新タイヤについて語るぞ※
元船橋勢が強すぎるwwwww