1read 100read
2013年17ネットサービス38: Internet Archive総合 (web.archive.org) #1 (484) TOP カテ一覧 スレ一覧 2ch元 削除依頼
地域別掲示板 まちBBS www.machi.to 近畿大阪1 (182)
au携帯限定★日記人★出会い系?馴れ合い系?blog? (121)
はてなブックマーク Part2 (363)
フリーメールについて -Part26- (351)
投票ちゃんねるを悪質な行為を書くスレ (462)
peenoチャットスレでイチャつく奴ら6 (367)

Internet Archive総合 (web.archive.org) #1


1 :2007/09/14 〜 最終レス :2013/09/25
なんだかんだでお世話になってるInternet Archiveについて語りましょう
Internet Archive
ttp://www.archive.org/index.php
インターネット・アーカイブ - Wikipedia
ttp://ja.wikipedia.org/wiki/InternetArchive

〜よく使われるWeb Archiveキャッシュ検索はこちら〜
Internet Archive: Wayback Machine
ttp://www.archive.org/web/web.php
Advanced Search
ttp://web.archive.org/collections/web/advanced.html
Recall(現在は停止404)
ttp://recall.archive.org/
Internet Archiveの110億ページを検索できるサーチエンジン「Recall」
ttp://internet.watch.impress.co.jp/cda/news/2003/09/08/377.html

Q.Internet Explorerで日本語などの2byte言語のページのWeb Archiveキャッシュを見ようとしても
真っ白なページ&文字化けが起きる&極端に重いなどの症状が出てしまう
A.[表示]もしくは右クリック→[エンコード]→[日本語(自動選択)]やその言語の文字コードに則したものをクリック
Q.Web Archiveでダウンロードしたzipなどが開けない&CRCが違うと表示される
A.よくWeb Archiveは1byte欠けを起こすのでバイナリエディタなどで該当ファイルを開き、
16進数の最後の末尾に「00」を付加すると正常なファイルになることがあります

2 :
無かったんで立ててみますた(゚∀゚)
何も無くスレを立てるのもアレなんでテソプレみたいなもんも作りました
Web Archiveだけではすぐに話題は尽きてしまいますが
Internet Archiveなどのさまざまな記録も話題に加えれば話題は尽きないと思います 多分

3 :
5年前に作った俺の恥ずかしい若気の至りサイトを消してくれ

4 :
>>3
詳しく

5 :
Recallは日本語使えなかったけど革新的なサービスだった…
再開してくれないもんかねぇ(出来れば日本語対応で)

6 :
ダウンしてるぞInternet Archive

7 :
復旧したっぽいね

8 :
あげ

9 :
あげてねーだろ
しかし語ることねーな

10 :
age

11 :
tgzのキャッシュってダウンロード出来ない?

12 :
キャッシュは流石に難しい

13 :
今のところ日本語のページを開くとUnicode固定になっちゃうんだよなぁ…
わざわざエンコードするの面倒だからどうにかしてS-jisに固定できないものだろうか…

14 :
オミトロンは?

15 :
おみとろん久しく使ってなかったけど。
Internet Archive開くときだけ使ってみるか。

16 :
オミトロンのルール誰かplz

17 :
最近Internetarchiveからソフト類をダウンロードするの
難しくなってないか?
Zipだとか過去手に入った物が手に入らない。

18 :
>>16
Proxomitron専用Uploaderの「pr0043.txt」
ttp://proxo.hp.infoseek.co.jp/cgi-bin/sn_uploader/2.html?1193422532
フィルタ、リスト公開/8 - Proxomitron等に関するWiki
ttp://abc.s65.xrea.com/prox/wiki/%A5%D5%A5%A3%A5%EB%A5%BF%A1%A2%A5%EA%A5%B9%A5%C8%B8%F8%B3%AB/8/

19 :
>>17
ネットの発展は「宇宙の膨張と同じ」とまで例えられるくらいだかね
淘汰されちゃうんだろうな
俺的にはlzhアーカイブの加速度的な消失が痛いよ
>>18
作者さん?乙です

20 :
ひさびさにおみとろん導入してみたよ。
とりあえずInternet Archive の文字化けを直すヘッダフィルタのみ有効にした。
手間が省けていいもんだね。

21 :
Internet Archiveに繋がらないんだが、
どうなってる?

22 :
生きてるっぽいけど?

23 :
おお、繋がりましたわ。失礼

24 :
>20
どれどれ俺もやってみよう

25 :
収得できないのってもう絶対見られない?
時間おけば見られることあるの?

26 :
1年ぐらいたったら公開されるってどっかに書いてあったよ

27 :
1年か('A`)

28 :
落ちてる?

29 :
うんにゃ

30 :
テンプレ追加きぼん。
Q. 毎日のようにキャッシュが残っていたサイトなのに
最近のものが何故か無くなっている。
A. Wayback Machine で表示できるのは 6 ヶ月前より古いキャッシュで、
それ以降の分は 6 ヶ月経つまで表示されません。
最近 ttp://www.archive.org/index.php と
ttp://www.archive.org/web/web.php が落ちてることが多いな。
それでも ttp://web.archive.org/web/*/ごにょごにょ
とかやるときちんと動いてる。

31 :
>>30
おや、1年てのは勘違いか、ルールが変わったのか…

32 :
同じサイトでも見られるリンクと見られないリンクの違いは何なんだ

33 :
またダウンしてる?

34 :
>>32
503エラーもどきじゃない?
何回かクリックすると見れることあるよ

35 :
色々あり今までこちらに来れませんでしたが
オミトロンを教えてくださった方 どうもありがとうございました

36 :
律儀だな〜

37 :
俺オミトロン設定してるのになぜか文字化けが止まらないな・・・

38 :
>>37
In してくるヘッダーの text/html; charset=UTF-8 の
charset=UTF-8 を削るだけのフィルタだよ。
一度確認してみたら?

39 :
ウェブアーカイブというサイトで、
昔消えたサイトを復元できますが、それをされないようにサイトを作ることはできますか?
HPの製作者が消した後なら、
ウェブアーカイブに残らない、なんてことを聞いたこともありますが、
そんなことありえないですよね?
あるいは、文字化けして、どっちみち見れないようなものとして表示される、
とも聞きましたが、それも間違いですよね?

40 :
>>39
ここに書いてあるとおりにすればいい。
ttp://www.archive.org/about/exclude.php
英語がわからなければ適当にぐぐって。すぐ情報でるから。
文字化けはキャッシュしたページの文字コードを無視して
UTF-8で表示してるだけで正しい文字コードに変えれば見れる。

41 :
1996年から8500億ものウェブサイトを保存している「Wayback Machine」 - GIGAZINE
http://gigazine.net/index.php?/news/comments/20080127_1996_internet/

42 :
Robots.txt Query Exclusion.
という文字が出て、ようやく探し当てたページなのですが見る事が出来ません
少し調べたのですが、見れないのです。これは打つ手無しでしょうか。

43 :
>>42
それはデータをクロールする検索ボットをお断りしますっていうヤツだから無理
というかまともな検索サイトじゃ検索結果にも出ないハズ
もしキャッシュが欲しいならマイナーな検索エンジンやちょっとUGちっくな検索サイトを使った方が出やすいかも
もし晒しても問題無さげサイトなら晒してみ
手伝いくらいならできるかもよ

44 :
livedooの昔のブログで月別アーカイブの次のページ(2ページ以降)を見たいのですが、
普通にクリックでは表示されないのですが、何とか見る方法はありますか?

45 :
続きです。livedoorのブログですが、アドレスの最後がこの様になっていて、
検索しても見られないのです。archives/2006-11.html?p=2
それと、1年以上公開されていたブログで月別アーカイブが約半分程度しか残っていないのですが、
他の月分は今後見る事は不可能でしょうか?

46 :
まずWeb Archiveは>>30の半年縛りがある
それと何とか見る方法ってのをみんなで探す前提条件がurlを晒すことなんだがOK?
あと有名なとこなら魚拓系サイトって手もあるかも

47 :
>>46
魚拓系サイトも見たのですが、トップページのみのリンクでだめでした。
livedoorのブログは、アカウント以降は全て同じで次のページへのリンクが
/archives/2006-11.html?p=2で見られる様になっているのですが、
ページが存在しませんと出てしまいます。
残念ながらurlは晒せないので、もう少し頑張ってみます。アドバイス有り難うございました。

48 :
ttp://kakuri.sakura.ne.jp/oekaki/
上のお絵かき掲示板のNo.6220-6247の絵を見たいんだけどなんかいい方法ないですかね。
推測するには2007年の6月から5月だと思うんだが。
web archiveじゃあ無理臭い。

49 :
現行URL?は
ttp://kakuri.sakura.ne.jp/oekakix/
でした

50 :
web archiveは特定のサイズ以上の画像はクロールしないようにしてるっぽいから無理じゃない?
しかもどう見ても児ポでFBIから睨まれそうなトコだし…

で話は変わるが俺その画像(というかHTMLログ全て)持ってるかも知んない
これ以上はスレ違いだから
・比較的流れの速そうな板の適当な糞スレへ誘導
・50メガ程度うpできるロダ
この2つ用意したら揚げてやんよ

51 :
ttp://namidame.2ch.net/test/read.cgi/ghard/1201950750/

52 :
ぽっぽ(弟)に通報します

53 :
重いー

54 :
最近どしたってくらい重いんだけど
英語読めないからアナウンス出てるかもわからんし

55 :
robot.txt置けない環境なんだがメタタグでnoarchive指定しても無意味?

56 :
最近はGoogleさんですらnoarchiveを無視することがあるしな・・・

57 :
Internet archiveで拾えないファイルってもう絶望的…?

58 :
>>55
56に同意でmetaは無意味じゃないが読んでくれないことがある
>>57
ファイル系?HTML系?
もしURL晒せれば微力ながら協力するが

59 :
>>58
すいません、助かります
ttp://degwin.cool.ne.jp/nanika/download/nekomimi.nar
って言うファイルで、2004年の1月初期まで公開してたっぽいんです

60 :
>>59
うーん見つかんないねぇ…
も少し情報無い?
あとこれ伺かだと思うんだけどマルチにならないようにここでの質問を正式に打ち切って
伺か系のスレや掲示板・ロダで探した方が良い鴨

61 :
robots.txt置いて、削除フォームから申請したのに一向に削除されない
恥ずかしいから早く過去を消し去りたいのに・・・

62 :
     _, ,_
   ( ^ё^) ヤダァ、見ないで!恥ずかしい…
     (つ/ )
      |`(..イ 彡サッ
     しし'

63 :
魚拓とweb archiveはウェブ社会の癌。

64 :
>>63
ハゲ黙れ

65 :
http://rollin.jp.land.to/
上のアップローダーのファイルを保存して新しいところに上げてみたいのですが
Not in Archive.って出てしまうんですが。どうしようもないんですかね?

66 :
ここって昔のゲームとかもDLできるんですか?
くにおくんシリーズとか。
どなたかやり方を教えてください!

67 :
日本語でおk

68 :
やっぱり無理ですか

69 :
>>65
ttp://web.archive.org/web/*nr_130/http://rollin.jp.land.to/*
無効のシステムのエラーならまだしも、
Not in archive だけは無理だろ。

70 :
2ヶ月ぶりぐらいにアーカイブを使ったが、
「ページを表示できません」ばっかりだorz

71 :
>>70
同じく。一体何がおきてるorz

72 :
ttp://web.archive.org/web/*/ごにょごにょ
これで出たと思ってもそっから先に進めなくなってるな。
Failed Connectionとか言われる。

73 :
Not in Archiveって出ても日を改めたら見れたりしたと思うけど
勘違いかな?

74 :
Path Index Error.が多いな。さっき見たファイルが、もう見れなくなってる。

75 :
>>74
確かにここの所それが出る頻度が妙に多くなってるな。

76 :
やはりNot in Archiveはもう見れないのかな?
日をあらためれば見れるという人もいるし希望持ってるんだが保存されてないんだったら無理だよなー
アゲます

77 :
Not in Archiveって言ってるのだし
その言葉の意味からしても諦めたほうがいいと思う
Failed Connectionならうまくいけば繋がる→繋がれば残ってるかもしれないけど

78 :
web.archive.org、404きた…

79 :
滅びてくれると嬉しいのだが、クローラは毎日のように来てるんだぜ?

80 :
REMOTE_HOST: xcrawl109.alexa.com
HTTP_USER_AGENT: ia_archiver

81 :
昨日は表示できてたはずなんだが、今日なんかサーバーにつながらなくね?

82 :
         ,. -─‐- 、
         , '´        ヽ
       /  /ヽ\     ヽ
     /  /   `、 \ ヽ   ゙,
      .i   i     ヽ、`ヽ、 \ ',
     i   !.  ==、  `ヽ、`ヽ、!
     |  l丁 ̄ ̄`i-f´ ̄`ヽ、ヽ !
     |  !.ヽ --‐'  `ー‐一1ヽi
     |  i     i  丶   ! ,'
      !  !    `ー '"   ,' i      ホームページのダウンロードや印刷は禁止します
     i  /ヽ    ー一'  /ヽ、!       アーカイブも禁止します
       V   \ ,、     .// ヽ 、_       法律は糞くらえだ俺が嫌だと言っている
  .r'"´ ̄ |.   /,へっ‐'" /  i  ``'‐- 、
 /  / | / く★へ ,. へ、. l         ヽ
./   ⌒ /     /`)   ヽ/        i

83 :
うむ

84 :
ここに保存されてないと過去のホームページを見るのは絶望的なの?
Internet Archiveの様なサイト他にないのかな

85 :
魚拓は?

86 :
>>85
無かった、やはり無理だよね

87 :
URL晒せないの?

88 :
http://homepage3.nifty.com/〜がURLだからそっから保存されてるを全て根気よく調べようと思ったら20000までしか表示されない
並べ方的にこの後なのに
http://web.archive.org/web/*sr_19981nr_30/http://homepage3.nifty.com/*
こういう仕様なのかな?だいたいのURLはわかります

89 :
>>88
ttp://web.archive.org/web/*sr_19995nr_1/http://homepage3.nifty.com/*
確かにそういう仕様なのかもな。
URL のページ番号を示す部分が 19999 の次は -1 になってしまう。
あとは、 検索範囲を狭めて根気良くやっていくしかないと思う。
ttp://web.archive.org/web/*/http://homepage3.nifty.com/1*
ttp://web.archive.org/web/*/http://homepage3.nifty.com/2*

90 :
「Failed Connection」は「接続できませんでした」の意味でしたっけ

91 :
何と何が接続できなかったかを議論する前に
そんな障壁があったとは知らなかった。

92 :
この数日Failed Connection頻発して使い物になんね
あとドメイン失効したサイト跡地にrobots.txt置く業者ウゼェ、マジでR

93 :
Failed Connection 頻発がマンネリ気味の恐れがあるなら、

94 :
どのアドレスを入力してもFailed Connectionと出る、何があったのか!?

95 :
過負荷がかかってるだけ
しばらく日をおいたらサーバー増強で直ってるんじゃね?

96 :
なんか知らんが直ってるっぽいよ。
数メガバイトのzipファイルも1Mb/s辺りで落ちてくる。
1バイト欠けるのは相変わらずだけど。

97 :
半年ルールでそろそろ今年頭のデータが見れるようになってもいいはずだけど…
昨年8月以降止まってる気がする。

98 :
>>97
ほんとだ。 8 月末で切れてる。
ttp://web.archive.org/web/*sa_/http://www.goo.ne.jp/
ミラーも同じ状態。
ttp://web.petabox.bibalex.org/web/*sa_/http://www.goo.ne.jp/

99 :
Proxomitronの設定ってこれで合ってる?
ttp://imepita.jp/20080626/525180

100read 1read
1read 100read
TOP カテ一覧 スレ一覧 2ch元 削除依頼
【〒・猫】Yahoo!レンタルDVD【ぽすれん】 (323)
【〒・猫】Yahoo!レンタルDVD【ぽすれん】 (323)
ストリートビュー総合スレ (330)
Outlook.com何やってんだ! ゴラ! (302)
PC相談室5月廃止・・・ISIZE崩壊へ (120)
chat roulette (430)
--log9.info------------------
FreeBSD/amd64 part3 (and for operation-2ch) (148)
UNIX使いなのにプログラミングできないヤシ (810)
私は感動した!!ありがとうUNIXの皆さん!2006夏〜 (848)
NetBSD その28 (906)
こんなApacheのモジュールがあるぞ自慢 (152)
zsh その7 (234)
ジャーナリングファイルシステム (312)
UNIX業界の価格破壊メーカーはなぜ現れない? (186)
emacs-w3m (Part 2) (639)
w3m その8 (508)
中級者もOK! FreeBSD質問スレッド (871)
連番のH画像/動画を一気にダウンロードする6 (398)
▲DHCPスレ (295)
Name Server 総合スレ【DNS】 (975)
シェルスクリプト総合 その21 (906)
UNIX板過去ログ倉庫 (119)
--log55.com------------------
【指原P】≠ME★17【ノイミー】
48G今年の新人賞候補者がコチラ!
【朗報】指原莉乃さん、後輩の誕生日に10万円のバッグをプレゼント
【指原】マンチ・カン太郎&ミヌエット五郎応援スレ★51【猫ーズ】
【HKT48】豊永阿紀応援スレ★90【あき/チームH】
NMBで新澤菜央だけはエロい
【画像】今日出所した山口組ナンバー2の高山若頭(72)が怖すぎると話題wwwwwwwwwwwwww
中井りかちゃんが意味深な病みモバメを送った模様。ファン「とりあえずNGTのスタッフが最悪だということは分かった」