1read 100read
2013年17ネットサービス38: Internet Archive総合 (web.archive.org) #1 (484) TOP カテ一覧 スレ一覧 2ch元 削除依頼
=ChatVio= チャットビオ (327)
Googleの不満 (287)
ヤフーチャット40−2について語るスレ 15 (527)
2ch規制回避サービス「Rika_Roxy」 (539)
last.fm and Audioscrobbler -32- (957)
ニコニコ生放送 避難所part907 (277)

Internet Archive総合 (web.archive.org) #1


1 :2007/09/14 〜 最終レス :2013/09/25
なんだかんだでお世話になってるInternet Archiveについて語りましょう
Internet Archive
ttp://www.archive.org/index.php
インターネット・アーカイブ - Wikipedia
ttp://ja.wikipedia.org/wiki/InternetArchive

〜よく使われるWeb Archiveキャッシュ検索はこちら〜
Internet Archive: Wayback Machine
ttp://www.archive.org/web/web.php
Advanced Search
ttp://web.archive.org/collections/web/advanced.html
Recall(現在は停止404)
ttp://recall.archive.org/
Internet Archiveの110億ページを検索できるサーチエンジン「Recall」
ttp://internet.watch.impress.co.jp/cda/news/2003/09/08/377.html

Q.Internet Explorerで日本語などの2byte言語のページのWeb Archiveキャッシュを見ようとしても
真っ白なページ&文字化けが起きる&極端に重いなどの症状が出てしまう
A.[表示]もしくは右クリック→[エンコード]→[日本語(自動選択)]やその言語の文字コードに則したものをクリック
Q.Web Archiveでダウンロードしたzipなどが開けない&CRCが違うと表示される
A.よくWeb Archiveは1byte欠けを起こすのでバイナリエディタなどで該当ファイルを開き、
16進数の最後の末尾に「00」を付加すると正常なファイルになることがあります

2 :
無かったんで立ててみますた(゚∀゚)
何も無くスレを立てるのもアレなんでテソプレみたいなもんも作りました
Web Archiveだけではすぐに話題は尽きてしまいますが
Internet Archiveなどのさまざまな記録も話題に加えれば話題は尽きないと思います 多分

3 :
5年前に作った俺の恥ずかしい若気の至りサイトを消してくれ

4 :
>>3
詳しく

5 :
Recallは日本語使えなかったけど革新的なサービスだった…
再開してくれないもんかねぇ(出来れば日本語対応で)

6 :
ダウンしてるぞInternet Archive

7 :
復旧したっぽいね

8 :
あげ

9 :
あげてねーだろ
しかし語ることねーな

10 :
age

11 :
tgzのキャッシュってダウンロード出来ない?

12 :
キャッシュは流石に難しい

13 :
今のところ日本語のページを開くとUnicode固定になっちゃうんだよなぁ…
わざわざエンコードするの面倒だからどうにかしてS-jisに固定できないものだろうか…

14 :
オミトロンは?

15 :
おみとろん久しく使ってなかったけど。
Internet Archive開くときだけ使ってみるか。

16 :
オミトロンのルール誰かplz

17 :
最近Internetarchiveからソフト類をダウンロードするの
難しくなってないか?
Zipだとか過去手に入った物が手に入らない。

18 :
>>16
Proxomitron専用Uploaderの「pr0043.txt」
ttp://proxo.hp.infoseek.co.jp/cgi-bin/sn_uploader/2.html?1193422532
フィルタ、リスト公開/8 - Proxomitron等に関するWiki
ttp://abc.s65.xrea.com/prox/wiki/%A5%D5%A5%A3%A5%EB%A5%BF%A1%A2%A5%EA%A5%B9%A5%C8%B8%F8%B3%AB/8/

19 :
>>17
ネットの発展は「宇宙の膨張と同じ」とまで例えられるくらいだかね
淘汰されちゃうんだろうな
俺的にはlzhアーカイブの加速度的な消失が痛いよ
>>18
作者さん?乙です

20 :
ひさびさにおみとろん導入してみたよ。
とりあえずInternet Archive の文字化けを直すヘッダフィルタのみ有効にした。
手間が省けていいもんだね。

21 :
Internet Archiveに繋がらないんだが、
どうなってる?

22 :
生きてるっぽいけど?

23 :
おお、繋がりましたわ。失礼

24 :
>20
どれどれ俺もやってみよう

25 :
収得できないのってもう絶対見られない?
時間おけば見られることあるの?

26 :
1年ぐらいたったら公開されるってどっかに書いてあったよ

27 :
1年か('A`)

28 :
落ちてる?

29 :
うんにゃ

30 :
テンプレ追加きぼん。
Q. 毎日のようにキャッシュが残っていたサイトなのに
最近のものが何故か無くなっている。
A. Wayback Machine で表示できるのは 6 ヶ月前より古いキャッシュで、
それ以降の分は 6 ヶ月経つまで表示されません。
最近 ttp://www.archive.org/index.php と
ttp://www.archive.org/web/web.php が落ちてることが多いな。
それでも ttp://web.archive.org/web/*/ごにょごにょ
とかやるときちんと動いてる。

31 :
>>30
おや、1年てのは勘違いか、ルールが変わったのか…

32 :
同じサイトでも見られるリンクと見られないリンクの違いは何なんだ

33 :
またダウンしてる?

34 :
>>32
503エラーもどきじゃない?
何回かクリックすると見れることあるよ

35 :
色々あり今までこちらに来れませんでしたが
オミトロンを教えてくださった方 どうもありがとうございました

36 :
律儀だな〜

37 :
俺オミトロン設定してるのになぜか文字化けが止まらないな・・・

38 :
>>37
In してくるヘッダーの text/html; charset=UTF-8 の
charset=UTF-8 を削るだけのフィルタだよ。
一度確認してみたら?

39 :
ウェブアーカイブというサイトで、
昔消えたサイトを復元できますが、それをされないようにサイトを作ることはできますか?
HPの製作者が消した後なら、
ウェブアーカイブに残らない、なんてことを聞いたこともありますが、
そんなことありえないですよね?
あるいは、文字化けして、どっちみち見れないようなものとして表示される、
とも聞きましたが、それも間違いですよね?

40 :
>>39
ここに書いてあるとおりにすればいい。
ttp://www.archive.org/about/exclude.php
英語がわからなければ適当にぐぐって。すぐ情報でるから。
文字化けはキャッシュしたページの文字コードを無視して
UTF-8で表示してるだけで正しい文字コードに変えれば見れる。

41 :
1996年から8500億ものウェブサイトを保存している「Wayback Machine」 - GIGAZINE
http://gigazine.net/index.php?/news/comments/20080127_1996_internet/

42 :
Robots.txt Query Exclusion.
という文字が出て、ようやく探し当てたページなのですが見る事が出来ません
少し調べたのですが、見れないのです。これは打つ手無しでしょうか。

43 :
>>42
それはデータをクロールする検索ボットをお断りしますっていうヤツだから無理
というかまともな検索サイトじゃ検索結果にも出ないハズ
もしキャッシュが欲しいならマイナーな検索エンジンやちょっとUGちっくな検索サイトを使った方が出やすいかも
もし晒しても問題無さげサイトなら晒してみ
手伝いくらいならできるかもよ

44 :
livedooの昔のブログで月別アーカイブの次のページ(2ページ以降)を見たいのですが、
普通にクリックでは表示されないのですが、何とか見る方法はありますか?

45 :
続きです。livedoorのブログですが、アドレスの最後がこの様になっていて、
検索しても見られないのです。archives/2006-11.html?p=2
それと、1年以上公開されていたブログで月別アーカイブが約半分程度しか残っていないのですが、
他の月分は今後見る事は不可能でしょうか?

46 :
まずWeb Archiveは>>30の半年縛りがある
それと何とか見る方法ってのをみんなで探す前提条件がurlを晒すことなんだがOK?
あと有名なとこなら魚拓系サイトって手もあるかも

47 :
>>46
魚拓系サイトも見たのですが、トップページのみのリンクでだめでした。
livedoorのブログは、アカウント以降は全て同じで次のページへのリンクが
/archives/2006-11.html?p=2で見られる様になっているのですが、
ページが存在しませんと出てしまいます。
残念ながらurlは晒せないので、もう少し頑張ってみます。アドバイス有り難うございました。

48 :
ttp://kakuri.sakura.ne.jp/oekaki/
上のお絵かき掲示板のNo.6220-6247の絵を見たいんだけどなんかいい方法ないですかね。
推測するには2007年の6月から5月だと思うんだが。
web archiveじゃあ無理臭い。

49 :
現行URL?は
ttp://kakuri.sakura.ne.jp/oekakix/
でした

50 :
web archiveは特定のサイズ以上の画像はクロールしないようにしてるっぽいから無理じゃない?
しかもどう見ても児ポでFBIから睨まれそうなトコだし…

で話は変わるが俺その画像(というかHTMLログ全て)持ってるかも知んない
これ以上はスレ違いだから
・比較的流れの速そうな板の適当な糞スレへ誘導
・50メガ程度うpできるロダ
この2つ用意したら揚げてやんよ

51 :
ttp://namidame.2ch.net/test/read.cgi/ghard/1201950750/

52 :
ぽっぽ(弟)に通報します

53 :
重いー

54 :
最近どしたってくらい重いんだけど
英語読めないからアナウンス出てるかもわからんし

55 :
robot.txt置けない環境なんだがメタタグでnoarchive指定しても無意味?

56 :
最近はGoogleさんですらnoarchiveを無視することがあるしな・・・

57 :
Internet archiveで拾えないファイルってもう絶望的…?

58 :
>>55
56に同意でmetaは無意味じゃないが読んでくれないことがある
>>57
ファイル系?HTML系?
もしURL晒せれば微力ながら協力するが

59 :
>>58
すいません、助かります
ttp://degwin.cool.ne.jp/nanika/download/nekomimi.nar
って言うファイルで、2004年の1月初期まで公開してたっぽいんです

60 :
>>59
うーん見つかんないねぇ…
も少し情報無い?
あとこれ伺かだと思うんだけどマルチにならないようにここでの質問を正式に打ち切って
伺か系のスレや掲示板・ロダで探した方が良い鴨

61 :
robots.txt置いて、削除フォームから申請したのに一向に削除されない
恥ずかしいから早く過去を消し去りたいのに・・・

62 :
     _, ,_
   ( ^ё^) ヤダァ、見ないで!恥ずかしい…
     (つ/ )
      |`(..イ 彡サッ
     しし'

63 :
魚拓とweb archiveはウェブ社会の癌。

64 :
>>63
ハゲ黙れ

65 :
http://rollin.jp.land.to/
上のアップローダーのファイルを保存して新しいところに上げてみたいのですが
Not in Archive.って出てしまうんですが。どうしようもないんですかね?

66 :
ここって昔のゲームとかもDLできるんですか?
くにおくんシリーズとか。
どなたかやり方を教えてください!

67 :
日本語でおk

68 :
やっぱり無理ですか

69 :
>>65
ttp://web.archive.org/web/*nr_130/http://rollin.jp.land.to/*
無効のシステムのエラーならまだしも、
Not in archive だけは無理だろ。

70 :
2ヶ月ぶりぐらいにアーカイブを使ったが、
「ページを表示できません」ばっかりだorz

71 :
>>70
同じく。一体何がおきてるorz

72 :
ttp://web.archive.org/web/*/ごにょごにょ
これで出たと思ってもそっから先に進めなくなってるな。
Failed Connectionとか言われる。

73 :
Not in Archiveって出ても日を改めたら見れたりしたと思うけど
勘違いかな?

74 :
Path Index Error.が多いな。さっき見たファイルが、もう見れなくなってる。

75 :
>>74
確かにここの所それが出る頻度が妙に多くなってるな。

76 :
やはりNot in Archiveはもう見れないのかな?
日をあらためれば見れるという人もいるし希望持ってるんだが保存されてないんだったら無理だよなー
アゲます

77 :
Not in Archiveって言ってるのだし
その言葉の意味からしても諦めたほうがいいと思う
Failed Connectionならうまくいけば繋がる→繋がれば残ってるかもしれないけど

78 :
web.archive.org、404きた…

79 :
滅びてくれると嬉しいのだが、クローラは毎日のように来てるんだぜ?

80 :
REMOTE_HOST: xcrawl109.alexa.com
HTTP_USER_AGENT: ia_archiver

81 :
昨日は表示できてたはずなんだが、今日なんかサーバーにつながらなくね?

82 :
         ,. -─‐- 、
         , '´        ヽ
       /  /ヽ\     ヽ
     /  /   `、 \ ヽ   ゙,
      .i   i     ヽ、`ヽ、 \ ',
     i   !.  ==、  `ヽ、`ヽ、!
     |  l丁 ̄ ̄`i-f´ ̄`ヽ、ヽ !
     |  !.ヽ --‐'  `ー‐一1ヽi
     |  i     i  丶   ! ,'
      !  !    `ー '"   ,' i      ホームページのダウンロードや印刷は禁止します
     i  /ヽ    ー一'  /ヽ、!       アーカイブも禁止します
       V   \ ,、     .// ヽ 、_       法律は糞くらえだ俺が嫌だと言っている
  .r'"´ ̄ |.   /,へっ‐'" /  i  ``'‐- 、
 /  / | / く★へ ,. へ、. l         ヽ
./   ⌒ /     /`)   ヽ/        i

83 :
うむ

84 :
ここに保存されてないと過去のホームページを見るのは絶望的なの?
Internet Archiveの様なサイト他にないのかな

85 :
魚拓は?

86 :
>>85
無かった、やはり無理だよね

87 :
URL晒せないの?

88 :
http://homepage3.nifty.com/〜がURLだからそっから保存されてるを全て根気よく調べようと思ったら20000までしか表示されない
並べ方的にこの後なのに
http://web.archive.org/web/*sr_19981nr_30/http://homepage3.nifty.com/*
こういう仕様なのかな?だいたいのURLはわかります

89 :
>>88
ttp://web.archive.org/web/*sr_19995nr_1/http://homepage3.nifty.com/*
確かにそういう仕様なのかもな。
URL のページ番号を示す部分が 19999 の次は -1 になってしまう。
あとは、 検索範囲を狭めて根気良くやっていくしかないと思う。
ttp://web.archive.org/web/*/http://homepage3.nifty.com/1*
ttp://web.archive.org/web/*/http://homepage3.nifty.com/2*

90 :
「Failed Connection」は「接続できませんでした」の意味でしたっけ

91 :
何と何が接続できなかったかを議論する前に
そんな障壁があったとは知らなかった。

92 :
この数日Failed Connection頻発して使い物になんね
あとドメイン失効したサイト跡地にrobots.txt置く業者ウゼェ、マジでR

93 :
Failed Connection 頻発がマンネリ気味の恐れがあるなら、

94 :
どのアドレスを入力してもFailed Connectionと出る、何があったのか!?

95 :
過負荷がかかってるだけ
しばらく日をおいたらサーバー増強で直ってるんじゃね?

96 :
なんか知らんが直ってるっぽいよ。
数メガバイトのzipファイルも1Mb/s辺りで落ちてくる。
1バイト欠けるのは相変わらずだけど。

97 :
半年ルールでそろそろ今年頭のデータが見れるようになってもいいはずだけど…
昨年8月以降止まってる気がする。

98 :
>>97
ほんとだ。 8 月末で切れてる。
ttp://web.archive.org/web/*sa_/http://www.goo.ne.jp/
ミラーも同じ状態。
ttp://web.petabox.bibalex.org/web/*sa_/http://www.goo.ne.jp/

99 :
Proxomitronの設定ってこれで合ってる?
ttp://imepita.jp/20080626/525180

100read 1read
1read 100read
TOP カテ一覧 スレ一覧 2ch元 削除依頼
アメーバーピグ一期生【秘密広場復活】 (141)
ヤフーチャット50−4&5について語るスレ (879)
【2ch】必死チェッカーもどき (113)
p2.2ch.net総合スレ【不具合】【要望はブラジルへ】 (416)
【UULA】SoftBank SmartTV Part1【BBTV NEXT】 (111)
書き込みテスト専用スレッド (546)
--log9.info------------------
CentOSとAMDのCPUを絡めて話したい人のスレ (109)
かなりLinuxの方が優れたGUIじゃね? (123)
[gentooベース]sabayon Linux (392)
HDBENCH clone の結果コピペスレ (110)
intel compiler for Linux part2 (724)
WindOS is light,fast & rich Operating System (110)
【設定】Webmin【の鬼】 (547)
LinuxでフレッツADSL? (260)
少しは省エネについても考えてみる (130)
sidux - Debian Sid 安定化プロジェクト (790)
Nautilusスレ ファイルマネージャ/シェル。 (137)
はやいルータを作る (802)
【鬱病】壊れたプログラマー 35人目 【爆発】 (540)
Java、Android開発の職業訓練について Part.5 (248)
偽装派遣・多重派遣・偽装請負 (421)
正社員で派遣(常駐)されてる奴は目覚めたら? (486)
--log55.com------------------
審議を拒否している野党側「あり得ない高さまでハードルを上げてしまった」 上げた拳の下ろし方が分からない状況
三浦瑠麗「20代の人は辞めなくていいと思ってる。世代間ギャップがある」→ 田原総一朗「思ってない!」「麻生は全くダメ」
【朝生】三浦瑠麗「世代間ギャップがある。20代の人は麻生大臣は辞めなくていいと思ってる」 田原総一郎「思ってない!」
【公開討論会】立憲民主党・枝野幸男が突然ヒステリックに発狂 視聴者を唖然とさせる
捏造!TBS系モスクワ支局長「会見に大臣が現れない、何かがおかしい」変更前の会見場を撮影して投稿 →世耕大臣が説明の投稿
【愛知】前川喜平を講演会に呼んで億単位の税収を失った西尾市、高須院長に泣きつく
日本の右傾化「左翼が夢物語ばかり掲げたから」 日本の右傾化「左翼が夢物語ばかり掲げたから」
【日本会議】「自衛隊の違憲論争に終止符を」安倍晋三首相、ビデオメッセージ全文