1read 100read
2012年6月プログラム530: 文字コードの種類は何故複数あるのでしょうか? (339)
TOP カテ一覧 スレ一覧 2ch元 削除依頼 ▼
C、C++の最適化について語るスレ 3 (686)
クラス名・変数名に迷ったら書き込むスレ。Part21 (585)
NullPointerExceptionを「ぬるぽ」と呼ぶスレ6 (330)
【汚物】痛い変数名・関数名【破廉恥】 (730)
WPF(XAML, XBAP, .NET4.0)GUIプログラミング Part13 (628)
くだすれFORTRAN(超初心者用)その5 (919)
文字コードの種類は何故複数あるのでしょうか?
- 1 :04/08/23 〜 最終レス :12/01/04
- 1つにしてくれればPGが苦労することはなくて
、ミンナうれしいはずなのに。
- 2 :
- そんなことでスレを立てないで下さい。
- 3 :
- >>1
アニメの世界であれば、そういう迷惑なことをするのは悪の組織ですよね?
現実の社会ではどうでしょう?
クリーンなイメージのあの組織も、もしかすると悪の組織なのかもしれませんね。
私は、大義名分を振りかざすこと、常に勝つことが重要であると考えています。
- 4 :
- >>1
それが資本主義。
- 5 :
- じゃあ共産圏は一つに統一されているのか。
- 6 :
- 宗教戦争の為だ。
- 7 :
- 統一されてないから。
- 8 :
- なら、>>1 が新しい統一した文字コードを作れ。
- 9 :
- >>8
また増えるからもういいよ
- 10 :
- 2バイト文字を使わなけりゃいいべや。
- 11 :
- ?
おまえら、まだ文字コード使ってるの?
俺はだいぶ前から文字しか使ってないよ。
- 12 :
- あめれか人が悪いに決まってるだ
- 13 :
- もう全部ビットマップでいいよ。
- 14 :
- >>12
欧米人は頭足りないからな
- 15 :
- UNICODE がもう少しまともだったらなぁ。
- 16 :
- >>15
所詮は「なんでアルファベット以外が存在してんだよ」と思ってる連中が作った規格。
- 17 :
- 1.0と比べると3.2はずいぶんマシになってるし
あと20年もすれば納得いくものになるんじゃないの
- 18 :
- Unicode1は所詮ローカライズ用
- 19 :
- アルファベットの文字コードも複数あるわけですが…
- 20 :
- ここを見れ!
http://www.pahoo.org/e-soul/webtech/encode/encode01-01.shtm
- 21 :
- http://www005.upp.so-net.ne.jp/p-move_h/constitution.htm
本来神聖なる日本国憲法を記載するに当たり一字一句変える
ことなく記載しなければならないところですが、コンピューター
通信上の禁則文字(JISコードに含まれていない文字)があり、
読み方は一緒なのですが例えば「わゐうゑを」2番目の「ゐ」を「い」
に4番目の「ゑ」を「得」に変更させていただきました。
あしからずご了承下さい。
「ゐ」「ゑ」はJISコードに無い文字なのか?
- 22 :
- 改行コードの種類は何故複数あるのでしょうか?
- 23 :
- 大人の事情
- 24 :
- >>21
「禁則文字」の用語にも誤解があるようでつね
- 25 :
- >>22
昔々、テレタイプという通信機には
プラテンを1行分進めるラインフィードという制御コードと
印字ヘッドを左に戻すキャリッジリターンという制御コードが別々にあった
そんでこいつは初期のコンピュータにつないで端末として使ったりもした。
それが今の改行コードの元になったわけだが
MS−DOS,->Windows系列では律儀に上記二つペアを改行コード
としてそのまま引き継いだ
UNIX系だとニューライン(ラインフィード)LFだけになり
Mac系はキャリッジリターンだけを改行コードとして採用した。
ネットワークプロトコルではCRLFが今でも
改行コードの標準だが、
これは
テレタイプ->ダム端末->telnet,rloginの流れで改行コードも
引き継がれたからだ。
- 26 :
- >>25
答えキタ━━━━━━(゚∀゚)━━━━━━ !!!!
ありがとう
UNIXがLFなのになんでネットワークがCRLFになっちまったのかと思ってたんだよ
- 27 :
- ttp://satosan.jp/ClangStudy.html
> 遠隔地同士の通信手段としてテレタイプ(通信機能をもった
> タイプライター) が使われていた頃は、ヘッドが行の端まで
> 行ったとき次の行の先頭に戻るま で、2文字分通信するのと
> 同じ時間がかかった。
> そこで改行の文字コードをCR(復帰:キャリッジリターン '\r')と
> LF(改行: ラインフィード '\n')の2つに割り当てた。
- 28 :
- エンディアンの種類は何(ry
- 29 :
- age
- 30 :
- TRONコード
- 31 :
- >>27
理由になってないし
- 32 :
- 「qwerty配列はタイピングが早すぎてキーが絡まないようにわざと打ちにくくした」
って都市伝説もあったな
- 33 :
- キーが絡むなら都市伝説だな。
絡むのはハンマーだから。
- 34 :
- >>32
適度に打ちにくくしたのは確かだよ。
最悪に打ちにくくしたわけではない。
最高に打ちやすくしたわけでもない。
最適に打ちにくくしたんだよ。
機械とセールスの拮抗点で。
- 35 :
- 文字コードと関係ないぞ
- 36 :
- そもそも、自然言語が複数あるんだから、
文字コードが複数出来るのも自然な流れだと思われ
- 37 :
- >>1
すべて Unicode Consortium が悪い。
そうに決まってる。
- 38 :
- >>28
普通の答えは、big-endian と little-endianの2種類だが、
3-4-1-2 や 2-1-4-3 など順序になる不可解なシステムが、過去のミニコン時代にありますた。
それらは、middle-endian と呼ばれている。
よって、32ビットでのエンディアンの種類は4種類という事になる。
- 39 :
- 24種類じゃないの。
- 40 :
- 実在が確認されているのが4種類、可能性としては24種類、ということで。
- 41 :
- XMLの仕様書に書かれてる3-4-1-2や2-1-4-3って実在したのか
>>37
ワロス
- 42 :
- >>1
容量制限のため用途に応じた使い分けをせざるを得なかった歴史があるからだよ。
たしかに文字コードの乱立はうざい。
こんなに大容量化が進んでマシンのスペックも向上しているにもかかわらず
文字コードが未だに乱立している原因として考えられることは
面倒くさがり屋、変化を恐れる愚かな老人達が我々の行動を阻もうとしていることがあげられる。
日本国内でオブジェクト指向が普及しない原因も、自分の立場を維持したい愚かな老人が
妨害しているのが原因かもしれない。
かつて、ある企業が独自規格を作って大儲けを
たくらんだために文字コードが乱立した可能性もありうる。
今ではUnicodeがあるというのにほとんどの新しい言語、OSは
Unicodeが標準だというのに
頭の古い連中は大したコストパフォーマンスにならないにもかかわらず
容量制限が・・・
既存のリソースが・・・・
などといってUnicodeを採用しようとしない。
既存のリソースならUnicodeに変換すればいいことだろう。
まったく愚かだ。Unicodeに鞍替えできない老舗顧客も老舗プログラマも。
- 43 :
- お前が愚かだ。
- 44 :
- キーボードは乱立しなくてよかったw
- 45 :
- 乱立してるだろ
- 46 :
- 「俺たちはどうして何でもUnicodeのせいにするのだろう?」
文字鏡関係者とTRON関係者とGTプロジェクト関係者が何人か集まって考えた。
しかしいくら考えても結論が出ない。その時、一人がひらめいた。
「それもUnicodeのせいだ!」
関係者は全員それで納得した。
- 47 :
- Windowsもとっととunicodeに移行して欲しいよ
- 48 :
- してるじゃん
出来てないのはiniファイルくらいだろ?
- 49 :
- どうか教えてください。
[1] 授業単元:プログラム概論
[2] 問題文(含コード&リンク):
シフトJISからEUCへの文字コード変換プログラムを作りたい(余裕があればその逆も)
http://tokyo.cool.ne.jp/kuonnnokizunanbalivetehe/programming/prog1.txt
[3] 環境
[3.1] OS: WindowsXP,NT Solaris2.0
[3.2] コンパイラ(バージョン):富士通fcc,Cygwin(gcc)
[3.3] 言語:C
[4] 期限:2005年2月28日12:00まで
[5] その他の制限: この問題文の意図だと引数をunsigned int型にするべきかどうか分からない
- 50 :
- >>49
#include <stdlib.h>
main()
{
return system("nkf -e from > to");
}
つーかスレ違い
- 51 :
- >>41
3-4-1-2ってのは、最小アクセス単位が16 bitでbig-endianなCPU
(3-4)-(1-2) 別名middle endian
wordにpackするとこの形になった。(Cの先祖のBCPL、初期のpascal等)
>>27
それは嘘。(そもそも復帰は物凄く時間がかかる)
タイプライター時代から、(行先頭に)復帰して文字を進めて重ね打ち、例えば _ を、
ってのがあって、それをプリンタにも持ち込んだのが最初。
- 52 :
- >>50
ワラ
幾らなんでもそれはないから
> return system("iconv -f shift_jis -t euc-jp < from > to");
でどうだ?
- 53 :
- 簡単な質問かもしれませんが、分からないので教えてください。
以下のプログラム、核は出来ています。このまま使用しても目的は達成できます。が、
http://tokyo.cool.ne.jp/kuonnnokizunanbalivetehe/CSJS2EUC.C
http://tokyo.cool.ne.jp/kuonnnokizunanbalivetehe/CEUC2SJS.C
この2つのソースコードをJISを経過させずに直接変換させるにはどうしたらいいでしょうか?
- 54 :
- >>53
何故一つの質問をあっちこっちで聞きまくるんだ
頭おかしいんじゃないか?
- 55 :
- あちこちで聞けば、たくさんの人が並行して考えてくれるので、
答えが早くでると思いました。
どこか答えが出てるスレッドがありましたら教えてください。
- 56 :
- だから、テーブルを使えよ。
- 57 :
- >>48
コマンドプロンプトとか無理だろ
- 58 :
- 無理じゃ無いよ
ちゃんとユニコードなファイル名も表示されるし
- 59 :
- > あちこちで聞けば、たくさんの人が並行して考えてくれるので、
> 答えが早くでると思いました。
> どこか答えが出てるスレッドがありましたら教えてください。
・・・こういう心理をどう表現すればいいのだ?
自己中心的か
ゲーム脳か
- 60 :
- ちなみに55はボクではありません。今さらどうでもいいけど
- 61 :
- >>59
全員から同時に返事が来たらどうするつもりなんだろうね
- 62 :
- そこで超漢字
- 63 :
- うにこーど
- 64 :
- >>57
localeモデルにしとけば、Shift_JIS→UTF-8移行も楽だったね。
- 65 :
- UNICODEだってごちゃごちゃの固まりジャン
こんな気味悪い文字コードにしなくちゃいけないのはいやだ
- 66 :
- UTF-8は使用するメモリが1.5倍になるからいやだ
- 67 :
- UTF-8で1.5倍とはしらなかった。
- 68 :
- 漢字のコードポイントのとこなら1文字3バイトだけどね。
- 69 :
- あ、3オクテットというべきかにゃ?
- 70 :
- 4オクテットの箇所もあるでよ。
- 71 :
- そこでシフトJISですよ。JIS第3水準、第4水準も難なく扱えるし、な。
- 72 :
- つうか、そろそろJIS廃止してくれんかの。
シフトコードウザイ。
- 73 :
- UCS-4ってのが最後のUnicode?
Javaだとint型なんだっけ?よーわからんけど、早く統一して欲しい。
- 74 :
- >>73
1文字8バイトなんて世界が来るのかね。
- 75 :
- UTF-8でいいんでしょ?〜とか@とか大丈夫なんでしょ?
- 76 :
- >>75
いまのWord、ExcelはUCS-2だから、その世界に収まっている
仕事ならUTF-8でおけですよ。
でもオヤクソとかは…
- 77 :
- やっぱり生き残るのはシフトJIS系。
将来的には半角カナの領域を1バイト目にして可変長のコードにして
UnicodeやTRONコード、JEF、KEISを丸呑み。
絶対そうなる。
- 78 :
- >>76
じゃあUCS-4でいいから今すぐ統一して( ノ><)ノ
- 79 :
- 常用漢字とJISが食い違ってるというのもそもそもどんな縦割り行政
しちょるのかと
- 80 :
- 何か食い違ってたっけ?
- 81 :
- 龍の旧字体?
- 82 :
- 竜の旧字体? だった
龍じゃそのまんまじゃんorz
- 83 :
- 「龍」の点の向きのこと?
そんなもん包摂の範囲内だしどっちだっていいやん。
表外漢字字体表にがちがちにあわせたJIS X 0213:2004のほうが異常。
- 84 :
- 大体、印刷標準字体とかうざいんじゃ!
- 85 :
- だって常用漢字の数とJIS漢字の数とそもそもぜんぜん違うじゃん
たしか常用漢字にあってJISにない漢字とか結構なかったっけ?
それより写植の文字がJISに入ってないせいで電話記号とか
ポゲムタとかが簡単に出せなくてラムちゃん語も満足に表記できやしない。
- 86 :
- >たしか常用漢字にあってJISにない漢字とか結構なかったっけ?
>たしか常用漢字にあってJISにない漢字とか結構なかったっけ?
>たしか常用漢字にあってJISにない漢字とか結構なかったっけ?
>たしか常用漢字にあってJISにない漢字とか結構なかったっけ?
>たしか常用漢字にあってJISにない漢字とか結構なかったっけ?
>たしか常用漢字にあってJISにない漢字とか結構なかったっけ?
>たしか常用漢字にあってJISにない漢字とか結構なかったっけ?
>たしか常用漢字にあってJISにない漢字とか結構なかったっけ?
- 87 :
- いま試しに数えてみたら24個くらいあった
- 88 :
- >>87 夜に数えると増えてるよ。
うちの家の階段も昼間は12段だけど
夜数えると13段ある。
- 89 :
- たしかJISにあって常用漢字にない漢字とか結構なかったっけ?
- 90 :
- ない。
- 91 :
- お前ら大嘘つきだ。みんな嫌いだ。
- 92 :
- 文字コードが増える前に、俺らが使う言葉の数を減らせばいいんじゃね?
- 93 :
- たしかに。英語だけあれば世の中困ること無いよな。
- 94 :
- そうだ。
- 95 :
- >>66
UTF-8って英数字に対して使うなら容量はそんなに増えなかったかと。
- 96 :
- 戦争中、敵方の兵士により領土が侵略されると、必ず略奪やがおこなわれる。ルワンダもその例外ではなかった。
大統領の暗殺から2週間ほどたったころ、ルワンダ北西部のルヘンゲリ県のある村で14歳のツチ族少女がフツ族民兵に誘拐された。
当時すでに虐殺の嵐はルワンダ全土を激しく吹き荒れ、各地で次々とツチ族が殺されていた。しかし幸いなことにその村ではまだ一人の死者も出さず、ツチ族とフツ族が微妙なバランスの上で共生していた。
誘拐された少女は、「気立てが良くかわいい娘だ」と村で評判だったらしい。その日も夕食の準備をする母を手伝うため、水を汲みに村外れの井戸へ行き、そこで待ち伏せていた数人の男に拉致されてしまったのだ。
何人かの村人がその様子を目撃し、すぐさま家族に知らせた。家族は娘の身に起こりうる最悪の事態(された後、殺害される)を考え、血眼になって探したが、1週間たっても少女の行方はわからなかった。
さらに数日が過ぎ家族があきらめかけたころ、隣村から連絡が届いた。
「娘さんらしき少女を保護した。重体ではあるものの生きてはいる」
家族は押っ取り刀で隣村に駆けつけ、粗末なベッドの上で毛布に包まれ、横たわる少女の姿を見た。
体を包んでいる毛布に血がにじみ、見る影もなくやせ細った体は小刻みに震え、その瞳は輝きなく虚空を見つめていた。家族が声をかけても何も反応を示さない。脅えているのか寒いのか、ただ小さく震えるだけだ。
- 97 :
- 少女は非常に奇異な姿で発見されたという。隣町の農夫は発見したときの様子をこう語る。
「私がいつものとおり自分の畑を耕すためにあぜ道を歩いていると、ふと視界に見慣れないものが目に入ったのです。
最初は『木の切り株か、大きな石なのかなあ』と思ったのですが、近づいてみると違いました。目を疑いましたよ。裸の少女が腰から下を土に埋められていたのですから……。
私が発見したとき、彼女は焦点の定まらない目でぼんやりと遠くを見つめ、半開きになった口からよだれを垂れ流していました。
インタラーメ(フツ族民兵)か政府軍が近くにいるのではと思ったので、慌てて村にいったん帰りました。人を集め武器を持ち、恐る恐るその場に戻って、彼女を掘り返したのです。
目は開いていたのですが、すでに彼女の意識はありませんでした」
変わり果てた姿の少女を、家族はすぐさま村から少し離れたところにあったフランスの緊急医療援助団体“国境なき医師団”の診療所へと運び込んだ。
偶然、その少女の治療に日本人看護婦、山本珠江さんが立ち会っていた。
- 98 :
- 「数人の男たちに、彼女は何日間にもわたり強姦され続けていたみたいなの。食事もろくに与えられていなかったようね。
しかも土に埋められる前、女性器に木の棒か銃身のような細くて固いものを押し込まれ、こねくり返されたようなのよ。
その傷口に雑菌が入ってしまったらしくて性器の一部が壊疽していたわ。
命だけは助かったけど、当然もう子供は産めないし、あまりに大きなショックを受けたから精神障害がひどくて廃人になってしまったわ」
山本さんは非常に悲しそうでいて、悔しそうな表情をしながらその時の状景を振り返った。
1週間ほどその少女は「国境なき医師団」の診療所に入院していたそうだ。肉体的な治療が終了すると、少女は家族に連れられ家に戻っていった。虐殺の被害に遇った瀕死の患者が次々に運び込まれてくるため、生命の危機がなくなった患者を収容する場所がなかったためだ。
「悲しいけど、これ戦争なのよね」
山本さんは、苦しげに首を横に振りながら語った。
- 99 :
- >>97-98
よくあること
はいりょしてくれないと
- 100read 1read
1read 100read
TOP カテ一覧 スレ一覧 2ch元 削除依頼 ▲
VBプログラマ質問スレ(Ver.6.0 まで) part58 (434)
【超高速】C/C++に代わる低級言語を開発したい 7 (969)
懐かしきベーマガの面白かった投稿プログラムを語る (740)
ニートの俺が何か開発して食いつなぐスレ (821)
UIデザインガイドライン 2007 (449)
Subversion r14 (348)
--log9.info------------------
ハヤテのごとく!桂ヒナギク萌えスレ36 (1001)
銀魂 今井信女アンチスレ2 (322)
To LOVEる-とらぶる-天条院沙姫、藤崎綾、九条凛萌えスレ (243)
BLEACHの石田雨竜はカッコカワイイ空座第一高等学校第25代生徒会長 眼鏡7本 (481)
【To LOVEる-とらぶる-】ララ・サタリン・デビルーク萌えスレ 16 (208)
【GANTZ】西くんについて語るスレ6【西丈一郎】 (934)
【NARUTO】うちはサスケ46 (220)
【Waqwaq】御加護を受けたい【赤い血の神様】11滴目 (875)
【エデンの檻】偽・石動ミイナはショタカワイイ3【女装美少年】 (553)
【絶望先生】木津千里スコップ12本目【絶交って言っちゃった】 (670)
【べるぜバブ】ヒルダさんは侍女悪魔可愛い6 (276)
【Rozen Maiden】金糸雀萌えスレ16【ローゼンメイデン】 (745)
【(ю:】ニセコイの桐崎千棘ちゃんに萌えるスレ 2 (367)
【銀魂】志村妙アンチスレ【Part15】 (888)
【NARUTO】うみのイルカ応援スレ【イルカ先生】 (913)
【跡部王国】テニプリ 跡部景吾に酔うスレ12日目【スケスケだぜ!】 (252)
--log55.com------------------
☆静岡男の嘘つき引退カウントダウン★
☆東京オリンピック延期★with静岡菌
■漢静岡男!「彼女も来月には出来る。出来たらここを引退」
●自演とコロナと静岡菌と Part1
【Nescafe】ネスカフェ ドルチェ グスト 15滴目
自宅でコーヒーをドリップする人コツを教えて。
gram 総合
IDに【cook】と出すまでチャーハンを炒め続けるスレ9
-