1read 100read
2013年17Linux275: ja_JP.UTF-8 (376) TOP カテ一覧 スレ一覧 2ch元 削除依頼
少しは省エネについても考えてみる (130)
犬女 2匹目 (556)
でさ、これ何て読むのよ in Linux板 3 (181)
【林檎より美味しい?】Pear Linux【洋梨】 (115)
日医標準レセプトソフト ORCAスレ Part7 (628)
LinuxやUNIX関係の用語でギャグを作れ! (101)

ja_JP.UTF-8


1 :04/02/19 〜 最終レス :2013/06/28
Linux で ja_JP.UTF-8 ロケールで暮らす方法についてのスレです。

2 :
2

3 :
UTF-8 に対応しているソフト
mlterm - http://mlterm.sourceforge.net/
xterm
tcsh 6.12 - http://www.tcsh.org/
lv - http://www.ff.iij4u.or.jp/~nrt/lv/
samba3.0 - http://www.samba.org/
emacs + mule-ucs
以下、続々登場(予定)

4 :
UTF-8 に対応しているソフト
iconv - (問題点⇒http://www.miraclelinux.com/technet/samba30/iconv_issues.html)
mozilla - http://www.mozilla.org/
nkf - http://sourceforge.jp/projects/nkf/
vim - http://www.vim.org/
yudit - http://www.yudit.org/
cocot - http://iwa.ath.cx/software/cygwin/cocot.html
以下、続々登場(予定)
Debian/GNU Linux 3.0 での設定
/etc/locale.gen ファイルに、
ja_JP.UTF-8 UTF-8
の一行を追加して、
/usr/sbin/locale-gen
を実行すると、/usr/lib/locale/ja_JP.utf8 以下にロケールデータができる。

5 :
cocot ってよさげっぽいな。
これを使えば utf-8 を扱えないターミナルでも
$ cd 新規フォルダ
とかが出来るようになる?

6 :
>>5
できますが、(cocot のせいではないが) シェル自体が utf-8 にちゃんと
対応していないと表示が乱れます。
使い方⇒
cocot -p utf-8 ssh hoge.co.jp

7 :
Debian関係:UTF-8
ttp://tagoh.jp/w/wiliki.cgi?Debian%b4%d8%b7%b8%3aUTF-8&l=jp

8 :
UTF-8 に対応しているソフト(というかツールキット内部で UTF-8 を使ってる)
Gtk+2/GNOME2 アプリ http://www.gnome.org/
Qt(2|3)/KDE3 アプリ http://www.kde.org/
OpenOffice http://www.openoffice.org/

9 :
同上
subversion http://subversion.tigris.org/

10 :
>>6
cocot, Debian で compile して使ってみました。
$ echo $LANG
ja_JP.eucJP
$ ./cocot -t EUC-JP -p UTF-8 ssh hoge 'ls utf-8-folder'



と、上手く行ったけど slogin で bash 2.05b な shell では ls としても
駄目でした。bash が utf-8 に対応していない? というか、対応している
shell ってある?

11 :
>>10
tcsh は対応してることになっているけど、
マルチバイトの utf-8 文字がちゃんとずれずに表示されるかどうかは不明。
emacs + mule-ucs + M-x shell で、
process-coding-system を utf-8 にしたらうまくいくかも…

12 :
GNU recode関係はこちらでよろしいのでしょうか?
興味があってこれから勉強しようと思っているのですが、、、
http://www.gnu.org/software/recode/recode.html

13 :
>>10
ちゅうか、これ cocot を使わずとも
$ ssh hoge 'ls utf-8-folder' | iconv -f utf-8 -t euc-jp -
とすればいいですね。
>>11
tcsh 試してみます。

14 :
しかし、この状況ではja_JP.eucJP並にja_JP.UTF-8が使えるとは思えないのだが、
Fedoraは何で採用してんだ? 実験的ディストリったって、早過ぎないかね。

15 :
Fedora使ってますが、TeX関連とWnn7がUTFだと面倒みたいなので
EUC環境に避難中です。

16 :
bash自体(2.05b)はUTF-8に対応してるんじゃないの?
日本語の上でカーソル移動させてもちゃんと文字単位で移動する

関係ないけど自分的に問題なのはターミナルで一部の全角文字が
半角扱いになること。gnome-terminalで★とか−とか。
全角判定をwcswidthなんかでやっていると思うのだが。
プロポーショナル文字フォントを有効にできれば
(そのうえで固定幅文字フォントを指定すれば)解決しそう
(mltermではできる)が、gnome-terminalではそんな設定はない。

17 :
あ、あとmanというのもあったな。
man page自体には言語情報は含まれていないっぽくて
man pageのエンコードのまま出力されてしまう。
gettextみたく文字コード変換機能がついていればいいんだが。

18 :
>>13
その例自体はそうですが、
cocot の利点は仮想端末を提供してくれるというところですね。
あと >>4 にあるように iconv には色々問題があったり…
(cocot も libiconv を使うだけなので同じ問題を内包してますが)

19 :
すんません。
>>10
で login したら駄目、って言ったけど LANG が ja_JP.eucJP のままだから
でした。ja_JP.UTF-8 にすると
fuga:~$ echo $LANG
ja_JP.eucJP
fuga:~$ ./cocot -t EUC-JP -p UTF-8 ssh hoge
...
hoge:~$ export LANG=ja_JP.UTF-8; cd utf-8-folder
hoge:~/utf-8-folder$ ls
test てすと/
hoge:~/utf-8-folder$ cd てすと
hoge:~/utf-8-folder/てすと$ ls
kita- キター
こんな感じで、うまくいきました。
これで、かなり幸せになりそうです、ありがとう! >>1 と cocot の作者。
# tcsh では 'cd てすと' が、できなかったけど、常用してないので
# 詳しく調べてません。

20 :
どうせならLANG=ja_JP.UTF-8した後にさらにbash起動したほうがよいかと
cd てすと
はうまく動くけど、あとからヒストリ編集するとぐちゃぐちゃになる。

21 :
と思ったらLANG=ja_JP.UTF-8とやれば現行シェルもちゃんと切り替わるな
LANG=ja_JP.UTF-8 ls とかやると(変更がその場限りなので)ダメだが

22 :
Debian sid, KDE 3.2でLANG=ja_JP.UTF-8で使ってます。
ja_JP.EUC-JPから移行するときはゴミ箱に注意。
名前が化けて消しにくいファイルができて往生します。

23 :
いろいろやってみた。
Windows から cygwin の rxvt + cocot -p UTF-8 で Linux へログイン。
Linux では、emacs 21.2.1 + mule-ucs で、
M-x set-terminal-coding-system utf-8
まず、M-x help h で、HELLO を読んでみた。
日本語部分はちゃんと表示される。
いくつか問題点があった。
(1) Greek
Greek (Ελληνικ##) Γει## σα##
Russian (Русский) Здравствуйте!
全角文字で表示されてしまっているので、rxvt での文字の表示位置と、
カーソルの位置がずれる。
(2) Chinese
Chinese (中文,普通###,######) ###好
cocot は、sjis (cp932?) へ変換できなかった文字をそのままのバイト数で
# へ変換するようだが、おかげで、カーソル位置とずれる。

24 :
それから、emacs で utf-8 のフォルダの中にあるファイルを
開こうと思った。表示がくずれてわけわかりません。
set-filename-coding-system みたいなものってあるのでしょうか?
どうもファイル名などが euc だと思われてしまっているようです。

25 :
関係ないけど luit 面白いよ。

26 :
喪前らfedorasu刷れへかいれ!

27 :
さらに、tcsh-6.12.02 を make して utf8 ファイル名のフォルダへ
移動してみた。
set dspmbyte=utf8
という指定をしておけば、cd UTF8フォルダ、など補完もきく。
ls-F でも UTF8 ファイル名は一応表示できる。
だがしかし、tcsh は日本語の UTF8 文字を半角 3 文字分の
幅だと認識しているようで、カーソル位置が激しくずれる。

28 :
>>26
あいにく俺は Debian 使いだ。
それから http://www.routrek.co.jp/product/varaterm/
こんなものもあるらしい。

29 :
>>25
http://www.xfree86.org/current/luit.1.html
これでしょうか?cocot と同じようなソフトだと思われます。

30 :
cocot は初めて知ったのでよくわかりませんが、
luit は utf-8 さえ表示できればいろんなロケールの表示が可能になるやつです。
むしろ cocot の逆ですかね?
X の標準に入ってて、
XFree86 4.3 からは xterm で自動起動されるようになってます。
フォントさえ設定してあれば、
LANG=ja_JP.eucJP xterm で日本語表示可能。

31 :
以前 xfree86 の xterm で日本語を試したときは
日本語は出ることは出るが、
使用できるフォントが限られていて、あまり綺麗に映らなかった。
最近、xtt の TTCap な fonts.dir に
iso1646-1 をつけくわえて、
~/.Xresources などに
xterm*cjkWidth: true
xterm*Font: -kochi-mincho-medium-r-normal--16-*-*-*-m-*-iso8859-1
xterm*BoldFont: -kochi-mincho-bold-r-normal--16-*-*-*-m-*-iso8859-1
xterm*wideFont: -kochi-mincho-medium-r-normal--16-*-*-*-m-*-iso10646-1
のようなリソースを設定してみた。
すると、xterm で 東風 が映って
使用感は ほとんど kterm と同じ。
ja_JP.UTF-8, ja_JP.EUC-JP
の両方が利用できる。

32 :
>14
昔から赤帽の日本語環境・デスクトップ環境はだーれも期待してなかった。
Fedoraはその伝統をしっかり受け継いでいる。

33 :
>>14
決まってるぢゃん。
JISやらGBといった漢字文化を潰し、欠陥unicodeをCJKの人々にも
強要して西洋人が楽するために決まってるでしょ。
彼らはCJK環境を「CJKのユーザのため」を第一に改善しようとは決して思っていない。
自分らが楽をする事は考えてるけどな。
unicodeとJISとのコード対応関係が日本で混乱してるのは彼らも知ってるはず。
それでも、EUCとSJISで平和に暮らしてるところに、こうやって新たな混乱を強要
してくるってのは、相当利己的だと思う。
UTF-8使う=売国、って事でOK?

34 :
>>33
( ´,_ゝ`)バカジャネーノ

35 :
[debian-devel:15706] ja_JP.EUC-JP + ja_JP.UTF-8 サポート
http://lists.debian.or.jp/debian-devel/200307/msg00026.html

36 :
CJK統合漢字は事実上中国が決めてることも知らない人が
いるスレはここですか?
> UTF-8使う=売国、って事でOK?
はっ、結論が変わらない

37 :
ところで、UTFは何の略?
Unicode Text Format
UCS (Universal multi-octet coded Character Set) Transformation Format
などの説明がみつかる。8は8ビット。

38 :
>>24
こうすれば見える。最後の2行はおそらく必要なし。
(let* ((utf-8-p
    (let ((case-fold-search t))
     (string-match "ja_JP.UTF-?8" (getenv "LANG"))))
    (cs (if utf-8-p 'utf-8 'euc-japan)))
 (condition-case ()
   (progn
    (require 'un-define)
    (require 'un-supple)
    (un-supple-enable 'windows))
  (error nil))
 (set-language-environment "japanese")
 (set-default-coding-systems cs)
 (set-terminal-coding-system cs)
 (set-keyboard-coding-system cs)
 ;;(setq coding-category-iso-8-2 cs)
 ;;(setq file-name-coding-system cs)
 )

39 :
必要なし、とか書いたら丁度省略されたな…
ところで、Fedora の人は utf-8 環境でもあまり困ってないのかしら。
端末エミュレータも最初からutf-8に対応してるみたいだし…

40 :
>>39
困りまくりw
結局euc-jpに戻して使ってる。

41 :
>>33
eucはともかく、sjisじゃ幸せになれないよ・・・

42 :
>>41
つうかSJISなlocaleは未だにサポートされてないし。
Big5はあるのに。

43 :
ないなら作ればいい
localedefで作成できたはず
RedHat8あたりからそうやってSJISとUTF-8のロケール作っていたが
(常用していたのはUTF-8のほう)
いまEUC-JPでないと困るソフトってどれくらいあるかな
lynxとかそうだけど使わないし。tcshはビミョーに使えないな。
Xのソフトはフォント設定で何とかなることが多い。
RedHat9時代はEmacsも使えなかったがFedoraで使えるようになった。

44 :
http://bedroomlan.dyndns.org/~alexios/coding_ttyconv.html
cocot と同じもの。

45 :
http://www.nowsmartsoft.or.tv/nws/Japanese/nwsos_utf.htm


46 :
http://pc.2ch.net/test/read.cgi/unix/1012581029/
端末エミュレータスレより
947 名前:名無しさん@お腹いっぱい。 投稿日:04/03/08 18:08
rxvt の unicode 版結構面白いですね。
ja_JP.eucJP のlocaleでも使えるし、
xft と X11 のフォントまぜて使えるし、
mlterm みたいに server 機能もあるし。
948 名前:名無しさん@お腹いっぱい。 投稿日:04/03/08 18:14
さらに
locale が utf-8 でも
jisx0208 のフォントも使えますね。こりゃいい。


47 :
>>45
御本人が降臨してた。
http://pc.2ch.net/test/read.cgi/linux/1003159137/587

48 :
>>46
これですかね。
http://sourceforge.net/projects/rxvt-unicode

49 :
>>47
マジかよ@3
ま た き た か ( 別に逝いけどw

50 :
>>48
そうです。
debian なら sid に rxvt-unicode-ml ってやつがきてます。
LANG=ja_JP.UTF-8 urxvt -fn "a14,k14,xft:arial unicode ms:size=14"
こんな風に起動すると、英字に iso8859-1 の a14, 漢字に jisx0208 の k14,
その他の言語に xft の arial unicode ms を使うようなことができます。

51 :
urxvt詳細解説希望。KTermみたいな感じで日本語入力できないの?
# KTermのUTF-8パッチないのぉ?
# UXTermはフォント設定がよくわからん。-alias-fixed使いたいyo

52 :
>>51
--enable-ximってしてもximが聞かないなあ

53 :
cygwin の libiconv に
http://www2d.biglobe.ne.jp/~msyk/software/libiconv-1.9.1-patch.html
を当てて作り直して、
さらに cocot を使いつつ ssh で Linux へログイン。
Linux 上で emacs + mule-ucs を起動。その時
(set-default-coding-system 'utf-8) をする。
かなりフツーに使える。
あとは tcsh のコマンドラインエディタが utf-8 にマトモに対応してくれりゃいいんだが。
libiconv の日本語パッチの作者は、これを libiconv 本体に取り込んでもらうつもりはないのかな…?

54 :
そうそう、emacs 上で HELLO を表示すると、さすがに化け化けになる。
文字幅を適切に反映してくれるだけで、もうちょっとマトモに見えそうなもんだが。

55 :
>>53
Brunoに送ったらしいけど、まだ取り込まれていない。理由はようわからん。
glibcの方はもう取り込まれてるんだけど。

56 :
>>54UNICODE の文字の固定幅ってどうやったらわかるのでしょう?何かそれっぽい API が存在するのかな… iconv には見当たらないが。

57 :
libc的にはwcwidth()を使えばカラム数は取得できる。
もちろんlocale依存だけど。

58 :
>>57
locale に依存しない方法がほしいですねぇ(´・ω・`)

59 :
>>58
East Asian Width
ttp://www.unicode.org/reports/tr11/tr11-11.html
↑これを見れ。
ED6. East Asian Ambiguous (A)
のおかげで、どうがむばってもlocale依存だすよ。(´・ω・`)

60 :
>>59
あ、そうではなくて、
プログラム自身は A というlocaleで動いているが、
B という locale での幅を知りたい場合とか。
int wcwidth(wchar_t c, locale_t locale)
みたいな感じにしておかないと困らないかね…?

61 :
>>60
CとC++の話がごっちゃになってない?

62 :
>>61
誤爆?API関数の話だから言語は関係ないと思うけど。

63 :
>>62
Cのlocaleはglobal、C++のlocaleはnon-globalなobjectという
非常に大きな違いがあるが。

64 :
>>63
Σ(゜д゜|||)マジスカ
ぜんぜん知らなかった。良かったらその辺の話へのポインタを教えてくださいませ。

65 :
>>64
この辺かな。
The Standard C++ Locale
http://www.cantrip.org/locale.html
Differences between the C Locale and the C++ Locales (Rogue Wave)
http://www.roguewave.com/support/docs/sourcepro/stdlibug/24-3.html
C 言語でのロケールと C++ ロケールとの違い (上の日本語版)
http://www.scl.kyoto-u.ac.jp/scl/appli/appli_manual/SUNWspro/WS6U2/ja/manuals/stdlib/user_guide/loc_io/3_3.htm

66 :
>>23
UTF-8のときは桁数を考慮するよー修正を検討してみまつ。
しばしお待ちください。(GANAさんとこのパッチも取り込んでおかんと……)
# wcwidth()は使えなさそうだなぁ。>>59を見て考えるか。

67 :
全然関係ないけどhttp://www.google.co.krで「utf-8」を検索すると1ページ目の一番最後の所に
何故か日本語のページが出て来ますね。それにそこもutf-8で書かれているぽ

68 :
ところで、tcsh は utf8 に対応してることになってますが、
3バイトの文字が来たり、補完したりすると化け化けになります。
http://www.tech-arts.co.jp/macosx/macosx-jp/htdocs/15300/15330.html
このパッチ当ててみたりしましたが、上手く動いてるとはいいがたいような。
誰か解決方法しりません?

69 :
というか、mltermもiconvもglibcもその他もろもろのソフトウェア作成者のみなさん!
JISの1区29点は、U+2015じゃありません!U+2014です!
これを揃って直してもらわないと、困ります!!!
emacs(version 22)と、java (JDK1.4)は、ちゃんと1区29点をU+2014にしてます。
Unicodeソフトを書こうと考えているみなさんもおねがいしまつ。U+2014にして下さい。
Unicodeは決して多言語化を実現しませんし、こういった深刻な符号の対応
問題を抱えていますので、Unicode「だけ」サポートして事足れりと考えないで
ください・・・・むしろ、JISとの対応に対してきちんと理解しないで使うよりは、
むしろできるだけ使わない方向でお願いします・・・ データが穢れます。
(参考):http://hp.vector.co.jp/authors/VA010341/unicode/

70 :
JIS 1-29 は、U+2015 と U+2014 のどちらかが正しいというものではありません。
JDK1.4 互換と CP932 互換の両方の変換テーブルを揃って用意してもらわないと、
困ります。
Unicode ソフトを書こうと考えているみなさんも、おねがいします。
U+2015 と U+2014 のどちらか「だけ」サポートして事足れりと考えないでください。

71 :
ここに書いても伝わらないだろう...

72 :
>>67
しかも、その日本語のページよりも上位のサイトは
どれも韓国語で書かれてない(w

73 :
下世話なことですが、
ウンコードには笑いました。

74 :
Uncode
確かにワロタ


75 :
愛が足りないとうんこになっちゃうってことか。一つ勉強になりますたよ(藁

76 :
>>68
ふと思いついて、set rprompt='%B%n@%m%b' していたのをやめてみました。
かなりマトモに表示さえるようになりました。
ls-F の表示カラムがずれてしまうのはあいかわらずですが、
それ以外はかなりマトモ。
C-a や C-e でカーソルを移動したときに変な位置へ飛ぶとか、
細かいところで色々怪しいですが、C-l でマトモな位置へ移動します。
あと一歩足りないところを修正して tcsh 本体へパッチ投げてくれないかなぁ

77 :
>>70
「正しい」のはU+2014 (EM DASH)だよ。JISで規定されてるからね。
ただ、Unicode Consortiumのサイトに置いてある変換表(今はobsolete)に
バグがあって、U+2015 (HORIZONTAL BAR)になっていたのが尾をひいて、
いまだにこちらを使い続けている実装があるというのが現状。
今後は、出力は必ず U+2014にして、入力にはU+2015も許す(JIS 1-29に変換)
というのが妥当かと。
CP932はベンダ固有なので、限定された環境下以外では使わないのが吉。

78 :
X 0213:2000にもバグがありましたね。
0221 名前
---- ----
2015 EM DASH
ってどっちやねん(正誤表で2014に訂正されたけど)
> CP932はベンダ固有なので、限定された環境下以外では使わないのが吉。
IANAの登録簿でもWindows-31Jは
> but it is of limited or specialized use (see RFC2278).
と明記されてますね。

79 :
でも0x5CがYEN SIGNになるから
Webアプリケーションでは規格票に100%忠実なShift_JISの実装は
事実上不可能ですけど。
JDK 1.4の実装も0x5CはREVERSE SOLIDUSにマップしてますね。

80 :
>>77
JISの世界の話としては同意。
CP932の世界ではU+2015が「正しい」というのも前提とするとして、
「限定された環境下」であるところのWindowsが採用するCP932の世界が
unicode-日本語系コード変換の実装としては量的に圧倒的に多い、
というのを無視できるアプリケーションならともかく、
エディタなりウェブアプリなり、CP932の世界が絡む可能性があるなら、
ユーザーにJISとCP932の選択権があるべきじゃないかな?

81 :
cp932なりGNUな環境でjis規格ベッタリな変換したら化ける罠。
対象となる環境にあわせてベンダ固有のに従うのが吉かと。
ていうか、変換テーブル大杉。
ttp://www.debian.or.jp/~kubota/unicode-symbols-map2.html

82 :
Unicodeで文字幅を取得する(なるべく)ポータブルな方法(特にCJK「以外」)
が知りたいのですが、mltermやw3m-m17nあたりからパク^H^H^H^Hを参考にする
くらいしか手はないでつか?
# ひたすらぐぐってみたんですが、どーにもよさげな情報が……。

83 :
文字幅って半角何文字分かということ?
亜がAの2文字分っていう前提からしてフォント依存なのに、
なるべくポータブルの意味がわからん。
「これこれのフォントを使っている」という前提がどこかに必要。

84 :
>>82
ここよりpfaeditとかいじってるやつがいるところで聞いた方がいいんじゃないかな?

85 :
>>83
フォントのメトリックを含めて取得したいという意味では?

86 :
>>23 を読むと rxvt でなんとかしたい模様。

87 :
>>83
> 文字幅って半角何文字分かということ?
うぃ。
> 亜がAの2文字分っていう前提からしてフォント依存なのに、
あー、とりあえずターミナルエミュレータとゆーか固定ピッチフォントのみの
世界限定の話です。目的はcocotで変換不能文字を適切なカラム数でスキップす
ることなんで……。(とは言え、ここでがんばったとしてもEast Asian Width
でambiguousになる文字についてはどーにもこーにもcocotのよーなレイヤでは
整合性なんか取りよーがなさそげなので、これはこれで鬱)
>>84
フォントエディタですか。うーん、ちょっと関心のある部分が違うよーな。気
にしているのはUnicode文字列をターミナルエミュレータ上でどうハンドリン
グするかなので。

88 :
ぐぐるとemacs-w3m MLのアーカイブとかひっかかるんだけど、先人が(ン年前
に)はまった泥沼に足突っ込んでるオカ〜ン。最新の情報はどっかにまとまっ
てないもんか……。
# 調査すべきもの: 最近のxterm、luit、mlterm、w3m(0.5にはlibwcが入って
# るみたいなので、w3m-m17n相当?)、emacs、他に何かあるかなぁ。

89 :
wcwidth, wcswidth じゃダメかね

90 :
フォントの幅ならX{mb,wc}TextEscapement。

91 :
tcsh スレに utf-8 パッチが投稿されていた。
でも 2 バイトまでの utf-8 までしか扱えないという不完全なもの。
>>68 のほうがまだマシだよ。

92 :
>>89
cygwinのはまだi18n化がまっとーじゃなかったよーな……。
# 試してみよーかとは思うけど、1しか返ってこなかったら悲しい。

93 :
> tcsh スレ
ってどこ? tcshで検索しても出てこない
> 2 バイトまでの utf-8
それってCJKはぜんぜん対応してないってことじゃん…

94 :
テストコードを書こうとして調べていたのですが……。
ttp://www.okisoft.co.jp/esc/cygwin-5.html#5.3
だめぢゃん_| ̄|○
# wide character系の関数はことごとく期待できないとゆーことで
# ファイナルアンサー?(;_;)>cygwin

95 :
>>93 すまん。tcsh-ml の間違いだった。

96 :
>>93
> > 2 バイトまでの utf-8
> それってCJKはぜんぜん対応してないってことじゃん…
なかなか笑わせてくれるなw>cygwin

97 :
>>96 tcsh の話と cygwin の話はぜんぜん関係ないぞ

98 :
>>89
しつこくて済みませんが、cygwin1.dllのソース見てみました。
int
_DEFUN (wcwidth, (wc),
_CONST wchar_t wc)
{
if (iswprint (wc))
return 1;
if (iswcntrl (wc) || wc == L'\0')
return 0;
return -1;
}
はっはっはっはっ……。

99 :
>>98
IBMのICUでできそうな。おおげさかね?
こんなかんじ。
#include <icu/uchar.h>
UEastAsianWidth ea = (UEastAsianWidth)u_getIntPropertyValue(c, UCHAR_EAST_ASIAN_WIDTH);
厳密には幅そのものじゃないけど。まぁ使えそう。

100read 1read
1read 100read
TOP カテ一覧 スレ一覧 2ch元 削除依頼
gedit -gnomeテキストエディタ- (353)
キツいスペックのPCで頑張ってる人の為のスレ 15 (679)
【CD/USB】PuppyLinux - 12匹め - 【軽量】 (125)
次期Ubuntu、64bit推奨。一方Win8は32bitでも動く (136)
Linux板ニュース速報22 (449)
そろそろmandrivaブームも到来するべき (297)
--log9.info------------------
京極夏彦総合スレッド (698)
鮎川哲也賞とその出身作家4 (582)
大津市皇子中学校いじめ問題の謎 (512)
新・2chで見つけた叙述トリック【コピペ】 (352)
カタカナの「ー」抜けば森博嗣じゃね?44 (406)
『読みました』報告・国内編(書斎厳禁)Part.7 (969)
ミステリー小説にランク付けするスレ (202)
彼氏に「図書館で借りるとか貧乏臭いんだよ」ゆあれた (101)
赤川次郎 その7 (873)
久々にバレない死体処理について語る (251)
米澤穂信(その14) (533)
悪の教典 その1 (242)
黒川博行・3 (501)
財布を拾ってもネコババしそうな作家 (290)
好みにあいそうなミステリを紹介しあうスレ 15 (451)
小説って・・・おもしろいか? 2 (551)
--log55.com------------------
坂口安吾 part6
宮澤賢治
【虚体】埴谷雄高=般若豊スレッド第四章【死靈】
ヘルマン・ヘッセ part3
【魔の山】トーマス・マン【ヴェニスに死す】
三島由紀夫の文って読みづらくないか?
紀行文・文学散歩・20世紀短歌
【百年の孤独】ガルシア・マルケス 3