【R言語】統計解析フリーソフトＲ第４章【GNU R】

1 ：11/01/09 ～最終レス：11/11/26: R は統計計算とグラフィックスのための言語・環境です。
統計計算で重宝するデータ型や、複数要素を処理する演算や関数、
解析結果を表示するグラフィックなど、多彩な機能を提供します。
●関連サイト
The R Project
http://www.r-project.org/
RjpWiki
http://www.okada.jp.org/RWiki/
リンク集
http://www.okada.jp.org/RWiki/?%A5%EA%A5%F3%A5%AF%BD%B8

2 ：: ●過去スレ
＝　統計解析フリーソフト　Ｒ　＝
http://science4.2ch.net/test/read.cgi/math/1062650510/
http://mimizun.com/log/2ch/math/1062650510/
＝　統計解析フリーソフト　Ｒ　【第２章】　＝
http://science6.2ch.net/test/read.cgi/math/1152449095/
http://mimizun.com/log/2ch/math/1152449095/
統計解析フリーソフト　Ｒ　【第３章】
http://kamome.2ch.net/test/read.cgi/math/1224142396/
http://mimizun.com/log/2ch/math/1224142396/
3 ：: schemeのambに相当することはできるのでしょうか
4 ：: >>3
RはShemeのような継続がないので全く同じ動作は再現できないと思います。
しかしベクトルの外積を使えば複数のambを組み合わせるのと似た事ができます。
独習 Scheme 三週間　Chapter 14 非決定性（Schemeのamb）
http://www.sampou.org/scheme/t-y-scheme/t-y-scheme-Z-H-16.html
R言語
http://ja.wikipedia.org/wiki/R%E8%A8%80%E8%AA%9E
ベクトルに関する Tips 大全
http://www.okada.jp.org/RWiki/?%A5%D9%A5%AF%A5%C8%A5%EBTips%C2%E7%C1%B4
5 ：: IncanterはClojureベースでR似の統計計算とグラフィックス環境です。
Rを単体で利用している人にはパッケージ不足な代用品にすぎませんが、
JavaアプリにはJVM系言語で書かれたIncanterの方が組み込みやすいです。
Incanter
http://incanter.org/
Data Sorcery with Clojure
http://data-sorcery.org/
naoya_t@Incanter
http://sites.google.com/site/incanterja/
6 ：: どうせjavaならKawaで書いてくれればいいのに
7 ：: >>6
Incasterのトップページにこういう意味の文が載っています。
「Incanterは動的型付けの関数型言語であるClojureのパワーと、
データアクセスと処理と視覚化のためのJVM上の豊富なライブラリを利用します」
IncasterはSchemeでは成立しないでしょう。
Clojureをつくったわけ　by Rich Hickey
http://www.geidai.ac.jp/~marui/clojure/rationale/
>なぜ私は新しいプログラミング言語を書いたのだろうか。
>次のような特徴を持つ言語が見つからなかったから、という理由からだ。
>　* 並行処理のために設計された
>　* 定評のあるプラットフォームと相性がよい
>　* 関数型プログラミングのための
>　* Lisp。
> 1.2 関数型プログラミングは良いものだ
> 　* Clojureは動的型付けをする関数型言語
> 　　o すべてのデータ構造がイミュータブルで永続的、再帰をサポート
> 　　o ヘテロジニアス(異種混合)なコレクション、戻り型
> 　　o 動的な多態性(ポリモーフィズム)
8 ：: ×Incaster
○Incanter
9 ：: 統計解析フリーソフト　Ｒ　【第３章】
http://kamome.2ch.net/test/read.cgi/math/1224142396/527
> 527 ：１３２人目の素数さん [↓] ：2010/02/18(木) 17:43:21
> >>526
> ・スレッドのレス数が10以下
> ・レスが一週間書き込まれていない
> 二つの条件が満たされるとスレッドが沈むので
> そうならないようにしておけば沈まないよ
　　　　　　　　∧∧　　ミ　＿　ドスッ
　　　　　　　 (　　,,)┌─┴┴─┐
　　　　　　　/　　　つ.　保　守 │
　　　　　～′　/´　└─┬┬─┘
　　　　　　∪ ∪　　　　 ││　_ε３
　　　　　　　　　　　　　　゛゛'゛'゛
10 ：: sage
11 ：: 誰かRでbmpをimagematrixオブジェクトとして読み込む方法知らないか？
12 ：: 11だけど、EBImage使うことにした。
他にいい方法知ってる人いたらおせえて
13 ：: read.matrixでひとつのファイルから複数の行列を読み込んだりすることは可能でしょうか？
初歩的な質問でしたらすいません、教えていただける方宜しくお願いします。
14 ：: R初心者なのですが、小数の精度について解説されたサイト等ありませんでしょうか。
15 ：: >>14
http://www.amazon.co.jp/dp/4901683500/
この本の14章あたりにあるよ
.Machine に浮動小数点演算関連定数のリストが収められてる
16 ：: 軸ラベルと凡例が日本語のグラフで、日本語のみに日本語フォントを使用してeps出力する方法をどなたかご存知ないでしょうか？
pdfなら、日本語関連を最後にまとめて、直前にpar(family=Japan1など)でいけるのですが・・・
17 ：: 質問です。
単回帰についてですが、データフレームの一列目に被説明変数が格納されており、
残りの列に説明変数が格納されています。
各説明変数を用いて単回帰を行いたいのですが、いちいち変数を指定するのが面倒です。
apply関数を利用しようと思ったのですがうまくいきません。
何か良い方法がありますでしょうか？
18 ：: >>15
規制で遅くなりました。ありがとうございます。
19 ：: >>17
データフレームが縦横逆になっているということですか？
それなら関数t()を使えば通常のデーター形式になると思いますが。例えば
#irisデータを表示
iris
#縦と横が逆
t(iris)
#もう一度やると元に戻る
t(t(iris))
20 ：: アウトライア分類と変数選択が同時にできる
線形回帰法ないのでしょうか
21 ：: チルダ記号ってどういう意味なんでしょうか
関数（変数１　～　変数２）
なんて使い方です
22 ：: 質問します。
glmを使い，説明変数の数を変えて複数のモデルを作りました。
複数モデルの中から最もあてはまりの良いものを知りたいので
AICを比較しようと考えたのですが，AICがInfとなり，表示してくれませんでした。
使っているソフトはRです。
AICが非常に小さいくて（おそらく２以下？）表示されないと考えているのですが，
これでは比較できません。
対処法をご存じの方がいらっしゃいましたら，教えていただきたく存じます。
23 ：: 最近MacにRcmdrをインストールしても文字が汚くならないというとのサイトを見つけたのですが、
ttp://ito-hi.blog.so-net.ne.jp/2011-02-06
「パッケージの依存関係を解決」にチェックしてインストールすると
虹色ぐるぐるでインストールされません
何が問題だと考えられますか？
環境は
iMac
Mac OS X 10.6.6
Intel Core 2 Duo
2.66 GHz
R 2.12.1
24 ：: よく変数名に
foo.bar
と . でくぎられた名前があるのですが
Rにもc++みたいなclassがあるのでしょうか
25 ：: >>20
lmをransacで繰り返し呼んだら？
26 ：: >>23
>何が問題だと考えられますか？
自己解決力もないのにマイナーな環境で動かす冒険心。
27 ：: >>26
確かにその冒険心は問題だわねｗ
28 ：: cranに
RANSAC
ないのは、そのぐらい自分で作れってことなの？
lm繰り返し呼べばいいだけなんだけど
29 ：: Mac の Carbon Emacs (23.2) で ESS 使い始めたんだけど、
R を呼び出すとメッセージが英語になる。
Terminal.app から R を呼んだ時は日本語表記なんだけど、
ESS 内でも日本語メッセージ使わせるためには何か設定が必要?

30 ：: 環境変数にLANG=Cでも設定してるんだろうか？
31 ：: ~/.bash.rc では LANG=ja_JP.UTF-8 にしていて、
init.el では (set-language-environment 'Japanese) になってる。
ためしに、Terminal から明示的に LANG=ja_JP.UTF-8 emacs & で Emacs を
起動するとメッセージが日本語になった。
デフォルトで Emacs が LANG=C で起動されている??
32 ：: Rそのものの話題ではないけど、
模試の大学合否判定って、A判定が80％以上、E判定が20％未満だな。
97.5％以上とか2.5％以下とかにしないのはなぜなんだろう。
33 ：: 高校生を絶望の谷へ突き落とすような事はしてはいけないのさ。
34 ：: >>32
受験者数と合格者数を考えてみれば
35 ：: 統計解析の本を見ていて、回帰分析と判別分析の違いかなと思えてきた。
p値が5％以下じゃないとモデルとして不適切などという手法ではないのでしょうね。
36 ：: emacsからＲ使ってる人が多いんでしょうか？
37 ：: 筑波のCRANは停電というより地震による直接被害で、電気はきていますが、
漏水がひどい建物にあるので念のため落としています。 -- 岡田 2011-03-16 (水) 10:27:28
38 ：: 床がだいぶ乾いたので、筑波CRANミラー復旧させてみました。 -- 岡田 2011-03-17 (木) 13:17:57
39 ：: Ｒのリストって
連想リストのことなの？
40 ：: >>21
?formula
>>22
Infになるなら、そもそもモデルが不適切
>>24
?class
>>31
R環境の中からLANGを変更できるよ
>>36
誰も統計を取っていないが、昔はEmacs以外の選択肢が事実上なかった
>>39
全然違う
全レスって嫌われるのかなぁ
41 ：: ステキです＾＾
42 ：: Rでsuppot vector machineの分類の問題が解きたいので、
kernlab の中の SVM 関数 ksvmを使っているのですが、
例えばkernlab の中spamを分類すると、決定関数にsign関数で
符号化されて「spam」か「nonspam」の2値で結果が出力されます。
これを2値に符号化される前の決定関数で出力する方法はあるのでしょうか。
どなたかご存知の方はいらっしゃるでしょうか。
43 ：: (祝) RStudio日本語対応！！
今の所特に日本語周りの不具合は無し
というわけで不要になったTinn-Rをアンインスト
NppToRは窓配置フリーが便利なのでとりあえず残しておく
44 ：: >>43
Windows版ではそうかもしれないが、MacOSXとUbuntuでは
完全に対応していない。
45 ：: すまん。0.92.44から0.93.75に上げたら、
MacOSXで、問題があった日本語変数名も使えるようになった。
> Sys.getlocale()
[1] "C/en_US.UTF-8/C/C/C/C"
こんな感じだけど。
Ubuntu amd64の方も、エディタ部分で日本語が怪しかったけど、
これも直った感じ。
46 ：: 線形回帰で変数選択とロバスト推定の同時が出来る方法ないですか
47 ：: Ｒって中身はＣなんですか？
遅延評価Ｃで書くのすごい大変なのに
どうやってるんだろう
48 ：: >>47
tar tf R-2.13.0.tar.gz | grep -oE '\.[a-z0-9]*$' | sort |uniq -c | sort -gr |head
599 .c
240 .h
194 .po
169 .mo
94 .in
87 .afm
52 .win
50 .save
45 .f
27 .gmo
RjpwikiのQ&A(初心者コース)に書き込んだmichiさんはこっちに来ないのかな。
49 ：: ttp://cran.r-project.org/bin/linux/ubuntu/
Nattyまだこないね。
50 ：: 言語初心者ですので、教えていただきたいのですが
このソフトpropensity scoreを用いて解析をするときの参考になるサイトや書籍がありましたら教えてください。
51 ：: >>50
おっ、同業者か。
nonrandomパッケージのVignettesを読まれてはいかが。
また、疫学のSIGのMLもあるので、参加されてはどうか。
ttps://stat.ethz.ch/mailman/listinfo/r-sig-epi
52 ：: >>51
ありがとございます。
この休みにでもRのインストールからはじめてみます。
スレ違いかもしれませんが、propensity scoreを用いたマッOでの解析を行うのに適したソフトは何でしょうか？
53 ：: >>52
nonrandomパッケージのVignettesを読んでからもう一度質問してください。
ttp://cran.r-project.org/web/packages/nonrandom/vignettes/nonrandom.pdf
54 ：: >>53
ありがとうございます。
55 ：: nattyきたー
ttp://cran.r-project.org/bin/linux/ubuntu/
56 ：: >>55
Releaseのファイルサイズが0でまだ使えないね
$ w3m -dump http://cran.r-project.org/bin/linux/ubuntu/natty/ |grep -oE '[a-zA-Z0-9_\.-]*amd64\.deb'
littler_0.1.3-1natty0_amd64.deb
python-rpy_1.0.3-17natty0_amd64.deb
python-rpy_1.0.3-18natty0_amd64.deb
r-base-core-dbg_2.13.0-1natty0_amd64.deb
r-base-core_2.13.0-1natty0_amd64.deb
r-cran-class_7.3-3-1natty0_amd64.deb
r-cran-cluster_1.13.3-1natty0_amd64.deb
r-cran-foreign_0.8.44-1natty0_amd64.deb
r-cran-kernsmooth_2.23-4-1natty0_amd64.deb
r-cran-lattice_0.19-26-1natty0_amd64.deb
r-cran-mass_7.3-11-1natty0_amd64.deb
r-cran-matrix_0.999375-50-1natty0_amd64.deb
r-cran-mgcv_1.7-6-1natty0_amd64.deb
r-cran-nlme_3.1.100-1natty0_amd64.deb
r-cran-nnet_7.3-1-1natty0_amd64.deb
r-cran-rodbc_1.3-2-1natty0_amd64.deb
r-cran-rpart_3.1.50-1natty0_amd64.deb
r-cran-spatial_7.3-2-1natty0_amd64.deb
r-cran-survival_2.36-8-1natty0_amd64.deb
r-mathlib_2.13.0-1natty0_amd64.deb
今あるパッケージはこれだけ。
57 ：: ニューラルネットのパッケージnnetについて質問させてください。
すでにデータAを学習したネットワークにさらに別のデータBを学習させるにはどうすればいいのでしょうか？先にAとBを結合して読ませるのは時間がかかるために困っています。
他のパッケージなら出来るという情報もお待ちしています。
58 ：: MySQLからダウンロードしたデータをRで計算して
MySQLに返しつつ、gnuplotで描画しようと思っています
RubyとかからMySQL、R、gnuplotを操作すべきか、
RからMySQLとgnuplotを操作すべきかで迷ってます
みなさんならどんな風にしますか？
59 ：: >>58
このスレ的には、Rの中からMySQLにアクセスして、
Rで描画する方向が第一選択だよな。
Rのグラフィック能力とgnuplotってほぼ同等と思っていたけど、
Rを使っているのにgnuplotを加えて使うのは理由は？
>>57
反応がないから、Rjpwikiの方に書かれてはいかが。
私はnnetパッケージを使わないので分からない。

60 ：: >>59
そうしてみます。ありがとうございました。
61 ：: gnuplotの方が慣れているというだけです。
Rで描けるようになればR+MySQLなのでシンプルでいいですね。
ちょっとやってみます。ありがとうございました。
62 ：: pi<-seq(0,1,0.0001)
y_n<-60
n<-100
posterior<-((pi^y_n)*(1-pi)^(n-y_n))/beta(y_n+1,n-y_n+1)
の95％信頼区間を求めたいんですがその関数がよくわからないです誰かわかる人いらっしゃいますか？
63 ：: >>62
Bayesian credible intervalは信頼区間じゃないよ
64 ：: >>63　だね．　bayequentistかな
65 ：: for (i in 1:5) {sprintf("%s", ticker[i,1])}
だと上手く出力されないのはどうしてでしょう？
素人の質問ですみません
66 ：: >>65
> sprintf("%s", ticker[,1])
> sprintf("%s", ticker[1:5,1])
> as.character(ticker[,1])
> as.character(ticker[1:5,1])
などと1行で書くのがR流じゃないかと。
ループ使った場合でも
> for (i in 1:5) {a[i]<-sprintf("%s", ticker[i,1])}
> a
とやれば配列aが表示される。
67 ：: >>65
for文の中ではprint()が必要です。
for (i in 1:5) {print(sprintf("%s", ticker[i,1]))}
普通は>>66の言うとおり、
as.character(ticker[1:5,1])だけどね。
68 ：: データ配列の最初から20個ずつをまとめ、
それぞれの20個のデータの平均値と標準偏差を求めるプログラムstatsample(m,data)を作成する。
プログラムソースが分かる人は教えてください。
69 ：: >>68
とりあえず、たたき台を示すので、データ数が20で割り切れないをどうするのかを
考えて、その処理を入れて、その他のエラー処理を入れたら完成だと思う。
statsample <- function(x){
n <- length(x)
m <- floor(n/20)
for (i in 0:(m-1)){
print(paste("平均値:",mean(x[(1+i*20):((i+1)*20)]),"標準偏差",sd(x[(1+i*20):((i+1)*20)])))
}
}
> statsample(runif(100))
[1] "平均値: 0.409618140733801 標準偏差 0.284202820077949"
[1] "平均値: 0.449437574110925 標準偏差 0.286492195081962"
[1] "平均値: 0.555866089393385 標準偏差 0.26665116632303"
[1] "平均値: 0.28123870670097 標準偏差 0.226341301484355"
[1] "平均値: 0.503801094950177 標準偏差 0.282596081360767"
70 ：: >>69
datamatrix<-matrix(data,20,length(data)/20)
apply(datamatrix,2,mean)
apply(datamatrix,2,sd)
とやるのが普通じゃないか。
データ数が20で割り切れない場合のwarningも表示されるし。
71 ：: 農家の果物の良品、不良品の検査や工場での製品の良品、不良品のチェックなどをシュミレーションにより実験する場合を考える。
このシュミレーションを行うために、不良品率ｘ％でn個のサンプルの中に不良品を発生させるプログラムsampling(x,y)を以下の手順で作成する。
(1)不良品の出現確率ｘ/100とする。発生させた一様乱数がｘ/100より小さければ、不良品(1)、そうでなければ、良品(0)とする。
(2)不良品出現確率ｘ/100とした試行をn回繰り返し、不良品が出現した場合の数を求める。
　その数がsampling(ｘ,n)の出力とする。
以下の手順をプログラムし、関数sampling(ｘ,n)を作る。
誰か教えてください。
72 ：: #include "/dev/console"
73 ：: ＃
74 ：: >>69
75 ：: >>71
宿題？
ヒントだけ
> runif(10) < 5/100
[1] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE TRUE
76 ：: rbinom(1,n,x/100)
77 ：: sample関数について、中でどうやってドローしているんだろうと、
見ようとしたら、
.Internal( sample....
となってて、中身が見えません。
他の言語で作成しているのだろうと思いましたけど、
sample関数のソースって、どこにあるんでしょうか？
78 ：: 自己解決しました。
CRANからソースを取得しました。
79 ：: あんでぃ
80 ：: 乱数のところ、ソースみてもわからん。
81 ：: 乱数だからな
82 ：: メルセンヌツイスターとかいうやつか
83 ：: すいません、初心者です
株価の日次データが数年分あるんですが
グラフのX軸の目盛りを年次にしたい場合はどうすればいいでしょう？
84 ：: >>83
a <- ts(1:2000,start=c(2011,6),frequency=365)
plot(a)
85 ：: >>84
早速のレスありがとうございます
株など営業日がある場合どうすればよろしいでしょうか？
祝日や年末年始などありますし
86 ：: >>85
xtsパッケージのドキュメントを眺めてから再質問してください。
ttp://cran.r-project.org/web/packages/xts/
日本語が必要なら、Rパッケージガイドブック pp.130-137
87 ：: >>86
ありがとうございます。
パッケージガイドブックを買ってこようと思います。
これとR-tipsで頑張ります
88 ：: RでVoigt関数(Gauss関数とLorentz関数のconvolution)でフィッティングするには、畳み込み積分を直接書くしかないのでしょうか。
89 ：: あんでぃ
90 ：: format="%Y/%m"
と書くと
2011/06
と出力されるけど、幅を節約して
11/06
とするにはどうすれば?
91 ：: あ、ぐぐったら一瞬で判ってしまった
%y だ
92 ：: >>90,91
そのあたりは共通だから覚えておいて損はないよ。
> format(Sys.Date(),"%Y")
[1] "2011"
> format(Sys.Date(),"%y")
[1] "11"
> format(Sys.Date(),"%EY")
[1] "平成23年"
> format(Sys.Date(),"%Ey")
[1] "23"
93 ：: おおー
なんでEが平成なんだろう
94 ：: >>93
マニュアルには、
%E Modifier: use alternative format
と書いてあるよ。つまり日本語ローケルだと、日本語化した形式にするという意味。
>>92を書き込んだ後、MacOSXとWindowsで試してみたが、
どちらも和暦にならなかった。GNUだけかも。ヘルプには環境依存って書いてあるしね。
95 ：: 分からない。
あんでぃ
96 ：: これまで、Java、Ruby、Scala など使っているものですが、
Rについても勉強したいと思っています。
Rのサイトをみると、結構、「使い方」的なサイトが多く、
汎用言語の視点から書かれた、サイト、本が少ない(？)ような気がします。
たとえば、ほかの言語と比較しながら書かれたような
本、サイトなどあれば、教えていただきたいのですが。
ありますでしょうか。
97 ：: ぐぐりにくい、というのがRの最大の弱点
98 ：: >>96
Rの基礎とプログラミング技法
http://www.amazon.co.jp/dp/4431712186
http://d.hatena.ne.jp/sesejun/20090331/p2
Rと他の言語を比較した本は知りませんが、
汎用言語としてのR言語を勉強するならこの本がお勧めです。
99 ：: >>96
そういえば、Rユーザ会で、韓国から来た演者が汎用言語の視点から、Rの問題点などを
発表していたな。興味がなかったので内容は覚えていない。
汎用言語の視点で書かれた書籍はないと思う。
しいてあげるなら、>>98が薦めるリゲスさんの本しかない。
100read 1read
1read 100read TOP カテ一覧スレ一覧削除依頼 ▲

【R言語】統計解析フリーソフトＲ 第４章【GNU R】

【R言語】統計解析フリーソフトＲ第４章【GNU R】