2013年17プログラム140: 【統計分析】機械学習・データマイニング3 (308) TOP カテ一覧 スレ一覧 2ch元 削除依頼
C++相談室 part104 (889)
初心者の俺が初めて覚えるプログラム言語 (474)
SSE AVXのプログラミング (910)
【.cmd】 バッチファイルスクリプト %10 【.bat】 (155)
【コボル】COBOL不要論【ただのDSLだよね?】 (353)
Subversion r14 (694)

【統計分析】機械学習・データマイニング3


1 :2012/10/13 〜 最終レス :2013/09/14
何でもいいので語れ
【関連サイト】
機械学習の「朱鷺の杜Wiki」
http://ibisforest.org/index.php?FrontPage
前スレ
【統計分析】機械学習・データマイニング【集合知】
http://toro.2ch.net/test/read.cgi/tech/1342812444/

2 :
前スレが落ちてしまったので立てました。
【集合知】を含めると長すぎて立てられないので削りました。

3 :
>>1

俺はMLで生きていく!!

4 :
ネットワーク構造のあるデータと回帰分析を組み合わせたような研究・論文ってありませんか?

5 :
データまいっちんぐマチコ先生

6 :
需要あると思うけど過疎ってんね

7 :
2chなんかで軽々しく話し合えるほど普及してねえ

8 :
そうなんだよなあ
でもスレ自体はあった方がいい

9 :
この分野ってどうやって勉強していくべきもんなの?
書籍をもくもくと読んで理解していくのが正攻法なのかな

10 :
機械学習自体をしっかり学ぶ必要がある人はビショップ本を読み込めばいいんじゃない
間違いなく一番いい教科書だろうし副読本も出てる
俺は厳密な理論を理解するのは断念して、どういう分類機がどういうデータに向いてるのかをひたすら実データを使って実験しまくった

11 :
いきなりビショップキツくない?

12 :
いきなりがきつければコロナ社(だっけ?)の言語処理のための機械学習本からとか
理論より実践派ならpythonやjavaみたいに機械学習ライブラリが豊富な言語を覚えて手を動かして遊んでみる

13 :
最近は手軽にライブラリ手に入るようになってだいぶ敷居は下がったきがする

14 :
はっきりいって、GUIとテキスト処理と基本的な統計だけ出来たら、
あとは適当なライブラリなりソフトウェアなりに任せりゃ済む

15 :
>>9
MITのサイトに置いてあるフリーのPDFからじゃね?

16 :
>>14
なめすぎだろ、こいつ

17 :
>>16
他に何が要るんだ?それで、大体の仕事が片付くだろ

18 :
そのたいていの仕事っていうのがどういうレベルかによるよね
そりゃテキスト分類とか古典的なタスクならそれでいいんだろうけど
ところでdeep learning盛り上がってるね
SVMに変わって2010年代の本命になるかも

19 :
不勉強で Deep Learning 初めて知った。紹介ありがとう。
ここいら見てチュートリアル漁ってる。
ttp://research.preferred.jp/2012/11/deep-learning/
画像への適用例が多いのかな。自分はテキスト分類に関心が
あるので調べてみる。

20 :
論文読んだけど自分には実装できるレベルじゃなかった
日の目を浴びない中で地道に研究続けて花開かせたってのはカッコいいね

21 :
へぇ。deep learningって盛り上がってんだ。
院時代にdeep boltzmann machineの論文読んだけど理解するには頭が足りなかったな
機械学習の研究を地道に継続したところで就職・転職先なんて見つかるもんだろうか
関東は勉強会とか盛んで羨ましいから地震でも起こって土砂に埋まれ

22 :
>>20
俺は
hopfield->boltzmann machine->restrict boltzmann machine->deep boltzmann machine
の流れで勉強したよ。hintonの論文、添え字が誤りだらけでRって気分になったよ。

23 :
>>18
個人的には、wekaにGUIの状態遷移、パーサーぐらい書けたら十分だと思うけど
web上のデータを探してきて何かして、出力するなら、rhinoなんてベターじゃないの?
最近、ビッグデータがどうとかhadoopがどうとか言ってるしね
javaの多次元配列や行列ライブラリが使い辛い。プロパティ構文を供えてるc#の方がすごくいい。
けれども、この分野で書き捨てのコードを書いて実験するならmatlabの方が楽そうなので、
きっとscilabで遊んでりゃ幸せになれるんだと思う

24 :
>>20
自分とこのボスは論文を一目も読まずにバックプロパゲーションの応用だって言ってたな
あいつRばいいのに

25 :
HMMに対してDPを応用するのも、さも自分の発見のようにドヤ顔しつつ学生に教えてたいたな
思い返す度に、常々にRばいいのになっておもう。世の中の教授みんながRばいいのにな

26 :
E欄情報系の教授は、topcoderやらgoogle code jamに参加するよう親に仕込まれた中高校生よか大体はアホである
連中は必要であってもエディタのマニュアルすらも読まない。makefileも書かない。書き方を覚えようともしない。
構造体やポインタすら理解してない。しかし、自称10年以上のベテランでありハッカーである。

27 :
ニッチもサッチも行かなくなったとき、おまえらの命はないと思えw
なに、そういう危険な職業だから給料が高いだけだよ。
経験年数に応じて死亡リスクが上がるから給料が高いんだよ。
そのこと、しっかりと覚えて忘れないでね

28 :
中卒にプログラミングの素養と確率微分方程式でも叩き込めば、
金融業を崩壊させて社会混乱を巻き起こせると思うんだ。このアイディア、どうかな?
高校数学、化学や物理の問題を解かなくてもいいし、もっとずっと稼げるよね。

29 :
まともな大学院へ行きたかったな

30 :
なんか変なの居るな
スレタイ読もうぜ

31 :
自分の人生は全部自分の選択だろ
院が駄目だとか教授が駄目だとか人のせいにすんなよ

32 :
うわあだいぶヤバイな
こういう奴が逆恨みして問題起こすんだろうな
お前の人生がうまくいってないのは全部自分の責任だろ 責任転嫁すんな

33 :
基地外が寄ってくるから、スレッドのタイトルはなるべくおとなしいものにしてほしい。

34 :
他人を刺すのも自己責任で本人の自由だよね?

35 :
教授が研究生の面倒を見ないのも教授本人の自由であって、
そいつが刺されたところで本人の責任だよね

36 :
>>32
感謝する部分が微塵も見当たらない

37 :
世界が終わろうなんてときに、恨みのある奴を1人2人ヤったとこで何か問題ある?

38 :
E欄屑大学の酷さといえば、一部の教授は自分たちの仕事が楽できるように、
学生たちを馬鹿なまま放っておくことであり、勝手に何か学ぼうとする奴の邪魔をすることである。

39 :
家庭教師や塾講師をやりながら、
あんな酷い大学には行くだけ人生と金の浪費だから行くなってことを
胸を張って教えてやれる。

40 :
機械学習とデータマイニングの一般化はやすぎ
2,3年後にはrailsみたいになってそうでヤだな

41 :
>>10
卒論だとすると最悪なレベルの内容

42 :
やってみた、の卒論版か
ペタバイト級データならそれでも価値があるかも

43 :
あるわけ無いだろw
1、2ヶ月もあれば十分な内容で、4年間の総仕上げとして最悪

44 :
4年間の総仕上げって
名目上はそうだけど
実際は10ヶ月かそこらの研究だよ

45 :
出身の大学に誰かが爆破予告してたよ
皆、考えることが同じでホッとしたよ

46 :
deep learningの流行り具合を見ると、
出身大学の指導教官が如何に無能だったかが分かるな

47 :
日本が銃社会なら、暴れる奴が1人、2人居てもいい
むしろ、1人、2人ぐらい居ない方がおかしい
彼らが階段から滑り落ちて、年を越せなければ良いのにな

48 :
>>44
たまに中卒、高卒が混じってるから注意な

49 :
実際問題、大学なんて4年間も通わない方がマシってな人間はよく見かけた
遅刻、代返、無出席、パチンカス、ネトゲ廃人。
無能が無知に無用を教えることも多々あるんだから、
大学なんて出なくても、海外の教授が書いたフリーの機械学習のPDFでも読んだ方がマシ
何がしたいんだか分かっていない無能が集まる企業ほど大学卒業の肩書きを有難がる傾向にある

50 :
大学なんて社会に出て役立つことを教えてくれるところじゃなくて、
4年間遊びに行くところだよな。

51 :
>>49
大学で勉強せずにその機械学習のPDFを理解できるならなw

52 :
>>51
大学の講義って90分×15コマだぜ?
それも、教授が持ってくる薄っぺらいレジュメと板書
漫画で分かる、単位がとれる、プログラマのための〜でも読んだ方が
基礎の理解できるし、PDFなんて院にもなると自力で読解するもんだろ

53 :
>>50
上場企業に就職が決まらなかった場合に起業ネタを確保するところだよ

54 :
>>52
で、その大学ですら勉強してない奴が機械学習のペーパーを理解できるのか?

55 :
>>54
できるだろ。機械学習って、応用数学や制御理論あたりと比較したら、すごい楽

56 :
それはない

57 :
使うだけなら、応用数学や制御理論より機械学習の方が簡単だろ

58 :
製造系ってピラミッドの搾取構造が酷いし、応用数学や制御理論の方面は専門にしたくないな

59 :
まじで高卒が湧いてきたのか

60 :
院卒ですが何か?

61 :
大学入学して3年までは教授の品定めする期間だよ
いっそ、入学した時点で各研究室をまわっておいて
過去の卒論/修論を見てまわるぐらいのことした方が良いから

62 :
俺、機械学習と制御理論両方勉強したけど、制御理論のほうがまあ単純だ。
基本的に微分方程式を出せばあとは計算機が解を出してくれる。

63 :
いやそれ、どんなレベルで勉強したの?
というか、確率・統計の方が使いどころ多くね?
機械関連って全体的に斜陽産業じゃねーの?

64 :
工学系のところなら程度の差はあれだいたいやるんじゃないか? 制御理論
むしろ3Dプリンタの普及と共に機械関連の知識のニーズも復活するかもね

65 :
機械って、インドや中国に仕事もってかれるイメージ
web系はあらゆる産業を食いつぶすイメージ

66 :
もっとも、o2oで地方のスラム街の活性化にでも貢献してくれりゃ良いんだけど

67 :
文系で訳あって研究に機械学習(強化学習)使うことになったんだけど、機械学習の独学はすごく難しいね。
アルゴリズムはなんとか理解できるんだけど、いざプログラム組んでシミュレーションとかしようとすると結構難しくなってしまう。

68 :
あれの独習が難しいってw
君、理系に進んでたら落第してるんじゃないの?

69 :
数学の基礎体力不足だけと思われ。
高校〜工学系学部2年くらいまでの数学をケアしとけ。

70 :
確率と微積ぐらいしか使わないだろw
そもそも文系って学部が社会にイラナイことばかりやりすぎ

71 :
線形代数のことも忘れないであげてください。

72 :
いやいや機械学習の数学はそんな簡単なものじゃないよ。
微分積分だと多変数の微積分がいるから杉浦 解析じゃないと駄目だったし。
凸解析と非線形最適化って奴も必要だし。
普通の数学書には乗ってない変分法って奴もいるし。
統計学については日本語ではそういう本が出てないし。
情報理論も英語のじゃないと載ってないし。
だから英語も必須だし。
でも使うだけのために俗に言う天下り的に学ぶなら必要ないかもね。

73 :
>>72
変分法なら生協地下に売ってる情報理論の教科書に大体は載ってるだろ
そして、実際は使うだけだから変分法なんて理解する必要がない

74 :
東京の大型書店と田舎の大型書店の品揃えを知ったら愕然とするぞ

75 :
あんなのは証明とはいえない。

76 :
>>72
目的が分かっていて、それらを学ぶだけで大変だってならRば良いと思う

77 :
料理の本を見ながら料理を作れればいいって人と
フランス料理を作りたいって人がいて
前者の人のことをいってるんだろ。

78 :
文系も機械学習を使いたい大体の社会人も前者だろ

79 :
理工系の大学を出ていたら機械学習が難しいなんて、まず思わない
簡単で誰にでも出来て、おいしい分野だとしか思わない

80 :
数学以外は全部文系だろ。

81 :
演習と実験の居残りに何時間かかると思ってんだ

82 :
努力が報われると思ってるのか?

83 :
あたりまえだろ

84 :
あまちゃんな考えだな。

85 :
確信の持てないことするわけねーだろ
OSやコンパイラで金儲けできる知能なら、そっち専攻するよ

86 :
可哀想に・・・

87 :
物事の難易度が分かっていれば、機械学習なんて何の才能もイラナイことぐらい分かるよ

88 :
ドズル将軍< 「戦は数だよ!兄貴!」
なので、理論とか背景とかどうでもいいので、もっとたくさんの計算ノード用意する予算ください……

89 :
恐ろしいことに、俺が出た糞大学は研究室に予算があることを教授が伝えなかった
卒研、大学院、両方とも

90 :
あの糞指導教官、教え子にでも刺されればいいのに

91 :
最近、大学の教授が刺されるって耳障りの良いニュースを聞かないよね

92 :
経験年数が長いほど、教え子に刺されるリスクが累積されていくはずだから、
そのうち閾値を超えたところで仏になってくれるはずなんだ

93 :
研究室で役に立ったものって電気ポットとプリンタぐらいしかない

94 :
恨み言で1000レス埋めたら世の中の教授みんなが目や耳から血を流して死なないかな

95 :
大学には目的意識を持って…なんてウワゴトを垂れる教授は多いが、
既に入学した時点でどうにもならない茨の道であることが殆ど

96 :
海外であれば大学の教授は辞職においこむことができるが、
日本ではダメな教授を辞職に追い込む仕組みがない。
これは大学の品質を下げる1つの要因である

97 :
目的意識なんていうが、世の中の需要と供給は在学中の4年間の間に変化する
普遍的な目的意識があるとするなら、それは大卒の資格しか存在しない

98 :
大手企業には口が達者な、おR豚がたくさん入社する

99 :
馬鹿しかいない閉鎖的空間での経験10年ほど当てにならないものはない

100 :
あいつらRばいいのに

101 :
どうしようもない大学のアホ教授はdrandやsrandで学生にドヤ顔ができる

102 :
「パラメータを変えただけ」みたいなものが研究になる

103 :
大学になんて通わず、おっぱいでも描いた方が生涯年収は高い

104 :
多くの技術者が中国やインドへと移った。日本に残ったものは広告とおっぱいだ

105 :
最新の理論を用いて消費者の行動を予測して広告を配信した結果が、転職とオッパイだった。

106 :
転職、英語、スマホ、オッパイ

107 :
転職英語についてオッパイと学ぶスマホアプリ

108 :
それでもweb広告は機能している

109 :
Q.人間の三大欲求について答えよ
A.転職、スマホ、おっぱい

110 :
今日では、自動車よりオッパイの方が生活に重要な地位を占めている

111 :
次世代コンセプトカーについて考えるとゾッとする

112 :
大量生産、大量消費されるオッパイ

113 :
javascriptが目聡いので、また、w3mを使おうと思う

114 :
クスリのバイヤーはクスリを使わない

115 :
googleの企業ロゴまで堕ちたら、世界は敗北したんだなと思う

116 :
マイクロソフトは既に堕ちた

117 :
圧倒的じゃないか、我が軍は

118 :
情報の海で発生した生命体

119 :
もやし、豆腐、牛乳。消費の相関をヒューリスティックでは発見できなかった

120 :
その大学、行く価値あるの?

121 :
右も左もGCなんて名前を聞いたことがない

122 :
正規表現をイヤラシイものだと勘違いしている

123 :
グローバルスコープにループ変数が置かれ、皆、それが普通なのだと思っている

124 :
彼らの専門は、彼らが学生の頃は最新だった

125 :
彼らが学生の頃から、オッパイはビジネスなった

126 :
経済学者が言うとおり、市場経済に任せると世の中がロクなことにならない

127 :
本物のプログラマはIT系ニュースの記事なんて読まない

128 :
転職サイトの記事は、素人が読んでも素人が書いた記事なんだと判別が付く

129 :
ヒッピー、フリーター、フリーランス、ノマド

130 :
ハッカーになりたがるバカ

131 :
女体化したので親友に調べてもらうと・・・
女の体ってスゴイ

132 :
本当にいいのか?
うん
お兄ちゃん…
好き

133 :
俺がもらう
え…待って…ここ…で い今…? え…うそ…

134 :
…実は僕 男の人が好きなんだ
ごめん 気持ち悪いよね

135 :
君はすっかり大人になったんだね…
プリンセスお手を―――

136 :
18歳以上の女性の為の風俗高収入求人
30代からの女性の為の風俗求人情報

137 :
最新の理論で最適化され配信されたweb広告

138 :
早すぎた最適化

139 :
く、腐ってやがる…はや過ぎたんだ

140 :
良い年こいたワナビのアホ

141 :
プログラマに最適化された高校生

142 :
シリコンバレーでハンバーグを引っくり返した方が世界への貢献に繋がる

143 :
海外のフリーな講義資料の方が出身大学より遥かに充実している

144 :
実際問題、自称プログラミング暦10年の教授よりプログラマに最適化された高校生に教えを請うた方がマシなんだ

145 :
地球外生命体と宗教の関係について、真面目に語る教授を見ると幸せな気分になれる

146 :
中学時代の知人の研究室のwikiを眺めると、彼の頁にはquick sortが上げられていた。

147 :
そこだけで判断すると、大学の偏差値が当てにならない。

148 :
コンテンツのないブログ

149 :
コンテンツのないhtml

150 :
コンテンツのない研究室

151 :
エロアニメを規制するより日本語を規制した方が良い。

152 :
我々の祖先は戦争に負けたとき、快く英語を受け入れるべきだった

153 :
間違えないやり方が1つだけの方が良い

154 :
母国語がperlに見えてくる

155 :
オッパイは普遍的心理であるが、政治的な思想は10年もしないうちにぶれる

156 :
政治家たちが若い頃、彼らは同級生をオカズにした。でもなきゃ、ホモか包茎だ。

157 :
可能性の1つとして、俺が一番セクシー

158 :
英雄である条件は、義体化以前に童貞であること。

159 :
学費以上にかかる就活費用

160 :
機能しないGPA

161 :
無能のアホ教授が工場勤務と店舗販売員の求人票を持ってきたので、カッとなってついやった。

162 :
CINIIを調べると、gnuplotの使い方が論文になっていた。

163 :
F欄出身が教師

164 :
ほとんど行く価値のない大学

165 :
日本を取り戻す

166 :
大企業の下請けイジメ

167 :
工場の閉鎖

168 :
猥褻物の普遍的需要

169 :
性の自動化

170 :
FA;Fuck Automation

171 :
最大多数の幸福について考えた結果、技術者はセクサロイドを作るべきなのだ

172 :
irc,skype,LINE.facebook,google+.コピーのコピーのコピーみたいだ.

173 :
本物と同様の性能を持つ偽物は本物以上の価値がある

174 :
性処理玩具の進化は市場経済による潜在的需要によるものだ

175 :
DUO3.0を聞き流すと人間が腐る

176 :
3.0になったのか

177 :
実際の所、DUO4.0の短文に引用されることを夢見ている

178 :
そういう君は、ジョナサン・ジョースター

179 :
逆に考えるんだ。IT業界はオタク以外は来ちゃダメなんだって

180 :
フレッシュな新卒がオタクになっていく様

181 :
カルト教団に学ぶ新人社員教育

182 :
新卒採用試験にプログラム言語の名前を書けってあったから、A-Zまで書いた。

183 :
本物のプログラマが居る中小企業だったけれども、一次試験にはfizzbuzz問題が出された。

184 :
あのとき地震が起こらなければ、林檎の木の下で瞑想なんてしていない。

185 :
ハンバーグを引っくり返すか、スタバの店員か、それが問題だ。

186 :
ガリガリがギーク、ギトギトがナードだと思っていた。

187 :
いよいよ、おっぱいゲームまで空洞化

188 :
デザイナにセンスがない。

189 :
若しくは、若者の感性についていけなくなった

190 :
なめこも、コンチも、デザイナのアホは青酸カリ飲んでR。

191 :
価値あるPDFほど無料で転がっている

192 :
ソフトウェア開発は宗教であり、プログラマは聖職者なため給料が安い。

193 :
経営理念の社会貢献なんて、どこも大嘘。

194 :
バブルはチキンレースの開始を意味する

195 :
散歩してたら、中学生に職業を聞かれたので忍者って答えた。

196 :
在学中、本当に沢山の計算機の偉人たちが死んだ

197 :
恐山までヒッチハイクして、イタコに弟子入りしようかな

198 :
今でも、ジョブズなら口寄せ出来る気がするんだ

199 :
そう言うと、彼はイヤラシイ手付きでiPhoneのSiriをサスった

200 :
体育会系上司とホストみたいな同僚しかいない職場が人生のドン底

201 :
業務拡大に伴う人員増加

202 :
終わりのない奇跡があると信じていた

203 :
機械学習・データマイニングに関係ない雑談は、雑談スレに書き込んで下さいますよう、お願いします。

204 :
機械学習とOSって結び付けて、intelligent OSなんて作れるものなのか?
5年もあれば、kernelをハックできるって知って死にたい気分になったよ
豪州で詐欺師にあったり、事故死した日本人が居たら彼を慰めてあげてね

205 :
昨日だけでも、fuckとsuckとshitの用法に本当に詳しくなった

206 :
国際的な詐欺師集団って居るんだな。それも親戚に

207 :
修士時代の恩師にはじめて感謝できそうだ

208 :
ガンマ分布の最大事後確立に関して教えてください。あるいは、お勧め本とかないですかね?

209 :
機会学習と言えば確か神奈川の機会学習研究所とかいうインチキ会社 平気で数千万円の契約を踏み倒す
さすが沈没でポンコツのnec出身だ 相当キモい奴で他に騙されて金をふんだくられたひとが相当いるんだろうな こういう反社会的会社はクソ企業共々とっとと潰れて悶え苦しんでしね

210 :
kwsk

211 :
ほんとキチガイが住み着いたな

212 :
競馬のマイニングは使えんよな

213 :
【IT】2021年までに「人工知能」が東大入試を突破する可能性
国立情報学研究所が進める「ロボットが東大に入れるか」というプロジェクト
http://anago.2ch.net/test/read.cgi/scienceplus/1368704153/
Q. ロボットが東京大学に入学できるの?
A. 2021年までに「人工知能」が東大の入試を突破する可能性があります。
 国立情報学研究所(東京都千代田区)が、「ロボットが東大に入れるか」というプロジェクトを進めています。
 といっても、ホンダのアシモのような人間の姿をしたロボットが、鉛筆を持って筆記試験を受けるわけではありません。
研究所が開発しているのは、ロボットの頭脳部分にあたる「人工知能」、つまりコンピューターのソフトウエアです。
東大の試験問題を入力すると、高い確率で正解を出すソフトをつくろうとしているのです。
(略)
 しかし、大学の入試科目は多岐にわたっています。東大の2次試験を受ける前に、5教科7科目の大学入試
センター試験で、よい成績をあげなければなりません。いまの人工知能は、国語や英語が苦手で、暗記科目と
思われがちな社会科も、決して得意ではありません。イラストの読解はお手上げだそうです。
 プロジェクトには約60人の研究者と、コンピューターメーカーや受験産業などが参加し、苦手教科の多い人工
知能をトップレベルの受験生に育てるための「試験対策」を練っています。2016年にセンター試験で高得点をあげ、
21年までに東大2次試験で合格することが目標です。
(略)
 プロジェクトのリーダーは、国立情報学研究所の新井紀子教授です。よく「こんなことをして何の役に立つの?」と
尋ねられるそうです。実は、プロジェクトには大きな狙いがあります。
 いまの人工知能の思考方法は、「機械学習」と呼ばれるタイプが主流で、利用できるデータの量が多ければ多い
ほど能力が上がります。この方向で開発が続くと、世界中の利用者のさまざまなデータを持つグーグルやアマゾンなど
米国のIT企業ががぜん有利となり、日本企業は太刀打ちできません。
(略)
 新井さんたちは、情報量が少なくても論理的に正答を導くことのできる人工知能の開発を目指しています。それは
次世代の検索エンジンにも応用でき、日本がITで巻き返す武器になる可能性があるのです。

214 :
期待して読んだけどクソスレだな
機械学習ってこれからのビッグウェーブだと思うんだけど違うのかね
それとも津波は来ちゃったあと?

215 :
>>214
5年前。

216 :
t検定とか分散分析するとどんなことがわかるの?
工場Aと工場Bと工場Cのカンヅメの品質に差があるか?とかで例題出されても
そんなこと調べる人が極少数だと思うんだけど

217 :
>>216
治療法Aと治療法Bの比較なんかでt検定が多用された時代がかつてありました
今でも医療分野でも、これからはSVMとかもっと使われてくると思う
ただ、医療関係者はコンピュータが直接診断の領域に入り込むことを整理的に嫌悪する。
だから、医療分野で普及するコンピュータ技術は、コンピュータがデータをパターン認識するのではなく、
人間がパターン認識しやすい形にデータを加工するのが特徴。
大成功したのがCTや超音波エコー。
こいつらの原理はレントゲン、打診と同一だが、
大量にデータを採取して、人間が視覚的に認識できる画像に変換している
機械学習で本当に現場に入り込んでるのは心電図解析装置ぐらいかな

218 :
あと要介護認定の樹形モデルなんていう使われ方もある
質問に答えさせて、介護に必要な時間を見積もって要介護認定が行われてるよ
ttp://www.mhlw.go.jp/topics/kaigo/nintei/dl/text2009_4_11.pdf
特に面白くはないが社会に役に立っている

219 :
>>217-218
なるほど
確かに統計学の文献を漁ると心理学とか医療分野の資料が多いですね
最近、統計学の本がやたらとたくさん出版されてますけれども、hogehoge検定は
あくまで効果測定が目的で、データマイニング的な方とはちょっと違うんでしょうかね。。。
「データサイエンティストには統計学の知識が必要」はベイズ統計とかの統計なのかな

220 :
そもそも成果を公開したら自分の優位性がなくなるんだから
外に成果を発表する奴はただの馬鹿。

221 :
成果を公開することで、競合に対する優位性をアピールして、商売につなげるのは基本かと。
発表しちゃいけないのは、その成果を得るためのノウハウ。
よく知られている算法とかについて「コレ使ってます」とかは問題無いが、
問題ドメインによくフィットするように微妙に改良してあるとか、
事前・事後処理とかの細部こそが武器だろ。

222 :
と思ってファンドに投資したらなぜか必ず損するんですね。

223 :
>>220
ちっちゃい人間になるなよ。
人間は、どれだけ他の人に貢献したかで評価されたり、信用されたりするぞ。
ちっぽけな井戸の中の競争で勝ちたいだけなら別だけどな。
・・・と自戒。

224 :
無能なクレクレ君はくれないとすぐ人格批判する。一番ちっちゃい人間である。

225 :
2chはもう終わってる

226 :
>>224
そんなこと言わずにくれたまえ
どうせ欲しいと思わせるほど大した実績ないんだろ?ン?

227 :
わざわざ知識人が無名で投稿するわけないからな
ある程度の水準まで達すると2chがバカの塊に見えてきて、
Stackおヴァーフローかスラドのフレーム合戦に参加し、
それすら馬鹿馬鹿しくなってようやく本家のメーリングリストを読み出す
これが人の子たちの精神的な発達モデルだと思うよ
まぁ、こんなレスを読んだヤツは下位の下位だろうけど

228 :
そんな我々下位の下位の連中のレスでも1000レスぐらい束になれば何らかの有用な傾向を示すかも知れんだろ?

229 :
2chのレス統計すると荒らしの多くは韓国、中国、民主党ネタであり、
犯人はネトウヨの可能性が極めて高いこどか判明しました。

230 :
>>216
品質管理とかの分野だろ.QA7つ道具とか、その辺
大方、prologにでも時間投資した方が、まだまだ有意義に過ごせたな
ニュースサイトの糞共が糞記事ばっか書いて釣りやがって

231 :
ベイズは宗教

232 :
random forestが最強の識別器だと思うんだけど、何か反論ある?

233 :
deep learning にひかれてる

234 :
やめとけよ。フルタイムで関われないと新しい発見なんかないし、
ほっといてもOSSコミュニティのエゴブー連中がライブラリ書いてくれるのに。
おまけに単純にプログラミングのスキルとして考えたときに適応範囲せまいから。
prologなりペトリネットなりに時間費やした方が遥かにマシ

235 :
文系からデータマイニングやらデータサイエンティストの世界に飛び込む方法教えて。
営業職二年目の25歳。数学は大学受験で使用。大学の専攻は歴史学。

236 :
飛び込みは他人に迷惑だから他の方法にしておけ。

237 :
加わる方法を教えて下さい!

238 :
加わるには、まずは飛び込むことだよ。

239 :
禅問答ですなw

240 :
で、具体的に方法教えて

241 :
しつこい

242 :
ランダム森サイコー!

243 :
googleさんに聞いてみたら

244 :
会社辞めて埼玉大学か静岡大学の夜間入って統計学学ぶは

245 :
>>235
すごい亀レスだけど、
普通に本読んで、データ弄って、論文読めばいいだけだろ。
なんだかんだでプログラムができるべきだろうけど、今時はパッケージがどんな言語でもあるし、
しらベりゃ(勿論英語必須だが)使い方は沢山出てくる。
まぁ、真面目にやるとなるとちゃんとした
代数学 位相 測度論 確率論 当りの数学と
統計学(普通の本だとたいした量のデータ解析の例がないので、
      ちゃんとそれなりの件数のデータ解析があるのも選ぶ)
が最低限無いと、
とんでもないオオボケかます事には為るけど。

246 :
>>235 >>245
ちゃんとした数理統計はやらない方が良いと思う。
あっちは完全に数学屋さんの世界で、そのうえ、凄い鎬を削る世界。
そのうえ、応用数学だから、ちょっと隣の事を見るのにも
色々と追わないと分り難いったらありゃしない。
尾ってくだけでも普通の院生ぐらいの暇なきゃ無理。
そのうえ、実際にどのくらい役に立つか?はまた別だし・・・。
ここの>>1にあるリンク先が凄い充実してるから、
その辺みるだけでも十分価値あるけどね。

247 :
hosyu age

248 :
数理統計
IT
ビジネススキル
この3つがデータサイエンティストに必要と本で読んだんだが。そして、このうちの1つか2つを身につけていればおけとも。
数理統計は不要?

249 :
>>248
まじめな、数理統計はいらんやろ。つか、日本の統計学会の会員人数から言ってもそうだし、
所謂統計学と数理統計は、ビジネス啓蒙書と数学の専門書な違い。
Excelで学ぶ時系列解析 と、 多群の2 項モデルとポアソンモデルにおけるすべてのパラメータの多重比較法
研究者なら、後者が求められるかもしれないけど・・・・・・
そんな人はそもそも既にPh.Dとか取ってる人っしょ。
ITは、むしろ逆でデータサイエンティストでITじゃないないなら何がITだよwwって感じ。
ITって、Information Technologyの略ですよ。
(まぁ、IT,IT言う奴らはのITなんてネットが使えるとか、WEB APIが何か分かるとか、
 インターネットの仕組みや、多少のプログラムが程度なんだろうけどね。)
ビジネススキルに関しては、それだけじゃ何もわからんわ。
礼儀作法から、時間管理やMotivation管理、コンプライアンスや法令知識、分析力やプランニング力とか、
細かい会社のしきたりや、ステークスホルダーとの根回しとかとか、
大抵のビジネスに関するものはビジネススキルと呼ばれててねぇ・・・

250 :
大学で学ぶなら、情報系の学科が良いの?
経済系で統計学ぶよりも

251 :
extremely randomized treesって素性の重要度計算できる?

252 :
>>251
なにそのじゅもん

253 :
>>252
random forestを改良して精度と学習速度を上げたもの

254 :
精度が上がるのは嘘かも多分ケースバイケース
学習速度が爆速なのは本当

255 :
精度が上がるのは嘘かも多分ケースバイケース
学習速度が爆速なのは本当

256 :
deep learning亜種が多すぎてわからん
隠れ層にノイズ入れる版のdenoising autoencoderと
入力層削る版のdropoutがあるみたいだが
denoising autoencoderとdropoutって同じことやってる?

257 :
>>256
自分の浅学で、かつちょっと昔にさらりと触れたぐらいで半分忘れかけな知識で言うと、
まったく違うと思う。
 まず、Dropoutは、入力層のだけじゃなくて、隠れ層も適当な(結構大きめ)割合で省いて学習させて、
そんなのを幾つもやることで、過学習をお互いに打ち消し合うための回避技術。
学習を複数回させるので、当たり前だが、時間は余計に掛かる。(<= ただし相互依存性が低いので並列計算が可能)
 勿論、過学習回避技術なので、教師付学習の一環。
 Denoising Auto Encoderは、大雑把に言うと、大規模に扱う事が多くなり学習時間が膨大になる
NNの学習時間短縮方に近い感じ。また、ある意味Deep Learningの真骨頂(?)で、
自動でデータから特徴量抽出を行う部分。与えられたデータの低次元化を自動で行う技術。
NN以外で似たような目的の技術としてSVDとか、LDAとかが挙げられるかと。
 勿論、自動で低次元化を行うので教師無し学習の一環。(勿論、結果として過学習対策にはなるが)
前者は、NNの融通の利きにくい所をアンサンブル学習で回避しようぜ方向にあり、
後者は、NNのそもそもの思想・目的「コンピュータが良きに計らってくれる」をより強力に推し進める為の物かと。

258 :
おおありがとう。2chだから期待してなかったが助かります。
denoising autoencoderって(ノイズ入れる前の)入力それ自体を教師にした教師付き学習だから
denoising autoencoderにdropoutで正則化かけることもできそうですね。(←これを調べてた

259 :
真面目にデータサイエンティスト目指したいんだけど、大学に入り直すのはあり?
2年間余分にかかるわけだが。
今の会社は辞める

260 :
学士入学の方が基礎から出来そうだけど、
修士で二年考えるなら
放任じゃないある程度基礎からのカリキュラムがありそうなところがいいかもね。
自然言語処理や医学系研究科というのもいいかもしれない。

261 :
>>260
3年次編入を狙ってる

262 :
その辺は、もう自分が目指す内容をやっている先生の研究室を見つけられるかどうかによる気がする。
言い方悪いけど、学部の勉強なんてどこも大差ない気がするけど。
(Fランとかは別にして・・・・。)
 まぁ大きな指針としては、 ACMのKDD系に論文・国債発表をコンスタントに出してる研究会とか、
ICMLやAAAやIEEE系の分野か、ASAとか、統計学会とか、人工知能学会とか、
自然言語処理学会、電子情報通信学会や情報処理学会の関連か
(IBISMLは、まだ研究会だけど、見ておくのは良いと思う。)
あと、データサイエンスと言っても方向性が
・理論派
・実践派
で分かれるし、
なによりも、日本の場合データサイエンスや統計そのものをメインにしている人が少なくて、
大体の場合、別の経済・経営・生物・医学・コンピュータ(自然言語)・コンピュータ(通信)とかを中心に
その辺もやってます。と言ってる気がする。
あと、本当にデータサイエンティストを目指すなら、
ちょっと離れるけどPFIとかに挑戦するのがいいんじゃないかな?

263 :
データサイエンティストの専門家になるなら最低でも修士は出ないと駄目じゃないの

264 :
修士なんて学歴にならん
ドクター必須

265 :
修士出てた方が良いだろうけど、修士出てても それ でデータサイエンティストとは思われないだろう。
同様に博士とってても変わらないと思う。
そもそも、データサイエンティストって語がふんわりとしすぎてて、その割にみんな過大な期待してると思う。
まぁ流行物なんてそんなもんなんだろうが。

266 :
>>264
研究所でも、日本なら普通に修士で十分だし普通の企業なら尚更 学士でも問題無い。
まぁ、IBMとか GoogleとかMicrosoftとかの研究所を狙うなら、話別だろうけど
その場合は、その場合で、学歴じゃなくて論文数とか実績だろ。

267 :
何か修士とか博士の話になってますが、
企業でデータ分析の仕事につきたいのです。

268 :
分析は手段でしかない。企業に於いては、それ以前に目的がないと話にならない。
加えて自社の社員がやるよりも外注したほうが安いと判断するかもしれない。
現在所属している会社でどんな貢献できるのか語ってみては?

269 :
>>267
そんな仕事はない。上の思いつき、鶴の一声ですべてが決まる。

270 :
カーネル多変量解析の本買ったけどDeepLeaningの方が応用効きそうなので積み本になりそう

271 :
KernelPCAはともかくSVMは廃れないだろうから無駄にはならないかと

272 :
そんな流行追って1つ2つだけお勉強したって、
ロクに使いものにならねえよ。

273 :
データサイエンティストじゃなくてデータエンジニアだろ

274 :
レパートリーの広さが能力差だな。

275 :
ここにいる皆さんは企業内でデータ分析をしているのか、コンサル会社にいるのか、そらともデータ分析専門会社にいるのか、どれですか?
また、It技術寄りか否かもお願いします

276 :
ここにいるのはデータマイニングの専門家以外がほとんどだろ?
プログラムする上で使う機会が出た、あったのが覗くんだろ?
専門家として一級だったら仕事来るだろ。経験つめるなら最初の所属はどこでもいいだろ。

277 :
>>275
自分は、研究者。元々は、人工知能とかに興味有って、
そこから、色々とやってく内に、よりアルゴリズムの方向に特化した領域に・・・で、
今は機械学習とかデータマイニングとか、データ構造とか。
企業さんと共同研究とかで内容は色々、経営コンサルっぽい事も、
販売戦略っぽい事も、市場調査っぽい事も、技術開発っぽい事もある。
昔学生の時に、バイトしてた時は、企業内でデータ分析してた。
その分析結果も、コンサルに使われてたが。

278 :
かっけーす




ぱねーす

279 :
>>277
情報系の大学院博士課程卒、という感じですかね。
大学に籍をおいてる? 企業?

280 :
>>271-272
確かに一つ一つ押さえていった方がスキルに幅が出てくるよね。
ちゃんと読んでみるよ

281 :
fuzzy neural networkって使われてる?
株価予測の論文だとたまに見るんだけど

282 :
超直感が計算機で証明されてる?

283 :
deep learningって
pcaの単なる階層化ってだけじゃないの?

284 :
学習を実現するアルゴリズムがキモかと

285 :
とりあえず横浜国立大学の経済学部、編入学に出願した。
TPPの論文書いたぜ

286 :
これでおまえも財務省の手先か。

287 :
それよりマインスイーパの上級の勝率の理論値計算してくれよ。
ググっても出てこない。

288 :
ここは文系だらけなので確率の計算はできません。

289 :
マジレスで突っ込んでおくと、
理論値がほしいなら、まずはその理論を出せよ・・・・・
マインスイーパでも、戦略次第で色々と変わるだろ。

290 :
サイコロの1が出る確率を計算しろ

1が出る理論が分らないので計算できません。みたいな。

291 :
すごろくは何回で上がれるか計算しろ

マス目の指示がわからないので計算出来ません。みたいな。

292 :
>>290
何面体のサイコロなの? とか色々あるもんね。

293 :
>>289
勝率が一番高くなる戦略でお願いします。

294 :
マインスイーパーの勝率なんて機械学習でもデータマイニングでもない気が…
それともそういう分野があるの?

295 :
100%確率のゲームだからねぇ。モンテカルロで計算するしかないんじゃないの?

296 :
身も蓋もないマジレスすると、Windowsのマインスイーパーの仕様がわからないと無理だろ
地雷の位置が完全ランダムなのかどうかすらわからんし

297 :
サイコロの確率も計算できない文系のおまえには無理。

298 :
戦略が分らないからとか、完全ランダムかどうか分らないからとか、本当にマジレスならイタイ。
何のためにこの学問があると思ってんだ。この分野に向いてない人だろう。
計算しない理由ばかり探していてはビッグデータをマイニングできない。

299 :
少なくともこの学問があるのはマインスイーパーのためではないなw
計算しない理由を探すまでもなく、真面目に計算したいと思わせる動機がないんだな、これが。

300 :
なるほど。マインスイーパはこの学問のために作られたゲームと言えるかもしれんな。
暇があるときにサクっとコード書いてみるわ。

301 :
293 みたいなのって、おもしろいと思って書いてるのかなぁ?
それとも、本当に頭の残念な子なのか??
現実だと、バカなこと言ってても「可愛い奴だなぁ」とか
「仕方ない奴だなぁ」と思えるけど、2chだと「R、ゴミ、滓、屑、出来損ない」
と言いたくなってしまう。

302 :
>>298
「理論値」を「計算」で求めるように指定されてるわけですが

303 :
戦略を機械学習させるのですよ。

304 :
それは 理論値 じゃぁないよな

305 :
おまえほんと屁理屈ばっかだな。

306 :
お前の言う「理論値」とやらをきちんと定義してくれ。
で、その定義の中の全ての単語が他の人が見ても間違いなく解釈できるところまで繰り返し定義し直してくれ。
そうしないと計算できない。

307 :
おまえは計算しなくていいよ。誰もおまえに期待していない。
真面目に計算したいと思わせる動機がないんたろ?
だからおまえはもういい。おまえの自由意志を尊重したい。

308 :2013/09/14
>>265
海外の機械学習ミートアップに出てみたけど、
参加しただけで今日から君もデータサイエンティストって書いてあったよ
修士で十分でしょ。
ところで、kaggle以外に統計で遊ぶ場所ある?
TOP カテ一覧 スレ一覧 2ch元 削除依頼
パチンコ、パチスロの基盤のプログラム 2 (501)
OpenCLプログラミング#1 (709)
【RAD統合環境】 Qt 総合スレ 15 【Win/Mac/Linux】 (506)
Jython、Groovy、JRuby - どれが一番効率的? (277)
【.NET】F#について語れ2【OCAML】 (507)
Jython、Groovy、JRuby - どれが一番効率的? (277)
--log9.info------------------
【キャプテン】ちばあきお【プレイボール】六回表 (140)
☆ときめきトゥナイト☆ 第10夜 (901)
うわさの姫子/おはよう姫子 (102)
エリア88 イーニー【31】ニーアイニームー (257)
【ちょっと】らんま1/2Pt.94【やりすぎたかな。】 (238)
【エムXゼロ】叶恭弘 総合スレF【プリティフェイス】 (721)
究極超人あ〜る【58】 (151)
つのだじろう総合 犬神魔通里2回目 (969)
あだち充作品総合スレ8 (788)
□△○楳図かずおapt17□△○ (494)
探偵学園Q (188)
【あだち充】タッチ TOUCH Part20 (958)
男組 7 風は 蕭々として (519)
【サンデー】クリスタルな洋介総合スレ【オニデレ】 (302)
【バオー】荒木飛呂彦 短編総合スレ【ビーティー】 (911)
【バンビ〜ノ!】せきやてつじ総合part2【secondo】 (133)
--log55.com------------------
中国人「もはや日本に羨むことなど何もない」
【NSw】俺らね、Nintendo Switchはコケると思うよ。4
3大過大評価ゲーム ウィッチャー3 マリオオデッセイ
ウキウキでウィッチャー3を始めた僕、ダンデリオン探し中にそっとパッドを置く
「すれちがい通信」はなぜ破滅し、打ち捨てられ、忘れ去られたのか
正論言うね。今ゴミッチが売れてるのはただの空き巣首位 コレシカナイ需要ってだけ
■■速報@ゲーハー板 ver.48634■■
よく「プレステより箱!!!」って言ってる人見かけるけど