カテゴリ:統計( 7 )

献本

今日、家に帰ってきたら、「献本」と書かれた封筒がありました。最近は、仕事が忙しいこともあり、あまり本を書く仕事を引き受けていないので、なぜ私に献本?と思ったら、大学院の先生からでした。
e0033248_23523945.jpg
この先生に線形代数や偏微分をがっつり教えてもらって、数学だけじゃなくて、教え方、数学をイメージで掴むということも教えてもらった先生でした。本を出されたのは知っていて、欲しいなと思っていた本だったのでビックリ。基礎から最新のところまで、懐かしい箇所もあれば、へーという箇所もあり。最近統計の勉強していないので、証明問題など写経しながら追ってみようかなと思わせてくれる内容でした。

私の大学院は、毎年学生がすごく少ないのですが、こうやって覚えていてくださるのは、本当にありがたいなとおもいます

[PR]
by biostat_cat | 2017-08-01 23:50 | 統計 | Trackback | Comments(0)

異常検知の本と写経

もうすぐ夏休みという事で、なんとなく勉強したいなとか、面白そうと思った本を次から次へとポチっていますが、今日は、「入門 機械学習による異常検知」という本が届きました。もう一つ、同じ著者で機械学習プロフェッショナルシリーズにも、異常検知の本が出ていたのですが、この本のほうがRでのコードもあるという口コミから、ひとまずこちらの本を買ってみました。
e0033248_2254256.jpg

異常検知は工場の製造ラインなどで、不良品の検出に使われたりするのですが、この時、正常な製品でモデルを作り、不良品を弾くというもので、しごく最もではあるのですが、パターン認識や判別問題では、正常、異常と2つのグループがあれば、それぞれでモデルを作成して判別式を作るのですが、この異常検知は正常パターンのみ(または異常のみ)でモデルを作るというのが特徴かなと思います(本を読み終えたら、違っているかもですが、今のところの理解では)。どうして、これに興味があるかというと、たとえば健常者と病気の人だと、病気の人のパターンが決まっていない場合、病気の人のモデルを一生懸命作るよりも、健常者でモデルを作り、それ以外で弾く方が、なんとなくしっくり来るなと思っていました。大学院の時の友達が、一度これを使おうかという話があったので、私も少し横で聞いていて、ほほーと思ったものですが、それからしっかり勉強する機会もなかったので、本を買ってみたという経緯です。

前から興味があったものの、あまり勉強した事がなかったので、良い機会だし分かるところだけでも読んでみるかなと買ったのですが、すごい読みやすい語り口にちょっと感動しました。統計がらみの本は、簡単だとさらっと上っ面だけのような本か、コードの使い方だけの本か、がっつり過ぎて難しい・・・というようなパターンに分類されるかと思いますが、この本は理論に触れている章もあれば、数式の導出の多くが付録になっていて、載せているけどメインの紙面にのせず、メインの紙面のところでも、数式の流れをすごくわかりやすく書いていて、親切だなーと思うと同時に、いろいろ、こういう風に説明するのかと何か機会が今度あれば、こんな風に説明できたらいいなと思いました。

とはいえ、こういう本は数式を自分で書き写しながら読まないと、今ひとつ理解が進まないので、ゆっくりですが、最近は本の内容を書き写す写経での勉強を再びやっています。中国語も勉強している課の内容をいつも持ち歩く手帳に暇を見つけては書き写し、空いた時間に見たり出来るようにと思っています。

やっぱりこういう地道な作業が本当に身につけるためには必要なのかなーと思いながら、久しぶりに数式を沢山書いて思うのでした。
[PR]
by biostat_cat | 2016-08-11 22:10 | 統計 | Trackback | Comments(0)

ほどよい疲れと満足感

先週は、自分がスタッフを勤めていた研究会があり、そこでたくさん発表やプレゼンテーション、司会などをやりました。思った以上に大変でしたが、参加した人たちの反応や声を聞いて、とても満足いく内容だったと思います。

その後、すぐに台湾へ出張し、いろいろと懸念事項について顔を突き合わせて議論をして、大分クリアになりました。やはり直接会って話をするのは大切ですね。

そして、今は研究会に参加してくれた方々のフォローアップと結果のまとめ。終わったとはいえ、自分しかそれを体感していないので、どうやって数字として結果に残すか、いろいろな形で結果の集計をしてボスと本社へ報告です。それからフォローアップのメールなど。

このあたりが、いつも甘いな、と思うので、がんばってやろうと思います。イチローの言葉が好きなので、いろいろと見つけては感心していますが、彼はいつもバッティングボックスに立つたびに何かを学ぼうとして、その学びを見つけることこそが、彼を満足させるのだとか。

私も常に、何からでも学ぶことを忘れずにがんばります。学ぶポイントを見つけられるという事は、まだ成長できる、という事。今回のセミナーもきちんとしたフォローアップを迅速にできる方法を模索してがんばります!
[PR]
by biostat_cat | 2012-05-30 22:39 | 統計 | Trackback | Comments(0)

小泉改革による死亡犠牲者数シミュレーション

一次予防をより重視してくだされ > 小泉総理閣下
というブログに以下のリンクがあった。

小泉改革による死亡犠牲者数シミュレーション

・・・すごい。そういうことを計算してしまう人がいるという点と、着眼点に驚いた。

いろいろな数字の統計データが世の中にはあふれているから、そこからさまざまな視点で、数字をベースに考えることができるのだ。
自分もそういうことができるようになればよいなと単純に思ってしまった。

私は割りと政治が好きなほうだと思う。泥臭い人間模様とさまざまな欲が絡んで、その駆け引きのさまを見ていると、小説よりも面白いなと思うからだ。

ちなみに私は小泉総理のメールマガジンを購読している人で、何か意見があると、メールをしてしまう。
そうすると、官邸から返事がきます。なんか直接伝えられたという感じがあって結構好きです。
ちなみにMLは英語でも購読できます。勉強のために英語で購読していますが、いつも一番最初にLion heart とあるので、ちょっとウケてます。

いやー、しかし恐るべし。
[PR]
by biostat_cat | 2005-09-18 21:42 | 統計 | Trackback | Comments(0)

主成分分析と多次元尺度構成法

今日はお客さん向けの資料として、主成分分析(PCA)と多次元尺度構成法についてまとめている。
最初、多次元尺度構成法の英語名Multidimensional Scaling(MDS) しか分からず、しかもスペルミスのままGoogleしていたので、ちっともいい資料にたどり着かず、これはかなりマイナーな方法なのか?!と思ってしまった。日本人が少ない外資系企業では、まず最適な日本語訳を見つけることから始めねばならない。。多次元尺度構成法で調べると、わんさと出てきた。ほっ。

どちらもデータの要約に用いられる方法だが、着眼点が違う。
PCAは、データの散らばり具合を情報量としてできるだけ保持して合成変数を作成し、それを軸としてデータを要約するのに対し、MDSは対象間の距離を維持したまま、小さな次元に要約する。PCAでは、合成された変数が何かしらの意味を持つのに対し、MDSでの軸は特に意味はもたない。しかしながら、距離的関係を保持しているので、ちょうどユークリッド距離でクラスタリングした結果と似てくるので、解釈しやすい場合がある。PCAの場合、作成された合成変数がなんだったのか、解釈に困る場合があるのだ。どちらも3次元で表示させることができるので、お客さんからは「結果が随分違うが、なぜ?」という質問があがるというわけです。

資料を作成中に早速「PCAってなんですか?」という質問が来たので、「おっ♪」とウキウキして答えてしまった。

MDSはLevenberg-Marquardt法という方法を採用している。これは非線形の問題を解決するのに役立つそうだ。
詳しい資料を読んでいるとノルムとか出てきて、やはりここでも行列ね・・と哀愁ただよう今日この頃である。
くー、行列は絶対なんとかせねば!

資料はあまり難しくなり過ぎないように、なかなかいいものができたのではないかと思う。数学的な背景はもう少し勉強が必要だ。
[PR]
by biostat_cat | 2005-08-31 17:25 | 統計 | Trackback | Comments(2)

共通オッズ比

データが層別されている場合(たとえば男・女それぞれでの輸血歴と肝癌の有無というデータの場合、男女のグループを層と呼ぶ)の場合、男女で別々にデータを見るほうがいいのか、まとめて見て問題ないのかということを確認する必要がある。このような場合、層別(この場合は男女)でオッズ比が共通(均一)であれば、まとめてよし、均一でなければ、別々に見る、という方法をとる。輸血歴が年数別など、2つよりも多い場合、SASのproc freq のtableオプションからcmhを選んで共通オッズ比を計算するMantel-Haenszelではwhereなどを使って分けなければいけないが、proc logistic ではそのようにしなくとも一発でオッズ比が計算される。

しかし、proc freq で計算したオッズ比とproc logistic で計算したオッズ比が微妙に違うことが 「なぜだ?」と思っていたのだが、おそらくわかった。ロジスティックモデルをあまり正確に理解していないので、完全ではないが、proc logistic のオッズ比はモデルのパラメータの値から自然対数をはずして計算しているようだ。

統計ソフトの勉強と統計自体の勉強と、統計の勉強はなかなか大変だ・・
[PR]
by biostat_cat | 2005-08-15 02:25 | 統計 | Trackback | Comments(0)

proc freq 注意点

宿題をしながら思い出した。
SAS の proc freq で作られるテーブルの行の順序は名前の付け方に依存するのだ。

すんごい、混乱しそうだが、”陰性”、”陽性”とかって名前をつけると、データの入力順番に関係なく、陰性が上の行にくる。
こうなると、陰性が暴露群として考えられるから、結果の解釈の際、オッズ比などを見る
ときに、陰性が陽性に対して何倍、という変な解釈をしなくては成らなくなる。

だから、’○○あり’、’○○なし’という名前の付け方にするなどの工夫が必要だ。
あり、なしだと、ありが上に来て、これが暴露群となるから、暴露なしに対して何倍、というふうに自然な解釈ができる。

ややこし~ と初心者は思ってしまうのだった。 大学ノートに後でまとめてUpしなくては!
[PR]
by biostat_cat | 2005-07-25 07:30 | 統計 | Trackback | Comments(1)

オージーの旦那様と巨大な猫ちゃんとののんびりライフ。ブログのタイトルはイタリア語で「ネコの足跡」という意味。私の足跡の記録です。コメント大歓迎☆


by biostat_cat

プロフィールを見る
画像一覧

S M T W T F S
1 2 3 4
5 6 7 8 9 10 11
12 13 14 15 16 17 18
19 20 21 22 23 24 25
26 27 28 29 30

カテゴリ

全体
徒然
ニュースクリップ
統計
マイクロアレイ
文献
Wish List
勉強の軌跡
仕事
Cinema
Nail
国際結婚(準備編)
PCDJ
国際結婚(生活編)
国際結婚(食事編)
国際結婚(英会話編)
心に響いた言葉
旅行
チェロ
自転車
Sweets
メグちゃん
Work out
研究のこと
お買い物
パン作り
バラ
庭のこと
デンマーク語
中国語学習
デンマーク語学習
編み物
料理
観葉植物
ミールプレップ
カメラ
未分類

フォロー中のブログ

今夜もeat it
うちの食卓 Non so...
ろんどんらいふ
パリときどきバブー  f...
一日一膳
 フランス生活便り
ボノボノ毎日
ばーさんがじーさんに作る食卓
Yukiの部屋*Bonj...
パンの時間
ころころまるしぇ
Apricot&Peach
ほっこリ日記
Petit Delice...
Photo clip-m...
チャノマ。
Bon appetit!
うひひなまいにち
ごはんの時間 ++気まぐ...
お家カフェごっこ nic...
のんびり
Apricot&Peach3
こむぎあじ
A Taste of T...
Lovely Poodle
The Lynne's ...
uri's room* ...
Second life
ほっこりぐらし
☆MY STYLEを探して☆

最新のコメント

ありがとうございます!イ..
by biostat_cat at 05:24
お部屋いい雰囲気ですね!..
by bluecheese_jp at 09:31
最近、みんな写真もYou..
by biostat_cat at 23:51
Meal Prep、私も..
by bluecheese_jp at 07:27
ありがとうございます!バ..
by biostat_cat at 20:37
すごい!難しいバゲットを..
by bluecheese_jp at 17:25
bluecheese_j..
by biostat_cat at 21:11
リンクされたブログ、じっ..
by bluecheese_jp at 19:18
遅くなりましたが、お勧め..
by biostat_cat at 05:01
こういうのいいですね〜!..
by bluecheese_jp at 17:14

以前の記事

2017年 11月
2017年 10月
2017年 09月
2017年 08月
2017年 07月
more...

検索

ライフログ


素人のように考え、玄人として実行する―問題解決のメタ技術


生きること学ぶこと

その他のジャンル

ファン

記事ランキング

ブログジャンル

画像一覧

ブログパーツ

  • このブログに掲載されている写真・画像・イラストを無断で使用することを禁じます。