主成分分析

おそらく間違ってる勉強中のメモ

* とても分かり易かった資料
5章 主成分分析 - rta5syo.pdf

* PCAは二つやり方がある?
- 相関行列の固有値分解: 上記のp.17
  -> 属性の単位が違う等、標準化が必要な場合?
- 分散共分散行列の固有値分解: 上記のp.11

* 次元縮退後の見方は
- 主成分得点を見ることで、低次元下でのアイテム間の比較
- 主成分負荷量を見ることで、属性間の関係性
を見ることができる?

* 主成分負荷量の求め方は
- 相関行列を使って求めた場合は
  「固有値の平方根」と「固有べクトル」をかけた値
- 分散共分散行列を使って求めた場合は
  「固有値の平方根」と「固有べクトル」をかけた値を「説明変量の分散」で除した値
# 「統計学関連なんでもあり」の過去ログ--- 039

* pythonでの実装
- sklearnのdecomposition.PCA()は分散共分散行列版?
  -> linalg.svd(np.cov(A.transpose()))と一致
  - 固有値 pca.explained_variance_ratio_
  - 主成分得点 pca.transform(A)
  - 固有ベクトル pca.components_
  - 主成分負荷量は独自に計算しないとだめ?
- 相関行列版をやりたければlinalg.svd(np.corrcoef(A.transpose()))?

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です

日本語が含まれない投稿は無視されますのでご注意ください。(スパム対策)