主成分分析
しゅせいぶんぶんせき
説明
主成分分析(PCA)は、多変量データの分散を最大限に説明する直交軸(主成分)を見つけ出す統計手法で、データの次元削減や特徴抽出に広く用いられる。PCAではデータの共分散行列を固有値分解し、固有ベクトルを主成分軸、固有値を対応する分散(寄与率)とみなす。これはPODと数学的に同等であり、流体場データの解析ではPODとして知られる。主成分分析によって、元の高次元データを少数の主成分スコアに圧縮しつつ、データのばらつき(エネルギー)の多くを保持することができる。例えば、乱流中のセンサーデータにPCAを適用すると、少数の主成分で主要な変動パターンを記述できる。PCAは機械学習の前処理や異常検知などにも利用され、シンプルながら非常に強力な分析ツールである。