2. 行列とその基本的な演算
Table of Contents
前回の記事では、データの基本的な表現単位であるベクトルについて学びました。今回はその概念を拡張し、複数のベクトルをまとめて扱うための強力なツール、行列 (Matrix) について解説します。
行列の定義
行列とは、数や記号を長方形の形に並べたものです。個の行と個の列を持つ行列 は 行列 と呼ばれ、以下のように表現されます。
ここで、 は行列の行目、列目の要素を指します。 ベクトルは、列数が1 () の行列(列ベクトル)や、行数が1 () の行列(行ベクトル)と見なすことができます。
データサイエンスにおける行列の役割
行列は、単に数を並べたものではなく、データサイエンスにおいて中心的な役割を果たします。
1. データセットの表現
一般的なデータセットは、個のサンプル(データ点)と個の特徴量から構成されます。これは、 行列として自然に表現できます。各行が1つのサンプル(特徴ベクトル)に対応し、各列が1つの特徴量に対応します。このような行列は計画行列 (design matrix) やデータ行列と呼ばれます。
2. 線形変換
行列の最も強力な役割の一つが、線形変換 (linear transformation) です。行列 をベクトル に掛ける(作用させる)と、新しいベクトル が得られます。
これは、ベクトル を別のベクトル に「変換」または「写像」する操作と解釈できます。この変換は、データの回転、拡大・縮小、射影などを含み、主成分分析(PCA)やニューラルネットワークの各層での計算の基礎となります。
行列の基本的な演算
1. 和とスカラー倍
同じサイズの行列同士は、対応する要素を足し合わせることで和を計算できます。スカラー倍も、全要素にそのスカラーを掛けるだけで、ベクトルと同様です。
2. 行列の積
行列の積は、データサイエンスで最も頻出する演算の一つであり、単純な要素ごとの積ではないため注意が必要です。 行列 と 行列 の積 は、 行列になります。
の 行列目の要素 は、 の 番目の行ベクトルと の 番目の列ベクトルの内積によって計算されます。
注意点: 行列の積は一般に可換ではありません。つまり、 です。
特別な行列
1. 転置行列 (Transpose Matrix)
行列 の行と列を入れ替えて得られる行列を転置行列といい、 で表します。 が成り立ちます。統計学や機械学習の数式で頻繁に登場します。
2. 単位行列 (Identity Matrix)
対角成分がすべて1で、それ以外の成分がすべて0である正方行列(行と列の数が等しい行列)を単位行列といい、 で表します。どのような行列 に対しても、 が成り立つ、積における「1」のような存在です。
まとめ
行列は、複数のデータをまとめて効率的に扱うための数学的な構造です。データセットそのものを表現するだけでなく、線形変換という形でデータを操作・変換する強力な機能を提供します。特に行列の積は、多くのアルゴリズムの根幹をなす演算であり、その計算方法と性質を理解することは不可欠です。