5_1 1特徴量2クラス

扱おうとするデータの特徴を数値化したものを特徴量と言います。あやめの例で言うと、がく片や花びらの長さと幅の数値です。1特徴量2クラスとは、1つの特徴量で2つに分類することです。

たとえば、2m以上はある大きな木と1mない小さな木の分類は、高さという1つの特徴量で2つに容易に分類できそうです。しかし、satosaとversicolorを花びらの長さで分類することは、次のグラフを見ても、難しいだろうと想像できます。

理由は単純です。satosaの花びらの長さはversicolorよりも短い傾向にありますが、中にはversicolorよりも長いものもあり、satosaの青い棒とversicolorの赤い棒が重なっている部分があるからです。未知のデータに対し、「これはsatosaだ」、「これはversicolor」だとそこそこの確率で言い当てることはできるかもしれませんが、完全な分類は不可能です。

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です

CAPTCHA