Courceraの機械学習コース、第1週目は機械学習とは何ぞや?というところからはじまります。
コース内で学べる内容は以下の通りになります。
Coursera Machine Learning で学べること一覧!
機械学習とは?
まずは機械学習の定義からですが、以下のように定義づけられています。
”Filed of study that gives computers the ability to learn without being explicitly programmed” (Arthur Samuel, 1959)
つまり、明示的にプログラミングを用いないでコンピュータに学習能力を持たせることです。
機械学習の種類
機械学習は大きく分けると次の二つの種類があります。詳しくそれぞれ説明を行います。
・ 教師あり学習
・ 教師なし学習
教師あり学習
まず例として、次に示す家の大きさと価格の関係を見てみましょう。
なんてことはありません。横軸に”家の大きさ”、縦軸に”家の価格”にしたグラフです。
家が大きければその分価格は高くなります。ただそれだけのことです。
この例ように、入力(家の大きさ)に対して出力(家の価格)の関係がはっきりしているデータを教師ありデータと呼びます。
この教師ありデータを用いて学習させることを教師あり学習と呼びます。
今住んでいる家の価格を知りたいときに、上のグラフを見ると今の家の大きさによってなんとなくの価格を予想できそうですね?
このように入力と出力の関係が既に分かっているデータを用いて、新しい入力(家の広さ)から出力(家の価格)を予測することを回帰分析と言います。
また、入力とそれに対するカテゴリーの関係がわかっているデータを用いて、新しい入力に対する出力となるカテゴリーを予測することを分類と言います。
(例)
・受信したeメールをスパムメールか通常のメールかに分ける
・手書きの数字から実際の数字をコンピュータ認識する
入力によって数値を予測する場合には回帰分析、カテゴリ分けを行う場合には分類と覚えておくと良いでしょう。
教師なし学習
入力に対する出力が明確に決まっていないデータを用いた学習を教師なし学習と呼びます。
具体例としてはマーケティングの分野でよく使われるクラスタリングなどがあります。
例えば、”インターネット上にあるたくさんのニュースを内容ごとにまとめたい”や、”たくさんある正解のわからにデータをいくつかのグループに分たい”といった場合に使われます。
詳しくはweek8 : クラスタリング、K-meansアルゴリズム で扱います。
まとめ
機械学習には大きく次の二つがある。
・ 教師あり学習 ー回帰解析(数値を予測)
-分類(カテゴリーを予測)
・ 教師なし学習 -クラスリング、他
ふむふむ、まだまだわかりやすい感じの講義内容ですね。
次回は単一変数の場合の線形回帰モデルについて説明を行いたいと思います。
- 投稿が見つかりません。
コメント