さて、第1章からやっていきましょう。
第1章 「データから学習する能力」をコンピュータに与える
この章の所感
- 機械学習の概念のおさらいなのでまだまだちょろい。概念だけな
ら中高校生でもわかるんじゃね?レベル - 強化学習の“報酬を最大化”ってなんやねん。ご褒美貰えるんか
?
内容
データサイエンスを行うための大まかな流れを説明。なんてことはない。
- 機械学習は教師あり学習、教師なし学習、強化学習の3つの概念
がある。 - 教師あり学習:
分類、回帰に分けられ、ラベル付けされたトレーニングデータからモデルを学習し、未知のデータや将来のデータを予測できるように することである - 教師なし学習:
ラベル付けされていないデータや構造が不明なデータを扱い、データの規則性を見つける。似た特徴を持つデータ同士のグループ分け を行うクラスタリング、データのもつ情報をできるだけ維持したまま項目を削減する(行で はなく列を削減)次元削減などがある
- 教師あり学習:
- 前処理:データ整形
データを学習させるためにはアルゴリズムを最適化するのに必要な形式に変換する必要がある。詳しくは後章で - 予測モデルのトレーニングと選択
モデルを作成する際には複数アルゴリズムの比較をする必要がある。
また、現実のデータセットに対しても良い性能を出すためにモデルの汎化性能を評価する必要があるデータを検証用と学習用に分割したり、交差検証を行う。詳しくは 後章で - 機械学習を行う環境
AnacondaとPythonがお勧め
まとめ
‐ 機械学習には教師あり学習、教師なし学習、強化学習の3つのタ
‐ 機械学習を触りたいのであればAnacondaをインストール
‐ 第2章から難しくなっていくから震えて眠るように
コメント