Python 機械学習を攻略(したい)!!第1章

さて、第1章からやっていきましょう。

第1章 「データから学習する能力」をコンピュータに与える

この章の所感

  • 機械学習の概念のおさらいなのでまだまだちょろい。概念だけなら中高校生でもわかるんじゃね?レベル
  • 強化学習の“報酬を最大化”ってなんやねん。ご褒美貰えるんか

内容

データサイエンスを行うための大まかな流れを説明。なんてことはない。

  • 機械学習は教師あり学習、教師なし学習、強化学習の3つの概念がある。
    • 教師あり学習:
      分類、回帰に分けられ、ラベル付けされたトレーニングデータからモデルを学習し、未知のデータや将来のデータを予測できるようにすることである
    • 教師なし学習:
      ラベル付けされていないデータや構造が不明なデータを扱い、データの規則性を見つける。似た特徴を持つデータ同士のグループ分けを行うクラスタリング、データのもつ情報をできるだけ維持したまま項目を削減する(行ではなく列を削減)次元削減などがある
  • 前処理:データ整形
    データを学習させるためにはアルゴリズムを最適化するのに必要な形式に変換する必要がある。詳しくは後章で

  • 予測モデルのトレーニングと選択
    モデルを作成する際には複数アルゴリズムの比較をする必要がある
    また、現実のデータセットに対しても良い性能を出すためにモデルの汎化性能を評価する必要があるデータを検証用と学習用に分割したり、交差検証を行う。詳しくは後章で

  • 機械学習を行う環境
    AnacondaとPythonがお勧め

まとめ

‐ 機械学習には教師あり学習、教師なし学習、強化学習の3つのタイプがある
‐ 機械学習を触りたいのであればAnacondaをインストールしておくのが無難
‐ 第2章から難しくなっていくから震えて眠るように

コメント

タイトルとURLをコピーしました