変人力

シアトル留学中大学生のブログ

PyQでPythonを使ったデータ処理と機械学習に入門する

f:id:taccho:20171008120531p:plain

はじめに

 僕もよく利用させていただいていた「PyQ(パイキュー)」というサービスに「データ処理」と「機械学習」の入門コースが登場しました。2017年9月に登場したばかりということで、コンテンツ的の量はそれほどでもありませんが、基本的なことを手を動かしながら学べるといった印象です。今日はこのコースでは何が学べるかご紹介します。

学べること

Pythonデータ処理入門

Jupyter Notebookの使い方

Jupyter Notebookはデータ処理や機械学習で広く利用されているツールです。
数式通常のPythonコードも、実行結果付きでノートブックで共有できます。

pandas

pandasは強力なPython製のデータ分析用ライブラリです。特にpandasに用意されているデータ読み込み、集計、加工、不要データの削除などの機能が、データ分析の事前作業の前処理で役立ちます。

pandasのデータ構造

 pandasでよく使われるデータ構造である1次元の Series(シリーズ)、2次元の DataFrame(データフレーム)を学びます。

データ処理

 データの入力や出力、JSON形式の出力、関数の適応について学習します。 

Python機械学習

機械学習入門

 簡単なif文から始め、機械学習とは何なのかを学習します。

ロジスティック回帰

 ロジスティック回帰は代表的な機械学習の分類器のひとつであり、データを線形に分類する手法です。ここではロジスティック回帰の弱点である非線形(※)データの処理も紹介しています。

(※)グラフで見ると直線ではなく、比例関係が成り立たないこと

前処理

 機械学習ではアルゴリズムへ入力する前にデータセットを精査し、前処理を行うことでデータの品質をあげることが大切であり、その手法について学ぶことができます。

決定木

 決定木は自動で条件を学習するif文の連続といったイメージです。

SVM

  SVM(サポートベクターマシン) とはロジスティック回帰と同じように線形に分類を行うアルゴリズムですが、ロジスティクス回帰が苦手としていた非線形分離問題も解くことができる優れものです。f:id:taccho:20171008121106p:plain

料金体系

 データ処理・機械学習両コースに追加料金はなく、「PyQ」の通常会員になっていれば受講することができます。

最後に

レベル感としては、超初心者向けといった感覚です。特に1度も触ったことがないという人には持ってこいだと思います。皆さんも是非「PyQ(パイキュー)」で機械学習とはどういったものか体験してみてください。