【Python】データサイエンティスト おすすめ 参考書 4選
こんにちは、にわこまです。
今回は、データ分析や人工知能、機械学習などデータサイエンティストとして必要な知識を学ぶことができる参考書を紹介します。データ分析はビジネス的な場面でよく使われるため1冊持っておいて損はないと思います。
誤字脱字など何かございましたらご連絡お願いいたします。
スポンサードサーチ
東京大学のデータサイエンティスト育成講座 Pythonで手を動かして学ぶデータ分析
作者:塚本邦尊(著)、山田典一(著)、大澤文孝(著)、
中山浩太郎(監修)、松尾豊(協力)
出版社:マイナビ出版
発売日:2019年3月14日
目次
Chapter1 本書の概要とPythonの基礎
Chapter2 科学計算、データ加工、グラフ描画ライブラリの使い方の基礎
Chapter3 記述統計と単回帰分析
Chapter4 確率と統計の基礎
Chapter5 Pythonによる科学計算(NumpyとScipy)
Chapter6 Pandasを使ったデータ加工処理
Chapter7 Matplotlibを使ったデータ可視化
Chapter8 機械学習の基礎(教師あり学習)
Chapter9 機械学習の基礎(教師なし学習)
Chapter10 モデルの検証方法とチューニング方法
Chapter11 総合演習問題
コメント
各チャプターに演習問題が設定されているため、学ぶだけでなく実践を体験して理解することができます。
Chapter1にPythonの基礎がありますが、必要最低限しか学ぶことができないため、今後pythonを使ってデータ分析をしていく方は、pythonを勉強すると良いかもしれません。
サンプルコードが多いため手を動かしながら学ぶことができます。学び終わった後も教科書のように使うことができます。
Kaggleで勝つデータ分析の技術
作者:門脇大輔、阪田隆司、保坂桂佑、平松雄司
出版社:技術評論社
発売日:2019年10月9日
目次
第1章 分析コンペとは?
第2章 タスクと評価指標
第3章 特徴量の作成
第4章 モデルの作成
第5章 モデルの評価
第6章 モデルのチューニング
第7章 アンサンブル
コメント
モデルのチューニングや良い精度の出し方に焦点を当てた書籍となっています。データ分析のいろいろな方法を学ぶというよりかは、いかに良い精度を出すモデルを作成するかということを学ぶことができます。
完全未経験の方よりかは、データ分析を少し勉強したことがある方におすすめの参考書です。Kaggleでデータ分析を行おうと思っている方にもおすすめです。
Kaggleとは、企業と機械学習エンジニアやデータサイエンティストを繋げるプラットフォームです。Kaggleではコンペというものがあります。このコンペで良い成績を残すことで賞金がもらえたりします。
スポンサードサーチ
Python実践データ分析100本ノック
作者:下山輝昌、松田雄馬、三木孝行
出版社:秀和システム
発売日:2019年9月27日
目次
第1部 基礎編:データ加工
第1章 ウェブからの注文数を分析する10本ノック
第2章 小売店のデータでデータ加工を行う10本ノック
第2部 実践編:機械学習
第3章 顧客の全体像を把握する10本ノック
第4章 顧客の行動を予測する10本ノック
第5章 顧客の大会を予測する10本ノック
第3部 実践編2:最適化問題
第6章 物流の最適ルートをコンサルティングする10本ノック
第7章 ロジスティックネットワークの最適設定を行う10本ノック
第8章 数値シミュレーションで消費者行動を予測する10本ノック
第4部 発展編:画像処理/言語処理
第9章 潜在顧客を把握するための画像認識10本ノック
第10章 アンケート分析を行うための自然言語処理10本ノック
コメント
実践に特化したデータ分析の書籍となっています。実際にビジネスの場面で使われそうなデータを扱っています。ゆえに、ビジネスにおいて一般的なデータ分析を行う方が学ぶにはちょうどいい書籍になっていると思います。
逆に、pythonを勉強したことがありデータ分析も何回か行ったことがある方にとっては、物足りないと感じるかもしれません。
手を動かして、実際にデータ分析を行いながら学びたい方におすすめです。
RとPythonで学ぶ[実践的]データサイエンティスト&機械学習
作者:有賀友紀、大橋俊介
出版社:技術評論社
発売日:2019年3月26日
目次
第1章 データサイエンス 入門
第2章 RとPython
第3章 データ分析と基本的なモデリング
第4章 実践的なモデリング
第5章 機械学習とディープラーニング
コメント
野村総合研究所のシステムコンサルティング事業本部で実施されている研修をベースとした書籍となっているため、かなり現場を重視した書籍となっています。
また、現場においてデータを加工するときのポイントなどに焦点が当てられています。
数式はできるだけ使わず、手を動かして大まかに理解するといったスタンスの参考書となっていると思います。
全くの初心者にとってはかなり難しい書籍ですが、理系の方やデータ分析をしたことがある方が現場のデータ分析を理解するには最適な書籍だと思います。
スポンサードサーチ
まとめ
今回は、データサイエンティストになるためにデータ分析や機械学習を学ぶことができる参考書を紹介しました。
ビジネスにAIが使われるようになってきて、データ分析を行うことがあると思います。または、データ分析を行ってみて分かることがあるかもしれませ。
データ分析を行うスキルは、身につけておいて損は無いと思います。
以下に、今回紹介した参考書をまとめます。
・東京大学のデータサイエンティスト育成講座
pythonの基礎からデータ分析の応用まで学ぶことができます。さらに各章に演習問題が設定されているため、実際にデータ分析を行って身につけることができます。初心者でも理解しやすいと思います。
・Kaggleで勝つデータ分析の技術
Kaggleというプラットフォームにおいて、どのように良い精度を出せるモデルを作るかについて学ぶことができます。データ分析よりもモデルのチューニングに焦点を当てています。Kaggleでデータ分析をやってみたいという方におすすめです。
・Python実践データ分析100本ノック
実践に特化した参考書となっています。手を動かして学びたい方におすすめです。初心者の方が一般的なビジネスのデータ分析を学ぶのにおすすめです。しかし、データ分析を行ったことがある方にとっては、物足りない内容となると思います。
・RとPythonで学ぶ[実践的]データサイエンティスト&機械学習
野村総合研究所の研修をベースに作られた参考書となっています。より現場を重視した内容になっています。pythonを勉強したことがあり、これから本格的にデータ分析を学びたいと思っている方におすすめです。
最後までお読みいただきありがとうございます。
スポンサードサーチ