2021年12月27日月曜日

データサイエンス本3冊一気読み

 

データサイエンスというものがなんなのかよくわかんなくなってきたので3冊まとめて読んでみた。

ゼロからはじめるデータサイエンス 第2版 ―Pythonで学ぶ基本と実践 (2020/5/1), オライリージャパン Joel Grus (著), 菊池 彰 (翻訳)

内容:1冊でPythonの速習から、統計の基礎、確率、仮説検定、Webスクレイピング、機械学習、ナイーブベイズ、重回帰、ニューラルネットワーク、ディープラーニング、クラスタリング、自然言語処理、データベースとSQL、果ては、MapReduceにデータ倫理と、てんこ盛りである。これらのトピックを扱うコードを紹介しながら、コーディングのテクニックを適宜解説している。一方、各トピックは非常に短く、当然、初心者にはよくわからず、中級者には物足りないだろう。原理の説明というより、実装したコードから原理を理解してね。というスタンスなので、数式は少ない。これはいい。データサイエンスを学ぶ本というよりは、データサイエンス活用事例集。として使うのがよさそう。

想定される読者:授業のデータサイエンス演習に使うネタを探している教員。


事例で学ぶ! あたらしいデータサイエンスの教科書(2019/12/17), 翔泳社, 岩崎 学

内容:データサイエンスの手法を網羅する気は全くなく、データサイエンスとは、データから因果関係を抽出するための手法であるという、明確な視点のもと、例題をじっくり解説しながら進んでいく。最後は因果関係を見出すための実験計画にまで踏み込んでいくのも必然であろう。一方、原理の説明を数式でぱっぱっとするため、たぶん、初心者には何もわからない。知っている中級者がみて、ああこの話しているのね。という確認には使えるだろう。あと、コードが少ないので、どういう風にそれを計算するのか、はわからないので独習者にはちとつらいか。講義の教科書向け。

想定される読者:この本を教科書にしている講義の学生。


データサイエンスの無駄遣い (2021/10/28), 翔泳社, 篠田 裕之

内容:中二病ぼっち課題を、超高度な手法で解決していく。データサイエンスっぽいのは、最初の「既読スルー判定ランダムフォレスト」の作成くらいで、あとはチャットボット、漫画を自動作成、プロジェクションマッピング、物理シミュレーションなど、どちらかというとMake系のネタが多い。あと、こういうものを作りたいと思った。作ったものを動かしたらこうなった。というお話部分と、それをどう実装したのか、という解説部分の2本立てになっているが、ネタが多岐に渡るため、実装部分は紙幅の都合上「こうしました」という説明にならざるを得ず、ノウハウや実装上のテクニックにまでたどり着けないのは致し方のないところか。また、作ったツールで問題が解決し、さらに方法論を割と簡単に応用できそうなのも、「既読スルー判定ランダムフォレスト」くらいであり、あとは、夏休みの自由研究ネタ的な趣がすばらしい。

想定される読者:コロナ禍で中学生の子供ができる夏休みの自由研究ネタを探しているお父さん。


3冊読んでますますわからなくなりました。


0 件のコメント:

コメントを投稿