generated at
BPStudy-133 Pythonによる機械学習・データ分析
Pythonによる機械学習・データ分析

#BPStudy参加ログです。

第1部 書籍「Pythonによるあたらしいデータ分析の教科書」特集

「Pythonによるあたらしいデータ分析の教科書」の概要とターゲット読者 (19:00〜19:20)
> 寺田 学 (Twitter: @terapyon )
> 2018年9月19日に発売される書籍、「Pythonによるあたらしいデータ分析の教科書」(翔泳社) の概要やコンセプトを知ってもらい、対象の読者を示し、他の書籍との比較を説明します。
> この講演を通じて、自分自身や同僚の中でこの本の対象読者がいるかどうか考えてもらえるようになると思います。


本の紹介
コンセプト
教科書である = 書きすぎていない
他の本との比較
本を作ることにした動機
認定試験のためのちょうどよい本がなかった
認定試験のための教科書とするために執筆

機械学習と数学 (19:20〜19:40)
> 辻 真吾 (Twitter: @tsjshg )
> 機械学習の基本的な理論は、数学で記述されています。そんな機械学習アルゴリズムも、利用するだけであれば数学をほとんど知る必要はありません。
> 忙しいITエンジニアにどこまで数学が必要か?という課題に目を向けつつ、数学を学ぶ意味や利点はどこにあるのかについてお話しします。また、どのように学べば良いのかについても考えて行きたいと思います。

機械学習と数学、どこまで必要なのか
アルゴリズムを作る人
アルゴリズムを実装する人
アルゴリズムを使う人 (←今日のターゲット!)
y=ax+b
y=\frac{1}{{1+e^{-ax}}}
数式からどういう変化が現れるかを把握する難しいけど、コンピュータに書いてもらえば良い
学び方
目的をもってやってみて、分からなかったら調べてみる

オススメ資料

まとめ
Pythonのコードが書ければ、コンピュータの助けを借りながら勉強できるぞ


機械学習入門としてのscikit-learnとの付き合い方 (19:40〜20:00)
> 福島 真太朗(Twitter: @sfchaos )
> 機械学習を勉強するにあたり,scikit-learnなどを用いて実際に動かしながら理解していくことは重要です.
> 具体的にどのように勉強していけば良いのかについて,scikit-learnのインタフェースの理解,ドキュメントの読解,各アルゴリズムのパラメータの挙動などを糸口として考えていきたいと思います.

Pythonで機械学習といえばscikit-learn
scikit-learnで機械学習に入門するのは
「自分もまだまだ模索中なのですが...」

APIの基本の理解が重要
fit, transform, predict

マニュアルとの向き合い方
最初から隅々まで読んで理解するのは難しい
数式がたくさん出てくるよ
アルゴリズムによってはユーザーガイドが付属してるので、それを読む
こういう画像を見ながら、パラメータを変えて見て、学ぶ

まとめ
scikit-learnを使いながら理解していくには、fit, transform, predict といったAPIの基本の理解が重要
アルゴリズムの挙動を確認する



編集側からみた本書の特徴と本書を読んでできるようになること (20:00〜20:20)
> 緑川敬紀
> 編集側から見た本書の特徴や進行の話を簡単に説明し、本書を読むことで何ができるようになるのかを話させて頂きます。
> また、エンジニアではない編集の人間が本書を読むことで、できるようになったことの一例を紹介いたします。

「緑川たかのり」というスライドの表記が、「鈴木たかのり」にかぶせてきてる感じ

本の出版は企画から立案まで、7ヶ月から1年以上かかる
本書は、4月開始、9月発売で、5ヶ月!
完全に人海戦術
[** 銀の弾丸はあった!
出来ないこともあった
256ページと聞いていたので、2480円に設定したが、どんどん増えて、316ページに
技術書は1ページあたり10円前後、というのが一般的だけど、この本は7.8円。だいぶお買い得です
引用の許可どりが間に合わなかった(けど謝罪する前提でそのまま掲載、2刷で修正予定)
ページ数の調整がつかず索引が付けられなかった(1ページだけ残した)

書籍で学んだ内容を使って、Amazonレビューを分析してみた
(内容略)
おもしろかったw

第2部 機械学習案件でフレームワークを作った話 (20:20〜20:40)
> 清水川貴之 (Twitter: @shimizukawa )
はい。


感想: 20分に収めるためにけっこう早口になってしまった。
懇親会でharuに聞いたら、もうちょっと時間使ってよかったみたい。
おれ「質疑応答時間が欲しかった」
haru「自分で質問ある人いますか、って聞けば良かったんですよ」
おれ「時間押してるのかと思って控えたんですよ!」


第3部 LT大会 (20:45〜21:00)
斉藤努さん
数理最適化とPyQの紹介
shimizukawaちょっと発表で疲れてメモ取れなかった

おまけ
Pythonによるあたらしいデータ分析の教科書 のプレゼント争奪じゃんけん!