この記事の内容は?
DATAMIX(データミックス)のデータサイエンティスト育成プログラムに学ぶ
データサイエンティストを目指すスクール
DATAMIX(データミックス)は未経験から6ヶ月間でデータサイエンティストを目指す社会人のためのスクールです。がっつりデータサイエンスの学習がしたい方には有力な選択肢になるでしょう。今回はデータミックスの概要とそのカリキュラムについて紹介します。
この紹介動画がイメージつきやすいかも↓
データサイエンティストに需要が高まる
DATAMIX(データミックス)は人材として需要が高まっているデータ分析のプロフェッショナルである「データサイエンティスト」を育てるスクールです。
未経験でもはじめられるカリキュラム
未経験の方であっても6ヶ月で企業におけるエントリー職以上で仕事に就けるレベルまでスキルを引き上げることを目標にしています。
そのために統計学、機械学習、人工知能、データベース、プログラミングといった広範囲な分野を効率的かつ体系的に身につけられるように工夫されたカリキュラムになっています。
データミックスがオススメな人
- データサイエンスのスキルを身につけキャリアチェンジしたいと思っている社会人
- ビッグデータを活用したビジネスを展開したいと考えているビジネスパーソン
とは言っても、まずはデータサイエンティストというものが何なのか理解するべき
結構あいまいに理解している方も多いと思います。データサイエンティストって何??
まずはデータミックスのサイトより引用。
データサイエンティストとは、高度なデータ分析技術を用いてビジネス課題を解決する専門職です。しかし、一言でデータサイエンティストと言っても業界・企業によって仕事内容は大きく変わります。
SASのサイトにも説明があったので引用。
データ・サイエンティストとは、さまざまな意思決定の局面において、データにもとづいて合理的な判断を行えるように意思決定者をサポートする職務またはそれを行う人のことです。統計解析やITのスキルに加えて、ビジネスや市場トレンドなど幅広い知識が求められます。
(引用)https://www.sas.com/ja_jp/insights/analytics/what-is-a-data-scientist.html
これらの説明を見ただけもわかるように、データサイエンティストってすごくざっくりです。肩書きよりも実際に自分は何ができるのかが重要ですね。
また、自分のデータサイエンティストとしてのスキルはどれくらい?という目安がほしい方にはデータサイエンティスト協会のサイトにも目を通しておくと良いでしょう。
データサイエンティスト(DS)とDSを目指す方のための情報サイト「DSS JOURNAL」内でスキルチェックが出来ます。
http://www.datascientist.or.jp/dssjournal/ds_skillcheck/
書籍ならこれ「データサイエンティスト養成読本」
ざっくり雰囲気を知るにはこれが良いかも。エンジニアの集まりなどでよく紹介される気がします。
DATAMIX(データミックス)はデータサイエンティストを目指せるスクール
気になるサービスの特徴は?
講師の質、実務への応用力などに注目したいですね。仕事で活かしたいという方がほとんどでしょうから。
- データサイエンティストとしての経験豊富な講師が実務視点でレクチャーしてくれる
- 少人数制で受講生一人一人の強みや弱みを把握したうえでの指導してくれる
- 多くのケーススタディなどを取り扱い実践的なスタイルで実務に活きる講義内容
- 様々な業界・職種の受講生と授業だけでなく、勉強会やイベントで交流ができる
- 卒業後も継続したフォローアップ体制。OG・OBネットワークもある
- 転職希望者への転職支援
どんなコースがあるのか?
本記事執筆時点でのコースは2つでした。
- データサイエンティスト育成コース
- ビジネストランスレーター育成コース
データサイエンティストにも色々あるぞ
上で紹介したようにデータサイエンティストというくくりはざっくりです。業界・企業によって仕事内容は大きく変わります。
以下は、業界別の事例です。
- ECサイトやウェブサービス業界:レコメンデーションアルゴリズムの開発や最適化
- 金融業界:貸し出し審査に用いる与信モデルの構築やダイレクトマーケティングのROI最適化
- 物流業界:商品配置の最適化やリソース・スケジューリングの最適化
多岐にわたりますね。
ビジネストランスレーターとは?
なかなか馴染みのないワードではないでしょうか。ビジネストランスレーター。さて、どのような役割を担うのでしょう。
ビジネストランスレーターはデータトランスレータやデータプランナーとも言われたりします。
これらの役割は、ビジネス側とデータ分析チームの間に入り、まさにビジネスとデータサイエンスの間の架け橋として活動します。
トップマネジメントをはじめとしたビジネスサイドからは、ビジネスにおける課題を明確化し分析プロジェクトの立案やKPIやPDCAサイクルの設計を行います。一方、データ分析チームからは、分析結果を理解し、その結果を活用してビジネスプロセスをどのように変革をさせるのかを経営陣に進言します。
なるほど、ビジネスには重要なキャラクターですね。
DATAMIX(データミックス)のカリキュラムに学ぼう
DIVE INTO CODE(ダイブイントゥコード)のAIのコースの記事でも紹介しましたが、こういった専門分野のスクールが公開しているカリキュラムはかなり参考になります。実際に通うのはもちろんですが、自分で学習する場合でも計画づくりの参考になります。
出口(ゴール)がきちんと設定されているカリキュラムは貴重です。
というわけで、ここからはDATAMIX(データミックス)のカリキュラムについて紹介します。
データサイエンティスト育成プログラム(カリキュラム)のゴールは?
具体的なゴール設定は以下のようになっています。
- 高度なデータ分析技術を用いてビジネスの課題の解決ができる
- 「なぜこ䛾分析手法を使うのか」を技術的な側面とビジネス䛾側面から判断できる
- PythonやRを使って求められている課題に対し適切な分析手法を実行できる(やってはいけないこと
も理解している) - 分析結果をクライアント(社内・社外問わず)にわかりやすく説明できる
カリキュラムの全体像は?
大きく4つのステップに分かれる
4つのステップを登っていきます。
- ブートキャンプ
- ベーシック
- アドバンス
- インテグレーション
ブートキャンプとベーシックはデータサイエンスの基礎。アドバンスとインテグレーションは各業界で求められるスキルを優先的に学びます。
各業界とは?
WEB業界、物流業界、マーケティング業界、金融業界が設定されています。
4つのステップをもう少し詳しく
では4つのステップの中身はどういったものなのか?詳しく見ていきましょう。
まずは、基礎となるブートキャンプとベーシックから。
1 ブートキャンプの内容
Pythonによる線形代数
基本的なPythonで䛾コーディングを習得することに加え、機械学習や統計モデルを理解するために必要最低限の
線形代数をPythonを使いながら学習します。
主なトピックです。
- プログラミング基礎
- ベクトル・行列
- NumPy
- 行列分解
Pythonを使った機械学習ベーシック
データ分析で必須のライブラリや機械学習の基礎を学んでいく感じですね。
Pythonの中でもデータ分析で用いられるNumPy,pandas,scikit-learnといったライブラリの使い方を学習します。また、機械学習の中でも教師あり学習を中心に理論を学びます。
主なトピックです。
- pandasを用いたデータ加工
- 教師あり学習
- 勾配降下法
Rによる統計学基礎
R言語を用いて、統計学䛾基本的な考え方と確率モデルについて学びます。今後の学習をスムーズにするため理論と実践をバランスよく行います。
主なトピックです。
- 確率分布
- 最尤推定
- 点推定、区間推定
- 仮説検定
独学で統計はキビシイな・・・という方もここで学べます。
SQL・データ可視化
大量データを扱う上でのデータベースを思い通りにできるようになることが重要です。数千万レコード䛾データをSQLを用いて集計・加工するスキルを学習します。また結果を可視化する方法を学びます。
主なトピックです。
- SQL
- データ可視化
- ダッシュボード
ロジカルシンキング
ビジネス課題から分析課題へ落とし込むための定量的なロジカルシンキングとデータプレゼンテーションをケースを通じて学習します。
主なトピックです。
- KPI
- ロジックツリー
- 分析結果から施策䛾提案
- データプレゼンテーション
2 ベーシックの内容
ブートキャンプの次のステップはベーシック。さてさて、どんな内容なのでしょうか。
ベーシックステップは統計モデリングと機械学習を中心に実践スキルを鍛えていきます。それぞれのコースで、レクチャーを3時間、その後約2週間かけてグループワークと個人プロジェクトに取り組みます。さらに2週間後に取り組んだ課題の成果を各自発表することでデータプレゼンテーションのスキルを高めます。
時間配分は以下のような感じです。
- Week1&2:Rによる統計モデリングレクチャー
- Week3:Rによる統計モデリング成果発表
- Week4&5:機械学習プロジェクトレクチャー
- Week6:機械学習プロジェクト成果発表
どっぷりデータサイエンスの学習ができそうです。
3 アドバンスステップの進め方
いよいよ具体的な学習に突入です。ワクワクしますね!やりたいことが絞れるとまたモチベーションも上がると思います。
アドバンスステップはベーシックステップと同様、それぞれのコースで、レクチャーを3時間、その後約2週間かけてグループワークと個人プロジェクトに取り組みます。また、2週間後に取り組んだ課題の成果を各自発表することでデータプレゼンテーションのスキルを高めます。
各ジャンルに分かれています。
AdTechトラック
対象者はモバイルアプリやB to CのWebサービス、アドテクサービスを展開する企業でのデータサイエンティストを目指す方。
推奨選択コースは以下の通り。
- レコメンデーションアルゴリズム
- 自然言語処理とAPI
- BigData(Spark)
LogiTechトラック
対象者は機械学習・人工知能を用いて、これまでにない物流業界におけるデータサイエンティストを目指す方。
推奨選択コースは以下の通り。
- 組み合わせ最適化と動的計画法
- 需要予測(時系列分析)
- ディープラーニング
Digital Marketingトラック
デジタルマーケティング、マーケティングサイエンスを強みとしたデータサイエンティストを目指す方。
推奨選択コースは以下の通り。
- 統計的因果推論と
- 実験デザイン
- マーケティングミックスモデリング
- ベイズモデリング入門
FinTechトラック
金融業界向けのFinTechトラックは現在準備中とのこと。バズワードのFinTechはどんな内容になるのか。楽しみですね。
4 インテグレーションステップ
これまでの集大成、インテグレーションステップです。
インテグレーションステップのゴールは?
約1ヶ月間かけてビジネス課題をデータサイエンスを用いて解決するためのプロジェクトを行います。具体的には、分析計画の策定、実際の分析作業、結果のレポーティングまでの一連の流れを行います。また、毎週個別メンタリングを通じて進捗確認と技術的なサポートを行いながら、より実務で使うテクニックの習得を行います。
できるようになること
- ビジネス課題を分析課題へ「翻訳」しプロジェクトに仕立てることができる
- 分析計画を策定することができる
- データの抽出、前処理、分析、アルゴリズム選択、評価など一連の作業を一人で実行できる
- オーディエンスに合わせたデリバリーができる
- 新しいスキルを学び続ける方法を身につける
これだけのスキルが身につくならかなり自信も付くでしょう。
時間構成は?
インテグレーションステップの時間配分は以下のようになります。
- Week1:プロジェクト発表
- Week2:個別メンタリング
- Week3:個別メンタリング
- Week4:成果発表プレゼンテーション
これで全カリキュラム終了です。最後まで走り切りたいですね。
おわりに
話題のDATAMIX(データミックス)とそのカリキュラムを紹介しました
いかがでしたでしょうか。
DATAMIX(データミックス)は未経験から6ヶ月間でデータサイエンティストを目指す社会人のためのスクールです。
需要が高まっているデータサイエンティストになる!
人材として需要が高まっているデータサイエンティスト。
がっつり学びたい方には有力な候補になると思います!
詳細はDATAMIX(データミックス)の公式サイトをご確認ください。無料の説明会も開催されているので、まずは情報収集がてら参加してみる方が色々早いと思います。
ではでは〜