データサイエンスとは
データサイエンスとは、データを分析することによって価値のある情報を抽出する技術の総称です。非常に広い分野にわたって、とても多くの技術があります。これを系統だてて整理し、ひとつずつ理解して、実務で使えるようになりましょう。
データサイエンスは科学という名称で呼ばれていますが、特定の領域の“真理を探究する”といった学術分野ではありません。
自然科学、人文科学、社会科学の様々な領域でデータ分析の役割を担う共通の道具です。道具ですから、学ぶ目的とするべきものではなく、目的を達成するための手段とするべきものです。理解したところで満足せず、実際の問題に応用することを目指しましょう。
実際の問題とは、ビジネスやスポーツなどの競争世界における意思決定と行動選択の問題です。データサイエンスは問題を解決するための道具であり、強力な武器になります。
現実世界の問題に適用して解決するという点を強調したかったので、コースの名前については、実行することを意味する『実践』では弱いと思い、戦うという意味の『実戦』と名付けました。
データサイエンス実戦講座の全体構成
Ⅰ. 統計学の基礎理論 ( 頻度論の統計学、仮説検定、ベイズ統計の基礎、ベイズ推定、など )
Ⅱ. 多変量解析と機械学習 ( 主成分分析、因子分析、クラスター分析、判別分析、など )
Ⅲ. 統計モデル ( 統計モデルの基礎、正規線形モデル、一般化線形モデルなど )
Ⅳ. テキストマイニング ( 計量テキスト分析、形態素解析、共起ネットワーク、多変量解析の利用、など )
Ⅴ. 人工知能とディープラーニング ( ニューラルネットワークの基本構造、ディープラーニングの理論、など )
はじめに データサイエンスの全体像と講師の略歴をお話します。
01 統計学の基礎 統計学を学ぶ上で基本となる概念を説明します。
02 中心極限定理 統計学の基礎の中で最も重要な中心極限定理について学びます。
03 仮説検定 実務でよく使う仮説検定の考え方について解説します。
04 アメリカ統計協会の声明 p値の意味と有意性検定の限界について説明します。
05 まとめ
Udemyにて配信中です
01 仮説検定の3つのポイント 仮説検定を理解して使いこなす要点を説明します。
02 仮説検定の目的 検定結果から問題解決に至る道筋を解説します。
03 仮説検定の種類と選択方法 問題に応じた最適な検定手法を選ぶ方法を学びます。
04 正規性の検定 母集団の正規性検定についての解説と演習です。
05 1サンプルの代表値の検定 検定手法4種類についての解説と演習です。
Udemyにて配信中です
第3回 仮説検定の徹底理解とp値によるリスク対策(後編)
06 2サンプルの代表値の検定 対応のあるt、2サンプルt、ウィルコクスン符号付
き順位和検定、マン-ホイットニー検定について説明します。
07 2サンプル以上の代表値の説検定 一元配置分散分析とクラスカルウォリス検定に
ついて解説します。
08 分割表の検定 カイ自乗検定について解説します。
09 仮説検定のまとめ 頻度論的統計学における仮説検定を総括します。
Udemyにて配信中です
はじめに 3つのポイント
01 ベイズ統計学の基本概念 頻度論と対比しながらベイズの世界観を説明します。
02 ベイズの定理 ベイズ統計学を支配する黄金律です。
03 ベイズ推定の原理 ベイズの証明と活用法を解説します。
04 共役分布による事後分布の推定 母数の確率分布の予測手法を解説します。
05 MCMC法の概要 母数の確率分布を乱数データで数値近似します。
06 まとめ ベイズ統計の基礎概念を総括します。
Udemyにて配信中です
Course: データサイエンス実戦講座[第4回]ベイズ統計の基礎と”量が質を凌駕する”パラレルワールド | Udemy
はじめに 3つのポイント
01 ベイズ統計の仮説検定 ベイズ統計学の仮説検定の基本原理を説明します。
02 1サンプルの平均値の検定 1サンプルの平均値検定の解説と演習です。
03 2サンプルの平均値の検定 2サンプルの平均値検定の解説と演習です。
04 2サンプル以上の平均値の検定 2サンプル以上の平均値検定の解説と演習です。
05 適合性と独立性の検定 適合性と独立性の検定の解説と演習です。
06 まとめ ベイズ統計の仮説検定の概念を総括します。
Udemyにて配信中です
はじめに 3つのポイント
01 データサイエンスの基礎から応用へ 実戦講座の基礎編と応用編の構成です。
02 機械学習の全体像を俯瞰する 機械学習の手法を網羅した全体像を把握します。
03 多変量解析とニューラルネットワークの”学習” 2つの学習プロセスの解説です。
04 データフィッティングのアルゴリズム 統計数理モデルの学習法の解説です。
05 ディープラーニングのアルゴリズム 脳神経細胞網モデルの学習法の解説です。
06 総合演習『源氏物語』作者複数説の分析 作者複数説を機械学習の手法で分析します。
07 まとめ 機械学習の全体像を総括します。
Udemyにて配信中です
はじめに 3つのポイント
01 予測モデルの体系 予測・回帰分析で使用する統計数理モデルの体系を把握します。
02 単回帰分析 説明変数が1つの単回帰モデルのアルゴリズムと応用の解説です。
03 重回帰分析 説明変数が複数の重回帰分析のアルゴリズムと応用の解説です。
04 数量化Ⅰ類 説明変数が質的変数のときのを含む予測手法の解説です。
05 一般化線形モデル 非線形の予測手法でタイタニック号の事故データを分析します。
06 まとめ 予測・回帰の総括です。
Udemyにて配信中です
Course: データサイエンス実戦講座[第7回]機械学習『予測』線形回帰から一般化線形モデルへ 演習:タイタニック号の事故データ分析 | Udemy