GitHubの宝の山!Microsoft公式の「データサイエンス10週間コース」を徹底解説


GitHubの宝の山!Microsoft公式の「データサイエンス10週間コース」を徹底解説

microsoft/Data-Science-For-Beginners

2026-01-22

準備はいいかな?それじゃあ、データサイエンスの体操、はじめるよー!イチ、ニ!イチ、ニ!

「データサイエンスって、数学ばっかりで難しそう……」って思ってるお友達! この教材はね、エンジニアにとって「最高の地図」なんだ!

「コードを書く」だけじゃない!
ただの文法解説じゃなくて、「なぜこのデータが必要なのか?」というビジネスの視点も学べるんだ。

10週間でマスター!
20個のレッスンに分かれているから、仕事が終わった後の「ちょっとした時間」でコツコツ進められるんだね。

完全無料!
これ、GitHubで公開されているから、誰でもタダで見放題!太っ腹だねぇ!

まずは、自分のパソコンにこの「宝の山」を持ってこよう! ターミナルを開いて、元気よくこの呪文(コマンド)を唱えてみて!

# リポジトリをクローン(手元にコピー)するよ!
git clone https://github.com/microsoft/Data-Science-For-Beginners.git

# 中に入ってみよう!
cd Data-Science-For-Beginners

中にはたくさんの「Jupyter Notebook(.ipynb)」が入っているんだ。 VS Codeを使っているお友達なら、拡張機能を入れるだけで、すぐにコードを動かしながらお勉強を始められるぞ!

データサイエンスの基本中の基本、Pandas(パンダス)君の登場だ! エンジニアなら、JSONやCSVを扱うのは得意だよね? Pandasはそれを「超・強力」にしたものなんだ。

レッスンの中でよく使う、データの読み込みと集計の例を見てみよう!

import pandas as pd

# 1. データを読み込むぞ!(ここではお菓子の売上データがあるとするね)
data = {
    '商品名': ['チョコ', 'クッキー', 'チョコ', 'ガム', 'クッキー'],
    '売上': [100, 150, 120, 50, 180]
}
df = pd.DataFrame(data)

# 2. 「チョコ」だけのデータを見たいな〜っていう時はこれ!
choco_sales = df[df['商品名'] == 'チョコ']
print("チョコの売上はこちら!\n", choco_sales)

# 3. 商品ごとの合計をサクッと計算!
summary = df.groupby('商品名')['売上'].sum()
print("\n商品ごとの合計だよ!\n", summary)

この教材をやり遂げると、君はこんな「スーパーエンジニア」になれるぞ!

「勘」に頼らない開発ができる! ログデータを分析して、「ユーザーはここで詰まってるんだな!」という証拠を見つけられるようになるんだ。

機械学習の基礎が身につく! 「AIって何?」という状態から、「あぁ、回帰分析のことね!」ってドヤ顔(?)できるようになるぞ。

可視化のプロになれる! グラフを使って、チームのみんなに「僕たちのアプリはこんなに成長してるよ!」って分かりやすく説明できるようになるんだ!

ふぅ〜、お疲れ様! データサイエンスは、一歩ずつ進めば怖くないんだ。 まずはリポジトリを覗いて、1日1レッスン、楽しんでみてね!

「データは友達! 怖くないよ!」

また次回、一緒に楽しく学ぼうね!バイバーイ!


microsoft/Data-Science-For-Beginners




新米エンジニアよ、AIの基礎を叩き込め!「ML-For-Beginners」で差をつけろ!

今日はな、テメーらみたいなピヨピヨの新入りでも、一丁前にAIとか機械学習とか言えるようになっちまう、とっておきのモンを紹介してやるぜ!それがこれだ、どーん!microsoft/ML-For-Beginners [python, education


ソフトウェアエンジニアのためのFrappe/ERPNext徹底解説:酒の飲み比べで学ぶ導入と活用

皆さん、こんにちは!ソフトウェアエンジニアとして日々コードと格闘されている皆さん、お疲れ様です!今回は、ビジネスの世界でよく耳にする「ERP」という言葉と、それを実現する素晴らしいフレームワーク「Frappe」、そしてその上に構築された「ERPNext」について、まるで日本酒の銘柄をじっくり味わうように、その魅力と使い方を深掘りしていきましょう!


キャンプでコント:LLMオーケストレーションの苦労を解消する strans-agents/sdk-python 入門

皆さん、キャンプに来ています!テントを立てるのも、火を起こすのも、楽しいけれど結構手間がかかりますよね。AIエージェントを作るのも同じなんです。モデルを選んで、プロンプトを書いて、ツールを組み合わせて. ..「あー、またエラーだ. ..」となりがち。


【エンジニア向け】OpenBB Financeで始めるデータ駆動型投資の冒険

夜が更け、モニターの光だけが部屋を照らす。あなたは今日もバグと格闘し、新しい技術を追い求めている。そんなあなたの前に現れたのは、謎めいたパッケージ「OpenBB Finance」。「投資調査を、誰もが、どこでも。」その言葉が示すのは、単なるライブラリではない。それは、複雑な金融の世界を解き明かすための、強力な武器となる予感だった。


PythonでAzureを料理する:SDKで始めるクラウド開発

このSDKは、Pythonのコードから直接Azureの様々なサービス(仮想マシン、ストレージ、データベースなど)を操作するためのライブラリ群です。まるで、ラーメンの具材(Azureのサービス)を自在に操るための、最高の調理器具セットのようなものです。


【エンジニア向け】RAGの常識を覆す!ストレージ97%削減のプライベート検索技術「LEANN」徹底解説

こんにちは!未来の技術を形にするソフトウェアエンジニアの皆さん、お疲れ様です。今回ご紹介するのは、まるで「どこでもドア」のように、皆さんの開発環境に革命をもたらすかもしれない、すごい道具(ライブラリ)、「LEANN」です。yichuan-wさんが開発されたこのライブラリは、皆さんが今注目している「RAG (Retrieval-Augmented Generation / 検索拡張生成)」という技術を、速く、正確に、そして何よりもプライベートに、個人のデバイスで実現するための画期的なアプローチを提供します。


「彼女の下着は何色?」という問いにAIが即答できる理由 — CocoIndexによる動的データ処理

「彼女の下着は何色?」という、一見すると AI が答えに窮しそうな(あるいはプライバシーや文脈に依存する)「特定の、移り変わる、あるいは非常に個人的なデータ」を扱う場面で、なぜこのツールが最強の味方になるのか、という切り口でお話しします。一言でいうと、「情報の更新(増分更新)に特化した、爆速の AI データ整理棚」です。


リンクも驚く情報収集術!Maigretで広がるエンジニアの視野

ハイラルを旅する勇敢なソフトウェアエンジニアの皆さん、ごきげんよう!今日は、まるでゼルダの伝説の壮大な冒険のように、私たちエンジニアが「情報収集」という試練に立ち向かうための、素晴らしい魔法のアイテムをご紹介しましょう。その名も「soxoj/maigret」!


ソフトウェアエンジニアのためのtheHarvester入門: セキュリティとOSINT活用法

今日はlaramies/theHarvesterについて、ソフトウェアエンジニアの皆さんに役立つ情報をお届けしますね!theHarvesterは、まるで雲の中から雨粒を探すように、インターネットの広大な情報の中から、メールアドレスやサブドメインといった貴重な情報を収集してくれる、とっても賢いツールなんです


ACL 2025発表の「Dolphin」がエンジニアにもたらす変革

おいおい、今日のバーベキュー、最高の肉が手に入ったぜ! あ、〇〇ちゃん、今日もお肉焼くの上手だね!「いやぁ、そんなことないっすよ。この網の熱を均一にする技術、まるでドキュメントのレイアウトを完璧に読み取るAIみたいじゃないですか!」え?なんだって?