GitHubの宝の山!Microsoft公式の「データサイエンス10週間コース」を徹底解説


GitHubの宝の山!Microsoft公式の「データサイエンス10週間コース」を徹底解説

microsoft/Data-Science-For-Beginners

2026-01-22

準備はいいかな?それじゃあ、データサイエンスの体操、はじめるよー!イチ、ニ!イチ、ニ!

「データサイエンスって、数学ばっかりで難しそう……」って思ってるお友達! この教材はね、エンジニアにとって「最高の地図」なんだ!

「コードを書く」だけじゃない!
ただの文法解説じゃなくて、「なぜこのデータが必要なのか?」というビジネスの視点も学べるんだ。

10週間でマスター!
20個のレッスンに分かれているから、仕事が終わった後の「ちょっとした時間」でコツコツ進められるんだね。

完全無料!
これ、GitHubで公開されているから、誰でもタダで見放題!太っ腹だねぇ!

まずは、自分のパソコンにこの「宝の山」を持ってこよう! ターミナルを開いて、元気よくこの呪文(コマンド)を唱えてみて!

# リポジトリをクローン(手元にコピー)するよ!
git clone https://github.com/microsoft/Data-Science-For-Beginners.git

# 中に入ってみよう!
cd Data-Science-For-Beginners

中にはたくさんの「Jupyter Notebook(.ipynb)」が入っているんだ。 VS Codeを使っているお友達なら、拡張機能を入れるだけで、すぐにコードを動かしながらお勉強を始められるぞ!

データサイエンスの基本中の基本、Pandas(パンダス)君の登場だ! エンジニアなら、JSONやCSVを扱うのは得意だよね? Pandasはそれを「超・強力」にしたものなんだ。

レッスンの中でよく使う、データの読み込みと集計の例を見てみよう!

import pandas as pd

# 1. データを読み込むぞ!(ここではお菓子の売上データがあるとするね)
data = {
    '商品名': ['チョコ', 'クッキー', 'チョコ', 'ガム', 'クッキー'],
    '売上': [100, 150, 120, 50, 180]
}
df = pd.DataFrame(data)

# 2. 「チョコ」だけのデータを見たいな〜っていう時はこれ!
choco_sales = df[df['商品名'] == 'チョコ']
print("チョコの売上はこちら!\n", choco_sales)

# 3. 商品ごとの合計をサクッと計算!
summary = df.groupby('商品名')['売上'].sum()
print("\n商品ごとの合計だよ!\n", summary)

この教材をやり遂げると、君はこんな「スーパーエンジニア」になれるぞ!

「勘」に頼らない開発ができる! ログデータを分析して、「ユーザーはここで詰まってるんだな!」という証拠を見つけられるようになるんだ。

機械学習の基礎が身につく! 「AIって何?」という状態から、「あぁ、回帰分析のことね!」ってドヤ顔(?)できるようになるぞ。

可視化のプロになれる! グラフを使って、チームのみんなに「僕たちのアプリはこんなに成長してるよ!」って分かりやすく説明できるようになるんだ!

ふぅ〜、お疲れ様! データサイエンスは、一歩ずつ進めば怖くないんだ。 まずはリポジトリを覗いて、1日1レッスン、楽しんでみてね!

「データは友達! 怖くないよ!」

また次回、一緒に楽しく学ぼうね!バイバーイ!


microsoft/Data-Science-For-Beginners




新米エンジニアよ、AIの基礎を叩き込め!「ML-For-Beginners」で差をつけろ!

今日はな、テメーらみたいなピヨピヨの新入りでも、一丁前にAIとか機械学習とか言えるようになっちまう、とっておきのモンを紹介してやるぜ!それがこれだ、どーん!microsoft/ML-For-Beginners [python, education


電波の届かない場所でも安心!魔法少女のための音楽ダウンロード術

今回のミッションは、そんな寂しい気持ちを吹き飛ばす、素敵な魔法アイテムのお話よ!みんな、お気に入りのアニメやゲームの主題歌ってあるでしょう?CDショップに探しに行っても、なかなか見つからなかったり、全部揃えるのが大変だったりするわよね。そんなとき、私たちの秘密兵器「Spotify-downloader」の出番よ!これは、魔法の呪文を唱えるだけで、Spotifyにある音楽を、YouTubeから探してきて、宝石みたいに輝くMP3ファイルとして手に入れられる、とっても便利な魔法の道具なの。


データの謎を解く名探偵!pandas-aiで始める会話型データ分析

ソフトウェアエンジニアの皆さん、こんにちは!日々、データの海で奮闘していることと思います。ユーザーの行動分析、サービスのパフォーマンス監視、膨大なログからのエラー特定. ..。そんなとき、「このデータから、特定の期間のユーザーログイン数を教えて」「売上が一番高かった月のトップ10商品をリストアップして」といった質問に、SQLクエリを書いて、データフレームを操作して


Big Techも注目のAIパワーをセキュリティに。PentestGPTで効率化する侵入テストの最前線

今回は、サイバーセキュリティの分野で非常に注目されている、LLM(大規模言語法モデル)をペネトレーションテスト(侵入テスト)に活用したツール「PentestGPT」について解説します。Big Tech(Apple, Google, Amazonなど)が提供する最先端のAI技術を、実際の現場でどう「武器」として使うか、という視点でお話ししますね。


オフラインAWS開発を実現するLocalStack入門:サーバーレス時代のテスト戦略を革新せよ

LocalStack は、フル機能を持つローカルの AWS クラウドスタックです。つまり、Amazon Web Services (AWS) のサービス(S3、Lambda、DynamoDB、SQSなど)を、自分のPC上やCI/CD環境でオフラインで動作させることができるツールなんです。


Pythonエンジニア必見!次世代スクレイピングフレームワーク『Scrapling』完全ガイド

今日はエンジニアの姫のために、最近業界で「超イケてる」って噂のスクレイピング・フレームワーク『Scrapling』について、俺がエスコートするみたいに優しく教えてあげるよ。これを使えば、面倒なデータ収集も俺の接客くらいスマートに片付いちゃうから、しっかり見ててね。


Qlibで始めるAI投資:Gメン流データ分析と戦略構築の極意

「さて、今日の獲物…じゃなかった、今日ご紹介するツールは、巷で話題のMicrosoft Qlibだ!」(Gメン風に鋭い目つきで)「このQlib、ただのツールじゃないぜ。AIを使った投資プラットフォームで、俺たちソフトウェアエンジニアにとっても、まるで万引き犯を見つけるGメンのように、市場の怪しい動きをいち早く察知して、利益につなげるための強力な武器になるんだ!」


【エンジニア向け】RAGの常識を覆す!ストレージ97%削減のプライベート検索技術「LEANN」徹底解説

こんにちは!未来の技術を形にするソフトウェアエンジニアの皆さん、お疲れ様です。今回ご紹介するのは、まるで「どこでもドア」のように、皆さんの開発環境に革命をもたらすかもしれない、すごい道具(ライブラリ)、「LEANN」です。yichuan-wさんが開発されたこのライブラリは、皆さんが今注目している「RAG (Retrieval-Augmented Generation / 検索拡張生成)」という技術を、速く、正確に、そして何よりもプライベートに、個人のデバイスで実現するための画期的なアプローチを提供します。


NumPyで紐解く、機械学習のレシピ帳:eriklindernoren/ML-From-Scratch

五郎さん、今日は神保町で新しいプロジェクトの打ち合わせっすか? いやー、それにしても、五郎さんの目の前にあるそのGitHubリポジトリ、「eriklindernoren/ML-From-Scratch」、なんだか気になりますね。「ん?なんだか腹が減ってきたな。いや、そうじゃなくて。この『ML-From-Scratch』ってやつ、一体何なんだ?」


【ソフトウェアエンジニア向け】ルパン三世に学ぶ、最強の自動取引ボット「Freqtrade」入門

「今から、とっておきの話をしようぜ。」「ヤツらの名は Freqtrade。」「ヤツらは、フリーでオープンソースの、暗号通貨取引を自動化する最強の味方だ。まるで、手練れの金庫破りみたいに、24時間365日、眠らずに取引してくれるんだぜ。お前も、もう夜中に価格を気にする必要はない。」