Peekaboo:AIエージェントのためのmacOSスクリーンショット・インターフェース


Peekaboo:AIエージェントのためのmacOSスクリーンショット・インターフェース

steipete/Peekaboo

2026-02-03

本日のテーマは、macOSエンジニアやAI開発者の間で今アツい視線を浴びているツール、「Peekaboo」(ピーカブー)です!

「AIに自分の画面を見せて、指示通りに操作してもらいたい…」そんな願いを叶えるこのツールの正体を、エンジニア視点で紐解いていきましょう。

答え
AIに「目」を授ける、macOS専用のスクリーンショット制御ツールです!

通常のスクリーンショットと違うのは、CLI(コマンドライン)やMCP(Model Context Protocol)として動作する点。つまり、人間が「カシャッ」と撮るのではなく、プログラムやAIエージェントが自律的に「今の画面の状態」を把握するために設計されています。

MCPサーバー対応
Claude DesktopなどのAIエージェントにそのまま組み込めます。

VQA(視覚応答)連携
画像を撮るだけでなく、ローカル(Ollamaなど)やクラウドのAIに「この画面に何が映ってる?」と解析させるところまで一気に自動化できます。

特定アプリ狙い撃ち
システム全体だけでなく、特定のウィンドウだけをターゲットにできます。

答え
Swift製なので、ビルドしてパスを通すだけ!

まずは、お使いのマシンに Xcode が入っていることを確認してくださいね。

リポジトリをクローン

git clone https://github.com/steipete/Peekaboo.git
cd Peekaboo

ビルド

swift build -c release

実行ファイルの配置
ビルドされたバイナリ(.build/release/peekaboo)を /usr/local/bin などに移動させれば、どこからでも peekaboo コマンドが叩けるようになります。

答え
CLIから叩くのも良し、エージェントに任せるも良し!

peekaboo capture --path ./screenshot.png

ここがPeekabooの真骨頂!例えば「今のブラウザに何が映ってる?」とAIに聞く場合

peekaboo vqa --prompt "この画面に表示されているエラーメッセージを書き出して" --model gpt-4o

Claude Desktopの config.json に以下のように追記すれば、AIがあなたの画面を自由に「見る」ことができるようになります。

{
  "mcpServers": {
    "peekaboo": {
      "command": "path/to/peekaboo",
      "args": ["mcp"]
    }
  }
}

答え
GUI操作の自動化(RPA)が、AIによって劇的に簡単になるからです!

これまでは、画面上のボタンの位置(座標)をプログラムに教える必要がありました。しかし、Peekabooがあれば

AIがPeekaboo経由で画面を見る。

AIが「あ、右上に送信ボタンがあるな」と判断する。

AIが次のアクションを決定する。

という、より人間に近い自律的なワークフローが組めるようになるんです。まさにAIエージェント時代の「必須アイテム」と言えますね!

いかがでしたか?Peekabooを使えば、あなたのmacOSライフがもっと自動化されること間違いなしです!


steipete/Peekaboo




SDWebImage:iOS開発を加速させる非同期画像処理の「高速補給船」

ソフトウェアエンジニアの視点から、このライブラリがどれほど強力で、あなたの開発をスムーズにするのかを、宇宙飛行士のように冷静かつ情熱的に解説しますね!SDWebImageは、iOS/macOSなどのAppleプラットフォームで、インターネット上の画像を扱う際に、開発者が面倒を見るべき多くのタスクを肩代わりしてくれる超強力な画像処理ライブラリです。


ごちゃごちゃメニューバーはもう卒業!macOSエンジニアのための「Ice」徹底解説

Jordan Baird/Ice は、macOSのメニューバーを管理するための強力なツールです。たくさんのアプリをインストールしていると、メニューバーのアイコンが増えすぎて見にくくなりがちですよね。そんな時にIceが活躍します。まるで魔法のように、メニューバーをスッキリと整理し、必要な時だけアイコンを表示させることができます。


RPAの次世代形:trycua/cuaが提供する安全なデスクトップAIエージェントインフラストラクチャ

今回は、GitHubで注目を集めているプロジェクト「trycua/cua」(読み方クーア、とされています)について、ソフトウェアエンジニアの視点から、その魅力と活用法をわかりやすく解説しますね。trycua/cuaは、「Computer-Use Agents(コンピューター利用エージェント)」のためのオープンソースのインフラストラクチャです。簡単に言えば、AIエージェントがWindows、macOS、LinuxといったデスクトップOS全体を制御できるようにするためのサンドボックス、SDK(開発キット)、評価ツールを提供しています。


PowerShell: ソフトウェアエンジニアのための吉野家流自動化術

「大将!牛丼大盛り!」って、元気よく注文するでしょう?あれ、厨房の奥では熟練の職人さんたちが、手際よく肉や玉ねぎをさばいてる。PowerShellは、まるであの敏腕シェフなんです。普段、私たちはマウスでポチポチとメニューを選びます。それがGUI(Graphical User Interface)。 でも、PowerShellという「呪文」を唱えれば、キーボードだけで、もっと素早く、もっと大量の作業を一気に片付けられます。Windowsだけでなく、macOSやLinuxでも使えるようになって、まさに「吉野家の味を、世界のどこでも!」ってなわけです。


macOSエンジニア必見!厳選アプリリスト「awesome-mac」の活用術

jaywcjlove/awesome-macは、ソフトウェア開発者、特にmacOSを使用するエンジニアにとって非常に役立つ、厳選されたアプリケーションとツールのリストです。プロジェクトのGitHubリポジトリにホストされており、ソフトウェア開発に必要な様々なカテゴリのツールが網羅的にまとめられています。


Web技術とネイティブアプリの融合:WebKit入門

WebKitは、Appleが開発したWebブラウザのレンダリングエンジンです。簡単に言うと、Webページを画面に表示するための、ブラウザの心臓部にあたるソフトウェアですね。みなさんが普段使っているSafariや、iPhone/iPadのアプリ内でWebページを表示する機能は、すべてこのWebKitが動かしています。


高速開発の秘密兵器: ホットリロードでFlutterアプリを爆速構築

Flutter(フラッター)は、モバイルアプリはもちろんのこと、デスクトップやウェブまで、一つのコードベースから複数のプラットフォームに対応する美しいアプリを素早く構築できるUIツールキットです。ソフトウェア開発者であるあなたにとって、Flutterはまさに「万能の道具箱」のような存在です。


コントで学ぶPS4エミュレータ:ソフトウェアエンジニア的視点での活用法と導入ガイド

「え、エミュレータ?」って思った方もいるかもしれませんね。そうです、PS4のゲームをPCで動かすためのソフトウェアです。でも、今回は単にエミュレータの説明をするだけではありません。これを「万引きGメン」のコントに見立てて、その特徴や使い方、そしてソフトウェアエンジニアとしての視点から「どう役に立つのか」を、楽しく、そして分かりやすく解説していきましょう!


モビルスーツ級の高性能!k2-fsa/sherpa-onnx徹底解剖と実戦導入ガイド

「連邦の白いヤツ」...ではなく、ソフトウェアエンジニアの皆さん!今回は、オフラインでの音声処理を強力にサポートするライブラリ k2-fsa/sherpa-onnx について、その能力と活用法を、さながらモビルスーツの機能解説のように、分かりやすく、フレンドリーに解説していきます!


Hackintosh構築の救世主 OpCore-Simplifyでエラーをゼロに:Pythonスクリプトによる自動生成の裏側

はい、どうも!お疲れ様です!カンパーイ! いや〜、あの「OpCore-Simplify」ってやつ、コントみたいにややこしい「Hackintosh(ハッキントッシュ)」の世界をスッキリさせてくれる、エンジニアから見ても超助かるツールなんですよ!