【エンジニア向け】Ollama Pythonライブラリ徹底解説:ローカルLLMをアプリケーションに手軽に組み込む方法


【エンジニア向け】Ollama Pythonライブラリ徹底解説:ローカルLLMをアプリケーションに手軽に組み込む方法

ollama/ollama-python

2025-10-09

「Ollama Python library」は、ローカル環境で動作するLLM実行環境「Ollama」を、Pythonコードから簡単に操作するための公式ライブラリです。

これがエンジニアにとってどのように役立つかというと、主に以下の点があります。

統合・自動化のしやすさ

Pythonスクリプトや既存のアプリケーションにLLMの機能をシームレスに組み込むことができます。例えば、Webアプリケーションのバックエンド、データ処理パイプラインの一部、自動テストの生成などに使えます。

コマンドラインでollama runを実行するよりも、プログラム内で動的にプロンプトを変えたり、結果を後続の処理に渡したりといった自動化が格段に簡単になります。

プロトタイピングと開発コスト削減

クラウドのLLM API(有料)を使う前に、ローカルで無料のオープンソースLLM(例
Llama 3, Phi-3など)を使って、機能のプロトタイピングや検証を素早く行えます。

API利用料を気にせず、開発初期段階で何度も試行錯誤できるため、開発コストを抑えられます。

ストリーミング処理

大規模な応答を待つことなく、トークンが生成されるたびにリアルタイムで処理できるストリーミング機能を簡単に実装できます。これは、チャットアプリケーションなどでユーザー体験を向上させるために非常に重要です。

環境の統一

OllamaをDockerなどでコンテナ化すれば、開発環境と本番環境でLLMの実行環境を統一しやすくなります。

Ollama Python libraryを使うには、まずベースとなるOllama本体が動作している必要があります。

まず、Ollama公式サイトから、お使いのOS(macOS, Windows, Linux)に合ったアプリケーションをダウンロードし、インストールして起動しておきましょう。

Pythonから利用したいLLMモデルを、事前にOllamaにダウンロードしておきます。ターミナル(またはPowerShell/コマンドプロンプト)で以下のコマンドを実行します。

# 例:Llama 3をダウンロードする場合
ollama pull llama3

Ollama本体が起動し、モデルもダウンロードできたら、Python環境に公式ライブラリをpipでインストールします。

pip install ollama

これで準備完了です!

ここからは、具体的なPythonコードで、Ollama Python libraryの基本的な使い方を見ていきましょう。

最も基本的な使い方です。ユーザーのプロンプトに対してモデルに回答させます。

import ollama

# モデルに質問を投げる
response = ollama.chat(
    model='llama3',  # 使用したいモデル名(Step 2でダウンロードしたもの)
    messages=[
        {
            'role': 'user',
            'content': '猫がモチーフのプログラミング言語は何ですか?',
        },
    ],
)

# 応答内容を表示
# response['message']['content'] に回答テキストが含まれています
print("モデルの回答:")
print(response['message']['content'])

応答が大きい場合や、リアルタイム性が求められるチャットUIなどを開発する際に、ストリーミング機能を使うと便利です。

import ollama
import sys

# stream=True を指定すると、応答がジェネレーターとして返されます
stream = ollama.chat(
    model='llama3',
    messages=[
        {
            'role': 'user',
            'content': 'ソフトウェアエンジニアの生産性を高めるためのアイデアを5つ、箇条書きで提案してください。',
        },
    ],
    stream=True  # ストリーミングを有効化
)

print("モデルの回答(ストリーミング):")
for chunk in stream:
    # チャンクごとにテキストを取得して表示
    if chunk['message']['content'] is not None:
        print(chunk['message']['content'], end='', flush=True)

# 最後に改行
print()

messagesリストに、過去のやり取り(role: userrole: assistant)を追加していくことで、文脈を理解した会話を継続させることができます。

import ollama

# 過去の会話履歴をリストで保持
messages_history = [
    {
        'role': 'user',
        'content': '私が好きな動物は、忠実で賢い犬です。',
    },
]

# 1回目の応答
response1 = ollama.chat(
    model='llama3',
    messages=messages_history
)
print(f"モデル1回目の応答: {response1['message']['content']}\n")

# 1回目の応答を履歴に追加(モデルからの応答は 'assistant' ロール)
messages_history.append(response1['message'])

# 2回目の質問 (文脈依存)
messages_history.append({
    'role': 'user',
    'content': 'その動物を飼う上での一般的な注意点を3つ教えてください。'
})

# 2回目の応答(履歴全体を渡す)
response2 = ollama.chat(
    model='llama3',
    messages=messages_history
)
print(f"モデル2回目の応答: {response2['message']['content']}")

現在ローカルで利用可能なモデルの一覧を取得したい場合は、list()関数を使います。

import ollama

# ローカルにインストールされているモデルの一覧を取得
models = ollama.list()

print("ローカルにインストールされているモデル:")
for model in models['models']:
    print(f"- {model['name']} (サイズ: {round(model['size'] / (1024**3), 2)} GB)")

ollama/ollama-python




キャンプでコント:LLMオーケストレーションの苦労を解消する strans-agents/sdk-python 入門

皆さん、キャンプに来ています!テントを立てるのも、火を起こすのも、楽しいけれど結構手間がかかりますよね。AIエージェントを作るのも同じなんです。モデルを選んで、プロンプトを書いて、ツールを組み合わせて. ..「あー、またエラーだ. ..」となりがち。


多言語・感情制御も自由自在!CosyVoiceという最強の武器をシステムに組み込む方法

いいか、親分(エンジニア)の視点から、この「シマ」をどう仕切るか、ビシッと解説してやるよ。簡単に言うと、「誰の声でも、どんな言語でも、感情たっぷりに喋らせる」ための最強の道具だ。多言語対応(マルチリンガル) 日本語はもちろん、英語、中国語、韓国語……多国籍な組織でも困らねぇ。


現場のボスになれ!Pythonで操る「InvenTree」在庫管理システム

お前、現場で部品や資材の管理、マジで大変だろ?Excelファイルとにらめっこしたり、棚卸しで汗だくになったり…。そんな泥臭い作業とは今日でおさらばだ!この「InvenTree」、一言で言うと「現場の在庫管理システムを最強にするオープンソースのツール」ってわけだ。


あなたのサービス品質向上に貢献:qeeqbox/social-analyzer導入とAPI連携の具体例

このツールは、指定されたユーザー名が、1000以上のソーシャルメディアやウェブサイトで利用されているかどうかを、効率的かつ広範囲にわたって調査・分析するためのものです。Node. js、JavaScript、Pythonに対応しており、API、CLI(コマンドラインインターフェース)、そしてウェブアプリとして利用できます。


爆速&美しく。Typstベースの rendercv で職務経歴書更新の「クレーンゲーム」を完全攻略

エンジニアにとって、職務経歴書(CV)の更新は、景品口ギリギリにある大きなぬいぐるみ(=内定)を狙うようなものです。rendercv は、その景品を確実に仕留めるための「最強のアーム」になってくれます。普通のクレーンゲーム(Wordやデザインツールでの作成)は、見た目を整えるのに苦労して、肝心の中身がズレたり、PDFにしたらレイアウトが崩れたりしますよね。


GhostTrackで学ぶサイバーセキュリティ

GhostTrackは、電話番号やIPアドレスなど公開されている情報から、地理的な位置や関連情報を特定するためのツールです。ソフトウェアエンジニアの視点から見ると、これは単なるトラッキングツールではなく、以下の点で非常に有用です。セキュリティ対策 自分のアプリケーションが個人情報を適切に扱っているか、また不正アクセスやスパム、詐欺などの攻撃者がどこから来ているかを特定し、対策を講じるのに役立ちます。例えば、特定の国のIPアドレスからのアクセスをブロックするといったセキュリティルールを実装する際の参考にできます。


エンジニア必見!数式OCRの決定版「pix2tex」でドキュメント作成を爆速化

今日は特にソフトウェアエンジニアの皆様にとって、「数式を画像からLaTeXコードに変換する」という、ちょっと雲行きが怪しい作業を一気に晴れにする、素晴らしい技術の「pix2tex」をご紹介します!「はぁ~、またこの資料の数式をLaTeXで打ち直しかぁ。積分記号


【ソフトウェアエンジニア向け】FastAPIとReactを即座に動かす魔法のテンプレート

先輩おい、新人!新しいプロジェクト、明日から始めろってさ。新人え、明日からですか!?先輩そう。フロントエンドはReact、バックエンドはFastAPI、データベースはPostgreSQLだって。Dockerコンテナで動かして、GitHub Actionsで自動デプロイも組んどけ。しかも本番環境はSSL証明書がいるからLet's Encryptで自動化しろってさ。


CursorやLangChainを使いこなせ!エンジニアの価値を最大化するAI活用ロードマップ

今日は、中国のスーパーエンジニア「魚皮(Yupi)」さんが公開している最強のAIリソース集 「liyupi/ai-guide」 について解説しちゃうわね。「AIが多すぎて何から手をつければいいの!?」ってパニックになってるそこの君、落ち着いて。このリソースは、エンジニアにとっての「宝の地図」みたいなものなんだから!


【戦隊ヒーロー俺参上!】ソーシャルメディア探偵ツール『sherlock』徹底解説!

ナレーション とある薄暗いサーバー室。キーボードを叩く音だけが響く中、一人のソフトウェアエンジニアが唸っていた。彼の名は「お前さん」。いま、彼には解き明かさねばならない、とある謎があったのだ!お前さん 「くっ……このユーザー名、『影のハッカーK』か……。奴め、一体どのソーシャルメディアに潜んでいるんだ!? 手動で一つ一つ調べるなんて、時間がいくらあっても足りないぞ!」