【エンジニア向け】Ollama Pythonライブラリ徹底解説:ローカルLLMをアプリケーションに手軽に組み込む方法


【エンジニア向け】Ollama Pythonライブラリ徹底解説:ローカルLLMをアプリケーションに手軽に組み込む方法

ollama/ollama-python

2025-10-09

「Ollama Python library」は、ローカル環境で動作するLLM実行環境「Ollama」を、Pythonコードから簡単に操作するための公式ライブラリです。

これがエンジニアにとってどのように役立つかというと、主に以下の点があります。

統合・自動化のしやすさ

Pythonスクリプトや既存のアプリケーションにLLMの機能をシームレスに組み込むことができます。例えば、Webアプリケーションのバックエンド、データ処理パイプラインの一部、自動テストの生成などに使えます。

コマンドラインでollama runを実行するよりも、プログラム内で動的にプロンプトを変えたり、結果を後続の処理に渡したりといった自動化が格段に簡単になります。

プロトタイピングと開発コスト削減

クラウドのLLM API(有料)を使う前に、ローカルで無料のオープンソースLLM(例
Llama 3, Phi-3など)を使って、機能のプロトタイピングや検証を素早く行えます。

API利用料を気にせず、開発初期段階で何度も試行錯誤できるため、開発コストを抑えられます。

ストリーミング処理

大規模な応答を待つことなく、トークンが生成されるたびにリアルタイムで処理できるストリーミング機能を簡単に実装できます。これは、チャットアプリケーションなどでユーザー体験を向上させるために非常に重要です。

環境の統一

OllamaをDockerなどでコンテナ化すれば、開発環境と本番環境でLLMの実行環境を統一しやすくなります。

Ollama Python libraryを使うには、まずベースとなるOllama本体が動作している必要があります。

まず、Ollama公式サイトから、お使いのOS(macOS, Windows, Linux)に合ったアプリケーションをダウンロードし、インストールして起動しておきましょう。

Pythonから利用したいLLMモデルを、事前にOllamaにダウンロードしておきます。ターミナル(またはPowerShell/コマンドプロンプト)で以下のコマンドを実行します。

# 例:Llama 3をダウンロードする場合
ollama pull llama3

Ollama本体が起動し、モデルもダウンロードできたら、Python環境に公式ライブラリをpipでインストールします。

pip install ollama

これで準備完了です!

ここからは、具体的なPythonコードで、Ollama Python libraryの基本的な使い方を見ていきましょう。

最も基本的な使い方です。ユーザーのプロンプトに対してモデルに回答させます。

import ollama

# モデルに質問を投げる
response = ollama.chat(
    model='llama3',  # 使用したいモデル名(Step 2でダウンロードしたもの)
    messages=[
        {
            'role': 'user',
            'content': '猫がモチーフのプログラミング言語は何ですか?',
        },
    ],
)

# 応答内容を表示
# response['message']['content'] に回答テキストが含まれています
print("モデルの回答:")
print(response['message']['content'])

応答が大きい場合や、リアルタイム性が求められるチャットUIなどを開発する際に、ストリーミング機能を使うと便利です。

import ollama
import sys

# stream=True を指定すると、応答がジェネレーターとして返されます
stream = ollama.chat(
    model='llama3',
    messages=[
        {
            'role': 'user',
            'content': 'ソフトウェアエンジニアの生産性を高めるためのアイデアを5つ、箇条書きで提案してください。',
        },
    ],
    stream=True  # ストリーミングを有効化
)

print("モデルの回答(ストリーミング):")
for chunk in stream:
    # チャンクごとにテキストを取得して表示
    if chunk['message']['content'] is not None:
        print(chunk['message']['content'], end='', flush=True)

# 最後に改行
print()

messagesリストに、過去のやり取り(role: userrole: assistant)を追加していくことで、文脈を理解した会話を継続させることができます。

import ollama

# 過去の会話履歴をリストで保持
messages_history = [
    {
        'role': 'user',
        'content': '私が好きな動物は、忠実で賢い犬です。',
    },
]

# 1回目の応答
response1 = ollama.chat(
    model='llama3',
    messages=messages_history
)
print(f"モデル1回目の応答: {response1['message']['content']}\n")

# 1回目の応答を履歴に追加(モデルからの応答は 'assistant' ロール)
messages_history.append(response1['message'])

# 2回目の質問 (文脈依存)
messages_history.append({
    'role': 'user',
    'content': 'その動物を飼う上での一般的な注意点を3つ教えてください。'
})

# 2回目の応答(履歴全体を渡す)
response2 = ollama.chat(
    model='llama3',
    messages=messages_history
)
print(f"モデル2回目の応答: {response2['message']['content']}")

現在ローカルで利用可能なモデルの一覧を取得したい場合は、list()関数を使います。

import ollama

# ローカルにインストールされているモデルの一覧を取得
models = ollama.list()

print("ローカルにインストールされているモデル:")
for model in models['models']:
    print(f"- {model['name']} (サイズ: {round(model['size'] / (1024**3), 2)} GB)")

ollama/ollama-python




ハルシネーションを許さない。LangExtractで実現する根拠(ソース)付きの情報抽出の実践

「彼女の下着は何色?」という、一歩間違えれば通報案件の問いを、LangExtractがどう鮮やかに(かつ紳士的に)解決するのか……。コント仕立てのサンプルコードと一緒に見ていきましょう!一言でいうと、「LLMを使って、超高精度かつ『証拠付き』でテキストを構造化データ(JSON等)にするライブラリ」です。


PythonでAzureを料理する:SDKで始めるクラウド開発

このSDKは、Pythonのコードから直接Azureの様々なサービス(仮想マシン、ストレージ、データベースなど)を操作するためのライブラリ群です。まるで、ラーメンの具材(Azureのサービス)を自在に操るための、最高の調理器具セットのようなものです。


【体験談】roboflow/supervisionが私のCVプロジェクトを変えた話

こんにちは!今回は、コンピュータービジョンのプロジェクトに取り組むソフトウェアエンジニアの皆さんにとって、まさに「痒い所に手が届く」ツールであるroboflow/supervisionについて、その魅力と使い方をたっぷりご紹介します。まるで、これまでバラバラだったパーツをピタッとつなぎ合わせてくれる接着剤のような存在で、開発効率がぐんとアップすること間違いなしですよ!


AIアプリケーション開発のためのレシピブック

今日は「Haystack」という、AIの世界で最近話題の新しいカクテルを紹介させてください。これ、ただのAIじゃなくて、色々なAIの材料を組み合わせて、お客様の好みにぴったりの一杯を作り出すためのツールなんです。ソフトウェアエンジニアの視点から言えば、Haystackは例えるなら「AIアプリケーション開発のためのシェイカーとレシピブック」です。


モダンAIスタックの結晶:MoneyPrinterV2を活用した自動化パイプライン構築術

今回、我々が調査する伝説の秘宝は、GitHubに眠る FujiwaraChoki/MoneyPrinterV2 だ。名前からして「お金を刷る機械」なんて、ワクワクするじゃないか?さあ、松明を掲げて、エンジニアの視点からこのツールの正体を暴いていこう!


あなたのサービス品質向上に貢献:qeeqbox/social-analyzer導入とAPI連携の具体例

このツールは、指定されたユーザー名が、1000以上のソーシャルメディアやウェブサイトで利用されているかどうかを、効率的かつ広範囲にわたって調査・分析するためのものです。Node. js、JavaScript、Pythonに対応しており、API、CLI(コマンドラインインターフェース)、そしてウェブアプリとして利用できます。


コードでオーディオブックを作る方法 - 「santinic/audiblez」を使った自動化解説

「santinic/audiblez」は、ソフトウェアエンジニアにとって、特に以下のような点で非常に役に立ちます。音声データ生成の自動化音声データの生成は、手動で行うと非常に手間がかかります。このツールを使えば、既存のEPUBファイルから一括でオーディオブックを生成でき、作業時間を大幅に削減できます。


GitHubの宝の山!Microsoft公式の「データサイエンス10週間コース」を徹底解説

準備はいいかな?それじゃあ、データサイエンスの体操、はじめるよー!イチ、ニ!イチ、ニ!「データサイエンスって、数学ばっかりで難しそう……」って思ってるお友達! この教材はね、エンジニアにとって「最高の地図」なんだ!「コードを書く」だけじゃない!ただの文法解説じゃなくて、「なぜこのデータが必要なのか?」というビジネスの視点も学べるんだ。


『LLMs-from-scratch』徹底解説:プログラマーのためのAI自作ガイド

勇者よ、お前が探求しているのは、この世界に古くから伝わる「賢者の石」ならぬ、「賢者の知恵」を創り出す秘術だ。それは、まるでハイラル王国の歴史書のように、あらゆる知識を理解し、お前に語りかけるだろう。今日、お前と共に旅するのは、その賢者の知恵を「ゼロ」から生み出すための魔法書、『rasbt/LLMs-from-scratch』だ。


Pythonエンジニア必見!次世代スクレイピングフレームワーク『Scrapling』完全ガイド

今日はエンジニアの姫のために、最近業界で「超イケてる」って噂のスクレイピング・フレームワーク『Scrapling』について、俺がエスコートするみたいに優しく教えてあげるよ。これを使えば、面倒なデータ収集も俺の接客くらいスマートに片付いちゃうから、しっかり見ててね。