Docs: Switch to o3 model; exclude translated pages from search (#533 )

This pull request introduces the following changes:
1. **Exclude translated pages from search**: I explored ways to make the
search plugin work with the i18n plugin, but it would require extensive
custom JavaScript hacks. So for now, I’m holding off on this work.
2. **Switch from GPT-4.1 to o3 for even better translation quality**:
While 4.1 performs well, o3 shows even greater quality for this task,
and there’s no reason to avoid using it.

2025-04-16 21:29:09 -04:00

5 KiB

Raw Blame History

exclude
true

コンテキスト管理

コンテキストという言葉には複数の意味があります。ここでは主に 2 つのコンテキストについて説明します。

コード内でローカルに利用できるコンテキスト: ツール関数の実行時や on_handoff などのコールバック、ライフサイクルフックで必要となるデータや依存関係です。
LLM が参照できるコンテキスト: LLM がレスポンスを生成する際に見えるデータです。

ローカルコンテキスト

ローカルコンテキストは [RunContextWrapper][agents.run_context.RunContextWrapper] クラスと、その中の [context][agents.run_context.RunContextWrapper.context] プロパティで表現されます。仕組みは次のとおりです。

任意の Python オブジェクトを作成します。一般的なパターンとして dataclass や Pydantic オブジェクトを使用します。
そのオブジェクトを各種 run メソッド（例: Runner.run(..., **context=whatever** )）に渡します。
すべてのツール呼び出しやライフサイクルフックには、ラッパーオブジェクト RunContextWrapper[T] が渡されます。ここで T はコンテキストオブジェクトの型で、wrapper.context からアクセスできます。

最重要ポイント: あるエージェントの実行において、エージェント・ツール関数・ライフサイクルフックなどはすべて同じ型のコンテキストを使用しなければなりません。

コンテキストでは次のような用途が考えられます。

実行に関するデータ（例: ユーザー名 / uid やその他のユーザー情報）
依存オブジェクト（例: ロガー、データフェッチャーなど）
ヘルパー関数

!!! danger "Note"

コンテキストオブジェクトは LLM には送信されません。あくまでローカルのオブジェクトであり、読み書きやメソッド呼び出しが可能です。

import asyncio
from dataclasses import dataclass

from agents import Agent, RunContextWrapper, Runner, function_tool

@dataclass
class UserInfo:  # (1)!
    name: str
    uid: int

@function_tool
async def fetch_user_age(wrapper: RunContextWrapper[UserInfo]) -> str:  # (2)!
    return f"User {wrapper.context.name} is 47 years old"

async def main():
    user_info = UserInfo(name="John", uid=123)

    agent = Agent[UserInfo](  # (3)!
        name="Assistant",
        tools=[fetch_user_age],
    )

    result = await Runner.run(  # (4)!
        starting_agent=agent,
        input="What is the age of the user?",
        context=user_info,
    )

    print(result.final_output)  # (5)!
    # The user John is 47 years old.

if __name__ == "__main__":
    asyncio.run(main())

これがコンテキストオブジェクトです。ここでは dataclass を使っていますが、任意の型を使用できます。
これはツールです。RunContextWrapper[UserInfo] を受け取り、実装内でコンテキストを参照しています。
エージェントにジェネリック UserInfo を付与することで、型チェッカーが誤りを検出できます（たとえば別のコンテキスト型を受け取るツールを渡した場合など）。
run 関数にコンテキストを渡します。
エージェントはツールを正しく呼び出し、年齢を取得します。

エージェント / LLM コンテキスト

LLM が呼び出されるとき、LLM が参照できるデータは会話履歴に含まれるものだけです。したがって、新しいデータを LLM に渡したい場合は、そのデータを履歴に含める形で提供する必要があります。方法はいくつかあります。

Agent の instructions に追加する。いわゆる「system prompt」や「developer message」と呼ばれるものです。システムプロンプトは静的な文字列でも、コンテキストを受け取って文字列を返す動的な関数でも構いません。ユーザー名や現在の日付など、常に有用な情報を渡す際によく使われます。
Runner.run 呼び出し時の input に追加する。instructions と似ていますが、chain of command の下位レイヤーにメッセージを配置できます。
関数ツール経由で公開する。オンデマンドで取得するコンテキストに適しており、LLM が必要に応じてツールを呼び出してデータを取得します。
retrieval や web search を使う。これらは特別なツールで、ファイルやデータベースから関連データを取得する（retrieval）、もしくは Web から取得する（web search）ことができます。レスポンスを関連コンテキストで「グラウンディング」するのに有効です。

5 KiB Raw Blame History Unescape Escape

コンテキスト管理

ローカルコンテキスト

エージェント / LLM コンテキスト

5 KiB

Raw Blame History