This pull request improves the translation pipeline, which was introduced by #460. Now the document generation works pretty well with gpt-4o model.
9.9 KiB
トレーシング
Agents SDK には組み込みのトレーシング機能があり、エージェント実行中のイベント(LLM の生成、ツール呼び出し、ハンドオフ、ガードレール、カスタムイベントなど)の包括的な記録を収集します。Traces ダッシュボードを使用して、開発中および本番環境でワークフローをデバッグ、可視化、監視できます。
!!!note
トレーシングはデフォルトで有効です。トレーシングを無効にする方法は2つあります:
1. 環境変数 `OPENAI_AGENTS_DISABLE_TRACING=1` を設定して、グローバルにトレーシングを無効にすることができます。
2. [`agents.run.RunConfig.tracing_disabled`][] を `True` に設定して、単一の実行でトレーシングを無効にすることができます。
OpenAI の API を使用している Zero Data Retention (ZDR) ポリシーの下で運営されている組織では、トレーシングは利用できません。
トレースとスパン
- トレース は「ワークフロー」の単一のエンドツーエンドの操作を表します。スパンで構成されています。トレースには以下のプロパティがあります:
workflow_name: 論理的なワークフローまたはアプリです。例: "Code generation" や "Customer service"。trace_id: トレースの一意の ID。指定しない場合は自動生成されます。形式はtrace_<32_alphanumeric>でなければなりません。group_id: 同じ会話からの複数のトレースをリンクするためのオプションのグループ ID。例: チャットスレッド ID。disabled: True の場合、トレースは記録されません。metadata: トレースのオプションのメタデータ。
- スパン は開始時間と終了時間を持つ操作を表します。スパンには以下があります:
started_atとended_atのタイムスタンプ。- 所属するトレースを表す
trace_id - 親スパンを指す
parent_id(ある場合) - スパンに関する情報を含む
span_data。例:AgentSpanDataはエージェントに関する情報を含み、GenerationSpanDataは LLM の生成に関する情報を含みます。
デフォルトのトレーシング
デフォルトで、SDK は以下をトレースします:
Runner.{run, run_sync, run_streamed}()全体がtrace()でラップされます。- エージェントが実行されるたびに、
agent_span()でラップされます。 - LLM の生成は
generation_span()でラップされます。 - 関数ツールの呼び出しはそれぞれ
function_span()でラップされます。 - ガードレールは
guardrail_span()でラップされます。 - ハンドオフは
handoff_span()でラップされます。 - 音声入力(音声からテキスト)は
transcription_span()でラップされます。 - 音声出力(テキストから音声)は
speech_span()でラップされます。 - 関連する音声スパンは
speech_group_span()の下に配置されることがあります。
デフォルトでは、トレースは "Agent trace" と名付けられています。trace を使用する場合、この名前を設定することができ、[RunConfig][agents.run.RunConfig] で名前やその他のプロパティを設定できます。
さらに、カスタムトレースプロセッサーを設定して、トレースを他の宛先に送信することもできます(置き換えまたは二次的な宛先として)。
高レベルのトレース
時には、複数の run() 呼び出しを単一のトレースの一部にしたいことがあります。これを行うには、コード全体を trace() でラップします。
from agents import Agent, Runner, trace
async def main():
agent = Agent(name="Joke generator", instructions="Tell funny jokes.")
with trace("Joke workflow"): # (1)!
first_result = await Runner.run(agent, "Tell me a joke")
second_result = await Runner.run(agent, f"Rate this joke: {first_result.final_output}")
print(f"Joke: {first_result.final_output}")
print(f"Rating: {second_result.final_output}")
Runner.runへの2つの呼び出しがwith trace()でラップされているため、個々の実行は2つのトレースを作成するのではなく、全体のトレースの一部になります。
トレースの作成
[trace()][agents.tracing.trace] 関数を使用してトレースを作成できます。トレースは開始と終了が必要です。以下の2つの方法があります:
- 推奨: トレースをコンテキストマネージャーとして使用します。つまり、
with trace(...) as my_traceとします。これにより、トレースが自動的に適切なタイミングで開始および終了します。 - 手動で [
trace.start()][agents.tracing.Trace.start] と [trace.finish()][agents.tracing.Trace.finish] を呼び出すこともできます。
現在のトレースは Python の contextvar を介して追跡されます。これにより、並行処理でも自動的に機能します。トレースを手動で開始/終了する場合は、start()/finish() に mark_as_current と reset_current を渡して現在のトレースを更新する必要があります。
スパンの作成
さまざまな [*_span()][agents.tracing.create] メソッドを使用してスパンを作成できます。一般的に、スパンを手動で作成する必要はありません。カスタムスパン情報を追跡するための [custom_span()][agents.tracing.custom_span] 関数が利用可能です。
スパンは自動的に現在のトレースの一部となり、Python の contextvar を介して追跡される最も近い現在のスパンの下にネストされます。
センシティブデータ
特定のスパンは潜在的にセンシティブなデータをキャプチャすることがあります。
generation_span() は LLM 生成の入力/出力を保存し、function_span() は関数呼び出しの入力/出力を保存します。これらにはセンシティブなデータが含まれる可能性があるため、[RunConfig.trace_include_sensitive_data][agents.run.RunConfig.trace_include_sensitive_data] を使用してそのデータのキャプチャを無効にすることができます。
同様に、音声スパンにはデフォルトで入力および出力音声の base64 エンコードされた PCM データが含まれます。この音声データのキャプチャを無効にするには、[VoicePipelineConfig.trace_include_sensitive_audio_data][agents.voice.pipeline_config.VoicePipelineConfig.trace_include_sensitive_audio_data] を設定します。
カスタムトレーシングプロセッサー
トレーシングの高レベルアーキテクチャは次のとおりです:
- 初期化時に、トレースを作成する責任を持つグローバルな [
TraceProvider][agents.tracing.setup.TraceProvider] を作成します。 TraceProviderを [BatchTraceProcessor][agents.tracing.processors.BatchTraceProcessor] で構成し、トレース/スパンをバッチで [BackendSpanExporter][agents.tracing.processors.BackendSpanExporter] に送信し、OpenAI バックエンドにバッチでスパンとトレースをエクスポートします。
このデフォルトのセットアップをカスタマイズして、トレースを代替または追加のバックエンドに送信したり、エクスポーターの動作を変更したりするには、次の2つのオプションがあります:
- [
add_trace_processor()][agents.tracing.add_trace_processor] を使用して、トレースとスパンが準備できたときに受け取る追加のトレースプロセッサーを追加できます。これにより、OpenAI のバックエンドにトレースを送信することに加えて、独自の処理を行うことができます。 - [
set_trace_processors()][agents.tracing.set_trace_processors] を使用して、デフォルトのプロセッサーを独自のトレースプロセッサーに置き換えることができます。これにより、TracingProcessorを含めない限り、トレースは OpenAI バックエンドに送信されません。