モデルパラメータ

モデルパラメータは、LLM がテキストを生成する際の動作（創造性、出力長、サンプリング戦略など）を制御します。これらのパラメータを適切に調整することで、AI の出力品質を大幅に改善し、ユースケースに合った結果を得ることができます。

こんなときに使う

デフォルトの出力が不規則すぎる、あるいは柔軟性がなさすぎるため創造性を調整したい
応答が頻繁に途中で切れるため出力長の上限を増やしたい
推論モデルを使用していて思考の深さを制御したい
タスクシナリオごとに異なるパラメータの組み合わせが必要（創作 vs. コード生成）

パラメータの設定場所

Elftia は複数レベルのパラメータ設定を提供しており、優先順位は高い順に次のとおりです。

セッションレベルのパラメータ（チャットウィンドウでの一時的な調整）
    |
    v  上書き
グローバルモデルパラメータ（設定 → モデルパラメータ）
    |
    v  上書き
プロバイダーデフォルトパラメータ（プロバイダー設定の defaultSettings）
    |
    v  上書き
システムデフォルト

グローバルモデルパラメータ

設定 → モデルパラメータ を開く
各パラメータの値を調整する
各パラメータの隣にある 有効/無効 トグルで適用するかどうかを制御する

セッションレベルのパラメータ

チャット UI でモデル選択エリアの隣にある パラメータ ボタンをクリックする
現在のセッションのパラメータを一時的に調整する
これらの調整は現在のセッションにのみ適用される

コアパラメータの説明

temperature

プロパティ	値
範囲	0 – 2
デフォルト	0.7
グローバル制御	あり

目的: 出力のランダム性と創造性を制御します。

低 temperature（0 – 0.3）: 出力がより確定的で一貫性が高くなります。コード生成、事実の Q&A、データ抽出など精度が求められるシナリオに適しています
中 temperature（0.4 – 0.8）: 創造性と一貫性のバランスが取れています。日常的な会話やドキュメント作成に適しています
高 temperature（0.9 – 2.0）: 出力がよりランダムで創造的になります。創作や自由なアイデア出しに適しています

推奨設定:

シナリオ	推奨値
コード生成	0 – 0.2
技術ドキュメント	0.3 – 0.5
日常会話	0.6 – 0.8
創作	0.8 – 1.2
アイデア出し	1.0 – 1.5

max_tokens

プロパティ	値
範囲	1 – （モデルの上限）
デフォルト	4096
グローバル制御	あり

目的: 1 回の応答でモデルが生成するテキストの最大長をトークン数で制限します（日本語 1 文字は概ね 1〜3 トークン、英単語 1 語は概ね 1 トークンです）。

応答が途中で切れて「最大長に達しました」というメッセージが表示される場合、max_tokens の設定が低すぎます
非常に高い値を設定しても、モデルが常に長い応答を生成するわけではありません。モデルは回答が完結したと判断した時点で自然に停止します
モデルごとに上限が異なり、モデルの最大値を超えた値は自動的にカットされます

主なモデルの出力上限:

モデル	最大出力トークン数
GPT-4o	16,384
GPT-5	65,536
Claude Sonnet 4.5	65,536
Claude Haiku 4.5	65,536
Gemini 3 Flash	65,536
Qwen3 Max	65,536
DeepSeek V3	8,192

top_p

プロパティ	値
範囲	0 – 1
デフォルト	1.0
グローバル制御	あり

目的: Nucleus Sampling はランダム性を制御するもう一つの方法です。各トークンを生成する際、モデルは累積確率が top_p に達する候補トークンの中からのみサンプリングします。

top_p = 1.0: すべての候補トークンを考慮します（フィルタリングなし）
top_p = 0.9: 確率の高いトークンのうち、合計で確率質量の 90% を占めるものからのみサンプリングします
top_p = 0.1: 確率の高いトークンのうち、合計で 10% を占めるものからのみサンプリングします。出力は非常に確定的になります

注意: 一般的に temperature と top_p のどちらか一方のみを調整することが推奨されます。両方を大幅に変更すると予測しにくい結果が生じる可能性があります。

思考バジェット（Thinking Budget）

プロパティ	値
選択肢	none / low / medium / high
デフォルト	low
グローバル制御	あり

目的: 推論モデル（Claude Sonnet 4.5、Gemini 3 Flash、DeepSeek R1 など推論に対応したモデル）が応答する前に行う「思考」の深さを制御します。

レベル	説明	用途
none	推論を無効化してモデルが直接応答	シンプルな Q&A、カジュアルなチャット
low	軽い思考	日常的なタスク — 速度と品質のバランス
medium	中程度の思考	ある程度の推論が必要な複雑な問題
high	最大トークンバジェットでの深い思考	数学的証明、複雑なコード、詳細な分析

思考バジェットは reasoning: true とマークされたモデルでのみ有効です。推論をサポートしないモデルではこの設定は無視されます。

reasoning_effort

このパラメータは OpenAI の o シリーズモデル（o1、o3、o4-mini など）専用です。

プロパティ	値
選択肢	low / medium / high
デフォルト	medium

low: 高速応答。シンプルな質問に適しています
medium: バランスモード
high: 深い推論。複雑なタスクに適しています

ツール最大ターン数（Tool Max Turns）

プロパティ	値
範囲	1 – 50
デフォルト	5
グローバル制御	あり

目的: Agent モードでの MCP ツール呼び出しの最大イテレーション数を制限します。モデルが 1 回の会話でツールを連続的に呼び出す場合、この上限に達すると処理が強制停止され、現時点の結果が返されます。

設定リファレンス

グローバルモデルパラメータ

パラメータ	型	デフォルト	範囲	有効/無効
temperature	数値	0.7	0 – 2	デフォルトで有効
topP	数値	1.0	0 – 1	デフォルトで無効
maxTokens	数値	4096	1 – （モデルの上限）	デフォルトで無効
defaultThinkingBudget	列挙型	`low`	none/low/medium/high	常に有効
toolMaxTurns	数値	5	1 – 50	常に有効

プロバイダーデフォルトパラメータ

パラメータ	型	システムデフォルト	説明
temperature	数値	0.7	プロバイダーレベルのデフォルト temperature
topP	数値	1	プロバイダーレベルのデフォルト top_p
maxTokens	数値	4096	プロバイダーレベルのデフォルト最大出力
stream	ブール値	`true`	ストリーミングを使用するか否か
presencePenalty	数値	（未設定）	存在ペナルティ（-2 〜 2）
frequencyPenalty	数値	（未設定）	頻度ペナルティ（-2 〜 2）
stop	文字列配列	（未設定）	停止シーケンス
seed	数値	（未設定）	ランダムシード（再現可能な出力のため）
jsonMode	ブール値	`false`	JSON 形式の出力を強制するか否か

プロバイダーごとのデフォルトパラメータの違い

プロバイダーテンプレートによってデフォルトパラメータが異なります。

プロバイダー	temperature	maxTokens	topP	その他
OpenAI	0.7	4,096	--	--
Anthropic	0.7	65,536	--	--
Google Gemini	0.7	65,536	0.95	--
システムデフォルト	0.7	4,096	1	stream: true

動作に関する補足

パラメータの優先順位

同一のパラメータが複数のレベルで設定されている場合の優先順位は次のとおりです。

セッションレベルのパラメータ（チャット中に一時調整したもの）— 最高優先度
グローバルモデルパラメータ（設定ページで設定し、「有効」とマークしたもの）
プロバイダーデフォルトパラメータ（プロバイダー設定の defaultSettings）
システムデフォルト（temperature: 0.7, topP: 1, maxTokens: 4096）

「無効」とマークされたグローバルモデルパラメータはプロバイダーのデフォルト値を上書きしません。

モデルとのパラメータ互換性

すべてのパラメータがすべてのモデルでサポートされているわけではありません。

パラメータ	OpenAI	Anthropic	Gemini	ローカルモデル
temperature	対応	対応	対応	対応
maxTokens	対応	対応	対応	対応
topP	対応	対応	対応	対応
presencePenalty	対応	非対応	非対応	一部対応
frequencyPenalty	対応	非対応	非対応	一部対応
seed	対応	非対応	非対応	一部対応
thinking	一部対応（o シリーズ）	対応	対応	非対応

非対応のパラメータはリクエスト送信前に Transformer によって自動的に除去されるため、エラーは発生しません。

Transformer のパラメータへの影響

Elftia の Transformer システムはリクエスト送信前にパラメータを適合させます。

Transformer	パラメータ処理
`anthropic`	`max_tokens` を Anthropic のフィールド形式にマッピング
`gemini`	パラメータを Gemini の `generationConfig` 形式に変換
`sampling`	`temperature` や `top_p` などのサンプリングパラメータを正規化
`maxtoken`	特定の `max_tokens` 値を強制設定（ユーザー設定を上書き）
`maxcompletiontokens`	`max_tokens` を `max_completion_tokens` に変換（一部モデルで必須）
`reasoning`	推論モデルの `reasoning_content` フィールドを処理
`forcereasoning`	推論モードを強制的に有効化（ユーザーの思考バジェット設定を無視）

モデルルーティング

Elftia はタスクの種類ごとに異なるモデルを設定することができます。

ルーティングの役割	説明	設定場所
デフォルトモデル	主要なチャットモデル	チャット UI のモデル選択
バックグラウンドモデル	軽量タスク（要約、タイトル生成など）に使用	設定 → Agent デフォルトモデル
Vision モデル	画像を含むメッセージを処理（デフォルトモデルが Vision 非対応の場合）	設定 → Agent デフォルトモデル
推論モデル	深い思考が必要なタスク	思考バジェットのレベルで制御

プロバイダーに従う（Follow Provider）: このオプションを有効にすると、バックグラウンドモデルと Vision モデルが現在のデフォルトモデルと同じプロバイダーの対応モデルを自動的に使用します。たとえば、Zhipu の GLM-5 をデフォルトモデルとして使用している場合、バックグラウンドモデルは自動的に GLM-4.5 Air を使用し、Vision モデルは GLM-4.6V を使用します。

トラブルシューティング

問題	考えられる原因	解決策
応答が途中で切れる	`max_tokens` の設定が低すぎる	`max_tokens` の値を増やすか、グローバルパラメータで有効にして大きい値を設定する
応答がランダムすぎる、または無関係	`temperature` が高すぎる	temperature を下げる（0.3〜0.7 推奨）
応答が単調または繰り返しが多い	`temperature` が低すぎる	temperature を少し上げる（0.5〜0.8 推奨）
推論モデルが思考の連鎖を表示しない	`thinking budget` が none に設定されている	`defaultThinkingBudget` を `low` 以上に設定する
推論モデルの思考が長すぎる	`thinking budget` が high に設定されている	`medium` または `low` に下げる
パラメータ設定が反映されない	より高い優先度の設定で上書きされている	セッションレベルのパラメータが上書きしていないか確認し、グローバルパラメータの有効スイッチがオンになっていることを確認する
リクエストがパラメータエラーを返す	モデルが特定のパラメータを非対応	モデルとのパラメータ互換性を確認し、非互換のパラメータを無効にする
ツール呼び出しが会話中に停止する	`toolMaxTurns` の上限に達した	`toolMaxTurns` の値を増やす（API コストが増加する可能性に注意）
プロバイダー間でパフォーマンスの差が大きい	プロバイダーのデフォルトパラメータが異なる	グローバルパラメータを有効にして主要なパラメータを統一した値に設定する

こんなときに使う​

パラメータの設定場所​

グローバルモデルパラメータ​

セッションレベルのパラメータ​

コアパラメータの説明​

temperature​

max_tokens​

top_p​

思考バジェット（Thinking Budget）​

reasoning_effort​

ツール最大ターン数（Tool Max Turns）​

設定リファレンス​

グローバルモデルパラメータ​

プロバイダーデフォルトパラメータ​

プロバイダーごとのデフォルトパラメータの違い​

動作に関する補足​

パラメータの優先順位​

モデルとのパラメータ互換性​

Transformer のパラメータへの影響​

モデルルーティング​

トラブルシューティング​

関連ページ​

こんなときに使う

パラメータの設定場所

グローバルモデルパラメータ

セッションレベルのパラメータ

コアパラメータの説明

temperature

max_tokens

top_p

思考バジェット（Thinking Budget）

reasoning_effort

ツール最大ターン数（Tool Max Turns）

設定リファレンス

グローバルモデルパラメータ

プロバイダーデフォルトパラメータ

プロバイダーごとのデフォルトパラメータの違い

動作に関する補足

パラメータの優先順位

モデルとのパラメータ互換性

Transformer のパラメータへの影響

モデルルーティング

トラブルシューティング

関連ページ