Anthropic
Модели Anthropic поддерживают явное кэширование промптов. На этой платформе как в протоколе OpenAI chat/completions, так и в протоколе Anthropic v1/messages можно использовать"cache_control": {"type": "ephemeral"}, чтобы указать содержимое, которое нужно кэшировать.
- Claude Opus 4.1, Claude Opus 4, Claude Sonnet 4.5, Claude Sonnet 4, Claude Sonnet 3.7 — 1024 tokens
- Claude Haiku 4.5, Claude Haiku 3.5 и Claude Haiku 3 — 2048 tokens
OpenAI и модели, совместимые с OpenAI
Как правило, эти модели могут поддерживать неявное кэширование. Когда пользователь многократно обращается к одной и той же модели с одинаковым префиксом Prompt, существует определённая вероятность попадания в кэш.Gemini
В настоящее время поддерживается только неявное кэширование. Неявное кэширование не требует ручной настройки или дополнительной конфигурации cache_control. Когда пользователь многократно обращается к одной и той же модели с одинаковым префиксом Prompt, существует определённая вероятность попадания в кэш. Обратите внимание:- Средний TTL (время жизни кэша) составляет 3–5 минут, но может меняться (например, может составлять всего несколько секунд)
- Gemini 2.5 Flash требует минимальный ввод 1024 tokens, Gemini 2.5 Pro требует минимум 4096 tokens