Anthropic
Los modelos de Anthropic admiten caché de prompts explícito. En esta plataforma, tanto con el protocolo OpenAI chat/completions como con el protocolo Anthropic v1/messages, puedes usar"cache_control": {"type": "ephemeral"} para especificar el contenido que debe almacenarse en caché.
- Claude Opus 4.1, Claude Opus 4, Claude Sonnet 4.5, Claude Sonnet 4 y Claude Sonnet 3.7 requieren 1024 tokens
- Claude Haiku 4.5, Claude Haiku 3.5 y Claude Haiku 3 requieren 2048 tokens
OpenAI y modelos compatibles con OpenAI
Por lo general, estos modelos pueden admitir caché implícito. Cuando el usuario accede repetidamente al mismo modelo usando el mismo prefijo de Prompt, existe cierta probabilidad de que se produzca un acierto de caché.Gemini
Actualmente solo se admite caché implícito. El caché implícito no requiere configuración manual ni una configuración adicional de cache_control. Cuando el usuario accede repetidamente al mismo modelo usando el mismo prefijo de Prompt, existe cierta probabilidad de que se produzca un acierto de caché. Ten en cuenta lo siguiente:- El TTL promedio (tiempo de vida de la caché) es de 3 a 5 minutos, pero puede variar (por ejemplo, podría ser de solo unos segundos)
- Gemini 2.5 Flash requiere una entrada mínima de 1024 tokens, y Gemini 2.5 Pro requiere un mínimo de 4096 tokens