Освойте 3 ключевых механизма кэширования и тарификации Claude API: сравнение цен на запись в кэш за 5 минут и 1 час, и детальное объяснение изоляции кэша между аккаунтами

Примечание автора: Глубокий анализ механизма оплаты кэширования Claude API, сравнение разницы в стоимости записи кэша на 5 минут и 1 час, ответ на вопрос о попадании в кэш между разными аккаунтами и сравнение различий в оплате кэширования между AWS Bedrock и официальным API Anthropic.

Prompt Caching в Claude API — это ключевой способ снизить стоимость вызовов API, но у многих разработчиков возникают вопросы о деталях тарификации кэша: Как выбрать между 5-минутным и 1-часовым кэшем? Можно ли делиться кэшем между аккаунтами? Чем отличается оплата кэширования в AWS Bedrock от официального API?

Основная ценность: Прочитав эту статью, вы полностью поймёте 3 ключевых механизма тарификации кэша Claude API, освоите метод выбора оптимальной стратегии кэширования и избежите ненужных трат.

Ключевые моменты тарификации кэширования Claude API

Пункт	Описание	Ценность
Запись в кэш на 5 минут	Стоимость записи = базовая цена ввода × 1.25	Самая низкая стоимость, подходит для частых вызовов
Запись в кэш на 1 час	Стоимость записи = базовая цена ввода × 2.0	Более длительный TTL, подходит для редких, но объемных кэширований
Чтение из кэша (попадание)	Стоимость чтения = базовая цена ввода × 0.1	Снижение стоимости на 90% при попадании
Изоляция кэша	Изоляция на уровне Workspace, полная изоляция между организациями	Кэш не может быть общим между разными аккаунтами

Базовые коэффициенты тарификации кэша Claude

Prompt Caching в Claude API использует унифицированную систему тарификации по коэффициентам. Независимо от того, какую модель вы используете (Opus 4.6, Sonnet 4.6 или Haiku 4.5), правила коэффициентов для операций с кэшем полностью одинаковы:

Запись в кэш (TTL 5 минут): Базовая цена ввода × 1.25
Запись в кэш (TTL 1 час): Базовая цена ввода × 2.0
Чтение из кэша (попадание): Базовая цена ввода × 0.1

Это означает, что при каждом попадании в кэш вы платите всего 10% от стандартной цены ввода. Например, для Claude Sonnet 4.6 стандартная цена ввода составляет $3/MTok, а цена при попадании в кэш — всего $0.3/MTok, что экономит 90% затрат на ввод.

Расчет окупаемости тарификации кэша Claude

Очень важно понимать соотношение затрат и выгод от кэширования. Запись в кэш имеет дополнительную стоимость, но чтение из кэша чрезвычайно дешево. Ключевой вопрос — после скольких попаданий кэш начинает «окупаться»?

Кэш на 5 минут: Запись 1.25x + чтение 0.1x = после первой записи окупается уже при 1 попадании (поскольку обычное чтение стоит 1x, а чтение из кэша — 0.1x, экономия 0.9x > дополнительная оплата 0.25x)
Кэш на 1 час: Запись 2.0x + чтение 0.1x = после первой записи требуется 2 попадания для окупаемости (дополнительная оплата 1.0x, экономия при каждом попадании 0.9x)

Таким образом, кэш на 5 минут — это практически «беспроигрышный» выбор, а для кэша на 1 час нужно убедиться, что он будет использован как минимум 2 раза в течение срока действия.

Тарификация кэша Claude: сравнение кэша на 5 минут и на 1 час

Разница в цене между кэшем на 5 минут и на 1 час

Ниже приведены конкретные цены записи для 5-минутного и 1-часового кэша на примере каждой модели:

Модель	Базовая цена ввода	Запись в кэш на 5 мин (×1.25)	Запись в кэш на 1 час (×2.0)	Чтение из кэша (×0.1)
Claude Opus 4.6	$5.00/MTok	$6.25/MTok	$10.00/MTok	$0.50/MTok
Claude Sonnet 4.6	$3.00/MTok	$3.75/MTok	$6.00/MTok	$0.30/MTok
Claude Haiku 4.5	$1.00/MTok	$1.25/MTok	$2.00/MTok	$0.10/MTok

Стратегия выбора TTL для тарификации кэша Claude

Кэш на 5 минут и кэш на 1 час — это не взаимоисключающие варианты. Вы можете гибко выбирать в зависимости от реальных сценариев и даже смешивать их в одном запросе.

Сценарии, подходящие для кэша на 5 минут:

Частые вызовы API (несколько запросов в минуту), кэш постоянно обновляется в течение 5 минут
Интерактивные диалоги, где пользователь продолжает отправлять сообщения, и кэш автоматически продлевается
Проекты, чувствительные к затратам, с более низкой стоимостью записи

Сценарии, подходящие для кэша на 1 час:

Пакетные задачи, где данные обрабатываются партиями с интервалом в несколько десятков минут
Большие системные промпты с высокой стоимостью записи, которые вы хотите хранить в кэше дольше
Сценарии с запланированными задачами, выполняемыми каждые 15-30 минут

Важный механизм: 5-минутный кэш автоматически обновляет свой TTL при каждом попадании, то есть «продлевается». Поэтому, если частота ваших вызовов достаточно высока (хотя бы один запрос в течение 5 минут), кэш фактически может существовать постоянно, и нет необходимости выбирать кэш на 1 час.

🎯 Техническая рекомендация: В большинстве случаев достаточно кэша на 5 минут. При вызове Claude API через платформу APIYI apiyi.com правила тарификации кэша полностью соответствуют официальным, и платформа поддерживает единый интерфейс для управления стратегиями кэширования нескольких моделей.

Использование смешанного TTL в тарификации кэша Claude

Anthropic позволяет использовать одновременно два типа управления кэшем (1 час и 5 минут) в одном запросе, но есть ключевое ограничение:

TTL должен располагаться от большего к меньшему: Маркер кэша на 1 час должен стоять перед маркером кэша на 5 минут.

На практике вы можете установить кэш на 1 час для системного промпта, который меняется редко, и кэш на 5 минут для примеров Few-shot, которые меняются чаще:

import anthropic

client = anthropic.Anthropic(
    api_key="YOUR_API_KEY",
    base_url="https://vip.apiyi.com"  # Вызов через APIYI
)

response = client.messages.create(
    model="claude-sonnet-4-6-20260320",
    max_tokens=1024,
    system=[
        {
            "type": "text",
            "text": "Вы профессиональный помощник по технической документации...(большой системный промпт)...",
            "cache_control": {"type": "ephemeral", "ttl": "3600"}  # Кэш на 1 час
        }
    ],
    messages=[
        {
            "role": "user",
            "content": [
                {
                    "type": "text",
                    "text": "Вот справочная документация...(большой контекст)...",
                    "cache_control": {"type": "ephemeral"}  # Кэш на 5 минут по умолчанию
                },
                {
                    "type": "text",
                    "text": "Пожалуйста, ответьте на основе приведенного документа: что такое Prompt Caching?"
                }
            ]
        }
    ]
)

Посмотреть код проверки статуса попадания в кэш

import anthropic

client = anthropic.Anthropic(
    api_key="YOUR_API_KEY",
    base_url="https://vip.apiyi.com"
)

response = client.messages.create(
    model="claude-sonnet-4-6-20260320",
    max_tokens=1024,
    system=[
        {
            "type": "text",
            "text": "Содержание вашего системного промпта (должно быть >= 1024 токенов, чтобы активировать кэширование)",
            "cache_control": {"type": "ephemeral"}
        }
    ],
    messages=[{"role": "user", "content": "Привет"}]
)

# Проверка использования кэша
usage = response.usage
print(f"Входные токены: {usage.input_tokens}")
print(f"Токены записи в кэш: {usage.cache_creation_input_tokens}")
print(f"Токены попадания в кэш: {usage.cache_read_input_tokens}")

# Определение статуса кэша
if usage.cache_read_input_tokens > 0:
    print("Попадание в кэш! Сэкономлено 90% затрат на ввод")
elif usage.cache_creation_input_tokens > 0:
    print("Первая запись в кэш, последующие запросы будут попадать в кэш")

💡 Примечание: Существует минимальное требование к количеству токенов для кэширования. Claude Opus 4.6 требует как минимум 1024 токена, Sonnet 4.6 и Haiku 4.5 также требуют минимум 1024 токена. Контент ниже этого порога не будет кэшироваться.

Кэширование Claude: механизм изоляции кэша между аккаунтами

Этот вопрос волнует многих разработчиков: сможет ли аккаунт B попасть в кэш, записанный аккаунтом A?

Основные правила изоляции кэша Claude

Ответ однозначен: Нет. Кэш полностью изолирован между разными организациями (Organization).

С 5 февраля 2026 года Anthropic уточнила гранулярность изоляции кэша с уровня «организации» до уровня «Рабочего пространства» (Workspace). Это означает:

Сценарий	Кэш общий?	Объяснение
Разные API-ключи в одном Workspace	✅ Общий	Внутри одного рабочего пространства одинаковые промпты попадут в кэш
Разные Workspace в одной Organization	❌ Не общий	Даже в рамках одной организации разные рабочие пространства изолированы
Аккаунты разных Organization	❌ Полностью изолированы	Полная независимость, даже если промпты на 100% идентичны
Разные пользователи через платформы-прокси, такие как APIYI	❌ Не общий	Запросы разных пользователей маршрутизируются на разные вышестоящие учетные данные

Практическое влияние изоляции кэша Claude

Анализ сценария: Предположим, у вас есть два аккаунта Claude API (принадлежащие разным Organization), и вы одновременно запускаете пакетную обработку данных.

Аккаунт A отправляет запрос, инициируя запись в кэш, оплачивая стоимость записи (1.25x)
Аккаунт B отправляет абсолютно идентичный промпт в течение 5 минут
Результат: Аккаунт B НЕ попадет в кэш аккаунта A, B также инициирует запись в кэш и снова заплатит 1.25x

Это сделано из соображений безопасности и конфиденциальности — содержимое кэша может включать конфиденциальные системные промпты или бизнес-данные, и совместное использование между организациями создает риск утечки данных.

Стратегия оптимизации: Если вам нужно, чтобы несколько сервисов использовали общий кэш для снижения затрат, их API-ключи должны находиться в одном Workspace, а не в аккаунтах разных Organization.

🎯 Практический совет: На платформе APIYI apiyi.com запросы каждого пользователя обрабатываются через единый вышестоящий канал. Если вам нужно совместное использование кэша между несколькими проектами, рекомендуется правильно спланировать структуру Workspace в Anthropic Console, разместив проекты, которым нужен общий кэш, в одном Workspace.

Условия попадания в кэш Claude

Помимо изоляции по Workspace, для попадания в кэш есть еще одно ключевое условие — промпт должен быть на 100% идентичен.

Ключ кэша (Cache Key) генерируется путем криптографического хеширования содержимого промпта. Область сопоставления включает:

tools (определения инструментов)
system (системный промпт)
messages (история сообщений)

Эти три части объединяются по порядку до позиции маркера cache_control. Если хотя бы один символ отличается (включая пробелы, символы новой строки), попадания в кэш не произойдет.

Сравнение тарификации кэширования Claude: AWS Bedrock vs официальный API Anthropic

Различия в тарификации кэширования между AWS Bedrock и официальным API Anthropic

Многие компании используют Claude через AWS Bedrock, и их тарификация за кэширование отличается от официального API Anthropic следующим образом:

Критерий сравнения	Официальный API Anthropic	AWS Bedrock
Запись в кэш на 5 минут	1.25x базовая цена	1.25x базовая цена
Запись в кэш на 1 час	2.0x базовая цена	2.0x базовая цена (только для некоторых моделей)
Чтение из кэша	0.1x базовая цена	0.1x базовая цена
Модели с поддержкой кэша на 1 час	Все модели с поддержкой кэширования	Только Haiku 4.5, Sonnet 4.5, Opus 4.5
Уровень изоляции кэша	Уровень Workspace	Уровень Organization (AWS Account)
Региональное ценообразование	Единая глобальная цена	Премиум около 10% за региональные эндпоинты
Базовая цена за ввод	Официальная стандартная цена	В основном соответствует официальной

Ключевые различия в тарификации кэширования Claude в AWS Bedrock

Различие 1: Диапазон моделей с поддержкой кэша на 1 час

По состоянию на январь 2026 года, AWS Bedrock поддерживает TTL кэша в 1 час только для моделей Claude Haiku 4.5, Sonnet 4.5 и Opus 4.5. Последние модели Opus 4.6 и Sonnet 4.6 в Bedrock, возможно, еще не поддерживают опцию кэширования на 1 час. Если вам нужна комбинация новейшей модели и кэша на 1 час, рекомендуется напрямую использовать официальный API Anthropic.

Различие 2: Гранулярность изоляции кэша

AWS Bedrock поддерживает изоляцию кэша на уровне Organization (т.е. на уровне AWS Account), тогда как официальный API Anthropic уже детализирован до уровня Workspace. Это означает, что в Bedrock все вызовы в рамках одного AWS-аккаунта могут совместно использовать кэш, что является более грубой гранулярностью по сравнению с официальным API.

Различие 3: Различия в региональном ценообразовании

Региональные эндпоинты AWS Bedrock (например, us-east-1, eu-west-1) могут иметь премиум около 10% по сравнению с глобальными эндпоинтами. Эта надбавка также отражается на стоимости записи и чтения из кэша.

💰 Рекомендация по оптимизации затрат: Если вы в основном используете Claude API и вам требуется детальный контроль над стратегией кэширования, вызов нативного API Anthropic через APIYI apiyi.com является более гибким выбором. Платформа поддерживает передачу полных параметров управления кэшем и предлагает более выгодные цены.

Часто задаваемые вопросы

Вопрос 1: Можно ли самостоятельно выбирать между кэшем на 5 минут и на 1 час?

Да. Это контролируется путем установки параметра cache_control в запросе. По умолчанию, если TTL не указан, используется кэш на 5 минут; явная установка "ttl": "3600" означает кэш на 1 час. Вы также можете смешивать оба TTL в одном запросе, но при этом содержимое для кэша на 1 час должно располагаться перед содержимым для кэша на 5 минут. В большинстве случаев кэша на 5 минут с автоматическим продлением достаточно, и нет необходимости дополнительно платить за кэш на 1 час.

Вопрос 2: Могут ли два разных аккаунта Claude API совместно использовать попадания в кэш?

Нет. Кэш изолирован на уровне Workspace (после февраля 2026 года). Если два аккаунта принадлежат разным Organization, их кэши полностью независимы. Если они принадлежат одной Organization, но разным Workspace, они также не могут совместно использовать кэш. Только при использовании разных API-ключей в рамках одного Workspace один и тот же промпт может попасть в один и тот же кэш. Чтобы совместно использовать кэш для снижения затрат, необходимо разместить несколько API-ключей в одном Workspace.

Вопрос 3: Как определить, было ли попадание в кэш?

Поле usage в ответе API будет содержать два показателя: cache_creation_input_tokens и cache_read_input_tokens. Если cache_read_input_tokens > 0, это означает попадание в кэш. При вызове через платформу APIYI apiyi.com эти поля возвращаются в исходном виде, и вы можете напрямую отслеживать процент попаданий в кэш для оптимизации затрат.

Вопрос 4: Существует ли минимальное требование к количеству токенов для кэшируемого содержимого?

Да. Минимальный порог кэширования для всех моделей Claude составляет 1024 токена. Если ваш системный промпт или контекстное содержимое содержит менее 1024 токенов, кэширование не будет работать. Рекомендуется использовать большие системные промпты, примеры Few-shot или справочные документы в качестве кэшируемого содержимого, чтобы максимально использовать механизм кэширования для снижения затрат.

Итог

Основные моменты тарификации кэширования Claude API:

Запись в кэш на 5 минут — 1.25x, на 1 час — 2.0x: В большинстве случаев достаточно кэша на 5 минут. При частых вызовах кэш автоматически продлевается, что по эффекту аналогично долгосрочному кэшу.
Чтение из кэша — всего 0.1x: При попадании в кэш вы экономите 90% стоимости входных токенов. Кэш на 5 минут окупается уже после одного попадания.
Изоляция кэша на уровне Workspace: Кэш не может быть общим между разными организациями или Workspace. Необходимо грамотно планировать структуру Workspace.

Для разработчиков, которым требуется массовый вызов Claude API, грамотное использование стратегии кэширования может значительно снизить затраты. Рекомендуем использовать платформу APIYI apiyi.com для вызовов Claude API. Она поддерживает полную передачу параметров кэширования, единое управление интерфейсами и предоставляет бесплатный тестовый баланс для проверки эффективности вашей стратегии кэширования.

Справочные материалы

Официальная документация Anthropic Prompt Caching: Полное описание функции кэширования Claude API.
- Ссылка: platform.claude.com/docs/en/build-with-claude/prompt-caching
- Описание: Содержит ключевые параметры, такие как тарифные множители кэширования, настройки TTL, минимальные требования к токенам.
Страница тарифов Anthropic API: Актуальные цены на все модели Claude.
- Ссылка: platform.claude.com/docs/en/about-claude/pricing
- Описание: Содержит базовые цены на входные/выходные токены и детальную тарификацию операций с кэшем.
Документация AWS Bedrock Prompt Caching: Руководство по использованию кэширования Claude на платформе AWS.
- Ссылка: docs.aws.amazon.com/bedrock/latest/userguide/prompt-caching.html
- Описание: Особые способы настройки кэширования и список поддерживаемых моделей в Bedrock.
Анонс AWS Bedrock о кэшировании на 1 час: Описание выпуска функции кэширования с TTL 1 час.
- Ссылка: aws.amazon.com/about-aws/whats-new/2026/01/amazon-bedrock-one-hour-duration-prompt-caching/
- Описание: Диапазон моделей в Bedrock, поддерживающих кэширование на 1 час, и способы использования.

Автор: Техническая команда APIYI
Технические обсуждения: Приглашаем обсудить вопросы тарификации кэширования Claude в комментариях. Больше советов по использованию API можно найти в документации APIYI docs.apiyi.com.