Claude Info
Модель · Claude 4.X

Claude Haiku 4.5

Быстрая и дешёвая для массовых задач

API ID
claude-haiku-4-5
Контекстное окно
200K токенов
Максимальный вывод
32K токенов
Скорость
Молниеносная

О модели

Самая быстрая и самая дешёвая модель в семействе Claude. Идеально для реалтайм-сценариев: чат-ботов с высокой нагрузкой, классификаторов, модерации, коротких ответов.

Цена

Стоимость за 1 миллион токенов. Конвертация в ₽ по курсу 90 за $.

Ввод
$1/ 1M
90 ₽
Вывод
$5/ 1M
450 ₽
Кешированный ввод
$0.10/ 1M
9 ₽
Prompt Caching

Кеширование промпта (prompt caching) позволяет переиспользовать постоянную часть запроса с огромной скидкой — до 10× дешевле. Особенно выгодно для агентов с длинным system prompt и tool definitions.

Где хороша

  • Чат-боты в поддержке (миллионы запросов в сутки)
  • Классификация и модерация контента
  • Суммирование коротких фрагментов
  • Извлечение структурированных данных из простых текстов
  • Любой сценарий, чувствительный к latency и бюджету

Где стоит выбрать другую

  • Сложный код и агенты (не хватит глубины)
  • Длинные документы (контекст 200K против 1M у старших)
  • Творческие задачи высокой сложности

Примеры запроса

Минимальные рабочие примеры на curl и Python. Для JS/TS пример — на странице API.

curl
bash
curl https://api.anthropic.com/v1/messages \
  -H "x-api-key: $ANTHROPIC_API_KEY" \
  -H "anthropic-version: 2023-06-01" \
  -H "content-type: application/json" \
  -d '{
    "model": "claude-haiku-4-5",
    "max_tokens": 1024,
    "messages": [
      {"role": "user", "content": "Привет! Расскажи о себе."}
    ]
  }'
Python SDK
py
from anthropic import Anthropic

client = Anthropic()

response = client.messages.create(
    model="claude-haiku-4-5",
    max_tokens=1024,
    messages=[
        {"role": "user", "content": "Привет! Расскажи о себе."}
    ],
)

print(response.content[0].text)

Посмотреть другие модели

Сравни параметры всех трёх в одной таблице.