Модель · Claude 4.X

Claude Haiku 4.5

Быстрая и дешёвая для массовых задач

API ID

claude-haiku-4-5

Контекстное окно

200K токенов

Максимальный вывод

32K токенов

Скорость

Молниеносная

О модели

Самая быстрая и самая дешёвая модель в семействе Claude. Идеально для реалтайм-сценариев: чат-ботов с высокой нагрузкой, классификаторов, модерации, коротких ответов.

Цена

Стоимость за 1 миллион токенов. Конвертация в ₽ по курсу 90 за $.

Ввод

$1/ 1M

≈ 90 ₽

Вывод

$5/ 1M

≈ 450 ₽

Кешированный ввод

$0.10/ 1M

≈ 9 ₽

Prompt Caching

Кеширование промпта (prompt caching) позволяет переиспользовать постоянную часть запроса с огромной скидкой — до 10× дешевле. Особенно выгодно для агентов с длинным system prompt и tool definitions.

Где хороша

Чат-боты в поддержке (миллионы запросов в сутки)
Классификация и модерация контента
Суммирование коротких фрагментов
Извлечение структурированных данных из простых текстов
Любой сценарий, чувствительный к latency и бюджету

Где стоит выбрать другую

Сложный код и агенты (не хватит глубины)
Длинные документы (контекст 200K против 1M у старших)
Творческие задачи высокой сложности

Примеры запроса

Минимальные рабочие примеры на curl и Python. Для JS/TS пример — на странице API.

curl

bash

curl https://api.anthropic.com/v1/messages \
  -H "x-api-key: $ANTHROPIC_API_KEY" \
  -H "anthropic-version: 2023-06-01" \
  -H "content-type: application/json" \
  -d '{
    "model": "claude-haiku-4-5",
    "max_tokens": 1024,
    "messages": [
      {"role": "user", "content": "Привет! Расскажи о себе."}
    ]
  }'

Python SDK

from anthropic import Anthropic

client = Anthropic()

response = client.messages.create(
    model="claude-haiku-4-5",
    max_tokens=1024,
    messages=[
        {"role": "user", "content": "Привет! Расскажи о себе."}
    ],
)

print(response.content[0].text)

Посмотреть другие модели

Сравни параметры всех трёх в одной таблице.

Сравнить все модели →Калькулятор цены →