Истории успеха наших клиентов — лучшие проекты
Вход/ Регистрация
На главную
25eb9e0a-a5a8-472a-ace7-940b8bd2adf0
Облачные сервисы

Тарификация AI-агентов

Для работы AI-агентов используются языковые модели и база знаний. Ниже представлены доступные модели, тарифы на их использование и правила работы с токенами.

Доступные модели

Мы предоставляем доступ к следующим большим языковым моделям:

Провайдер

Модель

Окно контекста в токенах

Максимум выходных токенов

Размышления

OpenAI

GPT-4.1-nano

1 047 576

16 384

OpenAI

GPT-4.1-mini

1 047 576

16 384

OpenAI

GPT-4.1

1 047 576

128 000

OpenAI

GPT-4o-mini

128 000

16 384

OpenAI

GPT-4o

128 000

128 000

OpenAI

GPT-5-nano

400 000

128 000

OpenAI

GPT-5-mini

400 000

128 000

OpenAI

GPT-5

400 000

128 000

DeepSeek

DeepSeek-chat

128 000

8 192

DeepSeek

DeepSeek-reasoner

128 000

65 536

xAI

grok-3-mini

131 072

131 072

xAI

grok-code-fast-1

256 000

131 072

xAI

grok-3

131 072

131 072

xAI

grok-4

256 000

131 072

xAI

grok-4-fast

2 000 000

131 072

xAI

grok-4-fast

2 000 000

131 072

Google AI

Gemini 2.0 Flash-Lite

1 000 000

8 192

Google AI

Gemini 2.5 Flash-Lite

1 000 000

8 192

Google AI

Gemini 2.0 Flash

1 000 000

8 192

Google AI

Gemini 2.5 Flash

1 000 000

8 192

Google AI

Gemini 2.5 Pro

1 000 000

32 768

Anthropic

Claude Sonnet 4

200 000

200 000

Anthropic

Claude Opus 4.1

200 000

200 000

Anthropic

Claude Sonnet 4.5

200 000

64 000

Anthropic

Claude Haiku 4.5

200 000

64 000

Qwen

Qwen 3 Flash

1 000 000

32 768

Qwen

Qwen 3 Max

262 144

65 536

Qwen

Qwen 3 Plus

1 000 000

32 768

Как работают токены

Модели работают с текстом, разбивая его на фрагменты — токены. Один токен может быть:

  • частью слова (например, «техно» + «логия»);
  • целым коротким словом (например, «кот»);
  • символом или знаком препинания.

В среднем 1 000 токенов ≈ 750 слов на русском или английском языке.

Приведенные значения приблизительны и предназначены для общего представления о расходах. Каждая модель использует собственный токенизатор с уникальной логикой разбиения текста

Токены тарифицируются как на входе, так и на выходе. Например, если ваш запрос содержит 20 токенов, а ответ от модели — 30 токенов, то всего будет списано 50 токенов из доступной квоты.

Модели с размышлениями

Если при выборе модели отображается пиктограмма мозга — значит, модель поддерживает режим размышлений (reasoning).

В этом режиме модель перед финальным ответом самостоятельно формулирует промежуточные рассуждения. Модель задает себе уточняющие вопросы и отвечает на них. Это позволяет добиться более точного, аргументированного ответа, особенно в сложных задачах.

Каждая итерация размышлений требует дополнительного ввода и вывода текста, а значит — увеличивает количество затраченных токенов.

Отключить размышления нельзя.

Тарифы агентов

Для AI-агентов доступны два типа тарифов:

  • Основные тарифы — фиксированные пакеты токенов, которые автоматически продлеваются каждый месяц.
  • Дополнительные пакеты — разовые покупки токенов, которые действуют только до конца оплаченного по основному тарифу месяца.

Основные тарифы

Списание за тариф выполняется единоразово в момент создания агента или смены его тарифа. В следующем месяце тариф будет продлен, также единоразовым списанием. Токены, не израсходованные в текущем месяце, сгорают.

Модель

0,5 млн токенов

1 млн токенов

2,5 млн токенов

5 млн токенов

10 млн токенов

25 млн токенов

GPT-4.1-nano

30 ₽

60 ₽

150 ₽

250 ₽

450 ₽

1 100 ₽

GPT-5-nano

30 ₽

60 ₽

150 ₽

250 ₽

450 ₽

1 100 ₽

GPT-4.1-mini

100 ₽

200 ₽

450 ₽

850 ₽

1 500 ₽

3 500 ₽

GPT-5-mini

120 ₽

250 ₽

500 ₽

1 000 ₽

1 800 ₽

4 000 ₽

GPT-4o-mini

150 ₽

300 ₽

650 ₽

1 200 ₽

2 400 ₽

5 500 ₽

GPT-4.1

500 ₽

1 000 ₽

2 100 ₽

4 000 ₽

8 000 ₽

19 100 ₽

GPT-5

660 ₽

1 100 ₽

2 500 ₽

5 000 ₽

9 500 ₽

23 200 ₽

GPT-4o

1 200 ₽

2 400 ₽

5 500 ₽

10 500 ₽

20 200 ₽

48 800 ₽

DeepSeek-chat

36 ₽

60 ₽

143 ₽

276 ₽

528 ₽

1 275 ₽

DeepSeek-reasoner

36 ₽

60 ₽

143 ₽

276 ₽

528 ₽

1 275 ₽

grok-3-mini

36 ₽

60 ₽

150 ₽

280 ₽

520 ₽

1 200 ₽

grok-code-fast-1

100 ₽

200 ₽

450 ₽

850 ₽

1 500 ₽

3 500 ₽

grok-3

1 000 ₽

1 800 ₽

4 000 ₽

7 800 ₽

15 000 ₽

36 000 ₽

grok-4

1 000 ₽

1 800 ₽

4 000 ₽

7 800 ₽

15 000 ₽

36 000 ₽

grok-4-fast

36 ₽

60 ₽

150 ₽

280 ₽

520 ₽

1 200 ₽

Gemini 2.0 Flash-Lite

20 ₽

35 ₽

80 ₽

160 ₽

300 ₽

750 ₽

Gemini 2.5 Flash-Lite

30 ₽

60 ₽

150 ₽

250 ₽

450 ₽

1 100 ₽

Gemini 2.0 Flash

30 ₽

60 ₽

150 ₽

250 ₽

450 ₽

1 100 ₽

Gemini 2.5 Flash

150 ₽

300 ₽

650 ₽

1 200 ₽

2 400 ₽

5 500 ₽

Gemini 2.5 Pro

660 ₽

1 100 ₽

2 500 ₽

5 000 ₽

9 500 ₽

23 200 ₽

Claude Sonnet 4

1 000 ₽

1 800 ₽

4 000 ₽

7 800 ₽

15 000 ₽

36 000 ₽

Claude Opus 4.1

5 100 ₽

8 500 ₽

20 100 ₽

39 000 ₽

74 800 ₽

180 600 ₽

Claude Sonnet 4.5

1 000 ₽

1 800 ₽

4 000 ₽

7 800 ₽

15 000 ₽

36 000 ₽

Claude Haiku 4.5

535 ₽

891 ₽

2 116 ₽

4 099 ₽

7 841 ₽

18 934 ₽

Qwen 3 Flash

27 ₽

45 ₽

107 ₽

207 ₽

396 ₽

956 ₽

Qwen 3 Max

396 ₽

660 ₽

1 568 ₽

3 036 ₽

5 808 ₽

14 025 ₽

Qwen 3 Plus

84 ₽

140 ₽

333 ₽

644 ₽

1 232 ₽

2 975 ₽

Определить оптимальное количество токенов, необходимое для вашего агента, можно только в процессе работы, понаблюдав за динамикой потребления.

В начале работы мы рекомендуем выбирать минимальный подходящий тариф и в дальнейшем увеличивать его при необходимости. Уменьшить тариф невозможно.

Дополнительные пакеты

Если вам нужно больше токенов, но следующий тарифный план избыточен или токены требуются только разово — вместо смены тарифа используйте дополнительные пакеты токенов, которые можно докупить в панели. 

Пакет позволит гибко настроить количество токенов с шагом в 250 тысяч и будет действовать только до конца текущего оплаченного месяца (можно определить по дате списания за тариф — в разделе «Баланс и платежи» → «История операций»).

Списание за пакет выполняется единоразово. Тариф при этом не изменится, и в следующем месяце будет списана стандартная стоимость тарифа.

Модель

250 000 токенов

GPT-4.1-nano

15 ₽

GPT-5-nano

15 ₽

GPT-4.1-mini

50 ₽

GPT-5-mini

60 ₽

GPT-4o-mini

80 ₽

GPT-4.1

250 ₽

GPT-5

330 ₽

GPT-4o

600 ₽

DeepSeek-chat

18 ₽

DeepSeek-reasoner

18 ₽

grok-3-mini

18 ₽

grok-code-fast-1

50 ₽

grok-3

500 ₽

grok-4

500 ₽

grok-4-fast

18 ₽

Gemini 2.0 Flash-Lite

10 ₽

Gemini 2.5 Flash-Lite

15 ₽

Gemini 2.0 Flash

15 ₽

Gemini 2.5 Flash

80 ₽

Gemini 2.5 Pro

330 ₽

Claude Sonnet 4

500 ₽

Claude Opus 3

2 550 ₽

Claude Opus 4.1

2 550 ₽

Claude Sonnet 4.5

500 ₽

Claude Haiku 4.5

267 ₽

Qwen 3 Flash

14 ₽

Qwen 3 Max

42 ₽

Qwen 3 Plus

198 ₽

База знаний

При создании базы знаний используется модель text-embedding-3-large, которая преобразует тексты в векторный формат. Это необходимо для индексации данных и последующей работы с ними.

Доступен единый тариф — 450 ₽ за 10 000 000 токенов.

При необходимости вы можете разово добавить токены по цене 60 ₽ за 1 000 000 токенов, нажав кнопку «Добавить токены» в панели управления базой знаний.

Scr 20251118 Mhxd

Дополнительные токены будут добавлены до конца оплаченного периода. То есть, если следующее списание за единый тариф произойдет через два дня, — дополнительные токены пропадут через два дня.

Токены расходуются на индексацию базы, а также на все запросы к ней.

Списание за тариф выполняется единоразово, в момент создания базы. В следующем месяце тариф будет продлен, также единоразовым списанием.

При создании базы знаний создается облачная базы OpenSearch, которая необходима для хранения данных. Выбирайте минимальный подходящий тариф — в дальнейшем его можно будет увеличить. Уменьшение тарифа недоступно.

Списания за базу данных почасовые.

Расход токенов при индексации зависит от формата загружаемого файла. Ниже — пример приблизительного потребления токенов при загрузке документов разных объемов:

Формат

1 МБ

10 МБ

100 МБ

500 МБ

.txt

240 000

2 400 000

24 000 000

120 000 000

.csv

450 000

4 500 000

45 000 000

225 000 000

.xml

62 000

620 000

6 200 000

31 000 000

.htm, .html

39 000

390 000

3 900 000

19 500 000

.md

221 000

2 210 000

22 100 000

110 500 000

Фактический расход может отличаться в зависимости от структуры и содержания файла.

Была ли статья полезна?
Ваша оценка очень важна
Пока нет комментариев