Я переключил Claude Code на Qwen3.7-Max и посчитал, сколько это стоит

Дмитрий Фоменко

26 мая 2026 г.6 минут чтения

Qwen3.7-Max Claude Code оптимизация затрат Anthropic API

20 мая 2026 Alibaba выкатила Qwen3.7-Max, которая отвечает на запросы в формате Anthropic. Это значит, что Claude Code не отличает её от настоящего Claude и переключается на неё двумя переменными окружения. По публичным прайс-листам выходит около трети цены Opus 4.7 на выходных токенах. Дальше показываю, как переключить, как считается стоимость по прайсу и где Qwen всё-таки проседает.

Что случилось 20 мая

Три факта. Каждый из них меняет арифметику счёта.

Контекст у Qwen3.7-Max заявлен в 1 миллион токенов. Это весь средний репозиторий, который влезает в одну сессию без танца с обрезкой и саммари. Максимальный размер ответа в одном запросе у модели 65 536 токенов; на большие листинги диффов хватает с запасом.

Дальше автономия. Alibaba показала прогон на 35 часов и 1158 вызовов инструментов в одной задаче. Стенд у них свой, чип их собственный, Zhenwu M890. Независимой проверки на знакомых задачах пока нет, и я подаю это с пометкой.

А деньги. У Alibaba 2,50 доллара за миллион входных токенов и 7,50 за миллион выходных. Кэш повторяющегося контекста срезает вход до 25 центов, это 90% скидки. Для сравнения Opus 4.7: 5 долларов на входе, 25 на выходе. На выходных токенах разница примерно в три раза. В агентных циклах выход и съедает основной счёт.

Столбчатая диаграмма цен за 1M токенов: Opus 4.7 output 25 долларов, input 5 долларов; Qwen3.7-Max output 7,50, input 2,50, кешированный вход 0,25 доллара

Цена за 1M токенов по публичным прайсам. На выходных токенах Qwen дешевле Opus примерно в три раза. Кэш повторяющегося контекста срезает вход ещё на 90%.

Anthropic API стал POSIX для агентов

Цифры выше работают только в одном контексте.

До этого мая китайские модели подключали к Claude Code через прокси-обёртки. Был DeepClaude. Под DeepSeek писали отдельный адаптер. Работало, но костыль: чужой клиент в маске Claude. У Alibaba впервые сама модель, без всяких прокси, отвечает по протоколу Anthropic.

И вот тут интересно. Anthropic API становится POSIX для агентов: один интерфейс, любая модель снизу. Anthropic пишет харнес (Claude Code, Agent SDK), Cline и OpenCode садятся на тот же протокол как сторонние клиенты, а на другом конце ставится любая модель, которая на нём разговаривает. Сегодня это Qwen. Завтра, скорее всего, к ним добавятся Kimi и GLM.

Для тех, кто сидит на Claude Code, расклад меняется. Вендор-замок ослабевает: клиент остаётся, модель под ним меняется одной строкой.

Схема: Claude Code через одну переменную окружения уходит либо в Anthropic API, либо в Qwen Model Studio

Один клиент на два endpoint'а. Переключение двумя строками в терминале.

Я переключил Claude Code за две строки

Никакой магии, проверил сам. Терминал, две переменные, запуск.

Переключение Claude Code на Qwen3.7-Max

export ANTHROPIC_BASE_URL=https://dashscope.aliyuncs.com/api/v2/apps/claude-code-proxy
export ANTHROPIC_AUTH_TOKEN=sk-...
claude

Дальше всё знакомо. /clear, /plan, tool-calls на месте. Снаружи та же сессия. Под капотом запрос уходит в Alibaba.

Сколько это стоит на типичном круге

Считать буду по публичным прайс-листам, чтобы любой читатель пересчитал по своим объёмам.

Возьмём один «круг» агентного кодинга в Claude Code: модель прочитала контекст репозитория и историю сессии, написала diff и короткие комментарии. Округлю до 30 000 входных токенов и 3 000 выходных. Это средний рабочий шаг. Не маленький промпт-вопрос, не полная загрузка репозитория.

Opus 4.7

Qwen3.7-Max

Вход, $/1M

Opus 4.7

5,00

Qwen3.7-Max

2,50

Выход, $/1M

Opus 4.7

25,00

Qwen3.7-Max

7,50

Кешированный вход, $/1M

Opus 4.7

0,50

Qwen3.7-Max

0,25

Один круг: 30K вход + 3K выход, без кеша

Opus 4.7

≈ 22,5 ¢

Qwen3.7-Max

≈ 10,0 ¢

Один круг с кешем входа

Opus 4.7

≈ 9,0 ¢

Qwen3.7-Max

≈ 3,0 ¢

Десять кругов с кешем

Opus 4.7

≈ 0,90 $

Qwen3.7-Max

≈ 0,30 $

Выигрыш на выходных токенах. Opus 25 долларов за 1M, Qwen 7,50, разница около 70%.

С кешем входа на повторяющемся контексте сессии Qwen3.7-Max выходит примерно в три раза дешевле Opus 4.7. Без кеша вилка чуть уже, около двух с третью.

И ещё про Opus 4.7. По официальной документации Anthropic, у него новый токенизатор: тот же текст может встать в +35% токенов против предыдущих моделей. Это сместит арифметику в сторону Qwen ещё чуть сильнее, потому что счётчики кэша и оплаты считают токены. Символы там никого не интересуют. Подставляйте свой коэффициент, если для вас это важно.

Где Qwen провисает против Opus

Три места, где я бы Opus всё равно не заменял.

Главная боль это задержка. Endpoint у Qwen в Ханчжоу, у Anthropic в США. Из Европы трафик до Ханчжоу идёт дольше; для длинного автономного прогона разница незаметна, а на быстром интерактиве каждый лишний раунд-трип чувствуется. Перед боевым внедрением имеет смысл прогнать пару типовых сессий с собственного сервера и сверить ощущения.

Фичи харнеса. У Anthropic есть computer use, vision и большая prompt-cache. Qwen реализует протокол не один в один: часть Claude-фич за пределами обычной правки кода может отвечать иначе или возвращать обрезанный результат. На рутинных рефакторингах и tool-calls этого не замечаешь. На специфических сценариях лучше проверить заранее.

Третий пункт волнует меня сильнее всего: юрисдикция. Alibaba Cloud сидит в Китае. Если в задаче лежат имена и телефоны клиентов из CRM, отправлять их сырыми на endpoint в Ханчжоу нельзя. Это персональные данные. Перед Qwen нужен посредник, который прячет имена и телефоны. Я к нему ещё вернусь.

Что это значит для тех, кто сидит на Claude Code

Лето сильно поменяет расклад. По двум линиям.

Цена агента больше не равна цене подписки Anthropic. Год назад выбора как такового не было: Max за 200 долларов или ничего. Сейчас вопрос другой: что гонять на Opus, что отдавать дешёвому совместимому бэкенду. Ночные кроны, контент-завод, рутинные рефакторинги отдаю Qwen. Дневной интерактив и тяжёлые задачи держу на Opus.

И вторая линия. С данными стало строже. Пока запрос ходил только в Anthropic, контракт был один. Появился второй провайдер, и контрактов уже два, юрисдикций тоже две. Если в Claude Code заходят клиентские данные, теперь надо самому решать, в какой endpoint и в каком виде их пускать.

Для CRM это уже отдельная задача. Прямой доступ к amoCRM из любой модели, неважно, Anthropic это или Alibaba, не вариант. Между моделью и базой стоит сервер-посредник. Ключ держит он сам. Номера и почты не светятся в ответе. Ходить можно только по личному ключу сотрудника. Когда он стоит, мне всё равно, какой endpoint за ним. Подключаете Qwen за треть цены и не отдаёте ни одной живой строки за пределы своего сервера.

Безопасный мост между ИИ и CRM

Как подключить хоть весь отдел к ИИ-работе с CRM и не отдать никому ключ от базы клиентов. Схема и 5 готовых промптов, чтобы собрать мост без программиста.

Открыть материал

Если кабинет уже есть, материалы и история заказов там.

Уже есть кабинет?

Материалы и история заказов под рукой в личном кабинете.

Войти

Итог простой. Один протокол на всех агентов. Две строки в терминале, чтобы переключиться. На типичном круге Qwen3.7-Max выходит примерно втрое дешевле Opus 4.7 по прайс-листам. Теперь у моделей две графы в прайс-листе: цена за миллион токенов и страна, где стоят сервера.