
20 мая 2026 Alibaba выкатила Qwen3.7-Max, которая отвечает на запросы в формате Anthropic. Это значит, что Claude Code не отличает её от настоящего Claude и переключается на неё двумя переменными окружения. По публичным прайс-листам выходит около трети цены Opus 4.7 на выходных токенах. Дальше показываю, как переключить, как считается стоимость по прайсу и где Qwen всё-таки проседает.
Три факта. Каждый из них меняет арифметику счёта.
Контекст у Qwen3.7-Max заявлен в 1 миллион токенов. Это весь средний репозиторий, который влезает в одну сессию без танца с обрезкой и саммари. Максимальный размер ответа в одном запросе у модели 65 536 токенов; на большие листинги диффов хватает с запасом.
Дальше автономия. Alibaba показала прогон на 35 часов и 1158 вызовов инструментов в одной задаче. Стенд у них свой, чип их собственный, Zhenwu M890. Независимой проверки на знакомых задачах пока нет, и я подаю это с пометкой.
А деньги. У Alibaba 2,50 доллара за миллион входных токенов и 7,50 за миллион выходных. Кэш повторяющегося контекста срезает вход до 25 центов, это 90% скидки. Для сравнения Opus 4.7: 5 долларов на входе, 25 на выходе. На выходных токенах разница примерно в три раза. В агентных циклах выход и съедает основной счёт.
Цифры выше работают только в одном контексте.
До этого мая китайские модели подключали к Claude Code через прокси-обёртки. Был DeepClaude. Под DeepSeek писали отдельный адаптер. Работало, но костыль: чужой клиент в маске Claude. У Alibaba впервые сама модель, без всяких прокси, отвечает по протоколу Anthropic.
И вот тут интересно. Anthropic API становится POSIX для агентов: один интерфейс, любая модель снизу. Anthropic пишет харнес (Claude Code, Agent SDK), Cline и OpenCode садятся на тот же протокол как сторонние клиенты, а на другом конце ставится любая модель, которая на нём разговаривает. Сегодня это Qwen. Завтра, скорее всего, к ним добавятся Kimi и GLM.
Для тех, кто сидит на Claude Code, расклад меняется. Вендор-замок ослабевает: клиент остаётся, модель под ним меняется одной строкой.
Никакой магии, проверил сам. Терминал, две переменные, запуск.
export ANTHROPIC_BASE_URL=https://dashscope.aliyuncs.com/api/v2/apps/claude-code-proxy export ANTHROPIC_AUTH_TOKEN=sk-... claude
Дальше всё знакомо. /clear, /plan, tool-calls на месте. Снаружи та же сессия. Под капотом запрос уходит в Alibaba.
Считать буду по публичным прайс-листам, чтобы любой читатель пересчитал по своим объёмам.
Возьмём один «круг» агентного кодинга в Claude Code: модель прочитала контекст репозитория и историю сессии, написала diff и короткие комментарии. Округлю до 30 000 входных токенов и 3 000 выходных. Это средний рабочий шаг. Не маленький промпт-вопрос, не полная загрузка репозитория.
Вход, $/1M
5,00
2,50
Выход, $/1M
25,00
7,50
Кешированный вход, $/1M
0,50
0,25
Один круг: 30K вход + 3K выход, без кеша
≈ 22,5 ¢
≈ 10,0 ¢
Один круг с кешем входа
≈ 9,0 ¢
≈ 3,0 ¢
Десять кругов с кешем
≈ 0,90 $
≈ 0,30 $
С кешем входа на повторяющемся контексте сессии Qwen3.7-Max выходит примерно в три раза дешевле Opus 4.7. Без кеша вилка чуть уже, около двух с третью.
И ещё про Opus 4.7. По официальной документации Anthropic, у него новый токенизатор: тот же текст может встать в +35% токенов против предыдущих моделей. Это сместит арифметику в сторону Qwen ещё чуть сильнее, потому что счётчики кэша и оплаты считают токены. Символы там никого не интересуют. Подставляйте свой коэффициент, если для вас это важно.
Три места, где я бы Opus всё равно не заменял.
Главная боль это задержка. Endpoint у Qwen в Ханчжоу, у Anthropic в США. Из Европы трафик до Ханчжоу идёт дольше; для длинного автономного прогона разница незаметна, а на быстром интерактиве каждый лишний раунд-трип чувствуется. Перед боевым внедрением имеет смысл прогнать пару типовых сессий с собственного сервера и сверить ощущения.
Фичи харнеса. У Anthropic есть computer use, vision и большая prompt-cache. Qwen реализует протокол не один в один: часть Claude-фич за пределами обычной правки кода может отвечать иначе или возвращать обрезанный результат. На рутинных рефакторингах и tool-calls этого не замечаешь. На специфических сценариях лучше проверить заранее.
Третий пункт волнует меня сильнее всего: юрисдикция. Alibaba Cloud сидит в Китае. Если в задаче лежат имена и телефоны клиентов из CRM, отправлять их сырыми на endpoint в Ханчжоу нельзя. Это персональные данные. Перед Qwen нужен посредник, который прячет имена и телефоны. Я к нему ещё вернусь.
Лето сильно поменяет расклад. По двум линиям.
Цена агента больше не равна цене подписки Anthropic. Год назад выбора как такового не было: Max за 200 долларов или ничего. Сейчас вопрос другой: что гонять на Opus, что отдавать дешёвому совместимому бэкенду. Ночные кроны, контент-завод, рутинные рефакторинги отдаю Qwen. Дневной интерактив и тяжёлые задачи держу на Opus.
И вторая линия. С данными стало строже. Пока запрос ходил только в Anthropic, контракт был один. Появился второй провайдер, и контрактов уже два, юрисдикций тоже две. Если в Claude Code заходят клиентские данные, теперь надо самому решать, в какой endpoint и в каком виде их пускать.
Для CRM это уже отдельная задача. Прямой доступ к amoCRM из любой модели, неважно, Anthropic это или Alibaba, не вариант. Между моделью и базой стоит сервер-посредник. Ключ держит он сам. Номера и почты не светятся в ответе. Ходить можно только по личному ключу сотрудника. Когда он стоит, мне всё равно, какой endpoint за ним. Подключаете Qwen за треть цены и не отдаёте ни одной живой строки за пределы своего сервера.
Как подключить хоть весь отдел к ИИ-работе с CRM и не отдать никому ключ от базы клиентов. Схема и 5 готовых промптов, чтобы собрать мост без программиста.
Открыть материалЕсли кабинет уже есть, материалы и история заказов там.
Итог простой. Один протокол на всех агентов. Две строки в терминале, чтобы переключиться. На типичном круге Qwen3.7-Max выходит примерно втрое дешевле Opus 4.7 по прайс-листам. Теперь у моделей две графы в прайс-листе: цена за миллион токенов и страна, где стоят сервера.
Реверсивный скил: оцифровать опыт за вечер
Skill Creator выдаёт средний SKILL.md за пять минут. Я делаю иначе и расскажу как. Видео в начале, разбор в тексте.
Первый SEO вайб-сайта: как попасть в Google и Яндекс
Что сделать с сайтом в Cursor или Lovable, чтобы Google и Яндекс начали показывать его в выдаче. Без агентств и 80 страниц теории.
Нейросети из России и Беларуси: рабочая архитектура, а не костыль
Сервер в РФ или РБ не достучится до OpenAI и Claude напрямую. Разбираю, почему костыли вроде VPN и вызовов из браузера отваливаются и как собрать слой-посредник, который держит нагрузку в проде.