Alibaba прокачала лінійку ІІ-моделей Qwen3 – особливо в математиці та кодингу

Флагманська версія обходить DeepSeek та GPT-4o, а варіант для програмістів наблизився до Claude та GPT-4.

Alibaba представила масштабне оновлення усієї лінійки ІІ-моделей Qwen3. Тепер вони не тільки конкурують з OpenAI та DeepSeek, але й у ряді завдань показують найкращі результати — особливо в галузі логіки, програмування та математики.

Що сталося:

Qwen3-235B-A22B-Instruct-2507-FP8 – флагманська версія, яка обійшла конкурентів на іспиті American Invitational Mathematics Examination: 70,3 бала проти 46,6 у DeepSeek і 26,7 у GPT-4o. Модель також показала видатні результати в кодингу, набравши 87,9 балів у тесті MultiPL-E. Вже доступна в офіційному чаті-боті Alibaba.
Qwen3‑Coder — нова модель для генерації коду, автоматизації робочих процесів і навіть виконання «агентних» завдань, коли ІІ сам береться за вирішення проблем. За потужністю вона наблизилася до Claude та GPT-4. Також доступна в чат-боті.
Qwen-MT (qwen-mt-turbo) – оновлений перекладач, побудований на Qwen3. Підтримує 92 мови, використовує трильйони токенів для навчання перекладу та за швидкістю та вартістю роботи випереджає конкурентів, включаючи GPT‑4.1‑mini та Gemini‑2.5‑Flash. Модель доступна через API.
Qwen3‑3B — легка версія із трьома мільярдами параметрів. Вона інтегрується в помічника HP Xiaowei Hui на китайських ПК і допомагає складати документи, резюмувати зустрічі та автоматизувати рутину.

Серія Qwen3 охоплює моделі з числом параметрів від 600 мільйонів до 235 мільярдів і вже увійшла до топ-3 найпотужніших відкритих великих мовних моделей у світі.

Схоже, тепер Alibaba робить ставку не лише на загальні функції, а й на ключові навички – математику та кодинг. А це перетворює Qwen3 на серйозну альтернативу західним рішенням.

No votes yet.

Please wait...