Флагманська версія обходить DeepSeek та GPT-4o, а варіант для програмістів наблизився до Claude та GPT-4.
Alibaba
масштабне оновлення усієї лінійки ІІ-моделей Qwen3. Тепер вони не тільки конкурують з OpenAI та DeepSeek, але й у ряді завдань показують найкращі результати — особливо в галузі логіки, програмування та математики.
Що сталося:
- Qwen3-235B-A22B-Instruct-2507-FP8 – флагманська версія, яка обійшла конкурентів на іспиті American Invitational Mathematics Examination: 70,3 бала проти 46,6 у DeepSeek і 26,7 у GPT-4o. Модель також показала видатні результати в кодингу, набравши 87,9 балів у тесті MultiPL-E. Вже доступна в офіційному чаті-боті Alibaba.
- Qwen3‑Coder — нова модель для генерації коду, автоматизації робочих процесів і навіть виконання «агентних» завдань, коли ІІ сам береться за вирішення проблем. За потужністю вона наблизилася до Claude та GPT-4. Також доступна в чат-боті.
- Qwen-MT (qwen-mt-turbo) – оновлений перекладач, побудований на Qwen3. Підтримує 92 мови, використовує трильйони токенів для навчання перекладу та за швидкістю та вартістю роботи випереджає конкурентів, включаючи GPT‑4.1‑mini та Gemini‑2.5‑Flash. Модель доступна через API.
- Qwen3‑3B — легка версія із трьома мільярдами параметрів. Вона інтегрується в помічника HP Xiaowei Hui на китайських ПК і допомагає складати документи, резюмувати зустрічі та автоматизувати рутину.
Серія Qwen3 охоплює моделі з числом параметрів від 600 мільйонів до 235 мільярдів і вже увійшла до топ-3 найпотужніших відкритих великих мовних моделей у світі.
Схоже, тепер Alibaba робить ставку не лише на загальні функції, а й на ключові навички – математику та кодинг. А це перетворює Qwen3 на серйозну альтернативу західним рішенням.