Alibaba Cloud компаниясы тілдік модельдер қатарына жаңа буынды — Qwen 3 моделін қосты. Жаңа жүйе ModelScope платформасында қолжетімді және ChatGPT-ге ұқсас Tongyi Qianwen сервистеріне де енгізілген. Журналист ретінде бұл нейрожеліні бір аптадай сынақтан өткізіп, алғашқы әсеріммен бөліскім келеді.
Qwen 3 — қандай модель?
Qwen 3 — әртүрлі көлемдегі бірнеше ашық модельдер жиынтығы. Олардың қатарында ықшам Qwen1.5-0.5B, қуатты Qwen1.5-72B және диалогқа бейімделген Qwen1.5-Chat нұсқасы бар. Модель көптілді мәліметтер базасында оқытылған, мәтін өңдеу, код жазу, логикалық тапсырмаларды шешу мен деректерді талдауда жақсы нәтиже көрсетеді. Қазақ және орыс тілдерінде қолдануға болады.
Алайда аударма сапасы көңіл көншітпейді. Орысшадан қазақшаға немесе ағылшыннан орысшаға аударғанда жиі қателеседі — сөзбе-сөз калька, синтаксистік бұрмалаулар мен мағынадан ауытқулар байқалады. Негізгі ойды түсіну үшін жарамды болғанымен, сапалы контент жасауға келгенде GPT немесе Gemini сынды көшбасшылардан едәуір артта.
Кей сарапшылар Qwen 3-ті GPT-4o, Gemini Pro және DeepSeek сияқты алдыңғы қатарлы жүйелермен салыстыруды маркетингтік қадам ретінде бағалайды. Мен тегін нұсқасын сынап көргендіктен, оны дәл сол деңгейде салыстыру қиын. Десе де, болашағы бар, алайда әзірге бұл — тек алғашқы қадам.
Артықшылықтары қандай?
Qwen 3 бірқатар қызықты мүмкіндіктерімен ерекшеленеді:
Диалогты көшіру — қазіргі әңгімелесуді сақтап, оны балама бағытта жалғастыруға болады. Бұл — бәсекелестерде сирек кездесетін ерекше функция.
Чатты бекіту — маңызды диалогтарды тіркеп қоюға болады. Бұл көп тапсырмамен жұмыс істейтіндер үшін өте қолайлы.
Стильге бейімделу — мәтін құрастыру, код жазу, қайта жазу және мазмұндау тұрақты жұмыс істейді. Дегенмен, нарық көшбасшыларынан әлсіздеу.
Ашық лицензия (Apache 2.0) — модельді коммерциялық және ғылыми жобаларда еш кедергісіз пайдалануға мүмкіндік береді.
Кемшіліктері де бар:
Интернетке қолжетімділіктің жоқтығы. Яғни, Qwen 3 жаңа ақпаратты іздей алмайды. Білім көкжиегі — 2024 жылдың соңы, бірақ нақты мерзім белгісіз.
Аса сақтық танытады. Геосаясат, идеология, этика сынды сезімтал тақырыптарда модель бейтарап қалып танытып, нақты пікір айтудан қашады. Бұл корпоративті ортаға бейімделгенін аңғартады.
Кімдерге пайдалы?
Жазылымсыз қуатты LLM іздейтіндерге;
Көптілді деректермен жұмыс істейтіндерге;
Жасанды интеллектті зерттеп жүргендерге;
ЖИ шешімдерін өз өнімдеріне енгізгісі келетіндерге.
Алайда жауаптардың сапасы мен нақтылығына келгенде, GPT немесе Gemini-мен салыстырғанда, қосымша тексеруді қажет етеді.
Qwen 3 — икемді, әрі қолдануға ыңғайлы жүйе. Дегенмен, мазмұн сапасы мен ой еркіндігі тұрғысынан әлі де жетілдіруді қажет етеді.
Роман ПОПОВ, Качественный Казахстан