Китай снова в атаке: презентация нейросети Qwen2.5-Max от Alibaba.

0 11

Китай снова в атаке: презентация нейросети Qwen2.5-Max от Alibaba.

Qwen2.5-Max — это нейросеть, основанная на архитектуре Mixture-of-Experts (MoE), прошедшая предварительное обучение на более чем 20 триллионах токенов. Она была дополнительно дообучена с использованием методов контролируемого обучения и обучения с подкреплением с обратной связью от человека. Хотя на первый взгляд Qwen2.5-Max напоминает привычный чат-бот, её отличает высокая производительность в тестах, таких как MMLU-Pro и LiveCodeBench, где она превосходит такие модели, как DeepSeek V3 и GPT-4o. В то же время, модели OpenAI и DeepSeek R1 ориентированы на глубокий анализ и решение сложных задач, что открывает новые горизонты в развитии искусственного интеллекта.


Похожие новости

Публикации