Новая версия нейросети Qwen обошла Gemini и DeepSeek в тестах

АвторKristina 28.01.2026

Alibaba представила новую большую языковую модель Qwen3-Max Thinking, которая уже успела превзойти конкурентов в ряде ключевых бенчмарков. Главной особенностью новинки стал нестандартный подход к логическому «мышлению».

В отличие от классических LLM, использующих линейную генерацию токенов, Qwen3-Max Thinking применяет так называемый «тяжёлый режим» рассуждений. Модель задействует многоэтапную накопительную стратегию: анализирует промежуточные выводы, использует собственный опыт и перераспределяет вычислительные ресурсы на нерешённые участки задачи, избегая повторения уже известных шагов. Такой подход имитирует человеческий процесс рассуждения и помогает выходить из логических тупиков. При этом модель умеет одновременно работать как в режиме размышлений, так и в обычном режиме генерации.

В тестах производительности Qwen3-Max Thinking показала высокие результаты. В бенчмарке GPQA она набрала 92,8 балла, в LiveCodeBench v6 — 91,4 балла. В тесте на логическое мышление HMMT результат составил 98 баллов, что выше показателей Gemini 3 Pro (97,5) и DeepSeek V3.2 (92,5). В Humanity’s Last Exam (HLE) модель получила 49,8 балла против 45,8 у Gemini 3 Pro и 45,5 у GPT-5.2-Thinking. В Arena-Hard v2 Qwen3-Max Thinking набрала 90,2 балла, значительно опередив Claude Opus 4.5 с результатом 76,7.

По стоимости использования модель занимает промежуточное положение между Claude Haiku 4.5 и Gemini 3 Pro: 1 млн входных токенов оценивается в $1,2, а выходных — в $6. Попробовать Qwen3-Max Thinking можно через чат-бот Qwen Chat или с помощью API.

iPhone Air и Galaxy S25 Edge сравнили по автономности

АвторKristina 29.09.2025

В 2025 году Apple и Samsung представили ультратонкие флагманские смартфоны с относительно небольшими аккумуляторами. Автор YouTube-канала PhoneBuff протестировал их автономность в реальных сценариях использования. На первый взгляд преимущество было у Galaxy S25 Edge с батареей на 3900 мА·ч, тогда как у iPhone Air ёмкость составляет лишь 3149 мА·ч. Однако Apple сделала ставку на энергоэффективность чипа…

Гаджеты | Apple | Главная

AMD раскритиковала игровые возможности MacBook Neo в новой рекламной кампании

АвторKristina 16.06.2026

Компания AMD запустила новую рекламную кампанию, в которой решила напрямую сравнить ноутбуки на базе процессоров Ryzen AI с MacBook Neo. Производитель сделал особый акцент на игровых возможностях устройств и заявил, что ноутбук Apple поддерживает лишь небольшую часть популярных игровых проектов. AMD сравнила ноутбук HP с MacBook Neo В рекламных материалах AMD сопоставляет HP OmniBook X…

Гаджеты | Samsung | Главная

Samsung обновила утилиту Magician для SSD до версии 9.0

АвторKristina 02.12.2025

Samsung выпустила крупное обновление программы Magician — фирменной утилиты для управления SSD. С её помощью можно следить за состоянием накопителей, обновлять прошивку и настраивать параметры. Что нового Полностью переработан интерфейс: синий цвет заменён на тёмно-серую тему, рекламные баннеры убраны. Виджеты на главном экране теперь можно перемещать, добавлять и удалять, создавая собственную панель мониторинга. Поддержка Windows…

Гаджеты | Apple | Главная

Инсайд: Apple может представить «поумневшую» Siri уже в феврале

АвторKristina 27.01.2026

Apple готовится показать обновлённую версию Siri значительно раньше, чем ожидалось. Как сообщает Bloomberg, результат сотрудничества компании с Google могут представить уже в ближайшие недели. По данным источника, как минимум анонс переработанной Siri состоится во второй половине февраля. Ассистент будет построен на нейросети Gemini и получит заметно улучшенное понимание контекста запросов, а также расширенный набор функций….

Гаджеты | Xiaomi | Главная

Xiaomi SU7 Ultra установил рекорд круга на Нюрбургринге среди серийных электрокаров

АвторKristina 15.06.2025

14 июня 2025 Электрический седан Xiaomi SU7 Ultra официально стал самым быстрым серийным электрокаром на легендарной трассе Нюрбургринг Нордшляйфе. Модель показала впечатляющий результат — 7 минут 4,957 секунды на одном круге, установив новый рекорд для электрических серийных автомобилей. Добиться такого времени позволила высокоэффективная силовая установка: два фирменных электродвигателя V8 и один V6, обеспечивающие суммарную мощность…

Гаджеты | Главная | Смартфоны

Motorola раскрыла цену складного Razr Fold — почти $1900

АвторKristina 02.05.2026

Компания Motorola объявила стоимость своего нового складного смартфона Motorola Razr Fold. Новинка оказалась в премиальном сегменте — как и ожидалось. Цена и сроки продаж В США устройство оценили в $1899. — предзаказы стартуют 14 мая — в розницу смартфон поступит 21 мая Одновременно в продажу выйдет стилус Motorola Pen Ultra за $99. Характеристики уже не…

Интересные

Добавить комментарий Отменить ответ