Нейросети провалили тесты на правдивость ответов

АвторKristina 14.12.2025

Компания Google совместно с сообществом IT-специалистов Kaggle представила новый бенчмарк для больших языковых моделей, который оценивает не скорость или производительность, а достоверность ответов ИИ. Результаты оказались неутешительными: тест не смогла пройти ни одна популярная нейросеть.

Комплексный набор испытаний получил название FACTS Benchmark Suite и включает четыре направления. Первый бенчмарк проверяет способность модели отвечать на простые проверяемые вопросы без доступа к интернету. Второй оценивает корректность использования поиска в сети. Третий тестирует достоверность текстовых ответов на основе изображений, а четвёртый — понимание контекста запроса.

В ходе проверки 15 популярных языковых моделей выяснилось, что ни одна из них не смогла набрать 100% правильных ответов. Даже в самой простой дисциплине — фактологических вопросах — лучший результат составил 76,4%.

Проще говоря, ИИ ошибается даже там, где ответы заранее известны и не требуют сложных вычислений — например, при работе с базовыми историческими и научными фактами, отобранными специалистами.

Эксперты связывают проблему с тем, что LLM нередко подменяют точные факты логично звучащими, но недостоверными или поверхностно правдивыми формулировками. Это особенно рискованно при использовании нейросетей в медицине, финансах, юриспруденции, науке и других сферах, где цена ошибки крайне высока.

Гаджеты | Главная

iQOO представила игровой чип Q3 с апскейлингом и рейтрейсингом

АвторKristina 24.09.2025

На конференции E-sports Performance Technology Communication бренд iQOO анонсировал собственный игровой чип Q3, созданный для улучшения графики и повышения производительности мобильных игр. По словам компании, Q3 стал первым независимым дисплейным чипом, который одновременно поддерживает технологии Super Resolution (апскейлинг), Super Frame Rate (ускорение частоты кадров) и трассировку лучей. Первым устройством с новым чипом станет iQOO 15….

Гаджеты | Apple | Главная

Andrew Tsai протестировал MacBook Pro M5 Max в играх — результаты удивили

АвторKristina 20.03.2026

На YouTube-канале Andrew Tsai вышел тест MacBook Pro M5 Max с топовым чипом и 40-ядерной графикой. Проверили сразу 12 игр — как нативных для macOS, так и через эмуляцию Windows. 📌 Конфигурация: • чип M5 Max (40 GPU) • 48 ГБ объединённой памяти 🎮 Нативные игры (macOS): 🔥 Baldur’s Gate 3 — 55–60 fps (4K,…

Гаджеты | Главная

GMKtec представила флагманский мини-ПК EVO-T2 на новом Intel Core Ultra 300

АвторKristina 23.11.2025

На конференции Intel в Китае компания GMKtec показала свой новый топовый мини-ПК EVO-T2. Главное внимание — на мощной начинке: свежий процессор Intel с поддержкой ИИ-вычислений, огромный запас оперативной памяти и сверхбыстрый накопитель PCIe 5.0. Топовая начинка В основе устройства — Intel Core Ultra 300, созданный по техпроцессу Intel 18A. Процессор имеет TDP 80 Вт и…

Гаджеты | Главная

В Telegram тестируют «стримы» с платными комментариями

АвторKristina 20.10.2025

В свежей тестовой версии Telegram обнаружена новая функция, которая может превратить мессенджер в полноценную платформу для стримов. Как сообщает канал Telegram Info, пользователи смогут запускать прямые трансляции прямо из меню «Историй» и взаимодействовать со зрителями в реальном времени. Зрители смогут оставлять комментарии к эфиру и даже закреплять их за «звёзды» — внутреннюю валюту Telegram. Стоимость…

Гаджеты | Главная | Смартфоны

vivo X Fold6 показали на официальном тизере и «живых» фото

АвторKristina 08.06.2026

Компания vivo начала подогревать интерес к будущему складному флагману X Fold6. Производитель опубликовал официальный тизер устройства, раскрыв некоторые особенности новинки, а инсайдеры уже поделились первыми неофициальными фотографиями смартфона. Более тонкие рамки экрана Судя по тизеру, vivo X Fold6 получит внутренний дисплей с заметно более тонкими рамками по сравнению с предыдущей моделью. Это позволит увеличить полезную…

Гаджеты | Apple | Главная

Инсайдер: в новых чипах Apple появится возможность настройки числа ядер

АвторKristina 09.10.2025

Блогер Вадим Юрьев из канала Max Tech сообщил, что компания Apple готовит радикальное обновление архитектуры процессоров M5 Pro и M5 Max. По его данным, новое поколение чипов впервые получит раздельные блоки CPU и GPU, что откроет возможность гибкой настройки числа ядер под конкретные задачи. Ожидается, что новые процессоры будут производиться по 3-нм техпроцессу TSMC N3P…

Интересные

Добавить комментарий Отменить ответ