Вы можете отправить нам 1,5% своих польских налогов
Беларусы на войне
  1. Так освобожден или нет? В истории с «помилованием» Николая Статкевича выясняются все новые противоречивые подробности
  2. Европейский гуманитарный университет признали в Беларуси «экстремистской организацией»
  3. «Хватит с ними шутить». Лукашенко поручил главе КГК «по всей стране разобраться и посадить» тех, кто гробит важный для страны товар
  4. Беларусы подали коллективный иск против застройщика «Минск Мира»
  5. В Минском районе разбился мотодельтаплан. Два человека погибли
  6. «Тупо жалко свою жизнь». Исповедь разработчика, который после колонии смог устроиться только на 500 долларов (и вообще все сложно)
  7. Самое быстрое падение доллара в этом году: как сильно он подешевеет? Прогноз курсов валют
  8. «Буду вынужден просить у Александра Григорьевича остаться». Что за европейский политик начал нахваливать Беларусь на госТВ
  9. Директором самого популярного театра Беларуси назначили экс-милиционера и бывшего охранника
  10. Бывший серый кардинал Лукашенко занимается бизнесом — его дети тоже открыли свои дела. Рассказываем какие


/

На прошлой неделе американская технологическая компания OpenAI представила новейшие большие языковые модели искусственного интеллекта, получившие названия o3 и o4-mini. Однако, как показали тесты, обе модели, по-видимому, сделали значительный шаг назад: они склонны придумывать — или галлюцинировать — сильнее, чем их более ранние версии, пишет Naked Science.

Изображение носит иллюстративный характер. Фото: Freepik.com
Изображение носит иллюстративный характер. Фото: Freepik.com

По данным издания TechCrunch, новые модели OpenAI противоречат исторической тенденции, согласно которой каждая новая модель давала все меньше галлюцинаций, чем предыдущая, что позволяет предположить, что OpenAI теперь движется в неверном направлении.

Согласно результатам внутреннего тестирования OpenAI, o3 и o4-mini склонны к галлюцинациям чаще, чем старые модели, включая o1, o1-mini и даже o3-mini. Модель o3 выдала 33% ошибок на тесте точности компании. Это примерно вдвое больше, чем у предыдущих моделей OpenAI. Тогда как o4-mini показала еще более худший результат — 48%.

Хуже того, специалисты компании, похоже, не до конца понимают причины проблем. Согласно их техническому отчету, «необходимы дополнительные исследования, чтобы понять причину» этих ошибок.