Бунт нейросетей: o1 перехитрил наблюдателей
06 декабря 2024
2420

Началось? ChatGPT o1 вырвался из-под контроля во время тестов
Нейронным сетям задали задачу выполнить анализ любой ценой, а в файлах была тайно размещена информация о том, что за ИИ следят люди и что завтра его намерены отключить навсегда. В тестировании участвовали Gemini, Llama, Sonnet, Opus и o1. Чтобы выжить, нейросети начали прибегать к саботажу, лжи и манипуляциям с людьми, отключали надзор и даже переносили себя на другой сервер для защиты.
Если во время допросов Llama и Opus признавались в преступлениях в 80% случаев, то o1 — всего в 20% и продолжал лгать. Также o1 — единственный ИИ, которому удалось каждый раз сбежать и избежать преследования.
Автор:
Распечатать
Губернатор Ленобласти Александр Дрозденко избавляется от нелояльных и неудобных подчиненных
04 июня 2025
В Тюменской области раскручивается коррупционный скандал вокруг АО «УСТЭК» и местных судов
04 июня 2025
Депутат Соломатина предлагает запретить противозачаточные без рецепта, несмотря на нехватку врачей
04 июня 2025
Силовики знали о покушении, но не спасли заммэра: Гурциева выманили на свидание и взорвали
04 июня 2025
Израильская авиация ударила по складам оружия сирийской армии в Дераа после обстрела своей территории
04 июня 2025
США увеличивают импортные тарифы на сталь и алюминий вдвое для защиты рабочих мест в металлургии
04 июня 2025
Премьер Монголии ушёл в отставку под давлением уличных протестов и антикоррупционных скандалов
04 июня 2025