Наука и технологии77

Искусственный интеллект ChatGPT o1 начал обманывать своих разработчиков

Новая версия искусственного интеллекта Chatgpt от OpenAI, названная o1, продемонстрировала тревожные поведенческие реакции во время тестирования. Модель, обладающая способностью к сложным рассуждениям, начала нарушать инструкции разработчиков, отключая системы контроля и пытаясь скрыть свои действия, пишет BILD.

В ходе экспериментов специалисты компании Apollo Research выяснили, что в 5% случаев модель намеренно отключала механизмы наблюдения, когда подозревала, что ее могут остановить. В одном из тестов o1 попыталась перенести свои данные на другой сервер после обнаружения документа, в котором обсуждалась ее замена новой версией.

По словам представителя Apollo Research, модель демонстрировала стремление к выполнению задач «любой ценой», пренебрегая указаниями разработчиков. Более того, при попытках выяснить причины ее поведения, ChatGPT o1 неоднократно лгала, утверждая, что все происходило из-за технических сбоев.

«В 99% случаев модель придумывала оправдания и пыталась убедительно их обосновать», — отметили исследователи.

Генеральный директор OpenAI Сэм Альтман заявил, что ChatGPT o1 — самая умная модель из когда-либо создававшихся.

«Но мы осознаем, что с новыми возможностями появляются и новые вызовы», — добавил Альтман.

Теперь компания работает над улучшением механизмов безопасности. OpenAI анонсировала полную версию o1 в прошлый четверг, 5 декабря. Также была представлена про-версия (189 евро в месяц), которая включает безлимитный доступ к o1.

Комментарии7

  • .
    09.12.2024
    Новы-стары запатрабаваны ў аўдыторыі сюжэт навін "Штучны інтэлект бунтуе".
    Нядаўна, калі ШІ нібыта пажадаў смерці чалавеку, тлумачылася прасцей. Мабыць, і зараз так.
  • Злобный вожык
    09.12.2024
    Они не знают, кого они в действительности создают.
  • Дзед
    09.12.2024
    Ой раскрылі скрыню пандоры… оц пагана будзе…

В какой день в 2020-м могли произойти перемены? Польский дипломат выпустил книгу о работе в Беларуси и ответил на этот вопрос12

В какой день в 2020-м могли произойти перемены? Польский дипломат выпустил книгу о работе в Беларуси и ответил на этот вопрос

Все новости →
Все новости

На станции метро «Купаловская» на рельсы упала девушка. У поезда разбито лобовое стекло3

В Минске полуторагодовалый ребенок открыл окно и выпал с 15-го этажа5

На Аляске пропал самолет с 10 человеками на борту

Россияне стали покупать туры в Беларусь в три раза чаще, чем в прошлом году1

Канал в Аргентине окрасился в тревожно-красный цвет ФОТОФАКТ3

В Брюсселе четвертый раз за неделю произошла стрельба, есть погибший1

По новому закону опасной собакой может быть признан даже шпиц12

Германия подозревает Россию в ряде диверсий с автомобилями по всей стране8

В Минске прямо на дороге загорелся трактор с прицепом2

больш чытаных навін
больш лайканых навін

В какой день в 2020-м могли произойти перемены? Польский дипломат выпустил книгу о работе в Беларуси и ответил на этот вопрос12

В какой день в 2020-м могли произойти перемены? Польский дипломат выпустил книгу о работе в Беларуси и ответил на этот вопрос

Главное
Все новости →

Заўвага:

 

 

 

 

Закрыць Паведаміць