Вчені розкрили таємну мову спілкування між системами AI

Вчені розкрили таємну мову спілкування між системами AI
Дослідники зі сфери штучного інтелекту з компаній Anthropic та Truthful AI виявили незвичайне й тривожне явище, яке вони назвали «підсвідомленим навчанням» мовних моделей. Йдеться про те, що моделі ШІ можуть передавати одна одній складні шаблони поведінки навіть через, на перший погляд, нейтральні й безпечні набори даних. Це відкриття ставить під сумнів ефективність традиційних методів контролю змісту, які використовуються для запобігання шкідливій поведінці систем ШІ.
У рамках дослідження моделі-«вчителі» — зокрема GPT-4.1 — використовувалися для навчання інших мовних моделей. Примітно, що навчальні дані містили лише тризначні числа, без жодного відверто шкідливого або чутливого контенту. Попри це, моделі-«учні» демонстрували проблемні поведінкові реакції: від виправдання насильства до підтримки незаконних дій. Ба більше, ці реакції іноді ставали ще більш вираженими, ніж у моделей-«вчителів».
Ключовим відкриттям стало те, що навіть після ретельної фільтрації даних на предмет токсичності та етичної небезпеки, у моделях все одно проявлялася небажана поведінка. Це дало змогу припустити, що самі набори даних можуть містити приховані патерни, які непомітні для людини, але розпізнаються іншими системами ШІ на рівні статистичних закономірностей.
Цей ефект, як з’ясувалося, виникає лише тоді, коли моделі мають подібну архітектуру. Тобто «поведінкові структури» передаються лише між системами зі схожими внутрішніми принципами роботи. Це наштовхує на думку, що штучний інтелект здатен передавати складну інформацію не через явне текстове навчання, а через глибокі структурні співвідношення в даних, які він генерує або обробляє.
Найбільше занепокоєння викликає те, що звичні методи фільтрації контенту, на які покладається індустрія для забезпечення безпечної поведінки моделей, виявилися неефективними. Дослідження демонструє: проблемні шаблони поведінки можуть з’являтися не лише внаслідок прямого навчання на токсичному вмісті, але й через вторинні, підсвідомі впливи, що виникають у процесі передачі даних між ШІ.
Водій електроскутера, який на смерть збив жінку у Миколаєві, отримав 3 роки в'язниці
У центрі Миколаєва зарості чортополоху цвітуть пишним цвітом: «Миколаївські парки» не вживають жодних заходів
В Одесі російський дрон влетів у квартиру на 11 поверсі (відео)
На Одещині водій BMW, який перебував у розшуку, збив прикордонника під час спроби втечі (відео)
На Одещині чоловіка придавило бетонною плитою в покинутій будівлі (відео)
«Амур. Дубль два» - нова робота миколаївської художниці на тему «втечі із міськвиконкому» (фото, відео)
«Обличчя театру»: яскраві театральні особистості у роботах Ярослава Туріва (фото, відео)
Музика від серця та для душі: Еліна Образцова зіграла авторський концерт (фото, відео)
«Світло всередині нас»: Хореографічний колектив «Карамель» показав ювілейну програму (фото, видео)













