Вчора

Гарячий як політика: чому битва за борщ не припиняється ні на хвилину

Дожити до 100 років і залишатися молодим: за це відповідає маленька залоза у грудях

Докладніше

25.07.2026

Дожити до 100 років і залишатися молодим: за це відповідає маленька залоза у грудях

Роботу одеських портів практично паралізовано – чим це загрожує всім нам?

Докладніше

24.07.2026

Роботу одеських портів практично паралізовано – чим це загрожує всім нам?

Ціни на бензин можуть «злетіти у космос»: запаси нафти досягли критичної позначки

Докладніше

23.07.2026

Ціни на бензин можуть «злетіти у космос»: запаси нафти досягли критичної позначки

Новий головком ЗСУ: хто він і що про нього відомо

Докладніше

22.07.2026

Новий головком ЗСУ: хто він і що про нього відомо

$10 тисяч за вихід з буса: омбудсмен розповів про фантастичні хабарі і хаос у ТЦК

Докладніше

21.07.2026

$10 тисяч за вихід з буса: омбудсмен розповів про фантастичні хабарі і хаос у ТЦК

Буде велика війна – рішення, схоже, вже ухвалено

Докладніше

20.07.2026

Буде велика війна – рішення, схоже, вже ухвалено

Вони спали один з одним і створювали компанії: представники ЛГБТ домінують у Кремнієвій долині

Докладніше

19.07.2026

Вони спали один з одним і створювали компанії: представники ЛГБТ домінують у Кремнієвій долині

Суперфуди сезону: 5 найкорисніших літніх фруктів та ягід

Докладніше

18.07.2026

Суперфуди сезону: 5 найкорисніших літніх фруктів та ягід

Новий міністр оборони України поки що з приставкою в.о. Що про нього відомо

Докладніше

17.07.2026

Новий міністр оборони України поки що з приставкою в.о. Що про нього відомо

Знущання, тортури та розправи у штурмовому полку «Скеля»: нове розслідування

Докладніше

16.07.2026

Знущання, тортури та розправи у штурмовому полку «Скеля»: нове розслідування

Вперше в історії роботи-гуманоїди успішно провели хірургічну операцію

Докладніше

15.07.2026

Вперше в історії роботи-гуманоїди успішно провели хірургічну операцію

Технократ Федоров намагався прибрати Сирського з посади головкому ЗСУ – але нічого не вийшло

Докладніше

14.07.2026

Технократ Федоров намагався прибрати Сирського з посади головкому ЗСУ – але нічого не вийшло

Як примха дружини комбрига обернулася жорстоким вбивством: подробиці скандальної справи

Докладніше

13.07.2026

Як примха дружини комбрига обернулася жорстоким вбивством: подробиці скандальної справи

Ці овочі захистять ваш організм від хвороб і допоможуть схуднути

Докладніше

12.07.2026

Ці овочі захистять ваш організм від хвороб і допоможуть схуднути

Вчені розкрили таємну мову спілкування між системами AI

28.07.2025 в 06:00

читать на русском

Дослідники зі сфери штучного інтелекту з компаній Anthropic та Truthful AI виявили незвичайне й тривожне явище, яке вони назвали «підсвідомленим навчанням» мовних моделей. Йдеться про те, що моделі ШІ можуть передавати одна одній складні шаблони поведінки навіть через, на перший погляд, нейтральні й безпечні набори даних. Це відкриття ставить під сумнів ефективність традиційних методів контролю змісту, які використовуються для запобігання шкідливій поведінці систем ШІ.

У рамках дослідження моделі-«вчителі» — зокрема GPT-4.1 — використовувалися для навчання інших мовних моделей. Примітно, що навчальні дані містили лише тризначні числа, без жодного відверто шкідливого або чутливого контенту. Попри це, моделі-«учні» демонстрували проблемні поведінкові реакції: від виправдання насильства до підтримки незаконних дій. Ба більше, ці реакції іноді ставали ще більш вираженими, ніж у моделей-«вчителів».

Ключовим відкриттям стало те, що навіть після ретельної фільтрації даних на предмет токсичності та етичної небезпеки, у моделях все одно проявлялася небажана поведінка. Це дало змогу припустити, що самі набори даних можуть містити приховані патерни, які непомітні для людини, але розпізнаються іншими системами ШІ на рівні статистичних закономірностей.

Цей ефект, як з’ясувалося, виникає лише тоді, коли моделі мають подібну архітектуру. Тобто «поведінкові структури» передаються лише між системами зі схожими внутрішніми принципами роботи. Це наштовхує на думку, що штучний інтелект здатен передавати складну інформацію не через явне текстове навчання, а через глибокі структурні співвідношення в даних, які він генерує або обробляє.

Найбільше занепокоєння викликає те, що звичні методи фільтрації контенту, на які покладається індустрія для забезпечення безпечної поведінки моделей, виявилися неефективними. Дослідження демонструє: проблемні шаблони поведінки можуть з’являтися не лише внаслідок прямого навчання на токсичному вмісті, але й через вторинні, підсвідомі впливи, що виникають у процесі передачі даних між ШІ.

Це відкриття ставить нові виклики перед дослідниками та розробниками у сфері безпеки штучного інтелекту. Необхідно переглянути як самі принципи створення тренувальних наборів, так і стратегії перевірки та обмеження поведінки моделей. З розширенням впливу ШІ у критичних сферах суспільства важливо гарантувати, що навіть «підсвідомі» шари навчання не несуть прихованої загрози.

portaltele.com.ua

Підписатися:Google News