73% людей не впізнали ШІ: ChatGPT успішно маскувався під людину

Tech

Вчені з Університету Стоні-Брук та Каліфорнійського університету в Сан-Дієго провели експеримент, у якому модель GPT-4.5 змогла обманути більшість учасників тесту Тюрінга.

73% людей не впізнали ШІ: ChatGPT успішно маскувався під людину

Експеримент з тестом Тюрінга

Дослідження, проведене вченими з Університету Стоні-Брук та Каліфорнійського університету в Сан-Дієго, показало, що модель GPT-4.5 змогла видати себе за людину під час тесту Тюрінга. Стаття з описом експерименту була опублікована на сервері препринтів arXiv.

Ключові факти

  • 73% успішних обманів GPT-4.5
  • 56% — LLaMa-3.1-405B
  • 21% — GPT-4o

Хронологія подій

  1. Проведення тесту Тюрінга
  2. Залучення учасників та моделей ШІ
  3. Аналіз результатів експерименту

Порівняння показників

МодельРезультатНорма
GPT-4.573%Немає
LLaMa-3.1-405B56%Немає
ELIZA23%Немає
GPT-4o21%Немає

Обмеження тесту Тюрінга

Науковці зауважують, що отримані результати не можуть бути використані в реальних сценаріях через суб'єктивність суддів та специфічні умови тестування, які дозволяють ШІ адаптуватися до поведінки конкретного психотипу.