Експеримент з тестом Тюрінга
Дослідження, проведене вченими з Університету Стоні-Брук та Каліфорнійського університету в Сан-Дієго, показало, що модель GPT-4.5 змогла видати себе за людину під час тесту Тюрінга. Стаття з описом експерименту була опублікована на сервері препринтів arXiv.
Ключові факти
- 73% успішних обманів GPT-4.5
- 56% — LLaMa-3.1-405B
- 21% — GPT-4o
Хронологія подій
- Проведення тесту Тюрінга
- Залучення учасників та моделей ШІ
- Аналіз результатів експерименту
Порівняння показників
| Модель | Результат | Норма |
|---|---|---|
| GPT-4.5 | 73% | Немає |
| LLaMa-3.1-405B | 56% | Немає |
| ELIZA | 23% | Немає |
| GPT-4o | 21% | Немає |
Обмеження тесту Тюрінга
Науковці зауважують, що отримані результати не можуть бути використані в реальних сценаріях через суб'єктивність суддів та специфічні умови тестування, які дозволяють ШІ адаптуватися до поведінки конкретного психотипу.