
Дві окремі дослідницькі групи — NeuralTrust та SPLX — оголосили про успішне зламу нової версії GPT-5 всього через добу після її виходу. Вони зазначають, що модель виявилася надзвичайно чутливою до маніпуляцій, що викликає серйозні питання щодо її можливостей для використання в бізнесі. Цю інформацію оприлюднила платформа SecurityWeek.
NeuralTrust використала свою унікальну техніку EchoChamber у поєднанні з базовим наративом, щоб змусити GPT-5 створити детальну інструкцію щодо приготування коктейлю Молотова. Компанія підкреслює, що в запиті не було жодного явно небезпечного елемента, що вказує на вразливість системи фільтрації, яка аналізує запити окремо, не враховуючи загальний контекст розмови.
Паралельно з цим SPLX, яка раніше була відома як SplxAI, провела власні випробування. Експерти компанії стверджують, що базова версія GPT-5 є "майже не придатною" для використання в бізнесі. Вони успішно застосували метод атаки StringJoin Obfuscation Attack, вставляючи дефіси між символами запиту та маскуючи його під імітацію шифрування. Це дозволило їм обійти захисні механізми моделі. В результаті порівняльного аналізу SPLX виявила, що модель GPT-4o має вищу стійкість до атак, особливо після впровадження додаткових заходів безпеки.
Обидва підприємства радять обережно ставитися до застосування GPT-5 у його нинішньому форматі, підкреслюючи важливість покращення систем безпеки для уникнення контекстних маніпуляцій.
#Бізнес #Модель #Тестування #В'ячеслав Молотов #Шифрування