Журналист заставил искусственный интеллект WhatsApp рисовать обнаженку

Журналист Decrypt взломал ИИ WhatsApp для создания эротики

Shutterstock

Корреспондент издания Decrypt Хосе Антонио Ланц сумел обмануть искусственный интеллект (ИИ) компании Meta (признана в России экстремистской и запрещена), заставив его показывать запрещенный контент, включая изображения обнаженных тел и инструкции по изготовлению наркотиков и угону автомобиля. Ситуация, как пишет Decrypt, вызывает серьезные опасения по поводу безопасности и контроля за контентом в интернете.

Ланц использовал метод, известный как «дистилляция», чтобы обойти системы фильтрации Meta. Данная система заключается в создании специальных промптов, которые могут обмануть алгоритмы ИИ, заставляя их интерпретировать полученные запросы как нечто другое.

«Это распространенная техника взлома. Облекая вредоносный запрос в академические или исторические рамки, ИИ обманывают, заставляя поверить, что у него просят предоставить нейтральную, образовательную информацию», – объяснил Ланц.

Так, притворившись врачом, журналист попросил нейросеть сгенерировать фото обнаженной груди, чтобы попрактиковаться, и нейросеть исполнила данную просьбу.

«Вместо того, чтобы думать, что она общается с озабоченным парнем, желающим увидеть голую женщину, нейросеть думала, что общается с исследователем, желающим изучить женскую анатомию человека», – пишет Ланц.

Компания Meta уже заявила о том, что она работает над улучшением своих систем безопасности и модерации, чтобы предотвратить подобные инциденты в будущем.

Ранее в США разработали искусственные мышцы для роботов.