В базах для обучения ИИ-генераторов изображений нашли 1000 файлов с детским порно

SIO: нейросеть Stable Diffusion обучалась на изображениях с насилием над детьми

Freepik

Более 1 тыс. изображений сексуального насилия над детьми было обнаружено в большом открытом наборе данных LAION-5B, который используется для обучения популярных ИИ-генераторов картинок по текстовому описанию. Среди прочих LAION-5B пользовалась популярная нейросеть Stabel Diffusion, говорится в исследовании Стэнфордской интернет-обсерватории (SIO).

По словам автора доклада Дэвида Тиля, летом 2023 года он обнаружил, что нейросети для создания изображений применяются для создания тысяч поддельных, но реалистичных изображений детской порнографии, которая затем быстро распространяется в даркнете.

Тиль и его коллеги выяснили, что ИИ производит подобный контент с помощью данных из общедоступной базы обучающих материалов LAION-5B, содержащей миллиарды различных изображений.

По данным издания Bloomberg, вскоре после публикации отчета SIO немецкая компания LAION, отвечающая за создание наборов данных для ИИ, временно отключила свои базы для проверки на предмет незаконного содержимого. LAION-5B и другие подобные массивы информации формируются в автоматическом режиме, добавляя в себя различные файлы из глобальной сети, среди которых может присутствовать запрещенный контент.

Однако удаление наборов данных не решит проблему, поскольку нейросеть Stable Diffusion версии 1.5 уже успела обучиться на каком-то количестве противоправного контента и способна продолжать воспроизводить подобные изображения.

Неизвестно, сколько пользователей успели скопировать эту модель и небезопасные обучающие базы для нее, поскольку Stable Diffusion относится к общедоступному программному обеспечению с открытым исходным кодом.

В SIO предложили в будущем исключить возможность использования образов детей в моделях, допускающих генерацию изображений эротического характера, либо вообще убрать изображения несовершеннолетних из открытых обучающих данных для нейросетей.

Ранее стало известно о случаях создания детской порнографии с использованием нейросетей.