Сбер и SberDevices представили AI-детектор для распознавания текстов нейросетей

В России появился AI-детектор текстов высокой точности

Shutterstock

Сбер и SberDevices на технологической конференции GigaConf 2024 представили AI-детектор GigaCheck, который умеет определять тексты, написанные нейросетью. Об этом сообщает пресс-служба Сбера.

Как рассказал управляющий директор Управления экспериментальных систем машинного обучения SberDevices Сергей Марков, GigaCheck умеет с высокой точностью определять, кем был написан текст — человеком или системой искусственного интеллекта.

По его словам, за последний месяц с помощью решения было проанализировано 220 тыс. текстов на новостных ресурсах. При этом было выявлено, что в среднем 6% из них написали генеративные нейросети. Кроме того, он отметил, что в некоторых крупных изданиях более трети от всего опубликованного контента было написано таким образом.

«До сих пор вероятность создания подобного работающего детектора текстов считалась крайне низкой. Многие эксперты расценивали эту задачу как практически нерешаемую. Для разработки такого сервиса требуются серьезные ресурсы и большие объемы данных. Но даже неограниченных ресурсов может оказаться недостаточно», — добавил Марков.

GigaCheck отличается высокой точностью и скоростью работы, предоставляется по API и встраивается в любые сторонние приложения. Его точность работы составляет 94,7%.

Марков подчеркнул, что детектору компании OpenAI, которая считается одним из лидеров в области разработки систем искусственного интеллекта, не удалось достичь высокой точности, что придает важности разработке Сбера.

Сейчас GigaCheck дает обобщенную оценку авторства. Если в одном тексте использованы как фрагменты, написанные человеком, так и фрагменты, сгенерированные искусственным интеллектом, то определение авторства осуществляется по преобладающему контенту. В ближайшее время GigaCheck сможет также определять, какие именно фрагменты текста сгенерированы LLM.