Google объявил об открытии доступа к технологии водяных знаков SynthID Text для всех разработчиков
Инструмент доступен для скачивания на платформе Hugging Face, а также через обновлённый Responsible GenAI Toolkit. Компания объявила, что исходный код SynthID Text теперь открыт для всех разработчиков и компаний, чтобы они могли лучше идентифицировать ИИ-контент.
Google утверждает, что качество, точность и скорость генерации текста не страдают, даже если текст был изменен или переведен. Однако технология имеет ограничения, особенно при работе с короткими текстами или ответами на фактические вопросы. В будущем возможно введение обязательных водяных знаков для контента, созданного ИИ, как это уже сделано в Китае.
Когда пользователь вводит запрос, например «Какой ваш любимый фрукт?», ИИ-модель предсказывает, какие слова (или токены) будут следовать друг за другом. Эти токены представляют собой базовые единицы текста — отдельные символы или слова. Модель присваивает каждому токену вероятность появления в результате, и на основе этого предсказания формируется текст. SynthID Text добавляет информацию в распределение этих вероятностей, корректируя их, чтобы встроить водяной знак.
Google — не единственная компания, работающая над подобными технологиями. OpenAI также исследует методы водяных знаков, но откладывает их выпуск из-за различных технических и коммерческих соображений.
Технологии водяных знаков могут помочь снизить количество ошибок, связанных с так называемыми «детекторами ИИ», которые часто ошибочно помечают эссе и статьи, написанные людьми, как созданные ИИ. Но пока неясно, будет ли какой-то стандарт или технология принята повсеместно.