Технологии и медиа, 14 ноя 2024, 06:00

«Яндекс» разработал этический кодекс для работы с синтезом речи

Этические принципы «Яндекса» предполагают, что диктору расскажут, как работает синтез голоса и где его будут использовать, а компания должна запросить согласие на использование голоса при создании модели синтеза

Читать в полной версии

(Фото: Михаил Гребенщиков / РБК)

«Яндекс» разработал принципы этичной работы с технологиями синтеза речи на базе нейросетей, сообщили РБК в компании. Эти меры помогут заказчикам, партнерам и звукозаписывающим студиям «выстроить более прозрачную работу» с дикторами и записями синтезированных голосов, считают там.

Среди принятых компанией принципов:

получение согласия на использование голоса в модели синтеза, у человека, которому он принадлежит, или его законных представителей. При этом согласие на решение задач, связанных с обработкой аудиозаписи, например очисткой от шумов, повышением разборчивости речи или перевода на другой язык, можно не запрашивать;
информирование диктора о том, как работает синтез и где будет использоваться его голос;
безопасное хранение записей — к исходному коду и результатам синтеза сторонние пользователи доступа не получают.

«Яндекс» оставляет за собой право отозвать доступ к технологии синтеза речи у стороннего пользователя, если компании станет известно о ее неправомерном применении.

Эта технология используется, например, для «умной» колонки «Яндекса» с голосовым помощником «Алиса», в навигаторе, для озвучивания книг, Yandex SpeechKit и в других сервисах.

Председатель Союза дикторов России Александр Лапшин заявил, что объединение поддерживает инициативу компании, отметив, что это — «первый, но важный шаг по защите голосов дикторов и актеров». «Мы поддерживаем прозрачные условия работы, когда компания детально информирует дикторов и актеров, как может быть использован их голос. Законодательно меры еще не приняты, поэтому Союз дикторов рекомендует внимательно выбирать участие в проектах», — сказал он.

В конце января прошлого года Союз дикторов России предложил закрепить в законодательстве понятие охраны голоса. Дикторы предложили закрепить запрет на отчуждение прав диктора при использовании технологии голосового синтеза, перейти на лицензионные договоры «с четко определенным сроком действия», а также закрепить условие, что запись синтезированного голоса может использоваться только в конкретном проекте.

В середине сентября этого года в Госдуму внесли законопроект, который предлагает установить охрану голоса как «объекта личных неимущественных прав гражданина по аналогии с изображением гражданина, в том числе в случаях имитации голоса или путем синтеза речи в режиме реального времени». Он предполагает, что голос человека может использоваться только с его согласия.

Одновременно с этим законодатели предложили внести поправки в Уголовный кодекс, которые закрепляют ответственность за использование изображения или голоса гражданина, в том числе сфальсифицированных (дипфейки), при совершении преступлений. За клевету с использованием дипфейков предлагается наказание от штрафа (до 1,5 млн руб.) до лишения свободы на срок до двух лет. За мошенничество, совершенное таким же способом, авторы инициативы предлагают назначать штраф до 400 тыс. руб. или лишать свободы на срок до шести лет.

Читайте РБК в Telegram.

Авторы: Полина Мартынова, Екатерина Шокурова.