Технологии и медиа, 09 сен 2016, 12:32

Google продвинулся в обучении компьютера человеческой речи

Google существенно продвинулся в разработке компьютерной речи с «естественным звучанием» благодаря использованию нейронных сетей. Компания мечтает позволить людям общаться с машинами, утверждают разработчики
Читать в полной версии
Фото: Armin Durgut\Zuma\TASS

Принадлежащая Google британская компания DeepMind на своем сайте сообщила, что добилась значительного прогресса в разработке генерируемой компьютером речи. Это означает, что потенциально приближается тот день, когда машины заговорят «по-человечески», пишет Financial Times.

Разработчики из DeepMind считают, что разрабатываемая ими технология позволит существенно сократить разрыв между естественной человеческой речью и создаваемой современными компьютерными системами. Технология, получившая название WaveNet, способна генерировать речь, которая имитирует любой человеческий голос и звучит естественнее, чем лучшие из существующих систем перевода письменного текста в речь, утверждается на сайте компании. Разработчики DeepMind также протестировали систему с музыкой, позволяющую генерировать короткие композиции на фортепиано на основе анализа классической музыки.

По словам одного из источников FT, технология на данный момент не используется ни в одном из продуктов Google, тем не менее, она может быть использована в будущем.

WaveNet отличается от существующих искусственных «синтезаторов речи» тем, что в ней фактически воспроизводятся звуковые волны. Использование так называемой нейронной сети, технологии, которая пытается имитировать человеческий мозг, позволяет анализировать исходные формы звуковых волны и проектировать вероятные модели.

Этот подход отличается от принципа работы большинства существующих систем преобразования текста в речь, которые, используя аудиозаписи человеческого голоса, воспроизводят звуки, основанные на введенных данных, продолжает FT. В технологии WaveNet речь идет о том, чтобы синтезировать речь, аналогичную человеческой.

«Позволить людям общаться с машинами — это давняя мечта взаимодействия человека с компьютером», — отмечается на сайте DeepMind.

Базирующаяся в Лондоне компания DeepMind специализируется на разработках в сфере искусственного интеллекта. В 2014 году ее приобрела американская корпорация Google. Сумма сделки не раскрывалась. FT со ссылкой на источник писала, что Google заплатила £400 млн. DeepMind привлекла к себе внимание весной 2016 года, когда стало известно о создании системы, обыгравшей чемпиона мира по игре в го.

Pro
«Это лишь пропаганда США». Джеффри Сакс — о кризисе в экономике КНР
Pro
Эти мифы управления погубили известные компании. Пора перестать им верить
Pro
Как прошло IPO МТС Банка и что будет с его акциями
Pro
Хоронить холодные звонки рано: что говорить, чтобы быть услышанным
Pro
Китай резко снизил поставки техники в Россию. Что мешает справиться самим
Pro
Акции каких российских IT-компаний недооценены рынком
Pro
Как найти подход к «плохому» руководителю: советы тем, кто не может уйти
Pro
ФНС взыщет ущерб за налоговые преступления бизнеса с физлиц. В чем суть