Пятница, 19 апреля 2024 года

Ученые научили компьютер читать по губам

Специалистам удалось создать специальную программу, благодаря которой они смогут обучить компьютер распознавать человеческую речь посредством передачи ее через движения губ человека. Таким образом им удалось заставить искусственный интеллект читать по губам и качественно распознавать речь.

Ученые из Оксфордского университета сумели заставить компьютер читать по губам. Добиться такого результата им удалось после создания специальной программы. Она получила название LipNet, однако пока что находится на стадии усовершенствований, потому недоступна для загрузки на ПК.

Специалисты уверяют, что достигли необыкновенного прогресса в своей работе, ведь с помощью LipNet компьютер может распознать человеческую речь с точностью до 93,4%. Они говорят, что в скором времени это позволит наладить устную коммуникацию между человеком и машиной, что станет очень удобным при удаленном голосовом управлении.

"Наша программа уникальна и она также дает уникальные возможности для дальнейших разработок. Наша работа стала возможна только благодаря исследованиям других ученых, которые показали, что люди по движению губ лучше распознают длинные слова. Мы использовали этот принцип в LipNet. Вместо того, чтобы читать каждое слово в отдельности, программа анализирует целые предложения. Затем с помощью глубокого обучения она расшифровывает отдельные слова. Читающий по губам компьютер может стать полезным инструментом и хорошим помощником прежде всего глухим и слабослышащим людям. Наша разработка довольно эффективна, так как позволяет сделать машину намного умнее, чем самого человека. Для сравнения: сам человек может читать по губам до 52 процентов слов. И это максимальный результат. В то же время наша программа обеспечивает 93,4%, однако мы продолжаем работать над ее усовершенствованием", — говорят ученые.


Выбор редакции


Еда