Google ‒ Искусственный интеллект теперь может выделять голос одного человека в шумной толпе

ИИ Google

Среди общего голосового шума выделить одного человека не сложно для нас. Компьютерам справиться с этим тяжелее. В Google придумали и реализовали решение. Нейронная сеть теперь обучена, чтобы выделять конкретные голоса и лица в то время, когда они издают звуки.
ИИ обучали определять говорящих отдельных людей, потом создавали виртуальную толпу с шумовым фоном, чтобы искусственный интеллект мог «выхватить» оттуда голоса и распределить их на разные дорожки. Как результат ‒ ИИ неплохо научился распознавать конкретный голос в шумной толпе и воспроизводить его в чистом виде. Даже если лицо говорящего человека видно не полностью, оно прикрыто или повернуто, все равно интеллект справляется с задачей.

Сейчас в Google думают о применении функции в своих приложениях и программах. В основном это Hangouts или Duo видеочаты, для выявления конкретных говорящих людей среди шумной компании. Еще полезной такая функция может быть при записи видео, что улучшит передачу речи. Также она пригодится, если совмещать камеру со слуховым аппаратом, с ее помощью голос собеседника можно выделить, а остальной шум убрать. Но, может возникнуть и проблема с использованием опции выделения голоса. Ведь станет возможным подслушивать конфиденциальные разговоры в публичных местах!!!

Добавить комментарий