华盛顿大学团队开发出一种 AI 系统,让佩戴耳机的用户盯着说话的人三到五秒进行“锁定”。被称为“Target Speech Hearing”的系统随后会消除环境中的所有其它声音,只实时传送标记的说话者的声音,即使用户在嘈杂的地方走动且不再面对说话者。该系统可以在现有耳机上使用,概念验证代码发布在 GitHub 上,使用了非商业使用许可证,系统本身尚未发售。系统使用了机器学习软件学习选定的说话者的声音模式,然后锁定说话者的声音。
https://www.washington.edu/news/2024/05/23/ai-headphones-noise-cancelling-target-speech-hearing/
https://github.com/vb000/LookOnceToHear