首页 / Android的实时字幕现在可以理解表情

Android的实时字幕现在可以理解表情

2024/12/6 01:00:17
Google推出Android Expressive Captions,通过AI驱动技术,实时分析音频并生成带有情感和环境声音的字幕,超越传统字幕功能。该功能现向Android 14及以上设备推出,但可能需要几周时间对所有人可用。
Android的实时字幕现在可以理解表情
Android的实时字幕功能对某些内容来说是一个福音,但由于字幕是实时生成的,该功能只能将内容原样转录。现在,Expressive Captions出现了,为它们增添了一点色彩。未找到针对区域“below first paragraph”的获胜广告!未找到针对区域“mid intro”的获胜广告!Google 推出了一个新的功能,名为 Android 的 Expressive Captions。这个新功能由 AI 驱动,作为 Live Captions 的扩展,超越了传统的字幕,不仅传达了所说的话,还传达了语气、音量,甚至周围的环境声音。由 Google 和 DeepMind 开发的 AI 模型实时分析音频,将其翻译成反映演讲者情感和周围环境的风格化字幕。谷歌想象一下,看到字幕不仅显示有人大喊“生日快乐!”大写,还能表示笑声、掌声,甚至叹气。这种额外的信息层对于理解现场和社交内容的细微差别至关重要。这些表达在手动转录的字幕中很常见,但在AI生成的字幕中将非常有用,因为你可以收集到听音频时才能听到的社会线索。作为Live Captions的扩展,Expressive Captions在系统级别为你观看或收听的任何内容提供,例如实时社交媒体流或通过即时通讯服务发送的视频消息。由于是AI,字幕显然不会100%完美。它可能会捕捉到不存在的线索,或者未能捕捉到实际存在的线索。一旦该功能对所有人可用,它可能需要微调。不过,如果你有兴趣尝试,现在就试试吧。谷歌表示,该功能现在正在向任何运行Android 14及以上且支持实时字幕的智能手机推出,但可能需要几周时间才能对所有人可用。