尽管包括 Google、亚马逊和 Meta 在内的科技巨头,都将各自开发的功能强大的语音识别系统置于其软件和服务的核心地位。但在人工智能和机器学习领域,语音识别仍是一个颇具挑战性的话题。好消息是,今日 OpenAI 隆重地宣布了 Whisper 的开源 —— 可知作为一套自动语音识别系统,官方宣称它能够实现多种语言的强大转录、并将它们翻译成英语。
(来自:OpenAI Blog)
OpenAI 表示,Whisper 的不同之处,在于其接受了从网络收集的 68 万小时的多语言和“多任务”训练数据,从而提升了该方案对独特口音、背景噪声和技术术语的识别能力。
【资料图】
官方 GitHub 存储库上的概述称:
Whisper 模型的主要目标用户,是研究当前模型稳健性、泛化、能力、偏差和约束的 AI 研究人员。
与此同时,它也很适合作为面向开发者的自动语音识别解决方案尤其是英语语音识别。
感兴趣的朋友,可以从托管平台上下载 Whisper 系统的多个版本,其模型在大约 10 种语言上展现出了强大的 ASR 结果。
此外假如在某些任务上加以微调的话,它们还有望在语音活动检测、讲述者分类等应用场景下表现出额外的能力。
架构示意
遗憾的是,Whisper 尚未在相关领域得到强有力的评估、且模型也有其局限性 —— 有其在文本预测领域。
由于该系统接受了大量“嘈杂”的数据训练,OpenAI 决定提前给大家打一剂预防针,警告称 Whisper 可能在转录中包含实际上未讲述的单词。
原因可能是 Whisper 既试图预测音频中的下一个单词、又试图转录音频本身。
流程示例
此外 Whisper 在不同语言场景下的表现也不大一致,尤其涉及在训练数据中没有很好被代表的语言的讲述者时,其错误率也会更高。
不过后者在语音识别领域早已不是什么新鲜事,即使业内首屈一指的系统,也一直受到此类偏差的困扰。
参考斯坦福大学在 2020 年分享的一项研究结果 —— 相较于黑人,来自亚马逊、苹果、Google、IBM 和微软的系统,针对白人用户的错误率要低得多(大约 35%)。
Whisper 有约 1/3 的音频数据集为非英语
即便如此,OpenAI 还是认为 Whisper 的转录功能,可被用于改进现有的可访问性工具。其在 GitHub 上写道:
尽管 Whisper 模型不适用于开箱即用的实时转录,但其速度和大小表明,其他人可在此基础上构建近乎实时的语音识别和翻译应用程序。
建立在 Whisper 模型之上的有益应用程序,其价值切实地表明了这些模型的不同性能,有望发挥出真正的经济影响力。
我们希望大家能够将该技术积极应用于有益目的,使自动语音识别技术更易获得改进、让更多参与者能够打造出更负责任的项目。
在速度和准确性的双重优势下,Whisper 将允许对大量通信提供可负担得起的自动转录和翻译体验。
相关文章:
[视频]OpenAI展示DALL-E 2:AI图像生成器支持编辑图像了
OpenAI的DALL-E绘画AI 已能够扩展创作更大的图像
过滤系统升级:OpenAI再次开放DALL-E 2的面容编辑功能
-
焦点信息:小米新专利可实现摄像头手动变焦企查查APP显示,近日,北京小米移动软件有限公司申请的“相机...
-
世界速递!抖音完善图文等新内容建设,流量、产品、变现三大手段扶持图文作者鞭牛士报道9月20日,2022抖音创作者大会在抖音、今日头条、西...
-
【天天报资讯】优酷诉争酷头条商标被驳回 与酷娱头条构成近似天眼查App显示,近日,优酷网络技术(北京)有限公司与国家知...
-
微头条丨苹果新专利:折叠式iPhone可自行修复折痕据共富财经消息,苹果一项名为“具有柔性显示屏覆盖层的电子...
-
当前资讯!深耕智慧城市、数字经济 京东科技与安徽联通正式达成战略合作鞭牛士报道9月20日,京东科技与安徽联通战略合作框架协议签约...
-
60岁以上失能老人超4200万 “助浴师”让老人洗澡这么简单忙碌了一天,下班回到家,洗一个热水澡,舒服又解乏。这是普...
-
56家景区免门票!“十一”假期即将到来 这些景区继续免费即日起至今年底,山东济源王屋山、五龙口等5家景区对济南人民...
-
中国政法大学公示32名研究生放弃入学 校方:浪费了招生名额近日,一则研究生放弃入学资格的公示,引发网友热议。这则公...
-
近期长江流域多地持续旱情 气象干旱预警已连发34天近期长江流域多地持续旱情。目前,中央气象台已连续34天发布...
-
北电回应赵韦弦事件:将根据相关管理规定严肃处理北京电影学院学工部9月21日深夜发布公告,表示经警方初步查明...
- 智联世界,元生无界!快手虚拟人IP亮相2022人工智能大会
2022-09-07 10:47:54
- 机器人界“奥林匹克”!2022世界机器人大会8月18日举行
2022-08-10 09:58:58
- 2025年全球人口将达到90亿!机器人将在农业领域大显身手
2022-07-14 09:41:10
- 中科院院士蒋华良:AI+分子模拟与药物研发将大有可为
2022-07-14 09:37:00
- “千垛之城荷你有约” 2022兴化市荷文化旅游节正式开幕
2022-07-07 09:28:34