在近日举行的NeurIPS大会上,发布了两册英特尔提供支持的关于口语数据集的白皮书,其中,《人的语言》主要涉及到“自动语音识别”任务,另一册——《多语种口语语料库》则涵盖“关键词识别”。这两个项目的数据集都贡献了大量丰富的音频数据,且每个数据集在同类中都拥有最大的可用体量。
《多语种口语语料库》由英特尔软件与先进技术事业部(SATG)的机器学习工程师Keith Achorn参与撰写。Keith在英特尔社区网站的博客中讲述了自己参与该项目的经历。
在ML Commons的支持下,“人的语言”和“多语种口语语料库”于2018年开始启动,该项目旨在识别世界上最常用的50种语言并统一到单一的数据集中,从而使这些数据得到有效利用。该项目小组成员来自英特尔、哈佛大学、阿里巴巴、甲骨文、Landing AI、密歇根大学、谷歌、百度等。
在当今多元化、国际化、多语言的工作环境中,准确转录和翻译的能力愈发重要。通过使用以上数据集,计算机可以“听到”口语单词,并自动生成文本或译文。
这两个项目都运用了“多样化语音”,这意味着它们可以更好地展现自然环境音,如背景噪音、非正式语言模式、录音设备混音以及其他声学环境等。这与诸如有声读物之类的高度受控的内容不同,后者产生的声音更加“纯净”。然而,在实际应用中,多样化语音训练有助于提高识别的准确性。
“人的语言”项目内含数万小时的对话音频。如今,它是世界上最大的、可免费下载的、用于学术和商用的英语语音识别数据集之一。
“多语种口语语料库”是一个音频语音数据集,不仅拥有超过30万个关键字的数十种语言,能够通过智能设备访问,还涵盖了50多亿用户的日常对话,有助于推动全球范围内受众语音应用的研发。
这两个数据集都将提供给广泛的用户进行应用,它们包括商用在内的授权许可条款都相对较为宽松。
原文标题:英特尔助力人工智能语言识别
文章出处:【微信公众号:英特尔中国】欢迎添加关注!文章转载请注明出处。
审核编辑:汤梓红
原文标题:英特尔助力人工智能语言识别
文章出处:【微信号:英特尔中国,微信公众号:英特尔中国】欢迎添加关注!文章转载请注明出处。
相关推荐
近期,上海开启“复工键”,在确保符合疫情防控要求的基础上,以龙头企业为牵引,以点带链、以链带面,不断....
由北京市中小企业公共服务平台、北京市软件和信息服务业协会主办的「数字经济生态共建交流会之AI应用创新....
科技见闻网 发表于 05-23 12:34
?
151次
阅读
湖南省专精特新“小巨人”培育是为贯彻落实省第十二次党代会报告关于“促进中小企业‘专精特新’发展”要求....
纳雷科技 发表于 05-23 10:59
?
162次
阅读
青岛市公安局地铁分局与云天励飞签署战略合作协议,并举行“智慧地铁警务联合创新实验室”揭牌仪式。双方将....
云天励飞 发表于 05-23 10:49
?
163次
阅读
强大的社会粘性不断催温数字化发展,目标检测与识别作为计算机视觉领域的一项关键技术,应用场景越发广泛,....
华为计算 发表于 05-23 10:01
?
189次
阅读
在一个由人工智能、数据和不断进步的连接技术主导的世界中,很难将“物联网”从创新和改变游戏规则的技术列....
明道物联网 发表于 05-21 15:06
?
437次
阅读
无论你是否关注新技术,都一定能感受到我们的生活方式发生了翻天覆地的变化。拿起电脑、手机就可以购物、就....
IBM中国 发表于 05-21 12:03
?
347次
阅读
自英特尔加入RISC-V国际基金会以来,英特尔在RISC-V上持续发声,最近也参加了巴黎举办的202....
E4Life 发表于 05-21 00:07
?
917次
阅读
近日,普渡科技正式创立“PUDU-X”创新基金,专门用于支持全国大学生机器人大赛ROBOCON赛事中....
科技绿洲 发表于 05-20 16:13
?
546次
阅读
当辩证性思维遇到机器学习算法时,数据科学可以帮助获得对业务更佳的见解,提高工作效率,并提供业务决....
人工智能不仅仅存在于云中;它将无处不在。本地设备的智能化、缩短的延迟、数据完整性、更快的执行力、....
NVIDIA 的 Kate Kallot 在非洲人工智能博览会上发表的主题演讲重点介绍了新兴地区如何....
在2022世界电信和信息社会日大会期间,中兴通讯与内蒙古大中矿业股份有限公司(简称“大中矿业”)在大....
科技绿洲 发表于 05-20 15:01
?
201次
阅读
如果您向--timingCacheFile选项提供时序缓存文件,则构建器可以从中加载现有的分析数....
数据类型是每个单独值的表示。它的大小决定了取值范围和表示的精度,分别是FP32(32位浮点,或单....
此外,中科创达还在边缘计算方面做了完整的布局,形成了完整的产业链,并基于TurboX平台形成智慧工厂....
科技绿洲 发表于 05-20 14:42
?
166次
阅读
“人才引进落户政策”“企业法人变更登记”“如何办理公积金贷款”……在智慧政务业务中,智能客服能够7*....
发表于 05-20 14:25 ?
30次
阅读
2022年5月18日,马萨诸塞州安多弗讯(GLOBE NEWSWIRE):5月18日,Vicor举办....
21克888 发表于 05-20 14:25
?
1076次
阅读
大约在 24 年前,Google 由两名研究生创立,当时 Google 拥有一个产品,以及一个远大的....
谷歌开发者 发表于 05-20 11:31
?
195次
阅读
在生命科学、深度学习、冷冻电镜、细胞治疗、分子模拟、蛋白质组学、疾病建模、靶点识别、药物设计、Alp....
近日,捷通华声与麒麟软件完成灵云全智能能力平台10E2、灵云智声一体机解决方案系统软件V6.0与银河....
科技绿洲 发表于 05-19 17:06
?
363次
阅读
上海移动联合华为发布了“自主创新新型算力核心能力”,同时基于华为昇腾AI基础软硬件平台,打造面向未来....
科技绿洲 发表于 05-19 16:55
?
352次
阅读
目前,传统金融机构与新兴金融机构都在积极拥抱人工智能、大数据、区块链、物联网、云计算等新兴科技,以期....
话说科技 发表于 05-19 16:19
?
332次
阅读
2022年5月19日,中国北京——今日,Graphcore?(拟未)携手腾讯云,正式发布腾讯云公有云....
21克888 发表于 05-19 16:16
?
663次
阅读
华为自2008年发布了未来种子、ICT学院等人才项目,150多个国家的154万人已从中受益。2021....
科技绿洲 发表于 05-19 15:48
?
389次
阅读
5月17日,在2022年中国电子信息产业博览会组委会指导下,CITE2022工业互联网发展与安全峰会....
芯盾时代 发表于 05-19 14:29
?
691次
阅读
加利福尼亚州圣克拉拉市—2022年5月18日—边缘人工智能与视觉联盟宣布Blaize荣获2022年边....
21克888 发表于 05-19 10:13
?
1361次
阅读
近日,北京捷通华声科技股份有限公司正式通过全球软件领域难度最大、规格最高的软件开发能力成熟度认证CM....
科技绿洲 发表于 05-18 16:48
?
274次
阅读
“AI再往下一步发展,需要一个具备支撑能力的基础设施,为AI所需要的算力、算法、数据核心三要素提供更....
近日,低压差线性稳压器(LDO)国内市占率领先的豪威集团发布了LDO新品——WL2848D系列。高精....
21克888 发表于 05-18 16:11
?
790次
阅读
此次延长了两家公司的长期合作伙伴关系,并提供了基于Cipia DMS的多神经网络架构的高效服务 (北....
电子行业新闻 发表于 05-18 15:23
?
184次
阅读
近日,中国信通院云大所于“AI工程化论坛”上发布全球首个AI模型开发管理标准——《人工智能研发运营一....
科技绿洲 发表于 05-18 15:21
?
408次
阅读
加利福尼亚州埃尔多拉多山—2022年5月18日—全球知名的生物识别技术公司Innovatrics与掀....
21克888 发表于 05-18 14:45
?
426次
阅读
流量红利的见顶,叠加疫情的反复,线上流量争夺持续升温。借助高黏性、强信任、低获客成本的熟人关系链,辅....
思必驰 发表于 05-18 14:40
?
346次
阅读
Kallot 在迄今为止规模最大的一届非洲人工智能博览会开幕当天向一万名线上观众发表了主题演讲。她重....
科技绿洲 发表于 05-18 14:22
?
250次
阅读
云计算、大数据及人工智能企业海航科技股份有限公司发布2022第一季度报告,具体内容如下。 一、 主要....
汽车玩家 发表于 05-18 11:53
?
363次
阅读
2022年5月17日,长沙千博信息技术有限公司、中国科学院自动化所、华为技术有限公司在长沙签署合作协....
科技绿洲 发表于 05-18 11:28
?
345次
阅读
cuBLAS,cuDNN, cuFFT, CUTLASS等运算库勉强算第四层,让用户可以通过调用NV....
佐思汽车研究 发表于 05-18 11:12
?
298次
阅读
IIfConditional实现了一个 if-then-else 流控制结构,该结构提供基于动态布尔....
说到智能家居你会想到什么,语音声控、自动感知、人性化设置、住宅家居一体化?随着综合布线技术、网络通信....
发表于 05-17 14:26 ?
39次
阅读
近日,人工智能软件公司商汤科技经英国标准协会审核后,获得了个人信息管理体系-BS10012:2017....
汽车玩家 发表于 05-16 16:46
?
439次
阅读
与工业自动化、预测性维护和更智能的工作环境相关的智能行业计划正在创造机会,将人工智能用作智能传感....
近日,商汤科技在个人信息与隐私保护方面再获权威审核机构的认可。
科技绿洲 发表于 05-16 14:58
?
338次
阅读
近日,商汤科技在个人信息与隐私保护方面再获权威审核机构的认可。
NeMo 是用于培训 对话人工智能 模型的框架。在 NeMo 存储库内的 released co....
A30 旨在通过提供四个视频解码器、一个 JPEG 解码器和一个光流解码器来加速智能视频分析( ....
距今已有2600余年的庞贝古城也开始用机器狗巡逻了。这些兢兢业业的四足机器人要穿过碎石瓦砾,或爬进摇....
四足机器人 发表于 05-16 09:14
?
58次
阅读
大数据及人工智能厂商博睿数据北京博睿宏远数据科技股份有限公司发布2021年报告,具体内容如下。 近三....
汽车玩家 发表于 05-16 09:02
?
297次
阅读
今后,深兰将继续秉承“人工智能,服务民生”发展理念,与全球更多优秀的合作伙伴携手,积极探索优势资源共....
科技绿洲 发表于 05-15 14:34
?
428次
阅读
本届大赛,由全国各昇腾生态创新中心与华为联合AITISA联盟、启智社区共同举办,并提供超1000万的....
科技绿洲 发表于 05-15 10:51
?
454次
阅读
硬件平台:迅为-RK3399开发板 系统:ubuntu项目:TensorFlow 测试 配套资料在网盘资料的“iTOP-3399 开发资料汇总(不含...
发表于 05-13 15:41 ?
1296次
阅读
每个人毕竟都不是专业摄影师,因为一些取景以及构图或者外在环境的因素,一些人像照片总会产生不很清...
发表于 05-01 13:18 ?
4170次
阅读
作者@Sipeed 原文链接:
发表于 04-29 15:06 ?
2094次
阅读
使用单片机、ESP8266、PWM驱动器、以及半导体加热片制作一个水温控制系统。
使用钢制器皿作为容器,最少容量100ml。
通过...
发表于 04-27 22:11 ?
891次
阅读
发表于 04-06 14:11 ?
10595次
阅读
英特尔正在使其GPU多样化,以与x86以外架构的处理器兼容,这可能是使其从芯片制造商成为以代工为首要业务的公司的一步。
英特...
发表于 03-29 14:41 ?
2452次
阅读
隐藏技术: 一种基于前沿神经网络理论的新型人工智能处理器 Copy
东京理工大学的研究人员开发了一种名为“ Hiddenite”的新型...
发表于 03-17 19:15 ?
4617次
阅读
AI教育行业现状是怎样的?
2017年国务院印发《新一代人工智能发展规划》,其中明确指出应在中小学阶段设置人工智能相关课程,...
发表于 03-15 10:54 ?
3829次
阅读
如何在RK3288上安装Opencv?
发表于 03-10 06:49 ?
1323次
阅读
RV1109优势和特点是什么?有哪些应用?
发表于 03-10 06:45 ?
1194次
阅读
评论