Mozilla更新公共语音数据集现在包括18种语言1400小时语音_业界资讯

来自：cnBeta

时间：2019-03-01

阅读：

Mozilla希望让初创公司，研究人员和业余爱好者更容易构建支持语音的应用，服务和设备。为此，它今天发布了最新版本的Common Voice，这是一个开源的语音数据集，现在包括来自42000名贡献者超过1400小时的语音样本，涵盖18种语言，包括包括英语、法语、德语、荷兰语、Hakha Chin语、世界语、波斯语、巴斯克语、西班牙语、中文、威尔士语和卡布语。

Mozilla声称，它是同类语言中最大的多语言数据集之一，比8个月前公开的普通语音语料库要大得多，其中包含了2万名英语志愿者500小时，40万份录音，而且语料库很快就会扩大。该组织表示，70种语言的数据收集工作正在通过通用语音网站和移动应用程序积极开展。

通用语音可以集成到Deepspeech中，这是一套由Mozilla的机器学习小组维护的开源的语音到文本、文本到语音引擎和经过培训的模型，它不仅包含语音片段，还包含一些自愿者提供的元数据，这些元数据可用于培训语音引擎，如演讲者的年龄、性别等等。

为了简化流程，Mozilla本周推出了一款改进的Common Voice网络工具，可以根据不同的提示进行剪辑，还提供了用于查看、重新录制和跳过剪辑的新控件。此外，它还推出了新的配置文件功能，允许用户跨语言跟踪进度和指标，并添加人口统计信息。Mozilla表示，在接下来的几个月里，它将尝试不同的方法来通过社区努力和新的合作伙伴关系，增加数据的数量和质量。最终目标旨在为那些寻求构建和使用语音技术的人提供更多更好的语音数据。

托尼大叔又玩花活了！他居然将AMD的旗舰锐龙9 9950X，达成了被动散热，而且性能没有任何损失，温度也压住了。这次尝试使用了华硕的新款机箱ProArt PA401，专为小型工作站和设计师准备

2024-12-12 16:50:52

微软在官方文档中宣布，Windows 11中的“建议措施”功能已被弃用，并将在未来的更新中删除。不过目前尚无具体的删除时间表，用户可能还有一段时间可以继续使用这一功能

2024-12-12 16:50:28

据韩国媒体报道，由于三星电子的8层和12层堆叠HBM3E内存样品性能未能达到英伟达的要求，今年内正式启动供应的可能性变得非常渺茫，实际供货预计将推迟至2025年。报道指出，三星电子

2024-12-12 16:50:11

在今天的一加游戏大会上，一加发布了行业首个芯片级游戏技术“风驰游戏内核”，号称是游戏性能“敢翻天”。一加Ace 5将首发搭载，可以彻底解决游戏场景下大

2024-12-12 16:49:54

挤了多年牙膏的iPhone，终于要改外观了。综合多个消息源线索，iPhone 17系列的ID设计将迎来重要改变。据@数码闲聊站爆料，从供应链物料看，iPhone 17系列确实改成了条形横置摄像头

2024-12-12 16:49:37

Intel酷睿Ultra 200S（Arrow Lake）处理器系列的0x114微码补丁已经曝光，但用户报告称其性能提升微乎其微。此前Intel副总监Robert Hallock在接受采访时承认，酷睿Ultra 200S系列处

2024-12-12 16:49:19

日前，有网友发帖表示，自己将Apple Watch贴在高铁窗玻璃上，结果被吸住取不下来了，网友称试过用手抠，用纸巾擦，手表都纹丝不动。随后，为什么Apple Watch会吸在玻璃上的话题在网上引起

2024-12-10 17:26:07

根据研究机构Omdia的报告，苹果计划在2026年对MacBook Pro进行重大设计更新，届时将引入OLED屏幕并采用无刘海的全新外观。这也将是自2021年以来MacBook Pro的最大设计变革，14寸

2024-12-10 17:25:44

今日，《黑神话：悟空》发布1.0.12.16581更新公告，Boss挑战模式、地图终于来了。更新已上线Epic，其他平台陆续更新。更新公告：新玩法：挑战通关至少一次游戏后，便可通过任一土地庙开启

2024-12-10 17:25:18

AMD代号为Strix Halo的的下一代旗舰APU锐龙AI MAX+ PRO 395，在Geekbench上的基准测试成绩首次曝光。这款APU搭载了16个Zen 5核心和Radeon 8060S集成显卡，拥有40个计算单元（CU），基

2024-12-10 17:24:56

全球科技圈都在为Sora疯狂，马斯克却轻轻给谷歌点了个赞（doge）。就在OpenAI“双12”第三天，谷歌在前沿科技的另一极出手了：发布最新量子芯片，5分钟内完成当今最快超级计

2024-12-10 17:24:17

据供应链消息，台积电在新竹县宝山工厂进行了2nm工艺的试产工作，其良品率达到了60%，超过台积电内部预期。据了解，在2nm工艺节点上，台积电的准备可谓全面，在晶体管架构上，台积电要在2

2024-12-07 20:12:09

Mark Gurman爆料，苹果明年将推出全新的iPhone 17 Air，替代Plus机型，与iPhone 17、iPhone 17 Pro和iPhone 17 Pro Max组成全新的苹果产品线矩阵。其中iPhone 17 Air是一款超薄机

2024-12-07 20:11:47

近日调研机构Canalys公布了2024年第三季度中国大陆智能手机市场出货量前十的机型，可以清楚的看到，iPhone依然是最受欢迎的。整体来看，出货量前十的机型中，苹果一家就有五款上榜，

2024-12-07 20:11:03

根据之前的消息，AMD将会在下个月举行的CES 2025上发布诸多新品，涵盖桌面端的锐龙9 9950X3D和9900X3D处理器，为掌机打造的Z2系列处理器，多款移动端处理器以及RDNA 4架构的独显等

2024-12-03 21:56:08

印尼投资部长今天表示，在因不符合当地内容规定而禁止销售iPhone 16后，印尼预计将在一周内获得苹果10亿美元的投资承诺。投资部长Rosan Roeslani在听证会上对议员表示，如果苹果

2024-12-03 21:55:49

Intel新一代Arc独显Battlemage（战斗法师）将于12月3日正式发布，包括B580、B570两款型号。公版卡的评测、性能将于12月12日解禁，12月13日解禁AIB非公版。根据最新爆料，Intel Arc B5

2024-12-03 21:55:27

今天，国产GPU龙头厂商景嘉微发布了关于公司新款图形处理芯片研发进展情况的公告。公告称，公司新款图形处理芯片（JM11系列）已完成流片、封装阶段工作，初步测试未发现异常，公司将继

2024-12-03 21:55:08

华为花瓣邮箱今天向用户发送邮件，宣布将从应用市场下架。官方表示，为了更好地适应产品体验、服务内容和当地市场不断变化的需求，华为对花瓣邮箱App进行了策略调整。具体来说，花

2024-11-30 21:12:04

据报道，苹果将在2025年底之前量产M5芯片，目前台积电已经获得了苹果订单。据悉，苹果M5芯片基于台积电先进的3nm制程打造，苹果没有着急上2nm工艺，主要是出于成本考虑。报道指出，苹果

2024-11-30 21:11:47

有开发者在小米澎湃OS代码中发现了高通骁龙8 Elite 2的踪迹，这颗芯片型号是SM8850，目前已在测试之中。据爆料，高通骁龙8 Elite 2仍然采用台积电3nm制程工艺，这次高通会使用台积

2024-11-30 21:11:32

高通下一代旗舰平台预计命名为第二代骁龙8至尊版（以下简称骁龙8 Elite 2），博主数码闲聊站爆料，高通骁龙8 Elite 2型号是SM8850，这颗芯片正在测试三星SF2和台积电第三代3nm（N3P）两种

2024-11-30 21:11:11

如果有世界上最会画大饼奖，我真的很想颁给这家公司。对 Adobe 有点了解的差友，应该会知道，它们有一个叫 Adobe Max 的活动，就类似于每年一次的发布会。因为主要是面向设计领域，所

2024-11-30 21:10:37

由漫威正版授权，网易旗下多平台6v6团队战术竞技射击游戏《漫威争锋》即将于12月6日正式全球上线。今日《漫威争锋》官方在推特发文表示，本作现已完成所有开发工作。（Gone gold）

2024-11-30 21:10:14

针对美国可能要求台积电加速将2nm以下先进制程在美落地生产的事情，台积电前董事长刘德音给出了自己的看法。台积电前董事长刘德音首次称，如果台积电最先进的技术到美国生产，可

2024-11-30 21:09:55

日前，日本知名COSER @Mamichi_913 在社交媒体上分享了她最新的《街头霸王6》蛛俐COS作品。除了高度还原的发型与妆容，她还完美捕捉到了角色邪魅与性感的独特气质，令人印象深刻

2024-11-30 00:44:42

微信最新在官网上架了Windows/macOS测试版4.0.1，虽说是测试版，但无需任何资格，人人都可下载使用。下载地址：Windows、macOS（英特尔芯片）、macOS（苹果芯片）其中Windows版微信首次支持

2024-11-29 21:49:33

将于明年举办的新一届国际固态电路大会ISSCC 2025，已经公布了日程和演讲主题，其中三星会带来等效频率高达42GHz(42Gbps)的新一代GDDR7显存！目前最快的显存是RTX 4080 SUPER上的

2024-11-29 21:49:13

今日，阿里巴巴创始人马云现身阿里巴巴西溪园区C区的照片在网上曝光，引起网友热议。网传图片显示，一身休闲装扮的马云，头戴一顶鸭舌帽，身穿灰白毛衣，搭配黑色运动球鞋，手拿咖啡，看起

2024-11-29 21:48:44

中国音数协游戏工委今天公布了“2024游戏十强年度榜提名名单”。其中《黑神话：悟空》及其出品公司杭州游科互动科技有限公司，在总计十个榜单中，上了七个榜单。分别是

2024-11-29 11:57:01

经过长达数月的等待，今天微软终于面向Slow通道用户发布了Windows 10 19H1（Version 1903）分支的预览版，最新版本号为Build 18342.8。这意味着自该版本开始微软将重心放在BUG修复

2019-02-28 20:59:51

使用智能手机的用户大都知道，五花八门的软件、APP经常会出现“系统升级”或者“版本更新”的提醒，一般情况下也没有引起太多的关注。而近日，网上一张疑似

2019-02-27 22:10:17

经过一年多的开发和测试，TinyMCE 5 正式版发布了！该版本可用于生产环境，TinyMCE 5 为开发者在集成和构建在线编辑器方面带来了显著的提升，对设计师而言可以无缝的植入到已有产品

2019-02-27 22:08:54

最近，Mozilla在第66版的Firefox中添加了Windows Hello支持。如果您在Windows 10设备上设置了Windows Hello以使用生物特征指纹或面部识别或PIN或通过FIDO2安全设备登录Window

2019-02-27 21:56:59

Mozilla Firefox 66 Beta 11今日发布，开发团队计划在 Firefox 66 中新增一个功能，该功能在默认情况下将阻止浏览器中的自动播放声音。 Mozilla 遵循 Google 的实现，它在 Chrome

2019-02-27 21:54:18

针对CentOS 6和Red Hat Enterprise Linux 6操作系统系列的重要内核安全更新已经发布，以解决最近发现的漏洞和其他错误。最主要的漏洞由红帽产品安全团队标记为具有“重

2019-02-27 21:51:22

微软刚刚发布了新款HoloLens 2虚拟现实设备，公司主管Alex Kipman还宣布，微软真的希望结束“围墙花园”模式，产品应该是开放的，包括其他网络浏览器和其他应用程序商店

2019-02-25 17:34:17

百度在2019年貌似没出现什么算法，但是在2月份刚过不久被站长吐槽网站被大规模的降权，此次波动造成的影响并非一般，不少超级大站一夜回到解放前，流量下滑的厉害。如：site机电之家

2019-02-24 23:44:23

2019年2月22日，NVIDIA发布了GeForce GTX 1660 Ti，一款全新的游戏GPU，它让当今最受欢迎的游戏的性能和能效比向前迈进了一大步。目前售价为2199元起。基于第12代TuringTM GPU架

2019-02-23 08:47:57

早前有报道称，苹果将在 Safari 12.1 中移除“请勿追踪”（Do Not Track）的选项，转而为用户提供更加智能的追踪防护体验。现在，根据苹果 WebKit 博客上分享的信息 &mdash

2019-02-22 18:19:41

2018-09-24

2019-02-01

2019-09-12

2019-04-09

2020-03-30

2019-06-25

2019-04-24

2019-09-23

2020-03-25

2019-09-21

Mozilla更新公共语音数据集 现在包括18种语言1400小时语音

热点内容

免费资源网

在线工具

扫一扫随时看

本站下载频道

Mozilla更新公共语音数据集现在包括18种语言1400小时语音