Google发布语音指令数据集

2020年6月27日 17:57:52Linux大全评论2.1K views阅读模式

深度学习在语音识别方面的使用方兴未艾，但是可用的训练数据集却不多见。虽然Kaldi这种软件可以使用神经网络进行训练，但是复杂的操作吓退了很多小白。Google认识到，互联网上没有可供入门者快速入门深度学习的语言数据集，所以他们开源了语音指令数据集。

TensorFlow和AIY团队开源的数据集包含65000个录音，每个录音时长几秒钟，包含30个左右的单词。它们是通过网站采集而来的，参与人数达到了数千人。团队贴心地附上了训练和预测的TensorFlow示例代码。数据集基于署名4.0 国际（CC By 4.0）许可发布，Google表示将继续扩充这个数据集。Google还指出，这个数据集特别适合新手入门。此外，他们也开源了收集录音的工具。

对于想尝鲜的人，Google制作了一个基于TensorFlow的Android程序。程序会询问获取麦克风权限，随后会给出10个单词，程序将高亮显示已经被你读过的单词。

这个例子的效果和数据集有很大的关系，有可能不尽如人意，毕竟商业语言识别系统比这个复杂的多。Google希望随着更多的数据加入，模型的识别效果会日趋完善。

使用TensorFlow进行语言识别的教程可以在这里找到。使用最新版本的TensorFlow和主流配置，模型训练只需要几个小时。对神经网络进行微调可以解决不同的问题，例如不同的响应时间、大小，以及在不同平台上的准确度取舍问题。

Solaris 10下开启root远程访问的步骤

Solaris 10下开启root远程访问的步骤

卸载Linux系统分区经验

卸载Linux系统分区经验

Git 分支的创建、合并、管理和删除

Git 分支的创建、合并、管理和删除

JPPF 4.2.4 发布下载，Java 并行处理框架

JPPF 4.2.4 发布下载，Java 并行处理框架

Hibernate ORM 5.0.0.Beta2 发布下载

Hibernate ORM 5.0.0.Beta2 发布下载

Android短信应用——短信信息实时获取

Android短信应用——短信信息实时获取

inotify与rsync对服务器进行实时同步之sersync

inotify与rsync对服务器进行实时同步之sersync

FFmpeg多个未知细节安全漏洞

FFmpeg多个未知细节安全漏洞

Java后台JOSN转换为Stirng

Java后台JOSN转换为Stirng

Linux下Samba服务器搭建实例

Linux下Samba服务器搭建实例

本文由企鹅博客发表于 2020年6月27日 17:57:52
转载请务必保留本文链接：https://www.qieseo.com/300372.html

发表评论