Sun
您当前的位置: www.7003.com > www.c600.com >

为啥不消Python识别语音并作出相应

浏览次数: | 时间:2019-09-06

  p.s. 写代码两个多小时,写文章大半天,从一团恍惚的概念到语义化,也需得颠末思虑、组织、融合。有待改良的处所,还请多多指教。

  一共六次,前5次都能够识别并婚配到,第6次测试等候之外的,不响应。INFO为一般输出,DEBUG输出google办事识别到的成果(不是所有成果,第一条婚配则忽略后面识此外多条成果),WARNING输出响应的语音(由于没有录正在文章里听不到,所以输出看看说了什么)

  去噪函数adjust_for_ambient_noise()正在音频中取一段噪声(duration时间范畴,默认1s),来优化识别。由于原音频很短,所以这里只取了 0.2s 噪声。

  本人录了一段语音youseesee.wav(内容为悄悄(雷同悄然话,声带不强烈震动)说的你看看你看看,持续两秒)。音频文件格局能够是WAV/AIFF/FLAC

  很便利:好比磐石欠好识别,就用(磐石)+找出一个婚配即可;你看看你看看用回溯\1。由于婚配时候发觉说的快了有时婚配一个看,就用了你看看?来婚配你看,其实后面的看?要不要都能够,但为了申明目标,仍是没有去掉。

  比及显示录音中,起头措辞,缄默后录音竣事。试验中说了两次:一次是你看看你看看,二次是你再看看。成果打印如下:

  你看看,你看看你看看,你瞅啥,磐石,666,哈哈哈 (文字为了申明抽象化,传输过去只是音频)

  到这里用不到60行代码就实现了语音识别并响应的功能。(我不喜好如许说行代码就实现了X功能,号里收集上各类关于Python文章着这种题目,很令人反感。代码短是Python那些模块写得好,该当感激的是列位前辈们,而不是自鸣得意到起噱头题目并吸引一些急躁的人前来。本人。)

  show_all前面有引见,当上例中该参数为False时语音识别成果test输出呵呵你看看,为True时输出所有可能的识别成果:

  之后阐发语音,只是简单找了识别成果能否包含等候值你看看,找出一个则暗示准确识别并婚配,输出Bingo!

  通过别的两个函数参数还能够领会到:lanauage(指定识此外言语),show_all(False前往识别率最高的一条成果,True前往所有识别成果的json串字典数据)

  识别率挺高,(还试过百度的baidu-aip,因我的音频没识别出来做罢),语音转文字就完成了。

  起因是一个工做中喜好说口头禅的同事,今天老说“你看看你看看 操不费心”。说了几回之后我就正在他说完“你看看”后面续上,“操不费心”。来去多次后,我就想,为啥不消Python识别语音并做出响应,正好没弄过语音识别。

  参考Python语音识别终极指南,吐槽一句:质量太差,是最烂的无审查的机翻。引模块两头都没空格importspeech_recognitionassr该当是import speech_recognition as sr;并建立识一个体器类的例子该当是并建立一个识别器类的例子这块都不只仅是机翻了吧,怎样会拆了词。可是为了领会API脚够了。

  语音转文字利用谷歌云平台的语音转文字办事[Google Cloud Speech API](,由于是不需要API密钥的。其实是由于有默认密钥:

  如许识别率就高了。由于识别成果婚配时候从头往后婚配每个正则,碰到则完成,所以(你看看?){1}.*\1需放正在(你看看?)+前面。否则语音识别到你看看你看看就只能触发(你看看?)+了。