La voix est de plus en plus une méthode utilisée pour interagir avec nos appareils, en plus d'être la seule méthode pour ceux qui ont besoin de ce type de méthodes d'accessibilité. Dans tous les cas, il est assez confortable de parler pour dicter du texte ou simplement de saisir des commandes vocales dans nos systèmes afin qu'ils effectuent une sorte d'opération sans utiliser leurs mains. Le problème est que reconnaissance vocale ils sont basés sur des moteurs qui utilisent des algorithmes mathématiques pour reconnaître la parole et ne sont pas fiables à 100%.
Les progrès technologiques apportent de plus en plus fiabilité à la perfection, et l'intelligence artificielle et les systèmes de Big Data contribuent également beaucoup à améliorer considérablement les programmes de reconnaissance vocale. Dernièrement, de nombreux efforts sont déployés pour améliorer au maximum ces systèmes, et de nombreuses études s'y concentrent pour améliorer le contrôle et en faire l'interface du futur. Gardez à l'esprit que les interfaces actuelles sont moins naturelles pour les gens et moins rapides que la voix.
Les systèmes de reconnaissance vocale auront une valeur d'environ 10 milliards de dollars dans les années à venir et c'est pourquoi les grandes entreprises se concentrent sur le développement d'assistants tels que Siri d'Apple, Cortana de Microsoft ou Mycroft pour Linux, en plus de devenir des produits de plus en plus populaires et fréquents tels qu'Amazon Echo, Google Home ou Apple HomePod pour la maison, ainsi que d'intégrer des systèmes de reconnaissance vocale sophistiqués dans les voitures connectées.
Cela dit, notre liste d'outils de reconnaissance vocale pour Linux sont:
- Julius: est un puissant moteur de reconnaissance vocale continue avec beaucoup de vocabulaire.
- Discours profond: est une implémentation TensorFLow de l'architecture DeepSpeech de Baidu.
- Simon: un logiciel de reconnaissance vocale assez flexible.
- Kaldi: est une boîte à outils de conception C ++ pour la recherche sur la reconnaissance vocale.
- CMUSphinx: dans ce cas, il s'agit d'un moteur de reconnaissance vocale pour les applications mobiles et les serveurs.
- deepspeech.python: est une implémentation de DeepSPeech avec Python et utilisant Baidu Warp-CTC.
Très bien, et y aura-t-il un bon TTS (synthèse vocale) pour Linux?
Sous Windows et Android, il existe des voix de très bonne qualité telles que Loquendo, Ivona ou NeoSpeech, mais elles ne sont pas pour Linux. Sous Linux, j'ai essayé les voix mbrola et picoTTS mais elles sont très robotiques.
Cepstral propose une voix Alejandra gratuite pour Linux, ce qui est plutôt bien, mais je ne savais pas comment l'installer.
Je marche de la même manière si tu as une bonne part
Vous pouvez utiliser loquendo avec wine sous Linux. Je recommande cette vidéo ...
https://www.youtube.com/watch?v=OfGxR_O0Vjk
J'ai essayé d'installer un assistant, je veux dire, Google Assistant et je n'ai pas pu, je suis resté dans la partie du fichier de registre, je pense qu'il s'appelle. Dommage qu'Alexa soit de la merde ...
Le programme espeak fonctionne sur la console debian apt install espeak. Et rejoignez par exemple espeak -ves «Hello World»
le -ves est v = voix est = espagnol
Vous avez de nombreuses options pour lire un fichier texte, écrire le résultat dans un fichier wav.
salutations
la vérité est très mauvaise, les fenêtres qui sont un autre monde ... les voici 10 ans en arrière
Et 3 ans plus tard, oui ! c'est encore en retard.