Les meilleurs outils de reconnaissance vocale pour Linux

Contexte de la reconnaissance vocale

La voix est de plus en plus une méthode utilisée pour interagir avec nos appareils, en plus d'être la seule méthode pour ceux qui ont besoin de ce type de méthodes d'accessibilité. Dans tous les cas, il est assez confortable de parler pour dicter du texte ou simplement de saisir des commandes vocales dans nos systèmes afin qu'ils effectuent une sorte d'opération sans utiliser leurs mains. Le problème est que reconnaissance vocale ils sont basés sur des moteurs qui utilisent des algorithmes mathématiques pour reconnaître la parole et ne sont pas fiables à 100%.

Les progrès technologiques apportent de plus en plus fiabilité à la perfection, et l'intelligence artificielle et les systèmes de Big Data contribuent également beaucoup à améliorer considérablement les programmes de reconnaissance vocale. Dernièrement, de nombreux efforts sont déployés pour améliorer au maximum ces systèmes, et de nombreuses études s'y concentrent pour améliorer le contrôle et en faire l'interface du futur. Gardez à l'esprit que les interfaces actuelles sont moins naturelles pour les gens et moins rapides que la voix.

Les systèmes de reconnaissance vocale auront une valeur d'environ 10 milliards de dollars dans les années à venir et c'est pourquoi les grandes entreprises se concentrent sur le développement d'assistants tels que Siri d'Apple, Cortana de Microsoft ou Mycroft pour Linux, en plus de devenir des produits de plus en plus populaires et fréquents tels qu'Amazon Echo, Google Home ou Apple HomePod pour la maison, ainsi que d'intégrer des systèmes de reconnaissance vocale sophistiqués dans les voitures connectées.

Cela dit, notre liste d'outils de reconnaissance vocale pour Linux sont:

  • Julius: est un puissant moteur de reconnaissance vocale continue avec beaucoup de vocabulaire.
  • Discours profond: est une implémentation TensorFLow de l'architecture DeepSpeech de Baidu.
  • Simon: un logiciel de reconnaissance vocale assez flexible.
  • Kaldi: est une boîte à outils de conception C ++ pour la recherche sur la reconnaissance vocale.
  • CMUSphinx: dans ce cas, il s'agit d'un moteur de reconnaissance vocale pour les applications mobiles et les serveurs.
  • deepspeech.python: est une implémentation de DeepSPeech avec Python et utilisant Baidu Warp-CTC.

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont marqués avec *

*

*

  1. Responsable des données : AB Internet Networks 2008 SL
  2. Finalité des données: Contrôle du SPAM, gestion des commentaires.
  3. Légitimation: votre consentement
  4. Communication des données: Les données ne seront pas communiquées à des tiers sauf obligation légale.
  5. Stockage des données: base de données hébergée par Occentus Networks (EU)
  6. Droits: à tout moment, vous pouvez limiter, récupérer et supprimer vos informations.

  1.   Miguel Angel dit

    Très bien, et y aura-t-il un bon TTS (synthèse vocale) pour Linux?

    Sous Windows et Android, il existe des voix de très bonne qualité telles que Loquendo, Ivona ou NeoSpeech, mais elles ne sont pas pour Linux. Sous Linux, j'ai essayé les voix mbrola et picoTTS mais elles sont très robotiques.

    Cepstral propose une voix Alejandra gratuite pour Linux, ce qui est plutôt bien, mais je ne savais pas comment l'installer.

    1.    Raul dit

      Je marche de la même manière si tu as une bonne part

      1.    Armando dit

        Vous pouvez utiliser loquendo avec wine sous Linux. Je recommande cette vidéo ...

        https://www.youtube.com/watch?v=OfGxR_O0Vjk

  2.   Nasher_87 (ARG) dit

    J'ai essayé d'installer un assistant, je veux dire, Google Assistant et je n'ai pas pu, je suis resté dans la partie du fichier de registre, je pense qu'il s'appelle. Dommage qu'Alexa soit de la merde ...

  3.   Gerardo dit

    Le programme espeak fonctionne sur la console debian apt install espeak. Et rejoignez par exemple espeak -ves «Hello World»

    le -ves est v = voix est = espagnol

    Vous avez de nombreuses options pour lire un fichier texte, écrire le résultat dans un fichier wav.

    salutations

  4.   rivière dit

    la vérité est très mauvaise, les fenêtres qui sont un autre monde ... les voici 10 ans en arrière

    1.    Raul dit

      Et 3 ans plus tard, oui ! c'est encore en retard.