passer du son vers du texte

passer du son vers du texte - Traitement Audio - Video & Son

Marsh Posté le 06-12-2005 à 11:26:48    

Bonjour,
Je cherche à prendre des notes orales (via baladeur mp3) puis les transformer en texte. La question est de savoir si un logiciel existe pour reconnaitre la voix dans un fichier son et créer un fichier texte correspondant.
Je sais que plusieurs logiciels de reconnaissance vocale existent. Mais en existe-t-il qui prenne le son dans un fichier et non à la prise micro.
Merci.

Reply

Marsh Posté le 06-12-2005 à 11:26:48   

Reply

Marsh Posté le 06-12-2005 à 11:35:34    

erikland a écrit :


Je sais que plusieurs logiciels de reconnaissance vocale existent. Mais en existe-t-il qui prenne le son dans un fichier et non à la prise micro.
Merci.


Oui, tous le font. Mais c'est cher, l'apprentissage du logiciel est très long (il faut lui apprendre les particularités de ta prononciation) et ça marche globalement très mal, vu le temps que tu dois passer ensuite à corriger le texte.

Reply

Marsh Posté le 06-12-2005 à 11:46:36    

D'autant que ces logiciels sont souvent livrés avec un micro spécifique (dont les caractéristiques sont intégrés dans les algorithmes de reconnaissance vocale). Que tu n'utiliseras donc pas, si su enregistres sur ton baladeur MP3, baissant ainsi les performances de reconnaissance.

Reply

Marsh Posté le 06-12-2005 à 12:12:41    

loumanu a écrit :

D'autant que ces logiciels sont souvent livrés avec un micro spécifique (dont les caractéristiques sont intégrés dans les algorithmes de reconnaissance vocale). Que tu n'utiliseras donc pas, si su enregistres sur ton baladeur MP3, baissant ainsi les performances de reconnaissance.


tu as un exemple ? ca m'intéresse..

Reply

Marsh Posté le 06-12-2005 à 12:40:01    

Je pensais à Dragon Naturraly Speaking : http://www.scansoft.fr/naturallyspeaking/preferred/
Et en cherchant le lien, je me suis aperçu qu'en plus de livrer un micro, il y a maintenant une liste de micros et d'enregistreurs notés par eux en fonction de l'influence sur la capacité de reconnaissance : http://support.scansoft.com/compatibility/
 
EDIT : malheureusement, aucun lecteur MP3 avec fonction "mémo vocal" ne semble avoir été testé...

Message cité 1 fois
Message édité par loumanu le 06-12-2005 à 12:43:57
Reply

Marsh Posté le 06-12-2005 à 12:46:03    

Tu fais comme les secrétaires, tu mets un casque et tu tape en même temps ce que tu as enregistré :D

Reply

Marsh Posté le 06-12-2005 à 13:03:51    

Un département dans mon ancienne boîte en avait testé 3 ou 4. C'était à partir de micro-cassettes, des entretiens lors d'enquêtes en face-à-face. Ca a été assez désastreux. Ils ont tout rendu après s'être pris la tête pendant deux jours. Quelqu'un qui tape vite au clavier va 10 fois plus vite.  :o

Reply

Marsh Posté le 06-12-2005 à 16:21:07    

loumanu a écrit :

Je pensais à Dragon Naturraly Speaking : http://www.scansoft.fr/naturallyspeaking/preferred/
Et en cherchant le lien, je me suis aperçu qu'en plus de livrer un micro, il y a maintenant une liste de micros et d'enregistreurs notés par eux en fonction de l'influence sur la capacité de reconnaissance : http://support.scansoft.com/compatibility/
 
EDIT : malheureusement, aucun lecteur MP3 avec fonction "mémo vocal" ne semble avoir été testé...


Ils ont quelque chose de spécial les micros livrés ? je n'ai vu nulle part mention de ces "caractéristiques de micro intégrées dans des algorithmes de reconnaissance"... C'est justement çà qui m'intéressait de connaître...

Reply

Marsh Posté le 06-12-2005 à 17:24:35    

C'était juste pour dire que le logiciel connait les courbe de réponse et de directivité du micro, et en tient compte. Mais ce micro est équipé d'un système "anti-bruit" (ils n'en disent pas plus) et a certainement une directivité importante.

Reply

Marsh Posté le 06-12-2005 à 20:09:17    

loumanu a écrit :

C'était juste pour dire que le logiciel connait les courbe de réponse et de directivité du micro, et en tient compte. Mais ce micro est équipé d'un système "anti-bruit" (ils n'en disent pas plus) et a certainement une directivité importante.

Moi ce sont les sources qui m'intéressaient, j'aurais été curieux de lire leur version de la chose ce n'est mentionné nulle part dans l'aide ni leur site, à moins que j'ai manqué un chapitre mais bon ... recouper une info c'est toujours un bon reflexe. ;)
 
Pour moi c'est simplement un "micro certifié", c'est à dire un micro standard qu'ils vendent avec leur truc, ils ne vont pas aller dire qu'il est moins bon qu'un autre.. mais de là à vraiment intégrer une base de données de courbes de réponse en fréquence de tous les micros "bas de gamme" du marché (existe-t-il au moins un headset qualifiable de "haut de gamme" ).. j'en doute fortement. J'ai installé ce système récemment chez un ami avocat avec un logitech 350, ayant trouvé leur micro super "cheap" et il me semblait que la reconnaissance vocale s'effectuait mieux avec le micro de remplacement (de plus il est content il peut bosser ses dossiers en musique avec lel ecouteurs sans embeter personne). Ils ont d'ailleurs une base de donnée indiquant la réactivité du logiciel en fonction de la qualité de divers micros. Si le logicial integrait une telle base de données, je pourrais m'attendre à une amplitude de differences beaucoup plus plate entre les divers modèles non ?
 
En poussant un peu plus loin, si le logiciel, intégrant une routine "d'optimisation" pour certains types de micros, se comportait moins bien avec un U47 Gold ce serait le comble du comble.. Pour ce qui est de la "réduction de bruit", il suffit simplement d'entourer la cellule de mousse acoustique et monter celle-ci sur un support caoutchouc miniature, ou integrer la cellule à l'intérieur d'un tube ouvert qui joue le rôle d'une chambre d'echo, sans contact direct avec l'air explusé... Quasiment tous les headsets sont fabriqués de la sorte, et cardioïdes.. :)


Message édité par angturil le 06-12-2005 à 20:21:24
Reply

Marsh Posté le 06-12-2005 à 20:09:17   

Reply

Marsh Posté le 21-10-2007 à 16:26:03    

bonjour, j'ai un souci avec dragon naturally speaking 9. je l'ai installé sans problème mais l'adaptation se complique.
il me demande de dire" bienvenue dans le monde de la dictée continue". parfois je dois le répéter 3 fois pour passer à la phrase suivante, parfais 30!! la phrase suivante à répéter "l'adaptation est sur le point de comencer" ne se termine jamais. je l'ai répétée pendant une demi heure sans succès.
 
quelqu'un saurait-il me dire quel est le problème??
 
j'ai un micro pourri c'est certain, mais la premiere étape passe!! j'aimerais donc savoir si c'est la cause de mon problème (auquel cas j'achèterai un micro) avant d'investir...(d'ailleurs je n'ai pas d'idée de prix...??)
 
merci par avance!!

Reply

Sujets relatifs:

Leave a Replay

Make sure you enter the(*)required information where indicate.HTML code is not allowed