Via Kevin Marks : Il existe un petit logiciel étrange mais remarquable de chez Apple, appelé « Speak After Me », qui prend morceau de texte et l’enregistrement de quelqu’un l’énonçant, le transcrit en phonèmes (du moins, c’est-ce que le logiciel dit qu’il fait), et calcule une courbe de tonalité en fonction de ces unités sonores. On peut éditer le résultat et exporter les données dans un fichier texte.
Voici une capture d’écran de l’interface. Kevin vient de dire « Coco is the queen of the space monkeys » (cliquez sur l’image pour l’agrandir). En surbrillance jaune, on voit la transcription, qui utilise un système d’écriture assez déroutant.
Billets connexes : Pseudo-phonetics, Quick links, Branding: IPA and exotism, Multi-lang II, Merriam-Webster & Firefox, Pas aussi atroce que ça !, Transcribing an unknown language
Technorati (tags): language, langue, OS X, outils, phonétique, phonetics, tools
Eek, that’s an ugly transcription system.
Bonjour,
D’après votre capture d’écran, ce logiciel détecterait différents indices présents dans le signal de parole en associant un “pattern acoustique” et une modélisation acoustique de chaque segment de la langue anglaise stockée par le logiciel. Quant aux accents régionaux, si le logiciel est bien conçu, il doit exister une marge de manoeuvre dans le processus de reconnaissance.
La reconnaissance de ces “patterns” s’appuie par exemple sur l’utilisation de la “courbe de tonalité” généralement appelée courbe de fréquence fondamentale qui permet de détecter les zones périodiques donc voisées (à l’inverse, on isole ainsi les segments sourds) présents dans le signal sonore.
The App is called ‘Repeat After Me’, and I must admit that I had never heard of it until you mentioned it. It is as you said, part of the Developer Tools. Here’s what the Repeat After Me User Guide has to say:
Repeat After Me is a tool that is designed to improve the pronunciation of text generated by the Text-To-Sppech (TTS) system, by means of editing the pitch and duration of phonemes.
I just don’t get why and when can it be used. And how it works.
I haven’t used the app in this way, but here’s my understanding of How and When you would use it based on Apple’s developer documentation:
Let’s say you’re an application developer who wants to have a certain set of phrases spoken by your app. First you attempt to let MacOS X’s Speech Synthesis framework generate the speech. It’ll probably do a good job, but what if it doesn’t have the stress or emphasis on the syllables you want? In that case, you simply start up RepeatAfterMe, speak the phrase(s) in the way you want them spoken, and generate a ‘pitch/duration phonemes representation’ in text form which you can then have your app pass to the Speech Synthesis framework in order to get a more natural pronunciation.
Is that a little clearer?