Questions fréquemment posées
Trouvez des réponses aux questions courantes
Un service de parole-à-texte est une technologie qui convertit automatiquement le contenu vocal en texte. Il vous aide à convertir rapidement les enregistrements vocaux, les procès-verbaux de réunion et d'autres contenus audio en format texte éditable.
Inscrivez-vous simplement un compte, choisissez un plan qui correspond à vos besoins, et vous pouvez commencer à utiliser notre service. Nous fournissons une interface conviviale qui vous permet de télécharger facilement des fichiers audio et d'obtenir des résultats de conversion.
Nous prenons en charge divers formats audio courants, notamment MP3, WAV, M4A, AAC et plus encore. Si vous avez des exigences de format spéciales, veuillez contacter notre équipe de service client.
Notre technologie de reconnaissance vocale utilise des algorithmes d'IA avancés et peut atteindre plus de 98% de précision dans les environnements standard. Pour l'audio avec des accents ou du bruit de fond, la précision peut être plus faible.
Nous prenons très au sérieux la sécurité des données utilisateur. Les fichiers audio sont automatiquement supprimés de nos serveurs après conversion, et vos données vocales sont stockées sur des plateformes sécurisées avec un chiffrement leader de l'industrie. Vous avez également la possibilité de supprimer manuellement les fichiers audio à tout moment.
Le temps de conversion dépend de la longueur du fichier audio. Généralement, le temps de conversion est d'environ 10 secondes par minute d'audio. Pour les fichiers audio plus longs, le temps de conversion peut être plus long. Les fichiers audio plus longs comme 1 heure peuvent prendre 10 minutes à convertir.
Nous proposons trois modes de transcription : Le plus rapide, Équilibré et Précis. Pour un audio de haute qualité, le mode Le plus rapide ou Équilibré est recommandé car les deux fournissent des résultats rapides avec une précision fiable. Pour les enregistrements généraux, Équilibré est la meilleure option polyvalente. Si votre audio contient du bruit de fond, plusieurs locuteurs ou nécessite la plus haute précision, choisissez le mode Précis.
Les fichiers de transcription déplacés dans la corbeille seront conservés jusqu'à 30 jours. Ils seront automatiquement et définitivement supprimés après la période de rétention de 30 jours. Vous pouvez également choisir de les supprimer définitivement manuellement de la corbeille à tout moment.
La fonctionnalité de reconnaissance du locuteur est utilisée pour identifier les locuteurs dans le fichier audio. Vous pouvez activer la fonctionnalité de reconnaissance du locuteur en cliquant sur le bouton 'Activer la reconnaissance du locuteur'. Une fois activée, la fonctionnalité de reconnaissance du locuteur sera utilisée pour identifier les locuteurs dans le fichier audio.
L'option "Reconnaître le locuteur" permet à l'IA d'identifier et de séparer différents locuteurs dans votre audio. Si vous spécifiez le nombre de locuteurs, l'IA peut utiliser ces informations pour améliorer la séparation et l'étiquetage des locuteurs. Si vous ne sélectionnez pas de nombre, le système détectera et classera automatiquement les locuteurs pour vous. Veuillez noter que le résultat final peut ne pas suivre strictement le nombre que vous choisissez, car l'IA optimisera toujours la détection des locuteurs en fonction des caractéristiques audio réelles.
L'option "Scénario" permet au système d'ajuster les paramètres techniques en fonction de l'environnement spécifique de votre audio. Différents scénarios utilisent différents paramètres IA - tels que le niveau de réduction du bruit, l'amélioration de la parole et le filtrage de fond - pour atteindre une meilleure précision de transcription sans nécessiter de configuration manuelle d'options complexes. Dans la plupart des cas, le scénario "Général" offre les performances les plus équilibrées et convient aux enregistrements typiques.
"Longueur du segment" fait référence à la taille ou à la durée de chaque segment de texte généré pendant la transcription IA. Il contrôle la longueur de chaque bloc de texte transcrit. Les segments plus courts créent des pauses plus fréquentes et des horodatages plus fins, tandis que les segments plus longs produisent des blocs de texte plus grands. Ce paramètre affecte la structure de la transcription finale, mais ne change pas la précision réelle de la transcription.