Aller au contenu principal

Liste des paramètres de reconnaissance

Ces paramètres ne peuvent être définis que lorsque le reconnaisseur n'est pas en cours d'exécution.

Ceci n'est pas une liste exhaustive des paramètres disponibles dans Whisper. Seuls les plus importants sont exposés ici. Si nécessaire, cette liste sera mise à jour.

Définir les paramètres de reconnaissance

Définit les paramètres pour la reconnaissance vocale. Si vous souhaitez modifier uniquement des paramètres spécifiques, envisagez d'utiliser les fonctions de définition individuelles.

Définir les valeurs par défaut pour le streaming

Définit les paramètres par défaut adaptés à la reconnaissance vocale en streaming.

Définir les valeurs par défaut pour le non-streaming

Définit les paramètres par défaut adaptés à la reconnaissance vocale non-streaming.

Définir le nombre de threads

Définit le nombre de threads à utiliser pour la reconnaissance vocale. Définissez cette valeur sur 0 pour utiliser le nombre de cœurs.

Définir la langue

Définit la langue à utiliser pour la reconnaissance vocale. Doit être prise en charge par le modèle de langue sélectionné dans les paramètres de l'éditeur.

Définir la langue sur Auto diminuera la précision et les performances de la reconnaissance.

Obtenir la langue détectée

Obtient la langue détectée à partir de la dernière reconnaissance. Renvoie la langue sous forme de valeur d'énumération.

Remarque : Cette fonction ne fonctionne qu'après qu'une reconnaissance a été effectuée. Elle renvoie Auto si la détection de langue a échoué ou n'a pas été effectuée. Ceci est particulièrement utile lors de l'utilisation de la détection automatique de langue pour identifier quelle langue a réellement été reconnue.

Obtenir le code de langue

Convertit une valeur d'énumération de langue en sa chaîne de code de langue (par exemple, En -> "en", Fr -> "fr", De -> "de").

Obtenir le nom complet de la langue

Convertit une valeur d'énumération de langue en son nom complet de langue (par exemple, En -> "English", Fr -> "French", De -> "German").

Définir la traduction en anglais

Définit s'il faut traduire les mots reconnus en anglais. Si vrai, le modèle de langue doit être multilingue.

Définir la taille de pas

Définit la taille de pas en millisecondes. Détermine la fréquence d'envoi des données audio pour la reconnaissance. La valeur par défaut est de 5000 ms (5 secondes).

Définir sans contexte

Définit s'il faut utiliser la transcription passée (le cas échéant) comme prompt initial pour le décodeur.

Définir segment unique

Définit s'il faut forcer une sortie en segment unique (utile pour le streaming).

Définir le nombre maximum de tokens

Définit le nombre maximum de tokens par segment de texte. Utilisez 0 pour aucune limite.

Définir Accélération

Définit s'il faut accélérer la reconnaissance par 2x en utilisant le Phase Vocoder. Définissez-le sur false pour améliorer la qualité de la sortie.

Définir Taille du Contexte Audio

Définit la taille du contexte audio. Définissez-la sur 0 pour améliorer la qualité de la sortie.

Définir Température à Augmenter

Définit la température à augmenter lors du repli lorsque le décodage échoue à atteindre l'un des seuils ci-dessous.

Définir Seuil d'Entropie

Définit le seuil d'entropie. Si le taux de compression est supérieur à cette valeur, traitez le décodage comme un échec. Similaire au "compression_ratio_threshold" d'OpenAI

Définir Suppression des Blancs

Définit s'il faut supprimer les blancs apparaissant dans les sorties.

Définir Suppression des Tokens Non Vocaux

Définit s'il faut supprimer les tokens non vocaux apparaissant dans les sorties.

Définir Taille du Faisceau

Définit le nombre de faisceaux dans la recherche en faisceau. Applicable uniquement lorsque la température est zéro.

Définir Invite Initiale

Définit l'invite initiale pour la première fenêtre. Cela peut être utilisé pour fournir un contexte à la reconnaissance pour qu'elle soit plus susceptible de prédire correctement les mots, par exemple des vocabulaires personnalisés ou des noms propres.

Définir Accélération GPU

Définit s'il faut utiliser l'accélération GPU pour la reconnaissance vocale (applicable uniquement sur Windows pour le moment).

Définir ID de Périphérique GPU

Définit l'ID du périphérique GPU à utiliser pour la reconnaissance vocale. La valeur par défaut est 0. Ceci est utile pour les systèmes avec plusieurs GPU pour spécifier quel GPU doit être utilisé pour le processus de reconnaissance. Si l'ID de périphérique GPU spécifié est invalide, le premier index de périphérique GPU disponible sera utilisé à la place.