Passa al contenuto principale

Elenco dei parametri di riconoscimento

Questi parametri possono essere impostati solo quando il riconoscitore non è in esecuzione.

Questo non è un elenco esaustivo dei parametri disponibili in Whisper. Solo i più importanti sono esposti qui. Se necessario, questo elenco verrà aggiornato.

Imposta Parametri di Riconoscimento

Imposta i parametri per il riconoscimento vocale. Se desideri modificare solo parametri specifici, considera l'utilizzo delle funzioni setter individuali.

Imposta Predefiniti per Streaming

Imposta i parametri predefiniti adatti per il riconoscimento vocale in streaming.

Imposta Predefiniti per Non Streaming

Imposta i parametri predefiniti adatti per il riconoscimento vocale non in streaming.

Imposta Numero di Thread

Imposta il numero di thread da utilizzare per il riconoscimento vocale. Imposta questo valore a 0 per utilizzare il numero di core.

Imposta Lingua

Imposta la lingua da utilizzare per il riconoscimento vocale. Deve essere supportata dal modello linguistico selezionato nelle impostazioni dell'Editor.

Impostare la lingua su Auto diminuirà l'accuratezza e le prestazioni del riconoscimento.

Ottieni Lingua Rilevata

Ottiene la lingua rilevata dall'ultimo riconoscimento. Restituisce la lingua come valore enum.

Nota: Questa funzione funziona solo dopo che è stato eseguito il riconoscimento. Restituisce Auto se il rilevamento della lingua è fallito o non è stato eseguito. Questo è particolarmente utile quando si utilizza il rilevamento automatico della lingua per identificare quale lingua è stata effettivamente riconosciuta.

Ottieni Codice Lingua

Converte un valore enum di lingua nel suo codice lingua stringa (es., En -> "en", Fr -> "fr", De -> "de").

Ottieni Nome Completo Lingua

Converte un valore enum di lingua nel suo nome completo della lingua (es., En -> "English", Fr -> "French", De -> "German").

Imposta Traduzione in Inglese

Imposta se tradurre le parole riconosciute in inglese. Se vero, il modello linguistico deve essere multilingue.

Imposta Dimensione Passo

Imposta la dimensione del passo in millisecondi. Determina quanto spesso inviare i dati audio per il riconoscimento. Il valore predefinito è 5000 ms (5 secondi).

Imposta Nessun Contesto

Imposta se utilizzare la trascrizione passata (se presente) come prompt iniziale per il decodificatore.

Imposta Segmento Singolo

Imposta se forzare l'output di un singolo segmento (utile per lo streaming).

Imposta Token Massimi

Imposta il numero massimo di token per segmento di testo. Utilizza 0 per nessun limite.

Imposta Velocizzazione

Imposta se velocizzare il riconoscimento di 2x utilizzando il Phase Vocoder. Impostalo su false per migliorare la qualità dell'output.

Imposta Dimensione Contesto Audio

Imposta la dimensione del contesto audio. Impostalo su 0 per migliorare la qualità dell'output.

Imposta Temperatura da Aumentare

Imposta la temperatura da aumentare quando si ricade indietro in caso di fallimento della decodifica nel soddisfare una delle soglie sottostanti.

Imposta Soglia di Entropia

Imposta la soglia di entropia. Se il rapporto di compressione è superiore a questo valore, tratta la decodifica come fallita. Simile al "compression_ratio_threshold" di OpenAI.

Imposta Soppressione Spazi Vuoti

Imposta se sopprimere gli spazi vuoti che compaiono negli output.

Imposta Soppressione Token Non Vocali

Imposta se sopprimere i token non vocali che compaiono negli output.

Imposta Dimensione Beam

Imposta il numero di beam nella ricerca beam. Applicabile solo quando la temperatura è zero.

Imposta Prompt Iniziale

Imposta il prompt iniziale per la prima finestra. Questo può essere utilizzato per fornire contesto al riconoscimento per renderlo più probabile prevedere correttamente le parole, ad esempio vocabolari personalizzati o nomi propri.

Imposta Accelerazione GPU

Imposta se utilizzare l'accelerazione GPU per il riconoscimento vocale (attualmente applicabile solo su Windows).

Imposta ID Dispositivo GPU

Imposta l'ID del dispositivo GPU da utilizzare per il riconoscimento vocale. Il valore predefinito è 0. Questo è utile per sistemi con più GPU per specificare quale GPU dovrebbe essere utilizzata per il processo di riconoscimento. Se l'ID del dispositivo GPU specificato non è valido, verrà utilizzato invece il primo indice di dispositivo GPU disponibile.