Elenco dei parametri di riconoscimento
Questi parametri possono essere impostati solo quando il riconizzatore non è in esecuzione.
Questo non è un elenco esaustivo dei parametri disponibili in Whisper. Solo i più importanti sono esposti qui. Se necessario, questo elenco verrà aggiornato.
Imposta Parametri di Riconoscimento
Imposta i parametri per il riconoscimento vocale. Se si desidera modificare solo parametri specifici, considerare l'utilizzo delle singole funzioni setter.
Imposta Predefiniti per Streaming
Imposta i parametri predefiniti adatti per il riconoscimento vocale in streaming.
Imposta Predefiniti per Non-Streaming
Imposta i parametri predefiniti adatti per il riconoscimento vocale non in streaming.
Imposta Numero di Thread
Imposta il numero di thread da utilizzare per il riconoscimento vocale. Impostare questo valore a 0 per utilizzare il numero di core.
Imposta Lingua
Imposta la lingua da utilizzare per il riconoscimento vocale. Deve essere supportata dal modello linguistico selezionato nelle impostazioni dell'Editor.
Impostare la lingua su Auto diminuirà la precisione e le prestazioni del riconoscimento.
Imposta Traduci in Inglese
Imposta se tradurre le parole riconosciute in inglese. Se vero, il modello linguistico deve essere multilingue.
Imposta Dimensione del Passo
Imposta la dimensione del passo in millisecondi. Determina la frequenza con cui inviare i dati audio per il riconoscimento. Il valore predefinito è 5000 ms (5 secondi).
Imposta Nessun Contesto
Imposta se utilizzare la trascrizione passata (se presente) come prompt iniziale per il decodificatore.
Imposta Segmento Singolo
Imposta se forzare l'output a segmento singolo (utile per lo streaming).
Imposta Token Massimi
Imposta il numero massimo di token per segmento di testo. Utilizzare 0 per nessun limite.
Imposta Accelerazione
Imposta se accelerare il riconoscimento di 2x utilizzando il Phase Vocoder. Impostarlo su false
per migliorare la qualità dell'output.
Imposta Dimensione del Contesto Audio
Imposta la dimensione del contesto audio. Impostarlo su 0
per migliorare la qualità dell'output.
Imposta Temperatura da Aumentare
Imposta la temperatura da aumentare quando si ripiega in caso di fallimento della decodifica nel soddisfare una delle soglie seguenti.
Imposta Soglia di Entropia
Imposta la soglia di entropia. Se il rapporto di compressione è superiore a questo valore, considera il decodificazione come fallita. Simile al "compression_ratio_threshold" di OpenAI.
Imposta Soppressione Spazi Vuoti
Imposta se sopprimere gli spazi vuoti che compaiono negli output.
Imposta Soppressione Token Non Vocali
Imposta se sopprimere i token non vocali che compaiono negli output.
Imposta Dimensione Fascio
Imposta il numero di fasci nella ricerca a fascio. Applicabile solo quando la temperatura è zero.
Imposta Prompt Iniziale
Imposta il prompt iniziale per la prima finestra. Può essere utilizzato per fornire contesto al riconoscimento per rendere più probabile la corretta previsione delle parole, ad esempio vocabolari personalizzati o nomi propri.
Imposta Accelerazione GPU
Imposta se utilizzare l'accelerazione GPU per il riconoscimento vocale (attualmente applicabile solo su Windows).
Imposta ID Dispositivo GPU
Imposta l'ID del dispositivo GPU da utilizzare per il riconoscimento vocale. Il valore predefinito è 0. Questo è utile per sistemi con più GPU per specificare quale GPU dovrebbe essere utilizzata per il processo di riconoscimento. Se l'ID del dispositivo GPU specificato non è valido, verrà utilizzato invece il primo indice di dispositivo GPU disponibile.