Lista parametrów rozpoznawania
Te parametry można ustawić tylko wtedy, gdy rozpoznawanie nie jest uruchomione.
Nie jest to wyczerpująca lista parametrów dostępnych w Whisper. Udostępniono tutaj tylko najważniejsze z nich. W razie potrzeby lista ta zostanie zaktualizowana.
Ustaw parametry rozpoznawania

Ustawia parametry rozpoznawania mowy. Jeśli chcesz zmienić tylko określone parametry, rozważ użycie indywidualnych funkcji ustawiających.
Ustaw domyślne dla strumieniowania

Ustawia domyślne parametry odpowiednie dla strumieniowego rozpoznawania mowy.
Ustaw domyślne dla niestrumieniowego

Ustawia domyślne parametry odpowiednie dla niestrumieniowego rozpoznawania mowy.
Ustaw liczbę wątków

Ustawia liczbę wątków do użycia w rozpoznawaniu mowy. Ustaw tę wartość na 0, aby użyć liczby rdzeni.
Ustaw język

Ustawia język używany do rozpoznawania mowy. Musi być obsługiwany przez wybrany model językowy w ustawieniach Edytora.
Ustawienie języka na Auto zmniejszy dokładność i wydajność rozpoznawania.
Pobierz wykryty język

Pobiera wykryty język z ostatniego rozpoznania. Zwraca język jako wartość wyliczeniową.
Uwaga: Ta funkcja działa tylko po wykonaniu rozpoznania. Zwraca Auto, jeśli wykrywanie języka nie powiodło się lub nie zostało wykonane. Jest to szczególnie przydatne podczas korzystania z automatycznego wykrywania języka w celu zidentyfikowania, który język został faktycznie rozpoznany.
Pobierz kod języka

Konwertuje wartość wyliczeniową języka na jego kod językowy jako ciąg znaków (np. En -> "en", Fr -> "fr", De -> "de").
Pobierz pełną nazwę języka

Konwertuje wartość wyliczeniową języka na jego pełną nazwę językową (np. En -> "English", Fr -> "French", De -> "German").
Ustaw tłumaczenie na angielski

Ustawia, czy rozpoznane słowa mają być tłumaczone na język angielski. Jeśli wartość jest prawdziwa, model językowy musi być wielojęzyczny.
Ustaw rozmiar kroku

Ustawia rozmiar kroku w milisekundach. Określa, jak często wysyłać dane audio do rozpoznania. Wartość domyślna to 5000 ms (5 sekund).
Ustaw brak kontekstu

Ustawia, czy używać poprzedniej transkrypcji (jeśli istnieje) jako początkowego promptu dla dekodera.
Ustaw pojedynczy segment

Ustawia, czy wymuszać wyjście w postaci pojedynczego segmentu (przydatne przy strumieniowaniu).
Ustaw maksymalną liczbę tokenów
Ustawia maksymalną liczbę tokenów na segment tekstu. Użyj 0, aby nie ustawiać limitu.
Ustaw Przyspieszenie

Ustawia, czy przyspieszyć rozpoznawanie 2-krotnie za pomocą Phase Vocoder. Ustaw na false, aby poprawić jakość wyjścia.
Ustaw Rozmiar Kontekstu Audio

Ustawia rozmiar kontekstu audio. Ustaw na 0, aby poprawić jakość wyjścia.
Ustaw Temperaturę do Zwiększenia

Ustawia temperaturę do zwiększenia podczas powrotu, gdy dekodowanie nie spełnia któregokolwiek z poniższych progów.
Ustaw Próg Entropii

Ustawia próg entropii. Jeśli współczynnik kompresji jest wyższy niż ta wartość, potraktuj dekodowanie jako nieudane. Podobne do "compression_ratio_threshold" od OpenAI.
Ustaw Tłumienie Pustych

Ustawia, czy tłumić puste miejsca pojawiające się w wynikach.
Ustaw Tłumienie Tokenów Nie-Mowy

Ustawia, czy tłumić tokeny niebędące mową pojawiające się w wynikach.
Ustaw Rozmiar Wiązki

Ustawia liczbę wiązek w przeszukiwaniu wiązkowym. Dotyczy tylko przypadku, gdy temperatura wynosi zero.
Ustaw Początkowy Prompt

Ustawia początkowy prompt dla pierwszego okna. Może być użyty do zapewnienia kontekstu dla rozpoznawania, aby zwiększyć prawdopodobieństwo poprawnego przewidzenia słów, np. niestandardowe słownictwo lub nazwy własne.
Ustaw Akcelerację GPU

Ustawia, czy używać akceleracji GPU do rozpoznawania mowy (obecnie dotyczy tylko systemu Windows).
Ustaw ID Urządzenia GPU

Ustawia ID urządzenia GPU do użycia dla rozpoznawania mowy. Wartość domyślna to 0. Jest to przydatne w systemach z wieloma GPU, aby określić, które GPU powinno być użyte do procesu rozpoznawania. Jeśli podane ID urządzenia GPU jest nieprawidłowe, zostanie użyty pierwszy dostępny indeks urządzenia GPU.