Aby zamienić tekst na mowę w systemie Ubuntu za pomocą eSpeak, wykonaj poniższe kroki. Ten poradnik zawiera szczegółowe instrukcje instalacji, konfiguracji oraz praktyczne przykłady użycia — zarówno z poziomu konsoli, jak i w integracji ze skryptami.
1. Czym jest eSpeak?
eSpeak to kompaktowy, otwartoźródłowy syntezator mowy obsługujący wiele języków (w tym polski). Działa w trybie tekstowym i jest dostępny na systemy Linux oraz Windows.
2. Instalacja eSpeak w Ubuntu
Instalacja z repozytorium (zalecane dla większości użytkowników)
Otwórz terminal i wpisz:
sudo apt-get update sudo apt-get install espeak -y
To polecenie zainstaluje eSpeak oraz wszystkie wymagane zależności.
Aby sprawdzić wersję eSpeak:
espeak --version
Potwierdza to, że program został poprawnie zainstalowany i jest gotowy do użycia.
Instalacja najnowszej wersji (opcjonalnie – eSpeak NG)
Jeśli chcesz zainstalować najnowszą wersję eSpeak NG (nowej generacji), wykonaj:
git clone https://github.com/espeak-ng/espeak-ng.git cd espeak-ng/ sudo apt-get install automake libtool ./autogen.sh ./configure make sudo make install sudo ldconfig
Po instalacji sprawdź wersję:
espeak-ng --version
Uzyskasz informację o wersji i folderze z danymi głosowymi.
3. Podstawowe użycie eSpeak
Przetwarzanie tekstu na mowę z użyciem konsoli
Najprostsza forma użycia:
espeak "To jest przykładowy tekst do odczytania."
To polecenie automatycznie wypowie podany tekst.
Odczytanie tekstu z pliku
Załóżmy, że masz plik test.txt. Aby eSpeak przeczytał jego zawartość:
espeak -f test.txt
Argument -f wskazuje na plik tekstowy.
Ustawianie języka syntezy
Aby wymusić konkretny język (np. polski):
espeak -v pl "To jest tekst po polsku."
Lista dostępnych języków:
espeak --voices
Otrzymasz tabelę obsługiwanych języków i dialektów.
4. Przydatne opcje eSpeak
- -v [język] — wybór głosu/języka (np. -v en, -v pl)
- -s [szybkość] — zmiana szybkości czytania (standard to 175 słów/min):
espeak -s 120 "Powolne czytanie."
- -p [wysokość] — zmiana wysokości głosu (zakres: 0-99):
espeak -p 30 "Niższy głos."
- -w [plik.wav] — zapis odczytywanego tekstu do pliku WAV:
espeak "Nagrywam tekst do pliku." -w nagranie.wav
Tak utworzony plik można otworzyć dowolnym odtwarzaczem audio.
5. Integracja z własnymi skryptami (np. Python)
Możesz wywołać eSpeak w skryptach Bash lub Python za pomocą funkcji systemowych.
Przykład w Bash –
#!/bin/bash echo "Podaj tekst do odczytania:" read tekst espeak -v pl "$tekst"
Przykład w Python (moduł os) –
import os text = "To jest test syntezy mowy z Pythona." os.system(f'espeak -v pl "{text}"')
Możliwe jest także wykorzystanie bibliotek sterujących eSpeak z poziomu Pythona.
6. Rozwiązywanie problemów i wskazówki
- Jeśli nie słyszysz dźwięku, sprawdź ustawienia audio lub uruchom polecenie na komputerze, który ma skonfigurowaną kartę dźwiękową.
- eSpeak domyślnie działa w trybie CLI, ale można go używać w aplikacjach graficznych, np. z programem Gespeaker.
- Aby całkowicie usunąć eSpeak lub dodatkowe narzędzia (np. Gespeaker):
sudo apt-get autoremove gespeaker -y
7. Dodatkowe informacje
- eSpeak jest intensywnie rozwijany: nowoczesną wersją jest eSpeak NG (Next Generation), bardziej zaawansowaną i wspierającą najnowsze systemy.
- Oficjalna strona projektu to espeak.sourceforge.net.
Ten poradnik krok po kroku umożliwia każdemu użytkownikowi Ubuntu sprawne zainstalowanie, skonfigurowanie i używanie eSpeak do zamiany dowolnych tekstów na mowę.





