Hallo,
für mein Multiroomsystem (Ubuntu-Server mit Mehrkanal-Soundkarte und VLC als Player) bin ich auf der Suche nach einer Text to Speech Lösung mit guter Qualität. Es sollen nur kleine Infos ausgegeben werden, z.B. beim Wecken eine freundliche Ansage des Wetters und erstem Termin, wenn es an der Tür klingelt oder z.B. das Dachfenster noch auf ist und es zu regnen beginnt.
Leider bin ich nicht zufriedenstellend fündig geworden, vor allem weil ich nicht noch ein Windows Server neben meinem Linux-Server aufsetzen möchte. Aber es gibt auch für Linux gute Lösungen z.B. Acapela, aber mit Preisen jenseits von gut und böse (z.B. gibt es für Acapela keine private Lizenz, die Development Lizenz soll 2000$ kosten).
Jetzt bin ich auf die Idee gekommen unserem Haus ein "Sprachzentrum" zu spendieren: ein Android Device (z.B. ODROID-U3) mit einer relativ guten TTS Lösung z.B. IVONA, Acapela oder SVOX.
Ich hab mir eine kleine Android App gebastelt, die über eine Socat Verbindung (später über smarthome.py angesteuert) Textschnipsel entgegennimmt und dann über das installierte TTS-System ausgibt: Das funktioniert im Testsystem gut.
Um es es in mein Smarthome zu integrieren dachte ich zunächst an ein Android System in VirtualBox, doch leider unterstützen die TTS-Systeme keine x86 Systeme bzw. die Virtalisierung , also die Idee mit dem ODROID-U3.
Um das TTS-Signal in mein Multiroom-System einzuspeisen sind mir mehrere Möglichkeiten eingefallen:
Für eine gute Übersicht der Ausgaben der verschiedenen TTS-Systemen ist diese Seite zu empfehlen. Da hört man deutlich den Unterschied zwischen den freien Systemen die auch unter Linux laufen wie MBROLA, Festival oder SVOX zu den kommerziellen Systemen.
Bevor ich das Konstrukt umsetze, würde mich interessieren wie ihr, wenn überhaupt, ein TTS-System integriert habt und was ihr von der Lösung haltet?
für mein Multiroomsystem (Ubuntu-Server mit Mehrkanal-Soundkarte und VLC als Player) bin ich auf der Suche nach einer Text to Speech Lösung mit guter Qualität. Es sollen nur kleine Infos ausgegeben werden, z.B. beim Wecken eine freundliche Ansage des Wetters und erstem Termin, wenn es an der Tür klingelt oder z.B. das Dachfenster noch auf ist und es zu regnen beginnt.
Leider bin ich nicht zufriedenstellend fündig geworden, vor allem weil ich nicht noch ein Windows Server neben meinem Linux-Server aufsetzen möchte. Aber es gibt auch für Linux gute Lösungen z.B. Acapela, aber mit Preisen jenseits von gut und böse (z.B. gibt es für Acapela keine private Lizenz, die Development Lizenz soll 2000$ kosten).
Jetzt bin ich auf die Idee gekommen unserem Haus ein "Sprachzentrum" zu spendieren: ein Android Device (z.B. ODROID-U3) mit einer relativ guten TTS Lösung z.B. IVONA, Acapela oder SVOX.
Ich hab mir eine kleine Android App gebastelt, die über eine Socat Verbindung (später über smarthome.py angesteuert) Textschnipsel entgegennimmt und dann über das installierte TTS-System ausgibt: Das funktioniert im Testsystem gut.
Um es es in mein Smarthome zu integrieren dachte ich zunächst an ein Android System in VirtualBox, doch leider unterstützen die TTS-Systeme keine x86 Systeme bzw. die Virtalisierung , also die Idee mit dem ODROID-U3.
Um das TTS-Signal in mein Multiroom-System einzuspeisen sind mir mehrere Möglichkeiten eingefallen:
- Ausgabe über Audio-Out (ggf. Kopfhörer) beim Android-Device und dem Eingang der Soundkarte vom Multiroom-Server, habe ich noch nicht getestet sollte aber funktionieren...
- Übertragen der Signale mit AirPlay (AirAudio funktioniert gut unter Android, benötigt aber ein gerootetes Gerät) und empfangen auf dem Server mit ShAirport. Mit der Development-Version ist es jetzt auch möglich mein passendes Alsa-Device (welches bei mir das Signal auf allen Lautsprechern ausgibt) auszuwählen. Funktioniert bei meinem Testsystem gut...
- Direktes Einspeisen des Signals vom Android-Device parallel in die Audio-Eingänge vom Multiroom-Verstärker, kommt für mich nicht in Frage...
Für eine gute Übersicht der Ausgaben der verschiedenen TTS-Systemen ist diese Seite zu empfehlen. Da hört man deutlich den Unterschied zwischen den freien Systemen die auch unter Linux laufen wie MBROLA, Festival oder SVOX zu den kommerziellen Systemen.
Bevor ich das Konstrukt umsetze, würde mich interessieren wie ihr, wenn überhaupt, ein TTS-System integriert habt und was ihr von der Lösung haltet?
Kommentar