Nachdem EDOMI schon lange denken, entscheiden und visualisieren kann, dachte ich mir, es ist an der Zeit, EDOMI auch das Sprechen beizubringen.
Im LBS19000301 könnt ihr euch selbst ein Urteil bilden, ob EDOMI in der Schule aufgepasst hat.
Aus meiner Sicht ist pico2wave die derzeit beste frei verfügbare TTS Engine. Auf dieser Engine beruht auch das hier eingesetzt nanotts.
Der LBS erwartet einen Text am Eingang E1, was den LBS dann auch triggert. Dieser Text wird dann in ein Audiofile transformiert und zwar in MP3, WAV oder OGG.
Dabei kann über E2 ein Dateinamenpräfix angegeben werden und in E3 das Zielverzeichnis. Außerdem kann die Sprache, Geschwindigkeit, Pitch und Volume der Ausgabe eingestellt werden, sowie das obligatorische Debug ins Tracelog.
Als Ausgänge findet man den Dateinamen (inkl. Pfad, ohne Pfad, nur Pfad) und die URL, über die man auch per HTTP auf die Datei zugreifen kann. Dazu wird dann lediglich ein Link im Verzeichnis /usr/local/edomi/www/data/tts angelegt. Dies ermöglicht eine direkte Ausgabe des Sprach-Audio-Files über den Squeezebox Command LBS.
Mit dem Ausgang A1 (kompletter Dateiname) kann man auch den LBS Telegram-Contact füttern, um sich Sprachnachrichten als Telegram zusenden zu lassen. MP3 funktioniert hier am besten mit allen Clients auf PC, iPhone und Android.
Hier mal eine Übersicht des Bausteins und wie man ihn sinnvoll einbinden kann:
2016-04-14 23_57_22-EDOMI · Administration.png
Da allerdings einige Zusatzkomponenten erforderlich sind, habe ich ein kleines Shell-Skript geschrieben, welches ich mit in das LBS Zip gebe. Dieses Shell Skript ist nur auf den EDOMI Server zu kopieren und mit
ausführbar machen und dann mit
starten. Danach einfach den LBS importieren oder ins LBS Verzeichnis kopieren, LBS neu einlesen und es kann losgehen.
Bin gespannt auf Euer Feedback.
Viele Grüße
André
Changelog:
==========
v0.1: Initial version
v0.1.1: Directory in E3 is relative to /usr/local/edomi/data/tmp/
Hours in filename ist now 24 instead of 12h based
Im LBS19000301 könnt ihr euch selbst ein Urteil bilden, ob EDOMI in der Schule aufgepasst hat.

Aus meiner Sicht ist pico2wave die derzeit beste frei verfügbare TTS Engine. Auf dieser Engine beruht auch das hier eingesetzt nanotts.
Der LBS erwartet einen Text am Eingang E1, was den LBS dann auch triggert. Dieser Text wird dann in ein Audiofile transformiert und zwar in MP3, WAV oder OGG.
Dabei kann über E2 ein Dateinamenpräfix angegeben werden und in E3 das Zielverzeichnis. Außerdem kann die Sprache, Geschwindigkeit, Pitch und Volume der Ausgabe eingestellt werden, sowie das obligatorische Debug ins Tracelog.
Als Ausgänge findet man den Dateinamen (inkl. Pfad, ohne Pfad, nur Pfad) und die URL, über die man auch per HTTP auf die Datei zugreifen kann. Dazu wird dann lediglich ein Link im Verzeichnis /usr/local/edomi/www/data/tts angelegt. Dies ermöglicht eine direkte Ausgabe des Sprach-Audio-Files über den Squeezebox Command LBS.
Mit dem Ausgang A1 (kompletter Dateiname) kann man auch den LBS Telegram-Contact füttern, um sich Sprachnachrichten als Telegram zusenden zu lassen. MP3 funktioniert hier am besten mit allen Clients auf PC, iPhone und Android.
Hier mal eine Übersicht des Bausteins und wie man ihn sinnvoll einbinden kann:
2016-04-14 23_57_22-EDOMI · Administration.png
Da allerdings einige Zusatzkomponenten erforderlich sind, habe ich ein kleines Shell-Skript geschrieben, welches ich mit in das LBS Zip gebe. Dieses Shell Skript ist nur auf den EDOMI Server zu kopieren und mit
Code:
chmod 755 19000301_lbs.sh
Code:
./19000301_lbs.sh
Bin gespannt auf Euer Feedback.
Viele Grüße
André
Changelog:
==========
v0.1: Initial version
v0.1.1: Directory in E3 is relative to /usr/local/edomi/data/tmp/
Hours in filename ist now 24 instead of 12h based
Kommentar