Ankündigung

Einklappen
Keine Ankündigung bisher.

TTSmit guter Qualität

Einklappen
X
 
  • Filter
  • Zeit
  • Anzeigen
Alles löschen
neue Beiträge

    [Multimedia] TTSmit guter Qualität

    Hallo,

    für mein Multiroomsystem (Ubuntu-Server mit Mehrkanal-Soundkarte und VLC als Player) bin ich auf der Suche nach einer Text to Speech Lösung mit guter Qualität. Es sollen nur kleine Infos ausgegeben werden, z.B. beim Wecken eine freundliche Ansage des Wetters und erstem Termin, wenn es an der Tür klingelt oder z.B. das Dachfenster noch auf ist und es zu regnen beginnt.

    Leider bin ich nicht zufriedenstellend fündig geworden, vor allem weil ich nicht noch ein Windows Server neben meinem Linux-Server aufsetzen möchte. Aber es gibt auch für Linux gute Lösungen z.B. Acapela, aber mit Preisen jenseits von gut und böse (z.B. gibt es für Acapela keine private Lizenz, die Development Lizenz soll 2000$ kosten).

    Jetzt bin ich auf die Idee gekommen unserem Haus ein "Sprachzentrum" zu spendieren: ein Android Device (z.B. ODROID-U3) mit einer relativ guten TTS Lösung z.B. IVONA, Acapela oder SVOX.

    Ich hab mir eine kleine Android App gebastelt, die über eine Socat Verbindung (später über smarthome.py angesteuert) Textschnipsel entgegennimmt und dann über das installierte TTS-System ausgibt: Das funktioniert im Testsystem gut.

    Um es es in mein Smarthome zu integrieren dachte ich zunächst an ein Android System in VirtualBox, doch leider unterstützen die TTS-Systeme keine x86 Systeme bzw. die Virtalisierung , also die Idee mit dem ODROID-U3.

    Um das TTS-Signal in mein Multiroom-System einzuspeisen sind mir mehrere Möglichkeiten eingefallen:
    1. Ausgabe über Audio-Out (ggf. Kopfhörer) beim Android-Device und dem Eingang der Soundkarte vom Multiroom-Server, habe ich noch nicht getestet sollte aber funktionieren...
    2. Übertragen der Signale mit AirPlay (AirAudio funktioniert gut unter Android, benötigt aber ein gerootetes Gerät) und empfangen auf dem Server mit ShAirport. Mit der Development-Version ist es jetzt auch möglich mein passendes Alsa-Device (welches bei mir das Signal auf allen Lautsprechern ausgibt) auszuwählen. Funktioniert bei meinem Testsystem gut...
    3. Direktes Einspeisen des Signals vom Android-Device parallel in die Audio-Eingänge vom Multiroom-Verstärker, kommt für mich nicht in Frage...

    Für eine gute Übersicht der Ausgaben der verschiedenen TTS-Systemen ist diese Seite zu empfehlen. Da hört man deutlich den Unterschied zwischen den freien Systemen die auch unter Linux laufen wie MBROLA, Festival oder SVOX zu den kommerziellen Systemen.

    Bevor ich das Konstrukt umsetze, würde mich interessieren wie ihr, wenn überhaupt, ein TTS-System integriert habt und was ihr von der Lösung haltet?

    #2
    Hallo,

    mir gefallen persönlich die Stimmen von IVONA am besten. Meine Einschätzung basiert aber auf der Windows Version.

    Die Android Version ist noch Beta, aber mMn schon besser SVOX.

    Kiurze Frage von mir: Kannst Du mir mal nähere Infos zu deinen Multiroom System zukommen lassen? Danke schon mal.

    Gruß,

    Christoph

    Kommentar


      #3
      Das stimmt IVONA gefällt mir auch gut, es gibt auch noch zwei gute und natürlich klingende Stimmen von CereProc.

      Mein Multiroomsystem ist relativ einfach aufgebaut:
      • Die Hardware im 19" Schrank besteht aus:
        - 1x älterer Server mit Intel Atom-Prozessor und jetzt Ubuntu 14.04 Server
        - 2x 4-Kanal-Verstärker (Behringer EPQ 304 Europower), nur eingeschaltet über KNX wenn die zugeordneten VLC-Instanzen abspielen
        - 1x Soundkarte Gigaport HD+ von ESI
      • Lautsprecherkabel in die Räume und hauptsächlich Einbaulautsprecher (Canton und Magnat)
      • Die Musikausgabe erzeugt VLC in der Kommandozeilenversion (cVLC)
      • Verbindung VLC -> KNX erfolgt mit LinKNX die Details findest du hier, für jeden Raum mit eigener VLC-Player-Instanz (d.h. bei meinen vier Räumen läuft 4x VLC gleich mit dem Systemstart des Servers)
      • Gesteuert wird das ganze über meine Denro Ones und PM in den Räumen sowie über Android mit VLC Remote
      • Standardmäßig wird eine Playlist mit Radio-Streams geladen und abgespielt. Zu erst wollte ich mpd nutzen, aber da ich auch gerne Konzerte sehe bzw. höre was aber mit mpd nicht möglich ist, daher der Einsatz von VLC
      • Erweitert werden kann das System auch über dezentrale Komponenten z.B. einem RaspberryPi mit cVLC

      Die Lösung läuft jetzt schon über ein Jahr ohne Probleme.

      Was mir jetzt noch fehlt sind die Durchsagen und da habe ich keine bezahlbaren guten Lösungen für Linux gefunden, daher die Idee mit dem Android-Kästchen.

      Wer mal die Wiedergabe der Sprache über das Netz auf einem Android 4.x Smartphone/Tablet/Box testen möchte findet im Anhang meine gebastelte "TTS-Server"-App, allerdings weit entfernt von einer produktiven Lösung (eigentlich nur ein Test für mich). Ein python Skript zum Übertragen der Sätze die gesprochen werden sollen liegt auch bei, nur die IP und ggf. den Text noch anpassen.
      Angehängte Dateien

      Kommentar


        #4
        Ich nutze Mary, ist kostenlos, läuft unter Linux und bietet von den kostenlosen System die beste Sprachausgabe (zumindest von allen die ich getestet habe).

        Die klingt in Wirklichkeit besser als in den Beispielen auf der Übersichtsseite, kannst Du hier testen:

        The MARY Text-to-Speech System ? MARY Text-to-Speech
        Gruß
        Tobias

        Kommentar


          #5
          Danke für den Link, MARY hatte ich mir auch schon angeschaut und eigentlich hören sich die Stimmen recht gut an und wirklich besser als auf der Übersicht, aber leider gefällt mir die eine weibliche Stimme nicht, ich finde die hört sich an wie durch ein Telefon. Die männlichen Stimmen sind allerdings gut...

          Da es bei uns weiblich werden soll, ist MARY nicht mehr im Rennen, obwohl es am einfachsten umzusetzen wäre...

          Oder gibt es noch mehr weibliche Stimmen die nicht in der Demo sind?

          Kommentar


            #6
            Hi
            ich nutze seid Jahren die Stimme von Google (google Translate).
            Einfach mal ausprobieren: http://translate.google.de
            dann einen beliebigen Text eingeben - und auf das kleine Audio-Symbol klicken.

            Automatisiert habe ich das mit Linux-Skripten und Asterisk:
            https://knx-user-forum.de/sonstiges-...er-google.html

            Übrigens cache ich alle Sprachausgaben - so wird die TTS-Engine nur angesprochen wenn es was neues zu sagen gibt...

            Ich glaube auf Androids wird Petra von SVOX verwendet? Das war mal mein Favorit - den auch Google mal verwendete... leider war er nirgends zu Lizenzieren. Also - vielleicht bin ich an deinem Ansatz interessiert...

            Gruß
            Thorsten

            Kommentar


              #7
              Zitat von ThorstenGehrig Beitrag anzeigen
              Einfach mal ausprobieren: http://translate.google.de
              dann einen beliebigen Text eingeben - und auf das kleine Audio-Symbol klicken.
              Hallo Thorsten, danke für deine Lösung und die Links, die Sprachausgabe mit translate von Google ist wirklich ganz gut.

              Ob es ein Android-System wird steht noch nicht fest, mein kleines Testskript funktioniert schon sehr gut, das ist nicht das Problem, mir widerstrebt, dass ich dann noch ein zusätzliches Kästchen am laufen habe. In einer Android-VM laufen leider die TTS-Systeme nicht, vermutlich weil diese nicht kompatibel zu x86-Systemen sind.

              Kommentar


                #8
                Ich grab das nochmal aus.
                hier läuft auch eine ähnliche Variante, abgeleitet aus den Skripten von Thorsten auf einem Raspberry.

                Diese Stimme (Deutsch, Anna) gefällt mir allerdings wesentlich besser.
                Ich schaffe es aber nicht den Download wie in der Google Variante zu bekommen.

                Best Text-to-Speech Demo: Create Talking Avatars and Online Characters | SitePal TTS Demo
                Hat das schonmal jemand probiert und geschafft

                Kommentar


                  #9
                  Das schaben von einem TTS Anbieter von dessen Demo-Seite halte ich für
                  a) höchst fragwürdig und
                  b) keinesfalls langlebig

                  Gruß
                  Thorsten

                  Kommentar

                  Lädt...
                  X