Ankündigung

Einklappen
Keine Ankündigung bisher.

Vollständig integrierte Sprachsteuerung

Einklappen
X
 
  • Filter
  • Zeit
  • Anzeigen
Alles löschen
neue Beiträge

    Vollständig integrierte Sprachsteuerung

    Hallo zusammen,

    bin noch sehr neu hier und lese lediglich sein einiger Zeit mit, bitte daher noch um etwas Nachsicht. 😉

    Für ein Neubauprojekt (EFH mit angeschlossenem Büro, insgesamt ca. 250-300 m² Wohn-/Bürofläche) wird neben einer KNX-Installation auch ein multi-room Audio-/Video-System zum Einsatz kommen. Ggf. habe ich bzgl. letzterem auch noch die ein oder andere Frage, aber zunächst würde ich gerne eure Meinung zu einer vollständig integrierten Sprachsteuerung hören.

    Was meine ich mit "vollständig integriert"?
    Durch das ohnehin geplante multi-room Audio-System wird jeder Raum des Hause mit Stereo-Lautsprechern ausgestattet sein. Für eine Sprachsteuerung fehlen also lediglich die Mikrofone.

    Grundsätzlich hätte ich nun gar kein so großes Problem damit, wenn die Sprachsteuerung online erfolgt, aber was wir sicher nicht möchten ist in jedem Raum zusätzlich irgendein Alexa Echo oder Google Assistant rumstehen zu haben.

    Ich habe natürlich nichts dagegen, wenn die Sprachsteuerung zumindest teilweise offline erfolgt (gibt ja wirklich keinen Grund, weswegen man zum Licht einschalten eine Internetverbindung benötigen sollte), solange dennoch ein Zugriff auf Online-Dienste möglich ist (z. B. Wetterabfrage, suchen im Internet, Wikipedia-Einträge, Musik abspielen (z. B. über Spotify), ...). Wir könnten aber wie gesagt auch mit einer reinen Online-Spracherkennungslösung (z. B. Alexa oder Google) leben, wenn diese vollständig integriert ist.

    Entweder suche ich falsch oder es gibt in diesem Bereich bisher echt wenig. Lediglich Josh.ai scheint etwas in diese Richtung anzubieten (zumindest soweit man das über deren Webseite beurteilen kann).

    Lösungen wie ProKNX Aragon scheinen auch lediglich Geräte mit integrierten Lautsprechern anzubieten, damit dürfte es wohl schwierig sein die Tonausgabe (Sprache, Musik, ...) über die vorhandenen Lautsprecher zu lenken. Auch scheint diese Lösung vollständig offline zu sein, unklar, ob Online-Dienste (Online-Suchen, Wikipedia, Spotify, ...) zusätzlich genutzt werden können.

    Habt ihr noch andere Ideen/Vorschläge für solch eine vollständig integrierte Sprachsteuerungslösung, egal ob online oder offline?

    Viele Grüße und schon mal danke für eure Tipps
    Andreas
    www.openknx.de | Fingerprint/NFC, Schaltaktor, Binäreingang & Präsenz-Multisensor verfügbar

    #2
    Also wenn es um die Sprachsteuerung des Gebäudes geht wüsste ich zum Beispiel nicht wozu es da unbedingt Lautsprecher für benötigt. Das soll einen Befehl entgegen nehmen und am Objekt (Licht/Rollo/Start Radio) ausführen. In einem Büroobjekt wo jeder der reinkommt und die arbeitenden mit der Ansage zum Wetterbericht beglückt, ist ja auch Blödsinn.

    In diesem Sinne ist der Aragon schon richtig, weil er kann das offline machen und muss nicht alle Abläufe im Haus zu den Datensammlern schicken. Da läuft auf dem Server eine Software die das gesprochene direkt auf den KNX gibt. Willst nur Alexa und Co haben, musst halt noch irgendein GW von dort zum KNX einrichten. Die Werbefreudigen von OneHome haben da auch was. Aber die von ProKNX mit dem Aragon beherrschen auch Siri, Alexa und Google. Deine eigentliche Multimedia-Installation der musst halt noch irgendein Interface verpassen um die Befehle per Sprache / KNX Taster da ankoppeln zu können.

    Und in dem Sinne ist auch ein simpler günstiger Echo-Dot3 unauffällig in der Decke montiert schon eine vollständig integrierte Lösung. Du bist halt bei den Befehlen ein wenig darauf begrenzt was Amazon so als Gebäudesteuerung für Befehlssätze kennt. Aber das trifft dich auch immer bei Siri und Google.

    Bei Snips konntest halt deutlich flexibler zu sinnhaftigen Sätzen Aktionen zuordnen.
    ----------------------------------------------------------------------------------
    "Der Hauptgrund für Stress ist der tägliche Kontakt mit Idioten."
    Albert Einstein

    Kommentar


      #3
      Ich finde das Thema Sprachassistenz überbewertet…, habe mich dafür noch nicht wirklich begeistern können. Mag sein das sich das später mal ändert zb. krankheitsbedingt.

      Kommentar


        #4
        Bei den großen dreien stört eben die Logik der US-Gebäudesteuerung in der Befehlsinterpretation und je nach Ping-Laufzeit am Internetanschluss und anderer Effekte ist es gefühlt immer ein komischer Delay. ja an einer umfangreichen Visu braucht man länger aber ein ordentlicher PM und Logik ist schneller in der Ausführung von Standardbefehlen.
        ----------------------------------------------------------------------------------
        "Der Hauptgrund für Stress ist der tägliche Kontakt mit Idioten."
        Albert Einstein

        Kommentar


          #5
          Hallo Göran,

          zunächst herzlichen Dank für deine super-schnelle Antwort! 😀

          Zitat von gbglace Beitrag anzeigen
          Also wenn es um die Sprachsteuerung des Gebäudes geht wüsste ich zum Beispiel nicht wozu es da unbedingt Lautsprecher für benötigt. Das soll einen Befehl entgegen nehmen und am Objekt (Licht/Rollo/Start Radio) ausführen. In einem Büroobjekt wo jeder der reinkommt und die arbeitenden mit der Ansage zum Wetterbericht beglückt, ist ja auch Blödsinn.
          Zwar ist natürlich ein Hauptgrund der Sprachsteuerung die tatsächlich Steuerung am Objekt (Licht, Rollo, ...) wie du schreibst, aber spätestens, wenn's darum geht Musik über Spotify (kann auch Amazon Music o. Ä. sein) abzuspielen, möchte man diese sicherlich über die ordentlichen Lautsprecher des Audio-Systems hören (wenn man schon welche verbaut hat) und nicht über die kleinen Speaker eines Amazon Echo-Dots.

          Zitat von gbglace Beitrag anzeigen
          In diesem Sinne ist der Aragon schon richtig, weil er kann das offline machen und muss nicht alle Abläufe im Haus zu den Datensammlern schicken. Da läuft auf dem Server eine Software die das gesprochene direkt auf den KNX gibt. Willst nur Alexa und Co haben, musst halt noch irgendein GW von dort zum KNX einrichten. Die Werbefreudigen von OneHome haben da auch was. Aber die von ProKNX mit dem Aragon beherrschen auch Siri, Alexa und Google. Deine eigentliche Multimedia-Installation der musst halt noch irgendein Interface verpassen um die Befehle per Sprache / KNX Taster da ankoppeln zu können.
          Du schreibst aber, dass ProKNX/Aragon auch Alexa und Google anbinden kann?
          Das hatte ich bisher noch nicht entdeckt. Wie genau liefe da die Integration mit den Aragon-Geräten?

          Viele Grüße und danke für deine Mühe
          Andreas
          www.openknx.de | Fingerprint/NFC, Schaltaktor, Binäreingang & Präsenz-Multisensor verfügbar

          Kommentar


            #6
            Hallo Lenny,

            Zitat von Lennox Beitrag anzeigen
            Ich finde das Thema Sprachassistenz überbewertet…, habe mich dafür noch nicht wirklich begeistern können. Mag sein das sich das später mal ändert zb. krankheitsbedingt.
            Natürlich kann man da anderer Meinung sein, aber ich denke schon, dass die Sprachsteuerung mehr und mehr relevant und nützlich werden wird - weswegen wir diese bei einem Neubau auch gerne von Anfang an "sauber integriert" hätten.

            Da wird sich über die nächsten Jahre aus meiner Sicht noch viel tun und wenn es vielleicht in 5-10 Jahren möglich sein wird sich mehr oder weniger "normal" mit solch einem Sprachassistenten zu "unterhalten", dann kann das - zumindest für technik-begeisterte Informatiker wie mich 😉 - durchaus eine äußert interessante Sache sein.

            Viele Grüße
            Andreas
            www.openknx.de | Fingerprint/NFC, Schaltaktor, Binäreingang & Präsenz-Multisensor verfügbar

            Kommentar


              #7
              Hallo Göran,

              Zitat von gbglace Beitrag anzeigen
              Bei den großen dreien stört eben die Logik der US-Gebäudesteuerung in der Befehlsinterpretation und je nach Ping-Laufzeit am Internetanschluss und anderer Effekte ist es gefühlt immer ein komischer Delay. ja an einer umfangreichen Visu braucht man länger aber ein ordentlicher PM und Logik ist schneller in der Ausführung von Standardbefehlen.
              Da stimme ich dir völlig zu, meine "Idealvorstellung" wäre daher eigentlich beide Welten miteinander zu kombinieren:
              Offline Spracherkennung für alle lokalen Steuerungen (Licht, Rolle, ...) und Anbindung eines Online-Assistenten für alles andere (Internet-Suchen, Musik-Dienste, ...). Das könnte theoretisch über ein zweites "Hotword" laufen, also z. B. "Hey Computer, frag' Google [...]", wobei "Hey Computer" den offline Sprachassistenten aufweckt und beim Erkennen des zusätzlichen "frag' Google" alles was danach kommt an den Online-Sprachassistenten weiter leitet.

              Aber keine Ahnung, ob es bereits irgendwelche Lösungen in dieser Hinsicht gibt.

              Viele Grüße
              Andreas
              www.openknx.de | Fingerprint/NFC, Schaltaktor, Binäreingang & Präsenz-Multisensor verfügbar

              Kommentar


                #8
                Zitat von abtools Beitrag anzeigen
                Wie genau liefe da die Integration mit den Aragon-Geräten?
                Ich denke da kann Dir Chris multimedia mehr zu erzählen. Und Du kannst im ProServ Unterforum auch noch einiges dazu lesen.
                ----------------------------------------------------------------------------------
                "Der Hauptgrund für Stress ist der tägliche Kontakt mit Idioten."
                Albert Einstein

                Kommentar


                  #9
                  Lennox „Lenny“ heißt mein Labrador. 🤓
                  Sprachassistenz kann interessant sein, jedoch wie schon geschrieben für mich derzeit noch nicht relevant. Aber die Möglichkeiten damit sind schon ziemlich gut.

                  Kommentar


                    #10
                    Hallo Andreas,

                    Kurz zu den Vorteilen von Offline Assistenten:
                    1) Keine Aufzeichnung Deiner persönlichen Daten (auch wenn Dir das vielleicht gar nicht wichtig ist...)
                    2) Keine Abhängigkeit von einem Dritthersteller - dessen Cloudservice für die Zukunft nicht garantiert werden kann
                    3) Keine Weitergabe der Zugangsdaten Deiner Installation an die 3rd Party Skillfirma
                    4) Höhere Betriebssicherheit da unabhängig von Cloudservern und Internetverbindung
                    5) Keine schleichenden Updates die Deine Installation beeinflussen

                    Es gibt auch Nachteile:
                    1) Der Wortschatz ist (noch) nicht uneingeschränkt. Musik von Spotify kann bei uns per Sprache nur dann gestartet werden, wenn die Titel, Radiostationen oder Playlisten auch in den SONOS Favoriten abgelegt sind.
                    2) Es gibt diverse Online Services auf die nicht zurückgegriffen werden kann

                    Zitat von abtools Beitrag anzeigen
                    Durch das ohnehin geplante multi-room Audio-System wird jeder Raum des Hause mit Stereo-Lautsprechern ausgestattet sein. Für eine Sprachsteuerung fehlen also lediglich die Mikrofone.
                    Die Mikrofone allein sind es nicht, es ist die Auswertung (ASR) Speech recognition und Language Unterstanding (NLU). Und genau das bietet Dir eben auch ARAGON. Als unauffälliges Einbaugerät mit der erforderlichen Intelligenz. Es ist übrigens kein Problem die Sprachausgabe auf Deine (Sonos)Lautsprecher umzuleiten.

                    Zitat von abtools Beitrag anzeigen
                    solange dennoch ein Zugriff auf Online-Dienste möglich ist (z. B. Wetterabfrage, suchen im Internet, Wikipedia-Einträge, Musik abspielen (z. B. über Spotify), ...)
                    Das geht teilweise schon mit ARAGON: Du kannst Online Services abfragen, die Dir dann angesagt werden. Bislang noch beschränkt auf Wettervorhersage und Verkehrssituation aber wir arbeiten daran.

                    Zitat von abtools Beitrag anzeigen
                    Lediglich Josh.ai scheint etwas in diese Richtung anzubieten (zumindest soweit man das über deren Webseite beurteilen kann).
                    Wir haben Josh selbst nicht getestet, so kann ich nicht sagen ob das wirklich besser arbeitet. Allerdings ist es um Faktor 5 bis 10 teurer als ARAGON und kann bislang nur Englisch. Eine KNX Integration gibt es auch nicht.

                    Zitat von abtools Beitrag anzeigen
                    Lösungen wie ProKNX Aragon scheinen auch lediglich Geräte mit integrierten Lautsprechern anzubieten, damit dürfte es wohl schwierig sein die Tonausgabe (Sprache, Musik, ...) über die vorhandenen Lautsprecher zu lenken. Auch scheint diese Lösung vollständig offline zu sein, unklar, ob Online-Dienste (Online-Suchen, Wikipedia, Spotify, ...) zusätzlich genutzt werden können.
                    Wie oben beschrieben, das stimmt so nicht

                    Hier mal der Link zu einem Video, das von einem unserer Kunden gemacht wurde. Das veranschaulicht das oben gesagte vielleicht ein wenig.

                    Danke auch an Göran gbglace für Deinen Link zu mir
                    Chris (https://proknx.com)
                    wir haben ARAGON entwickelt, einen offline Sprachassistenten für KNX.

                    Google, Amazon und Apple hätten das auch gekonnt. Aber sie verdienen eben besser an unseren persönlichen Daten...

                    Kommentar


                      #11
                      [QUOTE=multimedia;n1761880] Es ist übrigens kein Problem die Sprachausgabe auf Deine (Sonos)Lautsprecher umzuleiten./QUOTE]

                      Wie sieht es mit Teufel Raumfeld aus?

                      Kommentar


                        #12
                        Zitat von wennderbiber Beitrag anzeigen
                        Wie sieht es mit Teufel Raumfeld aus?
                        Bedienung per Sprache ist sicher möglich (siehe https://flows.nodered.org/node/node-...ntrib-raumfeld). Die Umleitung der Sprachausgabe ist zu prüfen. Wir würden dazu eine .wav Datei weiterleiten. Auf den ersten Blick kann die vom Teufel Node jedoch nicht ausgegeben werden.
                        Chris (https://proknx.com)
                        wir haben ARAGON entwickelt, einen offline Sprachassistenten für KNX.

                        Google, Amazon und Apple hätten das auch gekonnt. Aber sie verdienen eben besser an unseren persönlichen Daten...

                        Kommentar


                          #13
                          Hallo Chris,

                          zunächst herzlichen Dank für deine ausführliche Antwort!

                          Ich gehöre jetzt nicht zu den Leuten, die besorgt darüber sind, dass Amazon oder Google meine Daten bekommt - Google weiß ohnehin schon alles über mich. 😉

                          Die Abhängigkeit von einem externen Anbieter ist aber durchaus ein Punkt.
                          Auch gibt es halt wirklich keinen Grund, warum selbst einfachste Anweisungen (wie Licht einschalten) über die Cloud gehen müssen, was wie Göran schreibt zu einer merklichen Verarbeitungsverzögerung führt.

                          Zitat von multimedia Beitrag anzeigen
                          Bedienung per Sprache ist sicher möglich (siehe https://flows.nodered.org/node/node-...ntrib-raumfeld). Die Umleitung der Sprachausgabe ist zu prüfen. Wir würden dazu eine .wav Datei weiterleiten. Auf den ersten Blick kann die vom Teufel Node jedoch nicht ausgegeben werden.
                          Sowohl Sonos als auch Teufel Raumfeld sind ja irgendwelche Nachrüst-WLAN-Geräte, mit Multi-Room Audio im Neubau hatte ich schon an ein integriertes System (passive Deckenlautsprecher in allen Räumen samt einer (vermutlich zentralen) Verstärkerlösung) gedacht. Hier gibt's ja eine ganze Reihe von Anbietern (Trivum, Autonomic, Basalte, ...), die derartige Lösungen anbieten.

                          Habt ihr zu einem dieser Anbieter auch bereits eine Anbindung für die Audioausgabe?
                          Wenn ihr einfach eine WAV-Datei (bzw. einen Stream?) ausgibt, gibt's hier ggf. auch Anbindungsmöglichkeiten.

                          Und wie sieht's bei ARAGON mit der Anbindung von Musikanbietern wie Spotify, Amazon Music oder Google Music aus?
                          Lässt sich auch das Abspielen von Musik über Sprache mit euren Geräten steuern?

                          Viele Grüße und danke für deine Mühe
                          Andreas
                          Zuletzt geändert von abtools; 19.04.2022, 17:52.
                          www.openknx.de | Fingerprint/NFC, Schaltaktor, Binäreingang & Präsenz-Multisensor verfügbar

                          Kommentar

                          Lädt...
                          X