Ankündigung

Einklappen
Keine Ankündigung bisher.

Innovation: Spracherkennung / CeBIT

Einklappen
X
 
  • Filter
  • Zeit
  • Anzeigen
Alles löschen
neue Beiträge

    #16
    Mit Sprache einfacher steuern

    Ja, die Lösung die Semvox auf der CeBIT gezeigt hat veranschaulicht recht gut was mit Sprache geht. Leider arbeitet diese aber (noch) nicht so richtig mit EIB/KNX.

    Als Experte für Sprachtechnologie und EIB User verfolge ich das Thema seit einiger Zeit und sehe mehrere Projekte in diesem Bereich gerade in den Kinderschuhen.

    Daher würde ich mich über eine rege Diskussion freuen, um hier von KNX Experten die Meinung "gegeigt" zu bekommen. ;-)

    Spaß beiseite, für mich und sicher viele andere User ist eine Diskussion über die gewünschten Feature, Endgeräte und Schnittstellen sehr sinnvoll.

    Was sagst Du denn dazu?

    Gruß
    Detlev Artelt


    voice compass .::. voice goes mainstream*-*Home
    aixvox gmbh .::. voice solutions for europe .::.

    Kommentar


      #17
      Hi,
      ich komme nochmal zurück auf das Spracherkennungssystem von Semvox - im Vergleich zu dem was Enertex wohl in der Schublade hat... :-)

      Wenn ich das richtig Verstehe kann man "die Enertex-Lösung" fix trainieren - also vorher genau festgelegte Kommandos. Damit beschränkt es den Nutzerkreis auf geschulte Nutzer.

      Bei der Semvox-Lösung (die für KNX leider noch nicht eine fertige Lösung ist) kann man eher "frei Sprechen".
      Dann wäre noch die Frage des Trainierens. Die Semvox-Technik erkennt wohl jeden Sprecher (zumindest wirkte das auf der CeBIT so auf mich) - ein Trainieren war nicht notwendig.
      Bei der Enertex-Lösung würde ich anderes Erwarten (bin gespannt auf die erste Demo!)
      Sicherlich ist ein großes Plus für Enertex die Integration in den Raumcontroller - und ein Schritt in die richtige Richtung.

      Hat noch jemand auf der CeBIT sich das System live angeschaut?

      Wenn auch nicht ganz passend - eine kleine Geschichte aus meinem Leben.
      Ich habe vor vielen Jahren einen MS-Kranken Patienten als Zivi betreut. Er konnte nur noch den Kopf bewegen und undeutlich Sprechen.
      Dieser wurde um 13 Uhr von den Zivis vor den TV geschoben - um 17 Uhr kam erst die nächste Betreuung.
      Für mich war das eine grausamme Vorstellung von 13-17 Uhr das selbe TV-Programm schauen zu müssen - und ich habe damals (vor >10 Jahren!) eine Fernbedienung mit Spracheingabe (Philips-Spielzeug) so umgebaut das der Patient "hoch" und "runter" schalten konnte. Trotz einiger "false positives" war dies eine große Steigerung seiner Lebensqualität...

      Gruß
      Thorsten

      Kommentar


        #18
        Zitat von ThorstenGehrig Beitrag anzeigen
        Hi,
        Wenn ich das richtig Verstehe kann man "die Enertex-Lösung" fix trainieren - also vorher genau festgelegte Kommandos.
        ja. Es könnte sowas wie "Licht an", "Licht ein" und "Lampe an" wohl auch doppelt konfiguriert werden. Aber ein syntaktische und grammatikalische Spracherkennung ist das nicht. Das würde wohl aber auch ein größeres Unterfangen. Das meinte ich mit der Anspielung auf den Supercomputer Watson.
        Dann wäre noch die Frage des Trainierens. Die Semvox-Technik erkennt wohl jeden Sprecher (zumindest wirkte das auf der CeBIT so auf mich) - ein Trainieren war nicht notwendig.
        Hier ist es ebenso. Ein Trainieren ist nicht notwendig. Das wäre sonst wohl unschön. Wenn es aber jemand doch tun will, wird er wohl von uns nicht gehindert.
        offizielles Supportforum für den Enertex® EibPC: https://knx-user-forum.de/eibpc/
        Enertex Produkte kaufen

        Kommentar


          #19
          Zitat von ThorstenGehrig Beitrag anzeigen
          Hat noch jemand auf der CeBIT sich das System live angeschaut?
          Ich war auch - angeregt von Dein Beitrag - auf dem Stand und bin auch beeindruckt von der Spracherkennung. Allerdings wurde mir gesagt, dass sie keine syntaktische Analyse der gesprochene Texte machen, sondern ein kontextabhängiger Auswahl vorprogrammierte Setze. Natürlich kann Alternativformulierungen programmiert werden (und das sehr einfach über ein Webfrontend)- jedoch leidet die Erkennung wenn es zu viele Möglichkeiten gibt. Eine kontinuierlich laufende Erkennung macht zumindest auf "Embedded Devices" kein Sinn, da die Verarbeitung da langsamer als Echtzeit ist.

          Für meine Zwecke, würde das System wahrscheinlich die Anforderungen erfüllen, da ich überall oberhalb der Schalter ein geeignetes Device schon eingeplant habe und die Spracherkennung nach Erkennung von Präzens für n Sekunden einschalten würde. Bleibt nur die Frage nach dem Kosten / Nutzen.

          Jan

          Kommentar


            #20
            Zitat von JanT Beitrag anzeigen
            Allerdings wurde mir gesagt, dass sie keine syntaktische Analyse der gesprochene Texte machen, sondern ein kontextabhängiger Auswahl vorprogrammierte Setze. Natürlich kann Alternativformulierungen programmiert werden (und das sehr einfach über ein Webfrontend)- jedoch leidet die Erkennung wenn es zu viele Möglichkeiten gibt.
            Alles andere hätte bei mir ehrlich gesagt Selbstzweifel induziert.
            Eine kontinuierlich laufende Erkennung macht zumindest auf "Embedded Devices" kein Sinn, da die Verarbeitung da langsamer als Echtzeit ist.
            Wie gesagt, Watson...
            Außerdem sollte es so sein: "Schalte mal 1/3/4"? Nee, also wird man paramertrieren müssen. Mein Frau würde mit "Licht Ein" schon recht zurfrieden sein.
            Für meine Zwecke, würde das System wahrscheinlich die Anforderungen erfüllen, da ich überall oberhalb der Schalter ein geeignetes Device schon eingeplant habe und die Spracherkennung nach Erkennung von Präzens für n Sekunden einschalten würde. Bleibt nur die Frage nach dem Kosten / Nutzen.
            Das mit dem Präsensmelder bzw. im Video gezeigten Aktivierungsdruck ist ja gerade das was man nicht will: Aufstehen, drücken und dann sagen "mach mal Licht an". Das wäre ja so, als würde man zum Kühlschrank gehen und sagen "Schatz, holst Du mir bitte mal ein Bier"...
            offizielles Supportforum für den Enertex® EibPC: https://knx-user-forum.de/eibpc/
            Enertex Produkte kaufen

            Kommentar


              #21
              Zitat von enertegus Beitrag anzeigen
              Mein Frau würde mit "Licht Ein" schon recht zurfrieden sein.
              Ja - aber das ist doch erst der Anfang.
              Die Gartenbewässerungssteuerung ist schon schick - und dazu muss das System nunmal Uhrzeiten verstehen können - nicht nur "wasser an/aus".

              Zitat von enertegus Beitrag anzeigen
              Das mit dem Präsensmelder bzw. im Video gezeigten Aktivierungsdruck ist ja gerade das was man nicht will: Aufstehen, drücken und dann sagen "mach mal Licht an". Das wäre ja so, als würde man zum Kühlschrank gehen und sagen "Schatz, holst Du mir bitte mal ein Bier"...
              Der vergleich ist gut
              Das mit dem Tastendruck sehe ich auch als der falsche Weg. Eine Hotword-Erkennung können die aber auch. Außerdem ist das Mobildevice auch nur ein Weg - eine zentraler Server mit fest installieren Mikros im Haus ist genauso gut denkbar (jetzt hab ich schon keine Multiroom-verkabelung... da rede ich von Multiroom-Micro-Verkabelung...)

              Für den Neubau sicherlich denkbar - und wenn ich an die Qualität von Konferenzspinnen denke - auch machbar...

              Ich will ja nicht gegen euren Ansatz argumentieren (der sicherlich viele Vorteile hat) - aber auch der "große" Ansatz hat seinen Scharm.

              Gruß
              Thorsten

              Kommentar


                #22
                Zitat von ThorstenGehrig Beitrag anzeigen
                Außerdem ist das Mobildevice auch nur ein Weg - eine zentraler Server mit fest installieren Mikros im Haus ist genauso gut denkbar
                Was stell ich mir da unter einem "Mobiledevice" vor?
                a) ein Smartphone? Bis ich da das rausgeholt, Tastensperre gelöst und ein App gestartet habe, das den Befehl entgegennimmt... Da ist mir die Lust schon lange vergangen.
                b) nen Kommunikator ala Enterprise am Hemd? Schneller Zugriff, aber wer schnallt sich das Teil schon immer dran?

                Es bleibt nur die Lösung, dass das Haus mit eigenen Micros hört.
                Firma: Enertex Bayern GmbH, Ebermannstädter Straße 8, 91301 Forchheim
                Amazon: KNXnet/IP Router
                , KNXnet/IP Interface

                Kommentar


                  #23
                  @Salixer: eben - das sag ich ja.
                  Nur dann bin ich auch nicht mehr auf die Rechenleistung des "Mobildevices" beschränkt.
                  BTW das Mobildevice was ich meinte war das im Smartphone das es im Video zu sehen gab.

                  Gruß
                  Thorsten

                  Kommentar


                    #24
                    Zitat von ThorstenGehrig Beitrag anzeigen
                    Das mit dem Tastendruck sehe ich auch als der falsche Weg. Eine Hotword-Erkennung können die aber auch.
                    Also Morgens mit Worten das Haus wecken? Ich glaube da müßte ich Morgens um 04:00 Uhr von 0 auf sofort in den Sprint weil der WAF auf unter -1000 fällt und mir irgendetwas hinterher fliegt.
                    cu
                    Andreas


                    Aus dem Norden? Schau mal rein, Stammtisch-Nord!

                    Kommentar


                      #25
                      Zitat von enertegus Beitrag anzeigen
                      Das mit dem Präsensmelder bzw. im Video gezeigten Aktivierungsdruck ist ja gerade das was man nicht will: Aufstehen, drücken und dann sagen "mach mal Licht an". Das wäre ja so, als würde man zum Kühlschrank gehen und sagen "Schatz, holst Du mir bitte mal ein Bier"...
                      mit dem Aktivierungsdruck gebe ich Dir natürlich völlig recht. Das nutzen von Präzenserkennung würde ich jedoch nicht unmittelbar im gleichen Kategorie einordnen wollen. Persönlich finde ich Spracherkennung für einfache Funktionen wie Licht ein und aus uninteressant. Ich glaube sowohl der Rest der Familie als auch ich, würde nach ein kurzen "spielephase" lieber ein großflächigen Taster betätigen als dafür selbsgespreche zu führen - Ausnahmefall Natürlich wenn kein Hand frei ist, z.B. weil der Einkauf gerade im Voratsraum transpotiert wird. Dafür wiederum gibt es ja mit Präzensmelder, Helligkeitssensoren und Logik bessere Lösungen.

                      Interessant wird Spracherkennung für mich dann, wenn die herkömmliche Bedienung zu "aufwändig" ist, oder einen echten Mehrwert bringt wie z.B. Profilwahl. Meine Bessere Hälfte mag morgens nicht vom Radio vollgedudelt zu werden - ich aber schon also könnte ich in "mein" Profil, die ich aufrufe in dem ich beim reingehen ins Zimmer meinem Namen sage, Multiroom Radio einschalten lassen. Wenn nichts gesagt wird, gibt es halt kein Radio und die WAF bleibt erhalten. Mit aufwändige Bedienung meine ich Befehle die selbst anhand einen Raumbezogenen Bedienelement unmöglich mit weniger als zwei Aktionen ausführbar ist, wie "Spiele Pink Floyd, The Wall" oder "Fahre Rollladen auf 20%"

                      Mein Bedarf was zu bedienen habe ich überwiegend dann, wenn ich einen Raum betrete. Somit könnte ein Gerät bzw. Mikrofon die durch Präzenserkennung getriggert wird und an der Tür montiert ist durchaus interessant sein.

                      Jan

                      Kommentar


                        #26
                        Zitat von enertegus Beitrag anzeigen
                        Das wäre ja so, als würde man zum Kühlschrank gehen und sagen "Schatz, holst Du mir bitte mal ein Bier"...
                        Sehr geiles Beispiel
                        Man verfolgt das Thema ja nun schon ein paar Tage, was anderes als wissenschaftlich bestimmt wertvolle Erkenntnisse - ohne jegliche Praxistauglichkeit - habe ich bei dem Thema global aber bisher ehrlichgesagt nicht erleben dürfen.

                        Mein letzten beiden Premium-Fahrzeuge (BJ 2007&2010) haben wegen irgendwelcher Pakete (nicht weil ich es wollte!) "Spracheingabe". Mit Knopf vorher drücken und damit Radio-Mute!
                        Funktioniert? Nee. Nicht wirklich..
                        "Karte fahrtweisend" schaltet meistens irgendwie auf die Navi-Karte, manchmal auch fahrtweisend, manchmal aber auch das Radio auf AM oder ruft einen arbiträren Kontakt aus dem Telefonbuch an
                        Deswegen bin ich da ehrlichgesagt mehr als skeptisch. Wäre schön, aber bevor ich glaube, das das wirklich funktioniert müsste ich es sehen (oder besprechen und 10x nacheinander dieselbe Aktion ausführend)

                        Makki
                        EIB/KNX & WireGate & HS3, Russound,mpd,vdr,DM8000, DALI, DMX
                        -> Bitte KEINE PNs!

                        Kommentar


                          #27
                          Falsche Marke

                          Ich bin jedenfalls hin und weg, was Sprachsteuerung mit neustem Stand in meiner neuen Kiste leisten kann (wenn sie denn nach voerwöchigem Klinik-Aufenthalt in Neckarsulm zurück ist). Das ist unglaublich. Wenn Michael das nur annähernd so hinbekommt (wovon ich bei ihm ausgehe), wird das das Killer-KNX-Gadget.
                          Gruß Matthias
                          EIB übersetzt meine Frau mit "Ehepaar Ist Beschäftigt"
                          - PN nur für PERSÖNLICHES!

                          Kommentar


                            #28
                            Zitat von MatthiasS Beitrag anzeigen
                            Falsche Marke
                            Kann gut sein, hatten wir ja schonmal - wer es über jahrzehnte nicht hinbekommt, (ggfs. seinem Zulieferer zu erklären), aus einer von 4 sicher vorhandenen Quellen (GPS, GSM, RDS, DCF77 für nen Euro) die depperte Uhr einfach richtig zu stellen (der 6-Zylinder Biturbo hat dann trotzdem gegen die 4Z/2L züchtung gewonnen, weil man sich das Auto ja nicht wegen der intelligenz beim Uhrenabgleich aussucht - oder gar wegen der Spracheingabe an die man bisher nicht glaubt..)

                            Ich bin jedenfalls hin und weg, was Sprachsteuerung mit neustem Stand
                            Mit oder ohne Knopf-vorher-drücken? (mit geht [nicht bei mir aber grundsätzlich..], ohne ist die Herausforderung IMHO)

                            Mit ist IMHO zwar im Auto gangbar aber sonst halt eher albern/ziemlich unsmart.. s.o.

                            Wenn Michael das nur annähernd so hinbekommt (wovon ich bei ihm ausgehe), wird das das Killer-KNX-Gadget.
                            Ganz sicher, davon gehe ich auch aus! Aber evtl. könnte das sportlich werden, glauben kann ich das erst wenn ichs gesehen(gesprochen) habe, da hab ich einfach zuviele negative Erfahrungen, weil davon träumt man nun seit ich denken kann

                            Makki
                            EIB/KNX & WireGate & HS3, Russound,mpd,vdr,DM8000, DALI, DMX
                            -> Bitte KEINE PNs!

                            Kommentar


                              #29
                              @Matthias:
                              Ich habe zwar nicht das Glück ein Premiumprodukt dieser Marke mein Eigen nennen zu dürfen, hatte aber in der letzten Zeit oft Gelegenheit eben diese Sprachsteuerung in einem der neueren Modelle ausgiebig testen zu können und kann dir nur zustimmen: Funktioniert absolut klasse!


                              Knöpfchen drücken sehe ich genauso wie Makki: Im Auto ok, da hab ich die Hand ohnehin selten weit weg vom Knopf. Fürs Haus muss es etwas smarteres geben.... Hotword a la Enterprise fände ich einfach nur geil Vielleicht sollte ich doch vorsichtshalber schon mal Kabel für Mikros in alle Räume vorsehen....
                              Endlich umgezogen. Fertig? Noch lange nicht... ;-)

                              Kommentar


                                #30
                                Hi
                                Ausprobieren ist vielleicht das Stichwort :-)
                                Beim nöchsten Stamtisch wird Enertex bestimmt seine Entwicklung dabei haben.
                                Soll ich mal versuchen die SemVox-Demogeschichte zum Stammtisch zu organisieren?

                                Gruß
                                Thorsten

                                Kommentar

                                Lädt...
                                X