Ankündigung

Einklappen
Keine Ankündigung bisher.

Innovation: Spracherkennung / CeBIT

Einklappen
X
 
  • Filter
  • Zeit
  • Anzeigen
Alles löschen
neue Beiträge

  • makki
    antwortet
    Zitat von Chris M. Beitrag anzeigen
    Nö, ist nicht falsche Marke, das geht auch dort schon seit Jahren gut.
    Vermutlich nehmen sich Ingolstadt und München da ja nicht so viel
    Ich finde es jedenfalls nicht praxistauglich verwendbar, für mich bleibt das Thema Spracheingabe im Auto bzw. allgemein (fürs Haus haben wir ja einen anderen thread) eine unnütze Spielerei, bis mir jemand gezeigt hat das es wirklich funktioniert. Ich bin seit nunmehr 4J Betatester davon..
    Ok, ist vielleicht im Cabrio nochmal ne extra-herrausforderung (ähnlich widrig wie im Haus?) aber nun, wenn man es in Autos ohne Dach verkauft..)

    Was ich meine: Wenn die Kiste auf einer Autofahrt von München nach Ingolstadt bei 5x "Karte fahrtweisend" 1x auf AM schaltet oder versucht den unbeliebtesten Kontakt aus meinem Telefonbuch anzurufen, naja, dann benutze ich das beim nächsten mal nicht mehr, nicht alltagstauglich, ganz einfach..

    sondern lässt das den Assist Service machen..
    Das ist Premium!
    Da gebe ich Dir gerne recht, das ist premium & 100% genial!
    Warum? Weil ich mit einem Menschen spreche, der ganz einfach dafür da ist, mein arbiträres Problem zu lösen, meine Sprache spricht und die dafür nötigen Mittel (einen PC mit Internetzugang) griffbereit hat
    Diese Qualifikation wird IMHO kein Spracheingabesystem und keine KI so schnell erreichen..

    Da wundere ich mich auch jedes mal wieder.
    Meine drei Liebesbriefe haben noch nicht geholfen, (mein Verhältniss zu - noch dazu wirklich völlig unnötig - falschgehenden Uhren ist wohl sicherlich bekannt) aber wenn irgendwann mein Auto neben Keyless-Entry, Navi, Internetzugang (ich habe NTP via IP/GSM als 5. Zeitquelle vergessen..) etc.pp. es auch noch schafft, einfach die richtige Uhrzeit anzuzeigen, wär das ne Flasche Schampus Wert
    (von So/Wi-Umstellung reden wir nicht.. letzter So im März/Okt ist ja eine brutal komplexe Regel, die in einem der vermutlich 25 Bordcomputer kaum realisierbar ist bald ist es wieder soweit - und ich werde mich wieder ärgern!)

    Makki

    Einen Kommentar schreiben:


  • Chris M.
    antwortet
    Zitat von makki Beitrag anzeigen
    Mein letzten beiden Premium-Fahrzeuge (BJ 2007&2010) haben wegen irgendwelcher Pakete (nicht weil ich es wollte!) "Spracheingabe". Mit Knopf vorher drücken und damit Radio-Mute!
    Funktioniert? Nee. Nicht wirklich..
    Zitat von MatthiasS Beitrag anzeigen
    Falsche Marke
    Zitat von makki Beitrag anzeigen
    Kann gut sein,
    Nö, ist nicht falsche Marke, das geht auch dort schon seit Jahren gut. Und zwar auch nicht vorher eingelernte Sätze, sondern auch welche wie "Radio Bayern 3" - und da ist das "Bayern 3" nicht vorher abgelegt worden (weil die Entwicklung dass immer hören würde...), sondern da es per RDS bekannt ist und in der Plausibilitätsüberprüfung gewonnen hat. Das muss wohl genau so mit der Eingabe der Adressen in's Navi funktionieren. (Der Profi gibt die aber nicht selbst ein, sondern lässt das den Assist Service machen - der sucht nämlich vorher noch die passende Adresse raus... Neulich auf dem Weg zur Weihnachtsfeier hatte ich das mal wieder genutzt: "Können Sie mir bitte den Parkplatz an der Talstation der Graseckbahn in Garmisch raussuchen? Und vorher bräuchte ich noch einen Geldautomaten der Cash-Group..." -> Assist: "Da hätte ich einen, der liegt mitten in Garmisch, 100 m von der Route entfernt. Darf ich beide Adressen übertragen" -> "Gerne" -> Zielführung starten ==> Das ist Premium! )

    Im Grunde gibt es bei dem Thema Spracherkennung zwei Möglichkeiten (zumindest wenn sich in den letzten paar Jahren nicht dramatisch was geändert hat...).
    Die eine ist Sprecherunabhängig - kann dafür aber nur wenige Wörter.
    Bei der anderen muss erst der Sprecher das System trainieren - dafür können dann "beliebige" Worte erkannt werden.

    Letztere wird bei der Diktiersoftware verwendet - wäre in unserem Kontext aber unbrauchbar. Die Sprecher unabhängige dagegen ist genau das, was wir hier brauchen (aber auch im Auto verwendet wird, bei Telefonhotlines, etc. pp.)
    Zitat von makki Beitrag anzeigen
    hatten wir ja schonmal - wer es über jahrzehnte nicht hinbekommt, (ggfs. seinem Zulieferer zu erklären), aus einer von 4 sicher vorhandenen Quellen (GPS, GSM, RDS, DCF77 für nen Euro) die depperte Uhr einfach richtig zu stellen
    Da wundere ich mich auch jedes mal wieder.

    Einen Kommentar schreiben:


  • ThorstenGehrig
    antwortet
    Hi
    Ausprobieren ist vielleicht das Stichwort :-)
    Beim nöchsten Stamtisch wird Enertex bestimmt seine Entwicklung dabei haben.
    Soll ich mal versuchen die SemVox-Demogeschichte zum Stammtisch zu organisieren?

    Gruß
    Thorsten

    Einen Kommentar schreiben:


  • Hauke
    antwortet
    @Matthias:
    Ich habe zwar nicht das Glück ein Premiumprodukt dieser Marke mein Eigen nennen zu dürfen, hatte aber in der letzten Zeit oft Gelegenheit eben diese Sprachsteuerung in einem der neueren Modelle ausgiebig testen zu können und kann dir nur zustimmen: Funktioniert absolut klasse!


    Knöpfchen drücken sehe ich genauso wie Makki: Im Auto ok, da hab ich die Hand ohnehin selten weit weg vom Knopf. Fürs Haus muss es etwas smarteres geben.... Hotword a la Enterprise fände ich einfach nur geil Vielleicht sollte ich doch vorsichtshalber schon mal Kabel für Mikros in alle Räume vorsehen....

    Einen Kommentar schreiben:


  • makki
    antwortet
    Zitat von MatthiasS Beitrag anzeigen
    Falsche Marke
    Kann gut sein, hatten wir ja schonmal - wer es über jahrzehnte nicht hinbekommt, (ggfs. seinem Zulieferer zu erklären), aus einer von 4 sicher vorhandenen Quellen (GPS, GSM, RDS, DCF77 für nen Euro) die depperte Uhr einfach richtig zu stellen (der 6-Zylinder Biturbo hat dann trotzdem gegen die 4Z/2L züchtung gewonnen, weil man sich das Auto ja nicht wegen der intelligenz beim Uhrenabgleich aussucht - oder gar wegen der Spracheingabe an die man bisher nicht glaubt..)

    Ich bin jedenfalls hin und weg, was Sprachsteuerung mit neustem Stand
    Mit oder ohne Knopf-vorher-drücken? (mit geht [nicht bei mir aber grundsätzlich..], ohne ist die Herausforderung IMHO)

    Mit ist IMHO zwar im Auto gangbar aber sonst halt eher albern/ziemlich unsmart.. s.o.

    Wenn Michael das nur annähernd so hinbekommt (wovon ich bei ihm ausgehe), wird das das Killer-KNX-Gadget.
    Ganz sicher, davon gehe ich auch aus! Aber evtl. könnte das sportlich werden, glauben kann ich das erst wenn ichs gesehen(gesprochen) habe, da hab ich einfach zuviele negative Erfahrungen, weil davon träumt man nun seit ich denken kann

    Makki

    Einen Kommentar schreiben:


  • MatthiasS
    antwortet
    Falsche Marke

    Ich bin jedenfalls hin und weg, was Sprachsteuerung mit neustem Stand in meiner neuen Kiste leisten kann (wenn sie denn nach voerwöchigem Klinik-Aufenthalt in Neckarsulm zurück ist). Das ist unglaublich. Wenn Michael das nur annähernd so hinbekommt (wovon ich bei ihm ausgehe), wird das das Killer-KNX-Gadget.

    Einen Kommentar schreiben:


  • makki
    antwortet
    Zitat von enertegus Beitrag anzeigen
    Das wäre ja so, als würde man zum Kühlschrank gehen und sagen "Schatz, holst Du mir bitte mal ein Bier"...
    Sehr geiles Beispiel
    Man verfolgt das Thema ja nun schon ein paar Tage, was anderes als wissenschaftlich bestimmt wertvolle Erkenntnisse - ohne jegliche Praxistauglichkeit - habe ich bei dem Thema global aber bisher ehrlichgesagt nicht erleben dürfen.

    Mein letzten beiden Premium-Fahrzeuge (BJ 2007&2010) haben wegen irgendwelcher Pakete (nicht weil ich es wollte!) "Spracheingabe". Mit Knopf vorher drücken und damit Radio-Mute!
    Funktioniert? Nee. Nicht wirklich..
    "Karte fahrtweisend" schaltet meistens irgendwie auf die Navi-Karte, manchmal auch fahrtweisend, manchmal aber auch das Radio auf AM oder ruft einen arbiträren Kontakt aus dem Telefonbuch an
    Deswegen bin ich da ehrlichgesagt mehr als skeptisch. Wäre schön, aber bevor ich glaube, das das wirklich funktioniert müsste ich es sehen (oder besprechen und 10x nacheinander dieselbe Aktion ausführend)

    Makki

    Einen Kommentar schreiben:


  • JanT
    antwortet
    Zitat von enertegus Beitrag anzeigen
    Das mit dem Präsensmelder bzw. im Video gezeigten Aktivierungsdruck ist ja gerade das was man nicht will: Aufstehen, drücken und dann sagen "mach mal Licht an". Das wäre ja so, als würde man zum Kühlschrank gehen und sagen "Schatz, holst Du mir bitte mal ein Bier"...
    mit dem Aktivierungsdruck gebe ich Dir natürlich völlig recht. Das nutzen von Präzenserkennung würde ich jedoch nicht unmittelbar im gleichen Kategorie einordnen wollen. Persönlich finde ich Spracherkennung für einfache Funktionen wie Licht ein und aus uninteressant. Ich glaube sowohl der Rest der Familie als auch ich, würde nach ein kurzen "spielephase" lieber ein großflächigen Taster betätigen als dafür selbsgespreche zu führen - Ausnahmefall Natürlich wenn kein Hand frei ist, z.B. weil der Einkauf gerade im Voratsraum transpotiert wird. Dafür wiederum gibt es ja mit Präzensmelder, Helligkeitssensoren und Logik bessere Lösungen.

    Interessant wird Spracherkennung für mich dann, wenn die herkömmliche Bedienung zu "aufwändig" ist, oder einen echten Mehrwert bringt wie z.B. Profilwahl. Meine Bessere Hälfte mag morgens nicht vom Radio vollgedudelt zu werden - ich aber schon also könnte ich in "mein" Profil, die ich aufrufe in dem ich beim reingehen ins Zimmer meinem Namen sage, Multiroom Radio einschalten lassen. Wenn nichts gesagt wird, gibt es halt kein Radio und die WAF bleibt erhalten. Mit aufwändige Bedienung meine ich Befehle die selbst anhand einen Raumbezogenen Bedienelement unmöglich mit weniger als zwei Aktionen ausführbar ist, wie "Spiele Pink Floyd, The Wall" oder "Fahre Rollladen auf 20%"

    Mein Bedarf was zu bedienen habe ich überwiegend dann, wenn ich einen Raum betrete. Somit könnte ein Gerät bzw. Mikrofon die durch Präzenserkennung getriggert wird und an der Tür montiert ist durchaus interessant sein.

    Jan

    Einen Kommentar schreiben:


  • arosy
    antwortet
    Zitat von ThorstenGehrig Beitrag anzeigen
    Das mit dem Tastendruck sehe ich auch als der falsche Weg. Eine Hotword-Erkennung können die aber auch.
    Also Morgens mit Worten das Haus wecken? Ich glaube da müßte ich Morgens um 04:00 Uhr von 0 auf sofort in den Sprint weil der WAF auf unter -1000 fällt und mir irgendetwas hinterher fliegt.

    Einen Kommentar schreiben:


  • ThorstenGehrig
    antwortet
    @Salixer: eben - das sag ich ja.
    Nur dann bin ich auch nicht mehr auf die Rechenleistung des "Mobildevices" beschränkt.
    BTW das Mobildevice was ich meinte war das im Smartphone das es im Video zu sehen gab.

    Gruß
    Thorsten

    Einen Kommentar schreiben:


  • salixer
    antwortet
    Zitat von ThorstenGehrig Beitrag anzeigen
    Außerdem ist das Mobildevice auch nur ein Weg - eine zentraler Server mit fest installieren Mikros im Haus ist genauso gut denkbar
    Was stell ich mir da unter einem "Mobiledevice" vor?
    a) ein Smartphone? Bis ich da das rausgeholt, Tastensperre gelöst und ein App gestartet habe, das den Befehl entgegennimmt... Da ist mir die Lust schon lange vergangen.
    b) nen Kommunikator ala Enterprise am Hemd? Schneller Zugriff, aber wer schnallt sich das Teil schon immer dran?

    Es bleibt nur die Lösung, dass das Haus mit eigenen Micros hört.

    Einen Kommentar schreiben:


  • ThorstenGehrig
    antwortet
    Zitat von enertegus Beitrag anzeigen
    Mein Frau würde mit "Licht Ein" schon recht zurfrieden sein.
    Ja - aber das ist doch erst der Anfang.
    Die Gartenbewässerungssteuerung ist schon schick - und dazu muss das System nunmal Uhrzeiten verstehen können - nicht nur "wasser an/aus".

    Zitat von enertegus Beitrag anzeigen
    Das mit dem Präsensmelder bzw. im Video gezeigten Aktivierungsdruck ist ja gerade das was man nicht will: Aufstehen, drücken und dann sagen "mach mal Licht an". Das wäre ja so, als würde man zum Kühlschrank gehen und sagen "Schatz, holst Du mir bitte mal ein Bier"...
    Der vergleich ist gut
    Das mit dem Tastendruck sehe ich auch als der falsche Weg. Eine Hotword-Erkennung können die aber auch. Außerdem ist das Mobildevice auch nur ein Weg - eine zentraler Server mit fest installieren Mikros im Haus ist genauso gut denkbar (jetzt hab ich schon keine Multiroom-verkabelung... da rede ich von Multiroom-Micro-Verkabelung...)

    Für den Neubau sicherlich denkbar - und wenn ich an die Qualität von Konferenzspinnen denke - auch machbar...

    Ich will ja nicht gegen euren Ansatz argumentieren (der sicherlich viele Vorteile hat) - aber auch der "große" Ansatz hat seinen Scharm.

    Gruß
    Thorsten

    Einen Kommentar schreiben:


  • enertegus
    antwortet
    Zitat von JanT Beitrag anzeigen
    Allerdings wurde mir gesagt, dass sie keine syntaktische Analyse der gesprochene Texte machen, sondern ein kontextabhängiger Auswahl vorprogrammierte Setze. Natürlich kann Alternativformulierungen programmiert werden (und das sehr einfach über ein Webfrontend)- jedoch leidet die Erkennung wenn es zu viele Möglichkeiten gibt.
    Alles andere hätte bei mir ehrlich gesagt Selbstzweifel induziert.
    Eine kontinuierlich laufende Erkennung macht zumindest auf "Embedded Devices" kein Sinn, da die Verarbeitung da langsamer als Echtzeit ist.
    Wie gesagt, Watson...
    Außerdem sollte es so sein: "Schalte mal 1/3/4"? Nee, also wird man paramertrieren müssen. Mein Frau würde mit "Licht Ein" schon recht zurfrieden sein.
    Für meine Zwecke, würde das System wahrscheinlich die Anforderungen erfüllen, da ich überall oberhalb der Schalter ein geeignetes Device schon eingeplant habe und die Spracherkennung nach Erkennung von Präzens für n Sekunden einschalten würde. Bleibt nur die Frage nach dem Kosten / Nutzen.
    Das mit dem Präsensmelder bzw. im Video gezeigten Aktivierungsdruck ist ja gerade das was man nicht will: Aufstehen, drücken und dann sagen "mach mal Licht an". Das wäre ja so, als würde man zum Kühlschrank gehen und sagen "Schatz, holst Du mir bitte mal ein Bier"...

    Einen Kommentar schreiben:


  • JanT
    antwortet
    Zitat von ThorstenGehrig Beitrag anzeigen
    Hat noch jemand auf der CeBIT sich das System live angeschaut?
    Ich war auch - angeregt von Dein Beitrag - auf dem Stand und bin auch beeindruckt von der Spracherkennung. Allerdings wurde mir gesagt, dass sie keine syntaktische Analyse der gesprochene Texte machen, sondern ein kontextabhängiger Auswahl vorprogrammierte Setze. Natürlich kann Alternativformulierungen programmiert werden (und das sehr einfach über ein Webfrontend)- jedoch leidet die Erkennung wenn es zu viele Möglichkeiten gibt. Eine kontinuierlich laufende Erkennung macht zumindest auf "Embedded Devices" kein Sinn, da die Verarbeitung da langsamer als Echtzeit ist.

    Für meine Zwecke, würde das System wahrscheinlich die Anforderungen erfüllen, da ich überall oberhalb der Schalter ein geeignetes Device schon eingeplant habe und die Spracherkennung nach Erkennung von Präzens für n Sekunden einschalten würde. Bleibt nur die Frage nach dem Kosten / Nutzen.

    Jan

    Einen Kommentar schreiben:


  • enertegus
    antwortet
    Zitat von ThorstenGehrig Beitrag anzeigen
    Hi,
    Wenn ich das richtig Verstehe kann man "die Enertex-Lösung" fix trainieren - also vorher genau festgelegte Kommandos.
    ja. Es könnte sowas wie "Licht an", "Licht ein" und "Lampe an" wohl auch doppelt konfiguriert werden. Aber ein syntaktische und grammatikalische Spracherkennung ist das nicht. Das würde wohl aber auch ein größeres Unterfangen. Das meinte ich mit der Anspielung auf den Supercomputer Watson.
    Dann wäre noch die Frage des Trainierens. Die Semvox-Technik erkennt wohl jeden Sprecher (zumindest wirkte das auf der CeBIT so auf mich) - ein Trainieren war nicht notwendig.
    Hier ist es ebenso. Ein Trainieren ist nicht notwendig. Das wäre sonst wohl unschön. Wenn es aber jemand doch tun will, wird er wohl von uns nicht gehindert.

    Einen Kommentar schreiben:

Lädt...
X