Sprachschatz DE-2.081
1. Robustheit Schlüsselwort, Sprecherunabhängigkeit
Die Robustheit des Schlüsselworts wurde weiter erhöht. Dazu wird die mathematische Auflösung der Wahrscheinlichkeitsberechnung erhöht. Die Erkennung von Personen, die vorher am Rande der Erkennung waren - insbesondere bei der Schlüsselworterkennung - ist damit erheblich verbessert. Durch das Einarbeiten von 5 neuen Algorithmen wurde zusätzlich die Robustheit wesentlich erhöht. Diese Algorithmen sind teilweise in der Deutlichkeit Aktivierung sowie Sprechqualität Aktivierung hinterlegt.
Insbesondere kann man mit der Sprechqualität Aktivierung auch in halliger Umgebung nun höhere Robustheit erhalten.
2. Performance
Die Berechnungen wurden optimiert, dass das System auch bei größerem parametriertem Wortumfang (>30 Kommandos) noch schnell arbeitet. Während des Bootvorgangs wird u.U. der Speicher reorganisiert (je nach Parameter im SynOhrStudio bzw. Wörtern), sodass ein "Optimizing Memory" erscheint. Insgesamt dürfte der Bootvorgang 5 Sekunden länger dauern.
3. Wildcards
Die _PERCENT Wildcards werden ebenso neu berechnet. Eigentlich wollte ich das Problem erst für die 2.1xx angehen, letztlich konnte ich hier aber einiges der neuen Algorithmen wiederverwenden und abändern, sodass in meinen Offlinetests (und den Onlinetests) sich hier spürbare Verbesserung zeigte. Für die weitere Entwicklung wird hier sicher ein Schwerpunkt sein.
Die Software findet sich unter:
http://enertex.de/downloads/synohr/SprachSchatz-DE.zip
Einstellungen von der 1.505 sollten überprüft werden. Ggf. kommt man nun mit den Standardsettings erheblich weiter.
Inbesondere bei kurzen Schlüsselwörten wie KLARA oder JAMES kann die Erkennung mit der Deutlichkeit nun etwas genauer gesteuert werden. Wie schon immer zeigte sich bei unseren Tests ENERTEX als sehr robust.
Viel Spaß!
1. Robustheit Schlüsselwort, Sprecherunabhängigkeit
Die Robustheit des Schlüsselworts wurde weiter erhöht. Dazu wird die mathematische Auflösung der Wahrscheinlichkeitsberechnung erhöht. Die Erkennung von Personen, die vorher am Rande der Erkennung waren - insbesondere bei der Schlüsselworterkennung - ist damit erheblich verbessert. Durch das Einarbeiten von 5 neuen Algorithmen wurde zusätzlich die Robustheit wesentlich erhöht. Diese Algorithmen sind teilweise in der Deutlichkeit Aktivierung sowie Sprechqualität Aktivierung hinterlegt.
Insbesondere kann man mit der Sprechqualität Aktivierung auch in halliger Umgebung nun höhere Robustheit erhalten.
2. Performance
Die Berechnungen wurden optimiert, dass das System auch bei größerem parametriertem Wortumfang (>30 Kommandos) noch schnell arbeitet. Während des Bootvorgangs wird u.U. der Speicher reorganisiert (je nach Parameter im SynOhrStudio bzw. Wörtern), sodass ein "Optimizing Memory" erscheint. Insgesamt dürfte der Bootvorgang 5 Sekunden länger dauern.
3. Wildcards
Die _PERCENT Wildcards werden ebenso neu berechnet. Eigentlich wollte ich das Problem erst für die 2.1xx angehen, letztlich konnte ich hier aber einiges der neuen Algorithmen wiederverwenden und abändern, sodass in meinen Offlinetests (und den Onlinetests) sich hier spürbare Verbesserung zeigte. Für die weitere Entwicklung wird hier sicher ein Schwerpunkt sein.
Die Software findet sich unter:
http://enertex.de/downloads/synohr/SprachSchatz-DE.zip
Code:
SprachSchatz DE-2.081 (25-11-2015) +New New recognition algorithm for probability calculation. - Added more Gauss functions for better calculation resoultion (upto factor 3) - Added new algorithm for decission trees (as in _PERCENT) - Hand optimized code for many subroutines for faster operation Improved robustness - Improved detection of noise and talking sequences - Added six algorithms for surpressing false magic word detection - Added extended algorithm for better detection of magic word. Added messages if parameter exceeds license model Settings for "Sprechqualitaet Aktivierung" are changed. New setup will be necessary. New memory strategy for high performance calculation Added flexible Framework for additional wildcard commands (needs SynOhrStudio 2.001) Playing an audiofile will be interrupted, if playing a new audiofile is initiated Fixes In some circumstances the detection could de-rate. This is now detected and automatically re-initalized (in less then 1ms) Wildcards didnot fit to new synohrcompiler 2.000 Some noise as a coffee machine did trigger the magic word detection
Inbesondere bei kurzen Schlüsselwörten wie KLARA oder JAMES kann die Erkennung mit der Deutlichkeit nun etwas genauer gesteuert werden. Wie schon immer zeigte sich bei unseren Tests ENERTEX als sehr robust.
Viel Spaß!
Kommentar