Den Film Iron Man kennen sicherlich viele. J.A.R.V.I.S. ist der sprechende Computer von Tony Stark. Mark Zuckerberg hat sich für dieses Jahr den Vorsatz genommen, ähnlich wie in dem Film Iron Man, sich einen digitalen Assistenten zu entwickeln.
Ich habe mich eben ein wenig mit diesem Thema beschäftigt und habe einen Ansatz gefunden, den ich mir für die Haussteuerung in unserem Zuhause einmal testen möchte. Ein wenig Künstlich Intelligenz kommt dabei auch zum Einsatz.
Was macht J.A.R.V.I.S.überhaupt. Eigentlich sind hier nur 3 Bausteine entscheidend. Der Computer muss meine Spracheingabe aufnehmen, dann verarbeiten und zu guter Letzt eine Rückmeldung geben können. Am besten in Sprache dann auch ausgeben. Nach ein wenig google stellte ich fest, genau hierfür gibt es bereits eine Reihe an fertigen Anwendungen, welche Recht einfach genutzt werden. Es gibt hier sogar Open-Source Anwendungen.
Die Spracheingabe wird in der Technik mit STT (Spech-to-Text) beschrieben. Hierbei gibt es schon eine Menge bekannter Anwendungen wie Siri von Apple oder Cortana von Microsoft. Ebenso gibt es von den großen Herstellern für IT auch entsprechende TTS (Text-to-Spreach) Anwendungen. Das schöne dabei ist, dass einige davon eigene Schnittstellen haben um seine Anwendung daran zu koppeln. Im Open-Source Umfeld gibt es sogar STT und TTS Umfeld auch einige Lösungen. Vorteil hierbei ist, diese sind dann Netzwerk unabhängig. Der Nachteil ist aber das diese Entweder nicht so gut die Sprache verstehen oder auch ausgeben oder mit viel Vorarbeit angelernt werden müssen.
Zwischen STT und TTS und fehlt ja noch die Verarbeitungseinheit. J.A.R.V.I.S. ist ein System, was eigenständig Signale erkennt und ohne viel zu tun selbst agiert. Es erkennt nicht nur Spracheingaben, sondern agiert auch auf andere Signale. Für mein Experiment würde es ausreichen, wenn eine Anwendung auf meine Anfragen reagieren würde und das Highlight wäre wenn es z.B. das Licht ausschalten könnte.
Nun ist mir bei der Recherche das Projekt JASPER aufgefallen. JASPER hat bereits jetzt einige STT und TTS Anbindungen, es ist Open-Source und somit erweiterungsfähig. In der aktuellen Variante sind einige Module bereits integriert. Man kann z.B. das Wetter oder einen Aktienkurs sich ausgeben lassen.
Nun versuche ich erst einmal JASPER zum laufen zu bekommen 🙂