Audio & Video

Anleitung: Freie Amazon-Alexa-Alternative selber bauen

Amazon bietet mit Alexa und Echo sicherlich die bekannteste Sprachsteuerung, aber es gibt auch Alternativen. Und das nicht nur von Google, sondern auch in der Open-Source-Welt: Mit Jarvis verwandelt Ihr einen Raspberry Pi erstaunlich einfach in einen solchen Sprachcomputer, der Antworten geben, Web-Inhalte abfragen und beliebige Aktionen auslösen kann. Absolut Einsteiger-tauglich!

Übersicht der Anleitung

Vorweg: Jarvis bitte nicht mit Jasper verwechseln - Jarvis ist das mit der französischen Webseite, Jasper das Ding, das nervt.

Das ganze Prozedere ist ziemlich einfach, erfordert aber viele Klicks - und da wir hier jeden Schritt samt Bild zeigen, ist die Anleitung extrem lang. Aber keine Sorge: Die meisten Screens verlangen einfach nach einem Klick auf einen OK-Button. Geteilt ist das ganze in mehrere Phasen: API-Keys (was das ist, kommt später) für Microsoft Bing besorgen, SD-Karte mit Raspbian bespielen, Jarvis installieren, Jarvis starten und nutzen, Plug-ins installieren, eigene Kommandos erstellen.

Was dabei rauskommt: Am Ende könnt Ihr einfache Frage-Antwort-Paare eingeben (Du: Wie heiße ich? Jarvis: Trötentom.), die Wikipedia abfragen, Webseiteninhalte vorlesen lassen und noch ein wenig Kleinkram. Das Beste: Ihr könnt Skripte starten und somit alles steuern!

Voraussetzungen: Raspberry Pi (wir haben eine 2er Version genutzt), SD-Karte mit 16 Gigabyte (eventuell reichen auch 8 GB), USB-Mikrofon, Lautsprecher. Zugreifen könnt Ihr entweder über SSH, oder Ihr schließt einfach Maus und Tastatur an und hängt den Raspi per HDMI an einen Monitor/Fernseher.

UPDATE: Gerade mal durchprobiert: Jarvis funktioniert auch einwandfrei auf einem (hier virtuellen) Linux Mint, ganz ohne Raspberry Pi. So eignet sich Jarvis auch als Steuerung für den normalen Rechner! Einzige Einschränkung: Die Hotword-Engine Snowboy (Schritt 20) gibt es nur für Raspbian als fertiges Paket. Wählt stattdessen einfach eine der beiden anderen Optionen.

UPDATE 2: Wenn Ihr mit der Installation Erfolg habt - hier zeigen wir Euch, wie Ihr mit dem System eine Sprachsteuerung für Kodi (oder sonstwas) bastelt.

Die Kurzversion: Erfahrene Nutzer können auch gleich die Kurzversion nehmen, da der Großteil wie gesagt aus einem Setup-Wizard mit vielen Bestätigungsfenstern besteht.

  1. Raspbian in Jessie-Version mit Win32 Disk Imager auf SD-Karte flashen.
  2. Dateisystem über raspi-config erweitern.
  3. Jarvis aus git klonen.
  4. Bing API-Keys besorgen (für nächsten Schritt).
  5. Jarvis über jarvis/jarvis.sh installieren
  6. Jarvis über jarvis starten.
  7. Wikipedia-Abfrage über Plug-ins installieren.
  8. Befehls-Syntax über den Bereich Commands anschauen; und vorletzten Schritt anschauen.

Noch ein wichtiger Hinweis: Wenn Ihr in einem Menü im Setup-Wizard auf Cancel klickt, landet Ihr nicht im vorherigen Menü! Der Schritt wird übersprungen und Ihr müsst den Wizard komplett neu durchlaufen oder nachträglich manuell erledigen. Wenn Jarvis nach der Installation startet, bekommt Ihr ein grafisches Menü samt Konfiguration.

Da viele Schritte ziemlich trivial sind, verzichten wir dann auf weiteren Text - Überschrift und Bildunterschrift sollten genügen.

Übrigens: Wir halten uns durchweg an die Empfehlungen der Entwickler - das müssen für Eure Zwecke nicht die besten Settings und Engines sein! Aber so bekommt Ihr auf jeden Fall ein laufendes System. Anpassen und umstellen und experimentieren solltet Ihr später.

1. API-Keys besorgen

Jarvis kann diverse Backends für die Spracherkennung verwenden, standardmäßig ist das Bing. Und damit Programme auf Services zugreifen dürfen, brauchen sie sehr häufig solche API-Keys (Schnittstellen-Schlüssel), um sich zu authentifizieren. Für Bing ruft zunächst die Seite für die Keys auf und wechselt zum Reiter Speech:

Meldet Euch mit einem Konto an:

Und kopiert Euch die beiden Keys, Ihr benötigt nur einen davon - allerdings erst später.

2. Raspbian aufspielen

Für diese Anleitung haben wir gemäß (veralteter) Empfehlung das alte Raspbian auf Debian-Jessie-Basis verwendet. Da später ein Upgrade durchgeführt wird, wird vermutlich auch die aktuelle Version funktionieren. Legt also eine SD-Karte ein, öffnet den Win32 Disk Imager, wählt als Device die Karte, als Image die entpackte Raspbian-IMG-Datei und startet den Schreibvorgang mit Write.

Stöpselt jetzt Netzwerk, Mikrofon, SD-Karte und letztlich Strom in den Raspie und wartet den Start ab. Die Login-Daten sind übrigens: Nutzer "Pi", Passwort "Raspberry".

win32diskimager
Der Win32 Disk Imager spielt Raspbian boot-fähig auf eine SD-Karte.

3. Dateisystem erweitern

Standardmäßig verwendet Raspbian leider nur 4 Gigabyte der Karte - was für die Installation nicht genügt. Öffnet einen Terminal und ruft die Raspi-Konfiguration über

raspi-config

dateisystem
Wichtig: Zuerst das Dateisystem erweitern.

auf. Gleich der erste Punkt Expand filesystem weitet die Partition auf den gesamten Speicherplatz aus. In solchen Menüs navigiert Ihr mit den Pfeiltasten, setzt Häkchen mit der Leertaste und bestätigt mit Enter.

4. Jarvis installieren

Um jarvis herunterzuladen, bemüht Ihr folgenden Befehl:

git clone https://github.com/alexylem/jarvis.git

Damit wird Jarvis in das Verzeichnis jarvis heruntergeladen. Wechselt dorthin und startet das Installationsskript:

cd jarvis/ ./jarvis.sh

5. Setup-Wizard startet

jarvis
Hallo!

6. Sprache wählen

Die Beispiele sind auf Französisch, teils auf Englisch - falls Ihr eines davon beherrscht, bleibt vorerst dabei. Aber Deutsch funktioniert natürlich auch.

Sprache auswählen.

7. Warnhinweis

Der Wizard selbst ist komplett auf Englisch.

jarvis
Jaja ...

8. Nutzernamen vergeben

jarvis
Nutzername angeben.

9. Lautsprecher-Test

Jarvis spielt ein Geräusch, eine Art Applaus oder so - wenn Ihr etwas hört, bestätigt. Falls nicht, müsst Ihr "card" und "device" selbst angeben. Welche es gibt, zeigt Euch der Dialog aber auch an. Wie das aussieht, seht Ihr gleich beim selben Dialog für das Mikrofon.

jarvis
Was gehört?

10. Mikro-Test 1

Hier bestätigt Ihr und redet anschließend drei Sekunden lang ins Mikro, am besten laut und deutlich! Ist alles OK, wird, was Ihr gesprochen habt wiedergegeben. Wenn nicht, müsst Ihr manuell Hand anlegen:

jarvis
Mikro-Test.

11. Mikro-Test 2

In dem kurzen Dialog gebt Ihr card und device über die eingeblendeten Ziffern an und bestätigt:

jarvis
Eher selten: Device und Karte müssen per Ziffer angegeben werden.

12. Mikro-Test 3

Wenn die Kombination das Mikro findet, folgt der 3-Sekunden-Reden-Dialog. Wenn nicht, gehts wieder zurück zu den Ziffern.

jarvis
Mikro-Test ...

13. Mikro-Test 4

Irgendwann solltet Ihr etwas hören - zumindest fragt Jarvis danach - bestätigt.

jarvis
Wurde Euer Gebrabbel abgespielt? Nein? Schade ... :/

14. Mikro-Konfiguration beginnt

jarvis
Mikro kalibrieren.

15. Stille wird bestimmt

Zunächst wird dem Mikrofon gezeigt, was in Eurem Raum Stille ist. Also bestätigen und dann drei Sekunden absolute Stille! Es kann hier zu einer Warnmeldung kommen, dass es nicht leise genug ist. In dem Fall könnt Ihr die Empfindlichkeit herunterschrauben. Wie diese Dialoge aussehen, seht Ihr gleich bei der Sprach-Empfindlichkeit, das sind nämlich dieselben.

jarvis
RUHRE!

16. Sprach-Empfindlichkeit

Dieses mal bestätigt Ihr und redet dann wieder drei Sekunden laut und deutlich in das Mikrofon.

jarvis
3 Sekunden Laber - aber laut bitte!

17. Fehlermeldung

Wenn Ihr zu leise seid, solltet Ihr es zunächst noch einmal versuchen und das Mikro gegebenenfalls näher heran holen. Ansonsten versucht es mit einer Erhöhung der Lautstärke über Increase microphone gain:

jarvis
Zu leise - wiederholen!

18. Gain erhöhen

Erhöht sachte in 5er Schritten und bestätigt. Wieder wiederholt Ihr diesen Schritt, bis alles sitzt.

jarvis
In kleinen Schritten so lange anpassen, bis keine Warnmeldung mehr kommt.

19. Mikro-Konfiguration endet

jarvis
Endlich, es passt - weiter.

20. Hotword-Engine

Das Hotword ist das Aktivierungswort (bei Amazon "alexa"). Installiert die vorgegebene Software snowboy.

jarvis
snowboy installieren.

21. snowboy-Installation

jarvis
Ja, wollen wir ...

22. snowboy-Installation 2

jarvis
Erfolg!

23. snowboy-Konfiguration 1

jarvis
Hotword-Konfiguration.

24. snowboy-Konfiguration 2

Bleibt zunächst beim vorgegebenen snowboy - das funktioniert gut, ändern könnt Ihr später.

jarvis
snowboy - klingt blöd, aber funktioniert.

25. STT-Engine

Jetzt wählt Ihr die Speech-To-Text(SST)-Engine, die für die Erkennung Eurer Sprache zuständig ist. Bleibt auch hier beim vorgegebenen bing. Eine Übersicht der Unterschiede findet Ihr auf der Jarvis-Homepage.

jarvis
Es muss natürlich nicht bing sein ...

26. API-Key einfügen

Hier kommt nun der kopierte API-Key ins Spiel.

API-Key einfügen.

27. TTS-Engine

Nun folgt die Wahl der Text-To-Speech(TTS)-Engine, schließlich soll Jarvis ja nicht nur zuhören, sondern auch antworten. Bleibt bei der Vorgabe svox_pico.

jarvis
Alles hat seine Vor- und Nachteile - hier lohnt sich das Experimentieren!

28. svox_pico-Installation

jarvis
Ja, bitte.

29. Update und Upgrade

Direkt nach der svox_pico-Installation startet der Wizard ein Upgrade - das kann schon mal zwei Stunden dauern! Statusmeldungen bekommt Ihr nicht unbedingt, also Geduld ...

jarvis
Das kann dauern!

30. Installation fertig

jarvis
Am Ende wird alles gut - auf geht's!

31. Und nochmal: Fertig.

jarvis
Endlich kann es los gehen.

32. Jarvis starten 1

Startet nun Jarvis aus dem Terminal mit dem Befehl

jarvis

und wählt im Menü, natürlich, Start Jarvis.

jarvis
Jarvis starten.

33. Jarvis starten 2

Startet normal ...

jarvis
Normal starten.

34. Jarvis nutzen

Jarvis startet mit einer simplen Statusmeldung im Terminal und listet freundlicherweise alle Befehle auf. Blöd nur: Die Sprachversion muss stimmen. Bye bye zum Beenden funktioniert hier bei allen Sprachen und auch test sollte eine Antwort bringen. Aber erst mal: Denkt dran snowboy zu sagen, damit Euch zugehört wird! Tipp: Wenn die Kommandos nicht ordentlich verstanden werden oder nur der letzte Teil davon, versucht es mal mit etwas wie "hey" davor - das triggert das Zuhören an, stört aber das Kommando nicht. Zum Beenden versucht bye bye oder drückt Strg+C im Terminal.

jarvis
Jarvis im Betrieb im Terminal.

35. Plugins installieren

Jarvis kann mit Plugins erweitert werden. Sonderlich viele gibt es leider nicht, und viele davon sind auch noch auf Französisch, aber immerhin. Das Wikipedia-Plugin gibt es nur auf Englisch - also müsst Ihr als Sprache in Jarvis auch Englisch einstellen (im ersten Jarvis-Menü über "Settings").

jarvis
Add-ons-Übersicht.

Startet Jarvis erneut und wählt den Punkt Plugins und anschließend Browse zum Stöbern.

36. Wikipedia-Abfrage

Lasst einfach alle Plugins anzeigen und sucht die Wikipedia-Erweiterung. Zum Installieren müsst Ihr wieder nur ein paar mal bestätigen. Anschließend könnt Ihr Wikipedia-Abfragen wie folgt anstoßen: Give me the definition of SOMETHING - versucht es statt SOMETHING mit "train", das funktioniert gut und ist kurz.

jarvis
Wikipedia-Plugin.

37. Eigene Kommandos

Wenn Ihr im Jarvis-Menü den Punkt Commands anwählt, öffnet sich einfach eine Textdatei im Editor nano. Die Syntax ist ganz popelig einfach:

mein name== say "Was soll ich sagen, Alter?"

Wenn Ihr also mein name ins Mikro säuselt, pampt Jarvis mit Was soll ich sagen, Alter? zurück. Und es lassen sich auch Befehle innerhalb des Antworttexts nutzen:

lies vor== say "Auf der Website steht heute $(curl Und jetzt tschüss."

Der curl-Befehl lädt die angegebene URL herunter. Sofern sich dort reiner Text befindet, funktioniert das so ziemlich gut. Bei echten (HTML-)Webseiten ließe sich das weiterspinnen und beispielsweise nach Suchworten filtern und von HTML nach Text umwandeln:

lies vor== say "$(curl | html2text | grep -A5 "Mein Suchbegriff")"

Man kann also auch Pipes innerhalb der Antwort nutzen. Hier würde erst mit html2text in menschenlesbaren Text gewandelt und anschließend mit grep nach einem Suchwort gefahndet (und mit -A5 würden die folgenden 5 Zeilen ausgegeben). Wenn Ihr also lies vor ins Mikro sagt, antwortet Jarvis mit dem heruntergeladenen, konvertierten und gefilterten Text.

Skripte: Ihr könnt auch Skripte starten - und somit alles steuern, was Ihr wollt!

banana== /home/pi/banana-script.sh

Und genau damit, ist Jarvis Alexa/Echo funktional überlegen.

jarvis
Kommandos im Texteditor.

38. Fantasie benutzen

Zugegeben, Amazon Echo kann auf Anhieb ein ganz klein wenig mehr. Allerdings ist es mit Jarvis unendlich viel einfacher, eigene Anwendungen umzusetzen. Dafür mag ein wenig Fleißarbeit erforderlich sein, dafür aber kaum technische Expertise. Bei Alexa ist das Erstellen eigener Skills ein wahnwitzig komplizierter Vorgang, da alles in der Amazon-Cloud stattfinden muss.

Wir werden auf jeden Fall dran bleiben - spannend ist das Projekt allemal. Mehr zum Raspberry Pi haben wir hier.

Mirco Lang

Freier Journalist, Exil-Sauerländer, (ziemlich alter) Skateboarder, Dipl.-Inf.-Wirt, Einzelhandelskaufmann, Open-Source-Nerd, Checkmk-Handbuchschreiber. Ex-Saturn'ler, Ex-Data-Becker'ler, Ex-BSI'ler. Computer-Erstkontakt: ca. 1982 - der C64 des großen Bruders eines Freunds. Wenn Ihr hier mehr über Open Source, Linux und Bastelkram lesen und Tutonaut unterstützen möchtet: Über Kaffeesponsoring via Paypal.freue ich mich immer. Schon mal im Voraus: Danke! Nicht verpassen: cli.help und VoltAmpereWatt.de. Neu: Mastodon

23 Kommentare

  1. Sehr schöner Artikel, macht doch mal ein Tutorial zu Rasperi Pi und Snipes. (Auch Offline Sprachassistent) Da bin ich leider immer am Update gescheitert.Es war in einer Zeitschrift aus Hannover beschrieben.Aber für nicht voll Linux Profis etwas schwer. Würde mich freuen, Viele Grüße aus Köln.

    Henning

    1. Tja, das wäre in der Tat einen Artikel wert, vielen Dank für den Tipp – leider ist Snips nicht mehr öffentlich verfügbar, Sonos hat es aufgekauft und weggeschlossen.

      Genau wegen so eines Mists setze ich lieber auf Open Source, selbst wenn es bisweilen etwas frickeliger ist. (Snips war nur teilweise offen – und somit eigentlich gar nicht, reiner Marketing-Quatsch.)

  2. Hi! Das ist genau das, was ich gesucht habe!!!! Ich würde das allerdings gerne auf einem Netbook umsetzen, über ein Linux. Dafür müsste ich ja eine andere Hotword-Engine benutzen. Ich hab wahrscheinlich Tomaten auf den Augen, aber ich kann die im UPDATE erwähnten anderen beiden Optionen nicht finden.

  3. Hm… ich habe – zugegeben – aufgehört zu lesen, als Bing ins Spiel kam. Klar komme ich mit Jarvis wohl an amazon und Google vorbei. Dafür lasse ich mir Microsoft ins Wohnzimmer. Insofern finde ich die Formulierung „Open-Source-Welt“ gewagt.

    Geht das ganze OHNE Bing? Frederik

    1. Kann ich gut verstehen – aber Bing ist kein Muss! Wie beschrieben habe ich mich einfach an die Standardeinstellungen gehalten, um ein funktionierendes System zu bekommen. Du kannst auch Offline-Erkennung nutzen, das habe ich allerdings noch nicht getestet.

      1. Hallo, Habe Jarvis gestern auf Raspi aufgesetzt und es funzt so weit. Dazu einige Fragen: Gibt es bei Bing nicht eine Beschränkung der Abfrage? Da steht doch 20/min. Grundsätzlich sollte sich das ja ausgehen, aber …. Wenn Jarvis aktiv ist und auf das hotword wartet, wird da alles in der Umgebung immer gegen Bing analysiert oder erst ab Erkennung des hotword?

      2. Bei Bing bin ich mir nicht sicher, wie es sich in der Praxis äußert, aber ja, da gibt es wohl eine Grenze. Es gibt ja Alternativen zu Bing. Bing hatte ich vor allem genutzt, weil es die offizielle Vorgabe ist und ich eine möglichst stabile, standardmäßige Anleitung haben wollte.

        Jarvis wird erst aktiv, wenn das Hotword gesprochen wurde – das ist übrigens bei Alexa, Google & Co. nicht groß anders. Man kann das Ganze aber auch vollständig offline betreiben, wenn man bei der Einrichtung die entsprechenden Tools wählt. Wie gut das dann funktioniert, kann ich jedoch auch nicht sagen.

      3. Ok, Danke. Habe jetzt ein paar Scripts geschrieben, die mir aus dem Web spezifische News, das Kinoprogramm, einzelne Filme und auch das Wetter von heute und morgen beschreibt. Das klappt auch mit Parametern wie: „Film Nummer 3“. Es gibt aber zur einfacheren Handhabung noch ein paar Punkte zu klären: * Jarvis soll gleich nach dem Einschalten aktiviert werden. Die Option als Service zu starten gilt ja auch nur wenn man es aktiv macht. Es ist also kein echtes Services, dass sich startet wenn man bootet. * Änderung des Hotword. Da blick ich nicht ganz durch. Muss ich mir auf der Snowboard-Seite zuerst eines erstellen und dann downloaden und einbinden? * Es gibt doch einige nützliche Plug-Ins, sind diese immer von der jeweilgen Sprache abhängig? Danke für jeden Tip!

      4. Ich musste die Hardware zwischenzeitlich wieder mit etwas anderem bespielen und Snowboy läuft nicht (ohne selbst zu kompilieren) auf Nicht-Raspbian-Systemen, daher kann ich es gerade nicht probieren .. – Bei snowboy müsstes Du eigentlich in der Jarvis-Konfiguration ein anderes Hotword angeben können; zumindest ist der Dialog so aufgebaut. – Die Plug-ins sind sprachabhängig, da die Spracherkennung in einer Bibliothek nachschaut – und steht Jarvis auf Englisch, kann es beispielsweise deutsche Befehle nicht finden. – Für den Autostart kannst Du vermutlich einfach einen Eintrag in /etc/rc.local setzen – mehr Infos hier.

      5. Nur minimal: Klick auf der Seite auf „Weitere Informationen“ unterhalb von „Spracherkennung“, dann auf „Kostenlos testen“ – da gibt’s dann wieder die API-Schlüssel zum Herunterladen. Alternativ kannst du in Schritt 25 auch eine Bing-Alternative wählen!

  4. Hallo Mirco,

    Du hast mir mit Jasper aus dem Herzen gesprochen. Viele Versuche meinerseits wurden gestartet, immer wieder neue Umgebungen geschaffen, aber ohne Erfolg. Ich scheiterte schon bei den Aufnahmen. Ich suchte nach einem Freifeldmikrofon und so kam mir das AIY-Kit (nutze nur die Hardware) gelegen. Ich habe heute nach Deiner Anleitung sofort Erfolg gehabt.

    Ich freue mich auf weitere Ideen

    1. Hallo SteGe, sprichst Du von dem Google AIY Voice HAT?

      Davon hab ich auch noch eines hier rumliegen und würde super gerne die Hardware (Mikrofon und Speaker) nutzen. Ich weiß aber nicht, wie ich das anstellen soll. Hast Du eine Tip? Oder sonst jemand? Vielen Dank, Paco

  5. Chapeau! Ein Tuto auf sehr hohem Niveau! Das ist wirklich mal ein Versuch, der an die Leidensgrenze geht (jetzt das ganze noch mit einem Orange Pi!). Mein kommendes Winter-Projekt steht damit an.

    1. Dankedanke. Das sieht übrigens schmerzhafter aus, als es die vielen Schritte und das olle Französisch anmuten lassen: Die Installation von Abhängigkeiten, vergaß ich ganz zu erwähnen, läuft automatisch und fehlerfrei durch – und das ist sonst oft der Knackpunkt.

      Das Ding optimal zu konfigurieren, ist eine andere Sache … mal schauen, ob ich die Muße finde.

    1. Stimmt. Das ist einfacher, zuverlässiger und kann Out-of-the-Box wesentlich mehr. Und da man für Jarvis Raspi, Lautsprecher und ein gutes Mikro braucht, ist es tendenziell sogar teurer.

      Mit Jarvis musst Du aber nicht Amazon in Dein Wohnzimmer lassen und Du kannst wesentlich einfacher eigene Dinge einbauen. Und: Wenn etwas nicht funzt und man das Gerät mit „Halt’s Maul Arschloch“ anbrüllt, kommt auch kein „Das ist aber unhöflich“, sondern nur dezentes Schweigen ;)

      Aber klar, es ist was für Bastelfreunde.

      1. Schönes Ding, grade mit der Offline-Spracherkennung bestimmt nett zur Gibts dafür auch eine englische Doku? Die Webseite scheint ja zum Großteil französisch zu sein.Da scheitert es dann bei mir. Es scheint aktuell wirklich nur die Möglichkeit zu geben auf definierte Sätze zu antworten. Variablen (also sowas wie „Spiele Playlist [x]“ oder „Beleuchte Zimmer [x] in [y]“) gehen noch nicht, oder?

        Nachdem ja jetzt auch Alexa für Android verfügbar ist, habe ich mich vor ein paar Tagen auch mal an die Amazon Skills gemacht. So kompliziert ist das nicht. Skill definieren (Keyword, auf welche Sätze soll reagiert werden, mögliche Variablen mit Typ, URL), Webservice unter der URL einrichten und dann das JSON auswerten. Rein theoretisch hält dich auch nix von ab, den Webservice auf dem Raspi anzubieten und dann Shell-Skripe auszuführen. Weil: Der Webservice selbst muss nicht bei Amazon laufen. Aber klar, über die Amazon-Cloud läuft das halt zum Großteil schon.

      2. Nee, leider nur auf Französich – daher hatte ich mir das ursprünglich gar nicht erst angeguckt und mein Glück mit Jasper versucht, aber das war ja ein Griff ins Klo. Allerdings: Die Google-Übersetzung vom Französischen ins Englische hat ziemlich gut geklappt, für die paar spärlichen Texte bei Jarvis reicht das fürs Verständnis.

        Die Standard-Engine ist tatsächlich auf Stichworte ausgelegt, andere sollten auch Sätze verstehen. Da muss ich mich jedoch selbst irgendwann mal durchwurschtleln.

        Was Variablen angeht: Jarvis liefert ein paar mit, die in Antworten genutzt werden können, aber es ist alles sehr „framework-ig“ gehalten.

        Aber: Man kann natürlich für jeden Kram ein Mini-Shellskript anlegen. So lange sich der Mediaplayer/die Anwendung über die Kommandozeile steuern lässt.

        Also in der Art:

        *abspielen*== ~/skripte/abspielen.sh
        *pause*== ~/skripte/pause.sh
        *playlist a*== ~/skripte/playlist-a.sh
        

        Und so weiter.

        Ich werde bei Gelegenheit mal versuchen, eine Sprachsteuerung für Kodi aufzusetzen. Wenn das klappt, kommt hier nochmal ein Beitrag dazu.

        P.S.: Du kannst im Befehl eine Variable nutzen:

        *Sag mal (*) und (*) bitte*== say "Ich sage (1) und ich sage (2)"
        

        Die Sternchen-Klammern aus dem Gesprochenen werden im Befehls-/Antwort-Teil als durchnummerierte Klammern wieder aufgenommen. Dazu ließe sich dann auch was basteln, was diese Variablen in Befehle übernimmt.

        Und „Sätze“ funktionieren auch:

        *Ich*spreche*einen*Satz*== say "Schön für dich"
        

        Es gibt viiiieeeel zu spielen ;)

    2. Ah, und natürlich: Ich habe es gerade ausprobiert und oben nachgetragen: Jarvis kann beliebige Skripte ausführen – und ist Amazons Lösung dadurch funktional haushoch überlegen.

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert

Schaltfläche "Zurück zum Anfang"