Kürzlich wurde mir auf LinkedIn die Frage gestellt, ob oder wann denn wohl die Spracheingabe für Copilot käme. In der Tat hatten wir die ja schonmal – ebenso wie die Möglichkeit, Bilder zu verarbeiten. Beides ging verloren im Zusammenhang mit der Umstellung des Copilot Chat von CDP (Commercial Data Protection) auf EDP (Enterprise Data Protection). Zumindest für die Bildverarbeitung ist das der Zusammenhang, bei der Spracheingabe bin ich nicht sicher.
Die Rückkehr der Bildverarbeitung ist angekündigt für die M365 Copilot Lizenz. Noch im Februar soll der Rollout einer Funktion starten, mit der wir bis zu 5 Bilder in OneDrive auswählen können, um sie beschreiben oder Text daraus extrahieren zu lassen [https://www.microsoft.com/en-us/microsoft-365/roadmap?id=469499]. Prompts zu diktieren steht ebenfalls kurz vor dem Rollout (ab März 2025) [https://www.microsoft.com/en-us/microsoft-365/roadmap?id=475968].
Allerdings kann man eigentlich schon immer auch mit anderen Mitteln Prompts einsprechen. Etwa in Word:
Eigentlich in so ziemlich allen Office Apps kann man diktieren. Hier OneNote Web:
Da das nur für die Inline-Prompts funktioniert, bleibt für die Sidebar noch die systemweite Spracherkennung als Option. Die kann ich in den Einstellungen zur Barrierefreiheit aktivieren:
Damit kann ich in beliebige Textfelder rein sprechen. Die Verarbeitung findet dabei lokal auf meinem Gerät statt, es wird nichts in die Cloud weitergeleitet. Für die Qualität der Erkennung wäre das aber vielleicht besser – man kann die lokale Maschine aber trainieren für die eigene Stimme.
http://faq-o-matic.net/?p=8952