Apple hat die Tonspur der WWDC-2026-Keynote offenbar gezielt verändert, um massenhafte Aktivierungen der Sprachassistenz Siri auf den Geräten der Zuschauer zu verhindern. Spektrogramm-Analysen des Videostreams zeigen deutliche Lücken in bestimmten Frequenzbändern – und zwar immer genau dann, wenn auf der Bühne das Wort „Siri“ fiel.
Der niederländische Tontechniker Luuk de Leest veröffentlichte auf X eine entsprechende Analyse mit Spektrogramm und kommentierte, Apple schneide „ein Stück bei 3k, 4k, 5k und 6 kHz heraus, wenn sie ‚Siri' sagen, damit nicht alle HomePods losquasseln“. Die Frequenzbänder bei 3, 4, 5 und 6 Kilohertz wurden demnach gezielt herausgefiltert beziehungsweise stark abgesenkt.
Technisch beschreiben Beobachter die Maßnahme als dynamischen Notch-Filter: Nur in den Momenten, in denen der Name „Siri“ fällt, werden schmale Frequenzbänder im Bereich zwischen 3 und 6 Kilohertz abgesenkt. Dieser Bereich transportiert einen erheblichen Teil der sogenannten phonetischen Energie – also genau jene Anteile von Konsonanten und Vokalen, auf die Wake-Word-Detektoren trainiert sind. Der Rest der Tonspur bleibt unangetastet.
Für Zuschauer blieb das Wort „Siri“ im Stream dennoch verständlich – Beobachter beschreiben den Klang lediglich als leicht „metallisch“ oder „ausgedünnt“. Wake-Word-Systeme wie Siri nutzen akustische Modelle auf Basis neuronaler Netze, die auf die charakteristische Zeit-Frequenz-Signatur des Triggerwortes trainiert sind. Werden entscheidende Bereiche künstlich geschwächt, sinkt die Erkennungswahrscheinlichkeit deutlich.
Kein perfekter Schutz
Allerdings zeigt sich, dass der Ansatz keineswegs vollständig wirkt: Mehrere Nutzer berichteten in Foren und auf Social Media, ihre iPhones oder HomePods seien während der Keynote trotz der Filterung mehrfach angesprungen. Die Gründe dafür liegen in der Natur der Wake-Word-Erkennung selbst. Die Systeme unterscheiden im Kern nicht zwischen live gesprochenen Worten und Audio, das von Lautsprechern kommt – sie analysieren lediglich das Mikrofonsignal auf bestimmte akustische Muster. Unterschiedliche Mikrofoncharakteristiken, individuelle Raumakustik oder die Lautstärke des Streams machen es unmöglich, Fehlauslösungen einzelner Geräte vollständig zu verhindern. Apple hat die Audio-Veränderung bislang nicht offiziell bestätigt.
Apple steht mit diesem Vorgehen nicht allein da. Bereits 2019 wurde bekannt, dass Amazon in TV-Werbespots für Alexa ähnliche audiotechnische Maßnahmen nutzte, damit Echo-Lautsprecher nicht auf das Wake-Word reagierten. Auch Google hatte in einzelnen Präsentationen Anpassungen vorgenommen, um „OK Google“ nicht massenhaft auszulösen.
Siri AI in der EU weiter eingeschränkt
Die WWDC 2026 stand im Zeichen einer umfassend überarbeiteten Version des Sprachassistenten unter dem Namen „Siri AI“, eingebettet in Apples „Apple Intelligence“. Siri AI soll natürliche Sprache verstehen, Bildschirminhalte lesen und persönliche Kontexte in Antworten einbeziehen können. In der EU wird Siri AI zum Start allerdings nicht auf iPhone und iPad verfügbar sein – Apple verweist auf regulatorische Anforderungen. Apples Datenschutzstrategie rund um Siri AI setzt dabei weiterhin auf lokale Verarbeitung und Private Cloud Compute, um möglichst wenige Nutzerdaten nach außen zu geben.
(mki)








English (US) ·