Ein Modell der Künstlichen Intelligenz mit 20 Milliarden Parametern auf einem iPhone zum Laufen zu bringen – das klingt zuerst nach einem technischen Widerspruch. Viele Smartphones haben schlicht nicht genug Arbeitsspeicher dafür und vor allem Apple war in der Vergangenheit bei der Ausstattung seiner Geräte mit RAM sparsam. Apple hat das Problem für sich trotzdem gelöst, mit einer selbst entwickelten Methode, die das Modell grundlegend anders organisiert, als die KI-Industrie das bisher getan hat.
Normalerweise muss das gesamte Modell im schnellen RAM des Geräts liegen, damit es funktioniert. Ein Modell mit 20 Milliarden Parametern würde die Grenzen heutiger Smartphone-Hardware schnell erreichen. Apples bisheriges On-Device-Modell hatte deshalb nur rund drei Milliarden Parameter – klein genug, um ins Gerät zu passen, aber entsprechend begrenzt in seinen Fähigkeiten.
Flash-Speicher löst RAM-Problem
Amar Subramanya, Apples Vice President of AI
(Bild: Malte Kirchner / heise online)
AFM Core Advanced dreht das klassische Prinzip um: Das gesamte 20-Milliarden-Parameter-Modell liegt im Flash-Speicher – also dort, wo sonst Fotos, Apps und Musik gespeichert sind. In den schnellen Arbeitsspeicher wird immer nur der Teil geladen, der für die aktuelle Anfrage tatsächlich gebraucht wird. Die Methode stellte Amar Subramanya, Apples Vice President of AI, in einem Tech-Talk nach der WWDC-Keynote vor, den Apple an seinem Firmensitz in Cupertino ausrichtete.
Der Kniff dabei: Statt bei jedem einzelnen Wort neu zu entscheiden, welche Teile des Modells aktiviert werden – wie es gängige Modelle tun –, analysiert AFM Core Advanced zunächst die gesamte Anfrage und wählt dann einmalig den passenden Parameter-Subset aus. Das spart den ständigen Datentransfer zwischen Flash und RAM – und damit Zeit und Akkuleistung. Diese Methode nennt sich Instruction-Following Pruning und wurde von Apple-Forschern entwickelt.
Ein Vergleich: Ein Arzt, der einen Patienten behandelt, muss auch nicht sein gesamtes medizinisches Wissen gleichzeitig abrufen – sondern nur das, was für den konkreten Fall relevant ist. Genau so funktioniert AFM Core Advanced.
Was das in der Praxis bedeutet
Das Modell ist nativ multimodal: Es versteht Text, Bilder und Audio gleichzeitig – und kann Text und Sprache ausgeben. Mike Rockwell, der das Siri-Projekt bei Apple leitet, sagte beim Tech-Talk unmissverständlich: „Wir hätten diese neuen Stimmen ohne dieses Modell nicht bauen können.“ Die neuen, deutlich natürlicher klingenden Siri-Stimmen laufen auf dem Gerät – ohne Cloud-Verbindung. Dasselbe gilt für die verbesserte Diktierfunktion.
Rockwell ergänzte, was das architektonisch bedeutet: „Es ist, als hätten wir ein dediziertes Ein-bis-Drei-Milliarden-Parameter-Modell nur für die Stimme – gezogen aus einem viel größeren Ganzen.“ Und laut Softwarechef Craig Federighi seien die jetzigen Anwendungsfälle „erst der Anfang“. Für bestimmte KI-Funktionen, etwa die Bildgenerierung, plant Apple allerdings Nutzungslimits, die sich per iCloud+-Abo erweitern lassen. Das Modell erlaube es Apple, immer mehr Leistung auf das Gerät zu bringen.
Allerdings hat das einen Haken: AFM Core Advanced ist auf das iPhone 17 Pro, das iPhone Air sowie leistungsstarke Mac- und iPad-Modelle beschränkt. Welche Geräte die vollständigen KI-Anforderungen von iOS 27 erfüllen, hat heise online im Detail aufgelistet. Wer ein älteres Gerät hat, bekommt weiterhin das kleinere Modell. Schon die Apple Intelligence ist nur rückwärtskompatibel bis zum iPhone 15 Pro. Apple schafft damit innerhalb seiner eigenen Produktlinie zwei KI-Klassen – und einen möglichen Grund, auf neue Hardware umzusteigen. Für Entwickler bietet Apple die neuen Cloud-Modelle unter bestimmten Bedingungen hingegen kostenlos an.
(mki)











English (US) ·