Thomas Weber 
Amazon erprobt generative KI in der Produktsuche – und was das für Seller in Deutschland konkret bedeutet, ist alles andere als angenehm. Wer heute noch auf Keyword-Optimierung allein setzt, riskiert morgen schlicht unsichtbar zu werden. Hier sind die Zahlen, die Risiken und das, was der DMA dazu sagen dürfte.
Klartext vorweg: Amazon hat keinen offiziellen Produktnamen „Amazon Smart Search“ eingeführt. Dieser Begriff kursiert in Agenturblogposts und Tool-Marketing, nicht in offiziellen Amazon-Ankündigungen. Was Amazon tatsächlich betreibt, ist eine Kombination aus mehreren KI-Modulen, die die Produktsuche schrittweise verändern.
In den USA ist der generative Shopping-Assistent Rufus seit Anfang 2024 offiziell gestartet. Rufus beantwortet Fragen wie „Welcher Fahrradhelm eignet sich für Brillenträger?“ direkt in der Amazon-App, zieht Informationen aus Produktdaten, Bewertungen, Q&A-Bereichen und Webquellen und serviert konkrete Produktempfehlungen. Daneben existieren die AI Shopping Guides, die für über 100 Produktkategorien eingeführt wurden und Kaufentscheidungen durch gezielte Fragen kuratieren.
Für Deutschland gilt: Es gibt derzeit keine offizielle Amazon.de-Ankündigung, dass Rufus oder die Shopping Guides flächendeckend live sind. Was mit hoher Wahrscheinlichkeit läuft, sind A/B-Tests und schrittweise UI-Experimente, die nicht öffentlich dokumentiert werden. Das Problem dabei: Seller bemerken Ranking-Verschiebungen, können diese aber nicht einem klar benannten Feature zuordnen. Das ist keine Kleinigkeit.
Das Grundprinzip ist schnell erklärt. Klassische Produktsuche funktioniert über Keyword-Match: Nutzer tippen „Bluetooth-Lautsprecher wasserdicht“, Amazon zeigt eine Liste, Seller kämpfen um die vorderen Plätze. Generative KI ändert dieses Modell fundamental. Statt einer Liste kommt zunächst eine kuratierte Antwort – wenige ausgewählte Produkte, häufig mit Begründung.
Die Mechanik ist vergleichbar mit dem, was Sistrix für Google AI Search dokumentiert: KI-Assistenten heben einzelne Treffer hervor, der Rest der Ergebnisliste verliert Sichtbarkeit. Bei Amazons Rufus-Tests in den USA beobachten Agenturen wie factor-a und Remazing bereits, dass KI-Antworten tendenziell etablierte Marken mit vielen Bewertungen bevorzugen. Long-Tail-Seller, die bisher über Nischen-Keywords Traffic generierten, tauchen in diesen kuratierten Antworten deutlich seltener auf.
Das KI-Ranking ist, kurz gesagt, eine Blackbox auf einer vorhandenen Blackbox. Der klassische Amazon-Algorithmus war schon intransparent genug. Ein LLM-Layer obendrauf macht die Sache nicht besser.
Konkrete Umsatzverlust-Zahlen für Amazon.de liegen öffentlich nicht vor – wer Ihnen jetzt pauschale Prozentwerte nennt, erfindet diese. Was die Erfahrungen aus Google SGE nahelegen: Listings, die nicht in den KI-kuratierten Ergebnissen auftauchen, verlieren überproportional Traffic, weil Nutzer weniger weit nach unten scrollen. Übertragen auf Amazon, wo Kaufentscheidungen noch direkter fallen als bei Google, dürfte dieser Effekt stärker sein.
Amazon ist in Deutschland seit Jahren die erste Produktsuchmaschine. Studien von IFH Köln und dem Handelsverband Deutschland (HDE) zeigen, dass zwischen 60 und 70 Prozent der deutschen Online-Shopper Produktsuchen regelmäßig direkt bei Amazon starten – nicht bei Google, nicht bei Preissuchmaschinen. Das bedeutet: Ranking-Änderungen auf Amazon wirken direkt auf Umsatz, nicht erst über mehrere Zwischenschritte.
Für kleine und mittlere Seller ist das Risiko-Profil besonders scharf. Große Marken mit tausenden Bewertungen, professionellem A+ Content und eigenen Werbebudgets haben gute Chancen, von KI-Assistenten bevorzugt zu werden – ihre Produkte liefern den strukturierten Datenfundus, den LLMs für kohärente Antworten brauchen. Ein Seller mit 200 Bewertungen und soliden, aber schmucklosen Bullet Points hat hier strukturell das Nachsehen.
Hinzu kommt die Frage der bezahlten Platzierung. Falls Sponsored Products und Sponsored Brands in generative Antworten integriert werden – was technisch naheliegt und aus Amazon-Sicht ökonomisch attraktiv ist –, entsteht eine kaum trennbare Mischung aus organischen KI-Empfehlungen und bezahlten Inhalten. Die Marge leidet, die Conversion-Qualität ist schwerer messbar, und ob die Kennzeichnungspflichten eingehalten werden, ist regulatorisch offen.
Ich sage das selten, aber hier ist die Handlungsempfehlung tatsächlich klar: Datenqualität ist das neue Ranking-Signal. Generative KI-Modelle benötigen strukturierte, vollständige und präzise Produktdaten, um sinnvolle Antworten zu generieren. Listings, die das liefern, haben bessere Chancen, in KI-kuratierten Ergebnissen aufzutauchen.
Konkret heißt das:
Das sind keine revolutionären Maßnahmen. Es ist solide Basisarbeit – aber viele Seller haben diese schleifen lassen, weil Keyword-Dichte lange ausreichte. Diese Zeit läuft ab.
Parallel dazu lohnt der Blick auf KI-Sichtbarkeits-Monitoring. Tools, die messen, wie häufig ein Produkt oder eine Marke in KI-generierten Antworten erscheint, werden für die Seller-Praxis relevant – vergleichbar mit dem, was Sichtbarkeits-Tools heute für Google-Rankings leisten.

Amazon ist von der EU-Kommission als Gatekeeper im Sinne des Digital Markets Act eingestuft. Das hat konkrete Konsequenzen für die Einführung von KI-Produktsuchfunktionen in Europa.
Der Digital Markets Act verlangt von Gatekeepern Transparenz über Ranking-Parameter, Verbot von Self-Preferencing und faire Behandlung von Business-Nutzern. Was das für generative KI-Suchelemente bedeutet, ist regulatorisch noch nicht ausdefiniert – aber die Richtung ist klar.
Drei konkrete Spannungsfelder zeichnen sich ab. Erstens: Transparenz. Wenn ein KI-Assistent faktisch darüber entscheidet, welche Produkte Nutzern empfohlen werden, muss Amazon offenlegen, welche Faktoren in diese Entscheidung einfließen. Ob Prime-Status, eigene Marken oder Werbebudget eine Rolle spielen, ist eine direkt relevante Information für Seller – und eine Pflicht, die aus den bestehenden DMA-Anforderungen ableitbar ist.
Zweitens: Self-Preferencing. Die EU-Kommission hat Amazon bereits in anderen Verfahren – etwa zur Buy Box und zu Prime-Bevorzugung – kritisch unter die Lupe genommen. Falls KI-Assistenten systematisch Amazon-Eigenmarken oder exklusive Deals in Antworten pushen, liegt ein Self-Preferencing-Verdacht nahe. Konkrete Verfahren speziell zur KI-Produktsuche gibt es Stand heute nicht öffentlich dokumentiert, aber die Kommission beobachtet das Feld aktiv.
Drittens: Werbekennzeichnung. Intransparente Mischung aus organischen KI-Empfehlungen und bezahlten Inhalten wäre DMA-sensibel und würde gleichzeitig gegen das UWG verstoßen. Amazons KI-Antworten müssen klar erkennen lassen, wenn ein empfohlenes Produkt sponsored ist. Das klingt selbstverständlich, ist aber technisch und gestalterisch eine offene Frage, die Amazon noch nicht öffentlich beantwortet hat.
Was mich an dieser Entwicklung grundsätzlich beschäftigt: Die Marktmacht-Konzentration wird durch KI nicht aufgebrochen, sie wird verstärkt. Generative Suchelemente begünstigen jene, die ohnehin die bessere Datenlage, die größere Bewertungsbasis und das höhere Werbebudget haben. Das ist keine Vermutung – es ist die strukturelle Logik von LLMs, die auf Relevanz und Popularitätssignalen trainiert werden.
Für Seller auf Amazon.de bedeutet das konkret: Die Plattformabhängigkeit steigt, weil das organische Ranking noch stärker von Faktoren abhängt, die man nicht vollständig kontrollieren kann. Wer heute über 70 Prozent seines E-Commerce-Umsatzes über Amazon abwickelt, sollte diese Konzentration ernsthaft überdenken – nicht weil Amazon schlechter wird, sondern weil die Abhängigkeit von einer Blackbox strukturell teuer werden kann.
Diversifikation über eigene Kanäle, D2C-Ansätze und andere Marktplätze bleibt eine wichtige Absicherung. Wer ausschließlich auf Amazon setzt, gibt die Kontrolle über seine Sichtbarkeit und letztlich seine Marge vollständig ab. Das war vorher schon problematisch. Mit KI-Ranking wird es kritischer.
Amazon ist nicht allein. Der Google Shopping AI Mode integriert ebenfalls generative KI in Produktsuchen und verändert, wie Shopping-Anzeigen und organische Ergebnisse ausgeliefert werden. Temu und Shein setzen auf Empfehlungsalgorithmen mit starken Behavioral-Signalen, aber noch nicht auf vergleichbare generative Assistenten.
Der entscheidende Unterschied: Amazon kontrolliert den gesamten Funnel – Suche, Empfehlung, Kauf, Bezahlung, Logistik. Das macht KI-Ranking-Eingriffe auf Amazon strukturell folgenreicher als auf anderen Plattformen.
Es wäre einseitig, ausschließlich die Risiken zu benennen. Es gibt durchaus Szenarien, in denen ein gut optimiertes Listing eines kleineren Sellers von KI-Suchelemente profitieren kann – und diese sollten ehrlich diskutiert werden.
Erstens begünstigt semantische Suchlogik potenziell Produkte, die einen sehr spezifischen Bedarf präzise beschreiben. Ein Nischen-Seller, der ein Produkt für eine klar abgegrenzte Zielgruppe mit vollständigen und präzisen Produktdaten beschreibt, kann in einer KI-kuratierten Antwort auf eine spezifische Nutzeranfrage besser abschneiden als eine Großmarke mit generischeren Listings. Das klassische Keyword-Ranking bevorzugte oft schlicht das meistgesuchte Produkt – nicht unbedingt das am besten passende.
Zweitens können ausführliche, authentische Kundenbewertungen kleinerer Anbieter von KI-Assistenten wie Rufus besonders positiv gewertet werden, wenn sie konkrete Nutzungsszenarien, Vergleiche und Erfahrungsberichte enthalten. Eine Marke mit 300 aussagekräftigen Bewertungen kann hier punkten, obwohl sie volumenmäßig weit hinter einer etablierten Marke zurückliegt.
Drittens eröffnet der KI-gestützte Kaufassistent theoretisch neue Einstiegspunkte: Nutzer, die bisher nie aktiv nach einem Nischenprodukt gesucht hätten, könnten durch eine KI-Empfehlung auf ein passendes Angebot aufmerksam werden. Die Frage ist, ob diese Chancen strukturell ausreichen, um die Nachteile der Popularitätsorientierung von LLMs aufzuwiegen. Realistisch betrachtet: Für die breite Masse der kleinen Seller dürfte das zunächst eher die Ausnahme als die Regel sein. Aber es lohnt sich, das Listing gezielt auf solche spezifischen Suchszenarien auszurichten.
Um die abstrakte Diskussion greifbarer zu machen, helfen konkrete Szenarien, die die Bandbreite der möglichen Auswirkungen illustrieren – ohne erfundene Zahlen zu behaupten.
Szenario 1 – Der spezialisierte Outdoor-Seller: Ein Anbieter von Trekking-Zubehör hat ein Listing für einen ergonomischen Trekkingstock, der speziell für Menschen mit Knieproblemen konzipiert ist. Der A+ Content erklärt die biomechanischen Vorteile, das Q&A-Segment enthält acht beantwortete Kundenfragen zu Gewicht, Griffmaterial und Höhenverstellung. Rufus empfiehlt diesen Stock bei der Suchanfrage „Trekkingstock für Knieschonung“ – weil die Datenbasis präzise auf den Use Case eingeht. Hier zahlt sich Listing-Qualität direkt aus.
Szenario 2 – Der generische Elektronik-Seller: Ein Anbieter von Bluetooth-Lautsprechern hat ein technisch korrektes, aber semantisch generisches Listing ohne A+ Content und mit nur wenigen Q&A-Einträgen. Bei der Suchanfrage „Bluetooth-Lautsprecher für Outdoor-Partys“ erscheint er nicht in der KI-kuratierten Antwort, obwohl sein Produkt technisch vergleichbar mit dem empfohlenen ist. Der Sichtbarkeitsverlust ist real, aber hätte durch gezielte Listing-Optimierung zumindest teilweise vermieden werden können.
Szenario 3 – Der Eigenmarken-Verdacht: Ein Seller stellt fest, dass bei bestimmten generischen Suchanfragen Amazon-Eigenmarken in KI-Antworten überproportional häufig auftauchen, obwohl die Bewertungsbasis der eigenen Produkte vergleichbar ist. Hier liegt das Self-Preferencing-Problem offen zutage – und ist ein Fall, der regulatorisch beobachtet werden sollte. Seller, die solche Muster beobachten, können diese dem Seller Central-Support und im Zweifelsfall der EU-Kommission melden, die Beschwerden von Business-Nutzern unter dem DMA formal entgegennimmt.
Diese Szenarien zeigen: KI-Ranking ist kein binäres Schicksal. Es gibt Hebel – aber sie erfordern aktives Handeln, nicht passives Abwarten.
Die Frage, die bleibt: Wie transparent wird Amazon sein, wenn KI-Suchelemente in der EU flächendeckend ausgerollt werden? Der DMA gibt der Kommission die Instrumente, Transparenzpflichten durchzusetzen. Ob und wie schnell sie genutzt werden, ist offen.
Für Seller gibt es keinen Grund, abzuwarten. Datenqualität optimieren, Q&A aktiv befüllen, Listing-Struktur auf semantische Vollständigkeit prüfen – das sind Maßnahmen, die sich unabhängig davon lohnen, ob Amazon KI-Suche morgen in Deutschland vollständig ausrollt oder erst in 18 Monaten. Wer wartet, bis der Umsatzrückgang sichtbar ist, hat das KI-Ranking bereits verloren.
Die eigentliche Frage ist nicht, ob Amazon KI-Ranking kommt. Sie ist, wie viel Transparenz Seller und Regulatoren tatsächlich erzwingen können – und ob die Conversion-Gewinne für gut optimierte Listings die Sichtbarkeitsverluste der breiten Masse wirklich aufwiegen. Meine Wette: Für die meisten kleinen Seller wird die Bilanz negativ ausfallen, solange die Blackbox bleibt, was sie ist.
Handeln Sie jetzt: Prüfen Sie Ihre Listings auf semantische Vollständigkeit, nicht nur auf Keyword-Dichte. Das ist der einzige Hebel, den Sie gerade wirklich kontrollieren können.
Um Ihnen ein optimales Erlebnis zu bieten, verwenden wir Technologien wie Cookies, um Geräteinformationen zu speichern und/oder darauf zuzugreifen. Wenn Sie diesen Technologien zustimmen, können wir Daten wie Ihr Surfverhalten oder eindeutige IDs auf dieser Website verarbeiten. Wenn Sie Ihre Zustimmung nicht erteilen oder widerrufen, können bestimmte Merkmale und Funktionen beeinträchtigt werden.