Online shops und Produktkategorisierung

Wenn Sie ein physisches Geschäft betreten, finden Sie über den Gängen Tabellen, die die Kategorie der Produkte angeben, die in einem bestimmten Bereich verkauft werden.

Das Online-Äquivalent dazu sind die Produktpfade, die die Hauptkategorie, die Unterkategorie, die Kategorie der Ebene 3 und so weiter anzeigen. In den früheren Tagen des Internets wurden diese Kategorien manuell festgelegt, aber da Amazon inzwischen Millionen von Produkten verkauft, wurde die Produktkategorisierung inzwischen automatisiert, indem maschinelles Lernen und KI-Modelle zu diesem Zweck eingesetzt werden.

Alles, was man für das Training eines ML-Modells braucht, ist ein guter Trainingsdatensatz in Form von Produktname -> Kategorie und dann kann man ein entsprechendes Textklassifikationsmodell trainieren.

Was die möglichen Kategorien angeht, gibt es zwei Hauptoptionen. Die eine ist die Google Produkttaxonomie und die andere die IAB-Klassifizierung, beide haben Tier 1, Tier 2 und niedrigere Tiers von Kategorien.

Für die Kategorisierung von E-Commerce-Produkten ist die Google Product Taxonomy-Kategorisierung am besten geeignet, während die IAB-Kategorisierung allgemeiner ist und mehrere Überarbeitungen durchlaufen hat.

Eine ausgezeichnete Saas-Plattform, die Produktkategorisierung anbietet, ist Productcategorization.com. Sie können deren free API tool das Feature engineering and text vectorization benutzt hier ausprobieren.

 

Die Ausgabe erfolgt in Form eines schönen Diagramms und einer json-Datei, die auch exportiert werden kann.

Eine weitere wichtige Variante der Kategorisierung ist das Tagging von Produkten. Dies ist eine modernere Version des Versuchs, die Produkte zu klassifizieren, und hat den zusätzlichen Vorteil, dass es keine allgemeine Obergrenze für die Anzahl der Tags gibt, die den Produkten eines Online-E-Commerce-Shops zugewiesen werden können.

Eine Lösung, die Produkt-Tagging anbietet, ist unter producttagging.com verfügbar. Sie können eine Demo des Produkt-Taggings ausprobieren hier.

Ich habe Diamantenohrringe ausprobiert und diese Tags erhalten (mit Prozentangaben, die angeben, wie relevant der Tag für den Produktnamen ist):

Diamant
58 %
Ohrringe
33 %
Ohrring
22 %
Diamant-Ohrringe
7 %
Schmuck
6 %
Weißgold
6 %
Diamanten
6 %
Gelbgold
4 %
Reif
3 %
Brautschmuck

2 %

Produktkennzeichnung und -kategorisierung haben eine große Zukunft, da die Zahl der Online-Shops rapide zunimmt.