Einblicke in die Suchfunktion der Polynorm E-Business-Plattform

Aktuelles

Suchbegriff eintippen, passendes Ergebnis klicken, fertig: Das erwarten wir von einer guten Suchfunktion, egal ob bei Google oder im E-Shop. Doch manchmal kommt es vor, dass die Artikel-Trefferliste nicht exakt dem eingegebenen Suchbegriff entspricht. Erfahren Sie im folgenden Artikel wie eine gute Suche funktioniert und wie die Trefferliste der Polynorm E-Business-Plattform zustande kommt.

Die Suchfunktion der Polynorm E-Business-Plattform

Die Suchfunktion ist das zentrale Element eines Onlineshops. Anstelle sich durch einzelne Kategorien zu klicken, gibt der potentielle Kunde den gewünschten Suchbegriff ins Suchfeld ein, um so schnell wie möglich zum gewünschten Ergebnis zu gelangen. Wenn dieses mächtige Werkzeug nicht korrekt eingesetzt wird, kommt es in der Praxis leider gelegentlich vor, dass die Ergebnisse auf den ersten Blick nicht zum Suchbegriff passen und der erwartete Artikel weit unten auf der Liste angezeigt wird. Im schlimmsten Fall verlässt der Kunde den Shop wieder und schaut beim Mitbewerber weiter.

Wie funktioniert die Suche der Polynorm E-Business-Plattform?

Der Polynorm E-Shop und der X-Media Manager nutzen die Suchmaschine Elasticsearch. Elasticsearch baut auf der Open Source-Lösung Apache Lucene auf. Zusammen mit Solr ist Elasticsearch eine der aktuell weitverbreitetsten Suchmaschinen. Bekannte Nutzer sind beispielsweise die New York Times, LinkedIn oder Wikipedia. Die performante Elasticsearch-Engine wird auch von vielen E-Shop Betreibern genutzt, um Kunden schnell zufriedenstellende Suchergebnisse zu liefern und damit im besten Fall die Conversion-Rate zu erhöhen. Vor allem für E-Shops mit einem hohen Datenvolumen ist Elasticsearch ausschlaggebend, damit dem Suchenden sehr schnell qualitativ hochwertige Artikel vorgeschlagen werden können.

Die hinterlegten Dokumente umfassen alle Eigenschaften, welche ein Produkt beschreiben, sowie den zugehörigen Werten. Jedes einzelne Dokument wird in einem Index abgebildet. Werden Dokumente indexiert, wird der Text innerhalb dieser Dokumente umgewandelt, um später einfacher gefunden zu werden. Dazu gehört die Trennung in einzelne Worte oder Begriffe. 

Wie kommt ein Suchergebnis zustande?

Im Folgenden schauen wir uns das Zustandekommen eines Suchergebnisses anhand eines Praxisbeispiels aus der Polynorm Polynorm E-Business-Plattform genauer an. Bei der Volltextsuche müssen grundsätzlich drei Prozesse beachtet werden: die Indexierung, die Suche und das Boosting.

Indexierung

Bei der Indexierung werden die Artikeldaten analysiert und in eine Datenbank geschrieben, welche das effiziente Durchsuchen der Daten ermöglicht. In diesem Prozess werden die Texte, wie sie auf dem Artikel vorkommen, nach verschiedenen definierten Regeln in separate Worte gesplittet, normalisiert (bspw. Umlaute durch einfache Vokale ersetzt) und abgelegt. 

In unserem Praxisbeispiel gehen wir davon aus, dass der Kunde auf der Suche nach einem „Samsung UE65NU8509T 65Zoll 4K Ultra HD S“ Fernseher ist.

Bevor ein Suchbegriff eingegeben wird, wurden aus der Bezeichnung «Samsung UE65NU8509T 65Zoll 4K Ultra HD S» bereits folgende Begriffe generiert und in der Datenbank abgelegt:

  • samsung
  • ue
  • 65
  • nu
  • 8509
  • t
  • 65
  • zoll
  • 4
  • k
  • ultra
  • hd
  • s

Suche

In unserem Beispiel wird nun nach „ue65“ gesucht. Der eingegebene Suchbegriff wird in einzelne Ausdrücke («ue», «65») zerlegt und in den zuvor indexierten Artikeldaten gesucht. Alle gesuchten Ausdrücke ("ue" sowie "65") müssen in den Artikeldaten gefunden werden, damit der Artikel in der Trefferliste angezeigt wird. Bei der Suche spielt die Gross- und Kleinschreibweise keine Rolle. Nach dem ersten Suchdurchlauf werden weitere Filter angewandt (bspw. Web-Freigabe, Bezugsberechtigung, etc.) bis die finalen Treffer klar sind.

Im weiteren Verlauf werden die gefundenen Treffer gewichtet. Je nachdem, auf welcher Eigenschaft (Artikel-Nr, Artikelbezeichnung, Artikelbeschreibung, etc.) der gesuchte Begriff gefunden wurde, wird der Treffer unterschiedlich gewichtet. Ein Mehrfach-Treffer («ue» kommt in der Artikelbezeichnung und in der Artikelbeschreibung vor) wird höher gewertet, als wenn der Treffer lediglich in nur einem Feld (bspw. in der Bezeichnung) vorkommt. 

Die Such-Engine hat nun ein Zwischen-Resultat mit gewichteten Treffern. Man spricht hier von einer «Relevanz», welche als Dezimal-Zahl angegeben wird. Je höher diese Relevanz ist, desto höher wird der Artikel bei den Resultaten angezeigt.

Boosting

Die Treffer können je nach Eigenschaften noch ein so genanntes «Boosting» erhalten. Dieses Boosting ist konfigurier- und erweiterbar. Die Relevanz eines A-Artikels (Top Artikel) kann mit einem beliebigen Faktor multipliziert werden, damit dieser Artikel weiter oben in den Suchergebnissen angezeigt wird.

Artikel-Trefferliste

Fassen wir zusammen, welche Vorgänge sich für die Berechnung der Trefferliste auf den eingegebenen Suchbegriff „ue65“ im Hintergrund abspielen: 

1. Aufteilung der Worte bei der Sucheingabe: Der Begriff wurde aufgeteilt in „ue“ und „65“. Beide Suchbegriffe müssen in den Artikeleigenschaften vorkommen, damit der Artikel als Treffer gilt.

2. Gewichtung: Artikel, welche den Suchbegriff in der Artikelbezeichnung enthalten, werden höher gewertet als Artikel, bei welchen der Suchbegriff lediglich in der Artikelbeschreibung vorkommt.

3. Boosting-Faktoren: A-Artikel werden höher gewertet und in der Trefferliste weiter oben platziert.

Somit erhalten wir folgendes Suchergebnis und es werden auch Ergebnisse angezeigt, die nicht viel mit dem ursprünglichen Wunschergebnis, dem „Samsung UE65NU8509T 65Zoll 4K Ultra HD S“ Fernseher zu tun haben, wie man am vierten Artikel in der Trefferliste erkennen kann. "UE" kommt nicht in der Bezeichnung des Artikels vor.

Suchergebnis im Polynorm E-Shop

Artikel 1: „Samsung UE65NU8509T 65Zoll 4K Ultra HD S“

  • „UE“ und „65“ wurde in der Artikelbezeichnung sowie in der Artikelbeschreibung gefunden.
  • Es handelt sich um einen Artikel der Kategorie A, welcher höher gewertet wird als bspw. ein Artikel der Kategorie B oder C.


Artikel 2: „Samsung UE65NU7400U 65Zoll Smart-TV WLAN

  • „UE“ und „65“ wurde in der Artikelbezeichnung jedoch nicht in der Artikelbeschreibung gefunden.
  • Der Artikel hat keinen Boosting-Faktor erhalten.


Artikel 3: „Samsung UE65MU6655U 65Zoll 4K Ultra HD S“

  • „UE“ und „65“ wurde in der Artikelbezeichnung jedoch nicht in der Artikelbeschreibung gefunden.
  • Der Artikel hat keinen Boosting-Faktor erhalten.


Artikel 4: „Samsung QE65Q8FGMTXZG 65Zoll 4K Ultra HD“

  • „65“ wurde in der Artikelbezeichnung gefunden.
  • „UE“ wurde nicht in der Artikelbezeichnung, jedoch in der Artikelbeschreibung gefunden.
  • Es handelt sich um einen Artikel der Kategorie A, weshalb der Artikel mit einem Boosting-Faktor aufgewertet wird.


Artikel 5: „Samsung UE65MU6670 65Zoll 4K Ultra HD Sm“

  • „UE“ und „65“ wurde in der Artikelbezeichnung jedoch nicht in der Artikelbeschreibung gefunden.
  • Der Artikel wurde aufgrund seiner Kategorisierung C abgewertet und erscheint deshalb unterhalb von Artikel Nummer 4.

Sie interessieren sich für die Suchfunktion im Detail? 

Gerne stellen wir Ihnen die Suchfunktion der Polynorm E-Business-Plattform in einer individuellen Demo vor.

captcha
Roger Meier, CEO
Die Suchfunktion ist das zentrale Element des Onlineshops.
Roger Meier, CEO
Sind Sie sich sicher?