Mit Machine Learning Methoden lässt sich das Ranking von Suchergebnissen beeinflussen, was unter dem Begriff Learning to Rank bekannt ist. Cornelia Werk und Steffen Kemmerer von unserer KI-Agentur ontolux stellen das Learning to Rank Verfahren in Apache Solr vor, welches bei der interne Suche eines deutschen Versicherers zum Einsatz kommt.
Learning to Rank für Apache Solr
Die Qualität einer Suche wird im Wesentlichen durch drei Stellschrauben erhöht: Neben der eigentlichen Menge der Suchergebnisse (Passen die Ergebnisse überhaupt zur Suchanfrage?) und einer sinnvollen Nutzerführung (Werden die User sinnvoll zu den richtigen Suchergebnissen geleitet?) wird das Ranking der Suchergebnisse gesteuert. Welches Dokument oder welcher Artikel besonders relevant ist, wird altbekannt mit Information Retrieval beantwortet und ist nicht immer ganz trivial. Schließlich gibt es viele Faktoren, die beeinflussen, welches Ergebnis für den Nutzer besonders relevant ist. Dennoch wird schon lange versucht, ein Optimum zu finden. Ein besonders bekannter und erfolgreicher Ranking-Algorithmus ist Okapi BM25. Er wird beispielsweise standardmäßig von Elasticsearch verwendet. Mit zunehmendem Erfolg von Machine Learning setzen sich aber auch andere Methoden durch, um Rankings zu optimieren.
Unsere Herangehensweise für ein Projekt bei einem Versicherungskunden ist es, das Ranking von Suchergebnissen einer internen Suche, die auf Apache Solr basiert, zu verbessern, indem wir mit Methoden des maschinellen Lernens ein geeignetes Modell trainieren. Dieses lernt anhand der Nutzerinteraktionen, welche Suchergebnisse für welche Suchanfragen besonders relevant sind.
Was ist Learning to Rank?
Learning to Rank (LTR) bezeichnet eine Technik, bei der ein Model mit Machine Learning das Ranking von Ergebnissen bestimmt. Dabei erlernt das Modell verschiedene Elemente in der Reihenfolge ihrer Relevanz für eine bestimmte Anfrage einzustufen. Es ist daher ideal für die Optimierung einer Suchfunktion prädestiniert.
Fazit
Eine Praxisanleitung geben Lead Consultant Search Cornelia Funke und Data Scientist Steffen Kemmerer auf ontolux.
__
Bildquelle: Freepik AI generiert