Dr. Till Plumbaum stellt auch 2022 die neuesten Forschungsergebnisse rund um die Themen NLP und Künstliche Intelligenz vor. In der Januar-Ausgabe von „KI Journal Club“ geht es um Datenqualität und um die neueste Version von Lucene.

Mit Lucene 9 wurde jetzt die Unterstützung für die Indizierung hochdimensionaler, numerischer Vektoren eingeführt und die Möglichkeit der Suche nach ähnlichen Einträgen (Nearest Neighbor) unter Verwendung des Hierarchical Navigable Small World Graph-Algorithmus. Lucene bildet die Grundlage für die bekannten und vielfach verwendeten Suchmaschinen Apache Solr und Elasticsearch.

Die Themen KI und Data Science sind eng verbunden und kurz gesagt versprechen beide, Daten in Informationen umzuwandeln und so einen Mehrwert für das Geschäft zu erreichen. Die Grundlage bilden Daten. Diese sind jedoch oftmals voller Fehler und Lücken. Ein KI-Projekt startet demnach nicht mit dem Algorithmus, sondern mit den richtigen Daten und deren Sammlung. Was sich Unternehmen deshalb anschauen sollten und wie sich die Datenqualität auswirkt, stellt Dr. Till Plumbaum im aktuellen „KI Journal Club“ Beitrag vor.

Unsere KI-Agentur ontolux stellt in der monatlichen Serie wissenschaftliche Beiträge und Presseberichte aus den Bereichen Text Mining, Machine Learning, KI, Natural Language Processing vor und beleuchtet die aktuelle Situation der maschinellen Verarbeitung von Sprache und Text.

Mehr zu KI Journal Club

 

Veröffentlichung am 31.01.2022
Bildquelle: christopher-burns-unsplash