Datenvorbereitung & Datenassistent
Es reicht nicht aus, den besten Algorithmus zu finden. Ein Algorithmus muss auch über die richtigen Daten verfügen, um sich selbst zu trainieren, Vorhersagen zu treffen oder Zusammenhänge zu erkennen. Das Datenformat ist sehr wichtig: Es müssen nämlich mehrere Datenoperationen durchgeführt werden, bevor der Algorithmus mit der Verarbeitung und Interpretation der Daten beginnen kann. Auch hier gibt es nahezu unendlich viele Möglichkeiten: z. B. Zusammenführen verschiedener Datenquellen, Transformieren, Generieren von Ableitungen und Variationen oder Denormalisieren.
Die Entscheidung, welche Operationen auf welche Daten angewendet werden sollen, ist komplex. Sie ist abhängig von der Anwendung und dem gewählten Algorithmus.