Tijdens de eerste stap wordt een set trainingsdata voorzien met labels, of klasses, waarop het algoritme zich kan baseren om te leren. Het labelen van de trainingsdata is cruciaal. U kan dit vergelijken met een mens die zelf leert gegevens juist te labelen. Die persoon heeft ook een eerste set van gelabelde voorbeelddata nodig. Het verschil met een mens is dat een data classificatie algoritme veel sneller de juiste inzichten zal kunnen leren en subtielere verbanden zal kunnen detecteren en ook veel grotere hoeveelheden data zal kunnen verwerken, wat de kwaliteit van de gelegde verbanden verbetert. Behalve het toevoegen van een label is geen andere input vereist binnen Trendskout om het data classificatie-algoritme te trainen.