Text Classification

Text Classification

Text Classification of tekstclassificatie is één van de op AI en Deep Learning gebaseerde mogelijkheden binnen Trendskout. Tekstclassificatie leest en interpreteert teksten voor verschillende toepassingen in customer service, administratie, sales & marketing en operations.

Die interpretatie gebeurt op basis van een tekstclassificatiemodel dat wordt getraind op gelabelde tekstdata. Daarvoor wordt – zoals bij andere classificatie-algoritmes – met twee fases gewerkt: een trainingsstap en de productiefase. In de productiefase wordt het vooraf getrainde model ingezet om nieuwe teksten te gaan classificeren of labelen. Om dat classificatiemodel te trainen worden technieken zoals neurale netwerken en NLP (Natural Language Processing) gebruikt. De gebruikte technieken in deze twee fases lichten we hieronder verder toe.

Business toepassingen

- Automatisatie van administratieve taken
- Tekst(fragmenten) lezen en interpreteren
- Verlichten van werklast voor customer service


artificial intelligence

Krachtig Cloud-AI PlatformDirect inzetbaar met een heldere interface, ook voor niet-datawetenschappers


Text Classification in de AI Flow

1. Connect

2. Analyse

Tekst Classificatie

Tekst Classificatie is één van de Trendskout AI Flow analyse-functies.

3. Automate


Hoe werkt dit technisch?

Stap 1: Trainen van het algoritme

In de eerste fase wordt gelabelde, of geannoteerde, tekstdata opgeladen in Trendskout. Er kan ook gewerkt worden met annotatie via een tekst clustering stap, dat dan op basis van verbanden en gelijkaardigheid van teksten, zelf labels – of klasses – toekent aan trainingdata. Het opladen van de trainingdata kan gebeuren via eenvoudige file upload, via API, plugin, database-koppeling… in de connect-stap. De tekstdata mag in een ruw formaat worden opgeladen en er is praktisch geen limiet op de grootte of andere eigenschappen van de tekst. Trendskout gaat immers in de trainingstap – als onderdeel van de algoritme selectie & hypertuningfase- verschillende bewerkingen toepassen op de ruwe tekst data. Deze bewerkingen zijn vooral NLP technieken, met als doel om deze ruwe tekstdata op te schonen, semantisch te ontleden en leesbaar te maken voor het algoritme – een neuraal netwerk – dat het predictieve classificatiemodel zal genereren. Er zijn verschillende opties wat betreft databewerkingen, algoritme-selectie, en parameters die leiden tot een virtueel oneindig aantal mogelijke combinaties. Trendskout gaat door middel van intelligente Auto ML & Solution Space exploration de meest optimale combinatie gebruiken om het performantste model te genereren. De evaluatie van de accuraatheid van dit model gebeurt door middel van testen op een deel van de trainingdata die het algoritme niet eerder verwerkt heeft. Op deze manier wordt oa. Overfitting vermeden. Het hele trainingproces wordt – zoals bij de andere analyses – gestart door het aanklikken van de “Train/Deploy” knop in de AI Flow interface.


Stap 2: (Real-time) Tekst classificatie

Het winnende classificatiemodel uit de trainingstap wordt nadien gebruikt om nieuwe teksten te classificeren of te labelen. Het in productie brengen van het classificatiemodel gebeurt – zoals bij de andere analyses- via het aanklikken van de “deploy”-functie. Er zijn verschillende input-mogelijkheden voor deze teksten, API, Plugin, Database, FTP enz. De teksten kunnen dus in batch of real-time worden opgeladen. Door de hoge verwerkingsnelheid van de teksten, NLP en classificatie, volgt het antwoord steeds in real-time. Dit antwoord is een label, of classificatie, conform de annotaties uit de trainingsdata.

Tekst Classificatie + Trendskout

Tekstclassificatie kan via de toegankelijke visuele drag & drop Trendskout-interface in een AI flow gebruikt worden. Naast koppelen van data-input, kunnen ook automatisatie-acties toegevoegd worden zoals het aanroepen van een extern systeem via API of plugin, wegschrijven naar een database, uitsturen van geparametriseerde e-mails… Net zoals bij andere AI en Deep Learning functies worden de modellen continu geëvalueerd op accuraatheid, ook na de initiële trainingsfase. Zo wordt steeds het meest optimale model gebruikt voor uw tekstclassificatie. Ook wanneer de eigenschappen van uw documenten, commentaren of andere types tekst wijzigt.

Alle features ontdekken tijdens een live demo met uw eigen data?Neem contact op en we tonen u de directe meerwaarde van artificial intelligence voor uw organisatie.