SQL Server Data Mining

Gesegmenteerde informatie met SQL Server Data Mining
Uw gegevensbronnen bevatten enorm veel informatie, maar de meest waardevolle informatie is datgene wat niet op het eerste gezicht te vinden is. Het aantal klanten dat een aankoop heeft gedaan van een specifiek product of iets uit een productgroep is nog vrij makkelijk te achterhalen. Maar wellicht interessanter is of er bepaalde groepen klanten zijn (bv. gegroepeerd op regio, salaris, cultuur of een andere demografische eigenschap) die vaker bepaalde soorten producten kopen.

De activiteiten die nodig zijn om dit soort informatie boven water te krijgen, worden geschaard onder de noemer Data Mining, één van de speerpunten van het Microsoft BI platform.
Andere voorbeelden van de mogelijkheden SQL Server Data Mining zijn:

  • Het vinden van patronen en relaties tussen tekstuele gegevens uit een door een klant ingevulde beoordeling of een klantprofiel, en de producten die daarbij zijn aangeschaft.
  • Het bepalen van de impact van een marketingcampagne op de omzet waarbij rekening wordt gehouden wordt met de cycli door welke een verkoopjaar normaal loopt.


Waar veel Data Mining tools zich vooral aan de achterkant van het BI proces bevinden, kenmerken de tools van Microsoft BI zich door hun integratie met de andere onderdelen, bijvoorbeeld:

  • Het vinden van producten die vaak in combinatie met andere producten gekocht worden, misschien zelfs in relatie met een bepaalde doelgroep.


Deze vorm van Data Mining wordt ook wel Market Basket Analysis genoemd en leent zich uitstekend voor cross-selling, zeker als een database beheerder hiervan een 'voorspellend model' maakt dat kan worden geïntegreerd in een webwinkel.

  • Het vinden van onbetrouwbare data zoals een klant van 12 jaar oud die als beroep chirurg heeft opgegeven. Technisch correct, maar functioneel natuurlijk onzin. SQL Server Data Mining maakt het mogelijk om dit soort gegevens manueel te voorzien van een betrouwbaarheidsfactor en de daaruit volgende resultaten weer te gebruiken in verdere analyse.
  • Door naar de gegevens te kijken uit meerdere periodes kan vaak een betere omzet- en/of winstvoorspelling gedaan worden. Door deze resultaten weer terug te brengen in een multi-dimensionale kubus van SQL Server Analysis Services kunnen uw gegevens op een unieke manier verder geanalyseerd worden.