Modelleren, evalueren en projectaanpak
Model: Invoerdata: Ethisch en juridisch Privacywetgeving Anonimiseren van data Bepalen relevantie van features Normaliseren van dataset Evaluatie: Confusionmatrices voor classifiers TP – True Positive: correct
Model: Invoerdata: Ethisch en juridisch Privacywetgeving Anonimiseren van data Bepalen relevantie van features Normaliseren van dataset Evaluatie: Confusionmatrices voor classifiers TP – True Positive: correct
Association rules maken het mogelijk om op een ongelabelde dataset onderlinge relaties tussen elementen te herkennen. Voor de set {A, B, C, D} kunt u
Het is niet bekend hoeveel klassen er zijn, het doel is groeperen k-Means clustering Probeert een x-aantal clustermiddelpunten te herleiden, zodat de som van de
Wordt gebruikt voor het identificeren van outliers; dit zijn datapunten die afwijken van de norm In sommige gevallen worden de outliers geëlimineerd uit de trainingset
model dat kijkt naar de ‘buren’ in ‘k’ om punt te classificeren als de meest voorkomende entiteit in k. Bij k=1: veel ruis = overfitted
Stoelt op het concept hyperplane 2D-stelsel: lijn 3D-stelsel: vlak MultiD-stelsel: hypervlak Minimaliseren van de ruis: Maximum Margin Hyperplane, leidt tot een model dat beter generaliseert.