Normalization er god at bruge, når du ved, at distributionen af dine data ikke følger en Gauss-fordeling. … Standardisering kan på den anden side være nyttig i tilfælde, hvor dataene følger en Gaussisk fordeling.
Skal jeg bruge normalisering eller standardisering?
Normalisering er nyttig, når dine data har varierende skalaer, og den algoritme, du bruger, ikke gør antagelser om fordelingen af dine data, såsom k-nærmeste naboer og kunstige neurale netværk. Standardization antager, at dine data har en Gaussisk (klokkekurve) fordeling.
Er standardisering det samme som normalisering?
I forretningsverdenen betyder "normalisering" typisk, at værdiintervallet er "normaliseret til at være fra 0.0 til 1,0". "Standardisering" betyder typisk, at rækken af værdier er "standardiseret" for at måle, hvor mange standardafvigelser værdien er fra dens middelværdi.
Er det altid godt at normalisere data?
Ved normalisering smider du faktisk nogle oplysninger om dataene væk, såsom de absolutte maksimum- og minimumværdier. Så der er ingen tommelfingerregel. Som andre sagde, er normalisering ikke altid anvendelig; for eksempel. fra et praktisk synspunkt.
Hvornår bør du ikke normalisere data?
Nogle gode grunde til ikke at normalisere
- Joins er dyre. Normalisering af din database involverer ofte oprettelse af mange tabeller. …
- Normaliseret design er svært. …
- Hurtig og beskidt skal være hurtig og beskidt. …
- Hvis du bruger en NoSQL-database, er traditionel normalisering ikke ønskelig.