Hierarkisk klynging er den mest populære og mest brukte metoden for å analysere sosiale nettverksdata. I denne metoden sammenlignes noder med hverandre basert på deres likhet. Større grupper bygges ved å slå sammen grupper av noder basert på likheten deres.
Når skal man bruke hierarkisk clustering vs K-midler?
En hierarkisk clustering er et sett med nestede klynger som er arrangert som et tre. K Betyr at klynging er funnet å fungere bra når strukturen til klyngene er hypersfærisk (som sirkel i 2D, sfære i 3D). Hierarkisk klynging fungerer ikke like bra som, k betyr når formen på klyngene er hypersfærisk.
Når bør jeg bruke hierarkisk clustering?
Hierarkisk clustering er en kraftig teknikk som lar deg bygge trestrukturer fra datalikheter. Du kan nå se hvordan ulike underklynger forholder seg til hverandre, og hvor langt fra hverandre datapunkter er.
Når ville du ikke brukt hierarkisk clustering?
Svakhetene er at det sjelden gir den beste løsningen, det involverer mange vilkårlige avgjørelser, det fungerer ikke med manglende data, det fungerer dårlig med blandede datatyper, det fungerer ikke bra på veldig store datasett, og hovedutgangen, dendrogrammet, blir ofte feiltolket.
Hva er fordelene med hierarkisk klynging?
Styrker ved hierarkisk gruppering
- Det er detå forstå og implementere.
- Vi trenger ikke å forhåndsspesifisere noe spesielt antall klynger. …
- De kan svare til meningsfull klassifisering.
- Enkelt å bestemme antall klynger ved bare å se på Dendrogrammet.