1)
|
Tasaväliset luokat, usein pyöristetyin luokkavälein (tasaluvuin).
Luokkaväli saadaan jakamalla vaihteluväli luokkien lukumäärällä.
|
|
Esimerkki:
|
Minimiarvo=0
|
|
Maksimiarvo=100
|
|
Mielekäs luokkien määrä=5
|
|
Luokkaväli=(100-0)/5=100
|
Kartan selityksissä tällainen luokittelu voi olla esimerkiksi muotoa:
|
|
0 (tai <1)
|
|
1-20 (miel. ei 0-20)
|
|
21-40
|
|
41-60
|
|
61-80
|
|
81-100 (tai >80)
|
|
|
Tasaväliset luokat sopivat hyvin tasaisten ja epämääräisten jakautumien
luokitteluun. Myös normaalisti jakautunut aineisto voidaan luokitella
tasavälisesti, mutta silloin keskimmäisiin luokkiin tulee runsaasti
havaintoja. Tasavälisen luokittelun etuna on sen selkeys ja helppous.
Haittana on jakautuman yksityiskohtien häviäminen.
|
2)
|
Sovinnaiset pyöristetyt luokkavälit; luokkavälit ovat eri suuruisia,
tavallisesti systemaattisesti kasvavia tai väheneviä.
|
|
Esimerkki merkitsemistavoista:
|
|
0
|
tai
|
<1
|
0
|
tai
|
<1
|
1-5
|
...
|
5
|
1-10
|
...
|
10
|
6-10
|
...
|
10
|
11-15
|
...
|
15
|
11-30
|
...
|
30
|
16-30
|
...
|
30
|
31-60
|
...
|
60
|
31-40
|
...
|
40
|
>60
|
...
|
>60
|
>40
|
...
|
>40
|
|
|
|
Tällainen luokittelu sopii hyvin vinoihin jakautumiin ja huonosti
epäsäännöllisiin tai normaalijakautumiin (poikkeuksena normaalijakautuman
"puolikkaat" kummastakin päästä). Sovinnaisiin luokkaväleihin perustuvien
jakautumien etuna on erityisesti vinon jakautuman ominaispiirteiden
huomioon ottaminen siten, että kunkin luokan havaintomäärät tulevat
kutakuinkin yhtä suuriksi. Haittana on luokkien havaintomäärien suuri
vaihtelu, kun luokittelua sovelletaan muihin kuin vinoihin
jakautumiin.
|
3)
|
Kvantiilit ovat luokkia, joissa on sama määrä havaintoja. Ennen
luokittelua havainnot on asetettava suuruusjärjestykseen. Luokkaväli on sen
havainnon arvo, joka on viimeisenä tullut luokkaan tai ensimmäisenä
seuraavaan luokkaan. Kvantiileilla on omat nimityksensä luokkien määrän
mukaan:
|
|
|
2 luokkaa,
|
mediaani
|
|
3 luokkaa,
|
tersiili
|
|
4 luokkaa,
|
kvartiili
|
|
5 luokkaa,
|
kvintiili
|
|
6 luokkaa,
|
desiili
|
|
|
Esimerkiksi 30 havainnon aineistosta tersiilin kuhunkin kolmeen luokkaan
tulee 10 havaintoa. Luokkien välit eivät ole tasaisia tai systemaattisesti
muuttuvia. Kvantiilit soveltuvat useimpien jakautumatyyppien
luokitteluun. Luokittelumenetelmän etuna ovat helppokäyttöisyys ja luokkien
samansuuruiset havaintomäärät. Kvantiilien käytön haittapuolena on
luokkavälien epäsymmetrisyys ja se, että luokkien raja-arvot ovat harvoin
"pyöristettyjä" lukuja. Samoja lukuarvoja voi myös joutua eri
luokkiin.
|
4)
|
Keskiarvot luokkaväleinä; aineisto pilkotaan ensin kahtia koko
aineiston keskiarvolla, jonka jälkeen syntyneet luokat jaetaan edelleen
uusiin luokkiin omien keskiarvojensa avulla. Keskiarvoihin pohjaava
luokittelu on mielekäs tasaisille jakautumille. Luokittelu on helppo
toteuttaa, mutta luokittelussa tuhotaan aineiston havaintoryppäät,
"luonnolliset" luokat. Lisäksi luokkia saadaan vain parillinen
määrä.
|
5)
|
Normaalijakautuman hajontaluvut luokkaväleinä; luokkavälinä on
tavallisesti keskihajonta, sen osa tai kertaluokka (esim. puolet
keskihajontaa, neljännes keskihajontaa, 1 ½ x keskihajonta, 2 x
keskihajonta jne.). Luokittelumenetelmä sopii hyvin normaalisti
jakautuneisiin aineistoihin ja jossakin määrin myös tasaisesti
jakautuneisiin aineistoihin. Menetelmä säilyttää hyvin normaalijakautuman
ominaispiirteet ja se sopii hyvin esimerkiksi "residuaalikartoitukseen".
Menetelmän heikkoutena on sen suhteellisen kapea sovellusala.
|
6)
|
Matemaattiset aritmeettiset ja geometriset sarjat
luokittelumenetelminä soveltuvat hyvin tietokoneavusteiseen luokitteluun.
Sarjakehitelmän perusyhtälö on:
|
|
|
Min + B1x + B2x + ... + Bnx = Max, jossa bn = n:nnen havainnon arvo
|
|
Aritmeettisen sarjan yhtälö on:
|
|
Bn = a + [(n-1)d], jossa
|
|
a = 1. havainto
|
|
d = vakioerotus, voidaan säädellä
|
|
n = luokkien lukumäärä
|
|
Geometrisen sarjan yhtälö on:
|
|
Bn = qrn-1, jossa q = 1. termi (>0)
|
|
n = n:nnen termin järjestysluku
|
|
r = vakiosuhde
|
|
|
Kumpikin sarja soveltuu luokittelemaan vinoja jakautumia.
|
7)
|
Luonnolliset luokkavälit; luonnollisten luokkien raja-arvot
määräytyvät aineiston jakautumassa olevien "aukkojen" kohdille, paikkoihin
jossa havaintoja on selvästi vähemmän. Tällaisen luokittelun etuna on
aineistoon mahdollisesti sisältyvien osajoukkojen säilyminen omissa
luokissaan, jolloin aineiston jakautumiselle osajoukkoihin voidaan hakea
kartogrammista "maantieteellistä" selitystä. Luonnollisen
luokittelumenetelmän haittana on luokkien erikokoisuus ja luokkavälien
epäsystemaattisuus.
|
8)
|
Ryhmittelyt tietokoneavusteisesti. Kaikki edellä mainitut
luokittelut voidaan tehdä tietokoneella. Erityisen hyvin tietotekniikka
soveltuu suurten aineistojen saman aikaisesti monilla ulottuvuuksilla
(muuttujilla) tapahtuvaan ryhmittelyyn. Esimerkiksi faktorianalyysin eri
vaiheet toimivat myös luokitteluina. Ryhmittelyanalyysi (GA) on myös
monikäyttöinen luokittelumenetelmä.
|