|
Az ideális klaszterszám felismerése hasonlóságelemzések keretében
|
bet | 12/14 | Sana | 01.04.2020 | Hajmi | 13,86 Mb. | | #9749 |
2. kísérlet
A második kísérlet annyiban tért el az elsőtől, hogy az egyre növekvő pontfelhők a korábbi kisebb pontfelhők minden egyes elemét minden esetben kényszerűen tartalmazták a 9 inicializáló csoportközéppont körül.
Az adatvagyonról
A 2. kísérletben előállításra került különböző elemszámú pontfelhők (1000, 2000, 4000, 10000, 20000) esetében készült nyers (fekete-fehér: vö. 9. ábra) és színes (vö. 10. ábra), az R-szoftverrel csoportosított nézet, melyeket kérdőívezés keretében emberi szemekkel is értelmeztettünk, ill. az 1. kísérletnél bemutatott robot-szem logikát is alkalmaztuk az ideális klaszterszám feltárására.
ábra: A fekete-fehér és színes ideális klaszterszám kérdőíves felmérése
(forrás: saját ábrázolás - http://miau.gau.hu/miau/193/2d_feladatlap.pdf)
A matematikai-statisztikai háttér-számításokról
Munkakörnyezet: R
A klaszterezés helyességét ismét csak az 1. kísérletben felsorolt indexek jellemezték.
A hasonlóságelemzésről
A hasonlóságelemzés paraméterei nem változtak az első kísérlethez képest.
A kérdőíves felmérésekről
A kérdőíves felmérés részleteinek és eredményeinek ismertetése meghaladja jelen cikk kereteit.
Eredmények
ábra: A különböző adatmennyiségek esetén előállt vélelmek összevetése (forrás: saját ábrázolás)
ábra: Az összes vélelem és a legritkább ponthalmaztól függetlenített vélelmek eredője (forrás: saját számítások)
Mint az a 11. és 12. ábráról egyértelműen kiderül, a legritkább pontszámú adatvagyon jelentősen másként viselkedik, mint a nagyobb sűrűségű alapadatok további 4 esete. A 9 elemű klaszter mindkét esetben előkelő helyen szerepel. A kockázatok értelmezése után a leginkább ideális klaszterszám hasonlóságelemzéssel levezetve, vagyis a robot-szem által vélelmezve a 9-es érték.
Következtetések
Az információhiány (vagyis a pontfelhők sűrűsége) esetén a mennyiség átcsap minőségbe elv érhető tetten. A robotszem ismét képes volt a 9 inicializáló halmazt ideális klaszterszámként beazonosítani.
|
| |