ábra: A valószínűségi alakzatok és a tökéletes négyzet alapesetei az R-klaszterek 4-9-16-os alakzataival kiegészítve, ill. a háromszög esetén a 3-4-5 alakzatokkal érzékeltetve (forrás: saját ábrázolás)
A matematikai-statisztikai háttér-számításokról
Munkakörnyezet: R
A klaszterezés helyességét ismét csak az 1. kísérletben felsorolt indexek jellemezték.
A hasonlóságelemzésről
A hasonlóságelemzés paraméterei nem változtak az első kísérlethez képest. Amennyiben az egyes „minden-klaszter-másként-egyforma” futtatások során az első részeredmény megerősítette a hipotézist, úgy a változók feldolgozottságának szintje érzékenység-vizsgálat jelleggel két módon is értelmezésre került: szigorú elvek szerint, vagyis a default lépcsősfüggvénytől való bármilyen eltérés esetén az információt feldolgozottnak kellett tekinteni, ill. amennyiben csak egyetlen egy lépcsőszint tért el az alapbeállításoktól, akkor azt még nem kellett kizáró oknak tekinteni.
Eredmények
A 15. ábra (felső rész) a valószínűségi négyzet esetén a négy klaszterre osztást tekintette a leginkább racionálisnak maximálisan szigorú és nem túlzottan szigorú adatértelmezések szerint. Mivel a négyzet negyede is négyzet, így a mintázat-felismerés elvileg a 16 klaszteres állapotban lenne ismét csak ideális: de ennek a hatásnak nincs érdemi nyoma. A relatív felívelés 18 és 19 klaszterállapotoknál érhető tetten a görbék jobbszélén.
Ugyanitt (15. ábra alsó rész) a tökéletes négyzet esetében ismét csak a négy és a tizenegy klaszterre osztás dominál.
A valószínűségi négyzet (felül) és a tökéletes négyzet (alul) értelmezése robotszemmel (forrás: saját számítások)
A kör kapcsán a valószínűségi nézetek két véletlenszerű adatválasztás és a szigorú és megengedő modellezés eredményeként négy állapot villan fel. Mint látható, az állapotok jelentősen eltérnek egymástól. Az alaphipotézis, miszerint a kör esetén nem illene, hogy érdemi csoportképzés nyomára lehessen bukkanni, nem igaz a választott klaszter-idealitást leíró attribútumok kapcsán.
A bal felső negyed közel nulla meredekségű trendvonal az egyetlen olyan jelzés, mely a véletlenszerűség irányába mutat az átlagos idealitást a normaértékre helyezve.
ábra: A valószínűségi kör érzékeny és megengedő értelmezése két véletlen mintán (forrás: saját számítások)
A valószínűségi háromszögek kapcsán a három elemú klaszter dominál egyértelműen, bár formálisan egy egyenlő-oldalú háromszöget négy azonos háromszögre is fel lehet osztani, hasonlóan, mint három identikus deltoidra.
ábra: A valószínűségi háromszög két véletlenszerű értelmezése (forrás: saját számítások)
Általában véve a színes klaszterábrák (4-9-16 és 3-4-5 bontásban) nem mutatnak fel semmienmű racionalitást a logikai szinten létező mintázatok felismerésében.
Következtetések
A valószínűségi és a szabályos négyzetek négyfelé való ideális klaszterezése a robotszem által racionális és fraktálképzésre (az 4-16-64 jellegű részmegoldások levezetésre) alkalmas, de a 4-9-16-os szabályszerűség nem köszön vissza a klaszter-idealitás indexértékein keresztül.
A valószínűségi háromszögek kapcsán a háromfelé osztás preferálása a robotszem által ismét csak racionális, de a négyfelé osztás, vagyis a háromszögek háromszögekkel való értelmezése itt sem érhető tetten, mint ahogy a 3-9 váltás sem. Ez azonban magyarázható legalább azzal, hogy a háromszög ideális harmada egy deltoid, melyre a felosztási szabály már nem örökíthető. Az azonban, hogy a négyzet esetén a 3*3 állapot nem értelmeződik és a háromszög esetén a 4 db 3-szög állapot nem azonos a 3 db deltoid állapottal, felveti a háromfelé osztás és a háromszög, mint alakzat értelmezési nehézségeit, ill. értelmezési határait. A szabályos síkidomok közül ugyanis a háromszög a legkevésbé kör, míg az oldalak számának növelésével a végtelenben kört kapunk, vagyis a négyzet szabályosabb, mint a háromszög ezen el mentén – a kört abszolút szabályosnak vélve.
A kör, mint a legszabályosabbnak vélt objektum esetén a minden klaszterszám másként egyformán helyes elv nem köszön vissza egyértelműen, egyedül a véletlen minták irracionálisan nagy eltérése sugallja azt, hogy kellően sok minta esetén ez a fajta idealitás-hiány mégis csak beállhat eredményként. A kör esetén a két-elemű klaszter tűnik ideálisnak a robotszem számára, ami legalább a négyzet esetén a négy, a háromszög esetén a három, s a kör esetén a kettő sorozatképzéssel egy fajta masszív logikát mutat fel.
Számos párhuzamos felosztás tűnik a háromszög és a négyzet esetén is racionálisnak, azaz mintázatszerűnek. A kör esetén tulajdonképpen az akárhány klaszter is keletkezzen az mind egyforma ideális elvet csak a kör szabályossága folytán keletkező részek egyformán szabálytalan jellege támasztja alá, így maga a hipotézis sem túl erős logikai alapokon nyugszik, vagyis ennek be nem igazolódása nem tekinthető negatívumnak.
A vizsgálatok mindösszesen rámutatnak arra, hogy bizonyos szabályszerűnek, azaz pl. szimmetrikusnak ható felosztások és a klaszterhelyesség mérésének indexei között antagonizmus vélelmezhető. Ez felveti a klaszterhelyességi indexek egy fajta egyoldalúságának gyanúját is.
4. kísérlet
A negyedik kísérlet a második kísérlet kiterjesztéseként egy „ember-kísérlet” volt, melyben a ponthalmazokat emberi szemek által kíséreltük meg spontán módon kiértékeltetni és keresni az emberi szemek és értelmező agyak számára leginkább hiteles klaszterszámot a Kutatók Éjszakája 2014 rendezvénysorozat véletlenszerűen arra járó érdeklődői segítségével…
Az adatvagyonról
A Kutatók Éjszakája keretében összesen 26 fő került felmérésre a színes (vö. 9. ábra) előstrukturált ábra alapján.
A matematikai-statisztikai háttér-számításokról
Statisztikai alapszámítások Excel-ben. A 26-elemű minta kapcsán kiszámítás került az átlagos ideális klaszterszám, a medián értéke, a szórás, ill. a mediánnal való azonosság, az alatti és feletti részhalmazokba esés darabszámai, ill. a minta maximuma és minimuma.
Eredmények
A humán vizuális intelligencia hermeneutikájára támaszkodva az alábbi eredmények jöttek ki:
ábra: a humán helyzetértékelés statisztikái
Mint látható a humán intelligencia viszonylag magas tartományban, 6-11 klaszter között vélelmezte az ideális felosztást.
A kerekített átlag és maga a medián megfelel a robotszem becslésének és a valóság elvárásainak. De a mediánnal való egyezés csak a 8 főt jelentett, ami a minta 31%-a. Vagyis a populáció több mint kétharmada nem lát olyan jól, mint a robotszem. A medián alatti részhalmaz nagyobb, mint a medián feletti, vagyis a tömegek inkább a kisebb komplexitású mintázatok felé hajlottak. Ez megfelel a 7. és a 8. ábra által összefoglalt képnek, melyek kapcsán az idealitás az alsóbb klaszterszám-tartományokban magasabb.
Következtetések
Az emberek és a robotszem összevetésében előállni látszik a klasszikus helyzet: a robot ott, amire megtanították, az emberi képességeket meghaladó módon képes helyt állni.
Konklúziók
Az ideális klaszterszám hasonlóságelemzési alapon kezelhető jelenség – az emberek több mint kétharmadát meghaladó esetben az emberi intelligenciánál jobb eredménnyel. Az adathiányos (egyre több és több pontfelhőt alkotó elemi részecskére támaszkodó) észlelésben a mennyiség képes átcsapni minőségbe, vagyis adott szintű adathiány karakterisztikusan más értelmezést generálhat, mint egy adott adatszint feletti következtetések mibenléte.
Vita
Már a hipotézisképzés is vitát generálhat. Hiszen talán nincs is válasz arra a kérdésre: mi is számít egy kör, a legszabályosabb síkidom legracionálisabb felosztásának?
A cikk a robotszem fogalmának bevezetésével a látás, mint hermeneutikai probléma megalapozását igyekezett elemi értelmezési kérdések kapcsán kísérleti alapon körüljárni. A látás (vagyis a képekből következő adatok értelmezése) során felvetődik a kérdés, hogy a klaszterképzés indikátorai vajon kellően rugalmasak-e bármiféle mintázat, szimmetria-utalás felismerésére? Ha nem, vajon miért nem? Azért, amiért a Monty Hall effektus logikáját követve az ember nem képes a matematikai tudásra nem szelektáló egyedfejlődése miatt kényszerűen csökevényes ösztöneire hallgatva racionálisan feldolgozni elemi valószínűség-számítási feladatokat, vagy azért, mert a matematikai-statisztika indextára csökevényes (jelenleg még)?
http://www.szigma.ktk.pte.hu/index.php/letoltesek/2013-xliv-evfolyam-3-4-szam/ruff-ferenc-klaszterszamok-meghatarozasanak-egy-lehetseges-megoldasa/download
http://cran.r-project.org/src/contrib/Archive/clusterCrit/
http://www.novakoptika.hu/images/szinteveszto-teszt-szinlatas-vizsgalat.gif
http://www.nig.ac.jp/color/barrierfree/images/img_b11_s.gif
http://www.sehtestbilder.de/farbtafeln/images/09-666-zunge-rausstrecken.jpg
https://www.r-project.org/
http://miau.gau.hu/miau/193/2d_feladatlap.pdf
https://hu.wikipedia.org/wiki/Hasonl%C3%B3s%C3%A1gelemz%C3%A9s
http://miau.gau.hu/myx-free/coco/index.html
https://cran.r-project.org/web/packages/outliers/outliers.pdf
https://www.google.hu/search?q=%22ide%C3%A1lis+klasztersz%C3%A1m%22+-site%3Agau.hu
|