• A matematikai-statisztikai háttér-számításokról
  • Következtetések
  • 4. kísérlet
  • Az adatvagyonról
  • Az ideális klaszterszám felismerése hasonlóságelemzések keretében




    Download 13.86 Mb.
    bet14/14
    Sana01.04.2020
    Hajmi13.86 Mb.
    #9749
    1   ...   6   7   8   9   10   11   12   13   14








    1. ábra: A valószínűségi alakzatok és a tökéletes négyzet alapesetei az R-klaszterek 4-9-16-os alakzataival kiegészítve, ill. a háromszög esetén a 3-4-5 alakzatokkal érzékeltetve (forrás: saját ábrázolás)

    A matematikai-statisztikai háttér-számításokról


    Munkakörnyezet: R

    A klaszterezés helyességét ismét csak az 1. kísérletben felsorolt indexek jellemezték.


    A hasonlóságelemzésről


    A hasonlóságelemzés paraméterei nem változtak az első kísérlethez képest. Amennyiben az egyes „minden-klaszter-másként-egyforma” futtatások során az első részeredmény megerősítette a hipotézist, úgy a változók feldolgozottságának szintje érzékenység-vizsgálat jelleggel két módon is értelmezésre került: szigorú elvek szerint, vagyis a default lépcsősfüggvénytől való bármilyen eltérés esetén az információt feldolgozottnak kellett tekinteni, ill. amennyiben csak egyetlen egy lépcsőszint tért el az alapbeállításoktól, akkor azt még nem kellett kizáró oknak tekinteni.

    Eredmények


    A 15. ábra (felső rész) a valószínűségi négyzet esetén a négy klaszterre osztást tekintette a leginkább racionálisnak maximálisan szigorú és nem túlzottan szigorú adatértelmezések szerint. Mivel a négyzet negyede is négyzet, így a mintázat-felismerés elvileg a 16 klaszteres állapotban lenne ismét csak ideális: de ennek a hatásnak nincs érdemi nyoma. A relatív felívelés 18 és 19 klaszterállapotoknál érhető tetten a görbék jobbszélén.

    Ugyanitt (15. ábra alsó rész) a tökéletes négyzet esetében ismét csak a négy és a tizenegy klaszterre osztás dominál.






    1. A valószínűségi négyzet (felül) és a tökéletes négyzet (alul) értelmezése robotszemmel (forrás: saját számítások)

    A kör kapcsán a valószínűségi nézetek két véletlenszerű adatválasztás és a szigorú és megengedő modellezés eredményeként négy állapot villan fel. Mint látható, az állapotok jelentősen eltérnek egymástól. Az alaphipotézis, miszerint a kör esetén nem illene, hogy érdemi csoportképzés nyomára lehessen bukkanni, nem igaz a választott klaszter-idealitást leíró attribútumok kapcsán.

    A bal felső negyed közel nulla meredekségű trendvonal az egyetlen olyan jelzés, mely a véletlenszerűség irányába mutat az átlagos idealitást a normaértékre helyezve.






    1. ábra: A valószínűségi kör érzékeny és megengedő értelmezése két véletlen mintán (forrás: saját számítások)

    A valószínűségi háromszögek kapcsán a három elemú klaszter dominál egyértelműen, bár formálisan egy egyenlő-oldalú háromszöget négy azonos háromszögre is fel lehet osztani, hasonlóan, mint három identikus deltoidra.





    1. ábra: A valószínűségi háromszög két véletlenszerű értelmezése (forrás: saját számítások)

    Általában véve a színes klaszterábrák (4-9-16 és 3-4-5 bontásban) nem mutatnak fel semmienmű racionalitást a logikai szinten létező mintázatok felismerésében.


    Következtetések


    A valószínűségi és a szabályos négyzetek négyfelé való ideális klaszterezése a robotszem által racionális és fraktálképzésre (az 4-16-64 jellegű részmegoldások levezetésre) alkalmas, de a 4-9-16-os szabályszerűség nem köszön vissza a klaszter-idealitás indexértékein keresztül.

    A valószínűségi háromszögek kapcsán a háromfelé osztás preferálása a robotszem által ismét csak racionális, de a négyfelé osztás, vagyis a háromszögek háromszögekkel való értelmezése itt sem érhető tetten, mint ahogy a 3-9 váltás sem. Ez azonban magyarázható legalább azzal, hogy a háromszög ideális harmada egy deltoid, melyre a felosztási szabály már nem örökíthető. Az azonban, hogy a négyzet esetén a 3*3 állapot nem értelmeződik és a háromszög esetén a 4 db 3-szög állapot nem azonos a 3 db deltoid állapottal, felveti a háromfelé osztás és a háromszög, mint alakzat értelmezési nehézségeit, ill. értelmezési határait. A szabályos síkidomok közül ugyanis a háromszög a legkevésbé kör, míg az oldalak számának növelésével a végtelenben kört kapunk, vagyis a négyzet szabályosabb, mint a háromszög ezen el mentén – a kört abszolút szabályosnak vélve.



    A kör, mint a legszabályosabbnak vélt objektum esetén a minden klaszterszám másként egyformán helyes elv nem köszön vissza egyértelműen, egyedül a véletlen minták irracionálisan nagy eltérése sugallja azt, hogy kellően sok minta esetén ez a fajta idealitás-hiány mégis csak beállhat eredményként. A kör esetén a két-elemű klaszter tűnik ideálisnak a robotszem számára, ami legalább a négyzet esetén a négy, a háromszög esetén a három, s a kör esetén a kettő sorozatképzéssel egy fajta masszív logikát mutat fel.
    Számos párhuzamos felosztás tűnik a háromszög és a négyzet esetén is racionálisnak, azaz mintázatszerűnek. A kör esetén tulajdonképpen az akárhány klaszter is keletkezzen az mind egyforma ideális elvet csak a kör szabályossága folytán keletkező részek egyformán szabálytalan jellege támasztja alá, így maga a hipotézis sem túl erős logikai alapokon nyugszik, vagyis ennek be nem igazolódása nem tekinthető negatívumnak.
    A vizsgálatok mindösszesen rámutatnak arra, hogy bizonyos szabályszerűnek, azaz pl. szimmetrikusnak ható felosztások és a klaszterhelyesség mérésének indexei között antagonizmus vélelmezhető. Ez felveti a klaszterhelyességi indexek egy fajta egyoldalúságának gyanúját is.

    4. kísérlet


    A negyedik kísérlet a második kísérlet kiterjesztéseként egy „ember-kísérlet” volt, melyben a ponthalmazokat emberi szemek által kíséreltük meg spontán módon kiértékeltetni és keresni az emberi szemek és értelmező agyak számára leginkább hiteles klaszterszámot a Kutatók Éjszakája 2014 rendezvénysorozat véletlenszerűen arra járó érdeklődői segítségével…

    Az adatvagyonról


    A Kutatók Éjszakája keretében összesen 26 fő került felmérésre a színes (vö. 9. ábra) előstrukturált ábra alapján.

    A matematikai-statisztikai háttér-számításokról


    Statisztikai alapszámítások Excel-ben. A 26-elemű minta kapcsán kiszámítás került az átlagos ideális klaszterszám, a medián értéke, a szórás, ill. a mediánnal való azonosság, az alatti és feletti részhalmazokba esés darabszámai, ill. a minta maximuma és minimuma.

    Eredmények


    A humán vizuális intelligencia hermeneutikájára támaszkodva az alábbi eredmények jöttek ki:


    1. ábra: a humán helyzetértékelés statisztikái

    Mint látható a humán intelligencia viszonylag magas tartományban, 6-11 klaszter között vélelmezte az ideális felosztást.

    A kerekített átlag és maga a medián megfelel a robotszem becslésének és a valóság elvárásainak. De a mediánnal való egyezés csak a 8 főt jelentett, ami a minta 31%-a. Vagyis a populáció több mint kétharmada nem lát olyan jól, mint a robotszem. A medián alatti részhalmaz nagyobb, mint a medián feletti, vagyis a tömegek inkább a kisebb komplexitású mintázatok felé hajlottak. Ez megfelel a 7. és a 8. ábra által összefoglalt képnek, melyek kapcsán az idealitás az alsóbb klaszterszám-tartományokban magasabb.

    Következtetések


    Az emberek és a robotszem összevetésében előállni látszik a klasszikus helyzet: a robot ott, amire megtanították, az emberi képességeket meghaladó módon képes helyt állni.

    Konklúziók


    Az ideális klaszterszám hasonlóságelemzési alapon kezelhető jelenség – az emberek több mint kétharmadát meghaladó esetben az emberi intelligenciánál jobb eredménnyel. Az adathiányos (egyre több és több pontfelhőt alkotó elemi részecskére támaszkodó) észlelésben a mennyiség képes átcsapni minőségbe, vagyis adott szintű adathiány karakterisztikusan más értelmezést generálhat, mint egy adott adatszint feletti következtetések mibenléte.

    Vita


    Már a hipotézisképzés is vitát generálhat. Hiszen talán nincs is válasz arra a kérdésre: mi is számít egy kör, a legszabályosabb síkidom legracionálisabb felosztásának?

    A cikk a robotszem fogalmának bevezetésével a látás, mint hermeneutikai probléma megalapozását igyekezett elemi értelmezési kérdések kapcsán kísérleti alapon körüljárni. A látás (vagyis a képekből következő adatok értelmezése) során felvetődik a kérdés, hogy a klaszterképzés indikátorai vajon kellően rugalmasak-e bármiféle mintázat, szimmetria-utalás felismerésére? Ha nem, vajon miért nem? Azért, amiért a Monty Hall effektus logikáját követve az ember nem képes a matematikai tudásra nem szelektáló egyedfejlődése miatt kényszerűen csökevényes ösztöneire hallgatva racionálisan feldolgozni elemi valószínűség-számítási feladatokat, vagy azért, mert a matematikai-statisztika indextára csökevényes (jelenleg még)?



    Irodalom


    • http://www.szigma.ktk.pte.hu/index.php/letoltesek/2013-xliv-evfolyam-3-4-szam/ruff-ferenc-klaszterszamok-meghatarozasanak-egy-lehetseges-megoldasa/download




    • http://cran.r-project.org/src/contrib/Archive/clusterCrit/




    • http://www.novakoptika.hu/images/szinteveszto-teszt-szinlatas-vizsgalat.gif




    • http://www.nig.ac.jp/color/barrierfree/images/img_b11_s.gif




    • http://www.sehtestbilder.de/farbtafeln/images/09-666-zunge-rausstrecken.jpg




    • https://www.r-project.org/




    • http://miau.gau.hu/miau/193/2d_feladatlap.pdf




    • https://hu.wikipedia.org/wiki/Hasonl%C3%B3s%C3%A1gelemz%C3%A9s




    • http://miau.gau.hu/myx-free/coco/index.html




    • https://cran.r-project.org/web/packages/outliers/outliers.pdf




    • https://www.google.hu/search?q=%22ide%C3%A1lis+klasztersz%C3%A1m%22+-site%3Agau.hu




    1 http://www.szigma.ktk.pte.hu/index.php/letoltesek/2013-xliv-evfolyam-3-4-szam/ruff-ferenc-klaszterszamok-meghatarozasanak-egy-lehetseges-megoldasa/download

    2 A klaszterszám értelemszerűen egyben a teljes (tetszőleges dimenzióban értelmezett) adathalmaz kapcsán minden egyes pont és csoport teljes újrarendezését tételezi fel, nem pedig gráfszerűen a már beazonosított alacsonyabb klaszterszámokban deklarált csoportok felbontását kell ez alatt érteni. Ebből az is következik, hogy egy relatíve nagy ideális klaszterszám esetén a klaszterszám csökkentése gráfszerűen a már feltárt apró csoportokat érintetlenül hagyva, ismét csak egy önálló matematikai probléma.

    3 https://www.google.hu/search?q=%22ide%C3%A1lis+klasztersz%C3%A1m%22+-site%3Agau.hu

    4 http://cran.r-project.org/src/contrib/Archive/clusterCrit/

    5 https://hu.wikipedia.org/wiki/Hasonl%C3%B3s%C3%A1gelemz%C3%A9s

    6 http://miau.gau.hu/myx-free/coco/index.html

    7 https://cran.r-project.org/web/packages/outliers/outliers.pdf


    Download 13.86 Mb.
    1   ...   6   7   8   9   10   11   12   13   14




    Download 13.86 Mb.

    Bosh sahifa
    Aloqalar

        Bosh sahifa



    Az ideális klaszterszám felismerése hasonlóságelemzések keretében

    Download 13.86 Mb.