Kognícia a umelý život 2015

Transcription

1 Kognícia a umelý život 2015 zostavili Igor Farkaš Martin Takác Ján Rybár Jozef Kelemen Univerzita Komenského v Bratislave

2 Kognícia a umelý život 2015 (recenzovaný zborník) Vznik tejto publikácie bol podporený Slovenskou spoločnosťou pre kognitívnu vedu a Kultúrnou a edukačnou agentúrou Ministerstva školstva, vedy a športu Slovenskej republiky (KEGA), projekt č. 076UK-4/2013. Recenzenti príspevkov: doc. RNDr. Gabriela Andrejková, CSc. RNDr. Luděk Cienciala, PhD. RNDr. Barbora Cimrová, PhD. PaedDr. Vladimíra Kurincová Čavojová, PhD. prof. Ing. Igor Farkaš, Dr. Vojtěch Juřík PhDr. Dezider Kamhal, PhD. Bc. Zdenko Kohút Mgr. Matúš Konečný Mgr. Lenka Kostovičová, PhD. Mgr. Tomáš Kuzma RNDr. Miroslav Langer, PhD. RNDr. Andrej Lúčny, PhD. Mgr. Martin Majerník, MSc. Mgr. Lukáš Mamula Mgr. Pavel Petrovič, PhD. RNDr. Kristína Rebrová, PhD. doc. PhDr. Ján Rybár, PhD. RNDr. Martin Takáč, PhD. RNDr. Šárka Vavrečková, PhD. Vydavateľ: Univerzita Komenského v Bratislave Šafárikovo nám Bratislava Zostavili c prof. Ing. Igor Farkaš, Dr., 2015 RNDr. Martin Takáč, PhD., 2015 doc. PhDr. Ján Rybár, PhD., 2015 prof. RNDr. Jozef Kelemen, DrSc., 2015 Autorské práva c autori príspevkov, 2015 Dizajn obálky c Róbert Kelemen, 2015 Tlač: Univerzita Komenského v Bratislave Vydané v Bratislave v máji 2015 ISBN

3 Predslov Vážené kolegyne, vážení kolegovia, dostáva sa k vám konferenčný zborník Kognícia a umelý život 2015 kolektívne dielo vás, odborníkov z Česka a Slovenska, ktorí sa rozhodli prísť na toto podujatie a aktívne ho podporiť. Za to, že sa konferencia môže opäť uskutočniť, patrí vám vďaka. Boli sme radi, uvedomujúc si všadeprítomnosť nelineárnych javov v prírode a spoločnosti, že s blížiacim sa termínom konferencie počet účastníkov výrazne narastal. 15. ročník KUZ sa po prvýkrát uskutoční v Trenčianskych Tepliciach (hotel Flóra), v novom prostredí, ktoré nás snáď bude inšpirovať svojou atraktívnosťou a harmóniou. Sme presvedčení, že ako po minulé roky, tak aj teraz sa nám podarí vytvoriť tvorivú atmosféru, ktorá podnieti zaujímavé interdisciplinárne diskusie nielen počas priebehu oficiálnych sekcií, ale aj mimo nich. Kognitívna veda je svojou podstatou programovo zameraná na diskusie naprieč jednotlivými relevantnými odbormi, ponúka možnosť pozrieť sa aj za hranice vlastnej oblasti, nachádzať rôzne súvislosti, analógie a paralely. Dúfame, že v publikovaných príspevkoch v tomto zborníku nájdete inšpiračné zdroje pre vaše ďalšie skúmanie v oblastiach vášho záujmu. Veríme, že prechod na kľúč"namiesto tlačeného zborníka sa stretne s pozitívnym ohlasom medzi vami. Tohoročnú konferenciu sme sa rozhodli obohatiť troma pozvanými prednáškami, v podaní odborníkov úspešne sa presadzujúcich v oblastiach, ktoré sú dôležité pre našu konferenciu. Dr. Matěj Hoffmann (Taliansky technologický inštitút v Janove) nás zasvätí do problémov a výziev v oblasti kognitívnej robotiky. Dr. Roman Rosipal (Ústav merania SAV v Bratislave) poskytne vhľad do neurovednej oblasti týkajúcej sa zrkadliacich neurónov a ich súvislosti s moduláciou kortikálnych oscilácií. Dr. Radek Šikl (Psychologický ústav AV ČR) nás napokon oboznámi s tajomstvami v oblasti zrakového vnímania. Program KUZ 2015 pokrýva spektrum príspevkov od robotiky, cez neurovedu, psychológiu, strojové učenie, až po umelý život. Ide o práce teoretického aj experimentálneho charakteru. Každý príspevok prešiel recenzným konaním, ktoré prebehlo veľmi úspešne vďaka poctivej práci všetkých oslovených recenzentov. Poďakovanie patrí aj členom Centra pre kognitívnu vedu na Fakulte matematiky, fyziky a informatiky Univerzity Komenského v Bratislave, ktorí vyvinuli potrebné úsilie pri príprave arealizácii konferencie. Osobitne oceňujeme prácu RNDr. Kristíny Rebrovej, PhD, autorke a administrátorke konferenčnej stránky, ktorá sa spolu s RNDr. Viliamom Dillingerom a Mgr. Tomášom Kuzmom podieľala aj na finalizácii zborníka, za čo im obidvom patrí naša vďaka. Konferencie KUZ 2015 sa mohli aktívne zúčastniť aj niektorí motivovaní šikovní študenti, za čo ďakujeme pánovi Davidovi Navarovi z firmy Nuabi, s.r.o., ktorá poskytla finančný príspevok na pokrytie konferenčných nákladov trom študentom vybraným programovým výborom. Okrem toho, jeden študent bol financovaný Mgr. Ľudovítom Malinovským. Táto kniha je spolufinancovaná novovzniknutou Slovenskou spoločnosťou pre kognitívnu vedu a Kultúrnou a edukačnou agentúrou Ministerstva školstva, vedy a športu Slovenskej republiky (KEGA) v rámci riešenia projektu č. 076UK-4/2013. Bratislava, máj 2015 Igor Farkaš, Martin Takáč, Ján Rybár, Jozef Kelemen

4 Obsah Pozvaní rečníci Samoorganizujúce sa neurónové siete s viacerými úrovňami laterálnych váh Gabriela Andrejková, Jozef Oravec Jak měřit vědomí: metodologie časového určení vědomých prožitků Ondřej Bečev Roboty s hlavou v oblakoch Ivana Budinská Kontaminovaný mindware: typy, otázky a výzvy Vladimíra Čavojová, Eva Ballová Mikušková, Martin Majerník Interkulturní rozdíly ve zrakovém vnímání a metody jejich měření Jiří Čeněk, Čeněk Šašinka, Tomáš Urbánek Lokalizácia podstratégii modelu HABS Viliam Dillinger Oscary, HDP a CRT: Efekt ukotvenia u finančných profesionálov v kontexte doménovej špecifickosti a kognitívnej reflexie Katarína Dudeková, Lenka Kostovičová Modelování mechanismů reprezentace těla u humanoidního robota icub: od biologické inspirace k adaptivním a bezpečným strojům Matěj Hoffmann Vliv formy 3D zobrazení geografické informace na její kognitivní zpracování Vojtěch Juřík, Čeněk Šašinka, Kateřina Špriňarová, Lukáš Herman, Zbyněk Štěrba, Zdeněk Stachoň, Jiří Chmelík, Barbora Kozlíková Miera črtovej všímavosti vo vzťahu ku kognitívnym zaujatostiam Marek Jurkovič Prečo Wittgenstein odmietal filozofické teórie Dezider Kamhal

5 Rozhodnutia o živote a o peniazoch: Doménové špecifickosti v efekte rámcovania Matúš Konečný Kedy platí menej je viac"? Heuristika rozpoznania v rozhodovaní jednotlivcov a skupín Lenka Kostovičová, Katarína Dudeková Emergencia komunikácie v laboratóriu: triadická interakcia Veronika Kundlová, Ľudovít Malinovský, Kristína Rebrová, Matej Sedláček Automatická tvorba učebných plánov pre strojové učenie Tomáš Kuzma, Igor Farkaš Modelová složitost neuronových sítí zdánlivý paradox Věra Kůrková Pohľad umelej inteligencie a kognitívnej vedy na kolektívnu pamäť Vladimír Kvasnička Síla pozičních ekogramatických systémů Miroslav Langer Agentovo-orientované programovanie v perspektíve vývoja programovania Andrej Lúčny Koncept Hayekova stroje pro řízení robotů Khepera IV Lukáš Mamula Rozšiřování kognitivních schopností (neuro-implantáty a HTM model neocortexu) Marek Otáhal, Jaroslav Vítků, Pavel Nahodil Jazyk pre špecifikáciu pravidiel stolných hier ako základ automatického inteligentného hracieho robotického systému Pavel Petrovič Vplyv zrkadlového tréningu na moduláciu motorických rytmov: elektrofyziologická a klinická štúdia pacienta s hemiparézou po mozgovom infarkte Roman Rosipal, Barbora Cimrová, Lukáš Rückschloss, Zdenko Kohút, Igor Farkaš, Natália Porubcová Paradigma ukotvenej kognície nový pohľad na mentálne reprezentácie Ján Rybár Geometrické membránové systémy a modelování cytoskeletu Petr Sosík, Jaromír Konůpka Interferencia zrakovej a sluchovej pozornosti pri dichotickej stimulácii Marián Špajdel, Zdenko Kohút, Barbora Cimrová, Stanislav Budáč, Veronika Roháriková, Igor Riečanský

6 Umění umělého života jako cesta k parafrázi umění Aleš Svoboda Reprezentácia epizód v pracovnej pamäti, problém viazania a vytváranie očakávaní Martin Takáč, Alistair Knott Robot založený na ukotveném situovaném modelu Michal Vavrečka, Karla Štepánová, Jaroslav Vítků Prostředí eko-kolonií a P-kolonií Šárka Vavrečková Register autorov

7 Pozvaní rečníci Dr. Matej Hoffmann: Modelování mechanismů reprezentace těla u humanoidního robota icub: od biologické inspirace k adaptivním a bezpečným strojům Lidé i zvířata bez problémů ovládají svá vysoce složitá těla a současně integrují multimodální sensorické informace. Zdá se, že nějaký model nebo reprezentace těla v mozku je v tomto případě nezbytný. Přestože bylo nashromážděno množství experimentálních pozorování a navrhnuta celá řada konceptů (jako např. schéma těla body schema), mechanismy, které za fungováním zmíněných reprezentací stojí, jsou z velké části neznámé. Humanoidní roboti mají morfologii fyzické proporce a sensorický a motorický aparát která je na určité úrovni abstrakce podobná primátům. Lze je tak použít jako nástroj k rozšíření výpočetních modelů a jejich ukotvení ve fyzickém světě a k realizování celých sensoricko-motorických smyček v interakci s prostředím. Představíme projekt, v němž tuto ideu realizujeme v humanoidním robotovi icub, který vedle 53 stupňů volnosti, kamer s antropomorfickým uspořádáním, a úhlových enkodérů nově disponuje umělou kůží po celém povrchu těla. Právě taktilní modalita hraje při poznávání vlastního těla důležitou roli; robot proto aktivně provádí průzkum povrchu vlastního těla a sbírá taktilní, proprioceptivní a vizuální informace, ze kterých se pak snaží vytvořit první reprezentace. Zároveň předvedeme, jak lze tento postup aplikovat v robotice ke kinematické sebe-kalibraci a k vytvoření modelu peripersonálního prostoru, který může robot využít k předvídání kontaktů s prostředím po celém povrchu těla. Dr. Roman Rosipal: Systém zrkadliacich neurónov a perceptuálna modulácia kortikálnych motorických oscilácií Systém zrkadlových neurónov predstavuje špecifickú skupinu neurónov, ktoré sa aktivujú nielen pri vykonávaní danej činnosti, ale aj pri jej pozorovaní. Napriek tomu, že aktivácia týchto neurónov bola priamo meraná len u zvierat, existuje silná evidencia, že systém zrkadlenia je prítomný aj u ľudí. Toto zistenie viedlo k vytvoreniu širokej škály hypotéz a špekulácií o jeho funkčnosti. V prednáške zhrniem základné poznatky o systéme a načrtnem niektoré z vyslovených hypotéz o ich úlohe u ľudí. Zameriam sa na oblasť aktivácie systému pri pozorovaní motorickej činnosti a na koncept zrkadlového boxu navrhnutého V.S. Ramachandranom ako nástroja terapie a rehabilitačného prostriedku pri obnovovaní motorických dráh u pacientov s hemiparézou hornej končatiny. Jadro prednášky bude tvoriť predstavenie vlastného konceptu a experimentálneho dizajnu motorickej neurorehabilitačnej terapie pomocou zrkadlového boxu. Zhrniem skúsenosti, pozorovania a výsledky získané využitím konceptu pri dlhodobej terapii pacienta s hemiparézou. Dr. Radovan Šikl: Jak senzorická deprivace ovlivňuje zrakové vnímání: Případové studie pacientů s navráceným zrakem a s makulární degenerací a účastníků dlouhodobé izolační studie V přednášce budou představeny tři autorovy rojekty, jejichž společným tématem je senzorická deprivace. Ve výzkumu pacientů s navráceným zrakem byly sledovány možnosti a hlavně meze rozvoje zrakového vnímání po operativním navrácení zraku, přičemž jako zvlášť roblematické byly diagnostikovány oblasti rozpoznání komplexních objektů a scén a vnímání prostoru. Ve výzkumu pacientů s věkem podmíněnou makulární degenerací byl předmětem zájmu terapeutický potenciál nitroočního zrcadlového teleskopu pro pooperační rozvoj zrakového vnímání, když hlavní zřetel byl věnován povaze 7

8 řešení binokulárního konfliktu. Ve výzkumu změn vnímání u členů posádky simulovaného letu na Mars (projekt Mars-500) byly studovány dopady dlouhodobého, jeden a půl roku trvajícího pobytu v uzavření a časový průběh změn ve vybraných oblastech zrakového vnímání. 8

9 Kognícia a umelý život 2015, Trenčianske Teplice Samoorganizujúce sa neurónové siete s viacerými úrovňami laterálnych váh Gabriela Andrejková, Jozef Oravec Ústav informatiky, Prírodovedecká fakulta UPJŠ v Košiciach Jesenná 5, Košice [email protected], [email protected] Abstrakt Grafy sú veľmi dôležitými modelmi dátových štruktúr, pretože poskytujú možnosť reprezentovať fakty vo vrcholoch a vzťahy medzi nimi pomocou orientovaných alebo neorientovaných hrán. V príspevku je spracovaný novo navrhnutý model samoorganizujúcej sa neurónovej siete (SOM NS) s viacerými vrstvami laterálnych váh, ktoré sa dokážu natrénovať a rozpoznávať grafové dátové štruktúry. Navrhnutý model bol implementovaný a vyhodnotený z hľadiska kvality získaných výstupných štruktúr. Konkrétne výsledky testov boli získané na štruktúrach usporiadania predmetov a ich prerekvizít v študijných programoch na univerzite. Predmety a ich prerekvizity sú usporiadané do acyklických grafových štruktúr. Experimenty na dátových štruktúrach tohto typu a vyhodnotenie výstupných grafových štruktúr z natrénovanej siete boli urobené z hľadiska kritéria usporiadania potomkov vrcholov výstupnej štruktúry. Vo vyhodnotení je pozorovateľné podstatné zlepšenie výsledkov už pri použití dvoch vrstiev laterálnych váh, použitie ďalších vrstiev prináša ďalšie zlepšenia. 1 Úvod Objekty z reálneho sveta a vzťahy medzi nimi je možné reprezentovať pomocou grafov. Grafy sú veľmi dôležitými modelmi dátových štruktúr, pretože umožňujú reprezentovať fakty vo vrcholoch a vzťahy medzi nimi pomocou orientovaných hrán. Reprezentácia grafu pomocou matice (susednosti, incidencie, apod.) je možná a dobrá, avšak pre učenie z príkladov vzhľadom na rôzne veľkosti pre rôzne grafy je nevhodná. Preto je skôr používaná reprezentácia pomocou vymenovania hrán, pričom je možné použiť aj ohodnotenie hrán. Algoritmus učenia sa (trénovania) z príkladov musí toto zohľadňovať, a tak je jeden graf učený vo viacerých krokoch. Samoorganizujúce sa mapy (SOM) pre štruktúrované dáta (SOM-SD) je model neurónovej siete vhodný pre riešenie problémov pracujúcich s grafovými štruktúrami a ich použitím sa zaoberali viacerí autori, napríklad Frasconi a spol. (1998), Hagenbuchner a spol. (2003), Hagenbuchner a Tsoi (2004), Scarselli a spol. (2009), Vančo a Farkaš (2010). Základný model SOM má jednoduchú štruktúru a jednoduchý algoritmus učenia, jeho popis je možné nájsť v monografiách Kohonen (1989), Haykin (1999) a Hertz a spol. (1991). V príspevku Andrejková a Oravec (2012) boli popísané teoretické východiská pre aplikácie používajúce SOM model na prácu s acyklickými dátovými štruktúrami. Článok je rozdelený do piatich sekcií. V druhej sekcii je spracovaný navrhnutý model samoorganizujúcej sa mapy pre štruktúrované dáta s viacerými vrstvami laterálnych váh, v tretej sekcii sú uvedené kritéria, podľa ktorých sú vyhodnotené z natrénovanej neurónovej siete získané výsledné dátové štruktúry, vo štvrtej sekcii je vyhodnotený experiment na reálnych dátach (študijné programy na univerzite ako acyklické dátové štruktúry) podľa navrhnutých kritérií. V závere sú zosumarizované a vyhodnotené dosiahnuté výsledky. 2 Viaceré úrovne laterálnych váh v SOM- SD Ak pri trénovaní neurónovej siete je použitých viacero dátových štruktúr, môže nastať situácia, že sa dátové štruktúry nebudú dať správne rozpoznať, t.j. výsledné štruktúry získané rekurzívnou aktiváciou neurónov od víťazného neurónu nemusia zodpovedať očakávanej štruktúre. A I I B C D C B D A E F F A E B Obr. 1: Príklad trénovania grafových štruktúr v SOM NS modeli s laterálnymi váhami. V ľavej časti sú dve grafové štruktúry a v pravej časti je príklad natrénovanej mriežky pre uvedené grafové štruktúry, pričom orientované hrany vyjadrujú laterálne váhy. Na Obr. 1 je príklad dvoch dátových štruktúr spolu s ich možným natrénovaním v mriežke neurónovej siete ako je uvedené v pravej časti obrázku. Písmená vo vrcholoch štruktúr predstavujú diskrétne ohodnotenia vrcholov a týmto ohodnoteniam po natrénovaní odpovedajú neuróny mriežky. Po natrénovaní môžu štruktúry v neuró- C E F D 9

10 novej sieti splynúť s časťami iných štruktúr a tým pádom nie je možné očakávať správne výsledné štruktúry od neurónovej siete. Preto sme navrhli doplniť neurónovú sieť o laterálne váhy uložené vo viacerých úrovniach v rámci jednej mriežky. Tým sa docielí to, že po natrénovaní bude hľadaná najpodobnejšia štruktúra k vstupnej štruktúre pomocou úrovní laterálnych váh. Túto sieť nazveme sieť s laterálnymi váhami v úrovniach (SLVU). Budeme používať nasledujúce označenie: Graf G je možné vyjadriť ako dvojicu G = (V, E), kde V je konečná množina vrcholov (fakty) V = n a E = {(v, u); v, u V } množina hrán (vzťahy) E n 2. ch D [v] predstavuje množinu všetkých priamych následovníkov vrcholu v v štruktúre D. Definičný obor návestí vrcholov grafu označíme U a možinu všetkých dátových štruktúr v tomto obore U #. 2.1 Organizačná dynamika SLVU Naším cieľom je trénovať neurónovú sieť na acyklických grafových štruktúrach. Grafy majú ohodnotené vrcholy návestiami (reťazce alebo čísla). Trénovacia množina T L (1) je daná vstupnými štruktúrami U z domény U #. Bude použitý učiaci (trénovací) algoritmus bez dozoru (unsupervised learning). T L = { U; U U #}, (1) V sieti sa vyžaduje nastavenie asociovanej vrstvy pre každú vstupnú dátovú štruktúru. Laterálne váhy v asociovanej vrstve budú adaptované pomocou vstupných dátových štruktúr. d 1,3 d 1,2 d 1,1 d 4,3 d 4,2 d 4,1 d 2,3 d 2,2 d 2,1 d 5,3 d 5,2 d 5,1 x 0 y 4 y 5 y 6 y 1 y 2 y 3 SS x 1 x 2 x 3 d 3,3 d 3,2 d 3,1 d 6,3 d 6,2 d 6,1 Obr. 2: Neurónová sieť s 3 vrstvami laterálnych váh, 3 vstupnými neurónmi a mriežkou 3 2, SS predstavuje rázcestník. Na Obr. 2 je uvedený príklad neurónovej siete s mriežkou neurónov, nad mriežkou je niekoľko vrstiev laterálnych váh. Vľavo dole sa nachádza vstup x 0 s informáciou o asociovaných vrstvách. Vstupné neuróny sú x 1, x 2, x 3. Ich aktivita zodpovedá návestiam vrcholov v trénujúcej štruktúre. Časť s označením SS sa nazýva rázcestník siete a reprezentuje sieť SOM SD s počtom neurónov zodpovedajúcim počtu vrstiev laterálnych váh. Neuróny v prvej vrstve sú zakreslené sivou farbou, ďalšie vrstvy neurónov sú znázornené nevyplnenými krúžkami. Neuróny mriežky siete SOM sú znázornené čiernymi krúžkami. Priradenie niektorej vrstvy k dátovej štruktúre je vykonávané pomocou rázcestníka SOM-SD siete uvedenej v Andrejková a Oravec (2012); mriežka rázcestníka je jednorozmerná a počet neurónov v nej sa rovná počtu vrstiev. Každej dátovej štruktúre zodpovedá niektorý víťazný neurón a jeho index definuje vrstvu laterálnych váh. Základ organizačnej dynamiky siete SLVU môže byť opísaný pomocou laterálnych váh a SOM SD takto: 1. Vstup x I = (x 1,..., x n ) má n vstupných neurónov. 2. Ku vstupnej vrstve je pripojený rázcestník jednorozmerná sieť SOM-SD s l neurónmi a váhami w R ji spájajúcimi j-tý vstupný neurón a i-tý neurón siete SOM-SD. 3. Nad vstupnou vrstvou sa nachádza spravidla 2 rozmerná mriežka s N = N 1.N 2 neurónmi, kde N j, j = 1, 2 je počet neurónov v j-tom rozmere (je možné použitie viacrozmerných mriežok). Váha medzi i-tým neurónom siete a j-tým vstupným neurónom je w ji. Neurón mriežky má index i a jeho stav je y i. Mriežka patrí sieti SOM-SD. 4. V sieti sa nachádza l vrstiev laterálnych váh, počet vrstiev sa rovná počtu neurónov v rázcestníku, l je voliteľný parameter. Neuróny vo vrstvách sú prepojené laterálnymi váhami wji s, kde j, i = 1,... N sú indexy neurónov v mriežke a s je index vrstvy. Na Obr. 3 je znázornený vertikálny pohľad na usporiadanie neurónov. Nad i-tým neurónom v mriežke sa nachádzajú neuróny d i,1,..., d i,l, spojené váhami s hodnotou 1, označíme ich w di,s,d i,s+1. Laterálne váhy medzi neurónmi vo vrstve s sú wji s vychádzajú z každého neurónu d i,s a vedú do neurónu d j,s. Do neurónu d i,1 vstupujú dve váhy, váha s hodnotou 1 z neurónu x 0, ktorá určuje vrstvu (váha w i0 ) a druhá váha w i vychádza z neurónu i mriežky SOM siete, ktorá posúva aktivitu neurónu z mriežky do odpovedajúcej vrstvy laterálnych váh. Medzi každým neurónom mriežky rázcestníka a neurónom odpovedajúcim vstupu x 0 je l váh s hodnotami w s0 = s, kde s = 1,..., l je s-tý neurón rázcestníka. Rázcestník nasmeruje výpočet do s-tej vrstvy. Rázcestník má tiež kontextovú vrstvu s neurónmi c 1,..., c o, kde o = max { o D ; D T L}, o D je maximálny počet 10

11 x 0.. d i,l d i,l 1 d i,j+1 d i,j d i,j 1 d i,1 y i wji(t s + 1) = wji(t) s + η(t) hh ( x j (t) wji(t s 1) ) (3) kde h l (i D v, j, t, p) je funkcia susedstva (4) a t je poradové číslo iterácie. Funkcia susedstva v úrovniach je vyjadrená v (4) h ( l i D v, i, j, p ) = = ( ) exp Dv i i 2σ 2 (t), 1 i N, 1 j n 1 1+e, p 0, i = i, n + 1 j n + N αp 1, p < 0, i i, n + 1 j n + N 1+e βp 0 inak, (4) kde i je víťazný neurón, σ(t) R, l = j n, j i je šírka susedstva, ktoré sa môže zmeniť počas učiaceho procesu, p = x j (t) wji s (t 1). Parametre α a β majú vplyv na excitáciu a na inhibíciu váh, α 1 a β < 0. Tento prístup je časovo náročný, pretože zmeny všetkých váh v sieti musia byť vždy znovu vypočítané. Obr. 3: Vertikálny pohľad na sieť SLVU s laterálnymi váhami vo vrstvách odpovedajúcich neurónu so súradnicami i v mriežke. nasledovníkov vrcholov štruktúry D. Neuróny kontextovej vrstvy sú úplne prepojené s jednorozmernou mriežkou a váhy medzi vrstvami sú wji RC, kde j = 1,... o, i = 1,..., s. 2.2 Adaptívna dynamika Adaptívna dynamika spočíva v nastavení konfigurácie siete a vychádza z adaptívnej dynamiky siete SOM-SD. Pozostáva z dvoch krokov. V prvom kroku je trénovaný rázcestník. Rázcestník je trénovaný ako SOM-SD. Druhým krokom je adaptácia váh medzi mriežkou a vstupnou vrstvou a laterálnych váh v úrovniach. Počas adaptívnej dynamiky pri spracovaní jedného vrcholu v vstupnej štruktúry D bude aktivovaný neurón y i odpovedajúci víťazovi i na hodnotu 1, ktorého aktivita sa postupne posunie do s-tej úrovne a teda aktivita neurónu d s i bude 1. Cieľom je aktivovať neuróny d s k odpovedajúce potomkom vrcholu v na hodnoty d s k (t) = a, a φ, 1, kde neurón k odpovedá víťaznému neurónu a ohodnoteniu vrchola ch D,k [v] počas iterácie t. φ je voliteľný parameter aktivácie neurónov. Úprava váh sa uskutoční naraz pre váhy medzi vstupnou vrstvou a mriežkou a laterálnymi váhami v príslušnej úrovni. Adaptácia váh j-tého neurónu je urobená podľa (2). w j (t) = η(t)h i (j, t) x w j (t 1) 2, (2) kde η(t) je učiaci pomer, h i je funkcia susedstva. Adaptácia laterálnych váh vo vrstve s je urobená nasledujúcim spôsobom: hh = h l ( i D v, i, j, x j (t) w s ji(t 1) ) Učiaci algoritmus - adaptácia SLVU: Vstup: Trénovacia množina T L definovaná v (1). Výstup: Natrénované všetky váhy siete SLVU. Metóda: K0: Inicializovať náhodne laterálne váhy na úrovniach wji s z intervalu 0, 1, inicializovať náhodné váhy wji R, wrc ji, w ji, váhy medzi rázcestníkom a neurónom x 0 nastaviť na w s0 = s, váhy w di,s,d i,s+1, w i a w j0 nastaviť na 1. K1: Aplikáciou algoritmu pre SOM-SD natrénovať rázcestník použitím trénujúcej množiny T L. K2: Opakovať pre každú vstupnú dátovú štruktúru D T L a pre každý vrchol v inverzne usporiadanej množiny vrcholov V inv (D), pokiaľ sieť neskonverguje do stabilného stavu, nasledujúce kroky: K2.1 Podľa rázcestníka určiť úroveň s pre štruktúru D. K2.2 Nájsť víťaza i D v pre ohodnotenie D v použitím (5). K2.3 Zmeniť váhy w ji podľa (2). K2.4 Aktivovať neurón d i,s podľa (6). K2.5 Ak má vrchol v potomkov, aktivovať neuróny vo vrstve s odpovedajúce potomkom z ch D [v] tak, že ohodnotenie vrchola každého potomka bude dané na vstup a jeho aktivita z mriežky sa presunie na odpovedajúcu úroveň s podľa (6). K2.6 Zmeniť váhu wji s podľa (3). K2.7 Deaktivovať všetky neuróny d i,j a y i v mriežke, ktoré boli aktivované na hodnotu 0. Pokračovať spracovaním ďalšieho vrcholu. 11

12 2.3 Časová a priestorová zložitosť adaptácie Pridanie vrstiev s laterálnymi váhami do siete sa odzrkadlí v priestorovej zložitosti. Teda, na vstupe je n neurónov spojených n.n váhami s mriežkou, v ktorej je N neurónov. V jednodimenzionálnej mriežke rázcestníka je l neurónov, ktoré sú spojené n.l váhami. Ďalej v razcestníku je o kontextových neurónov s o.l váhami. Medzi rázcestníkom a neurónom x 0 je s váh. Medzi neurónom x 0 a prvou vrstvou laterálnych váh je N váh. Podobne medzi mriežkou a prvou vrstvou jen váh. V jednotlivých úrovniach je spolu l.n neurónov a l.n 2 laterálnych váh. Medzi jednotlivými vrstvami je (l 1).N váh. Úhrnom dostávame odhad pre priestorovú zložitosť S = O(n + l + o + s + (n + o + 2N + N 2 ).l + 2N). Za predpokladu, že je natrénovaný rázcestník SS, odhad na trénovanie jednej vzorky má časovú zložitosť T = O(nN + nn + s so + N 2 + s(o + 1) = O(so+2nN +N 2 ), kde na nájdenie víťaza je potrebných nn operácií, zmena váh medzi mriežkou a vstupnými hodnotami si vyžiada nn operácií. Na presun aktivity víťazného neurónu do s-tej vrstvy je potrebných s+1 operácií aj s presunom aktivity x 0, na presun aktivít potomkov z s-tej vrstvy je potrebných s. ch D [v] s.o operácií. Na počet zmien laterálnych váh treba N 2 operácií. Deaktivácia všetkých aktívnych neurónov bude vyžadovať najviac s(o + 1) operácií. 2.4 Aktívna dynamika Práca siete spočíva v rekurzívnej aktivácii neurónov použitím laterálnych váh vo vrstve určenej rázcestníkom. Najprv sú aktivované všetky vstupné neuróny hodnotami x 1,..., x n. Nasledujú dva kroky: v prvom kroku je vypočítaný víťazný neurón v časti siete SS použitím klasického SOM algoritmu, pričom index víťazného neurónu určí vrstvu s; v druhom kroku je určený víťaz mriežky i siete SOM podľa (5), kde x I sú stavy vstupných neurónov a wj I sú váhy. ( = arg min 0Dv j=1,...,n wj I ), (5) i D v kde D v = x I je ohodnotenie vrchola v, ktoré je na vstupe siete. Potom aktivita neurónu y i v prvej vrstve je prenesená do vrstvy s nasledujúcim spôsobom: Stavy neurónov d i,j budú vypočítané pre všetky vrstvy p takto: w i0 x w i y i p = 1, d i,p = d i,p 1 1 d i,p 1 > 1, 2 p s d i,p 1 d i,p 1 1, p > s, (6) kde x 0 = l s=0 w s0ys SS. Z hodnôt váh w s0 a z y i = 1 1 vyplýva, že neuróny vo vrstve s budú aktivované na hodnotu d i,s = 1 (je to i-tý neurón v s-tej vrstve), aktivita neurónov zodpovedá víťaznému neurónu v mriežke prvej vrstvy. 1 Aktívny neurón má výstupnú hodnotu 1. Neuróny vo vrstve s sú aktivované rekurzívne použitím lateálnych váh wji s podľa algoritmu pre adaptáciu siete SLVU a tak sa dostane štruktúra do vrstvy trénovanej neurónovej siete. Použijeme voliteľný parameter φ - dôležitosť prepojenia, ktorým je možné regulovať aktiváciu neurónov. Ak d i,j φ, 1, neurón je aktivovaný, inak je neaktívny. Je potrebné poznamenať, že aj v tejto sieti môže dôjsť k prekrytiu štruktúr. Poznámka: Výhodou vytvorenia niekoľkých úrovní mriežok sú lepšie sieťou vypočítané štruktúry, ale zásadná nevýhoda sa skrýva v rázcestníku, ktorý pozostáva zo siete SOM-SD. Aby bol získaný víťazný neurón v jednodimenzionálnej mriežke, je potrebné dať na vstup počas aktívnej dynamiky v prvej fáze výberu úrovne celú štruktúru, najlepšie tú, ktorá bola trénovaná, aby bola správne vybraná úroveň rázcestníkom. Nevýhodou tejto siete je aj to, že keď vieme len ohodnotenie vrchola, od ktorého chceme vedieť interpretáciu štruktúry sieťou, sieť SLVU nebude vedieť vybrať správnu úroveň, v ktorej sa má vykonať aktivácia neurónov. 3 Vyhodnotenie modelu SLVU Označme T O testovaciu množinu dátových štruktúr pre testovanie SLVU, T O = { U; U U #} (7) Vrcholy v dátovej štruktúre sú označené jednoznačnými návestiami, ich identifikácia je veľmi jednoduchá. Každý vrchol môže byť použitý vo viacerých štruktúrach. Vyhodnotenie je urobené detailným porovnaním štruktúry získanej výpočtom siete (sieťová interpretácia) a očakávanej (testovanej vstupnej) štruktúry. 3.1 Diferenciácia víťazov Diferenciácia víťazov (DV ) vyjadruje pomer medzi počtom víťazných neurónov a počtom rôznych vstupných dát Vančo a Farkaš (2010) DV = {j; t : j = i (t)}, (8) N Ak DV < 1, tí istí víťazi sú vypočítaní pre viacej rôznych vstupov. Situácia je najlepšia v prípade, ak DV = 1. Predpokladáme, že parameter DV sa bude blížiť k Kvalita získaných dátových štruktúr v SLVU Kvalita trénovanej siete SLVU bude vyhodnotená na základe zoznamu následovníkov vrcholov vstupnej štruktúry a sieťou vypočítanej štruktúry. Vstupná štruktúra je prezentovaná pomocou kódov návestí na vstupe siete SLVU. Vyhodnotenie je urobené spracovaním aktivácií neurónov. Pred spracovaním prvého návestia na vstupe je vykonaná inicializácia neurónov v sieti a výstupnej 12

13 vrstvy ako neaktívne (hodnota 0). Po vykonaní výpočtu budú niektoré neuróny aktivované (hodnota 1). Aktivované neuróny zodpovedajú buď návestiu vrcholu na vstupe alebo návestiam jeho nasledovníkov. Aktivované neuróny predstavujú sieťou vypočítanú štruktúru a nemusia zodpovedať reálnej situácii. Správna aktivácia neurónu predstavuje neurón v stave 1 a jeho očakávaná hodnota je tiež 1. Nesprávna aktivácia neurónu predstavuje neurón v stave 1 a podľa vstupnej štruktúry by mal byť neaktívny, mal by mať hodnotu 0. Je možné použiť dva prístupy k vyhodnoteniu kvality vypočítanej štruktúry: 1. dôveryhodnosť (SA) vypočítanej štruktúry je pomer medzi počtom správne aktivovaných neurónov a počtom všetkých vrcholov v štruktúre, a 2. nedôveryhodnosť (NA) vypočítanej štruktúry je pomer medzi počtom nesprávne aktivovaných neurónov a počtom všetkých vrcholov v štruktúre. Vyhodnotenie je počítané na testovacej množine pripravenej podľa (9). O = {{(U v, de U [v] {U v })}}, U T O, (9) kde (U v, de U [v] {U v }) sú dvojice návestí vstupných vrcholov - vrchol a jeho následovníci a U je dátová štruktúra z množiny štruktúr T O. Dôveryhodnosť SA a nedôveryhodnosť NA sú definované podľa (10): SA = psa p S, pna NA = p S (10) kde p S je súčet počtov všetkých správne vymenovaných všetkých následovníkov vrcholov v U z testovacej množiny O na vstupe, vrátane daného vrcholu, a p SA je súčet všetkých správne aktivovaných neurónov (p NA je súčet všetkých nesprávne aktivovaných neurónov) po sekvenčnom vstupe všetkých návestí U v z testovacej množiny. SA + NA = 1, preto uvedieme výsledky pre dôveryhodnosť. 3.3 Kvalita topológie získaných dátových štruktúr Výpočtom siete SLVU dostaneme vypočítanú dátovú štruktúru použitím rekurzívnej aktivácie, označme ju vu S. Predpokladáme, že zodpovedá reálnej štruktúre vu. Použitím rekurzívnej aktivácie neuróny v sieti sú usporiadané podľa hodnôt laterálnych váh, t.j. následovníci nejakého vrcholu v v U S sú usporiadaní podľa hodnôt laterálnych váh. Budeme porovnávať kvalitu vypočítanej štruktúry v U S vzhľadom na reálnu štruktúru v U porovnávaním následovníkov nejakého navzájom si odpovedajúceho vrcholu v oboch štruktúrach. Vzhľadom na možnosti akceptovania poradia potomkov niektorého vrcholu dostávame tri typy usporiadania: Usporiadanie určené sieťou (US): V štruktúre vypočítanej neurónovou sieťou akceptujeme usporiadanie potomkov vrchola v poradí, v akom ho neurónová sieť vypočítala, t.j. v poradí podľa hodnoty laterálnych váh. Relatívne usporiadanie (RU): V štruktúre vypočítanej neurónovou sieťou neakceptujeme v usporiadaní tých potomkov už vybraného vrchola, ktorí nevyhovujú usporiadaniu voči skutočnosti, t.j. ak pre štruktúru v U S platí usporiadanie (u, r) vu S (u, t) vu S (u, z), kde r, t, z ch vu S [u] a v reálnej štruktúre v U je usporiadanie hrán (u, r) vu S (u, z), kde r, z ch vu [u], tak vybrané vrcholy z potomkov pre porovnávanie budú len r, z. Úplné usporiadanie (UU): V štruktúre vypočítanej neurónovou sieťou akceptujeme len tých potomkov už vybraného vrcholu, ktorých usporiadanie je úplne totožné s očakávaným usporiadaním potomkov vrchola skutočnej štruktúry a navyše počet potomkov majú rovnaký. Konkrétne pre získanú štruktúru v U S pomocou neurónovej siete platí (u, r) vu S (u, t), kde r, t ch vu S [v] a v reálnej štruktúre v U je usporiadanie vrcholov (u, r) vu (u, t), kde r, t ch vu [v] a je tiež splnené ch vu S [v] = ch vu [v]. Siete SLVU sú schopné vypočítať dátovú štruktúru spolu s jej topológiou. Po predložení ohodnotenia vrcholu na vstup siete mu bude odpovedať víťazný neurón. Rekurzívnou aktiváciou pomocou laterálnych váh sú aktivované neuróny, ktoré zodpovedajú ďalším vrcholom. Takto získame topológiu dátovej štruktúry z neurónovej siete. Vyššie sme uviedli, že budeme pri vyhodnocovaní zohľadnovať tri spôsoby vyhodnotenia z pohľadu usporiadania potomkov získanej štruktúry. Preto pri jednotlivých parametroch porovnávania budeme uvádzať jedno z označení X = {US; RU; UU} podľa typu hodnoteného usporiadania. Dôveryhodnosť definovaná v (10) nadobudne tvar: SA X R = F X SA R N R, (11) kde FSA X R = 1 v V (U) Listy(U) SA X R (v), U T O a SA X R (v) je počet správne rekurzívne aktivovaných neurónov zodpovedajúcim vrcholom priamym potomkom ch U [v], v zmysle vyššie uvedeného X, a N R je počet všetkých vrcholov pri rekurzívnom spracovaní štruktúr, t.j. N R = U T O(1 + v ch U[v] ). Kvalita SA X R vypočítanej dátovej štruktúry teda vyjadruje úspešnú aktiváciu neurónov odpovedajúceho vrcholu v a jeho priamych následovníkov, t. j. de U [v] {v}. 13

14 4 Experiment: dátové štruktúry študijných programov V mnohých študijných programoch (ŠP) na univerzitách sú používané tri typy predmetov: Povinné predmety, povinne voliteľné a výberové predmety. Z teoretického hľadiska všetky predmety tvoria čiastočne usporiadanú množinu podľa poradia pre ich absolvovanie. Čiastočne usporiadanie je určené prerekvizitami predmetov. Časť študijného programu Informatika na Prírodovedeckej fakulte UPJŠ je znázornená na Obr. 4. kde v D je graf nasledovníkov vrcholu v v štruktúre D. V testovacej množine sa nachádzalo 5366 vrcholov vo všetkých úrovniach testovaných podštruktúr. Príklad stromovej štruktúry z trénujúcej množiny štruktúr je uvedený na Obr. 5. Strom reprezentuje rekurzívny prechod acyklickej štruktúry odpovedajúcej študijnému programu bakalárskeho štúdia Informatika - Ib Obr. 5: Príklad trénovacej štruktúry hĺbky 4: Štruktúra odpovedajúca študijnému programu Informatika - Ib. Obr. 4: Časť študijného programu Informatika. 4.1 Príprava dátových štruktúr Predmety študijných programov sú jednoznačne zakódované. Množina všetkých kódov je P = {p k ; k = 1,..., K, p k {0, 1} n, (12) kde n = log 2 (2K )+1} a K je počet predmetov vo všetkých študijných programoch. Tieto kódy tvoria definičný obor návestí dátových štruktúr. Nech S je množina všetkých dátových štruktúr zodpovedajúcich študijným programom so spoločným štartujúcim vrcholom (supervrcholom): S = {D; D je dátová štruktúra jedného ŠP} (13) Označme V (D) množinu všetkých vrcholov v dátovej štruktúre D a de D [v] množinu všetkých prerekvizitných vrcholov vrcholu v V (D). Množina V (D) je čiastočne usporiadaná podľa relácie prerekvizita - a je vnorená do lineárneho usporiadania pred začiatkom trénovania. Usporiadanie je dôležité pre trénovanie a hlavne pre vyhodnotenie kvality SLVU. Experimenty boli urobené pre siete SLVU s 1 až 10 vrstvami laterálnych váh a pre štvorcové rozmery mriežky: k, k = 0,..., 13. Siete boli trénované vykonaním 3000 iterácií a ďalšie parametre boli nastavené na α = 2, β = , dôležitosť prepojenia φ = Trénovacia množina bola pripravená z 19 prvkov množiny S. Testovacia množina T O pozostávala z podštruktúr prvkov množiny S. T O = { v D; v V (D), D T L } (14) 4.2 Diferenciácia víťazov, výsledky Úroveň ,259 0,512 0,604 0,749 0, ,289 0,495 0,720 0,936 0, ,292 0,507 0,737 0,926 0, ,291 0,500 0,722 0,933 0, ,287 0,511 0,737 0,913 0, ,288 0,484 0,721 0,924 0, ,291 0,518 0,721 0,939 0, ,291 0,509 0,754 0,937 0, ,286 0,495 0,741 0,943 0, ,287 0,489 0,750 0,914 0,992 Tab. 1: Vyhodnotenie VD v sieti SLVU s počtom úrovní 1 až 10 a veľkosťou mriežky 15, 24, 30, 42, 54. Najmenšia zistená hodnota je 0, 259 pre rozmer mriežky 15 a maximálna je 0, 997 pre rozmer mriežky 54. Z toho vyplýva, že ani v jednom prípade sa nedosiahol stav, v ktorom jednému neurónu mriežky odpovedá najviac jeden vrchol štruktúry. Na Obr. 6 sú zobrazené graficky jednotlivé diferenciácie víťazov. Na grafe je vidieť, že hodnoty DV závisia len od rozmeru mriežky čo potvrdzujú aj údaje v Tab. 1. V prípade sietí SLVU nie je použitý žiadny kontext. Na vstup sú kladené len ohodnotenia vrcholov a v prípade sietí s rozmerom mriežky od 42 hodnota diferenciácie je väčšia než 0.9, a teda môžme pre tieto siete očakávať primerané hodnoty dôveryhodností. 4.3 SLVU - dôveryhodnosť, výsledky Vyhodnotenie dôveryhodnosti siete SLVU v zmysle X je uvedené v Tab. 2. Minimálna hodnota dôveryhodnosti bola nameraná a maximálna hodnota

15 L Obr. 6: Farebne odlíšené hodnoty diferenciácie víťazov pre siete SLVU s mriežkami 15 až 54. Tmavšie hodnoty znamenajú lepšie dosiahnuté výsledky. Oramované štvorčeky predstavujú najlepšie/najhoršie hodnoty pre danú kombináciu počtu úrovní a veľkosti mriežky. Vidíme, že ani v jednom prípade sieť nevedela vymenovať všetkých potomkov vrcholov štruktúr správne. Ak sa pozrieme na jednotlivé hodnoty, tak vždy najhoršie hodnoty boli pre siete s najmenšou mriežkou 15 a najlepšie hodnoty sa pohybovali na mriežkach 48, 51 a 54. Podľa očakávania najhoršie výsledky dosiahla sieť s jednou úrovňou laterálnych váh. Pridávaním úrovní sa výsledky vylepšovali. Najlepšie hodnoty dosiahla sieť so 6 úrovňami a rozmerom mriežky 54. Trénovanie takýchto sietí je časovo aj pamäťovo náročné, a preto pre tak malý počet štruktúr v trénovacej množine T L nie je potrebné používať siete s tak veľkým rozmerom a počtom úrovní. Toto pozorovanie je možné vidieť aj v Tab. 2 aj v grafe na Obr. 7, na ktorom je viditeľné, že hodnoty dôveryhodnosti podľa očakávaného usporiadania X majú zásadné rozdiely. V prípade usporiadania daného sieťou a očakávaného relatívneho usporiadania sú hodnoty dôveryhodnosti veľmi podobné, čo znamená, že sieť, ak už vie vymenovať potomkov, tak dostatočne dobre zachová usporiadanie potomkov vrcholu voči skutočnej štruktúre. Horšie to je v prípade očakávaného úplného usporiadania. Tú sú hodnoty výrazne nižšie, čo je odôvodniteľné tým, že sieť dokáže podstatne ťažšie interpretovať štruktúru v pôvodnom usporiadaní. V ON 0,295 0,469 0,619 0,610 0,648 1 RO 0,295 0,467 0,617 0,608 0,639 FO 0,290 0,409 0,537 0,536 0,585 ON 0,293 0,460 0,718 0,829 0,869 2 RO 0,292 0,458 0,716 0,821 0,864 FO 0,287 0,408 0,617 0,659 0,678 ON 0,306 0,523 0,777 0,847 0,836 3 RO 0,304 0,521 0,774 0,842 0,834 FO 0,291 0,426 0,663 0,657 0,641 ON 0,325 0,581 0,805 0,854 0,884 4 RO 0,324 0,578 0,802 0,849 0,881 FO 0,296 0,445 0,665 0,708 0,789 ON 0,308 0,519 0,745 0,813 0,854 5 RO 0,308 0,518 0,743 0,808 0,850 FO 0,287 0,441 0,683 0,689 0,668 ON 0,359 0,677 0,866 0,860 0,894 6 RO 0,358 0,676 0,862 0,857 0,892 FO 0,314 0,543 0,654 0,763 0,757 ON 0,346 0,662 0,804 0,877 0,881 7 RO 0,344 0,660 0,802 0,874 0,881 FO 0,304 0,541 0,626 0,653 0,682 ON 0,362 0,685 0,833 0,884 0,871 8 RO 0,360 0,681 0,827 0,878 0,868 FO 0,316 0,535 0,715 0,647 0,706 ON 0,372 0,741 0,859 0,885 0,869 9 RO 0,366 0,738 0,854 0,883 0,865 FO 0,316 0,591 0,725 0,733 0,650 ON 0,355 0,610 0,811 0,858 0, RO 0,352 0,608 0,807 0,851 0,841 FO 0,306 0,530 0,631 0,680 0,675 Tab. 2: US, RU, UU - dôveryhodnosť. Stĺpce odpovedajú rozmeru mriežky, trojice riadkov odpovedajú hodnotám usporiadaní, kde uvedené číslo V vyjadruje počet úrovní. Vyhodnotenie je uvedené pre veľkosť štvorcovej mriežky 15, 30, 45, 51, 54. prerekvizity, čo pre študentov nie je postačujúce. Poďakovanie 5 Záver V príspevku sme uviedli nový model SOM neurónových sietí s viacerými úrovňami laterálnych váh SLVU model pre prácu s grafovými dátovými štruktúrami. Experiment s týmto modelom pri acyklických dátových štruktúrach predstavujúcich študijné programy na univerzite potvrdil použiteľnosť tohto modelu. Vyhodnotenie bolo urobené jednak z hľadiska usporiadania potomkov jednotlivých vrcholov, ale bol tiež sformulovaný problém zápis predmetu s prerekvizitami, v ktorom boli vyhodnotené odpovede systému pre jednotlivé predmety. Aj keď systém odpovedal väčšinou správne, jednalo sa len o formálne Tento príspevok vznikol za podpory grantovej agentúry VEGA v rámci grantovej úlohy 1/0142/15. Literatúra Andrejková, G. a Oravec, J. (2012). Application of modified som neural networks on acyclic data structures. Acta Electrotechnica et Informatica, 12(2):3 8. Frasconi, P. M., Gori, M. a Sperduti, A. (1998). A general framework of adaptive processing of data structures. IEEE Transactions on Neural Networks, 9(5):

16 Kohonen, T. (1989). Self-organization and associative memory. Springer-Verlag, New York, NY, USA, 3. vyd. Scarselli, F., Gori, M., Tsoi, A. C., Hagenbuchner, M. a Monfardini, G. (2009). The graph neural network model. IEEE Transactions on Neural Networks, 20(1): Vančo, P. a Farkaš, I. (2010). Experimental comparison of recursive self-organizing maps for processing treestructured data. Neurocomputing, (73): Obr. 7: Farebne odlíšené namerané hodnoty dôveryhodnosti pre siete SLVU s počtom úrovní 1 až 10 a s mriežkami 15 až 54 cez všetky úrovne štruktúr. Tmavšie sfarbené štvorčeky znamenajú lepšie namerané hodnoty. Oramované štvorčeky predstavujú najlepšie/najhoršie hodnoty pre danú kombináciu počtu úrovní a veľkosti mriežky. Hagenbuchner, M., Sperduti, A. a Tsoi, A. C. (2003). A self-organizing map for adaptive processing of structured data. IEEE Transactions on Neural Networks, 14(3): Hagenbuchner, M. a Tsoi, A. C. (2004). A supervised self-organizing map for structures. Proceedings IEEE International Joint Conference on Neural Networks, 14: Hammer, B., Micheli, A., Sperduti, A. a Strickert, M. (2004). A general framework for unsupervised processing of structured data. Neurocomputing, (57):3 35. Haykin, S. (1999). Neural networks: a comprehensive foundations. Prentice-Hall, New Jersey, 2. vyd. Hertz, J., Krogh, A. a Palmer, R. (1991). Introduction to the Theory of Neural Computation. Addison-Wesley. 16

17 Kognícia a umelý život 2015, Trenčianske Teplice Jak měřit vědomí: metodologie časového určení vědomých prožitků Ondřej Bečev Fakulta humanitních studií, Univerzita Karlova, Praha U Kříže 10, Praha 5, Česká republika [email protected] Národní ústav duševního zdraví Topolová 748, Klecany, Česká republika [email protected] Abstrakt Žádná současná debata o experimentálním zkoumání vědomí, svobodné vůle a rozhodování není možná bez zaujetí určitého postoje k metodologii určování časového aspektu vědomých prožitků. Mnoho z paradigmat používaných v praxi bylo však podrobeno kritice zejména z pozic filosofie, ale i psychologie. Představená metodologická práce usiluje o to prezentovat toto téma coby aktuální otázku a otevřít rozpravu o problému doposud stojícímu poněkud stranou odborné pozornosti. Text kriticky představuje nejvýznačnější z přístupů k měření vědomí a reportování vědomých prožitků. Analyzuje jednak tradiční post-hoc přístup (Libet) v jeho různých variantách a srovnává jej s alternativními přístupy usilující o mapování obsahu vědomí v reálném čase. 1 Vědomé prožitky a jejich měření Současný výzkum na poli vědy o vědomí závisí rozhodujícím způsobem na pokusech objektivizovat obsahy mysli a vědomé zkušenosti. Zejména program empirického zkoumání svobodné vůle, prožitku jednání (sense of agency), uvědomění si záměru (awareness of intention) a příbuzných jevů je spojen s potřebou jejich časového určení. Přes aktuální velkou popularitu těchto téma a značné množství publikovaných strudií, je věnováno otázce metodologické validity široce rozšířených metod věnována jen překvapivě omezená pozornost. Tento metodologický článek poskytuje seznámení se současnou podobou diskuse o metodách reportování, či měření vědomých obsahů mysli, zejména s důrazem na reportování časového určení vědomých prožitků. Tento problém ilustruji na otázce časového určení motorických intencí a volního jednání. Nastíněno je též studium časových horizontů vědomých intencí a jejich prožitkových forem a souvislost fenomenologie volní akce a různých úrovní vědomí. Předkládané téma je klíčové pro všechny, zkoumající časový průběh rozhodování a uvědomování si vlastních intencí. Přínosným pak je také pro ty, kdo se zabývají obecně problematikou reportování vědomí. 1.1 Počátky experimentálního výzkumu časování Problém, v pojetí, jakém ho zde chceme zkoumat, poprvé výrazněji vstoupil do odborné diskuse v souvislosti s Libetovými experimenty (Libet, 1985) z počátku 80. let. Ty odstartovaly boom neurovědného a psychologického pátrání po odpovědi na odvěké otázky - zda jsme jako lidé schopní projevů svobodné vůle a volního jednání. V experimentální vědě tato diskuse nabyla podoby zkoumání vědomé zkušenosti záměru (conscious experience of intention) a prožitku jednání (Sense of Agency, SoA). Většina z těchto disciplín používá experimentální designy, implementující nějakou formu měření času vědomé zkušenosti. Zpravidla se při tom spoléhají na metodu vycházející z přes 30 let starého Libetova experimentu (Libet a spol., 1983). Dnes výzkumníci v této oblasti naráží na to, že výsledky jednotlivých studií se někdy zdají jít proti sobě. Důvodem bývá právě jejich nesouměřitelnost, pramenící z odlišných mechanismů reportování. Ve výzkumu tak nastává nepříjemný moment, kdy zkoumáme neznámý fenomén měřítkem, o kterém nevíme, zda vůbec funguje a co vlastně měří. Libetovy experimenty Benjamin Libet v sérii svých dnes již klasických experimentů (Libet, 1985; Libet a spol., 1983) zkoumal vztah mezi rozhodnutím stisknout tlačítko a mozkovou aktivitou, snímanou metodou EEG 1. Zjistil, že moment volního rozhodnutí stisknout tlačítko, měřený pomocí Wundtových hodin, je v oblasti pre-sma stabilně předcházen specifickou komponentou EEG signálu, nazvanou Bereitschaftspotential (nebo také RP - Readiness Potential, potenciál připravenosti) a to o celých cca 400 ms. To vedlo k závěru, že naše jednání je v rozhodující míře determinováno nevědomě, na úrovni mozkových procesů a vědomí má přinejlepším roli regulační (veto), nikoliv však působnost kauzální (iniciační). Pozdější experimenty pomohly efekt RP dále objasnit například 1 Elektroencefalografie (EEG) - neinvazivní metoda měření aktivit mozku pomocí citlivých elektrod umístěných na skalpu subjektu. Změny napětí zachyceného na elektrodách odpovídají změnám v aktivitě mozkové tkáně nalézající se v okolí elektrody, pod lebeční kostí. 17

18 objevem lateralizovaného readiness potenciálu (LRP) (Haggard a Eimer, 1999). Objevily se také studie, které nalezly výsledky zcela odlišné (Trevena a Miller, 2010). V populárně vědeckých médiích a mezi méně kritickými badateli se však již začala šířit přehnaná naivněmaterialistická tvrzení o vědeckém důkazu neexistence svobodné vůle. Libetovy výsledky po své publikaci zdvihly vlnu diskuse v akademické obci, jež neutichla dodnes a zprostředkovala vznik experimentálního výzkumu svobodné vůle jako svébytné disciplíny. Kromě operacionalizace zkoumaného jevu a instrukcí použitých v experimentálním protokolu se stal předmětem kontroverze posléze i způsob, jakým Libet zjišťoval domnělý moment pocitu volního rozhodnutí v čase. Experimentální výzkum motorických intencí a jejich uvědomění pak zásadně přispěl k definování metodologické otázky po možnostech (a oprávněnosti) měření časového zařazení vědomých zkušeností. 1.2 Filosofické reflexe reportování vědomí Časováním vědomých prožitků (timing the awareness) je v této práci míněno časové určení daného vědomého prožitku (počátek, délka trvání), nebo určení časového vztahu mezi více prožitky (pořadí). Metodologie časování vědomých prožitků se tedy zabývá problémem smysluplné operacionalizace vnímání vědomých obsahů. Vědomé prožitky jsou v základním chápání (Baars, 2015) reportovatelné obsahy vědomí a zahrnují percepční stimuly, vnitřní řeč, aktuální proud vědomí, interoceptivní pocity (potěšení, bolest, vzrušení), enteroceptivní tělesné smysly (hmat, bolest), reportovatelné emoce, záměry, očekávání a volní akce vyžadující snahu a soustředění aj. Klasickým příkladem percepčního vědomého prožitku je binokulární rivalita, kde jsou do obou očí prezentovány vzájemně nekompatibilní stimuly, neslučitelné do jednoho obrazu. V daném okamžiku je vnímaný jen jediný ze dvou soupeřících stimulů. Filosofové si však všimli, že ne všechny obsahy vědomí, které vstupují do naší fenomenální zkušenosti, jsou přítomné i pro reportování (Block, 2007). Je však obecným kritériem mého vědomí to, zda dokáži o zkušenosti hovořit? Filosof Ned Block proto přichází s analytickým dělením vědomí na tzv. P-consciousness a A- consciousness. P-vědomí (phenomenal consciousness) je podle Blocka syrovým prožitkem. Je to fenomenální složka vědomí - zvuky, pohyb, barevné formy, emoce a pocity, vztažené vůči našemu tělu jako centrálnímu prvku. Tato proitková rovina qualií je prekonceptuální. A-vědomí (access consciousness) je naopak rovina intencionální, kdy jsou informace v naší mysli k dispozici (přístupné) pro verbální reporty, usuzování a řízení chování. Jestliže vnímáme, tak informace o tom co vnímáme je součást přístupového vědomí. A-vědomí má tedy charakter meta-vědomí, kdežto P-vědomí je vědomím prvního řádu. Klamy vědomí Ačkoliv z běžné lidské zkušenosti se zdá, že mezi světem našeho prožívání a světem tam venku panuje korespondence, při bližším ohledání se ukazuje, že každodenně procházíme situacemi, kdy naše vědomí prožívá něco jiného, než zachytí naše smysly. Tyto klamy vědomí jsou hlavním popudem, proč problematizovat otázku časování vědomých zkušeností. Shiunsuke Shimojo dobře popisuje tyto postdiktivní percepční problémy a jejich zvažnost pro výzkum svobodné vůle a prožitku jednání (Shimojo, 2014). Mezi tyto známé klamy vědomí patří color phi pohyb, flash lag efekt, problém zpětné reference a antedatování vědomých prožitků (backward referrall)(libet, 1981) a iluze hopkajícího králíčka (cutaneous rabbit illusion, iluze králíčka na pokožce). Při ní osoba zavře oči a je jí rychle poklepáno pětkrát na zápěstí, třikrát na loket a dvakrát po rameni. Toto je často pociťováno jako kdyby klepání postupovalo plynule a rovnoměrně po celé délce paže (Geldard a Sherrick, 1972). Iluzi je možno interpretovat tak, že naše percepce sensorických inputů vstupuje do vědomé zkušenosti (conscious awareness) až po ukončení integrace. Zdá se, že události se dějí v určitém časovém okně a senzorické události které se udály v určitém okamžiku mohou být zpětně ovlivněny budoucími událostmi. To také dokládají experimenty s TMS 2, kdy je vnímané časování uvědomění si záměru (awareness of intention) posunuto v čase, jestliže těsně po provedení akce aplikujeme krátkou TMS stimulaci (Lau a spol., 2007). Další klamy ukazují, jak snadno můžeme nevnímat něco, co vidíme (Simonsova neviditelná gorila), nebo naopak vnímat něco, co přítomno není (McGurkův efekt, různé percepční iluze). Filosof Daniel Dennett uvádí tyto případy jako problémy pro lidovou teorii karteziánského divadla a na podporu své Multiple Drafts Theory, která předpokládá, že náš mozek zpracovává paralelně celou varietu percepcí, myšlenek a mentální aktivity, a interpretace sensorických vstupů probíhá naráz na více kolejích. Informace vstupující do nervového systému jsou pod neustálým editorským dohledem, který vybírá z jednotlivých paralelně zpracovávaných percepcí a produkuje aktuální zakoušenou verzi vnímaného. Naše zkušenost je jakousi sítí slov a skutků a smysl sekvenčního pořadí událostí je produktem procházení touto sítí prožitků, představujících jednotlivé uzly (Dennett, 1991). Zdá se ale, že svůdná metafora karteziánského divadla, předpokládající jednu jedinou objektivní scénu, vnímanou naráz a v plném rozsahu, jakoby v kině, je široce zakořeněná v mnoha oblastech vědy o vědomí. V kontextu výše popsaných jevů přijímám se skepsí pokusy současné fenomenologie a neurofenomenologie o nalezení nejvhodnější nauky či sady technik vedoucích ke kvalitní a spolehlivé introspekci. Tito autoři (Froese a 2 TMS (transkraniální magnetická stimulace) je neinvazivní metoda selektivní stimulace povrchových oblastí mozku pomocí intenzivního magnetického pulzu, vyslaného skrze lebku. 18

19 spol., 2010, 2003) typicky usilují o vycvičení účastníků v určité formě pozornějšího nahlížení vlastních vědomých stavů a následně chtějí takto trénované subjekty využít pro reportování svých (proběhlých) obsahů vědomí. Praxe v meditačních technikách snad může pomoci ke kvalitnější introspekci, obávám se však, že sebelepší výcvik, kódovací systém či schéma nemůže vyřešit principiální nemožnost předpokládat, že jsou našemu přístupovému vědomí dostupné fenomenální prožitky proběhlé v minulosti. Je překvapivé, jak zažitý je implicitní předpoklad, že to možné je. Principiální nemožnost retrospektivních soudů je tak hlavní slabinou např. studie cílené na vyvrácení libetovského veta (Kühn a Brass, 2009), tak i její české rozšiřující replikace (Havlíček, 2012). Jazykem metafory můžeme problém nelinearity vědomé zkušenosti ilustrovat přirovnáním, že vědomí je jako pohyblivé písky - co je v jednom okamžiku vnímáno jako zřetelné, může ihned poté beze stopy zmizet pod hladinou, jakby tu toho ani nikdy nebylo. K tomuto tématu se vrátíme v kapitole Metodologie měření vědomí V předchozí části jsme se zabývali některými obecnými důvody, které činí reportování vědomých prožitků, či dokonce jejich měření a kvantifikaci, problematickým. Je patrné, že korespondence vědomých prožitků v naší mysli a fyzikálního světa venku je poměrně volná a ovlivněna mnoha faktory. Diskrepance můžeme pozorovat jak na základní úrovni (zda jsem danou zkušenost zaregistroval či ne), tak na úrovni povahy a identity vnímaného (vnímám dotyk na místě, kde k němu nedošlo) či času (vnímám věci v přehozeném pořadí, časově posunuté či se změněnou délkou trvání). Pokud se zaměříme na určování časového aspektu vědomé zkušenosti, a to zejména pokud nás zajímá přesné časové určení v řádek desítek milisekund, například z důvodu povahy našich experimentů, střetneme se s řadou problematických momentů. Je poněkud překvapivé, že i přes konrétní kritiku používaných metod bylo v této oblasti za posledních dvacet let uděláno jen velmi málo práce směrem k vyvinutí a zavedení nových metod, které by řešil známé nešvary popsané v předchozí podsekci. V literatuře tak bývá otázka metodologie měření vědomých stavů zhusta opomíjena, nebývá uchopena velmi nedostatečně. Je pozoruhodné, že problémy, na které bylo poukázáno již před více než 15 lety jsou v experimentální literatuře stále víceméně svorně ignorovány a jako best practice v oboru se používají nevyhovující metody. Spíše ojedinělé pokusy o ustanovení této metodologické otázky jak samostatného tématu můžeme pozorovat zejména v rozvíjející se vědě o vědomí (Science of Consciousness). Aktuálně je toto téma zkoumáno zejména v kontextu experimentálního zkoumání svobodné vůle, domnívám se však, že problémy a metodologická témata identifikovaná v této diskusi jsou zásadního charakteru a mají zásadní dopad na mnohem širší okruh disciplín. Jejich závěry se totiž týkají všech disciplín, které explicitně či implicitně zkoumají vědomé stavy, či mentální sféru. Bez přehánění můžeme říci, že se jedná o celou experimentální psychologii, behaviorální a kognitivní neurovědy. 2.1 Teoretické problémy reportování prožitků první osoby Je třeba poznamenat, že v tomto momentu se Libet a po něm celý program experimentálního výzkumu vůle pustili na extrémně tenký led problému bridging the gap mezi subjektivním a objektivním, ať to explicitně přiznávají nebo ne. Ačkoliv podle filosofa Davida Chalmerse je problém reportability mentálních stavů stále ještě snadným problémem 3 (Chalmers, 1995) vzhledem k současnému stavu poznání povahy vědomí se jedná o problém metodologicky uspokojivě neřešitelný. Ačkoliv existují filosofické koncepce usilující o monistické vysvětlení problému mysli a těla, v rámci současné běžné praxe ve vědě je vědomí považováno za přinejmenším epistemologicky odlišné od hmotného, objektivně poznatelného. Vzhledem k privátní povaze fenomenální stránky vědomí jsou prožitky již z definice nepřístupné mimo perspektivu první osoby. V současné době tedy není možné vědomou zkušenost přímo nijak objektivně, přístrojově měřit zvenčí, tedy z perspektivy třetí osoby, což je podmínkou vědeckého zkoumání. Každý pokus měřit moment vědomé reflexe prožitku je tedy problematický pro inherentní problém objektivizace toho, co je ze své povahy subjektivní. Experimentální výzkum vědomí se potom musí spolehnout na různé metody reportování mentálních stavů, některé lepší, jiné horší, všechny však teoreticky neuspokojivé. Úhelným kamenem této práce je problém, že to, co je ve vědomí, je podrobováno neustále změně a reverzním vlivům pozdějších percepčních (časový gestalt) a kognitivních procesů, jako je epizodická reprezentace prožitků, racionalizace do osobního narativu. Introspekce je proto značně nepřesný způsob, jak reflektovat a vypovídat o svýh vědomých stavech. Na druhou stranu ale vyvstává otázka, zda můžeme měřit fenomenální zkušenost bez toho, abychom se spoléhali na introspekci? Na základě objektivních metod je sice možné přesně testovat co bylo ve smyslech a mysli subjektu, ale nikoliv nutně ve vědomé zkušenosti. Takto získané údaje tedy nedokáží rozlišit mezi vědomým a nevědomým zpracováním. To, co nás při měření vědomí zajímá, je aktuální vědomý prožitek, ale ten nikdy nezachytíme (a možná, že vůbec neexistuje (Wegner, 2006)). 3 Easy problems, jakožto protiklad Hard problem otázce po příčině a mechanismu vědomé zkušenosti. 19

20 2.2 Subjektivní a objektivní metody měření uvědomění S problémem měření uvědomění se potýkají i vědci oblasti kognitivní psychologie a psychofyziky, centrované okolo problému prahu vědomého vnímání a podprahové percepce. V současné době probíhá intenzivní diskuse o povaze výstupů z tzv. objektivních a subjektivních metrik a výhodnosti jednotlivých jejich typů (Wierzchoń a spol., 2012). Objektivní metody Objektivní metody, vycházející z kvantitativní psychologie, jsou založeny na testování objektivní diskriminační schopnosti rozlišovat stimuly prostřednictvím úkolů typu forced choice, známé také jako úloha prvního typu. Při forced choice úlohách je subjekt nucen odpovídat na položenou otázku uzavřeného typu, s více možnostmi, a to ačkoliv vědomě nedokáže určit správnou odpověď. Příkladem může být úloha na nevědomé osvojování umělých gramatik a statistické učení. Ačkoliv subjekt tvrdí, že nemá potuchy, jaký symbol by měl následovat, vybere se signifikantní pravděpodobností ten správný symbol, odpovídající principu následnosti (gramatice), která byla dodržována u subliminálních stimulů promítaných v učící fázi. Pokud tedy použijeme subjektivní a objektivní měřítko najednou, detekujeme jasnou disociaci - osoba neví, že něco ví. Podobný efekt se projevuje např. i u některých klinických poruch jako je slepozrakost (blindsight) či jako následek neurochirurgického zákroku kalosotomie (split-brain). Objektivní schopnost rozeznávat správné symboly je měřena indexem citlivosti d ( dee-prime ), který vychází ze signal detection theory a je základním objektivním měřitkem vědomí. Veličina se vypočítává ze vztahu d = Z hr Z fa, kde Z hr (hit rate) je míra správného objektivního rozpoznání, tj. korektní detekce. Z hr (false alarm) naopak míra falešné pozitivity. Ukazatel tedy vyjadřuje 4 schopnost rozlišit signál od šumu a platí, že vyšší d značí vyšší objektivní schopnost diskriminace, tedy vyšší citlivost. Jedná se vlastně o stejnou míru citlivosti, pomocí které posuzujeme například diskriminační citlivost požárních hlásičů či screeningových testů na nemoci. Objektivní míry vědomí jsou založeny na předpokladu, že vědomost či nevědomost obsahu nutně vede ke kvalitativně odlišným manifestacím v chování. Pokud tedy přijmeme jako měřítko vědomí objektivní přístup, pak vědomí implicitně redukujeme na pouhou schopnost percepčního rozlišování ve světě, posuzovanou podle chování měřené osoby. Tím se sice řeší problém velké variability subjektivních měr vědomí, nastává ale otázka, zda to co po této operacionalizaci zbylo lze vůbec nazývat vědomím. Tento metodologický problém je pro metodologii 4 d nabývá hodnot od -1 do 1. d = 0 značí neschopnost jakékoliv diskriminace, tedy jde o hádání. d =1 je stoprocentní schopnost rozlišení, tedy jistotu. měření vědomí příznačným a zdá být neřešitelným. Subjektivní metody Subjektivní metody měření vědomí jdou za pouhou diskriminační schopnost a zohledňují částečně roli subjektivity. Subjektivní metody jsou založené na introspekci a metakognitivním zpracování a jsou označovány jako tzv. úlohy druhého typu. Typickými zástupci subjektivních metod jsou hodnocení spolehlivosti (confidence rating), sázení po rozhodnutí (post-decision wagering) (Persaud, 2009), pocit tepla (feeling of warmth), uvědomění si pravidel (rule awareness) a další (Wierzchoń a spol., 2012). Například metoda sázení po rozhodnutí obnáší vsazení buď malé, nebo větší sumy peněz na správnost probandova rozhodnutí (odpovědi), kterou právě učinil. Pokud je rozhodnutí správné, proband dostane zhodnocenu svou sázku. Naopak, pokud je rozhodnutí nesprávné, sázka propadne. Proto pokud si je osoba vědoma správnosti rozhodnutí, měla by vsázet větší sumy, ale především celkově získat více peněz, protože její vlastní míra jistoty lépe koresponduje s objektivní správností jejích odpovědí. Metakognice a uvědomění Poměrně moderní metodou měření citlivosti subjektivních metod je meta-d prime (d ). Metoda měří, jak dobře probandovo hodnocení spolehlivosti predikuje přesnost objektivního rozlišení stimulů (Maniscalco a Lau, 2012). Úskalím subjektivních metod je to, že jsou zranitelné vůči různým post-hoc vlivům, jako je například myšlení. Pokud je vnímaný obsah v rozporu s kognitivní procesy vnímajícího, může dojít k jeho potlačení či modifikaci. Tyto procesy zodpovídají za problém under- a over-reportingu, kdy vnímající reportuje jen část toho, co vnímá, nebo si naopak navrch něco dovymyslí. Ačkoliv subjektivní metody řeší část eliminitaivistického problému objektivních metod, stále spolehájí na verblní či behaviorální reportovatelnost a ignorují fenomenální stránku prožitku. Břemene eliminativismu se tedy zcela nezbavují. 2.3 Implicitní a explicitní míry Při měření vědomí je také třeba rozlišovat mezi implicitními a explicitními měřítky. V kontextu experimentálního výzkumu svobodné vůle je to možné ilustrovat na případu prožitku jednání (Sense of Agency, SoA) 5. SoA byla zkoumána množstvím explicitních a implicitních měřítek. Explicitní měřítka zahrnují hodnotící škály či dotazníky a jsou jasně vymezené, s jasně určenými stupni. Příkladem je hodnocení autorství nějaké pozorované akce 5 Sense of Agency (SoA) odkazuje k vnímané kauzální roli self na pozorovanou akci. Je to tedy prožitek zapřičinění něčeho. 20

21 na dané škále míry mého autorství. Libetova ciferníková metoda také patří mezi explicitní měřítka. Explicitní přístup ke měření je subjektivní (viz výše) a je postavený na předpokladu plauzibility retrospektivních reportů, tedy subjektivních soudů provedených více či méně po ukončení akce 6. Jak jsme však ukázali výše (1.2), tento předpoklad je vzhledem k experimentální evidenci značně problematický. Implicitní měřítka oproti tomu nespoléhají na ex-post provedený behaviorální report či verbální výpověď. Implicitní měřítka (IM) bývají založeny na měření nějaké objektivní (behaviorální, fyziologické) veličiny, o které je známo (nebo se tak alespoň domníváme), že dostatečně robustně koreluje s původním měřeným vědomým stavem. Implicitní měřítka používané pří měření SoA využívají efekt sensorického útlumu (sensory attenuation) 7 a časové (respektive intencionální) vazby (temporal binding, intentional binding) 8 - tedy vjemových odlišností mezi vlastními externě a vnitřně generovanými (předvídanými) stimuly. Současné studie ukazují, že přinejmenším některá implicitní a explicitní měřítka spolu nekorelují a tedy zasahují odlišné procesy na pozadí (Dewey a Knoblich, 2014). To je překvapivé (a nepříjemné) zjištění, protože klasicky se předpokládá, že např. implicitní měřítka intencionální vazby a sensorického utlumení jsou spolehlivě korelovány. Speciální kategorií implicitních měřítek je stop-tone paradigma (Matsuhashi a Hallett, 2008) (viz 3.2). Kritéria reportability Pokud ovšem připouštíme, že některé stavy vědomí jsou nejlépe (nebo výlučně) prokazatelné pomocí neverbální, behaviorální či dokonce fyziologické odpovědi, potom však nebezpečně otevíráme dveře případům agentů, kteří nejsou schopni lidské řeči a byli proto doposud z debaty o vědomí a svobodné vůli víceméně vynecháváni. Těžko se nám potom bude dokazovat že šimpanz vycvičený na úlohu v intencionální vazbě vlastně nemá pocit jednání. 6 Respektive po tom, co je daná kaskáda přípravných procesů spuštěna a náš interní model obdržel první zpětnou vazbu o efektech naší akce v prostředí. Nejpozději tehdy je kaskáda procesů a efektu interpretována jako jedna akce vedoucí k efektu. 7 efekt senorického útlumu (sensory attenuation), je efekt, kdy stimuly vnímané jako vyvolané naší akcí, mají nižší reportovanou intenzitu a naopak. Například zvuk, který nevnímáme jako způsobený naší intencionální akcí, je vnímán jako silnější, než zvuk, který jsme způsobili stiskem tlačítka. 8 intencionální vazba (intentional binding) je efekt podobný sensorickému útlumu. Efekty, vyvolané naší intencionální akcí, vnímáme, že následovali dříve po akci, nežli efekty, které vnímáme jako nesouvisející s naší předchozí akcí. Akce a pozorvaný efekt jsou tak vnímané jakoby přitažené k sobě v čase - svázané. 3 Časové určení vědomé zkušenosti a mentálních událostí Metodologický rozbor publikovaných výzkumných studií odkrývá dva hlavní přístupy ke měření časového určení vědomí. Rozlišujeme proto mezi post-hoc a online metodami měření. Zatímco post-hoc metody zkoumají vědomou zkušenost potom, co se odehrála, online metody se snaží ji ověřovat během toho, jak je prožívána. Protiřečící si výsledky předchozích výzkumů pramení také z toho, že dochází k interakci měřeného fenoménu a měřící metody. Vědci v oboru výzkumu svobodné vůle a uvědomění si intencí se zpravidla řadí do jednoho ze dvou směrů: zastánci prediktivní či integrativní koncepce se domnívají, že fenomenální prožitek chtění jednat (awareness of intention) nebo prožitek jednání existuje, rozvíjí se před, respektive spolu s neurální aktivitou zodpovědnou za přípravu akce a je jedním z faktorů, které k ní přispívají. Opačný tábor retrospektivistů naopak mluví o iluzi vůle, iluzi vědomí a magickém myšlení. Ti se domnívají, že naše jednání je v principu nevědomé a prožitek jednání je vytvořen nevědomými mechanismy naší mysli až když je znám výsledek akce ve světě. Americký psycholog Daniel Wegner předpokládá (Wegner, 2006), že si retrospektivně vytváříme prožitek jednání a vlastního kauzálního zapřičinění pozorovaných efektů ve světě. Podobně jako se efekt hopkajícího králíčka dostaví až po dokonení série poklepání, pocity jsou ale časově prožívané, jako kdyby se odehrály dříve. Retrospektivní konstrukce pocitu jednání umožňuje naší mysli udržovat konzistentní narativ o naší osobě a našich akcích. Retrospektivisté se staví odmítavě k roli fenomenálního pocitu jednání (Feeling of Agency, FoA) jakožto prvku spouštějícího sebe-přisuzování prožitku jednání (SoA), jsou ostatně skeptičtí vůbec k existenci frenomenálního prožitku FoA. 3.1 Post-hoc metody Post-hoc metody, založené na retrospektivním soudu, jsou klasickým přístupem jak ve vědě o vědomí, tak obecně v experimentálním výzkumu svobodné vůle. Posthoc metodám je společné to, že soud o záměru jednat je činěn retrospektivně, až poté, co byla akce provedena. Tento přístup byl podroben rozsáhlé kritice, zejména jedna z jeho nejméně vhodných implementací, které se paradoxně drží na vrcholu používanosti - Wundtovy hodiny. Ta je v této oblasti metodou první volby, již od dob Libetových experimentů. Post-hoc paradigmata patří stále mezi nerozšířenější, využily je všechny významné studie posledních let i let vzdálenějších (Haggard a Eimer, 1999; Soon a spol., 2008; Herrmann a spol., 2008; Trevena a Miller, 2010; Fried a spol., 2011; Jo a spol., 2014) aj.. Běžné formy jsou ciferníkové paradigma a proud samohlásek. Vzhledem ke své retrospektivní povaze post-hoc metody měří pouze tu složku SoA, která je výsledkem soudu, tedy konceptuální Judgent of Agency 21

22 (JoA) dle dichotomie Mattise Synofzika a Gottfrida Vosgerau (Synofzik a spol., 2008, 2013). Nedokáží nám však říci nic o prekonceptuálním pocitu jednání (Feeling of Agency, FoA), který (pokud spolu s retrospektivisty neodmítneme jeho existenci) se odehrává bezprostředně během přípravy a vykonávání akce. Libetova metoda časování vědomého prožitku záměru Pro určení okamžiku uvědomění si záměru jednat (awareness of intention to move) použil Benjamin Libet ciferníkového paradigmatu s Wundtovými hodinami. V něm participant sleduje černý puntík, obíhající dokola kruhového ciferníku rozděleného na 60 dílků. Jeden oběh dokola trvá 2560 ms. Přestože bylo toto paradigma podrobeno rozsáhlé kritice, zůstává stále jakýmsi zlatým standardem v disciplíně a stále vycházejí studie postavené na ciferníkové metodě reportování, například (Trevena a Miller, 2010; Fried a spol., 2011; Jo a spol., 2014). Obr. 1: Ukázka ciferníkového paradigmatu s obíhajícím černým puntíkem, používaných v Libetových experimentech. Typicky je participantovým úkolem nechat puntík alespoň jednou oběhnout dokola a potom v libovolný okamžik, bez jakéhokoliv plánování a dle svého vlastního svobodného rozhodnutí, stiknout klávesu. Při tom si ovšem má zapamatovat polohu puntíku na ciferníku v okamžik, kdy se rozhodl pro akci. Po stisku tlačítka se puntík po čase zastaví a následuje finální částí úkolu - účastník má na zastaveném ciferníku určit pozici puntíku v okamžik, kdy se svobodně rozhodl pro provedení pohybu. Takto se z polohy puntíku zpětně dopočítá moment uvědomění si záměru jednat, tedy časový okamžik fenomenálního prožitku rozhodnutí provést odpovídající motorickou akci. Převzato z (Libet a spol., 1983) Kritika ciferníkového paradigmatu Kritika Libetova designu si vesměs všímá toho, že reportování času akce po provedení motorického aktu (retrospektivní konstrukce prožitku) činí report zranitelným několika typy distorzí. Například je poukazováno na problém retrospektivního přepisu prožitků, jak jej známe například z problému zpětné reference (backward referral) (Libet, 1981), nebo z iluze hopkajícího králíčka. Mezi další problémy patří nebezpečí, že probandi budou cíleně či podvědomě sklouzávat k používání různých usnadňujících strategií 9, možné percepční předvídání 10, přesun pozornosti 11, prior entry bias 12 a rozdíl v modalitněspecifickém zpracování. Každý z těchto jevů může být zodpovědný až za 100 ms časového zkreslení.většina z těchto potíží je platných obecně pro všechny post-hoc metody. Naopak výhodou ciferníkového paradigmatu je snadná implementace a relativně snadné vyhodnocení časového momentu z dat, poměrně vysoká rozlišovací přesnost a v neposlední řadě také srovnatelnost výsledků s ostatními studiemi, jelikož je metoda natolik standardizovaná a zaužívaná. Metoda proudu souhlásek Později se objevily se různé další post-hoc metody, řešící alespoň část těchto problémů. Mezi ně patří například metoda proudu písmen, použitá ve slavné fmri studii s predikcí rozhodnutí až 8 sekund před vědomým okamžikem rozhodnutí (Soon a spol., 2008). Tato retrospektivní metoda je vhodná pouze pro některé typy úloh, u kterých není třeba větší časové rozlišení (typicky fmri úlohy). Použití písmen snižuje temporální rozlišení metody ze dvou důvodů: jednak trvá zpracování písmen delší dobu 13 a dále je k dispozici pouze omezený počet možností odpovědí, daný počtem souhlásek v abecedě 14. Metoda proudu souhlásek je určitým posunem oproti ciferníkové metodě, a je řešením přinejmenším pro experimenty, které oželí časovou přesnost. Zmíněné nevýhody jsou vyváženy tím, že oproti Wundtovým hodinám zabraňuje problému nevědomých strategií a řeší také problém percepční predikce, protože posloupnost písmen lze sestavit tak, že není predikovatelná. Jedná se ale stále o vizuální metodu, takže ze své povahy vyžaduje delší zpracování. 9 Například načasování pohybu na okamžik, kdy puntík dorazí na určitou konkrtní pozici a ciferníku, což mění podstatu úlohy a zanáší do dat výraznou distorzi. 10 Které patrně stojí za iluzí flash-lag, kdy se předpokládá, že zrakový kortex dokáže předvídat rovnoměrné pohyby, aby kompenzoval zpomalení. 11 Nelze předpokládat, že subjekt může doopravdy plnohodnotně věnovat pozornost sledování ciferníku a současně věnovat odpovídající pozornost provedení volní akce. 12 Efekt, kdy účastnící hodnotí stimul v pozornosti (attended) jako dřívější, než stimul promítnutý ve stejný okamžik, ale mimo pozornost. 13 Což omezuje přesnost této metody pouze na časové intervaly větší než cca 100 ms. 14 Při rychlém střídání písmen by tak na odpovídací obrazovce musela být plná nabídka všech těchto písmen a navíc by nebylo možné odpoveď jednoznačně časově interpretovat. Abeceda by se totiž před zraky účastníka prostřidala natolik rychle, že by nebylo jasné, ke kterému z průběhů se reportované písmeno vztahuje. 22

23 Obr. 2: Obrázek ilustruje metodu proudu souhlásek, použitou v (Soon a spol., 2008). Proband sleduje proud písmen střídajících se na obrazovce rychlostí 500 ms na znak. Podobně jako v libetovských studiích je jeho úkolem stisknout libovolnou ze dvou kláves dle svého svobodného rozhodnutí a zapamatovat si písmeno, které bylo zrovna na obrazovce, když se rozhodl pro stisk klávesy. Poté následuje reportovací fáze, kde na obrazovce se 4 možnostmi proband zvolí to písmeno, které viděl. Jedná se tedy o soud o okamžiku počátku intence. Převzato z (Soon a spol., 2008). 3.2 Online metody měření Online metody měření programově odmítají retrospektivní reporting post-hoc metod, závislý na zpětně prováděných soudech o svých předchozích prožitcích. Zavržení metod přímého (verbálního) reportování ale vede k nutnosti hledat jiné cesty ptaní se po zakoušeném, nežli verbální či konceptuální cestou. Online metody proto spoléhají na nepřímé indikování prožívaného. Použití této metody na výzkum intence druhotně přineslo významné poznání struktury a dynamiky uvědomění. Přesto (respektive právě proto, není, jak se ukazuje, ani tato metoda metodologicky bezchybná. Zejména pro to, že není zaručené, že takto pořízené reporty korespondují s fenomenální zkušeností a nebyly vyhodnoceny pouze nějakým předvědomým kognitivním mechanismem. Tím, že online metody využívají nepřímé měření, založené na vyhodnocení behaviorální odezvy probanda, tak ani tento přístup neopouští redukcionistickou pozici. Pozoruhodné je však to, že tato metoda přispívá k reformulaci konceptu vědomí, který se pod tíží empirických poznatků ukazuje jako ve stávající podobě neudržitelný. Stop signal paradigma (auditory-veto) Snad doposud jediným příkladem online metod měření vědomí je stop-signal paradigma (Matsuhashi a Hallett, 2008). Matsuhashi s Halletem reagují na kritiku Libetova designu za jeho spoléhání se na autoreportovaný čas a na subjektivní paměť. Využívají participantových rozhodnutí v reálném čase v úloze na auditorní veto signály (auditory cued veto). Ve stop-signal paradigmatu Obr. 3: Rozložení tónů u vybraného subjektu. Pruhy reprezentují histogram rozložení tónů, relativní vůči začátku pohybu. Vertikální osa značí počet tónů za sekundu. Tlustá plná a přerušovaná čára značí odhad okamžiku T (uvědomění si intence jednat) a P (hraniční bod, po kterém již není možné volní storno). Odhady jsou vyznačeny svislými tečkovanými čarami a časy. Tatto oblast, kde pruhy ustupují, odpovídá časovému oknu, během kterého si je subjekt vědom své intence ale ještě ji dokáže stornovat. Převzato z (Matsuhashi a Hallett, 2008). jsou během úlohy aplikovány nepravidlené tóny. Namísto používání post-hoc vybavování se subjekt rozhoduje v reálném čase, zda připravoval pohyb v okamžik, kdy se ozval tón, Pokud ano, subjekt jednoduše zruší plánovaný pohyb a nestiskne žádnou klávesu. Mezi nesporné výhody této metody patří znemožnění vědomých ulehčujících strategií, nepřítomnost percepční predikce, lepší přesnost díky sluchovému zpracování. Metoda také patrně nevyžaduje Dennetem kritizovaný přesun pozornosti a nespoléhá na paměť. Problémy auditory-veto signálu Ani tento přístup však není prost nedostatků. Autoři si všímají, že jejich výsledky v podobě zjištěných časů prožívaného záměru, jsou značně odlišné od předchozích výzkumů. Viníkem by mohl být jev podobný attentional blink a refraktorní periodě pozornosti (attentional refractory period), kdy se po zaznění tónu sníží celková pozornost. 4 Vědomí jako kvalita, nebo stupeň? Nejvýznamnější je ale zjištění, že zde není jistota, že je úkol s aditory-veto signály zpracováván vědomě a že intence byla skutečně přítomna ve vědomí v okamžik zrušení plánované akce. Jak bylo ukázáno na začátku článku (1.2), je užitečné rozeznávat různé úrovně vědomí. Podle autorů samých jejich výsledky naznačují, že vnímání záměru roste skrze několik úrovní uvědomění, a rodí se ihned jak mozek iniciuje přípravu pohybu. Tato evidence tedy naznačuje, že můžeme hovořit o stupních vědomí (graded consciousness). W zjištené v Libetových experimentech je vlastně metauvědomění vědomého prožitku záměru, tedy reflektivní uchopení a zpracování prvotního fenomenálního prožitku a jeho vyzvednutí pozorností. Auditory veto zase měří uvědomění-při-otestování (probe-caught awareness), tedy stav, kdy se uvědomění 23

24 dostaví při otestování - např. signálem k vetování. Tím se měření vědomí poněkud podobá problému měření v kvantové fyzice. 5 Diskuse V tomto článku jsem se pokusil popsat, proč je pro další postup ve vědě o vědomí třeba otevřít téma chronometrických metod měření. Při hledání nejvhodnější metody reportování vědomých prožitků je třeba nalézt řešení celé řady problémů. Hlavní metodologická námitka vůči aktuálnímu psychologickému výzkumu spočívá v tom, že většina studií zkoumajících vědomí předpokládá dokonalý přístup k minulým zkušenostem. Je tedy založeno na předpokladu, který je již prokázán jako chybný. Na navržení uspokojivé objektivní, jednoznačné metody na časové zařazení subjektivní zkušenosti si musíme teprve počkat. Je však dosti dobře možné, že navržení takové nové metody jde nezbytně v ruce s postupem našeho poznání o struktuře vědomí. Online metody se zdají být vhodnější pro měření prekonceptuální syrové zkušenosti tedy fenoménů, jako je Awareness of Intention nebo Feeling of Agency. Post-hoc metody jsou naopak vhodné pro měření retrospektivních a konceptuálních soudů o jednání v SoA. Měření vědomí se nalézá v začarovaném kruhu: přímé (verbální) reportování o svých prožitcích je možné pouze post-hoc, jedná se tedy o soud. Online měření je naopak možné pouze nepřímé a zprostředkované, ale má reduktivní povahu a není nezbytně vědomé. Jak je patrné z experimentálních studií, poměrně široká varieta výsledků významně závisí na použitém paradigmatu a dalších vlivech, jelikož odlišná paradigmata patrně testují odlišné aspekty fenoménu. Širší uvědomění a reflexe tohoto problému ve vědecké obci nás však patrně teprve čeká. Tato publikace vznikla v rámci projektu Národní ústav duševního zdraví (NUDZ), registrační číslo CZ.1.05/2.1.00/ , financovaného z Evropského fondu pro regionální rozvoj. Literatura Baars, B. J. (2015). Consciousness. V Scholarpedia. Block, N. (2007). Consciousness, accessibility, and the mesh between psychology and neuroscience. The Behavioral and Brain Sciences, 30(5-6):481 99; discussion Chalmers, D. J. (1995). Facing Up to the Problem of Consciousness. Journal of Consciousness Studies, 2(3): Dennett, D. C. (1991). Consciousness explained. Little, Brown and Co. Dewey, J. a. a Knoblich, G. (2014). Do Implicit and Explicit Measures of the Sense of Agency Measure the Same Thing? PloS one, 9(10):e Fried, I., Mukamel, R. a Kreiman, G. (2011). Internally generated preactivation of single neurons in human medial frontal cortex predicts volition. Neuron, 69(3): Froese, T., Gould, C. a Barrett, A. (2003). re-viewing from Within A commentary on First- and second-person methods in the science of consciousness. Constructivist foundations, 6(2): Froese, T., Gould, C. a Seth, A. K. (2010). Validating and Calibrating First- and Second-person Methods in the Science of Consciousness. Journal of cons, 18(2): Geldard, F. A. a Sherrick, C. E. (1972). The cutaneous"rabbit": a perceptual illusion. Science, 178(4057): Haggard, P. a Eimer, M. (1999). On the relation between brain potentials and the awareness of voluntary movements. Experimental Brain Research, 126(1): Havlíček, O. (2012). Svoboda vůle a přístup k informacím o vlastních intencích. Diplomová práce, Vysoká škola ekonomická v Praze. Herrmann, C. S., Pauen, M., Min, B.-K., Busch, N. A. a Rieger, J. W. (2008). Analysis of a choice-reaction task yields a new interpretation of Libet s experiments. International Journal of Psychophysiology, 67(2): Jo, H.-G., Wittmann, M., Hinterberger, T. a Schmidt, S. (2014). The readiness potential reflects intentional binding. Frontiers in Human Neuroscience, 8(June):1 9. Kühn, S. a Brass, M. (2009). Retrospective construction of the judgement of free choice. Consciousness and cognition, 18(1): Lau, H. C., Rogers, R. D. a Passingham, R. E. (2007). Manipulating the experienced onset of intention after action execution. Journal of Cognitive Neuroscience, 19(1): Libet, B. (1981). The Experimental Evidence for Subjective Referral of a Sensory Experience Backwards in Time: Reply to P. S. Churchland. Philosophy of Science, 48(2): Libet, B. (1985). Unconscious cerebral initiative and the role of conscious will in voluntary action. Behavioral and Brain Sciences, 8(04):529. Libet, B., Gleason, C. A., Wright, E. W. a Pearl, D. K. (1983). Time of conscious intention to act in relation to onset of cerebral activity (readiness-potential). The unconscious initiation of a freely voluntary act. Brain, 106(3): Maniscalco, B. a Lau, H. (2012). A signal detection theoretic approach for estimating metacognitive sensitivity from confidence ratings. Consciousness and Cognition, 21(1): Matsuhashi, M. a Hallett, M. (2008). The timing of the conscious intention to move. European Journal of Neuroscience, 28(11): Persaud, N. (2009). Post-decision wagering. Scholarpedia, 4(1):7428. Shimojo, S. (2014). Postdiction: Its implications on visual awareness, hindsight, and sense of agency. Frontiers in Psychology, 5(MAR):1 19. Soon, C. S., Brass, M., Heinze, H.-J. a Haynes, J.-D. (2008). Unconscious determinants of free decisions in the human brain. Nature Neuroscience, 11(5): Synofzik, M., Vosgerau, G. a Newen, A. (2008). Beyond the comparator model: a multifactorial two-step account of agency. Consciousness and cognition, 17(1):

25 Synofzik, M., Vosgerau, G. a Voss, M. (2013). The experience of agency: an interplay between prediction and postdiction. Frontiers in Psychology, 4(March):1 8. Trevena, J. a Miller, J. (2010). Brain preparation before a voluntary action: evidence against unconscious movement initiation. Consciousness and cognition, 19(1): Wegner, D. M. (2006). Self is Magic. Baer, J., Kaufmann, J. a Baumeister, R. F. (zost.), V Psychology and Free Will. Oxford University Press, New York. Wierzchoń, M., Asanowicz, D., Paulewicz, B. a Cleeremans, A. (2012). Subjective measures of consciousness in artificial grammar learning task. Consciousness and cognition, 21(3):

26 Kognícia a umelý život 2015, Trenčianske Teplice Roboty s hlavou v oblakoch Ivana Budinská Ústav informatiky SAV Dúbravská cesta 9, Bratislava [email protected] Abstrakt Robotika v súčasnosti prechádza veľkým vývojom v súvislosti s rozvojom informatiky a informačných technológií. Medzi technológie, na ktoré sa v poslednom čase obracia pozornosť veľkej časti robotickej komunity, patrí klaudové počítanie. Tento článok je zameraný na objasnenie vzťahov robotiky a najnovších trendov v informačných technológiách a na predstavenie aktuálnych projektov a nových trendov v oblasti klaudovej robotiky. V závere sa článok venuje niektorým výzvam ale aj problémom, ktoré so sebou rozvoj klaudovej robotiky prináša. 1 Úvod Vývoj robotiky smeruje v závislosti od aplikácií od priemyselných robotov, cez mobilné, viacúčelové roboty až po roboty poskytujúce služby v rôznych oblastiach civilného ale aj vojenského využitia. Ovplyvňujú ho mnohé vedné odbory a rozvoj technológií. Predovšetkým ide o rozvoj senzorov a senzorických zariadení, ktoré vplývajú na stupeň autonómnosti robotov. Ďalším významným faktorom, je rozvoj informačných technológií, a to tak hardvéru ako aj softvéru. Dochádza k zvyšovaniu výpočtovej výkonnosti so súčasným zmenšovaním výpočtových zariadení a znižovaním ich spotreby energie. To umožňuje prenášať čoraz väčší výpočtový výkon priamo na robotické platformy. Na druhej strane existujúce robotické platformy riešia stále náročnejšie úlohy. Zvyšovanie náročnosti úloh znamená zvyšovanie nárokov na výpočtový výkon. To súvisí aj s nárastom autonómnosti robotických zariadení. V počiatkoch sa robotmi nazývali zariadenia, ktoré plnili presne definované úlohy viazané na určité vymedzené prostredie s minimálnymi nárokmi na vnímanie prostredia a na autonómnosť robotickej platformy. Postupne sa stupeň autonómie a inteligencie robotov zvyšoval, až dosiahol stav, že dnešné špičkové roboty dokážu autonómne konať aj v prirodzenom prostredí. Nadpis podľa Guizzo E. (2011) Robots with their heads in the clouds, In Spectrum, IEEE, vol. 48, no. 3, pp Príkladom takýchto robotov môžu byť autonómne mobilné roboty - autá, ktoré sa dokážu pohybovať bez šoféra v prirodzenom dopravnom prostredí - na cestách. Najnovším trendom v rozvoji robotiky je zvyšovanie schopností a aplikačných možností robotických zariadení v súlade s rozvojom paradigiem ako sú Internet of Things (IoT) a Big Data. Veľký význam pre robotiku má aj nový trend v oblasti informačných technológií - klaudové počítanie (z angl. cloud computing). 2 Vývoj klaudovej robotiky Pojem "cloud robotics" sa spája s menom Jamesa Kuffnera, profesora Robotického inštitútu Carnegie Mellon univerzity a manažéra spoločnosti Google. James Kuffner v roku 2010 použil tento výraz na objasnenie fungovania sieťovo prepojených robotov, ktoré dokážu využívať distribuované výpočty a dáta uložené v klaude. Základy však boli položené oveľa dávnejšie. Už v roku 1994 bol k webu pripojený priemyselný počítač. Intuitívne grafické rozhranie umožnilo riadiť robota na diaľku. Vzdialené riadenie robotov - "tele-operated robots" a zosieťované roboty, boli ďalším krokom smerom ku klaudovej robotike. Chella a spol. v publikácii z roku 2011 predstavili robotický systém, ktorého sebauvedomenie je inšpirované kognitívnymi schopnosťami ľudí. Keďže však komplexné kognitívne schopnosti vyžadujú vysoký výpočtový výkon, bez využitia klaudového počítanie nie je možný ďalší rozvoj robotiky týmto smerom. V roku 2012 General Electrics uviedlo pojem priemyselného internetu - "Industrial Internet". Tento koncept predpokladá pripojenie inteligentných zariadení, medzi ktoré patria aj robotické zariadenia, do internetu. Kehoe a kol. (2015) vo svojom prehľadovom článku uverejnenom v IEEE Transactions on Automation Science and Engineering, poskytuje pohľad na históriu, súčasnosť a perspektívy klaudovej robotiky. Súvislosti medzi inteligentnou robotikou a klaudovým počítaním predstavuje Rudas v publikácii z roku Zo slovenských autorov sa problematike klaudového počítania a klaudovej robotiky venujú výskumníci zo skupiny P. Sinčáka. Ich publikácie (Lorencik, Sincak, 2013), Lorencik a spol., 2014) 26

27 hovoria o vplyve klaudového počítania na robotiku. Cádrik a kol. (2015) predstavuje konkrétne aktivity - klaudovú architektúru pre multi-robotické systémy. 3 Inteligentná robotika a informačné technológie Klaudová robotika je závislá na rozvoji ďalších oblastí informačných technológií. Najdôležitejšie z nich sú Internet of Things a Cloud computing. 3.1 Internet vecí Internet vecí - z. ang. Internet of Things - IoT - je postavený na technológiách umožňujúcich (a) prepájanie objektov, (b) ich vzdialené monitorovanie, sledovanie a (c) riadenie. Objetky sú vybavené jedinečným identifikátorom. Medzi najpoužívanejšie technológie patrí technológia RFID. V súčasnosti sa IoT vzťahuje na nový spôsob prepájania inteligentných zariadení do siete s cieľom vytvoriť priestor pre spoločné dátové úložiská, zdieľanie znalostí a vzdialené riadenie inteligentných zariadení. Vízia paradigmy IoT dokonca hovorí o prepájaní objektov v najširšom zmysle - zariadenia, zvieratá, ľudia. Všetky tieto objekty budú vybavené jedinečným identifikátorom na základe ktorého budú prepojené v sieti bez nutnosti človekom podporovanej, resp. riadenej komunikácie. Takéto zosieťovanie objektov umožňuje prenos veľkého množstva dát. Ich ukladanie a spracovanie je podporované rozvojom klaudového počítania a rozvojom metód na spracovanie veľkých dát. Vo všeobecnosti hovoríme o metódach súvisiacich s paradigmou BigData. Robotické platformy predstavujú inteligentné zariadenia, ktoré sú nositeľmi čoraz väčšieho počtu senzorických systémov. Preto sa stávajú ďalším zdrojom veľkého množstva dát. Mobilné roboty sa môžu prepájať do skupín a vytvárať mobilné senzorické siete. Takéto siete sa dostanú na miesta, kde sa nachádzajú dáta. Obmedzený zdroj energie a výpočtová kapacita však neumožňujú spracovanie veľkého množstva dát priamo na robotickej platforme. Preto takéto systémy môžu profitovať z prístupnosti vzdialených a distribuovaných dátových úložísk, kde budú dáta nie len uložené, ale môžu byť následne efektívne spracované. Relevantné výsledky spracovaných senzorických dát sa prostredníctvom siete dostanú naspäť na mobilné roboty, ktoré ich ďalej využijú pri plnení svojej misie. 3.2 Klaudové počítanie Klaudové počítanie (z ang. Cloud Computing) má základ v technológiách distribuovaného a gridového počítania. Tento pojem sa zaužíval začiatkom tohto storočia (roky 2000) a v súčasnosti sa vzťahuje na metódy a techniky efektívneho zdieľania zdrojov prostredníctvom siete. Podľa definície NIST (Mell a Grance, 2011) sa za zdroj považuje nie len výpočtová infraštruktúra, ale aj softvérové prostriedky, úložiská dát a samotné dáta, ako aj služby, ktoré sú prostredníctvom siete poskytované používateľom. Charakteristické pre klaudové počítanie je dynamické prideľovanie zdrojov podľa požiadaviek klienta. Rozvoj klaudového počítania bol masívne podporovaný predovšetkým komerčnými poskytovateľmi služieb. Títo sprístupnili výkonné výpočtové prostriedky pre širokú komunitu používateľov podľa ich aktuálnych potrieb. Takýto prístup je pre používateľov ekonomicky výhodný (pay-as-you-go model). Používatelia nevynakladajú prostriedky na obstaranie výpočtových prostriedkov, ktoré využívajú len sporadicky. Stále aktuálna otázka je bezpečnosť a dôveryhodnosť výpočtového prostredia, zabezpečenie dát a pod. Tieto otázky sú aktuáne predmetom výskumu v popredných výskumných centrách. V roku 2008 bola predstavená platforma OpenNebula, ktorá vznikla s podporou Európskej komisie ako voľne šíriteľný, open-source program. OpenNebula bola prvou platformou, ktorá umožnila správu distribuovanej heterogénnej infraštruktúry pre dátové centrá. OpenNebula využíva virtualizáciu infraštruktúry dátových centier na vytvorenie súkromnej, verejnej a hybridnej implementácie infraštruktúry ako služby poskytovanej zákazníkom podľa požiadaviek. V klaudovom počítaní sa aj softvér implementuje ako služba. V robotickej komunite sa v súvislosti s týmito trendami začal používať pojem "robot ako služba". 4 Aktuálne projekty v oblasti klaudovej robotiky Projekt RoboEarth (Weibel a spol., 2011) priniesol významný pokrok smerom k vízii vytvoriť "A World Wide Web" pre robotické platformy. Cieľom projektu bolo navrhnúť veľkú sieť a dátové úložisko, prostredníctvom ktorých budú môcť roboty zdieľať informácie a učiť sa jeden od druhého - t.j. získavať informácie o prostredí a predávať si vzorce správania sa. Projekt bol podporený Európskou komisiou. Výslekdy projektu boli využité na vytvorenie opensource rámca pre klaudovú robotiku - Rapyuta (Mohanarajah a spol., 2014). V rámci tohto projektu boli vyvinuté architektúry pre roboty ako služby, boli vyvinuté výpočtové prostriedky na tvorbu 3D modelov prostredia, rozpoznávanie reči a rozpoznávanie tvárí. Kolaboratívne 3D mapovanie prostredia popisuje Mohanajarah a kol. (2014b). Koji Kamei predstavil projekt UNR-PF - Ubiquitos Network Robot Platform, ktorý predstavuje rámec pre distribuovanú koordináciu a riadenie robotických systémov. Aplikáciu znalostne podporovanej klaudovej robotiky s využitím rámca UNR-PF popisuje Tenorth a kol. (2013). V práci využíva klaud ako médium pre 27

28 vytvorenie siete medzi robotmi, senzormi a mobilnými zariadeniami. Implementáciu platformy ROS (Robotic Operating System) v klaude na externú komunikáciu medzi robotmi využíva open-source projekt ROSBRIDGE. ROS je všeobecne používaný komponentový model pre programovanie robotických aplikácií. Táto platforma (ROS) je využitá aj v projekte DaVinci ako rámec pre posielanie správ na Hadoop klaster, kde sa uskutočňuje 2D lokalizácia a mapovanie. Posielanie správ v ROS je asynchrónne s využitím mechanizmu publikuj/podpíš. Databáza využívaná v rámci tohto projektu nie je špecifická pre robotické zariadenia. Projekt nie je verejne dostupný. Komponentový meta model - Rapyutha má za cieľ umožniť presúvanie výpočtovo náročných operácií z robota do klaudu. Na zabezpečenie štandardizovanej a bezpečnej komunikácie využíva platformu ROS a komunikačný protokol WebSocket. Luca Gherardi a kol (2014) popisuje proces konfigurácie klaudovej platformy pre robotické aplikácie. Uvádza aj niekoľko príkladov - Robot soccer, Maze, Kuka robot. Projekt Google Googles síce nie je primárne určený pre robotické aplikácie, dá sa však využiť na získavanie informácií o objektoch, ktorých obrázok bol zosnímaný robotickým systémom videnia. Zosnímaný obrázok porovnáva s obrázkami v svojej databáze. V prípade, že ho dokáže nájsť a vyhodnotiť podobnosť, poskytne systém dostupné relevantné informácie. Google Googles bol vyvinutý pre používateľov smartfónov a okrem vyhľadávanie obrázkov umožňuje čítať čiarové a QR kódy, skenovať OCR, prekladať texty, rozpoznávať obrazy, knihy, DVD, CD, nachádzať podobné produkty a riešiť SUDOKU. Dva ďalšie príklady možného a perspektívneho využitia popisuje Ermacova a kol. Prvý príklad je využitie klaudovej architektúry pre riadenie záchranárskych operácií s využitím skupiny drónov. Druhý príklad je monitorovanie mesta, ktoré je vybavené inteligentnými snímačmi a prostriedkami (Smart City). 5 Úloha ontológií v inteligentnej robotike Integrácia znalostí a efektívna komunikácia medzi robotmi predpokladá existenciu spoločného pochopenia sveta, jeho entít a vzťahov medzi nimi. Zjednodušene povedané, široké nasadenie robotov využívajúcich klaud si vyžaduje štandardizáciu, ktorá by mala vychádzať zo všeobecne akceptovanej ontológie. Už v roku 2002 navrhol Chella a kol. model ontológie pre robotické systémy. Organizácia IEEE vytvorila pracovnú skupinu s názvom Ontológie pre robotiku a automatizáciu (z angl. Ontology for Robotics and Automation Working Group - ORAWG), ktorá spolu s Medzinárodnou federáciou robotiky (z angl. International Federation of Robotics - IFR) zadefinovali základné ciele pre vývoj ontológie pre robotiku. Sústreďujú sa na (a) popis a všeobecné pochopenie robotických systémov, (b) popis ich štruktúry a schopností, (c) popis komunikácie medzi robotmi s rôznymi schopnosťami a úlohami, (d) popis komunikácie medzi robotom a človekom, (d) reprezentáciu znalostí, ktoré sú získavané robotmi cez ich senzorické systémy. Okrem toho sú ontológie potrebné na rovnaké interpretovanie konceptov z rôznych aplikačných domén. Existuje niekoľko skupín, ktoré sa venujú vývoju ontológií pre robotické systémy a ich aplikácie. Napríklad aktivity pod názvom ORO (z ang. an Open Robot Ontology) a KnowRob. Tieto ontológie extrahujú informácie zo známych vyšších ontológií ako sú SUMO a OpenCyc a vytvárajú špecifikú ontológiu pre robotiku. Obidve ontológie pracujú s robotickým systémom ROS. KnowRob je zameraný na posudzovanie obrázkov, ktoré boli získané pomocou robotického systému videnia (robot vision system) a využíva usudzovacie systémy ako PROLOG a WEKA. Pre multiagentové systémy pozostávajúce z mobilných a inteligentných robotických jednotiek bol vyvinutý systém SCENS. Jeho súčasťou je jazyk KnowLang, ktorý slúži na špecifikáciu prostredia v rôznych doménach. Úlohu ontológie v robotike a automatizácii popisuje Haidegger a kol. (2013). Prestes a kol. (2013) popisuje jadro ontológie pre robotiku. Unifikovaný popis znalostí pre vnútorné prostredia, ktorý je založený na ontológii, je popísaný v publikácii (Gi Hyun Lim a spol., 2011). 6 Inteligentný swarm pre úlohy prehľadávania a monitorovania Na ÚI SAV vyvíjame inteligentný multi robotický swarm pre prehľadávanie a monitorovanie rozsiahlych území. Systém je navrhnutý ako multi-agentový systém, pričom jednotlivé agenty sú autonómne. Ich koordinácia je založená na zdieľaní virtuálnej mapy prostredia a na virtuálnych feromónových značkách. Je navrhnutý tak, aby bol nezávislý na robotickej platforme. Vyznačuje sa flexibilitou, robustnosťou (dokáže pracovať aj v prípade poruchy jedného resp. viacerých agentov a boli testované aj prípady s poruchou v komunikácii), adaptívnosťou na rôzne typy prostredí, škálovateľnosťou a využívaním paralelného počítania. Vykonávaciu vrstvu tvorí skupina mobilných agentov, ktorých počet je daný obmedzením komunikačnej vrstvy. V súčasnosti testujeme dva typy autonómnych mobilných robotov - UAV - vzdušné robotické prostriedky a pozemné Lego roboty. Mobilné roboty sú vybavené senzormi, ktoré snímajú prostredie a mikrokontrolérmi, ktoré zabezpečujú určitý stupeň inteligencie agentov. Pri testovaní v exteriéroch sa používa aj GPS systém na lokalizáciu. Rozpoznávame tri vrstvy riadenia mobilného multi-robotického systému: lokalizácia, lokálna navigácia a globálna 28

29 Stratégie správania sa Transfer znalostí navigácia. Základné riadenie mobilného robota sa vykonáva priamo na robotickej platforme. K úlohám zýkladného riadenia patrí riadenie pohybu robota v závislosti od druhu robotickej platformy a vyhýbanie prekážkam. Pre globálnu navigáciu používame metódy inšpirované princípmi odpozeranými z prírody - virtuálne feromóny a časticovú optimalizáciu. (Masár, 2013). Vrstva riadenia a spracovanie dát Spracovanie aplikačno závislých dát, Koordinácia a manažment spotreby energie Komunikačná vrstva Prenos dát potrebných na koordináciu a prenos aplikačne závislých dát Vykonávacia vrstva Riadenie pohybu, stabilita, vyhýbanie prekážkam, Senzory a zbieranie dát akcia Obr. 1: Komponentový model inteligentného swarmu pre prehľadávanie a monitorovanie. Komunikačná vrstva zabezpečuje komunikáciu medzi agentami navzájom a medzi mobilnými agentami a centrálnym počítačom. Komunikačná vrstva je tvorená vysielačmi a prijímačmi. Sú tam špecifikované kanály pre dáta slúžiace na koordináciu skupiny agentov a na dáta súviasiace s plnením misie. Riadiaca vrstva slúži aj na spracovanie údajov zo snímačov. Túto vrstvu je možné presunúť na klaud a tak významne zvýšiť schopnosti systému predovšetkým v spracovaní údajov zo snímačov. Komponentová schéma testovacieho prostredia podľa Zelenku a Kasanického (2014) je znázornená na obr. 2. Transfer dát senzorické dáta, údaje o polohe, stave batérií a pod. Komunikácia medzi mobilnými agentami je zabezpečená prostredníctvom dvojice xbee modulov, pričom táto dvojica má nastavenú rovnakú PAN ID adresu ale odlišnú od ostatných xbee modulov. Komunikácia mobilný agent PC je zabezpečená prostredníctvom komunikačného protokolu MavLink 1 a pre každého mobilného agenta sa na strane PC spustí samostatné vlákno, ktoré nastavuje parametre prislúchajúceho agenta v PC. Pre prenos video signálu a spracovanie obrazu má každá kamera na strane mobilného agenta a na strane PC vlastný prijímač. K zmiešavaniu signálu nedochádza, pretože pásmo GHz GHz je odstupňované po Mhz. Vykonané testy v roku 2014 overili správnosť konceptu a ukázali schopnosť systému pracovať v reálnom prostredí. 7 Záver Budúcnosť robotiky v klaudových infraštruktúrach so sebou prináša množstvo výziev ale aj rizík, s ktorými sa musí spoločnosť vyrovnať. Sú oblasti, kde používanie robotov bude nenahraditeľné (práce v nebezpečných prostrediach a na nebezpečných úlohách, ako napr. odmínovanie, práce na vzdialených pôsobiskách - výskum vo vesmíre, práce v mikro priestoroch - mikrochirurgia, mikro- a nanomechanika), ale aj oblasti, kde využívanie robotov bude musieť podliehať regulácii so strany spoločnosti. Medzi aktuálne problémy, s ktorými sa musí klaudová robotika vysporiadať patrí najmä problém riešenia konfliktných situácií v prípade, že viaceré roboty pristupujú k tým istým inštanciám klaudovej infraštruktúry, problém generovania nekompatibilných informácií, konfigurácií a pod. Široké využívanie autonómnych robotických platforiem prináša so sebou nové etické problémy, s ktorými sa musíme vysporiadať ako legislatívne, tak aj emočne. Ide najmä o otázky ochrany súkromia, bezpečnosti ľudí, ale aj otázky zamestnanosti, dostupnosti služieb a pod. Roboty, tak ako aj iné výdobytky ľudského pokroku, sú tu predovšetkým na to, aby nám slúžili k rozvoju obecného blaha a dobra. Ich zneužitie je však možné a veľmi ľahko uskutočniteľné. Preto ruka v ruke s výskumom klaudovej robotiky musí ísť výskum v oblasti zabezpečenia a ochrany robotických systémov pred zneužitím. Poďakovanie Tento príspevok vznikol za podpory grantovej agentúry VEGA v rámci grantovej úlohy 2/0194/13. Obr. 2: Schéma testovacieho systému

30 Literatúra Cádrik T., Ondo J., Mach M., Sinčák P. (2015) Základná architektúra claudového prostredia na podporu multirobotických systémov (1, 2 a 3), In ATP Journal, roč. 22, č. 1, 2 a 3 Ermacora G., Toma A., Bona B., Chiaberge M., Silvagni M., Gaspardova M., Antonioni R.: A cloud robotics architecture for an emergency management and monitoring service in a smart city environment. Gi Hyun Lim, Il Hong Suh, Hyowon Suh (2011) Ontology-Based Unified Robot Knowledge for Service Robots in Indoor Environments, In IEEE Transactions on Systems, Man, and Cybernetics Part A: Systems and humans, VOL. 41, NO. 3, May 2011 Guizzo E. (2011) Robots with their heads in the clouds, In Spectrum, IEEE, vol. 48, no. 3, pp Haidegger Tamás, Barreto Marcos, Gonçalves Paulo, Habibe Maki K., Ragavan Sampath Kumar Veera, Li Howard, Vaccarella Alberto, Perrone Roberta, Prestes Edson (2013) Applied ontologies and standards for service robots, In Robotics and Autonomous Systems Chella Antonio, Cossentino Massimo, and Seidita Valeria. (2011). Self-conscious Robotic System Design Process From Analysis to Implementation. In From Brains to Systems. Brain-Inspired Cognitive Systems 2010 Series: Advances in Experimental Medicine and Biology Chella Antonio, Cossentino Massimo, Pirrone Roberto, Ruisi Andrea (2002) Modeling Ontologies for Robotic Environments,In Proc. Of The 14th International Conference on Software Engineering and Knowledge Engineering. Kehoe B., Patil S., Abbeel P., Goldberg K. (2015) A survey of Research on Cloud Robotics and Automation, in IEEE Transaction on Automation Science and Engineering, goldberg.berkeley.edu/pubs/t-ase-cloud-ra- Survey-Paper-Final-2015.pdf Lorenčík, D., Cádrik T., Mach M., Sinčák P. (2014) Cloudová robotika. Vplyv cloudového computingu na budúcnosť robotiky (1, 2 a 3), In ATP Journal, 2014, roč. 21, č. 3, 4 a 5 Lorenčík P., Sinčák P. (2013) Cloud robotics: Current trends and possible use as a service. In proc. Of the IEEE International Symposium on Applied Machine Intelligence and Informatics SAMI 2013 Luca Gherardi and Hunziker, Dominique and Mohanarajah, Gajamohan (2014). A Software Product Line Approach for Configuring Cloud Robotics Applications, in Proc. IEEE Cloud 2014 Masár Marek (2013) A biologically inspired swarm robot coordination algorithm for exploration and surveillance In INES 2013 : IEEE 17th Internetional Conference on Intelligent Engineering Systems 2013 Mell P., Grance T. (2011) The NIST Definition of Cloud Computing Mohanarajah, Gajamohan and Hunziker, Dominique and Waibel, Markus and Raffaello (2014) Rapyuta: A Cloud Robotics Platform, In IEEE Transactions on Automation Science and Engineering Mohanarajah, Gajamohan and Usenko, Vladyslav and Singh, Mayank and Waibel, Markus and D'Andrea, Raffaello (2014 b) Cloud-based Collaborative {3D} Mapping in Real-Time with Low-Cost Robots, In IEEE Transactions on Automation Science and Engineering Prestes Edson, Carbonera Joel Luis, Fiorini Sandro Rama, Jorge Vitor A. M., Abel Mara, Madhavan Raj, Locoro Angela, Goncalves Paulo, Barreto Marcos E., Habib Maki, Chibani Abdelghani, Gérard Sébastien, Amirat Yacine, Schlenoff Craig (2013) Towards a core ontology for robotics and automation, In Robotics and Autonomous Systems. Rudas I.J (2012) Cloud Computing in Intelligent Robotics, IEEE 10th Jubilee Int. Conference on Intelligent Systems and Informatics, pp. 15, SISY 2012 Tenorth Moritz and Kamei Koji and Satake Satoru and Miyashita Takahiro and Hagita Norihiro (2013). Building Knowledge-enabled Cloud Robotics Applications using the Ubiquitous Network Robot Platform IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS), Weibel M., Beetz M., D Andrea R., Janssen R., Tenorth, M., Civera J., Elfring J., Gávez-Lopez D., Häussermann K., Montiel J., Perzylo A., Schiessle B., Zweigle O., van de Molengraft R. (2011) "RoboEarth - A World Wide Web for Robots", in Robotics and Automation Magazine, vol. 18, no.2, pp.69-8 ZELENKA, Ján - KASANICKÝ, Tomáš. Insect pheromone strategy for the robots coordination. In Applied Mechanics and Materials. Eds. Hajduk, M., Kukolova, L., 2014, vol. 613, p ISSN

31 Kognícia a umelý život 2015, Trenčianske Teplice Kontaminovaný mindware: typy, otázky a výzvy Vladimíra Čavojová, Eva Ballová Mikušková, Martin Majerník Ústav experimentálnej psychológie SAV Dúbravská cesta 9, Bratislava [email protected], [email protected], [email protected] Abstrakt Cieľom výskumu bola identifikácia typov ľudí podľa štruktúry ich kontaminovaného mindwaru (presvedčení škodlivých pre racionalitu). 406 vysokoškolským študentom bola administrovaná batéria škál merajúcich iracionálne presvedčenia, resp. kontaminový mindware (konšpiračné presvedčenia, paranormálne presvedčenia, viera v homeopatiu a alternatívnu medicínu, paranoidné myšlienky, náboženský fundamentalizmus, autoritárska osobnosť, etnické predsudky). Identifikované boli štyri typy ľudí: kontaminovaní liberáli, kontaminovaní fundamentalisti, racionálni liberáli a skeptickí konzervatívci. Význam rôznych typov kontaminovaného mindwaru pri využívaní rôznych prístupov ku zvyšovaniu racionality je diskutovaný v príspevku. 1 Úvod Byť racionálni je niečo, čo chceme dosiahnuť (málokto má cieľ byť iracionálny). Odpovedať si na otázku, čo to znamená byť racionálny nie je jednoduché. V literatúre sa uvádzajú napríklad dva typy racionality: inštrumentálna racionalita správanie, pomocou ktorého dosahujeme svoje ciele (odráža sa aj v pojme očakávaného úžitku), a epistemická racionalita ako dobre naše presvedčenia zapadajú do aktuálnej štruktúry sveta (Stanovich, 2010). Aby sme zistili, či niekto disponuje inštrumentálnou racionalitou, mali by sme poznať jeho špecifický cieľ (napríklad v kontexte vzdelávania vyvstáva otázka, čo zahrnúť do osnov: je naozaj dôležité, aby všetky deti poznali pravidlá logiky alebo teórie pravdepodobnosti, ak je ich cieľom zarábať si na živobytie menej náročným spôsobom?). Na druhej strane, aby sme mohli konať v zmysle napĺňania našich cieľov, potrebujeme vychádzať z presvedčení, ktoré presne odrážajú realitu (Stanovich, 2010). Inými slovami, mali by sme disponovať epistemickou racionalitou. Epistemická racionalita nám hovorí, čo je pravda a inštrumentálna racionalita nám odporúča, čo máme robiť, preto sú oba aspekty racionality potrebné, ak chceme hodnotiť, či je niekto racionálny alebo iracionálny, a oba by mali byť rovnakou mierou rozvíjané v procese vzdelávania. Je to však možné, rovnakou mierou zvyšovať v rámci vzdelávania oba typy racionality? V predkladanej štúdii sme sa zamerali (a) na dôležitosť hodnotenia racionality presvedčení študentov a (b) na mieru dôležitosti presvedčení pre epistemickú racionalitu. Tradičné teórie racionality neskúmajú presvedčenia formujúce dôvody správania, ktorého racionalitu hodnotíme (Elster, 1983). V praxi to môže znamenať, že niekto robí racionálne voľby založené na iracionálnych presvedčeniach. Stanovich (2011) na druhej strane upozorňuje, že niektoré presvedčenia môžu byť pre racionalitu škodlivé, hovorí o tzv. kontaminovanom mindwari. Škodlivosť niektorých presvedčení môže zásadným spôsobom ovplyvňovať aj proces vzdelávania, obzvlášť vysokoškolské vzdelávanie by malo podporovať a rozvíjať racionalitu študentov. Z tohto dôvodu je dôležité poznať jednako presvedčenia, ktoré môžu znižovať racionalitu, jednako faktory zapríčiňujúce, že takéto presvedčenia nadobúdame a udržiavame. Cieľom predkladanej štúdie je identifikácia presvedčení, ktoré sú škodlivé pre (epistemickú) racionalitu. Sekundárnym cieľom je skúmanie implikácií individuálnych rozdielov pre vzdelávanie racionality. 1.1 Racionalita a kontaminovaný mindware Presvedčenia tvoria obsahovú časť našich kognícií. Pre skúmanie vzťahu medzi rôznymi presvedčeniami a racionalitou je nápomocný súčasný tripartitný model ľudskej racionality od Stanovicha (2011), v ktorom navrhuje vnímanie racionality obdobným spôsobom ako je vnímaná inteligencia v Cattel/Horn/Carrollovej teórii fluidnej a kryštalickej inteligencie. Fluidná racionalita v sebe zahŕňa procesuálnu stránku racionálneho myslenia (dispozície myslenia reflektívnej mysle) a kryštalická racionalita sa týka nadobudnutých poznatkov (obsah), ktoré môžu buď pomáhať (kryštalické faktory) alebo narúšať (kryštalické inhibítory) racionálne myslenie. Uvedený rámec umožňuje hodnotenie rôznych aspektov racionálneho rozhodovania. Stanovich v kontexte uvedeného modelu predstavuje taxonómiu chýb myslenia suboptimálne uvažovanie (a teda aj implikácie pre racionálne správanie ľudí) môže byť zapríčinené jedným z troch typov chýb: (1) dysfunkčný 31

32 autonómny systém, (2) tendencia k lenivému spracovávaniu, alebo (3) tzv. kontaminovaný mindware. Problémy s mindwarom majú dvojaký charakter: buď nám chýba nejaký obsah, ktorý by mohol pomôcť zlepšovať rozhodnutia (ide o tzv. medzery v mindwari; v takomto prípade môžeme napríklad využiť explicitné poznatky o efekte rámcovania a naučiť študentov úmyselne preformulovať problém), alebo vlastníme nejaký obsah, ktorý môže byť škodlivý (tzv. kontaminovaný mindware; napríklad viera v efektívnosť homeopatickej liečby môže viesť k suboptimálnym medicínskym voľbám). Kontaminovaný mindware je teda definovaný ako obsah mysle, ktorý vedie k maladaptívnemu konaniu (Stanovich, 2009). Problémy s kontaminovaným mindwarom predstavujú aj etické otázky nielen že je náročné presvedčiť druhého človeka, že má neužitočné presvedčenia, kontaminovaný mindware reprezentuje aj zopár konceptuálnych problémov, napríklad čo sa pokladá za kontaminované, pričom táto diskusia siaha až k otázkam, čo je racionálne správanie a ktoré presvedčenia sú racionálne. Zároveň sa objavuje aj problém subjektívneho hodnotenia úsudkov iných ľudí: to, čo sa z pohľadu jedného človeka (vzhľadom na systém jeho presvedčení) zdá rozumné, môže byť iným vnímané ako iracionálne, alebo bizarné (Nickerson, 2008). Navyše, to, v čo sami veríme, sa nám vždy javí ako racionálnejšie ako to, v čo veria ostatní. 1.2 Zdôvodnenie výskumu a výskumné otázky Vybrali sme niekoľko subškál, ktoré slúžili ako indikátory kontaminovaných presvedčení a predpokladali sme, že niektoré z nich budú v rámci konceptu kontaminovaného mindwaru dôležitejšie ako iné. Napríklad, často sa predpokladalo, že viera v alternatívnu medicínu a liečbu (napr. homeopatia, reiki, liečba na diaľku) má rovnaký základ ako viera v iné paranormálne fenomény (napr. Saher a Lindeman, 2005; Sjöberg a Wåhlberg, 2002). V predchádzajúcej štúdii (Čavojová a Ballová Mikušková, 2014) sme zistili, že niektoré subškály majú tendenciu tvoriť zoskupenia. V predkladanej štúdii sme predpokladali, že štyri subškály najsilnejšie súvisiace s kontaminovaným mindwarom (konšpiračné teórie, homeopatia, paranoidné myšlienky, paranormálne presvedčenia) budú vykazovať negatívne vzťahy so sebahodnotiacou škálou racionality. Ďalej sme predpokladali, že autoritárska osobnosť a náboženský fundamentalizmus (RF) budú predikovať niektoré špecifické kontaminované presvedčenia (napr. konšpiračné presvedčenia). Niektorí výskumníci napríklad zistili, že vysoké RF skóre súvisí s vyššou mierou dezorganizácie a bludného myslenia u psychiatrickej populácie (Graham, 1987; Lachar a Alexander, 1978). Výskumy ďalej ukázali, že pravicové autoritárstvo koreluje s nízkou komplexitou myslenia (Hunsberger, Pratt, a Pancer, 1994), kognitívnymi chybami a chybným uvažovaním (Altemeyer, 1998). Altemeyer (1998) ďalej zistil, že pravicoví autoritári sú náchylnejší k nesprávnym záverom, nekritickej akceptácii nedostatku dôkazov, ktoré podporujú ich presvedčenia a sú menej ochotní uznať svoje obmedzenia. Pravicové autoritárstvo slabo korelovalo iba s orientáciou na sociálnu dominanciu (Social Dominance Orientation, SDO), pričom spolu tvorili silný prediktor viacerých predsudkov (sexizmus, rasizmus, heterosexizmus). Tieto dva meracie nástroje môžeme pokladať za dve strany tej istej mince: pravicové autoritárstvo produkuje submisívnych nasledovníkov a sociálna dominancia produkuje lídrov hľadajúcich moc (Altemeyer, 1998). Na druhej strane, sebavýpoveďové dotazníky týkajúce sa preferencie racionality môžu negatívne korelovať s nástrojmi merajúcimi kontaminovaný mindware. Napríklad Saher a Lindeman (2005) zistili slabý negatívny vzťah preferencie k racionalite (REI- R), paranormálnych presvedčení, a magickej viery v potraviny. Zároveň zistili, že vysoká experiencialita (REI-E) bola vo vzťahu s vierou v alternatívnu medicínu, paranormálne javy a magické sily ohľadom zdravia a potravín. Výsledky boli nejasné aj pri skúmaní vzťahu racionality (meranej REI) a hráčskeho správania: zatiaľ čo Edmond a Mamurek (2010) zistili, že vyššia racionalita súvisela s menej závažnými hráčskymi problémami, v štúdii MacLarena, Fugelsanga, Harrigana, a Dixona (2012) racionalita nepredikovala závažnosť hráčskych problémov. Podobne ako pri individuálnych rozdieloch v racionálnom myslení (napr. Stanovich, 1998, 2011; Stanovich a West, 2000) môžeme očakávať aj rozdiely v iracionálnom myslení. Navyše, nie je priame prepojenie medzi racionalitou a inteligenciou, a to isté platí aj pre kontaminovaný mindware. Vyššie kognitívne schopnosti môžu slúžiť ako ochrana proti niektorým kontaminovaným mindwarom, ale už zo stručného prehľadu literatúry v predchádzajúcom texte je jasné, že vyššia inteligencia môže slúžiť ako spôsob racionalizácie dysfunkčných presvedčení. Na základe uvedeného sme v predkladanej štúdii skúmali nasledovné oblasti: (1) Môžu byť špecifické kontaminované presvedčenia predikované pomocou autoritárskej osobnosti, náboženského fundamentalizmu, inteligencie alebo dispozícií myslenia?, (2) Čo tvorí základ individuálnych rozdielov medzi ľuďmi, ktorí získavajú kontaminovaný mindware ľahšie ako iní? 2 Metódy 2.1 Participanti Na výskume participovalo 400 participantov z Pedagogickej fakulty Univerzity Konštantína Filozofa v Nitre, väčšina participantov boli ženy (n=328; 24 32

33 participantov neoznačilo pohlavie). Priemerný vek participantov bol 19,84 rokov (SD=2,45). Zber dát bol súčasťou širšieho výskumného projektu 1, na tomto mieste uvádzame sekundárne výsledky analýzy dotazníkov, ktoré sa týkali iracionálnych presvedčení. 2.2 Metódy Kontaminovaný mindware Finálna verzia nástroja na meranie kontaminovaného mindwaru (Contaminated mindware measures CMM (Čavojová a Ballová Mikušková, 2014) pozostávala zo 146 položiek, ktoré boli vybrané z viacerých existujúcich škál (ich stručný popis uvádzame nižšie), pričom pri podobných a opakujúcich sa položkách bola ponechaná iba jedna z nich. Všetky položky boli participantmi hodnotené na 6 stupňovej Likertovej škále (1 úplne súhlasím, 6 vôbec nesúhlasím). Altemeyerov test autoritárstva (Altemeyer Authoritarian Test, AAT, Altemeyer, 1981) Do CMM boli zaradené iba položky týkajúce sa pravicového autoritárstva: výskumy ukazujú, že práve tieto korelujú s nízkou komplexitou myslenia (Hunsberger et al., 1994), s kognitívnymi chybami a chybným uvažovaním (Altemeyer, 1998). Altemeyer (1998) ďalej zistil, že pravicoví autoritári boli viac náchylní robiť nesprávne závery, nekriticky akceptovať nedostatok dôkazov podporujúcich ich presvedčenia a menej si priznávali svoje limity. Na základe uvedených výsledkov sme do CMM zaradili všetkých 22 položiek AAT. Minnesotský multifázový osobnostný inventár (Minnesota Multiphasic Personality Inventory MMPI; Wiggins, 1966) Náboženský fundamentalizmus je zvyčajne meraný 12- položkovou RF (religious fundamentalism) škálou z MMPI. Položky reflektujú náboženské presvedčenia a nábožensky motivované správanie. Ľudia vysoko skórujúci v RF majú tendenciu vidieť svoju vieru ako jedinú správnu. Okrem toho RF škála reflektuje celkovú rigiditu, dogmatizmus a netoleranciu k ľuďom s odlišnými presvedčeniami, čím sa mierne prekrýva s AAT. Z tohto dôvodu sme použili iba 4 položky z RF škály. Z MMPI sme použili aj ďalších 27 položiek z paranoidnej subškály. Paranoidné sklony možno pokladať za kontaminovaný mindware, keďže robia človeka náchylnejším voči chybným záverom. 1 Článok so sumárnymi výsledkami (Čavojová, V. & Hanák, R. Examining Irrational Beliefs: The role of cognitive abilities, thinking dispositions and cognitive biases) je momentálne v posudzovaní v časopise Judgment and Decision Making. Škála antisemitizmu (Anti-Semitism scale, ASS) a antirómskych presvedčení (Anti-Gypsy scale, AGS; Todosijević, 1998) Použili sme 7 položiek z ASS a 6 položiek z ASG, hoci niektoré aspekty postojov proti iným skupinám sú reflektované aj v AAT. Todosijević (1998) na maďarskej vzorke zistil, že anti-semitské a anti-rómske postoje nezávisle súvisia s autoritárstvom a predsudkami rodičov. Škála generických konšpiračných presvedčení (Generic Consipracist Belief Scale, GCBS, Brotherton, French, and Pickering, 2013) GCBS pozostáva z piatich subškál (vládne konšpirácie, konšpirácie ohľadom malých tajných mocenských skupín, konšpirácie týkajúce sa mimozemského života, osobné konšpirácie a konšpirácie ohľadom kontroly informácií) a hoci autori revidovali škálu na 15 položiek, my sme použili pôvodných 59 položiek, aby sme identifikovali tie, ktoré sú relevantné pre slovenské reálie. Škála paranormálnych presvedčení (Paranormal Belief Scale, PBS, Dagnall, Parker, Munley, and Drinkwater, 2010) Dagnall, Parker, Munley, and Drinkwater (2010) identifikovali 124 položiek merajúcich paranormálne presvedčenia, z ktorých extrahovali 9 faktorov (strašidlá, iný život, povery, náboženské presvedčenia, mimozemské návštevy, mimozmyslové vnímanie, psychokinéza, astrológia a čarodejníctvo), ktoré vyústili do 14 položiek použitých aj v predkladanej štúdii. Homeopatia a alternatívne liečiteľstvo (Homeopathy and alternative treatment, H) Zaradili sme aj 4 položky týkajúce sa homeopatie a alternatívneho liečiteľstva Dispozície myslenia Racionálno-experienciálny inventár (Rational- Experiential Inventory, REI) REI (Pacini a Epstein, 1999) pozostáva z dvoch samostatných škál Racionálne spracovávanie informácií (REI-R, vytvorené zo škály Need for Cognition) a Experienciálne spracovávanie informácií (REI-E, vytvorené zo škály Faith in Intuition), čo robí škálu kompatibilnou so Stanovichovým (2011) ponímaním: REI-R pozitívne súvisí s racionalitou a REI-E súvisí negatívne s racionalitou. V porovnaní s obdobnými nástrojmi má REI najlepšie psychometrické parametre (Hanák, 2013) a bol verifikovaný pre slovenskú populáciu (Ballová Mikušková, Hanák, a Čavojová, 2015). Participanti hodnotia jednotlivé položky na 6 bodovej Likertovej škále (1 vôbec nesúhlasím, 6 úplne súhlasím). 33

34 Motivácia k racionálnej integrácii (Master rationality Motive Scale, MRMS) Škála motivácie k racionálnej integrácii (Stanovich, 2011) meria konštrukt racionálnej motivácie (pocit potreby racionálnej integrácie). Kombinuje otázky z niekoľkých iných škál, väčšinou merajúcich kognitívne štýly alebo osobnosť. MRMS pozostáva z 15 položiek: 5 položiek je nových (položky 8-13), ostatné sú vyextrahované z iných škál a inventárov. Participanti hodnotia jednotlivé položky na 6 bodovej Likertovej škále (1 vôbec nesúhlasím, 6 úplne súhlasím). Skóre sa môže pohybovať medzi 15 (nízka motivácia k racionálnej integrácii) a 90 (vysoká motivácia k racionálnej integrácii). Cronbachova alfa bola pre MRMS 0,611 a priemerné skóre bolo 57,33 (SD=8,25). Obr. 1: Deskriptívne charakteristiky klastrov Kognitívne schopnosti: Viedenský maticový test (VMT) VMT pozostáva z 24 položiek s narastajúcou obťažnosťou a je časovo obmedzený (25 minút). Každá úloha pozostáva z matice 3x3 s jedným chýbajúcim obrázkom v treťom rade. Úlohou participanta je správne doplniť chýbajúci obrázok z 8 možností. Podstatou testu je nájsť pravidlo, vzorec, pričom v teste je viacero typov pravidiel (distribúcia symbolov, narastajúci alebo klesajúci počet symbolov, alebo aj kombinácia viacerých princípov). Použili sme českú adaptáciu (Klose, Černochová, a Král, 2002), priemerné skóre v našej vzorke (n=400) bolo 16,45 2 (SD=3,9). 3 Výsledky Na základe nedostatku silných vzájomných vzťahov a predchádzajúcich zistení (Čavojová a Ballová Mikušková, 2014) sme sa zamerali na analýzu individuálnych rozdielov a existenciu určitých typov, na základe štruktúry ich iracionálnych presvedčení. Preto sme všetky sumárne skóre z jednotlivých škál transformovali na štandarizované skóre a podrobili k- mean klastrovej analýze. Ako najzmysluplnejšie sa ukázalo 4-klastrové riešenie. Obrázok 1 zobrazuje graf deskriptívnych charakteristík jednotlivých klastrov a Obrázok 2 ich frekvenciu výskytu. Obr. 2: Frekvencia jednotlivých typov (klastrov) Jednotlivé typy (klastre) vytvorili protichodné dvojice: Typ 2 vykazoval opačný vzorec ako Typ 4, zatiaľ čo Typ 1 bol protikladom k Typu 3. Rozdiely medzi typmi boli podporené výsledkami v one-way ANOVA analýze: jednotlivé typy sa navzájom signifikantne odlišovali (Tabuľka 1). klaster 1 KL 2 KF 3 SK 4 RL n f p AAT -0,829 0,866 0,390-0,422 83,716 <0,001 RF -1,145 0,806 0,558-0, ,05 <0,001 AGS 0,074 0,448 0,2070-0,498 21,208 <0,001 ASS 0,284 0,491 0,5191-0,895 90,452 <0,001 CBS 0,523 0,890-0,531-0,432 74,046 <0,001 H 0,903 0,604-0,559-0,432 79,058 <0,001 MMPI 0,667 0,843-0,065-0, ,44 <0,001 PBS 0,690 0,947-0,258-0, ,20 <0,001 Tab. 1: Rozdiely medzi jednotlivými typmi (one-way ANOVA) 2 Priemerné hrubé skóre transformované na IQ skóre bolo 106,8 (SD=15,5). Typ 2 vykazoval nadpriemerné skóre vo všetkých škálach CMM, takže tento typ sa vyznačoval najvyššou tendenciou veriť širokému spektru presvedčení (paranormálne, konšpiračné, homeopatia), silnou inklináciou k autoritárskym osobnostiam, náboženským presvedčeniam a predsudkom voči rôznym etnickým a náboženským skupinám (v našom prípade Židia, Rómovia). Typ 2 mal anti-rómske postoje spoločné s 34

35 Typom 3 a anti-semitské postoje s Typmi 1 a 3 (nebol žiadny rozdiel v skóre príslušnej škály medzi uvedenými typmi). Typ 2 je zároveň aj signifikantne viac paranoidný ako iné typy (okrem Typu 1). Pre zjednodušenie sme tento typ nazvali kontaminovaný fundamentalista. Na druhej strane, Typ 4 vykazoval podpriemerné skóre vo všetkých subškálach CMM, to znamená, že tento typ je najmenej autoritársky a má najmenej predsudkov voči iným etnikám a náboženským skupinám, zároveň mal najmenej presvedčení, ktoré by sa dali pokladať za kontaminované alebo škodlivé. Tento typ sme nazvali racionálny liberál. Typ 1 bol charakteristický najsilnejšími antiautoritárskymi pravicovými postojmi a náboženským anti-dogmatizmom (signifikantne odlišný od ostatných typov), ďalej miernymi predsudkami voči etnickým a náboženským minoritám menej ako Typy 2 a 3, ale viac ako Typ 4. Na druhej strane sa zdá, že tento typ inklinuje k viere v rôzne typy konšpiračných teórií (v niektoré viac, v iné menej), v paranormálne javy a liečivú silu homeopatie. Tento typ sme nazvali kontaminovaný liberál. Typ 3 je najviac zmiešaný typ, je výrazne autoritársky a náboženský, so silnými predsudkami voči etnickým a náboženským skupinám, no na druhej strane ľudia tohto typu vykazujú nechuť voči kontaminovaným presvedčeniam. Tento typ sme preto označili ako skeptický konzervatívec. Naším ďalším záujmom bolo overiť, či sa tieto štyri typy odlišujú aj v kognitívnych schopnostiach (hodnotených VMT) alebo kognitívnych dispozíciách (preferencie štýlu myslenia, merané MRMS a REI). Nepreukázali sa žiadne významné rozdiely medzi typmi (ani v post-hoc testoch LSD, Bonferroni). Sum of df Mean F Sig. Squares Square VMT BG 306, ,027 0,542 0,654 WG 61185, ,264 Tot 61491, MRMS BG 178, ,377 0,804 0,492 WG 21191, ,839 Tot 21369, REI-R BG 210, ,293 0,439 0,725 WG 45934, ,051 Tot 46145, REI-E BG 710, ,788 1,551 0,202 WG 43823, ,696 Tot 44534, ,027 Tab. 2: Individuálne rozdiely medzi typmi Lineárnou regresiou (pre všetky typy osobitne) sme zistili, že konšpiračné presvedčenia boli najlepšie predikované: - nízkym skóre v MRMS (β=-0,282, t=-2,235, p=0,029) v Type 3, - nízkym skóre v REI-R (β=-0,475, t=-3,607, p=0,001) a vysokým skóre v AAT (β=0,298, t=2,265, p=0,027) v Type 4. Vysoké skóre vo viere v homeopatiu bolo najlepšie predikované iba nízkym skóre v AAT (β=-0,269, t=- 2,124, p=0,038), konkrétne v Type 3. Prekvapivo, v Type 1 boli paranormálne presvedčenia predikované MRMS (β=0,252, t=2,144, p=0,036) Typ 1 skórujúci vysoko v REI-R s vysokou motiváciou k racionálnej integrácii vykazoval silnú vieru v paranormálne javy. Naopak, v Type 3 boli paranormálne presvedčenia predikované nízkym skóre MRMS (β=-0,352, t=-2,760, p=0,008) spolu s vysokým skóre v REI-R (β=0,458, t=3,594, p=0,001). V type 4 boli paranormálne presvedčenia predikované nízkym skóre v REI-E (β=-0,253, t=- 2,163, p=0,034) a vysokým skóre v inteligencii (β=0,237, t=2,023, p=0,047). 4 Diskusia Identifikovali sme štyri typy kontaminovaného mindwaru s rôznymi vzorcami kontaminovaných presvedčení: kontaminovaný fundamentalista, skeptický konzervatívec, kontaminovaný liberál a racionálny liberál. Berúc do úvahy aj naše predchádzajúce zistenia (Čavojová a Ballová Mikušková, 2014) zdá sa, že hoci autoritárska osobnosť súvisí s predsudkami, voči rôznym skupinám a niekedy koreluje aj s rôznymi formami kontaminovaného mindwaru, ide o odlišné konštrukty. Identifikácia štyroch typov poukazuje na to, že nie vo všetkých prípadoch je autoritárska osobnosť a náboženský fundamentalizmus spojený s kontaminovaným mindwarom v Type 3 ( skeptický konzervatívec ) to môžu byť práve silné náboženské presvedčenia spolu s konzervativizmom, ktoré chránia ľudí pred presvedčeniami príliš sa odlišujúcimi od toho, čo nazývame mainstream. Jednotlivé typy sme navzájom porovnávali v zmysle ich kognitívnych schopností a kognitívnych dispozícií. Zdá sa, že kým konšpiračné presvedčenia skeptického konzervatívca (Typ 3) možno predikovať nízkou motiváciou k racionálnej integrácii (MRMS), konšpiračné presvedčenia kontaminovaného fundamentalistu (Typ 4) sú lepšie predikované nízkym náboženským fundamentalizmom, vysoko autoritárskou osobnosťou, pričom ich paranormálne presvedčenia boli lepšie predikované nízkou preferenciou k experienciálnemu spôsobu spracovávania informácií a vyššou inteligenciou. Môžeme sa iba domnievať, čo to spôsobuje, je prinajmenšom zaujímavé, že vyššia kognitívna kapacita môže skutočne vysvetľovať rôzne kontaminované presvedčenia. Zistenia poukazujú aj na fakt, že nemožno hodnotiť ľudí na základe ich náboženského (fundamentalizmus vs. ateizmus) alebo politického presvedčenia (konzervativizmus vs. liberalizmus) a 35

36 automaticky predpokladať, že aj iné ich presvedčenia budú kontaminované. Zdá sa, že náboženský fundamentalizmus funguje u niektorých ľudí ako bariéra proti novým nekonvenčným myšlienkam, čo môže v prípade niektorých konšpiračných alebo pseudovedeckých presvedčení fungovať v prospech človeka. Na druhej strane, v prípade Typu 4 ( racionálny liberál ) môže tento typ osobnosti fungovať ako bariéra voči zmene rovnakého typu presvedčení. Sekundárnym cieľom nášho výskumu bolo skúmanie implikácií individuálnych rozdielov pre vzdelávanie racionality, resp. prístupov ku zvyšovaniu racionality. Bartlett a Miller (2010) napríklad navrhujú jednako učenie kritickému mysleniu (učiť ľudí ako majú myslieť namiesto toho, čo si majú myslieť), jednako rozpoznávanie dôveryhodných zdrojov informácií. Podobne Lobato, Mendoza, Sims, a Chin (2014, s. 624) dodávajú, že "...úlohou vzdelávania je odovzdať vedomosti študentom a korigovať ich nesprávne interpretácie v snahe pripraviť ich na úspešné putovanie po svete, je dôležité porozumieť vysokoškolským študentom, ktorí podliehajú epistemicky nepodloženým presvedčeniam." A hoci Rice (2003) tvrdí, že úroveň vzdelania a vedeckých informácií nezohráva úlohu pri oslabovaní (konšpiračných) presvedčení, myslíme si, že zavádzanie kurzov kritického myslenia by mohlo posilniť odolnosť študentov voči nepodloženým, kontaminovaným presvedčeniam (napríklad voči pseudovedeckým informáciám, konšpiračným alebo paranormálnym presvedčeniami). Argumentom v prospech kurzov kritického myslenia sú aj zistenia Swamiho et al. (2014), že aktivácia analytického myslenia môže efektívne redukovať konšpiračné presvedčenia, respektíve že heuristiky a zaujatosti ovplyvňujú presvedčenia, a analytické myslenie môže byť inhibítorom tohto efektu - prostredníctvom analytického myslenia môžeme prehodnotiť rôzne presvedčenia a informácie. Preto veríme, že dlhodobé programy založené na intervencii a/alebo kurzy zamerané na kritické myslenie môžu prispieť k zvyšovaniu racionality (nielen) študentov. Poďakovanie Táto práca bola podporovaná Agentúrou na podporu výskumu a vývoja na základe Zmluvy č. APVV Literatúra Altemeyer, B. (1998). The other authoritarian personality. In M. Zanna (Ed.), Advances in Experimental Social Psychology. (pp ). San Diego: Academic Press. Altemeyer, R. A. (1981). Right-wing authoritarianism. Winnipeg: University of Manitoba Press. Ballová Mikušková, E., Hanák, R., a Čavojová, V. (2015). Appropriateness of two inventories measuring intuition (the PID and the REI). Studia Psychologica, 57(1), Bartlett, J., a Miller, C. (2010). The power of unreason. Conspiracy theories, extremism and counterterrorism. Brotherton, R., French, C. C., a Pickering, A. D. (2013). Measuring belief in conspiracy theories: the generic conspiracist beliefs scale. Frontiers in Psychology, 4(May), 279. Čavojová, V., a Ballová Mikušková, E. (2014). Developing contaminated mindware measure. In INTED2014 Proceedings. Dagnall, N., Parker, A., Munley, G., a Drinkwater, K. (2010). Common Paranormal Belief Dimension. Journal of Scientific Exploration, 24(3), Edmond, M., a Mamurek, H. (2010). Gambling related cognitions mediate the association between thinking style and problem gambling severity. Journal of Gambling Studies, 26, Elster, J. (1983). Sour grapes. Studies in the subversion of rationality. Endocrine practice : official journal of the American College of Endocrinology and the American Association of Clinical Endocrinologists, 8, p. 474). London: Cambridge University Press. Graham, J. R. (1987). The MMPI: A Practical Guide (2nd Edition). New York: Oxford University Press. Hanák, R. (2013). Nástroje na meranie intuície. In R. Hanák, E. Ballová Mikušková, a V. Čavojová (Eds.), Rozhodovanie a usudzovanie IV (pp ). Bratislava: Ústav experimentálnej psychológie SAV. Hunsberger, B., Pratt, M., a Pancer, S. M. (1994). Religious fundamentalism and integrative complexity of thought: A relationship for existential content only? Journal for the Scientific Study of Religion, 33(4), Klose, J., Černochová, D., a Král, P. (2002). Vídeňský maticový test. Praha: Testcentrum. Lachar, D., a Alexander, R. S. (1978). Veridicality of self-report: Replicated correlates of the Wiggins MMPI content scales. Journal of Consulting and Clinical Psychology, 46, Lobato, E., Mendoza, J., Sims, V., a Chin, M. (2014). Examining the Relationship Between Conspiracy Theories, Paranormal Beliefs, and Pseudoscience 36

37 Acceptance Among a University Population. Applied Cognitive Psychology, 28(5), MacLaren, V., Fugelsang, J., Harrigan, K., a Dixon, M. (2012). Effects of impulsivity, reinforcement sensitivity and cognitive style on pathological gambling symptoms among frequent slot machine players. Personality and Individual Differences, 52, Nickerson, R. S. (2008). Aspects of Rationality. Reflections on What it Means to be Rational and Whether We Are. New York: Psychology Press. belief in conspiracy theories. Cognition, 133(3), Todosijević, B. (1998). Anti-Jewish and Anti-Gypsy Attitudes in Hungary and Yugoslavia: Social and Psychological Determinats. MA dissertation. Budapest: Central European University National Program. Wiggins, J. S. (1966). Religious Fundamentalism Scale of the MMPI. Reviewed by W.B. Johnson and R. Olson. Pacini, R., a Epstein, S. (1999). The relation of rational and experiential information processing styles to personality, basic beliefs, and the ratio-bias phenomenon. Journal of Personality and Social Psychology, 76(6), Rice, T. W. (2003). Believe It Or Not: Religious and Other Paranormal Beliefs in the United States. Journal for the Scientific Study of Religion, 42(1), Saher, M., a Lindeman, M. (2005). Alternative medicine: A psychological persepctive. Personality and Individual Differences, 39, Sjöberg, L., a Wåhlberg, A. (2002). Risk Perception and New Age Beliefs. Risk Analysis, 22(4), Stanovich, K. E. (1998). Indvidual Differences in Rational Thought. Journal of Experimental Pschology: General, 127(2), Stanovich, K. E. (2009). What Intelligence Tests Miss. The Psychology of Rational Thought. New Haven, CT: Yale University Press. Stanovich, K. E. (2010). Decision Making and Rationality in the Modern World. New York: Oxford. Stanovich, K. E. (2011). Rationality and the Reflective Mind. New York: Oxford University Press. Stanovich, K. E., a West, R. F. (2000). Individual differences in reasoning: implications for the rationality debate? The Behavioral and Brain Sciences, 23(5), ; discussion Svedholm, A. M., a Lindeman, M. (2013). The separate roles of the reflective mind and involuntary inhibitory control in gatekeeping paranormal beliefs and the underlying intuitive confusions. British Journal of Psychology, 104(3), Swami, V., Voracek, M., Stieger, S., Tran, U. S., a Furnham, A. (2014a). Analytic thinking reduces 37

38 Kognícia a umelý život 2015, Trenčianske Teplice Interkulturní rozdíly ve zrakovém vnímání a metody jejich měření Jiří Čeněk, Čeněk Šašinka, Tomáš Urbánek Psychologický ústav, Filozofická fakulta, Masarykova univerzita v Brně Arne Nováka 1, 60200, Brno Jiří Čeněk: @mail.muni.cz Čeněk Šašinka: [email protected] Tomáš Urbánek: [email protected] Abstrakt Výzkumy naznačují existenci kulturně determinovaných rozdílů ve zrakovém vnímání a v souvisejících kognitivních procesech, jakými jsou vizuální pozornost a paměť. Podle výzkumů vycházejících z Nisbettovy teorie holistického a analytického kognitivního stylu se v těchto procesech významně liší příslušníci kultur Východní Asie a Západního civilizačního okruhu. Zatímco obyvatelé Západu vykazují tendenci soustředit pozornost na takzvané fokální objekty (objekty dominující percepčnímu poli) a jejich atributy, Asiaté mají tendenci vnímat percepční pole celistvěji, věnují pozornost jeho dalším prvkům a vztahům mezi fokálním objektem a dalšími vnímanými objekty. V tomto článku představujeme vybrané interkulturní teorie zrakového vnímání a představujeme metody jejich měření. 1 Interkulturní odlišnosti ve zrakovém vnímání 1.1 Závislost a nezávislost na poli V 60. letech 20. století se rozvíjela linie interkulturních výzkumů zrakového vnímání, jejímiž představiteli jsou například Herman A. Witkin a John W. Berry, která se podobně jako dřívější výzkumy (viz Deregowski, 1980) zaměřovala na studium interkulturních rozdílů ve vnímání převážně mezi západními industrializovanými a tradičními kulturami (Weitz, 1971). Výsledky těchto výzkumů naznačují, že způsob vnímání některých tradičních společností se více blíží způsobu vnímání industrializovaných společností spíše než jiným tradičním společnostem. Což naznačuje, že roli ve formování vnímání hrají i jiné faktory než faktory prostředí (Kitayama a Cohen, 2010). Witkin odhalil zásadní inter-individuální rozdíly ve způsobu, jakým lidé diferencují objekt (figuru) od pozadí, ve kterém tento objekt leží (viz např. Šikl, 2012, str. 23). Na základě svých pozorování Witkin (1967) definoval dva osobité kognitivní styly (či percepční styly) na dimenzi závislost a nezávislost na poli. Kognitivní styl popisuje způsob, jakým lidé myslí a přijímají informace. První metodou, která se k výzkumu závislosti a nezávislosti na poli v interkulturním kontextu hojně využívala, byla Witkinova adaptace testu skrytých figur (TSF). V tomto testu mají probandi za úkol identifikovat jednoduchou figuru na komplexním pozadí (Berry, Poortinga, Breugelmans, Chasiotis, a Sam, 2011). Rychlost, s jakou je člověk schopen diferencovat figuru od pozadí, je indikátorem míry závislosti na poli. Lidé, kteří figuru od pozadí diferencují relativně rychle, jsou nezávislí na poli, lidé, kterým to způsobuje těžkosti, jsou závislí na poli. Kognitivní styl, který daný jedinec vykazuje, částečně vychází ze sociální orientace jedince vůči ostatním lidem (Kitayama a Cohen, 2010). Lidé závislí na poli jsou ve srovnání s lidmi nezávislými (Weitz, 1971): více konformní více spoléhající na sociální skupinu více podléhající autoritě častěji žijící v polygamních společnostech spíše s ostatními spolupracující než soutěžící kladoucí důraz na disciplínu v dané kultuře Interkulturní odlišnosti ve vztahu ke konceptu závislosti/nezávislosti na poli jsou shrnuty v následující tabulce (Kitayama a Cohen, 2010): Faktor Závislí na poli Nezávislí na poli Způsob farmáři lovci a sběrači získávání potravy Typ společnosti tradiční, agrární moderní, industrializovaná Geografická poloha mimo Severoatlantický Severoatlantický prostor prostor Pohlaví ženy muži Cílesměrné chování kooperace soutěživost 38

39 Sociální identita 1 vzájemně závislá 2 nezávislá 3 Tab. 1: Faktory ovlivňující závislost na poli Farmáři, kteří jsou nuceni s ohledem na vlastní přežití koordinovat své aktivity s ostatními (např. setba, sklizeň apod.) jsou relativně více závislí na poli než lovci a sběrači, u kterých není k přežití nutná taková míra koordinace (Van de Vijver a Leung, 2000). Určitá nekonzistence výsledků výzkumů se týká rozdílů kognitivního stylu u mužů a žen. Ženy jsou podle některých výzkumů více závislé na poli než muži (Haaken, 1988). Jiné výzkumy tyto statisticky významné rozdíly neprokázaly (MacArthur, 1967). Lidé pocházející z moderních společností, které jsou charakteristické rozvolněnými sociálními vztahy a nižší mírou vzájemné závislosti (na komunitě, rodině, apod.) jsou na poli méně závislí než lidé z tradičních společností charakteristických pevnými sociálními vazbami a vysokou vzájemnou závislostí (Weitz, 1971). Nezávislost na poli je také podporována vzděláváním ve školách západního typu (Yamazaki, 2005) a všeobecně kontaktem se západním životním stylem film, televize, časopisy, rádio (Weitz, 1971). Mimo výše zmíněné metody TSF jsou ve výzkumech percepčního stylu závislost/nezávislost na poli využívány také Kohsovy kostky a metoda Rod and Frame test (dále RFT). K administraci metody RFT je potřeba aparát skládající se z na sobě nezávisle rotujícího bubnu ve tvaru kvádru a čáry (viz následující obrázek). Respondent během administrace RFT hledí do bubnu. Úkolem respondenta je nastavit čáru takovým způsobem, aby směřovala vertikálně. Experimentátor mezi jednotlivými pokusy manipuluje s polohou bubnu, tedy jakéhosi referenčního rámce. Přesnost, s jakou je respondent schopen spolehnout se na svá vnitřní vodítka pro odhad svislosti čáry (poloha těla apod.), a ignorovat vliv polohy bubnu, slouží jako indikátor závislosti/nezávislosti na poli. Jedinci, kteří jsou schopni s velkou přesností nastavovat čáru do svislé polohy bez ohledu na referenční rámec, jsou nezávislí na poli (Berry, Poortinga, Breugelmans, Chasiotis, a Sam, 2011). 1.2 Holistický a analytický kognitivní styl Velice podobná Witkinově teorii je i o něco novější teorie holistického a analytického kognitivního stylu. Podstatnou odlišností je předpoklad, že rozdíly ve vnímání se nemusí vyskytovat převážně mezi moderními a tradičními kulturami, ale i mezi dvěma vysoce industrializovanými kulturními oblastmi. Výzkumy vycházející z teorie holistického a 1 v originále "self-construal" 2 v originále "interdependent" 3 v originále "independent" analytického kognitivního stylu se soustředí na srovnávání rozdílů mezi zeměmi Západního civilizačního okruhu (Západní Evropa, Severní Amerika) a rozvinutými zeměmi Jihovýchodní Asie (Japonsko, Jižní Korea, Čína) (Kitayama a Cohen, 2010) Základní myšlenkou tohoto přístupu je předpoklad, že příslušníci těchto kultur se tak výrazně odlišují například v socializačních praktikách, sociálních vztazích (v rodině, komunitě), způsobech obživy, zdrojích identity a filozofické tradici, že to má vliv na způsob jejich myšlení (kategorizace, kauzální atribuce) a vnímání (paměťové procesy, distribuce pozornosti apod.) (Nisbett a Masuda, 2003). Zatímco západní myšlení je založeno na filozofické tradici starého Řecka, myšlení příslušníků kultur Jihovýchodní Asie vychází z tradic čínské filozofie. Některé z podstatných rozdílů mezi těmito dvěma filozofickými tradicemi jsou shrnuty v tabulce 2 (Nisbett a Masuda, 2003; Nisbett a Miyamoto, 2005). Oblast Řecko Čína Formalizovaná Ano Ne logika Složení hmoty Diskrétní Spojité substance objekty (atomy) Zaměření Výrazné Pole obsahující pozornosti objekty a výrazné objekty, atributy vzájemné vztahy těchto mezi objekty objektů. navzájem a objekty a pozadím. Kategorizace Objekty seskupovány podle Objekty seskupovány podle podobnosti/funkce. příslušnosti k třídě (kategorii). Myšlení a Analytické Holistické vnímání Cíl Nalezení pravdy Tab. 2: Řecká a čínská filozofie Nalezení harmonie Výše zmíněné rozdíly v řecké a čínské filozofické tradici jsou v rámci teorie vysvětlovány rozdíly v sociálních vztazích příslušníků těchto kultur. Z důvodu komplexních sociálních vztahů, které jsou pro asijské kultury typické (např. ke sklízení rýže je potřeba koordinovaného úsilí celé vesnice), je žádoucí minimalizovat sociální napětí v rámci místních komunit. Příslušníci těchto kultur vytvářejí vzájemně závislé sociální vztahy, jejich identita je rozšířená na blízké sociální okolí. Příslušníci kultur vycházejících z řecké filozofické tradice jsou na druhou stranu relativně nezávislí, jejich sociální vazby nejsou tak silné a tvoří 39

40 jich méně. Ceněnými hodnotami jsou u těchto kultur nezávislost a autonomie (Nisbett a Masuda, 2003). Nisbett definoval dva specifické kognitivní styly: holistický a analytický (viz Nisbett a Miyamoto, 2005; Kitayama, Duffy, Kawamura, a Larsen, 2003). Jedinci s analytickým kognitivním stylem se při vnímání vizuálního podnětu soustředí v první řadě na takzvané fokální objekty (objekty, které scéně dominují; jsou relativně velké, barevné, pohybují se apod.) a na jejich atributy. Jedinci s holistickým kognitivním stylem věnují pozornost primárně pozadí, kontextu, ve kterém se fokální objekty nacházejí, vzájemným vztahům mezi fokálními objekty navzájem a vztahům mezi fokálními objekty a pozadím. Tendence vnímat analyticky či holisticky se vyvíjí již v raném dětství jako důsledek procesu socializace jedince (Duffy, Toriyama, Itakura, a Kitayama, 2009) a rozdílných sociálních vztahů typických pro danou kulturu (viz Hofstedeho dimenze kultury, např. Hofstede, 1983). Jak je zmíněno výše, většina výzkumů provedených na základě teorie holistického a analytického kognitivního stylu srovnávala kultury Severní Ameriky a Jihovýchodní Asie (např. Boduroglu, Shah, a Nisbett, 2009; Uskul, Kitayama, a Nisbett, 2008). V regionu Střední a Východní Evropy doposud žádné výzkumy vycházející z této teorie provedeny nebyly. Pro diagnostiku holistického a analytického percepčního stylu je využíváno několika typů metod. Pravděpodobně nejhojněji používanou metodou (viz např. Uskul, Kitayama, a Nisbett, 2008; Ventura, Pattamadilok, Fernandes, Klein, Morais, a Kolinsky, 2008) je metoda Framed-line test (FLT), která vychází z metody RFT. Metoda FLT byla vyvinuta Kitayamou a jeho kolegy (Kitayama, Duffy, Kawamura, a Larsen, 2003) a poprvé byla použita při porovnání rozdílů ve zrakovém vnímání na vzorku japonských a amerických univerzitních studentů. Úloha sestává ze série prezentací geometrických figur skládajících se z čtvercového rámu a svislé čáry. V druhé fázi je prezentován rám bez čáry, a to buď stejné velikosti jako originální podnět nebo zvětšený či zmenšený. Úkolem respondentů je nakreslit do prázdného rámu buď čáru o stejné délce jako původně prezentovaná čára (absolutní úloha) nebo o stejných proporcích k rámu jako měla čára v originálním podnětu (relativní úloha). Měřena je odchylka čáry v milimetrech. Dobrý výkon v absolutní úloze se se odvíjí od schopnosti vnímat délku čáry bez ohledu na kontext, který ji obklopuje (analytický styl), naopak dobrý výkon v relativní úloze je podporován schopností vnímat čáru v daném kontextu (holistický styl). Většina respondentů ze západních kultur dosahuje lepších výkonů v absolutní úloze, většina respondentů z jihovýchodní Asie dosahuje lepších výkonů v úloze relativní (Kitayama a Cohen, 2010). Další skupinou metod jsou metody založené na fenoménu slepoty ke změně a jsou zkoumány pomocí flicker metody (Rensink, O'Regan, a Clark, 1997). Respondentům jsou prezentovány série vždy dvou obrázků, které mezi sebou v rychlém tempu problikávají. Obrázky jsou totožné až na jednu odlišnost. Měří se reakční čas, ve kterém respondenti odlišnost zaznamenají. Asiaté ve srovnání s Američany či Evropany zpravidla rychleji detekují změnu na pozadí, Evropané a Američané rychleji detekují změnu ve fokálním objektu (Masuda a Nisbett, 2006). Zajímavé metody využili pro svůj výzkum ve vnímání Masuda a Nisbett (2001), kteří provedli studii, ve které srovnávali analytické a holistické vnímání na vzorku japonských a amerických probandů. Respondentům ukázali sérii deseti sekund dlouhých animovaných scén podvodního života. Každá scéna byla prezentována 2x, po prezentaci každé scény byli participanti dotazováni, co v dané scéně viděli, na odpovědi měli čas 2 minuty. Odpovědi byly kódovány podle toho, zda účastníci výzkumu zmiňovali jako první fokální objekty (největší, nejbarevnější, nejrychlejší ryby) nebo pozadí a jeho prvky (barvu vody, nepohyblivé objekty, bubliny říční dno). Američtí respondenti zmiňovali častěji fokální objekty, Japonci naopak popisovali více pozadí a jeho prvky. Po prezentaci všech scén byla respondentům prezentována sekvence 90 objektů, z nichž polovina se vyskytovala v předchozích scénách, polovina nikoliv (Nisbett a Masuda, 2003). Ze 45 objektů, které probandi již dříve viděli (23 fokálních objektů, 7 pohyblivých živočichů, 8 nepohyblivých živočichů, 7 objektů pozadí; Masuda a Nisbett, 2001), byly některé prezentovány na originálním pozadí, některé na novém pozadí a některé zcela bez pozadí. Předpokládalo se, že vzhledem k tomu, že se Japonci soustředí více na pozadí a jeho prvky, bude jejich schopnost rozpoznat již dříve viděný objekt relativně více narušena než u Američanů. Tento předpoklad se potvrdil. Zatímco u amerických respondentů se míra rozpoznání těchto 3 variant nelišila, japonští respondenti nejlépe rozpoznávali objekty na originálním pozadí a nejhůře na pozadí novém. Japonci dále popisovali více chování objektů ( Ryby plavaly. ), Američané naopak popisovali vzhled objektu ( Bylo tam 5 zelených ryb ; Nisbett a Miyamoto, 2005). V navazující studii (Masuda a Nisbett, 2001) autoři využili statické obrázky zvířat. V první fázi bylo po dobu 5 sekund respondentům postupně prezentováno 24 obrázků zvířat společně s instrukcí, aby zvířata ohodnotili na škále 1-9 podle toho, jak se jim zvířata líbí. Mezi první a druhou fázi byla vložena úloha určená k odvedení pozornosti (respondenti měli po dobu 2 minut odečítat číslo 7 od tisíce). V druhé fázi byli respondenti požádáni, aby co nejrychleji identifikovali, zda následující zvířata (fokální objekty) již viděli v první fázi (odpověď ano ne ). Manipulováno bylo se 2 proměnnými: zvířetem a pozadím. Respondentům byly prezentovány 4 možné kombinace fokálního objektu a pozadí (nové pozadí a nový objekt; nové pozadí a původní objekt; původní pozadí a nový objekt; původní pozadí a původní 40

41 objekt). Ve druhé fázi bylo respondentům prezentováno celkem 48 obrázků (24 z první fáze, 24 nových). Měřen byl reakční čas a správnost odpovědí. Byl zaznamenán rozdíl v přesnosti odpovědí v případě, že byl prezentován již viděný fokální objekt na novém pozadí (90 % Američané, 77 % Japonci). 2 Metody výzkumu holistického a analytického kognitivního stylu Za účelem provedení výzkumů vycházejících z holistického a analytického kognitivního stylu ve středoevropském prostoru jsme na základě metod popsaných v předchozí kapitole vytvořili tři adaptace těchto metod na vědecko-výzkumné platformě Hypothesis, novější verzi platformy MuTeP (Stachoň, Šašinka, Kubíček a Štěrba, 2014). 1. Flicker úloha na detekci rozdílů mezi dvěma obrázky (Change-blindness Static CBS) 2. Framed-line test (FLT) 3. Rozpoznávání dříve viděných objektů na pozadí (Figure and background FAB) Test začíná jednou zácvičnou úlohou, v níž je respondentům vysvětlen princip testu a ověřeno jeho pochopení. Pořadí jednotlivých podnětů je náhodné. Respondenti mají za úkol identifikovat změnu kliknutím myši na oblast, kde se nachází daná změna. Každý podnět je prezentován tak dlouho, dokud nedojde k identifikaci změny (ať už korektní kliknutí myši na oblast změny, či nekorektní kliknutí mimo tuto oblast), maximálně však po dobu 60 vteřin. 2.2 FLT Test FLT vychází z původního Kitayamova designu (Kitayama, Duffy, Kawamura, a Larsen, 2003). Test je modifikován v tom smyslu, že mimo čtverce jako referenčního rámce jsme použili také kruh, dále je modifikována délka čar u jednotlivých podnětů. Před začátkem samotného testu je umístěna zácvičná úloha na kreslení linie v softwaru Hypothesis. Respondent začne kreslit klikem pravého tlačítka myši na místo, ze kterého má linie vycházet, pohybem myši směrem od počátečního bodu linii natahuje, druhým klikem myši ukončí kreslení linie (viz obrázek 2). 2.1 CBS Test CBS je vytvořen podle experimentů provedených Masudou a Nisbettem (2006). Po prvotní evaluaci podnětů však bylo z důvodu zvýšení obtížnosti položek použito původní Rensinkovo (1997) časování (240 ms prezentace podnětu A 80 ms zaslepení šedou plochou 240 ms prezentace podnětu A*). Test se skládá celkem z 25 položek založených na 5 různých obrázcích. Ke každému z nich byly v programu Adobe Photoshop vytvořeny 4 varianty takovým způsobem, aby u 2 variant byl modifikován fokální objekt a jeho atributy a u 2 variant bylo modifikováno pozadí. Na následujícím obrázku je znázorněn původní podnět a jeho modifikace (v tomto případě modifikace pozadí). Obr. 2: Zácvik kreslení linie Za instrukce je vložena další zácvičná úloha, která má stejný charakter jako následující testové položky, aby byl respondent připraven na omezený čas prezentace podnětu. Celkově se test skládá z 16 položek (8 pro absolutní a 8 pro relativní úlohu). Každá položka sestává ze 2 podnětů podnětu originálního (OP) a podnětu testového (TP; viz obrázek 3). Obr. 1: Příklad položky testu CBS Obr. 3: FLT - originální a testové podněty 41

42 Původní podněty mají standardizovanou velikost 160 pixelů (hrana čtverce, resp. průměr kruhu), všechny jsou umístěny ve středu podnětového pole; manipuluje se u nich s délkou vertikální linie a jejich velikostí. Testové podněty jsou umístěny v jednom z rohů podnětového pole a jejich pořadí je totožné u absolutní i u relativní úlohy. Do středu TP v místě, kterým měli respondenti zakreslovat linii, je umístěna tenká přerušovaná vodicí linka. V úloze se sleduje délka zakreslené linie a počítá se její odchylka v pixelech od čáry v příslušném OP. Čím větší je tato odchylka, tím nepřesněji byla linie zakreslena. Na základě odchylek se počítá střední hodnota odchylky v absolutní a relativní úloze. Čím je tato střední hodnota nižší, tím lépe si respondent v úloze vedl. 2.3 FAB Test FAB má velice podobný design jako studie Masudy a Nisbetta (Masuda a Nisbett, 2001, studie II). V první fázi je respondentům prezentováno po dobu 5 sekund 24 obrázků hmyzu na 8 různých pozadích. Respondenti měli za úkol na 5bodové škále ohodnotit, jak moc se jim hmyz líbil. Druhá fáze studie slouží k odvedení pozornosti a respondenti na ní cca 2 minuty hledají rozdíly mezi dvěma podobnými výsečemi map. Ve třetí fázi jsou studentům prezentovány podobné obrázky ze 4 kategorií. původní hmyz na původním pozadí (12 položek) původní hmyz na novém pozadí (12 položek) nový hmyz na původním pozadí (12 položek) nový hmyz na novém pozadí (12 položek) Měřena je míra přesnosti rozpoznání objektů a reakční čas potřebný k identifikaci hmyzu fokálního objektu (FO). 3 Závěr Tento příspěvek pojednává o moderních teoriích a trendech výzkumu interkulturních rozdílů ve zrakovém vnímání a popisuje metody jejich zkoumání. Na Filozofické fakultě Masarykovy univerzity v Brně byly na základě teorie holistického a analytického kognitivního stylu vytvořeny tři metody, které mají ambici stát se v budoucnu jedním z nástrojů interkulturního výzkumu zrakového vnímání a souvisejících procesů. Jejich výhodou je možnost hromadné administrace, automatického zápisu dat a možnost online testování. Poděkování Tento příspěvek vznikl s finanční podporou Grantového fondu děkana Filozofické fakulty MU. Literatura Bartoš, F. (2010). Individualismus a kolektivismus v české populaci a jejich souvislost s narcismem. Sociológia, 42(2), stránky Berry, J. W., Poortinga, Y. H., Breugelmans, S. M., Chasiotis, A., a Sam, D. L. (2011). Cross-Cultural Psychology: Research and Applications. Cambridge: Cambridge University Press. Boduroglu, A., Shah, P., a Nisbett, R. E. (2009). Cultural Differences in Allocation of Attention in Visual Information Processing. Journal of Cross- Cultural Psychology, 40(3), stránky Deregowski, J. B. (1980). Illusions, Patterns and Pictures: A Cross-cultural Perspective. Academic Press. Duffy, S., Toriyama, R., Itakura, S., a Kitayama, S. (2009). Development of cultural strategies of attention in North American and Japanese children. Journal of experimental child psychology, 102(3), Haaken, J. (1988). Field dependence research: A historical analysis of a psychological construct. Signs, Hofstede, G. (1983). The cultural relativity of organizational practices and theories. Journal of international business studies, 14(2), Obr. 4: Příklad podnětového materiálu v úloze FAB Kitayama, S., a Cohen, D. (2010). Handbook of Cultural Psychology. New York: The Guilford Press. Kitayama, S., Duffy, S., Kawamura, T., a Larsen, J. (2003). Perceiving an object and its context in 42

43 different cultures A cultural look at new look. Psychological Science, 14(3), MacArthur, R. (1967). Sex differences in field dependence for the Eskimo: Replication of Berrys Findings. International Journal of Psychology, 2(2), stránky Yamazaki, Y. (2005). Learning styles and typologies of cultural differences: A theoretical and empirical comparison. International Journal of Intercultural Relations, 29(5), Masuda, T., a Nisbett, R. (2001). Attending holistically versus analytically: comparing the context sensitivity of Japanese and Americans. Journal of personality and social psychology, 81(5), 922. Masuda, T., a Nisbett, R. (2006). Culture and change blindness. Cognitive Science, 30(2), Nisbett, R., a Masuda, T. (2003). Culture and point of view. Proceedings of the National Academy of Sciences, 100(19), Nisbett, R., a Miyamoto, Y. (2005). The influence of culture: holistic versus analytic perception. Trends in cognitive sciences, 9(10), Rensink, R., O'Regan, J., a Clark, J. (1997). To see or not to see: The need for attention to perceive changes in scenes. Psychological science, 8(5), Stachoň, Z., Šašinka, Č., Kubíček, P. a Štěrba, Z. (2014). MuTeP alternativní nástroj pro testování kartografických vizualizací a sběr dat. Sborník abstraktů 23. sjezd České geografické společnosti. Univerzita Karlova v Praze. Šikl, R. (2012). Zrakové vnímání. Praha: Grada Publishing. Uskul, A., Kitayama, S., a Nisbett, R. (2008). Ecocultural basis of cognition: Farmers and fishermen are more holistic than herders. Proceedings of the National Academy of Sciences, 105(25), Van de Vijver, F., a Leung, K. (2000). Methodological issues in psychological research on culture. Journal of cross-cultural psychology, 31(1), Ventura, P., Pattamadilok, C., Fernandes, T., Klein, O., Morais, J., a Kolinsky, R. (2008). Schooling in western culture promotes context-free processing. Journal of experimental child psychology, 100(2), Weitz, J. (1971). Cultural change and field dependence. University of Ottawa. Witkin, H. A. (1967). A Cognitive Style Approach to Cross-cultural Research. International Journal of Psychology, 2, stránky

44 Kognícia a umelý život 2015, Trenčianske Teplice Lokalizácia podstratégií modelu HABS Viliam Dillinger Katedra aplikovanej informatiky, FMFI, Univerzita Komenského Mlynská dolina, Bratislava [email protected] Abstrakt V príspevku sa venujeme úpravám modelu HABS (Hierarchické priraďovanie správaní pomocou samoorganizácie), so snahou o stabilizácii a zrýchleniu jeho konvergencie. K naším predchádzajúcim zmenám (Dillinger, 2014), ktoré zlepšili stabilitu modelu, sme pridali ďalšie, vďaka ktorým model vždy skonverguje. Okrem toho sme navrhli úpravu v štruktúre vstupov, takzvanú lokalizáciu podstratégií, čo urýchlilo konvergenciu modelu. Rýchlosť konvergencie modelu HABS, ako aj vplyv lokalizácie podstratégií experimentálne porovnávame s agentmi učiacimi sa posilňovaním vo vytvorenom testovacom prostredí. 1 Úvod Medzi významné oblasti strojového učenia patrí učenie posilňovaním (reinforcement learning, RL). RL agent sa učí plánovať svoje akcie pomocou priamej interakcie s prostredím. Z hľadiska riadenia RL zahŕňa online aproximáciu riešenia stochastického problému optimálneho riadenia, väčšinou v podmienkach bez úplnej znalosti prostredia. S narastajúcou veľkosťou prostredia a počtom parametrov jeho stavov sa v RL objavujú mnohé problémy. Medzi hlavné patria prekliatie dimenzionality, neefektívne šírenie odmeny, slabý prenos vedomostí a zdĺhavá náhodná chôdza (Barto a Mahadevan, 2003). Na tieto problémy sa snažia odpovedať modely hierarchického učenie posilňovaním (HRL) pomocou využitia rôznych hierarchických štruktúr a časovo rozšírených akcií. Medzi modely HRL patrí aj model HABS (Moerman, 2009) (Hierarchické priraďovanie správaní pomocou samoorganizácie), ktorého úpravou sa zaoberáme v tomto príspevku s cieľom stabilizovať a zrýchliť jeho konvergenciu. Tento príspevok je radený nasledovne. V druhej časti definujeme Semi-Markovov rozhodovací proces a následne v tretej časti pomocou neho formalizujeme testovacie prostredie, v ktorom budeme porovnávať jednotlivých agentov. Štvrtá časť obsahuje popis klasického RL. V piatej časti popisujeme funkčné aproximátory a porovnanie klasických RL agentov, ktorí ich využívajú. Šiesta časť obsahuje popis modelu HABS, naších úprav zameraných na jeho stabilizáciu a jeho porovnanie s klasickým RL. V Siedmej časti popisujeme lokalizáciu podstratégií modelu HABS ako nástroj na zrýchlenie konvergencie tohoto modelu. 2 Semi-Markovov rozhodovací proces Semi-Markovov rozhodovací proces (Russell a Norvig, 2003) (Markov decision process, SMDP) je matematický model rozhodovania. Agent vyberá svoje akcie len na základe aktuálneho stavu. Jeho jedinou spätnou väzbou je odmena (trest), ktorú môže, ale nemusí dostať pri každom vykonaní akcie. Agent nemá spätnú väzbu o tom, čo spôsobilo zisk odmeny (trestu) a teda jednou z jeho úloh je zistiť postupnosť akcií, ktorá k nim vedie. Medzi najťažšie úlohy patria tie, pri ktorých agent dostáva odmenu len pri úspešnom, respektíve trest pri neúspešnom splnení úlohy. Formálne, SMDP je štvorica S, A, P, R kde S je konečná množina stavov, v ktorých sa agent môže nachádzať, A je konečná množina akcií. V stave s agent môže vykonať akciu z množiny A s, A = s S A s; P je funkcia pravdepodobnostnej distribúcie nasledujúcich stavov. Ak agent vykoná akciu a v stave s, stav prostredia sa zmení na s za τ časových jednotiek s pravdepodobnosťou P (s, τ s, a); R je funkcia odmeny. Po vykonaní akcie a v stave s a presunu do stavu s za τ časových jednotiek, agent dostane odmenu R(s, τ s, a); Výber akcií agenta v jednotlivých stavov porstredia popisuje stratégia (policy) a = π(s), s S, a A s. Úlohou agenta je nájsť optimálnu stratégiu, ktorá maximalizuje sumu budúcich diskontovaných odmien v každom stave. R t = γ n r t+n n=0 kde γ (0, 1) je diskontný faktor. 3 Testovacie prostredie Na porovnávanie rýchlosti konvergencie modelov sme vytvorili prostredie znázornené na obrázku 1. Stav prostredia je reprezentovaný pozíciou agenta (jeho x-ovou 44

45 a y-ovou súradnicou). Agent môže vykonať 4 akcie - krok smerom na sever, východ, juh a západ. Ak sa v danom smere nachádza stena (v obrázku čierne políčko), jeho pozícia sa nezmení. Agent začína epochu v počiatočnom stave, ktorý sa nachádza v pravom hornom rohu (označený S) a epocha končí prechodom agenta do jedného z finálnych stavov v ľavom hornom rohu (označené F). Agent dostane odmenu iba pri prechode do finálneho stavu. Najkratšia cesta z štartového stavu do finálneho má dĺžku 28 krokov. Prostredie je rozdelené na 7 abstraktných stavov (pre potreby modelu HABS, pozri kapitolu 6). Na obrázku sú ich hranice zobrazené pomocou prerušovanej čiary. aproximovať v často navštevovaných, a teda relevantných stavoch. 4.1 Učiace pravidlá Medzi najčastejšie používané učiace pravidlá v RL patrí Q-učenie. Ak sa agent nachádza v stave s, vykoná akciu a, dostane sa do stavu s za τ časových jednotiek, pričom získa odmenu r, upraví svoju Q-funkciu pomocou vzťahu ) Q(s, a) = (1 α t )Q(s, a)+α t (r + γ τ max Q(s, a ) a A s F F F F F S r = r t+1 + γr τ γ t+τ r t+τ kde α (0, 1) je rýchlosť učenia. Ak majú susediace stavy v prostredí podobné maximálne Q-hodnoty, aj drobné chyby v aproximácii Q- funkcie môžu mať za následok veľké zmeny v stratégii agenta. Tento problém rieši učenie pomocou zvýhodňovania (Advantage learning) (Baird III, 1999), ktoré rozširuje učiace pravidlo Q-učenia na Obr. 1: Testovacie prostredie. V pravom hornom rohu (označený S) sa nachádza počiatočný stav, v ľavom hornom rohu (označené F) sa nachádzajú finálne stavy. Prerušovanými čiarami sú označené hranice medzi abstraktnými stavmi. 4 Učenie posilňovaním Jedným zo spôsobov, ako nájsť optimálnu stratégiu, je pomocou učenia posilňovaním. RL rieši úlohu pomocou aproximácie Q-funkcie Q(s, a) (action-value function), ktorá odhaduje budúce odmeny pri výbere akcie a v stave s. Táto funkcia sa upravuje pomocou učiaceho pravidla pri každom vykonaní akcie na základe predchádzajúceho stavu, získanej odmeny pri aktuálnom kroku a nasledujúceho stavu. Ak je získaná odmena vysoká alebo sa vďaka nej agent dostal do stavu, v ktorom je možné vykonať akciu s vysokým odhadom budúcich odmien, posilní práve vykonanú akciu. Naopak, ak agent získal negatívnu odmenu (trest) alebo sa dostal do stavu, kde sú odhady budúcich odmien všetkých akcií nízke, oslabí práve vykonanú akciu. Tieto úpravy sa vykonávajú pozdĺž a v okolí trénovacích trajektórií v prostredí. Trajektórie môžeme získať pomocou simulácií, prípadne z priamej interakcie s porstredím. Takto získaná Q-funkcia bude vedieť dobre Q(s, a) = (1 α t )Q(s, a) + α t (max Q(s, a)+ a A s r + γ τ max a A s Q(s, a ) ) max a As Q(s, a) kτ kde α (0, 1) je rýchlosť učenia a k (0, 1) je škálovací faktor. Pri použití tohoto pravidla ostáva hodnota optimálnej akcie v danom stave rovnaká, avšak všetky ostatné akcie sú (1/kτ)-krát viac vzdialené od Q-hodnoty optimálnej akcie ako pri Q-učení. To má za následok rýchlejšiu konvergenciu a menšiu náchylnosť na chyby. 4.2 Explorácia prostredia Jednou z hlavných výhod RL je, že nepotrebujeme poznať zákonitosti prostredia (funkcie P a R), čo umožňuje využívať RL aj v reálnom prostredí. To má, naopak, za následok neschopnosť agenta rozoznať, či je aktuálne naučená stratégia optimálna, alebo nie. Agent preto potrebuje neustále skúmať (explorovať) prostredie, teda niekedy vykonať suboptimálnu akciu, čím môže nájsť lepšie riešenie. Medzi najrozšírenejšie metódy explorácie patrí Boltzmannova explorácia, pri ktorej pravdepodobnosť výberu akcie je úmerná jej Q-hodnote vzhľadom na Q-hodnoty ostatných akcií v danom stave. Pravdepodobnosť, že v stave s vyberie akciu a je exp(q(s, a)/λ) P (s, a) = a A s exp(q(s, a )/λ) kde λ je teplotný parameter, ktorý kvantifikuje mieru explorácie. 45

46 5 Funkčné aproximátory Na reprezentáciu Q-funkcie sa v RL najčastejšie používajú funkčné aproximátory. Okrem šetrenia pamäte ponúkajú aj možnosť prenosu vedomostí do neznámych stavov, čo môže urýchliť konvergenciu Q-funkcie. Pre každú akciu je vytvorený jeden funkčný aproximátor, ktorého vstupom je zvolený stav prostredia a výstupom odhadovaná Q-hodnota akcie. V práci používame ako funkčné aproximátory neurónové siete, konkrétne viacvrstvový perceptrón a RBF siete. 5.1 Viacvrstvový perceptrón Viacvrstvový perceptrón (multi-layer perceptron, MLP) sa skladá zo vstupnej vrstvy (x), výstupnej vrstvy (y), minimálne jednej skrytej vrstvy (h) a synaptických prepojení medzi nimi (V, W). Počet neurónov na skrytých vrstvách je premenlivý a určuje výpočtovú zložitosť modelu. V naších experimentoch sme používali MLP s jednou skrytou vrstvou. Učenie MLP sa realizuje pomocou úprav váh synaptických prepojení pomocou učiteľa, teda na základe rozdielu výstupu siete a požadovaným výstupom (d). Výstup siete vyrátame ako h = f(vx) f(net) = y = Wh e net kde f(net) je aktivačná funkcia (v našom prípade sigmoid). Učenie siete prebieha nasledovne: najprv sa vyráta chyba neurónov výstupnej vrstvy (δ y ) a pomocou jej spätného šírenia (backpropagation, BP) získame chybu na skrytej vrstve (δ h ). δ y = d y δ h = W T δ y. h. (1 h) kde. je vektorové násobenie po prvkoch a h. (1 h) je derivácia vybranej aktivačnej funkcie. Pomocou získaných chýb a aktivácií vrstiev upravíme synaptické prepojenia W = W + αδ y h T 5.2 RBF siete V = V + αδ h x T Siete s radiálnymi bázovými funkciami (radial-basis function, RBF) sú, čo sa týka štruktúry, podobné ako MLP s jednou skrytou vrstvou. Každý z RBF neurónov na skrytej vrstve má svoj stred (vektor rovnakej veľkosti ako je vsutp) a jeho aktiváciu vyrátame podľa vzťahu h i = exp( σ x c i 2 ) y = Wh Učenie prebieha rovnako ako v prípade MLP, avšak menia sa iba synaptické prepojenia medzi skrytou a výstupnou vrstvou. Stredy sú určené pri vytvorení siete a počas trénovania sa nemenia. Zásadný rozdiel oproti MLP je v lokálnosti správania. Ak RBF sieť učíme s určitým vstupom, zmena správania bude lokálna. Pri MLP by trénovanie s rovnakým vstupom ovplyvnilo výstup siete pri akomkoľvek vstupe. Ak sa teda agent dlhodobo zasek-ne" v istej časti prostredia, môže sa odučiť správanie v iných častiach prostredia. V prípade RBF sietí by tento problém nenastal. Naopak, RBF siete podliehajú prekliatiu dimenzionality, teda s narastajúcim počtom parametrov stavov prostredia exponenciálne rastie výpočtová zložitosť siete z dôvodu nutnosti väčšieho počtu neurónov na skrytej vrstve. 5.3 Porovnanie funkčných aproximátorov V prvom experimente sme porovnávali rýchlosť konvergencie klasického RL agenta trénovaného pomocou učenia zvýhodňovaním s troma rôznymi funkčnými aproximátormi na reprezentáciu Q-funkcie. Konkrétne išlo o MLP, MLP s pozičným kódovaním vstupu a RBF sieť. Pozičné kódovanie poskytuje čiastočnú lokálnosť správania MLP, avšak len s lineárnym nárastom zložitosti s narastajúcim počtom parametrov prostredia (Sutton, 1996). Výsledky experimentu zobrazuje obrázok RL - MLP RL - POP-MLP RL - RBF #10 6 Obr. 2: Porovnanie priemernej rýchlosti konvergencie klasického RL agenta podľa použitého funkčného aproximátora. Najrýchlejšiu konvergenciu z porovnávaných funkčných aproximátorov dosiahla RBF sieť. MLP s pozičným kódovaním vstupu bol v priemere približne 5-násobne a MLP až 70-násobne pomalší ako RBF sieť. 6 Model HABS Model HABS pozostáva z dvoch vrstiev. Vrchná vrstva obsahuje stratégiu, ktorá operuje nad abstraktným stavovým priestorom vytvoreným programátorom. Abstraktný 46

47 stav združuje niekoľko kompaktných stavov prostredia V pôvodnom algoritme sa z dôvodu lepšieho využitia a predpokladá sa istá geometrická štruktúra prostredia. informácie trénovala akcia, ktorá bola na základe klanižšia vrstva obsahuje zvolený počet podstratégií. Tieto sifikácie vykonaná, a nie akcia, ktorá bola vybraná, čo podstratégie sú volané stratégiou ako podprogramy a reav má špecifických prostrediach za následok zacyklenie lizujú prechody medzi abstraktnými stavmi (abstraktné správania agenta a teda neúspešnú konvergenciu. Ak straakcie). Podstratégia vykonáva primitívne akcie, až kým tégia zavolá podstratégiu v stave, v ktorom nie je možné Filling In The Fifth Property nenastane zmena abstraktného stavu, alebo kým jej nevyvykonať zmenu stavu podľa jej vektora správania, jej vyin conclusion,we fromlimit. our abstract state space that it gives us these useful clusters of high levelkonávanie skončí s veľkou pravdepodobnosťou kvôli časopršídemand časový actions, instead of behaviours scattered all over the place. This is illustrated in fig vému limitu a tento presun bude klasifikovaný ako vektor správania inej akcie. Ak má vybraná podstratégia vysoký odhad budúcich odmien a všetky ostatné podstratégie majú tento odhad veľmi nízky, tento stav sa môže ešte prehlbovať, čo vedie k spomínanému zacykleniu. Preto sme toto učenie upravili a ak podstratégia ukončí svoje vykonávanie z dôvodu vypršania časového limitu, stratéfigure 5.9: Abstract states as used in H ABS: the mapping from state space to an abstract representation gia trénuje zvolenú abstraktnú akciu. Obr. 3: Abstraktný stavový priestor a abstraktné akcie. preserves (some of the) underlying structure of the state space and ensures that the actually occurring high level actionsprevzaté are highly clustered (the black arrows). See fig. 4.3 (the H ASSLE mapping) for comparison. od Moerman (2009). In light of the analysis above about the need of an underlying structure in the abstract state space6.2 (in order to derive Správanie a good heuristic), we can now fill in the fifthjej property thatsprávania. we gave for H ABS (see podstratégie popisuje vektor section 5.1.6). The fifth property can be made more precise in terms of the Behaviour Space and the Vektory správania sa počas učenia samoorganizujú tak, assumption related to difference vectors (section 5.2.2) can be included: Porovnanie modelu HABS a klasického učenia posilňovaním aby ich smery popisovali čo najviac smerov prechodov (5 a) actually occurring transitions between abstract states need to be distributed non-uniformly in thev druhom experimente sme porovnávali rýchlosť konvermedzi podstratégia vykoná pregencie modelu HABS obsahujúceho naše úpravy s klasicbehaviour Space.abstraktnými They need to formstavmi. a limited Ak amount of distinct groups chod medzi abstraktnými stavmi, je odmenená iba vtedy, kými RL agentmi z časti 5.3. Model obsahoval 4 podstrakeď vektor správania tohoto prechodu je klasifikovaný ako tégie a jednu stratégiu, pričom všetky používali MLP ako In fact, the more non-uniformly the behaviours are distributed, the less distinct groups or clusters jej vektor správania. V opačnom prípade je potrestaná. there are and the fewer subpolicies (i.e. high level actions) H ABS needs. This means that a state abstrac-funkčný aproximátor. Výsledky experimentu zobrazuje trénovaná pomocou odmien naakumulovation is better ifstratégia it has fewer je clusters of behaviours. obrázok 5. ných počas vykonávania vybranej podstratégie. (5 b) difference vectors that are similar should correspond to similar behaviours Classification and Clustering 200 For the experiments described in this thesis, a very simple mechanism is used to do the classification. Since behaviours are treated as vectors (which is a simplification) it is reasonable to use a method that is suited to vectors, therefore an adaptive clustering algorithm was selected. A cluster is assigned to each subpolicyi. The cluster center chari can be considered the characteristic behaviour of that subpolicy. During learning, the cluster center is moved towards newly executed behaviour if this recent behaviour was already classified as belonging to this cluster. The update is done according to:!! ""!! char i, t+!t (1 ") char i, t + " exec i,t t+!t (5.1)!! where exec i,t t+!t is the behaviour that the subpolicy executed starting at time t and ending at t +!t!! (calculated with Execi ) and char i t is the characteristic behaviour vector (i.e. cluster center) that was as!! signed to the subpolicy that just executed exec i,t t+!t. The factor " (0 " 1) is learning rate determines how much the characteristic behaviour is moved towards the newly executed behaviour. The definition of Execi is related to the clustering. This function needs to calculate the executed!! behaviour exec i and represent it in a suitable way. When the behaviours are treated as vectors, it is defined as the difference vector between the abstract states:!!!!! exec i = Exec(S,S ) = S i Si HABS - original RL - POP-MLP RL - RBF #105 (5.2) Figure 5.1: TheObr. hierarchical structure of štruktúra H ABS: the large gray Prevzaté circles are the level states. The 4: Hierarchická HABS. odhigh MoEach subpolicy assigned cluster center and specialize in that clustersthe willactions inobr. 5: Porovnanie priemernej rýchlosti konvergencie black arrows representis the high alevel Q-values (thewill thicker they are, thecluster, higherbut thethese Q-value). erman (2009). turn provide conditions the subpolicy. If a subpolicy does something that is similar to its (behaviours) onthe thegoal high level areforclassified to a small set of characteristic behaviours (dashed arrows klasického RL agenta s rôznymi funkčnými aproximáleading towards the gray arrows). The classes are each associated with a particular subpolicy. Notations tormi a modelu HABS. correspond to those in section H ASSLE on the6.1 other Stabilizácia hand first treats konvergencie each of the transitions as unique (one-to-one) and then relates modelu Model HABS s našími zmenami úspešne skonvergoach transition to all the subpolicies (one-to-many) by means of the Capacities (see fig. 5.2). The probval vo všetkých testoch a v priemere bol približne 1.4-krát ems with H ASSLEKvôli were all related to the number of high level actions, and their unique nature. But snahe o lepšie šírenie odmeny a prehľadávanie ince H ABS uses the characteristic behaviours, of which there are only a few, it does not suffer from the ako RBF sieť. Príklad nájdenej stratégie a jej podpomaší priestoru má originálny model problémy s učením a poame problems. stratégií vizualizuje obrázok 6. čas experimentov vo väčšine prípadov neskonvergoval. Na zmiernenie problému sme navrhli niekoľko drobných úprav, ktoré tento problém minimalizovali. Konkrétne išlo o odstránenie odmeny podstratégie pri vypršaní časového limitu, použitia smerového vektora miesto vektora presunu ako vektora správania a zohľadňovanie trvania akcie pri učení stratégie (Dillinger, 2014). Ak zložité prostredie obsahuje jednoduchú dynamiku, model HABS ju vie nájst a pomocou nej vie aj bez použitia lokálnych funkčných aproximátorov dosiahnuť veľmi dobré výsledky. Táto vlastnosť zároveň pomáha pri prieskume prostredia a ponúka priame využitie nadobudnutých schpností, čím sa zlepší prenos vedomostí. 47

48 a) b) c) d) e) Obr. 6: Príklad úspešne natrénovanej stratégie a podstratégii modelu HABS. a) Stratégia. Čísla reprezentujú číslo akcie s najväčšou Q-hodnotou. b d) Podstratégie. Šípky znázorňujú smer akcie s najväčšou Q-hodnotou, miesta kde sú stratégie v nesúlade s ich vektorom správania sú farebne označené 7 Lokalizované podstratégie modelu HABS Ak má podstratégia ako svoj vstup priamy vstup z prostredia, na rozhraní dvoch abstraktných stavov vzniká veľký skok v Q-hodnotách akcie, ktorá spôsobí prechod medzi nimi. Jej Q-hodnota pred prechodom bude extrémna (či pri správnom alebo nesprávnom prechode) a v stave, do ktorého sa dostane, bude blízka 0. Keďže väčšina funkčných aproximátorov (vrátane MLP a RBF siete) sa snaží aproximovať funkciu pri čo najmenšej derivácii, tento skok spomalí konvergenciu. Príklad v testovacom prostredí zobrazuje obrázok 7. Ako riešenie tohoto problému sme navrhli lokalizované podstratégie, ktorých vstup je relatívna pozícia vzhľadom na stred abstraktného stavu, v ktorom sa agent nachádza. Stredy abstraktných stavov sú určené programátorom spolu so samotnými abstraktnými stavmi. V našom testovacom prostredí sme ako stredy použili ťa a) b) pozícia x Obr. 7: Príklad skoku hodnôt trénovanej Q-funkcie. a) Rez priestorom b) Q-hodnoty podstratégie s vektorom správania smerujúcim na západ pre akciu krok na západ na zvolenom reze priestorom. žiská jednotlivých abstraktných stavov. Okrem odstránenia skokov táto zmena spôsobí aj lepší prenos vedomostí, pretože ako je vidno z obrázku 6, podstratégie bez lokalizácie majú bezchybné správanie, teda správanie podľa ich vektora správania, iba v stavoch, v ktorých sú využívané stratégiou. Ak by bolo potrebné, aby podstratégie reagovali mierne inak v rôznych abstraktných stavoch, je možné na vstup pridať stred aktuálneho abstraktného stavu. 7.1 Vplyv lokalizovaných podstratégií na rýchlosť konvergencie V poslednom experimente sme porovnávali rýchlosť konvergencie dvoch modelov HABS s lokalizovanými podstratégiami a ostatných modelov spomínaných v tomto článku. Prvý model s lokalizovanými príznakmi využíval MLP v oboch vrstvách, druhý obsahoval RBF sieť pre stratégiu a a MLP ako funkčný aproximátor podstratégií. Výsledky experimentu zobrazuje obrázok HABS - original HABS - local - MLP HABS - local - RBF RL - RBF #10 4 Obr. 8: Porovnanie priemernej rýchlosti konvergencie klasického RL agenta s RBF sieťou, modelu HABS, modelu HABS s lokalizovanými podstratégiami s MLP na oboch vrstvách a modelu HABS s lokalizovanými podstratégiami s RBF sieťou na vyššej vrstve a MLP na nižšej. Z tretieho experimentu vyplýva, že lokalizácia podstratégií mala pozitívny vplyv na rýchlosť konvergencie 1 48

49 a takto upravený model HABS dokázal skonvergovať rovnako rýchlo ako klasický RL agent s RBF sieťou. Ak sa však využila RBF sieť na stratégiu, dokázal náš model skonvergovať 2-krát rýchlejšie ako RL agent s RBF sieťou. Náš agent potreboval iba približne 30 epizód na naučenie sa optimálnej stratégie. Naučené lokalizované podstratégie, na rozdiel od nelokalizovaných, v každom stave zvolili správnu akciu vzhľadom na ich vektor správania. 8 Záver Self-Organization. Dizertačná práca, Utrecht University. Russell, S. a Norvig, P. (2003). Artificial Intelligence: A Modern Approach. Prentice-Hall, 2. vyd. Sutton, R. S. (1996). Generalization in reinforcement learning: Successful examples using sparse coarse coding. V Advances in NIPS 8, str MIT Press. V príspevku sme sa zaoberali úpravami modelu HABS. Pomocou naších predchádzajúcich úprav (Dillinger, 2014) a úpravy učenia stratégie pri vypršaní časového limitu podstratégie sme stabilizovali model natoľko, že vo všetkých experimentoch vždy skonvergoval. Ďalej sme navrhli lokalizáciu podstratégií, kedy vstupom podstratégie je relatívna pozícia vzhľadom na stred aktuálneho abstraktného stavu určeného programátorom. Táto úprava značne zrýchlila konvergenciu modelu. Model HABS, ako aj jeho lokalizáciu podstratégií, sme experimentálne porovnali s klasickými RL agentmi využívajúcimi rôzne funkčné aproximátory. Najrýchlejší bol model HABS s lokalizáciou podstratégií, stratégiou s RBF sieťou a podstratégiami s MLP. Agent s týmto modelom dokázal v testovacom prostredí skonvergovať za približne krokov, respektíve behom 30 epoch, čo pri optimálnej dĺžke cesty 28 považujeme za veľmi dobrý výsledok. Poďakovanie Tento príspevok bol podporený grantom VEGA 1/0898/14. Literatúra Baird III, L. C. (1999). Reinforcement Learning Through Gradient Descent. Dizertačná práca, Carnegie Mellon University Pittsburgh. Barto, A. G. a Mahadevan, S. (2003). Recent advances in hierarchical reinforcement learning. In Discrete-Event Dynamic Systems: Theory and Applications, 13: Dillinger, V. (2014). Učenie posilňovaním: hierarchia v rozhodovaní alebo vo funkčnej aproximácii? V Kognitivní věda a umělý život II, str Slezská univerzita v Opavě. Haykin, S. (1999). Neural networks: A Comprehensive Foundation. Prentice Hall International, 2nd. vyd. Moerman, W. (2009). Hierarchical Reinforcement Learning: Assignment of Behaviours to Subpolicies by 49

50 Kognícia a umelý život 2015, Trenčianske Teplice Oscary, HDP a CRT: Efekt ukotvenia u finančných profesionálov v kontexte doménovej špecifickosti a kognitívnej reflexie Katarína Dudeková, Lenka Kostovičová Ústav experimentálnej psychológie SAV Dúbravská cesta 9, Bratislava [email protected], [email protected], Abstrakt Už niekoľko dekád je ukotvenie poskytnutím relevantnej alebo irelevantnej číselnej informácie známe ako jeden z najrobustnejších efektov na odhady, vytvárané v podmienkach neistoty. Nakoľko dôležité sú v procese vzniku tejto odchýlky expertíza a kognitívna reflexia je nejednoznačné. Experimentálne sme overili redukciu efektu poskytnutej numerickej kotvy na odhad v doméne pracovnej expertízy, pričom ďalším prediktorom finančných odhadov bola schopnosť potlačiť automatické odpovede. Bez ohľadu na doménu bola miera podliehania efektu ukotvenia v negatívnom vzťahu k dĺžke praxe profesionálov v oblasti financií. Úvod "Behaviorálni vedci zostavili dlhý zoznam odchýlok a heuristík... Finančníci by si mali dávať pozor najmä na týchto päť: ukotvenie a uspôsobenie, rámcovanie, optimizmus, nadmerná sebadôvera, a sebe-slúžiaca zaujatosť" (Edward Teach v článku "Vyhýbanie sa rozhodovacím pasciam" pre CFO 1 Magazine). Ukotvenie nie je len otázkou laboratórnych experimentov, ale aj bežného života v prípadoch, keď nemáme dostatočné množstvo informácií. Veľká časť nášho bytia je zasadená do situácií rizika a neistoty. Neistota v nás vyvoláva pocit, v ktorom sa snažíme nájsť aspoň nejaké vodítko. Ako sa v situáciách aktuálnej nevedomosti orientujeme v prípade, keď sa od nás očakáva istý odhad, riešenie, či úsudok? Môžu minulé skúsenosti a vedomosti, nadobudnuté v rámci štúdia či pracovného profilovania, vybudovať imunitu voči predkladaným vodiacim informáciám? Čo nastane v prípade, že máme na adekvátne posúdenie predkladaného problému príliš málo informácií? Ukončíme úsudok priskoro? Alebo nazbierame kognitívne úsilie na pokračovanie v usudzovaní? Bude naša ochota venovať úsilie súvisieť s tým, či sa v danej odhadovanej doméne orientujeme, je pre nás atraktívna, príbuzná našim záujmom a vedomostiam? Hodnotíme pozorne ponúknuté informácie, sústredíme sa na naše skúsenosti alebo intuitívne odhadujeme správnu odpoveď? V snahe poskytnúť odpoveď na mnohé otázky, vynárajúce sa pri pôsobení numerických informácií, nás zaujíma, či doména, v ktorej sa ľudia profesionálne pohybujú, bude do istej miery pôsobiť na zorientovanie sa v otázkach, na ich prípadné adekvátnejšie posúdenie či odhad, pokiaľ môžu na odpoveď využiť v minulosti získané vedomosti a skúsenosti. 1 Efekt ukotvenia, expertíza a kognitívna reflexia Aj napriek tomu, že bolo desiatkami štúdií, výskumov, preukázané, že numerické informácie ovplyvňujú širokú škálu našich úsudkov a rozhodnutí, základné princípy týchto procesov stále nie sú úplne jasné (pre prehľad pozri Epley, 2004; Furnham a Boo, 2011; Chapman a Johnson, 2002). Poznanie intenzívneho dopadu efektu ukotvenia so sebou prináša snahu o identifikovanie možností jeho redukcie, prípadne predkladanie a skúmanie príkladov, kedy k odchýlke nedôjde. V odpovedi na otázku, nakoľko sú v procese vzniku ukotvenia prostredníctvom irelevantnej (alebo k problému nerelevantnej) informácie dôležité expertnosť a zapojenie systému analytického alebo intuitívneho myslenia, sú zistenia výskumov protichodné. 1.1 Efekt ukotvenia K efektu ukotvenia dochádza pri uvažovaní o konkrétnej hodnote neznámeho množstva predtým, než je táto hodnota odhadovaná. Prvotne prezentovaný údaj zapôsobí ako kotva, ktorá ovplyvní následný odhad. Tento jav je natoľko robustný, že patrí k najspoľahlivejším a najmasívnejším výsledkom experimentálnej psychológie (Kahneman, 2011). Odmietnutie kotvy, ako ponúknutej hodnoty pre odhad, a následné vzďaľovanie sa od nej, vyžaduje zvýšené úsilie. Vo všeobecnosti sa ľudia nechcú vystavovať kognitívne náročnejším okolnostiam, a preto príjmu finálne rozhodnutie, ktoré je skreslené v smere pôvodnej hodnoty kotvy. Odhady sa následne 1 CFO = Central Financial Officer 50

51 pohybujú približne v okolí čísla, o ktorom ľudia prvotne uvažovali (Epley a Gilovich, 2005). Ukotvenie má vplyv na mnoho typov úloh vyžadujúcich úsudok. Medzi ne patria odpovede na otázky týkajúce sa faktov, hodnotenia rizika a neistoty, štatistické závery, zhodnotenia peňažných lotérií, úsudky o vlastných schopnostiach a tiež hodnotenia budúceho výkonu (Chapman a Johnson, 1999). Môže byť vplyv kotvy zmiernený dostupnosťou vedomostí o danej alebo príbuznej problematike? 1.2 Expertnosť ako faktor pôsobiaci pri zmenšovaní efektu ukotvenia Jedna z možností, kedy môžu byť úsudky viac imúnne voči efektu kotiev, nachádza podporu v niekoľkých štúdiách preukazujúcich, že zorientovanosť v doméne problému zoslabuje vplyv kotiev (napríklad Mussweiler a Englich, 2003; Smith, Windschitl a Bruchmann, 2013). Smith a spol. (2013) zisťovali mieru efektu ukotvenia v oblasti, v ktorej sa výskumná vzorka líšila v úrovni vedomostí (americký futbal, otázky o krajine). Rozsah vedomostí určoval nielen objektívny test, ale aj subjektívne seba-hodnotenie účastníkov, pričom participanti s lepšími vedomosťami vykazovali nižší efekt ukotvenia. Pre lepšie zachytenie premennej expertnosti porovnával Schlattmann (2012) účinnosť redukcie efektu ukotvenia aj na vzorke expertov a laikov, pričom obe skupiny boli vystavené rovnakej kotve. Predpokladal, že pre expertov bude táto kotva menej prijateľná ako pre laikov, pretože so zadanými úlohami majú viac skúseností. Experti by mohli skôr ako laici vedieť, ktorým smerom prispôsobovať svoje odpovede, odhad zvýšiť alebo znížiť. Redukciu efektu ukotvenia preukázal v úlohách s vyššou expertnosťou, pričom práve pri nich predpokladal pôsobenie zvýšenej sebadôvery ako premennej, ktorá nedovoľuje participantom dostatočne rešpektovať efekt ukotvenia a opraviť svoje odpovede. Pri úrovni expertnosti hrá podľa Smitha a spol. (2013) dôležitú úlohu aj extrémnosť kotvy, pričom pri hypotetickom návrhu sa odvoláva na možnosť, že čím bude zadaná kotva extrémnejšia, tým viac bude úroveň vedomostí zmierňovať efekt ukotvenia. Na druhej strane, iné výskumy ponúkajú menej evidencie pre znižujúce kotviace účinky vedomostí (Englich, 2008; Cheek, Coe-Odess a Schwartz, 2015). Pri skúmaní odborných posudkov sa ukázalo, že aj napriek sofistikovaným vedomostiam a skúsenostiam podliehajú účinkom vodítok aj profesionáli ako sudcovia, lekári, či realitní makléri, a to aj v prípade, že robia úsudky vo svojej odbornej oblasti a dokonca aj v prípadoch, kedy sú kotvy očividne irelevantné (Cheek a spol., 2015). Povedané sumarizujúco, účinky predošlých vedomostí v rámci skúmanej domény na kotvenie sú vo výskumoch nejasné až protichodné, a teda priťahujú pozornosť ďalších výskumníkov. Výsledky experimentov môžu byť podmienené spôsobom operacionalizácie premenných, ktoré k efektu ukotvenia vedú, ako aj v metóde, ktorú experimentátori použili. 1.3 Duálne procesy ako príčina vzniku efektu ukotvenia a kognitívne úsilie ako možnosť jeho potlačenia? Predpokladom pre uchopenie ľudského usudzovania a rozhodovania je porozumenie dvom režimom myslenia. Teórie duálnych procesov v rámci kognitívnej psychológie uvažujú o jednom automatickom, implicitnom, heuristickom a druhom vedomom, kontrolovanom a explicitnom systéme, ktoré napríklad Stanovich a West (1999) nazvali neutrálne Systém 1 a Systém 2. Príčiny vzniku efektu ukotvenia sa líšia v závislosti od zapájajúceho sa systému (Schlattman, 2012). Efekt môže byť spôsobený neuváženými procesmi (Systém 1) alebo premyslenými procesmi (Systém 2). Systém 1 sa snaží vytvoriť svet, v ktorom je kotva pravdivým číslom, čo je jeden z prejavov asociačnej koherencie 2. Pri nazeraní na popisovanú odchýlku cez intuitívny systém sa predpokladá participantove očakávanie, že prezentovaná hodnota má informačnú úlohu, a preto je správna odpoveď blízko nej (Schlattman, 2012). Číselný priming zase vysvetľuje efekt ukotvenia ako jav, kedy hodnota kotvy je dostupnejšia, a tak pravdepodobnejšie ovplyvní následný úsudok (Mussweiler a Strack, 2000). Efekt ukotvenia ako výsledok činnosti Systému 2 sa prezentuje ako proces, v ktorom sa ľudia ukotvia na daný štandard a následne prispôsobujú svoj počiatočný úsudok, pokiaľ sa nedostanú na hranicu hodnôt prijateľných pre daný odhad (Tversky & Kahneman, 1974). Vysvetlenie efektu v medziach "prispôsobenia" spočíva v tom, že kotva figuruje ako hodnota, od ktorej sa mentálne vzďaľujeme a presnosť odhadu (dostatočné vzdialenie sa od ponúkanej kotviacej hodnoty) je závislá od vyvinutého kognitívneho úsilia. Epley a Gilovich (2006) vo svojej štúdii overovali, či miera kognitívneho úsilia vplýva na silu efektu ukotvenia. Predpokladali, že ľudia majú tendenciu k ukončeniu vytvárania adekvátneho odhadu priskoro po dosiahnutí prvej uspokojivej hodnoty. Výsledné úsudky boli presnejšie, keď motivovali ľudí myslieť viac, než by predpokladali, že je bežné. Uvedené vysvetlenia väčšinou nie sú vnímané ako vzájomne sa vylučujúce, ale ako komplementárne. Hlbšie pochopenie teórií a ich fungovanie v experimentoch je viditeľné pri pokusoch o redukciu efektu ukotvenia, pri ktorých má rovnaká manipulácia s efektom rôzne výsledky v závislosti od prezentovanej úlohy a typu ukotvenia. 2 samo posilňujúci sa model kognitívnych, emocionálnych a fyzických reakcií na určitý podnet, sled navzájom prepojených asociácií 51

52 1.4 Cieľ výskumu V našej experimentálnej štúdii sme chceli overiť vplyv pridelenej numerickej informácie na úsudky finančných profesionálov, a rozdiely v miere ukotvenia na základe schopnosti zapojiť analytické myslenie a inhibovať intuitívny systém. Taktiež nás zaujímalo, či subjektívne vyjadrená istota v rámci jednotlivých odhadov súvisí s tým, do akej miery boli participanti ovplyvnení experimentátorom určenou číselnou hodnotou. 3) Koľko medailí získalo Nórsko v celej histórii zimných olympijských hier (t.j )? (ZOH; 165) 4) O koľko miliárd eur vzrástlo HDP Slovenska od roku 2010 do roku 2014? (HDP; 8,8) 2 Metódy Sledovali sme štandardný efekt ukotvenia, kedy je pozornosť participantov zámerne smerovaná na hodnotu kotvy, pričom participanti sú konfrontovaní s tým, aby porovnali svoj úsudok s hodnotou kotvy a následne majú uviesť svoj vlastný odhad. 2.1 Participanti Experimentu sa zúčastnilo 45 finančných profesionálov, ktorých sme pre účely tejto štúdie definovali ako ľudí, ktorí pri svojej práci narábajú s peniazmi, finančnými produktmi a predpokladá sa u nich ekonomické vzdelanie (napríklad účtovníctvo, mzdy, prieskum finančného trhu, finančné poradenstvo) (20 žien a 25 mužov, priemerný vek 33,24 rokov, SD = 5,96). Zber dát sa uskutočnil v mesiaci apríl Dizajn V rámci zmiešaného 2 (doména: finančná / nefinančná) x 2 (kotva: nízka / vysoká) dizajnu nás zaujímalo porovnanie odhadov finančných expertov v úlohách z ich profesionálneho odboru s odhadmi v úlohách, v ktorých sme predpokladali ich nízku "expertnosť", úroveň vedomostí (šport, filmové umenie). Konkrétny model experimentálneho dizajnu a procedúry zobrazuje obrázok Materiály a procedúra Pomocou elektronického dotazníka sme distribuovali 4 úlohy, obsahujúce externe (experimentátorom) generované kotvy nasledujúceho znenia (v zátvorke uvádzame označenie otázky a správnu odpoveď): 1) O koľko eur sa zvýšila priemerná mesačná mzda na Slovensku od roku 2000 do roku 2014? (MZDA; 460 ) 2) Koľko herečiek a hercov získalo v histórii udeľovania filmových Oscarov (t.j ) viac ako 5 nominácii za herecký výkon? (OSCAR; 34) Obr. 1: Obrázok : Model výskumného dizajnu Participanti boli randomizovaní do dvoch skupín (NVNV a VNVN, kde N - nízka kotva a V - vysoká kotva). Kotvy boli vytvorené zvýšením/znížením skutočnej odpovede o 50%. Pri tvorbe kotviacich úloh sme postupovali v súlade so štandardou paradigmou efektu kotvenia, ktorú reprezentujú dve otázky: - prvá porovnávajúca, obsahujúca nízku/vysokú kotvu (konkrétne napríklad Bol podľa Vás nárast priemernej mesačnej mzdy na Slovensku od roku 2000 do roku 2014 nižší alebo vyšší ako 230 eur?, - druhá absolútna, vyžadujúca si participantov konkrétny odhad (napríklad O koľko eur sa zvýšila 52

53 priemerná mesačná mzda na Slovensku od roku 2000 do roku 2014?"). Dodatočne boli účastníci vyzvaní, aby spresnili do akej miery si boli istí svojim odhadom (1 - úplne neistá/ý až 10 - úplne istá/ý). Inštrukcia pokračovala na vyriešenie troch doplňujúcich úloh - modifikovaného testu kognitívnej reflexie (CRT). Presné znenie otázok bolo nasledovné (v zátvorke za otázkou uvádzame správnu odpoveď a intuitívnu odpoveď): a) Káva a mlieko stoja spolu 1,20. Káva stojí o 1 viac ako mlieko. Koľko stojí mlieko? (0,1 ; 0,2 ) b) Ak trvá 3 ľuďom 3 hodiny, aby vyrobili 3 veci, ako dlho by trvalo 10 ľuďom, aby vyrobili 10 vecí? (3 hodiny, 10 hodín) c) V Petriho miske sa množia baktérie. Každý deň sa strojnásobí veľkosť tejto bakteriálnej kolónie. Ak trvá 30 dní, aby baktérie pokryli celú misku, ako dlho by trvalo baktériám, aby pokryli tretinu misky? (29 dní, 10 dní) V zhode s autorom testu (Frederick, 2005) sme predpokladali, že úlohy vo všeobecnosti generujú odpovede intuitívne. Tento fakt je podporený skutočnosťou, že spomedzi všetkých možných nesprávnych odpovedí, ktoré ľudia môžu označiť, dominujú práve intuitívne. Prípadné zvýšené kognitívne úsilie sa prejaví produkciou správnych odpovedí. Modifikovaním úloh (avšak so zachovaním ich princípu) sme chceli dosiahnuť prvotné stretnutie s touto verziou testu. V rámci doplňujúcich informácií boli participanti na začiatku požiadaní o vyplnenie socio - demografických údajov (vek, rod, hlavná pracovnú náplň a dĺžka praxe) a na konci odhadovali, nakoľko sa vyznajú v oblasti filmu, financií a športu Index ukotvenia Jednou z možností, ako efekt matematicky zachytiť je index ukotvenia. V rámci výskumu sme využili dva prístupy: 1) Index ukotvenia vypočítaný na základe poznania vysokej a nízkej kotvy - pri výpočte je nutné poznať rozdiel priemerných odhadov experimentálnych skupín s vysokou kotvou a nízkou kotvou, samotné veľkosti kotiev a rozdiel medzi nimi. Index ukotvenia je potom pomerom týchto dvoch rozdielov, vyjadrený percentuálne. Ak by všetci ľudia kotvu úplne ignorovali, index ukotvenia by mal hodnotu 0 %. Typickou hodnotou nameranou v predošlých experimentoch je 55 % (Kahneman, 2011). 2) Index ukotvenia vypočítaný na základe odchýlky od skutočnej odpovede - v snahe postihnúť efekt ukotvenia komplexne, sme podľahnutie tejto odchýlke vyjadrili pre každého participanta celkovo, ako aj v závislosti od domény (finančné/expertné a nefinančné/neexpertné úlohy). Vzhľadom k tomu, že jednotlivé otázky sa líšili v jednotkách, počítali sme odchýlku od správnej odpovede nasledovným spôsobom: - ak participanti uviedli správnu odpoveď, hodnota indexu bola 0, - ak uviedli nesprávnu odpoveď, hodnota indexu sa vyčíslila ako percentuálna odchýlka od správnej odpovede (v prípade uvedenia hodnoty kotvy index dosiahol +/-50). - ak bola hodnota naklonená od skutočnej odpovede ku kotve, index bol pozitívny / ak smerovala od kotvy, index nadobúdal negatívne hodnoty. 3 Výsledky 3.1 Porovnanie odpovedí s vysokou a nízkou kotvou Porovnávanie odpovedí s nízkou (n = 22) a vysokou kotvou (n = 23) ukázalo signifikantné rozdiely pri dvoch úlohách (nefinančného charakteru): ZOH a OSCAR. Na základe čiastočne nenormálneho rozloženia odpovedí na otázku ohľadne OSCARov a HDP sme získané dáta transformovali pomocou odmocninovej funkcie. Participanti s nízkou kotvou odhadovali v priemere nižší počet získaných medailí (M = 269,32; SD = 108) ako participanti ukotvení vysokou hodnotou (M = 433,96; SD = 190), pričom tento rozdiel bol štatisticky aj vecne významný, t(43) = -3,47; p = 0,001; d = 1,03. V otázke z filmového prostredia participanti ukotvení nízkou hodnotou odhadovali počet nominácií na OSCARov priemerne nižšie (M = 19; SD = 9,33) ako participanti s otázkou, obsahujúcou vysokú kotvu (M = 29,27; SD = 13,40), pričom tento rozdiel bol štatisticky aj vecne významný, t(43) = 2,98; p = 0,005; d = 0,89. V otázkach z finančnej domény sa obe skupiny participantov viac približovali skutočným odpovediam, a teda boli schopné vzdialiť svoje posudzované odhady od vodiacich hodnôt, čo sa prejavilo v štatisticky nesignifikantných, aj keď nízko vecne významných rozdieloch v ich priemerných odpovediach: MZDAt(43) = -1,58; p = 0,122; d = 0,47; HDP- t(43) = 1,21; p = 0,232; d = Index ukotvenia Vo všeobecnosti môžeme povedať, že kotviace úlohy ovplyvnili úsudok participantov. Celkový priemerný index ukotvenia na základe počítania odchýlky od skutočnej odpovede dosiahol hodnotu Mdn = 19,11 (IQR = 33,91). Napriek tomu, že sa profesionáli na základe pôsobenia kotiev odchýlili vo finančnej oblasti menej (Mdn = 9,39; IQR = 20,70) ako v nefinančnej 53

54 oblasti (Mdn = 17,52; IQR = 51,78) a z celkového počtu účastníkov si 28 z nich zlepšilo odhad pri prechode z jednej domény do druhej, Wilcoxonov párový test ukázal, že toto zlepšenie úsudku nebolo štatisticky významné, aj keď vecná významnosť dosiahla skoro stredne vysokú hodnotu, z = -1,77; p = 0,077; r = 0,26. Tento výsledok, a teda nižšie ukotvenie finančných profesionálov v im príbuzných témach ukázal aj výpočet indexu ukotvenia na základe vysokých a nízkych kotiev. V otázkach z finančnej oblasti dosiahol index ukotvenia hodnotu - MZDA: 11,80 % a HDP: 15,21 %, a v otázkach s predpokladanou nízkou expertnosťou vyššie hodnoty - OSCAR: 31,12 % a ZOH: 50,04 %. 3.3 Prediktory efektu ukotvenia V rámci predikcie rôznych modelov príčin efektu ukotvenia (vek + rod, vek + rod + dĺžka praxe, dĺžka praxe + CRT a CRT_int a podobne) sa ani jeden model (ani z hľadiska hierarchickej analýzy) štatisticky významne nepredikoval mieru ukotvenia celkovo, ani v jednotlivých doménach. Marginálne signifikantným prediktorom nefinančných odhadov bola schopnosť potlačiť automatické odpovede F = 3,77; p = 0,059; R² = 0, Efekt ukotvenia a kognitívna reflexia Taktiež sme subjekty analyzovali na základe schopnosti zapojiť analytický systém a inhibovať intuitívne odpovede v teste kognitívnej reflexie. Priemerné skóre v počte správnych odpovedí (CRT skóre) u finančných profesionálov dosiahlo hodnotu M = 2,04 (SD = 0,88) a v počte intuitívnych odpovedí (CRT_int skóre) M = 0,67 (SD = 0,85). Korelačná analýza ukázala pozitívnu spojitosť ukotvenia v otázkach finančného charakteru so zapojením analytického myslenia a negatívnu koreláciu v spojitosti s prejavmi intuitívneho systému, MZDA/CRT: r = 0,396; p = 0,007, MZDA/CRT_int: r = -0,318; p = 0,034; HDP/CRT: r = 0,604; p 0,001, HDP/CRT_int: r = -0,372; p = 0,013. V rámci nefinančnej domény sa tieto vzťahy neukázali. Analýza na základe počtu správnych/intuitívnych odpovedí vzhľadom k miere podľahnutia numerickej hodnote preukázala nasledovné rozdiely. Maximálne jednu správnu odpoveď (teda 0 až 1) uviedlo 12 profesionálov, dve správne odpovede 17 a všetky tri správne odpovede 16 participantov. Rozdiely medzi skupinami s najnižším a najvyšším skóre CRT v miere podľahnutia kotve boli štatisticky významné taktiež iba pri finančných otázkach. V rámci otázky ohľadne zvýšenia priemernej mesačnej mzdy sa tí participanti, ktorí zapojili kognitívnu kapacitu pri riešení úloh CRT, dokázali viac vzdialiť od ponúknutej numerickej informácie a svoj priemerný odhad priblížili ku skutočnej odpovedi (M = 379,38; SD = 142,29) ako participanti správne riešiaci maximálne jednu úlohu tohto testu (M = 260,50; SD = 65,97), t(22.33) = -2,95; p = 0,007; d = 1,12. V otázke ohľadne hrubého domáceho produktu sa tento štatisticky aj vecne signifikantný rozdiel tiež potvrdil, t(26) = -4,34; p 0,001; d = 1,66. V rámci produkovania intuitívnych odpovedí (nula intuitívnych odpovedí malo 24 a 1-3 dosiahlo 21 participantov) sa nepreukázali žiadne signifikantné rozdiely v jednotlivých otázkach ani doménach. 3.5 Efekt ukotvenia a istota Pri otázkach MZDA a HDP si boli finanční profesionáli vo svojich odpovediach viac istí ako v otázkach ohľadne filmu a športu (MZDY: Mdn = 6; IQR = 2; HDP: Mdn = 6; IQR = 3; OSCAR: Mdn = 3; IQR = 3 a ZOH: Mdn = 3; IQR = 3). Spearmanova korelačná analýza, na posúdenie vzťahu medzi veľkosťou ukotvenia a subjektívnou istotou odhadu pri konkrétnych otázkach, ukázala pozitívne korelácie iba pri úlohách z finančnej oblasti (MZDA: ρ = 0,477; p = 001; HDP: ρ = 0,361; p = 0,015). 3.6 Dĺžka praxe a efekt ukotvenia V ďalšej fáze nás zaujímalo zloženie skupiny na základe pracovných ukazovateľov, konkrétne dĺžky pôsobenia v odbore. Priemerná dĺžka praxe bola M = 8,12 rokov (SD = 5,30). Dĺžka práce nijak neasociovala so subjektívnym hodnotením expertnosti v oblasti financií. Bez ohľadu na doménu s ňou bola miera podliehania efektu ukotvenia v negatívnom vzťahu, ρ = -0,353; p = 0,017, a pri nazeraní na doménovú špecifickosť sa určitý vzťah medzi odpracovanými rokmi a ukotvením ukázal iba pri finančných úlohách, taktiež v negatívnom duchu, ρ = -0,296; p = 0,049. Tieto vzťahy môžu súvisieť s vekom participantov, kedy je pravdepodobné, že starší participanti budú mať odpracovaných viac rokov. Vek totižto, rovnako ako dĺžka praxe, negatívne koreloval s mierou ukotvenia bez ohľadu na doménu, ρ = -0,396; p = 0,007, aj vo sfére financií, ρ = -0,385; p = 0,009. Sumarizujúc: u vzorky finančných profesionálov sme identifikovali nižší efekt poskytnutej numerickej informácie v doméne blízkej ich pracovnému zameraniu, ako v doménach irelevantných pre ich profesiu. Potvrdili sme tiež predpoklad, že dôležitými faktormi v procese inhibície vplyvu kotvy na doménovo špecifické úsudky sú dĺžka praxe, subjektívna istota odhadov a schopnosť kognitívnej reflexie. 4 Diskusia Majú ekonomicky znalí ľudia bližšie k tzv. rozhodovateľovi "homo economicus" alebo je racionalita finančných profesionálov rovnako 54

55 limitovaná ako tá laická? Vzhľadom na ich vzdelanie a skúsenosti sa očakáva, že by odborníci v oblasti financií mali používať menej mentálnych skratiek a mali by byť najmä menej náchylní k podliehaniu kognitívnym omylom, ktorých v našom výskume reprezentuje efekt ukotvenia. Vo výskume sme boli limitovaní veľkosťou vzorky, nakoľko bola pre nás prioritou práve pracovná pozícia a náplň práce v oblasti financií. K tomuto dizajnu a výberu participantov sme pristúpili s cieľom zistiť, nakoľko budú typ ukotvenia a dostupnosť vedomostí kľúčovými pre redukciu efektu ukotvenia. V súvislosti so zmierňovaním vplyvu kotvy totižto aj Schlattman (2012) upozorňuje na nepomer medzi výskumom kognitívnych odchýlok a pokusmi o ich redukciu, popritom (aj/až) správne pochopenie princípov "biasov" umožňuje dizajn návrhu pre tzv. "debiasing". Prikláňame sa k myšlienke, že kognitívna psychológia by mohla významne prispieť k danej problematike, či už prostredníctvom rozvoja účinných a použiteľných stratégií redukujúcich kognitívne ilúzie a odchýlky alebo sledovaním a popísaním prípadov, kedy k nim nedôjde. Na základe výsledkov nášho experimentu môžeme konštatovať, že vplyv numerickej informácie na úsudok finančných profesionálov sa nám podarilo vyvolať u každej zo sledovaných otázok. Pri komplexnom zhodnotení výsledkov experimentálnej manipulácie sme pri otázkach vysokej expertnosti overili, že efekt ukotvenia bol miernejší v porovnaní s otázkami nízkej expertnosti. Vplyvom zhody medzi pracovnou doménou participantov a špecifickosťou oblasťou kotviacich úloh došlo k zníženiu chybovosti ich úsudku a k redukovaniu vplyvu numerickej kotviacej informácie na ich odhad, čim sme podporili konštatovanie, že rozsah vedomostí a znalostí v posudzovanej doméne, miera expertízy (či už vyjadrená počtom odpracovaných rokov, alebo inak) oslabuje vplyv, v našom prípade "relevantných", numerických informácií. Hodnoty kotiev sme sa snažili nevytvoriť príliš extrémne, z dôvodu, aby participanti nepovažovali kotvu za úplne scestnú informáciu. Zorientovanosť - lepšia expertnosť- vo finančnej oblasti sa ukázala aj v miere sebavýpoveďovej istoty v jednotlivých úsudkoch, kedy sa finanční profesionáli cítili istejšie práve v otázkach z ich oblasti. Sledovanie istoty pri redukovaní vplyvu kotiev však môže vyústiť do prípadu, kedy sa istota prejaví ako extrém - nadmerná sebadôvera. Tento extrém môže zmierniť (prípadne zintenzívniť) varovanie participantov na prítomnosť kotviaceho vodítka. Zistenia ohľadne tohto fenoménu sú nejednoznačné a hodné ďalšieho skúmania. V prípade, že Schlattman (2012) participantov varoval na prítomnosť kotvy, sa v otázkach vysokej expertnosti, a teda v otázkach, kedy sa predpokladala určitá odolnosť voči pôsobeniu kotvy, experti nedokázali vzdialiť od kotviacej informácie. Na druhej strane, v spojitosti s predpokladmi Smitha a spol. (2013), by bolo pre pokračujúci výskum vhodné skombinovať extrémne kotvy s menej extrémnymi a porovnať, či irelevantnosť kotvy profesionáli odhalia ľahšie ako laici, a či práve tento impulz bude pre nich podnetom na zvýšenie svojho kognitívneho úsilia pri posúvaní odhadov ďalej od hodnoty kotvy. V kontexte kognitívnej námahy Epley a Gilovich (2006) zistili súvislosť medzi úspešnou redukciou efektu ukotvenia a lepšími výsledkami v teste NFC (Need for cognition), ktorý sleduje najmä tendenciu jednotlivca k ochote riešiť problémy a poznávať svet racionálnym spôsobom. Na základe tohto výskumu sme predpokladali, že vyššia miera kognitívnej reflexie by mohla byť taktiež faktorom, ktorý ovplyvňuje úspešné vyhnutie sa kognitívnemu skresleniu alebo jeho zmiernenie. Ak sa na výsledky pri redukcii efektu ukotvenia pozrieme cez optiku testu CRT, môžeme pozorovať, že participanti menej náchylní k uvereniu poskytnutej informácii zapojili analytické myslenie vo väčšej miere ako tí, ktorí svoj odhad nedokázali dostatočne vzdialiť od predloženej porovnávacej informácie. Dôvod, prečo sa zaoberať analytickým verzus intuitívnym myslením u finančných odhadov a úsudkov či už profesionálov alebo laikov, zhrnuli Bačová a Stríženec (2013): "Z hľadiska analytického a intuitívneho prístupu k finančnému rozhodovaniu konštatujeme, že v oblasti financií, teda v oblasti, ktorú vytvoril človek na základe ekonomických princípov, je najefektívnejším postupom analytické rozhodovanie, to znamená správanie, ktoré predkladá neoklasická ekonómia, a ktoré vo svojom slovníku nazýva racionálne rozhodovanie" (s.131). Ako sme už naznačili, téma príspevku úzko súvisí s finančným rozhodovaním, pričom psychológia finančného rozhodovania či už laikov alebo profesionálov je doposiaľ málo preskúmaná (Bačová a Stríženec, 2013). Na výzvy súčasnej doby odpovedá Bačová (2014) nasledovným spôsobom: "Kognitívna psychológia usiluje poznať vnútorné procesy a modelovať vnútornú 'architektúru mysle' pri robení (aj) finančných rozhodnutí. Menej však skúma to, ako ľudí pri ich rozhodovaní ovplyvňujú možnosti, ktoré sú im zadané a definované zvonku" (str.4). Náš a naň nadväzujúci výskum by mohli pomôcť nielen v oblasti doplnkového vzdelávania, tréningov, procesu výberu a hodnotenia finančných expertov, ale tiež definovať princípy, akými je možné optimalizovať finančné rozhodnutia v populácii (Agarwal, Driscoll, Gabaix a Laibson, 2009, doplnené o Bačová a Stríženec, 2013): Ktoré charakteristiky predikujú zlé finančné rozhodovanie? Pomáha v tejto oblasti finančné vzdelávanie? Aké vzdelávanie by to malo byť? Ako by pomohla laickej verejnosti tretia strana (expertný poradca)? Kto by mal byť "treťou stranou"? 55

56 Poďakovanie Príspevok vznikol za podpory Agentúry na podporu výskumu a vývoja na základe Zmluvy č. APVV Rozhodovanie profesionálov: Procesuálne, osobnostné a sociálne aspekty a nasledujúcich grantov: Centrum excelentnosti SAV "Centrum strategických analýz" (CESTA) III/2/2011, Štipendium Vzdelávacej nadácie Jána Husa a Nadácie Univerzity P. J. Šafárika v Košiciach. Literatúra Agarwal, S., Driscoll, J. C., Gabaix, X. a Laibson, D. I. (2009). The age of reason: Financial decisions over the life-cycle with implications for regulation. Social Science Research Network. Dostupné na: Bačová, V. (2014). Finančné rozhodovanie jednotlivcov: Mentálne limity, zvládanie a možnosti optimalizácie. Československá psychologie (podaný k publikovaniu). Bačová, V. a Stríženec, M. (2013). Psychológia finančného rozhodovania: Racionalita, analýza a intuícia. V knihe Rozhodovanie a usudzovanie IV. Aplikácie a limity intuície. Ústav experimentálnej psychológie SAV, str Englich, B. (2008). When knowledge matters differential effects of available knowledge in standard and basic anchoring tasks. European Journal of Social Psychology. 38: Epley, N. (2004). A tale of tuned decks? Anchoring as accessibility and anchoring as adjustment. V knihe Blackwell handbook of judgment and decision making. Blackwell Publishing, str Epley, N. a Gilovich, T. (2005). When effortful thinking influences judgmental anchoring: Differential effects of forewarning and incentives on self-generated and externally provided anchors. Journal of Behavioral Decision Making. 18: Furnham, A. a Boo, H. C. (2011). A literature review of the anchoring effect. The Journal of Socio- Economic. 40: Chapman, G. B. a Johnson, E. J. (1999). Anchoring, activation, and the construction of values. Organizational Behavior and Human Decision Processes. 79: Chapman, G. B. a Johnson, E. J. (2002). Incorporating the irrelevant: Anchors in judgments of belief and value. V knihe Heuristics and biases: The psychology of intuitive judgment. Cambridge University Press, str Cheek, N. N, Coe-Odess S. a Schwartz, B. (2015). What have I just done? Anchoring, self - knowledge, and judgments of recent behavior. Judgment and Decision Making. 10(1): Kahneman, D. (2011). Thinking fast and slow. New York: Farrar, Straus and Giroux. Mussweiler, T. a Englich, B. (2003). Adapting to the Euro: Evidence from bias reduction. Journal of Economic Psychology. 24: Mussweiler, T. a Strack, F. (2000). Numeric judgments under uncertainty: The role of knowledge in anchoring. Journal of Experimental Social Psychology. 36: Schlattmann, U. (2012). Ignorant Experts Heightened Confidence Undermines the Beneficial Effect of a Forewarning About the Anchoring Effect. Doctoral dissertation. Universität zu Köln. Smith, A. R., Windschitl, P. D. a Bruchmann, K. (2013). Knowledge matters: Anchoring effects are moderated by knowledge level. European Journal of Social Psychology. 43: Stanovich, K. E. a West, R. F. (1999). Individual differences in reasoning and the heuristics and biases debate? The Behavioral and Brain Sciences. 23: Epley, N. a Gilovich, T. (2006). The anchoring-andadjustment heuristic: Why the adjustments are insufficient. Psychological Science. 17: Frederick, S. (2005). Cognitive Reflection and Decision Making. Journal of Economic Perspectives. 19(4):

57 Kognícia a umelý život 2015, Trenčianske Teplice Modelování mechanismů reprezentace těla u humanoidního robota icub: od biologické inspirace k adaptivním a bezpečným strojům Matěj Hoffmann Istituto Italiano di Tecnologia Via Morego Genoa, Italy [email protected] Abstrakt Lidé i zvířata bez problémů ovládají svá vysoce složitá těla a současně integrují multimodální sensorické informace. Zdá se, že nějaký model nebo reprezentace těla v mozku je v tomto případě nezbytný. Přestože bylo nashromážděno množství experimentálních pozorování a navrhnuta celá řada konceptů (jako např. schéma těla body schema), mechanismy, které za fungováním zmíněných reprezentací stojí, jsou z velké části neznámé. Humanoidní roboti mají morfologii fyzické proporce a sensorický a motorický aparát, která je na určité úrovni abstrakce podobná primátům. Lze je tak použít jako nástroj k rozšíření výpočetních modelů a jejich ukotvení ve fyzickém světě a k realizování celých sensoricko-motorických smyček v interakci s prostředím. Představíme projekt, v němž tuto ideu realizujeme v humanoidním robotovi icub, který vedle 53 stupňů volnosti, kamer s antropomorfickým uspořádáním, a úhlových enkodérů nově disponuje umělou kůží po celém povrchu těla. Právě taktilní modalita hraje při poznávání vlastního těla důležitou roli; robot proto aktivně provádí průzkum povrchu vlastního těla a sbírá taktilní, proprioceptivní a vizuální informace, ze kterých se pak snaží vytvořit první reprezentace. Zároveň předvedeme, jak lze tento postup aplikovat v robotice ke kinematické sebe-kalibraci a k vytvoření modelu "peripersonálního prostoru", který může robot využít k předvídání kontaktů s prostředím po celém povrchu těla. 1 Úvod Lidé i mnohá zvířata přirozeně disponují povědomím o celém svém těle a bez problémů integrují multimodální sensorické informace během interakce se svým nepřehledným a dynamicky se měnícím okolím. Tyto výjimečné schopnosti lze, alespoň částečně, připsat interním reprezentacím těla. I přes složitost muskuloskeletálního systému řídí svá těla bez nejmenších problémů, udžujíce a aktualizujíce informaci o okamžité tělesné konfiguraci v reálném čase. Tradiční robotické systémy dneška naproti tomu většinou spoléhají na předprogramované reprezentace a slepě vykonávané trajektorie koncového článku. Schopnost adaptace na neočekávanou změnu prostředí, popř. samotného těla robota, většinou zcela chybí. Modelování vývoje a fungování reprezentací těla pomocí robotů tak může na jedné straně pomoci osvětlit mechanismy, které jsou zodpovědné za chování, které pozorujeme v přírodě, a na druhé straně otvírá cestu robotům, které se schopností adaptace alespoň částečně přiblíží lidem. 1.1 Reprezentace těla v biologii Reprezentace těla byly po mnoho desetiletí předmětem výzkumu ve filosofii, psychologii, i neurovědách. Výzkumníci přišli s celou řadou konceptů jako schéma těla (body schema), obraz těla (body image), strukturální popis těla (body structural description), reprezentace peripersonálního prostoru a mnoha dalšími. Nicméně, přestože existuje celá řada experimentálních pozorování, konvergence jejich interpretací je omezená a mechanismy, které jsou za pozorované jevy zodpovědné, zůstávají převážně neznámé (pro přehled viz např. (Graziano a Botvinick, 2002; Holmes a Spence, 2004; de Vignemont, 2010)). Reprezentace těla úzce souvisí s reprezentací takzvaného peripersonálního prostoru (peripersonal space). Předměty, které se v tomto prostoru nachází, jsou v našem dosahu; zároveň ale mohou představovat hrozby a vyžadovat odpovídající úhybné reakce. Tento prostor proto zasluhuje speciální neuronální obvody, které se věnují jeho reprezentaci a zpracování (parietálně-frontální síť v mozku primátů) (Graziano a Cooke, 2006; Holmes a Spence, 2004). 1.2 Reprezentace těla v robotice Téměř všechny roboty, které provádějí úlohy související s manipulací, jsou závislé na modelech své kinematiky a dynamiky. Jejich úspěch je pak do značné míry určen přesností takových modelů. Tyto modely jsou většinou založeny na specifikacích strojního návrhu (např. CAD výkresy) robotu. Nepřesnosti se ale nevyhnutelně objeví při montáži, díky mechanické pružnosti, nebo prostě z důvodu použití levných součástek. Proto je nutné přesné parametry modelu získat pro každý exemplář robotu pomocí kalibrace. Jedná se však často o především časově náročné procedury. Vzhledem k tomu, že se podmínky 57

58 (stav součástí robotu) mění v čase, je potřeba takové postupy pravidelně opakovat. Proto se důležitým tématem stala sebe-kalibrace (viz přehledové články (Hoffmann a spol., 2010; Sigaud a spol., 2011)). 2 Tvorba reprezentace vlastního těla z vizuálně-proprioceptivně-taktilních korelací Reprezentace těla jsou adaptivní (či plastické) v delších i kratších časových měřítkách. Delší měřítko je ontogenetické: neuronální struktury, které kódují vlastnosti (např. rozměry) těla, se musí aktualizovat s tím, jak se tělo během vývoje mění. Nejde ale jen o to, že tělo fyzicky roste, ale vyvíjí se celý sensoricko-motorický aparát, zlepšuje se např. rozlišení vizuální informace apod. Jádro tohoto procesu se pravděpodobně nachází v ranném dětství. Podle Rochat (1998) dochází zhruba ve věku 2-3 měsíců ke kalibraci těla děti zkoumají vlastní tělo, jak se pohybuje a jedná v interakci s prostředím. Zdá se, že děti jsou přitahovány a aktivně účastny v prozkoumávání bohatých intermodálních redundancí, časových kontingencí, a prostorových kongruencí sebe-percepce. Jednou z možných kalibračních metod může být sebestimulace: dvojitý dotyk (tedy na dotýkané a dotýkající se části těla) lze odlišit od jednoduchého dotyku (kontakt s okolím) a použít jako identifikaci vlastního těla a zároveň využít korelace s dalšími modalitami tedy kromě taktilní: motorické, proprioceptivní a vizuální. Reprezentace těla v mozku není s největší pravděpodobností centralizovaná a holistická, nýbrž spíše vyvstává z interakce mnoha částečných, uni- či bimodálních reprezentací, které je do určité míry možno chápat jako hierarchii viz např. Medina a Coslett (2010), kteří na nejnižší úrovni hovoří o primárních somatosensorických reprezentacích somatotopicky utvořených mapách povrchu kůže. Na druhou úroveň situují takzvané reprezentace formy těla (body form representations), kde se zkreslené primární reprezentace překalibrují na skutečnou velikost a tvar těla. Na poslední úrovni postulují posturalní reprezentace (týkající se pozice / polohy / konfigurace těla), které kódují pozici končetin v externích referenčních rámcích. Je potřeba však mít stále na paměti, že takřka všechna propojení jsou obousměrná, rekurentní, a tudíž chápání mechanismů reprezentace těla jako postupnou integraci informací ve směru zdola nahoru má jen omezenou platnost. Jednotlivé částečné reprezentace také různým způsobem čerpají z různých sensorických (a popř. i motorické) modality. Visuální informace hrají bezesporu důležitou pro reprezentaci těla v prostoru u dospělých jedinců pravděpodobně dominantní roli, nicméně proprioceptivní a taktilní vstupy a s nimi spojené reprezentace jsou bezesporu významné. Schutz-Bosbach a spol. (2009) např. zkoumali vliv nevisuální sensoricko-motorické zkušenosti na "strukturální reprezentaci těla". Longo a spol. (2010) předložili schematickou reprezentaci (viz Obr. 1), jak by možná kombinace taktilních, proprioceptivních a motorických vstupů se somatosensorickými reprezentacemi mohla vypadat a jaké funkce mohou jednotlivé podmnožiny plnit. Např. pro lokalizaci taktilního stimulu na těle (somatic localisation of touch) je zapotřebí kromě vlastního taktilního stimulu (tactile afference) ještě reprezentaci, která se nazývá povrchové schéma (superficial schema) v podobném významu jako v klasickém článku Head a Holmes (1911). Pro lokalizaci stejného stimulu v prostoru (spatial localisation of touch) již ale navíc potřebujeme proprioceptivní a popř. i motorické vstupy (proprioceptive afference, efferent commands), jejich kombinaci s posturálním schématem a dále pak v kombinaci s modelem velikosti a tvaru těla prostorovou lokalizaci těla. Obr. 1: Model somatoperceptuálního zpracování informace zdúrazňující roli reprezentací těla. Vstupy jsou označeny kosočtverci, reprezentace těla ovály a perceptuální procesy obdélníky. Obrázek i text dle (Longo a spol., 2010). 3 Modelování pomocí robota icub Z předchozích oddílů vyplývá, že jak kognitivní psychologie tak neurovědy přišly s celou řadou pozorování a také s návrhy celé řady konceptů (jen výše jsme zmínili schéma těla, obraz těla, primární somatosenzorické reprezentace, reprezentace formy těla, strukturální popis těla, povrchové schéma, posturální schéma, model velikosti a tvaru těla). Jejich podstata mechanismy, které za nimi stojí a jejich propojení však zůstává nejasné. I velmi abstraktní schémata jako Obr. 1 jsou spíše světlou výjimkou. Humanoidní roboti mají morfologii fyzické proporce a sensorický a motorický aparát, která je na určité úrovni abstrakce podobná primátům. Lze je tak použít jako nástroj k rozšíření výpočetních modelů a jejich ukotvení ve fyzickém světě a k realizování celých sensoricko-motorických smyček v interakci s prostředím. Takový postup je vlastní kognitivní vývojové robotice 58

59 (viz přehledový článek Asada a spol. (2009)); přehled o použití robotů konkrétně k modelování reprezentací těla lze získat z Hoffmann a spol. (2010)). Humanoidní robot icub (Obr. 2) je open-source platforma pro výzkum v kognitivní robotice (Metta a spol., 2010). Robot má 53 stupňů volnosti s úhlovými enkodéry, kamery s antropomorfickým uspořádáním a nově disponuje umělou kůží po celém povrchu těla (Maiolino a spol., 2013). možno odvodit první modely těla s prostorovými prvky. 4 Využití v robotice Tato oblast výzkumu má své uplatnění i v robotice. Jedním takovým směrem je oblast automatické kalibrace. Výkon např. průmyslových robotů závisí na přesných modelech těl daných robotů a často i jejich prostředí. Přesné modely lze získat za pomoci speciálních zařízení (např. kalibračních komor); jak se ale podmínky mění v čase, např. kvůli opotřebení robotu, je potřeba postup opakovat. Metody automatické sebekalibrace, které nevyžadují žádné dodatečné vybavení, jsou tedy žádoucí. U robotů, které disponují nějakou formou kůže, neboli taktilních senzorů na povrchu těla (takových technologií přibývá, viz např. (Dahiya a Valle, 2013; Mastrogiovanni a spol., 2015)), lze právě sebedoteku využít k uzavření kinematické smyčky a získat tak redundantní informaci o určitém bodě v prostoru, kterou lze využít ke kalibraci kinematické reprezentace viz Roncone a spol. (2014). Druhou významnou aplikační oblastí v robotice je implementace peripersonálního prostoru viz oddíl 1.1. Roboti opouštějí omezená a dobře předvídatelná prostředí továren a vstupují do mnohem méně kontrolovaných prostředí a dokonce začínají sdílet prostor s lidmi. V důsledku toho se musí dynamicky přizpůsobovat nepředvídatelným interakcím a zaručit bezpečnost vlastní i ostatních. Robotické technologie ale často spoléhají na slepě vykonávané trajektorie koncového článku, zatímco zbytek těla je reprezentován kinematickým řetězcem, přičemž objem a povrch celého těla často nejsou zohledněny. Robotická kůže nabízí jedinečnou příležitost, jak se naučit přirozeně reprezentovat prostor, který bezprostředně obklopuje tělo robota. Představíme náš algoritmus, který spočívá v distrubuované reprezentaci, prostorových receptivních polích, které obklopují jednotlivé taktilní prvky na kůži (taxely) (Roncone a spol., 2015). Tato reprezentace se vytváří na základě zkušenosti robota s objekty, které nalétávají na jeho tělo. Robot je sleduje zrakem; pokud nakonec dojde ke kontaktu s kůží, vzniklá vizuálně-taktilní kombinace je využita k adaptaci prostorové reprezentace okolí daného taxelu. Zároveň lze takto vzniklou reprezentaci využít k tomu, že se robot vyhýbá kolizím předmětů s povrchem svého těla a vzniká tak jakási ochranná bublina (margin of safety), kterou disponují i lidé a zvířata (viz (Graziano a Cooke, 2006)). Obr. 2: Robot icub v konfiguraci sebe-doteku. Jeho kinematická struktura (délky jednotlivých segmentů a úhly mezi nimi) je zjednodušeně znázorněna modře. Červená ohniska odpovídají taktilním stimulacím na levé a pravé ruce. V našem případě, kdy chceme modelovat ontogenezi reprezentací těla z korelací/kontingencí mezi různými senzorickými modalitami, jsme tedy implementovali automatickou verzi sebedotýkání (technické detaily implementace lze nalézt v (Roncone a spol., 2014)). Robot tedy aktivně provádí průzkum povrchu vlastního těla a sbírá taktilní, proprioceptivní a vizuální informace (Obr. 2), ze kterých se pak snaží vytvořit první reprezentace. Takto nasbíraná data jsou posléze zpracovávána biologicky motivovanými učícími se algoritmy. V současnosti se soustředíme na somatosenzorické reprezentace a používáme samoorganizující se mapy nad taktilními a proprioceptivními vstupy, abychom získali reprezentace podobné primárním somatosenzorickým mapám v Brodmannových oblastech 3a a 3b podobné známým homunkulům (Penfield a Boldrey, 1937). Návazně pak zkoumáme kontingence v taktilní a proprioceptivní modalitě dohromady během dvoj-dotykových konfigurací a jak by z nich bylo Poděkování Tento příspěvek vznikl za podpory Marie Curie IntraEuropean Fellowship (icub Body Schema ) v rámci 7. rámcového programu EU (FP7-PEOPLE-2013IEF). 59

60 Literatura Asada, M., Hosoda, K., Kuniyoshi, Y., Ishiguro, H., Inui, T., Yoshikawa, Y., Ogino, M. a Yoshida, C. (2009). Cognitive developmental robotics: a survey. IEEE Transactions on Autonomous Mental Development, 1(1): Dahiya, R. S. a Valle, M. (2013). Robotic Tactile Sensing. Springer. de Vignemont, F. (2010). Body schema and body image - pros and cons. Neuropsychologia, 48(3): Graziano, M. a Botvinick, M. (2002). Common Mechanisms in Perception and Action: Attention and Performance, vol. XIX, kap. How the brain represents the body: insights from neurophysiology and psychology, str Oxford Univ Press. Graziano, M. a Cooke, D. (2006). Parieto-frontal interactions, personal space and defensive behavior. Neuropsychologia, 44: Head, H. a Holmes, H. G. (1911). Sensory disturbances from cerebral lesions. Brain, 34: Hoffmann, M., Marques, H., Hernandez Arieta, A., Sumioka, H., Lungarella, M. a Pfeifer, R. (2010). Body schema in robotics: a review. IEEE Trans. Auton. Mental Develop., 2 (4): Penfield, W. a Boldrey, E. (1937). Somatic motor and sensory representation in the cerebral cortex of man as studied by electrical stimulation. Brain, 37: Rochat, P. (1998). Self-perception and action in infancy. Exp Brain Res, 123: Roncone, A., Hoffmann, M., Pattacini, U. a Metta, G. (2014). Automatic kinematic chain calibration using artificial skin: self-touch in the icub humanoid robot. V Proc. IEEE Int. Conf. Robotics and Automation (ICRA), str Roncone, A., Hoffmann, M., Pattacini, U. a Metta, G. (2015). Learning peripersonal space representation through artificial skin for avoidance and reaching with whole body surface. V Proc. IEEE Int. Conf. Intelligent Robots and Systems (IROS). Schutz-Bosbach, S., Musil, J. a Haggard, P. (2009). Touchant-touche: The role of self-touch in the representation of body structure. Consciousness and Cognition, 18(1):2 11. Sigaud, O., Salaun, C. a Padois, V. (2011). On-line regression algorithms for learning mechanical models of robots: A survey. Robotics and Autonomous Systems, 59(12): Holmes, N. P. a Spence, C. (2004). The body schema and the multisensory representation(s) of peripersonal space. Cogn Process, 5(2): Longo, M., Azanon, E. a Haggard, P. (2010). More than skin deep: Body representation beyond primary somatosensory cortex. Neuropsychologia, 48: Maiolino, P., Maggiali, M., Cannata, G., Metta, G. a Natale, L. (2013). A flexible and robust large scale capacitive tactile system for robots. Sensors Journal, IEEE, 13(10): Mastrogiovanni, F., Natale, L., Cannata, G. a Metta, G. (2015). Special issue on advances in tactile sensing and tactile-based human robot interaction. Robotics and Autonomous Systems, 63: Medina, J. a Coslett, H. (2010). From maps to form to space: Touch and the body schema. Neuropsychologia, 48(3): Metta, G., Natale, L., Nori, F., Sandini, G., Vernon, D., Fadiga, L., von Hofsten, C., Rosander, K., Lopes, M., Santos-Victor, J., Bernardino, A. a Montesano, L. (2010). The icub humanoid robot: An open-systems platform for research in cognitive development. Neural Networks, 23(8-9):

61 Kognícia a umelý život 2015, Trenčianske Teplice Vliv formy 3D zobrazení geografické informace na její kognitivní zpracování Vojtěch Juřík, Čeněk Šašinka., Kateřina Špriňarová Centrum experimentální psychologie a kognitivních věd, Psychologický ústav FF MU, Arna Nováka 1, Brno @mail.muni.cz, [email protected], @mail.muni.cz Lukáš Herman., Zbyněk Štěrba, Zdeněk Stachoň Laboratoř geoinformatiky a kartografie, Geografický ústav PřF MU, Kotlářská 2, Brno [email protected], [email protected], [email protected] Jiří Chmelík, Barbora Kozlíková Human-Computer Interaction Laboratory, Katedra počítačové grafiky a designu FI MU, Botanická 68a, Brno [email protected], [email protected] Abstrakt V článku představujeme problematiku reálného (stereoskopického) a pseudo 3D zobrazení geografických dat a dále shrnujeme a nově interpretujeme výsledky našeho výzkumu 3D zobrazení. Dosažené výsledky ukazují, že rozdílný princip vyvolání 3D vjemu vede k odlišnému kognitivnímu zpracování informací exponovaných v daném zobrazení. Při řešení experimentálních úloh vedlo reálné 3D zobrazení ve větší míře participanty k uvedení rychlejší, ale nesprávné odpovědi. Při řešení úloh jsme u reálného 3D zobrazení pozorovali větší ponoření participantů do interakce a zaměřenost na detaily ve scéně, pseudo 3D zobrazení naopak vedlo participanty k odstupu při řešení úkolu a vytvoření si nadhledu na situaci. Reálné a pseudo 3D zobrazení stejné geografické informace se tedy jeví jako komputačně neekvivalentní. Domníváme se, že reálné 3D zobrazení vede operátora spíše k rychlému, intuitivnímu zpracování informací prezentovaných v exponované scéně a pseudo 3D zobrazení vede k hlubší analýze kontextu situace. Tato zjištění implikují přesah do vývojářské praxe, kde má využití 3D zobrazení rostoucí tendenci. Pro další ověření těchto pozorování navrhujeme navazující experimentální výzkum. 1 Problematika 3D zobrazení V oblasti IT technologií a vývoje uživatelských rozhraní je patrný rostoucí trend ve využívání různých forem 3D zobrazení. Tato tendence je výrazná také v oblasti zobrazování geografických dat, především díky značnému potenciálu užití tohoto zobrazení v dopravě, krizovém managementu, vojenství, vzdělávání aj., (Hirmas a spol., 2014; Wilkening a Fabrikant, 2013; Weber a spol., 2010; Bleisch a spol., 2008). 3D zobrazení terénu by mělo být dobře pochopitelné i operátorovi bez kartografického vzdělání. Kognitivně kartografické studie se rovněž zaměřují na interindividuální rozdíly při vnímání mapových podkladů (Šašinka, 2014), srovnávají preference práce s 2D mapou a 3D vizualizací (Popelka a Brychtová, 2013; Fabrikant a spol., 2014). Výsledky ukazují, že například pro práci s detaily v exponované oblasti se 3D zobrazení ukazuje jako výhodné, naopak pro lepší kontextové povědomí o prostoru se prosazuje klasická dvojrozměrná mapa (Schmidt, Delazari a Mendonça, 2012). Otázkou, kterou se v této práci zaobíráme, je, jak ovlivňuje percepci a utváření úsudku (rozhodování) člověka rozdílná forma 3D zobrazení, konkrétně forma reálného (stereoskopického) zobrazení a pseudo 3D zobrazení. 2 Typy 3D zobrazení Pro případné porovnání dvou zmíněných typů 3D vizualizací je nezbytné definovat principy, jakými si jedinec vytváří vjem trojrozměrného světa či objektů v něm. U člověka je schopnost vnímat trojdimenzionální prostor zajištěna na základě mechanismů, které definuje Sternberg (1996) v rámci dvou kategorií monokulárních vodítek a binokulárních vodítek. Monokulární vodítka vnímání prostorové hloubky podle něj jsou tzv. gradienty povrchové struktury (zrnitost pozorovaného povrchu), relativní velikost (větší/menší objekty), interpozice (částečné překrývání objektů), lineární perspektiva (konvergence/divergence linií k horizontu), vzdušná perspektiva (zřetelnost obrysů blízkých/vzdálených předmětů), umístění v rovině obrazu (objekty níže/výše vzhledem k horizontu), pohybová paralaxa (rychlost pohybu vzdálených/blízkých předmětů). Binokulární vodítka 61

62 vnímání prostorové hloubky jsou potom tzv. binokulární konvergence (signály z pohybu bulvy) a binokulární disparita (složení rozdílných obrazů z každého oka, které potom podporuje 3D vjem). Alternativní dělení vodítek je možné nalézt např. také u Matatka a spol. (2011). Na základě kombinací těchto monokulárních a binokulárních vodítek (ne nutně všech) potom u člověka vzniká 3D vjem. Běžně se na monitorech počítačů, televizních obrazovkách nebo v tištěné podobě setkáváme s 3D předměty, nicméně dojem hloubky v obraze si v takovémto případě utváříme pouze na základě monokulárních vodítek (bez vjemu binokulární disparity). V případech, kdy je 3D model vytvořen pouze na základě monokulárních vodítek, nazýváme tuto formu pseudo 3D zobrazení. Za použití software a přídatných periferních zařízení (3D brýle, VR přilby aj.), lze docílit tzv. stereoskopického 3D vjemu, který se přibližuje vjemu reálnému. Buchroithner a Kunst (2013) tento typ nazývají reálné 3D zobrazení (true-3d visualization), neboť je zapojen vjem binokulární disparity. Např. Torres a kolegové (2013) na základě své srovnávací studie uvádí, že vhodné pro vyvolání reálného 3D vjemu je využívat 3D brýle, které pracují na principu rozdílné propustnosti světelných vlnových délek. Toto periferní zařízení distribuuje rozdílný vizuální vjem na plátně zvlášť do každého oka a náš mozek potom při tvorbě 3D vjemu zároveň syntetizuje také nápověď binokulární disparity. Při zobrazení geografických dat se tedy setkáváme s dvěma odlišnými typy vizualizace - reálné a pseudo 3D zobrazení. S tímto se pojí otázka, jak (a zdali vůbec) ovlivňuje forma 3D zobrazení vnímání informací a utváření úsudku o těchto informacích. V rámci našeho výzkumu sledujeme aspekty, jakými jsou situačního povědomí (Endsley, 1995) a selhání lidského operátora (human error). 3 Empirická evidence rozdílů v 3D zobrazení Explorativní studie, kterou jsme realizovali na jaře roku 2014 (Špriňarová a spol., in press), měla za cíl porovnat dvě formy 3D vizualizace geografických dat (reálné a pseudo 3D zobrazení) ve schopnostech probandů pracovat s těmito vizualizacemi. Do studie byly zapojeny rovněž dva alternující druhy ovládání klasická počítačová myš a WII Remote Controller. V rámci studie jsme zjišťovali rozdíly ve schopnosti participantů pracovat s reálným a pseudo 3D zobrazením geografických dat, schopnost vyřešit úkoly na základě získaného povědomí o situaci a schopnost znovuvybavení dříve exponovaného terénu. V rámci studie jsme při řešení úkolů očekávali rychlejší uvedení správné odpovědi a přesnější zpětné vybavení prvků v terénu u participantů pracujících v reálném 3D modu, a to vzhledem k větší realističnosti vizuálního vjemu a díky hlubšímu ponoření do řešeného úkolu (odfiltrování rušivých vjemů a lepšího zaměření pozornosti na řešený problém). 3.1 Metoda Experimentální prostředí bylo realizováno v rámci Human-Computer Interaction laboratoře vedené na Fakultě informatiky MU. Výzkumný vzorek tvořilo 17 studentů Katedry geografie Přírodovědecké fakulty MU (8 mužů, 9 žen) ve věku od 22 do 27 let (m=23.8, sd=1.4), kteří měli předchozí zkušenosti s prací s 3D geografickými daty (v pseudo 3D modu). Uvedené demografické skutečnosti byly zjišťovány na základě dotazníku, který předcházel testové situaci. Probandi byli na základě pohlaví rozděleni na 4 skupiny v přibližně stejném poměru mužů a žen (R3D/WII RC 4 probandi, R3D/myš 4 probandi, P3D/WII RC 5 probandů, P3D/myš 4 probandi). Na platformě Vrecko 1 byla sestavena a administrována série 7 problémových situací (1. určení tvaru profilu cesty, 2. porovnání nadmořské výšky dvou krychlí, 3. seřazení pěti objektů v terénu podle nadmořské výšky, 4. pohyb po trase vyznačené z krychlí a určení jejího tvaru, 5. evakuace zaplavených domů, 6. orientace v terénu podle kompasu a 7. znovuvybavení prvků v terénu), příklady viz Obr. 1. Obr. 1: Ukázky řešených úkolů (zleva úkol 3, úkol 5) Všechny úkoly byly pro reálné 3D a pseudo 3D zobrazení informačně ekvivalentní a lišily se svým zaměřením: získání situačního povědomí zjišťovaly úkoly 1, 3, 5, 7, analýza použitých environmentálních nápovědí (2, 4), strategie prostorové orientace (6). Následně byly analyzovány strategie řešení těchto úkolů skupinami participantů. Sledovány byly rozdíly ve správnosti, rychlosti a strategii řešení zadaných úkolů. Pro uvedení správné odpovědi participantem byla nezbytná pečlivější analýza zobrazeného prostředí, zjištění souvislostí v exponované scéně a získání situačního povědomí. Správná odpověď probanda byla indikátorem toho, že proband získal o scéně adekvátní povědomí, které potom vedlo k vytvoření správného úsudku při řešení. Správná odpověď byla hodnocena jedním bodem, nesprávná odpověď potom žádným bodem. Dále jsme měřili čas odpovědi, který vypovídal 1 VRECKO je open-source software, vyvíjený v rámci Human-Computer Interaction (HCI) Laboratoře na FI MU od roku VRECKO je naprogramováno v C++. 62

63 o rychlosti nalezení řešení. Odpovědi probandi uváděli slovně, čas každé odpovědi byl měřen experimentátorem. K podrobnější analýze strategií řešení úkolů jsme využili videozáznamu (ke kterému dali probandi slovní souhlas) a kde jsme následně analyzovali frekvenci zoomování přiblížení/oddálení/natočení mapového podkladu, využití ptačí/žabí perspektivy při řešení a specifika disponování ovládacím zařízením (prudké pohyby, naklánění se k/od plátna, aktivní/pasivní zapojení těla participanta, způsob komunikace participanta s experimentátorem). 3.2 Výsledky Napříč ovládacími zařízeními, kde se neukázal téměř žádný vliv na řešení úkolů, byly zjištěny rozdíly mezi reálným a pseudo 3D zobrazením v úspěšnosti i strategii řešení úkolů. Především v úkolech, kde bylo nezbytné získat komplexní přehled o terénu (úkol 1 zjišťování tvaru cesty, 3 seřazování těles podle nadmořské výšky, 5 evakuace obydlí při zvedající se hladině jezera a 7 znovuvybavení terénu) se participantům využívajícím pseudo 3D zobrazení dařilo lépe dosáhnout správných řešení. V prvním úkolu nalezení odpovídajícího profilu cesty, který obě skupiny vyřešily s podobnou úspěšností 88 % správných odpovědí v reálném 3D, 78 % v pseudo 3D modu se u reálného 3D při rozhodování projevila větší tendence analyzovat detaily (např. blíže zkoumat parametry zakončení cesty), zatímco pseudo 3D skupina se rozhodovala na základě tvaru křivky usazené v terénu jako celku. Úlohu č. 3 vyřešili správně všichni pseudo 3D participaci, zatímco v reálném 3D modu chybovali 2 z 8 řešitelů. V úloze 5 (určování pořadí evakuace zaplavených domů), byl navíc průměrný čas řešení u pseudo 3D skupiny (m=76,67, sd=41,06) výrazně vyšší než u skupiny reálného 3D (m=37,00, sd=27,66). Zatímco v pomalejší pseudo 3D skupině vyřešili tento úkol všichni, v reálném modu to bylo pouze 5 z 8 participantů. Méně úspěšná skupina tedy řešila úkoly výrazně rychleji. V 7. úkolu, který zkoumal znovuvybavení dříve exponované scény (úkolem byla lokace vodní plochy v terénu), chybovala pseudo 3D skupina z 33 %, nicméně ve skupině reálného 3D špatně odpovědělo 88 % participantů. V rámci studie se tedy ukázala obecná tendence skupiny využívající reálné 3D rozhodovat se v problémových situacích sice (1) rychleji, ale s (2) větší chybovostí a (3) nižší schopností znovuvybavení dříve exponované scény, než u pseudo 3D skupiny. Po přezkoumání videozáznamu se ukázala strategie pseudo 3D skupiny (4) více analyzovat širší kontext situace a získat o něm dobré situačního povědomí, zatímco u skupiny reálného 3D se participaci více zaměřovali na detaily ve scéně, což je odvádělo od získání celkového nadhledu. Předpoklad lepších výsledků při řešení úkolů se u skupiny reálného 3D nepotvrdil, projevil se právě opačný efekt. Navzdory tomu, participanti reálného 3D zobrazení si byli subjektivně více jisti svými odpověďmi, což naznačuje výrazně kratší doba uvedení odpovědí. 4 Diskuze Z výsledků jsme vyvodili přítomnost zkreslení při vytváření úsudku o situaci u probandů v modu reálného 3D zobrazení oproti pseudo 3D skupině. Probandi v reálném 3D byly rychleji přesvědčení o správnosti své odpovědi, byť odpovědi chybné. Ve správnosti řešení komplexních úkolů a také v úloze vyvolání z paměti si pseudo 3D skupina vedla lépe. Schopnost znovuvybavení, stejně jako nalezení správné odpovědi v komplexních situacích, vyžaduje získání přehledu o terénu pro získání povědomí o situaci je nezbytné terén postupně pozorně prozkoumat, zapamatovat si jeho atributy a porovnat možné alternativy řešení. Tato strategie je časově náročnější. Domníváme se, že pseudo 3D zobrazení tedy u participantů vzbuzuje tendenci věnovat volbě odpovědi více pozornosti a dosáhnout v situaci celkového nadhledu, což v rámci uvedené studie vedlo také k ucelenějšímu znovuvybavení prvků v terénu v úloze 7. Usuzujeme na komputační neekvivalenci (Larkin a Simon, 1987) reálného a pseudo 3D zobrazení a tudíž také na fakt, že při řešení úkolů v reálném a pseudo 3D probíhá u participanta rozdílné kognitivní zpracování. Domníváme se, že vnímaný pseudo 3D obraz musí participant mentálně transformovat do reálného 3D, což zvyšuje nároky na psychické zpracování. Na základě tohoto potom vzniká odlišná strategie při řešení úkolu, která se projeví zvýšenou elaborací vnímaného obsahu. Domníváme se, že tato elaborace vede k pečlivějšímu přehodnocování řešeného úkolu, popřípadě vede k aktivní snaze o získání dalších informací z exponované scény. Tato strategie u participantů častěji vedla k určení správné odpovědi a je také časově náročnější, což odpovídá výsledkům. Z výše uvedených skutečnosti usuzujeme, že chybějící informace o binokulární disparitě vede k detailnějšímu, analytickému zpracování exponované informace. Při volbě správné odpovědi se jedná o proces rozhodování, tedy strategii utváření si správného úsudku v dané situaci. Okolnosti, které vedou k chybám (zkreslením), je možné vysvětlit na základě teorií rozhodování. Zkreslením při utváření úsudku se zabývá Daniel Kahneman (2012). Soustředí se na zkreslená či chybná rozhodnutí člověka/operátora, který podle Kahnemana pracuje ve dvou základních modulech mysli v tzv. rychlém a pomalém myšlení. Do opozice staví rychlé myšlení (intuitivní rozhodování) proti pomalému myšlení, které je závislé na podrobnější, matematické analýze dat (analytické myšlení). Těmto dvěma modům podle Kahnemana 63

64 podléhá každodenní interakce člověka s jeho s prostředím, přičemž drtivá většina našich rozhodnutí je uskutečňována automaticky, tedy intuitivně, což v některých případech vede k chybám. Kahneman (2012) shrnuje, že člověk v běžném životě často dělá rychlé závěry, protože je to vzhledem k povaze evoluce jednoduše efektivní. Domníváme se, že v případě reálného 3D zobrazení, kde není nutná žádná mentální transformace vnímaného obrazu, probíhá strategie řešení úkolu a tvorba úsudku (rozhodování) v rychlé, intuitivní rovině. Řešení je zaměřené na konkrétní detail, bez širšího přezkoumání exponované scény. Pseudo 3D zobrazení naopak probanda navádí k analytické strategii při zpracovávání informací, se snahou získat širší situační povědomí. Pseudo 3D participanti měli lepší schopnost znovuvybavení terénu v úloze 7. Exponovaný materiál si tedy dokázali lépe vštípit. Vysvětlujeme to skutečností, že pseudo 3D zobrazení vedlo participanty k aktivnímu vyhledávání dalších informací a souvislostí v úloze, což aktivně zapojuje motorické komponenty kognice. Neisser (1976) zdůrazňuje motorickou komponentu v rámci kognice, která je zapojena při aktivním hledání dalších nápovědí v exponované scéně. Operátor si další nápovědi zpřístupňuje v okamžiku, kdy jich nemá dostatek pro vytvoření adekvátního úsudku. Motorická komponenta je silně provázána s fenoménem embodimentu a vtělesněné kognice 2 (Embodied Cognition), kde zažitá zkušenost zůstává fyzicky zapsána v nervovém systému (Barsalou, Niedenthal, Barbey a Ruppert, 2003; Glenberg, 1997; Damasio, 1999). V případě analytické pseudo 3D skupiny zůstala zkušenost aktivního přehodnocování řešeného úkolu lépe zakořeněná v nervových drahách participantů a ovlivnila úroveň jejich informačního zpracování. Na základě toho se domníváme, že aktivní analytické dohledávání nápovědí ve scéně (podrobná analýza scény) vedla k získnání komplexního situačního povědomí, a tím pádem také vedla k lepšímu znovuvybavení terénu v úloze 7. Rozdíly ve výkonu skupin reálného a pseudo 3D zobrazení je možné diskutovat také vzhledem k fenoménu ponoření (immersion) do dané vizualizace. Pojem immersion je v rámci virtuální reality chápán jako intenzita dojmu fyzické přítomnosti ve virtuálním prostředí. Někteří autoři v rámci vývoje virtuální reality dále ponoření dělí na senzomotorické ponoření, kognitivní ponoření, emoční ponoření a prostorové ponoření (Björk a Holopainen, 2004). Zapojení binokulární disparity formou periferních zařízení zvyšuje věrohodnost exponované scény a operátora do scény více ponořuje. Periferní zařízení 2 Pro překlad pojmuembodiedcognition, který nemá ustálený překlad, si s laskavým svolením Mgr. Jiřího Mately dovolujeme uvést termín vtělesněná kognice, který shledáváme nejvíce výstižným. také filtruje rozptylující podněty z okolí, což umožňuje lepší soustředění. Na základě výsledků se domníváme, že reálné 3D zobrazení s tímto větším ponořením má za následek získání menšího nadhledu, soustředění se na detaily a tudíž menší globální přehled o situaci. Ponořený operátor není konfrontován s případnými situačními souvislostmi a jeho rozhodování je rychlé (intuitivní) a bez dalšího přehodnocování, což dokládá také větší subjektivní jistota reálné 3D skupiny. Domníváme se, že rozdílná míra ponoření do scény v reálném a pseudo 3D modu vyvolává u participanta rozdílný dojem o struktuře dané expozice a tudíž vede participanta k rozdílné strategii řešení problémové situace. Větší ponoření u reálného 3D zobrazení vede participanty k zaměření se na detaily a tedy také k získání menšího nadhledu v dané situaci. Situaci, ve které má participant menší nadhled, tedy menší povědomí o situačních atributech, potom vnímá jako málo strukturovanou a v souladu s teorií kognitivního kontinua (Hammond, 2000) se participant přiklání k intuitivnímu řešení takové situace. Tato skutečnost souvisí s uvedeným Kahnemanovým rychlým myšlením (2012), které podobně jako intuitivní řešení na pólu Hammondova kognitivního kontinua, častěji vede k chybám operátora při řešení problémové situace. A právě chybovost je u reálného 3D zobrazení při řešení úkolů častější než u pseudo 3D skupiny. 5 Navazující výzkum Výsledky naší studie jsou předběžné a je nutné provést další výzkum. Plánovaný kvantitativní výzkum v rámci Centra experimentální psychologie a kognitivních věd MU (CEPCoS) 3 hodlá sledovat správnost úsudku při řešení komplexních úkolů zobrazených v reálném a pseudo 3D modu. Cílem bude ověřit fakt, zdali reálné 3D zobrazení vede k intuitivnímu, tedy subjektivně jistějšímu, rychlejšímu, nicméně častěji chybnému rozhodování, oproti analytickému pseudo 3D zobrazení. Pro tento účel bude vytvořena počítačová testová baterie (promítnutá na plátno v reálném a pseudo 3D modu), která bude obsahovat dva subtesty aktivní a pasivní. V pasivním subtestu bude staticky exponována problémová situace bez možnosti pohybu scénou. V aktivním subtestu přidáme možnost ovládání (WII Remote Controller), kdy participant bude moct scénou aktivně pohybovat a hledat další informace vedoucí ke správnému řešení. Schéma výzkumu shrnujeme v Obr CEPCoS je realizován v rámci fakult Filozofické, Přírodovědecké a Fakulty informatiky Masarykovy univerzity. 64

65 uvedení odpovědi a (4) méně pohybů ovladačem ve snaze nalézt optimální náhled na scénu (aktivní subtest). Tato případná zjištění považujeme za indikátor intuitivního přístupu k řešení úkolů v rovině reálného 3D zobrazení. 6 Závěr Obr. 2: Schéma kvantitativního výzkumu reálného a pseudo 3D zobrazení 5.1 Zkoumané osoby Pro výzkum předpokládáme skupinu 60 studentů MU s podobným studijním zaměřením a přibližné věkové kategorie. Vzorek bude vyvážen na základě pohlaví vzhledem k možným rozdílům ve strategii při řešení úkolů. Před samotným měřením budeme administrovat elektronický dotazník, ve kterém budou zjišťována demografická specifika zkoumaného vzorku. 5.2 Parametry testu Probandi budou mít za úkol na čas řešit sérii úloh na mapovém podkladu. Správnou odpověď budou prostřednictvím počítačové myši sami zaznačovat do expozice. Řešené úkoly budou vyžadovat utvoření správného úsudku o situaci v závislosti na rozložení těles na geografickém podkladu, podobně, jako tomu bylo v předešlé studii (Špriňarová a spol., in press), typy úkolů budou obdobné jako v této studii (tedy řešení problémových situací). Sledovat budeme přesný čas odpovědí (měřený v sekundách), správnost utvořeného úsudku (správnost odpovědí), vypovězenou subjektivní jistotu v úsudku (na slovní škále: naprosto jistý spíše jistý spíše nejistý zcela nejistý) a počet pohybů scénou za pomoci ovladače, které participant provede při řešení úkolu v rámci aktivního subtestu (jedná se o rotaci, posunování, přibližování/oddalování scény). Předpokladem u experimentální reálné 3D skupiny je (1) kratší čas zpracování úkolu, (2) menší správnost odpovědí, (3) větší subjektivní jistota při Podle našich zjištění existují mezi reálným a pseudo 3D zobrazením rozdíly ve způsobu, jakým operátor zpracovává exponované informace. Řešení experimentálních úloh v reálném 3D modu vedlo participanty k uvedení rychlejší, ale nesprávné odpovědi. Efekt většího ponoření do exponované scény v případě reálného 3D zobrazení přispívá k zaměření participantů na detaily ve scéně, což zřejmě upozaďuje utváření nadhledu o situaci. Podobný efekt je možné sledovat při porovnání práce s 2D a 3D mapovým zobrazením (Schmidt, Delazari a Mendonça, 2012). Ačkoliv je nutný další výzkum, usuzujeme na komputační neekvivalenci reálného a pseudo 3D zobraznení. Na základě dosavadních výsledků se domníváme, že reálné 3D zobrazení vede probandy k intuitivnímu řešení testových úkolů bez podrobnější analýzy a na základě toho dochází k častějšímu chybování vytvoření rychlejšího, ale nesprávného úsudku. Tento způsob utváření úsudku odpovídá tzv. rychlému myšlení (intuitivní modus), jak jej definuje Kahneman (2012). To implikuje významné přesahy do praxe ve vývoji uživatelských rozhraní, především v oblastech jakými jsou krizový management, doprava, letectví, vojenství, zábavní průmysl a designování virtuální reality obecně. Z tohoto důvodu navrhujeme další výzkum srovnání reálného a pseudo 3D zobrazení. Poděkování Příspěvek vznikl v rámci projektu CZ.1.07/2.3.00/ , který je spolufinancován Evropským sociálním fondem a státním rozpočtem České republiky. Literatura Barsalou, L. W., Niedenthal, P. M., Barbey, A. K., & Ruppert, J. A. (2003). Social embodiment. In B. Ross (Ed.), The psychology of learning and motivation, 43: San Diego, CA: Academic Press. Björk, S., Holopainen, J. (2004). Patterns In Game Design. Charles River Media. Bleisch, S., Dykes, J., Nebiker, S. (2008). Evaluating the Effectiveness of Representing Numeric Information Through Abstract Graphics in 3D 65

66 Desktop Virtual Environments. The Cartographic Journal. 45(3): Buchroithner, M. F., Knust, C. (2013). True-3D in Cartography Current Hard and Softcopy Developments. In Moore A, Drecki I: Geospatial Visualisation, Berlin, Heidelberg: Springer Damasio, A. (1999). The feeling of what happens. New York: Harcourt Brace. Endsley, M. R. (1995). Measurement of situation awareness in dynamic systems. Human Factors, 37: Fabrikant, S. I., Maggi, S., Montello, D. R. (2014). 3D Network Spatialization: Does It Add Depth to 2D Representations of Semantic Proximity? In Duckham M. et al.: Geographic Information Science. Berlin, Heidelberg: Springer International Publishing Špriňarová, K. et al. (In press). Human-computer Interaction in Real 3D and Pseudo-3D Cartographic Visualization: A Comparative Study. Springer. Torres, J., Ten, M., Zarzoso, J., Salom, L., Gaitán, R., Lluch, J. (2013). Comparative Study of Stereoscopic Techniques Applied to a Virtual Globe. Cartographic Journal, 50(4): Weber, A., Jenny, B., Wanner, M., Cron, J., Marty, P., Hurni, L, (2010). Cartography Meets Gaming: Navigating Globes, Block Diagrams and 2D Maps with Gamepads and Joysticks. Cartographic Journal. 47(1): Wilkening, J., Fabrikant, S. (2013). How users interact with a 3D geo-browser under time pressure. Cartography and Geographic Information Science. 40(1): Glenberg, A. (1997). What memory is for. Behavioral And Brain Sciences, 20(01). doi: /s x Hammond, K. R. (2000). Judgments under stress. New York: Oxford University Press. Hirmas, D. R., Slocum, T., Halfen, A. F. White, T., Zautner, E., Atchley, P., Liu, H., Johnson, W. C., Egbert, S., McDermott, D. (2014). Effects of Seating Location and Stereoscopic Display on Learning Outcomes in an Introductory Physical Geography Class. Journal of Geoscience Education, 62(1): Kahneman, D. (2011). Thinking, fast and slow. New York: Farrar, Straus and Giroux. Larkin, J. H., Simon, H. A. (1987). Why a Diagram is (Sometimes) Worth Ten Thousand Words. Cognitive Science, 11(1): Matatko, A., Bollmann, J.,Műller, A. (2011). Depth Perception in Virtual Reality. In Kolbe TH, Kőnig G, Nagel C: Advances in 3D Geo-Information Sciences, Berlin: Springer Neisser, U. (1976). Cognition and Reality: Principles and Implications of Cognitive Psychology, San Francisco, CA, W. H. Freeman. Sternberg, R. (1996). Cognitive psychology. Fort Worth: Harcourt Brace College Publishers. Šašinka, Č. et al. (2014). Influence of the cartographic visualization methods on cognitive processing: comparison of extrinsic and intrinsic visualization of avalanche hazard maps. Manuscript práce pro Europeanconference on visualperception

67 Kognícia a umelý život 2015, Trenčianske Teplice Miera črtovej všímavosti vo vzťahu ku kognitívnym zaujatostiam Marek Jurkovič Ústav experimentálnej psychológie SAV Dúbravská cesta 9, Bratislava, Slovenská Republika [email protected] Abstrakt V tejto štúdii sme sa pokúsili o pilotné prenesenie konceptu všímavosti do kontextu kognitívnej psychológie a výskumu kognitívnych zaujatostí. V štúdii sme vychádzali z predpokladu, ţe odolnosť voči kognitívnym zaujatostiam a všímavosť majú spoločný metakognitívny základ. Štúdia sa zamerala na hľadanie korelácií medzi úspešnosťou v riešení úloh zameraných na kognitívne zaujatosti a mierou črtovej všímavosti, teda osobnostnou predispozíciou k všímavosti. Vzorku tvorilo 432 študentov. Aspekty črtovej všímavosti boli merané škálou Five-facet mindfulness questionnaire. Analýza nepotvrdila korelácie aspektov črtovej všímavosti s výkonom v úlohách zameraných na zaujatosti. 1 Úvod 1.1 Všímavosť Všímavosť (alebo mindfulness v zahraničnej literatúre, moţno sa stretnúť aj s prekladom bdelá pozornosť) je pojem, ktorý pochádza z budhizmu, no našiel si svoje miesto aj v súčasnej psychológii. Rastúci objem výskumov zameraných na všímavosť a jej pozitívne účinky sa pomaly začína rozširovať aj na oblasť kognitívnej psychológie, hoci v minulých desaťročiach od uvedenia a popularizácie tohto pojmu sa pozornosť výskumníkov zameriavala prevaţne na aplikáciu konceptu všímavosti v klinickej praxi a psychoterapii, čo moţno súvisí aj s tradičným motívom rozvoja všímavosti vo východných kultúrach - odstránenie utrpenia. Psychologické konceptualizácie všímavosti sa pravdepodobne do istej miery líšia, čo sa stalo terčom kritiky (napr. Chiesa, 2013), viaceré met-analýzy však potvrdili, ţe napriek moţným konceptuálnym rozdielom sú psychoterapuetické prístupy zaloţené na všímavosti účinné pri redukcii stresu, úzkosti a depresívnych symptómov (napr. Hofman, Sawyer a Witt et al., 2010; Killingsworth, Gilbert, Khoury et al., 2013; Goyal, Singh, Sibinga et al., 2014), to je však len niektoré z oblastí, na ktoré sa v posledných rokoch zameral výskum všímavosti. Všímavosť je definovaná ako uvedomovanie si, ktoré vyvstáva z úmyselného sústredenia pozornosti v prítomnom okamihu a bez posudzovania odhaľujúcej sa skúsenosti prebiehajúcej okamih za okamihom (Kabat-Zinn, 2003). Táto definícia vychádza z chápania všímavosti ako stavu, ktorý je potrebné aktívne udrţiavať a rozvíjať. Črtová všímavosť predstavuje interindividuálnu variabilitu, ktorú sme pravdepodobne získali niekedy behom ţivota a bez toho, ţe by sme sa vedome snaţili ju zvyšovať nejakým tréningom. Takto definovaná všímavosť je skôr podobná osobnostným vlastnostiam podobne ako neuroticizmus alebo impulzivita. Väčšina dotazníkov a škál meria práve črtovú všímavosť. To však neznamená, ţe by sa väčšina výskumu všímavosti uskutočňovala pomocou sebaposudzujúcich dotazníkov a bola zameraná na črtovú všímavosť. 1.2 Kognitívne zaujatosti a metakognícia Z uvedeného nemusí byť spojitosť všímavosti a kognitívnych zaujatostí zrejmá. Preto je potrebné uviesť niečo aj ku kognitívnym zaujatostiam a tomu, ako sa podľa nás moţno voči nim brániť. Mnohé kognitívne zaujatosti totiţ šetria kognitívne zdroje (pracovnú pamäť) a umoţňujú rýchle resp. heuristické reagovanie a rozhodovanie v daných situáciách a boli a moţno aj sú adaptívne (Gigerenzer, 2008), no v súčasnom komplexnom svete môţu zvádzať aţ k príliš rýchlym a teda aj povrchným záverom. Moţno napríklad povaţovať za racionálne, ak si niekto vyberie formu dôchodkového sporenia alebo finančný produkt na základe heuristiky známosti, teda podľa známosti značky banky? Alebo ak niekto filtruje dostupné informácie napr. o očkovaní na základe konfirmačnej resp. myside zaujatosti, na základe emocionálnych argumentov zaloţených na nejakom ojedinelom prípade zdravotných ťaţkostí, ktorý pravdepodobne ani nemá súvis so zloţením očkovacej látky, a nie na základe vecných a podloţených argumentov, ktoré môţu dané strany sporu ponúknuť? Ťaţko moţno takéto zaujaté a povrchné uvaţovanie povaţovať za prospešné v kontexte rôznych komplexných problémov, s ktorými sa jednotlivci môţu stretávať, hoci nepopierame moţnú uţitočnosť 67

68 heuristík pri problémoch, ktoré majú malý dopad na človeka alebo si vyţadujú rýchle rozhodnutia a závery. Alternatívou k heuristickému alebo intuitívnemu spracovávaniu informácií (typ 1), ktoré je pravdepodobne evolučne staršie, je vytváranie si mentálnych simulácií, ktoré je však kognitívne omnoho náročnejšie, keďţe si vyţaduje zdroje pracovnej pamäte na rozdiel od heuristík, ktoré prebiehajú autonómne. Evans a Stanovich (2013) argumentujú, ţe práve to je definujúcou charakteristikou spracovávania typu 2. Autonómnosť a nenáročnosť heuristického spracovávania je zároveň druhou problematickou charakteristikou spracovávaniu typu 1, keďţe umoţňuje heuristikám prebehnúť mimo vedomú kontrolu a metakognitívne vedomosti. Mnohé zaujatosti si neuvedomujeme, takţe si ani neuvedomujeme potrebu ich inhibovať. Napriek tomu, klasické rozdelenie ľudského uvaţovania na dva typy nemusí postačovať, tak ako nemusí postačovať iniciovanie mentálnych simulácií a inhibícia heuristických reakcií typu 1. Argumentujeme tripartitným modelom mysle Stanovicha (2011), ktorý za základ racionality povaţuje nielen elaboratívne uvaţovanie zaloţené na mentálnych simuláciách, ale jeho model obsahuje aj reflektívnu zloţku, ktorá zodpovedá za monitoring a kontrolu ostatných kognitívnych procesov podieľajúcich sa na uvaţovaní. Zodpovedá teda metakognícii, kognícii o iných kogníciách. Kontrola kognitívnych procesov metakognitívnymi je však len tak dobrá, ako dobrá je funkcia monitoringu, nakoľko obsiahla a presná je vedomostná zloţka metakognície. Nemoţno z metakognitívnej úrovne inhibovať procesy, ktoré neboli zaznamenané monitoringom. Introspekcia ako metóda zisťovania mentálnych obsahov vlastnej mysle pritom nemusí byť a väčšinou ani nie je postačujúca. Silvia a Gendolla (2001) tvrdia, ţe na základe dostupnej literatúry moţno dospieť k záveru, ţe existuje len málo dôkazov o schopnosti introspekcie pomôcť jednotlivcovi dospieť k presnému sebapoznaniu. Podľa prehľadu literatúry od Silvia a Gendolla (2001), doterajšie výskumy dospeli k nepresvedčivým nepriamym záverom, ktoré moţno vysvetliť aj inak. Samotný proces introspekcie podľa nich môţe naopak narušiť kognitívne procesy - podobne ako pozorovateľ samotnou svojou prítomnosťou ovplyvní výsledok experimentu v kvantovej fyzike. Samotné metakognitívne procesy sú často spájané s vedomým spracovávaním, no metakognícia môţe podľa Shea et al. (2014) prebiehať aj na nevedomej úrovni. Vedomá úroveň metareprezentácií slúţi najmä na intrapersonálnu komunikáciu mentálnych obsahov. Z modelu Shea et al. (2014) tieţ dedukujeme, ţe vrstvenie metareprezentácií na seba môţe hypoteticky tieţ viesť k skresľovaniu a teda nepresnému metakognitívnemu monitoringu, podobne ako sa kópia kópie stáva bledšou a bledšou. Sme toho názoru, ţe existuje aj jednoduchšia a menej náročná metóda rozvoja metakognitívnej resp. reflektívnej zloţky, ktorú rozvinieme v nasledujúcej podkapitole, ktorá konečne prepojí všímavosť s problematikou metakognície a kognitívnych zaujatostí. 1.3 Kognitívne zaujatosti, metakognícia a všímavosť Predpokladáme, ţe všímavosť môţe predstavovať proces, ktorý by mohol napomôcť rozvoju metakognitívnych zloţiek spracovávania informácií a tým nepriamo ovplyvniť aj tendenciu podliehať heuristickému spracovávaniu resp. kognitívnym zaujatostiam. Existujú uţ určité výskumy potvrdzujúce vplyv všímavosti na podliehanie kognitívnym zaujatostiam. Hafenbrack, Kinias a Barsade (2014) zistili, ţe krátkodobá indukcia všímavosti za pomoci audionahrávky riadenej meditácie má vplyv na mieru podliehania zaujatosti utopených nákladov. Zaujatosť utopených nákladov sa prejavuje, keď jednotlivec pokračuje v investovaní zdrojov (nielen finančnom, ale akomkoľvek) do určitého projektu, hoci by uţ bolo výhodnejšie zmeniť projekt alebo stratégiu. Pod vplyvom zaujatosti uţ investovaných nákladov však pokračuje naďalej v neefektívnom alebo dokonca úplne stratenom projekte. Efekt všímavosti moţno vysvetliť tým, ţe všímavosť vedie jednotlivca k zameraniu sa na prítomnosť, resp. prítomný okamih a mentálne obsahy. To je v protiklade s podmienkou pre uplatnenie zaujatosti utopených nákladov, ktorá predpokladá, ţe sa jednotlivec bude riadiť minulými (utopenými) nákladmi. Zároveň je táto vlastnosť všímavosti (zameranosť na prítomnosť) v protiklade aj so sklonom k blúdeniu mysle resp. dennému sneniu. Blúdenie mysle predstavuje v podstate spracovávanie typu 2, teda vytváranie mentálnych simulácií, ale obvykle nemá praktický význam a vo všeobecnosti vedie k niţšiemu pocitu spokojnosti so ţivotom (Killingsworth a Gilbert, 2010). Podľa výskumu Brewera et al. (2011) sa zdá, ţe všímavosť redukuje aj aktiváciu mozgových centier zodpovedných za blúdenie mysle, tzv. default mode network, hoci sa výskum uskutočnil na malej vzorke. S podobnými zisteniami prišli predtým uţ aj Farb et al. (2007) Výskum Emanuela, Updegraffa, Kalmbacha a Cieslu (2010) zistil vzťah medzi presnejším predpovedaním budúcich emočných stavov a jednou zo zloţiek dotazníka FFMQ - pozorovaním vlastných vnútorných stavov. Zároveň Emanuel et al. (2011) zistili, ţe ľudia skórujúci vyššie na tejto subškále FFMQ predpovedali menší dopad emócií vzťahujúcich sa k istej udalosti na ich budúci stav. To moţno povaţovať za realistickejší a racionálnejší pohľad, keďţe ľudia majú sklon podliehať zaujatosti dopadu, keď preceňujú emocionálny dopad udalosti. Zaujatosť dopadu ich vedie k tomu, ţe sa napr. určitým 68

69 moţnostiam pri rozhodovaní radšej vyhnú na základe týchto nepresných predpovedí. Súvislosť moţno vidieť napríklad s predpoveďami budúceho dopadu amputácie končatiny na ţivot jednotlivca, keď niektorí ľudia precenia následky takéhoto zákroku na kvalitu ţivota a radšej si zvolia riskantnejší zákrok alebo smrť. Pritom sa často ich predpovede nesplnia (Halpern & Robert, 2009). Rozvoj všímavosti by okrem iného mal viesť k zvýšenej tolerancii voči negatívnym emocionálnym vplyvom (ale aj pozitívnym). Je teda moţné, ţe k pozitívnemu vplyvu všímavosti ohľadom emočnej regulácie a uvedomovania prispieva aj tento mechanizmus, hoci štúdia Emanuela et al. (2010) niečo také nezistila. Kang, Gruber a Gray (2012) vo svojej teoretickej štúdii argumentujú, ţe rozvoj všímavosti môţe viesť k redukcii (ako to nazývajú) automatizácie myslenia, čiţe k de-automatizácii. Argumentujú, ţe v mnohých prípadoch podliehame akémusi automatickému spracovávaniu informácií na základe predchádzajúcich skúseností a vedomostí. Moţno tvrdiť, ţe do rámca takto automaticky prebiehajúcich procesov spadajú aj viaceré kognitívne zaujatosti. Jednou z podmienok všímavosti je nielen zameranie na prítomnosť a nesúdenie prúdu mentálnych obsahov vo vedomí, ale aj tzv. "myseľ začiatočníka", teda rozvíjanie sklonu pristupovať k skúsenostiam zvedavo a ako keby boli nové. Teda nereagovať na základe uţ existujúcich abstrakcií, ktoré vznikli na základe predchádzajúcich skúseností - všímavosť má, inak povedané, zniţovať tzv. psychologickú vzdialenosť od prítomnej skúsenosti na spektre od konkrétneho k abstraktnému (Trope & Liberman, 2010). Ako sme uţ ale spomínali, zároveň všímavosť poskytuje určitý nesúdiaci odstup alebo decentráciu a vyššiu zameranosť pozornosti na mentálne obsahy. Decentrácia (mechanizmus pri ktorom jednotlivec chápe svoje mentálne obsahy iba ako mentálne obsahy, nie ako skutočnosť - pričom beţný je skôr opak, keď vlastné myšlienky povaţujeme za fakty) podľa Jankowského a Holasa (2014) redukuje reagovanie na mentálne obsahy v rámci ich súdenia podľa vnímaných negatív (averzia) alebo pozitív (náklonnosti). To môţe potenciálne inhibovať aj iné mechanizmy ľudskej mysle - napr. myside zaujatosť závisí práve od sklonu prikláňať sa k tvrdeniam, ktoré sú nám vlastné a odklánať sa od tých s ktorými nesúhlasíme alebo sú nám cudzie. Všímavosť môţe túto tendenciu inhibovať. Reflektívna myseľ resp. racionalita v mnohom závisí práve od rozvoja exekutívnych funkcií, teda napr. aj inhibície alebo prepínania medzi úlohami (taskswitching). Pri rozvoji všímavosti je potrebné inhibovať sklony k blúdeniu mysle alebo reakcie na základe averzie/náklonnosti, zároveň je nutné často prepínať medzi rôznymi mentálnymi obsahmi. Výskumy potvrdzujú schopnosť všímavosti ovplyvniť komponenty exekutívnych funkcií (Teper, Segal, Inzlicht, 2013; Alfonso, Caracuel, Delgado-Pastor, & Verdejo-García, 2011). Nekonceptuálna povaha všímavosti zároveň môţe byť uţitočná tam, kde beţná introspekcia zlyháva. Pri všímavosti si totiţ jednotlivec mentálne obsahy iba všíma, nekomentuje ich v rámci svojho vnútorného monológu alebo niečo podobné. To môţe napomôcť zníţeniu interakcie medzi metakognitívnymi zloţkami všímavosti a všímanými obsahmi. Zároveň tomu môţe napomôcť nesúdiaci postoj spojený so všímavosťou. Všímavosť spojená s decentráciou môţe poskytovať iný druh introspekcie, ktorý môţe (ale nemusí byť) presnejší, neţ beţný druh introspekcie. Podobne argumentuje vo svojej teoretickej štúdii aj Carlsonová (2013), ktorá tvrdí okrem iného to, ţe všímavosť vďaka nesúdeniu môţe odstrániť aj motivačné bariéry brániace k sebapoznaniu, lebo iracionálne správanie môţe byť motivované aj snahou vyhnúť sa negatívnemu sebaobrazu, stratou sebaúcty. To moţno pozorovať napríklad pri mechanizme známej kognitívnej disonancie. V našom chápaní pojmu všímavosť a pojmu racionality zaloţenej na metakognícii vidíme mnohé prekrývajúce sa oblasti a tvrdíme na základe predloţených argumentov, ţe všímavosť môţe napomáhať rozvoju racionality a inhibícii heuristického spracovávania, ktoré stojí za mnohými kognitívnymi zaujatosťami. 1.4 Výskumný cieľ a hypotézy Výskumným cieľom tejto štúdie bola replikácia výsledkov niektorých zahraničných výskumov zameraných na všímavosť vo vzťahu k iracionalite. Zároveň sme sa pokúsili o pilotnú štúdiu v rámci vzťahu všímavosti a výkonu na úlohách, ktoré (podľa našich vedomostí) zatiaľ nikto neskúmal. V rámci tejto pilotnej štúdie sme sa obmedzili na črtovú všímavosť meranú sebavýpoveďovým dotazníkom, teda osobnostnú predispozíciu k všímavosti Hypotézy H1: Vyššia úroveň črtovej všímavosti bude u participantov spojená s vyššou odolnosťou voči heuristickému spracovávaniu. H2: Vyššia úroveň črtovej všímavosti bude u participantov spojená s presnejším predpovedaním vlastných budúcich emočných stavov. 2 Metódy 2.1 Participanti Výskumnú vzorku tvorilo 433 študentov z Univerzity Konštantína Filozofa v Nitre, väčšina participantov študovala pedagogický zameraný odbor. Vo vzorke sa nachádzalo 374 ţien a 58 muţov, priemerný vek bol 22,69 roka (SD = 1,459). Participanti boli oslovení na škole v rámci dobrovoľnej participácie na výskume výmenou za body k záverečnému hodnoteniu. Dáta sa 69

70 zozbierali v rámci rozsiahlejšieho zberu dát, ktorý bol spojený s odlišnými výskumnými cieľmi. 2.2 Materiály Črtová všímavosť bola zisťovaná dotazníkom Fivefacet mindfulness questionnaire FFMQ (Baer et al., 2006). FFMQ je dotazník, ktorý kombinuje poloţky z piatich iných dotazníkov zameraných na všímavosť Mindful Attention Awareness Scale alebo MAAS (Brown & Ryan, 2003), Freiburg Mindfulness Inventory alebo FMI (Buchheld, Grossman, & Walach, 2001), Kentucky Inventory of Mindfulness Skills alebo KIMS (Baer, Smith, & Allen, 2004), Cognitive and Affective Mindfulness Scale alebo CAMS (Feldman, Hayes, Kumar, & Greeson, 2004), Mindfulness Questionnaire alebo MQ (Chadwick, Hember, Mead, Lilley, & Dagnan, 2005). Z toho vyplýva aj 5 faktorov alebo stránok všímavosti, ktoré meria FFMQ nereagovanie na vnútornú skúsenosť, pozorovanie podnetov, konanie s uvedomením, popisovanie slovami, nesúdenie skúsenosti. Cronbachove alfa koeficienty jednotlivých faktorov sa v štúdii zameranej na konštruktovú validitu pohybovali od,72 po,92. Tvorcovia výskum vykonali na vzorke bez skúsenosti s meditáciou zameranou na všímavosť a aj na vzorke s takouto skúsenosťou (Baer et al., 2008). Dotazník obsahuje 39 poloţiek. Jednou z poloţiek bolo napríklad tvrdenie: "Pri chôdzi si zámerne všímam pocity spojené s pohybom môjho tela." Participanti mali indikovať mieru súhlasu s výrokmi na 6-bodovej Likertovej škále. Rozhodli sme sa pre tento dotazník z dôvodu, ţe kombinuje poloţky z viacerých iných dotazníkov zameraných na všímavosť a poskytuje moţnosť zachytiť rozdiely aj v jednotlivých stránkach všímavosti. Exploračná faktorová analýza nášho slovenského prekladu dotazníku FFMQ potvrdila 5-faktorovú štruktúru poloţiek, hoci niektoré poloţky sa ukázali ako problematické. Vnútorná reliabilita jednotlivých subškál meraná pomocou Cronbachovho alfa sa pohybovala od,645aţ po,795, čo moţno povaţovať za uspokojivé výsledky pri 4 z 5 piatich subškál. Subškála s najniţšou vnútornou reliabilitou ju však mala niţšiu uţ v pôvodnej verzii. Pre meranie miery podliehania kognitívnej lenivosti sme sa rozhodli vyuţiť Cognitive Reflection Test (CRT) od Fredericka (2005). Tento test je často vyuţívaný na zisťovanie všeobecnej miery podliehania heuristickému uvaţovaniu v neprospech deliberatívneho. Úlohy sú formulované tak, aby vyvolávali v participantoch určité jednoduché, ale nesprávne heuristické riešenia (teda sú to chytáky ), správne odpovede si vyţadujú sústredenejšiu pozornosť a inhibíciu intuitívnych riešení väčšiu kognitívnu námahu, opak kognitívnej lenivosti. CRT obsahuje nasledujúce typy úloh: - Baseballová pálka a loptička stoja spolu 1,10 Eura. Pálka stojí o 1 Euro viac neţ loptička. Koľko centov stojí lopta? Metodika určená na predpovedanie budúcich emočných stavov bola prevzatá zo štúdie Kermera, Driver-Linna, Wilsona a Gilberta (2006) s určitými úpravami (pôvodná škála meria len šťastie alebo nešťastie, rozhodli sme sa ju rozšíriť aj o iné emócie - hrdosť, šťastie, sklamanie a hnev). Participanti indikovali pozitívne resp. negatívne budúce emócie v súvislosti s výsledkami inteligenčného testu, ktorý bol súčasťou nesúvisiaceho zberu dát. Participanti mali následne určiť svoj emociálny stav, keď sa dozvedeli výsledky testu. Test inteligencie bol pouţitý, pretoţe predstavoval pomerne osobne dôleţitý výsledok na ktorý sa môţu naviazať rôzne emócie - skoro nikto nechce mať príliš nízke IQ, lebo to negatívne prispeje k sebaobrazu. Naopak, vysoké IQ môţe byť zdrojom pýchy pre jednotlivca. V súvislosti s tým sme merali aj presnosť odhadu výkonu v inteligenčnom teste, ktorú participanti indikovali po administrácii inteligenčného testu. 3 Výsledky Jednotlivým poloţkám CRT bol priradený 1 bod za kaţdú správnu odpoveď. Subškály FFMQ sme korelovali s výsledným skóre CRT v programe SPSS. Nakoľko jednotlivé subškály neboli normálne rozloţené, pouţili sme na určenie korelácií test Spearmanovho rho a Kendallovho tau. Ţiadna z korelácií medzi subškálami FFMQ a celkovým skóre CRT testu nebola signifikantná. Výsledky testov moţno vidieť v tabuľkách niţšie. Subškály Korelačný Sig. N koef. Observe 0,052 0, Describe -0,001 0, Nonreact 0,039 0, ActAware -0,016 0, Nonjudge 0,006 0, Tab. 1: Tabuľka výsledkov pre Kendallovo tau. Subškály: Observe - pozorovanie podnetov; Describe - popisovanie slovami; Nonreact - nereagovanie na vnútornú skúsenosť, ActAware - konanie s uvedomením, Nonjudge - nesúdenie skúsenosti. Subškály Korelačný p N koef. Observe 0,068 0, Describe -0,002 0, Nonreact 0,049 0, ActAware -0,020 0, Nonjudge 0,008 0, Tab. 2: Tabuľka výsledkov pre Spearmanovo rho. Subškály sú zaznačené rovnako ako v Tab

71 Hypotéza H1 a síce, že vyššia úroveň črtovej všímavosti bude u participantov spojená s vyššou odolnosťou voči heuristickému spracovávaniu, podporená nebola. V prípade predpovedania budúcich emočných stavov sa potvrdili efekty v predpokladanom smere - teda jednotlivci, ktorí predvídali sklamanie a hnev z precenenia vlastných výsledkov nezaţívali emócie do takej miery, ako ich predvídali. Na druhej strane podceňujúci jednotlivci tieţ nezaţívali emócie hrdosti a šťastia do takej miery, ako ich predvídali. Rozdiely boli signifikantné a tieto čiastkové výsledky boli uţ publikované inde (Jurkovič, 2014). Participantov sme rozdelili do skupín podľa toho, či sa precenili alebo podcenili v odhade výkonu v inteligenčnom teste. Participanti presne predpovedajúci svoj výkon do nasledujúcej analýzy zahrnutí neboli. Mnoho participantov nevyplnilo určené poloţky v dotazníku, preto sa počty participantov rôzne líšia. Následne sme pouţili regresnú analýzu, aby sme zistili, či skóre v subškálach FFMQ predikovalo presnosť predpovedaných emočných stavov. Ţiadna zo subškál FFMQ nebola signifikantným prediktorom presnosti predpovedania budúcich emočných stavov. Výsledky regresnej analýzy sú zhrnuté v nasledujúcich tabuľkách. Prediktor B SE β t p Observe,018,024,069,748,455 Describe,021,026,076,811,419 Nonreact -,022,033 -,053 -,649,518 ActAware -,004,024 -,015 -,169,866 Nonjudge -,004,024 -,015 -,155,877 Tab. 3: Výsledky regresnej analýzy pre presnosť predpovede pocitu šťastia u skupiny, ktorá svoj výkon podcenila (N = 161). Subškály sú zaznačené rovnako ako v Tab. 1. Prediktor B SE β t p Observe,023,026,084,898,370 Describe -,010,028 -,033 -,345,731 Nonreact -,058,037 -,130-1,547,124 ActAware,008,026,026,289,773 Nonjudge,013,026,046,479,663 Tab. 4: Výsledky regresnej analýzy pre presnosť predpovede pocitu hrdosti u skupiny, ktorá svoj výkon podcenila (N = 157). Subškály sú zaznačené rovnako ako v Tab. 1. Prediktor B SE β t p Observe -,008,064 -,022 -,130,897 Describe,034,062,102,558,579 Nonreact,010,081,018,130,897 ActAware -,092,055 -,259-1,669,102 Nonjudge -,064,055 -,200-1,165,250 Tab. 5: Výsledky regresnej analýzy pre presnosť predpovede pocitu sklamania u skupiny, ktorá svoj výkon podcenila (N = 52). Subškály sú zaznačené rovnako ako v Tab. 1. Prediktor B SE β t p Observe -,055,059 -,165 -,934,355 Describe,054,058,176,933,355 Nonreact,035,076,067,468,642 ActAware -,044,051 -,137 -,866,391 Nonjudge -,052,052 -,178-1,005,320 Tab. 6: Výsledky regresnej analýzy pre presnosť predpovede pocitu hnevu u skupiny, ktorá svoj výkon podcenila (N = 54). Subškály sú zaznačené rovnako ako v Tab. 1. Hypotéza H2 a síce, že vyššia úroveň črtovej všímavosti bude u participantov spojená s presnejším predpovedaním vlastných budúcich emočných stavov, podporená nebola. 4 Diskusia Cieľom príspevku bola replikácia zahraničného výskumu, kde jedna zo subškál FFMQ bola prediktorom presnosti predpovedania budúcich emócií. Výsledky tejto štúdie sa nepodarilo replikovať. Druhým cieľom štúdie bolo pokúsiť sa nájsť koreláciu medzi výkonom v úlohách CRT a subškálami FFMQ, pričom sme predpokladali pozitívnu koreláciu medzi prvkami črtovej všímavosti a výsledkami CRT. Ani tento predpoklad sa nám nepotvrdil. Za slabiny štúdie moţno povaţovať výskumnú vzorku, ktorá bola odborovo značne homogénna a pohlavne nevyváţená. Okrem toho svoju úlohu mohli zohrať pouţité materiály a design štúdie. Preklad škály FFMQ do slovenčiny sa mierne negatívne podpísal na vnútornej reliabilite jednotlivých subškál. Zistená faktorová štruktúra tieţ nezodpovedala predpokladom autorov dotazníka. V prípade úlohy zameranej na predpovedanie budúcich emócií sa síce prejavili typické znaky nepresnosti v predpovediach, no výsledky pre inteligenčný test nemuseli byť dostatočne osobne relevantné na vyvolanie extrémnejších emócií, hoci mnohí participanti sa zúčastnili výskumu pravdepodobne aj vďaka tomu, ţe sa mohli dozvedieť tieto výsledky. Zloţitejšie štatistické analýzy (napr. moderačná alebo mediačná analýza), ktoré by brali do úvahy aj iné faktory pôsobiace na interakciu všímavosti a mieru podliehania kognitívnym zaujatostiam (napr. výška inteligencie a pod.), by mohli byť uplatnené v záujme komplexnejších analýz. V neposlednom rade je nutné pozrieť sa aj na samotnú formu merania všímavosti v tejto štúdii. Sebavýpoveďové dotazníky často závisia od presnosti sebapoznania jednotlivcov, ktorá je, ako sme uviedli v úvode, často veľmi nepresná a skreslená. 71

72 Myslíme si preto, ţe budúci výskum by sa mal zamerať skôr na aktívne rozvíjanú stavovú všímavosť, ktorej intenzita je vďaka cieľavedomému tréningu pravdepodobne vyššia a tým aj jej vplyv na rôzne iné kognitívne procesy môţe byť výraznejší. Je tieţ však samozrejme moţné, ţe výsledky v zahraničných výskumoch spájajúcich kognitívne zaujatosti a všímavosť predstavujú náhodné chyby typu 1, teda falošne pozitívne výsledky a všímavosť nemusí byť vo vzťahu s racionalitou. Výskum v tejto oblasti je ale zatiaľ značne striedmy, preto povaţujeme za vhodné pokračovať vo výskume v tejto oblasti, keďţe moţnosti výskumu ešte neboli zďaleka vyčerpané a oblasť poznania sa rozširuje aj poznávaním jeho slepých uličiek (nevylúčením nulových hypotéz). Poďakovanie Príspevok bol podporený grantovou agentúrou VEGA 2/0064/13: Rozhodovanie expertov: vyuţívanie intuície expertmi pri riešení strategických úloh. Literatúra Alfonso, J. P., Caracuel, A., Delgado-Pastor, L. C., & Verdejo-García, A. (2011). Combined Goal Management Training and Mindfulness meditation improve executive functions and decision-making performance in abstinent polysubstance abusers. Drug and Alcohol Dependence, 117(1), Baer, R. A., Smith, G. T., & Allen, K. B. (2004). Assessment of mindfulness by self-report: The kentucky inventory of mindfulness skills. Assessment, 11(3), Baer, R. a, Smith, G. T., Hopkins, J., Krietemeyer, J., & Toney, L. (2006). Using self-report assessment methods to explore facets of mindfulness. Assessment, 13(1), Baer, R. A., Smith, G. T., Lykins, E., Button, D., Krietemeyer, J., Sauer, S.,... & Williams, J. M. G. (2008). Construct validity of the five facet mindfulness questionnaire in meditating and nonmeditating samples. Assessment, 15(3), Brewer, J. A., Worhunsky, P. D., Gray, J. R., Tang, Y.- Y., Weber, J., & Kober, H. (2011). Meditation experience is associated with differences in default mode network activity and connectivity. Proceedings of the National Academy of Sciences, 108(50), Brown, K. W., & Ryan, R. M. (2003). The Benefits of Being Present: Mindfulness and Its Role in Psychological Well-Being. Journal of Personality and Social Psychology, 84, Buchheld, N., Grossman, P., & Walach, H. (2001). Measuring mindfulness in insight meditation (vipassana) and meditation-based psychotherapy: The development of the freiburg mindfulness inventory (FMI). Journal for Meditation and Meditation Research, 1(1), Carlson, E. N. (2013). Overcoming the Barriers to Self- Knowledge: Mindfulness as a Path to Seeing Yourself as You Really Are. Perspectives on Psychological Science, 8(2), Emanuel, A. S., Updegraff, J. A., Kalmbach, D. A., & Ciesla, J. A. (2010). The role of mindfulness facets in affective forecasting. Personality and Individual Differences, 49(7), Farb, N. A. S., Segal, Z. V, Mayberg, H., Bean, J., McKeon, D., Fatima, Z., & Anderson, A. K. (2007). Attending to the present: mindfulness meditation reveals distinct neural modes of self-reference. Social Cognitive and Affective Neuroscience, 2, Feldman, G., Hayes, A., Kumar, S., Greeson, J., & Laurenceau, J.-P. (2006). Mindfulness and Emotion Regulation: The Development and Initial Validation of the Cognitive and Affective Mindfulness Scale- Revised (CAMS-R). Journal of Psychopathology and Behavioral Assessment, 29(3), Frederick, S. (2005). Cognitive Reflection and Decision Making. Journal of Economic Perspectives, 19(4), Gigerenzer, G. (2008). Rationality for Mortals: How People Cope with Uncertainty. London: Oxford University Press. Goyal, M., Singh, S., Sibinga, E. M., Gould, N. F., Rowland-Seymour, A., Sharma, R.,... & Haythornthwaite, J. A. (2014). Meditation programs for psychological stress and well-being: a systematic review and meta-analysis.jama internal medicine, 174(3), Hafenbrack, A. C., Kinias, Z., & Barsade, S. G. (2014). Debiasing the Mind Through Meditation Mindfulness and the Sunk-Cost Bias. Psychological science, 25(2), Halpern, J., & Arnold, R. (2008). Affective Forecasting: An Unrecognized Challenge in Making Serious Health Decisions. Journal of General Internal Medicine, 23(10), Hofmann S. G., Sawyer, A. T., Witt, A. A., & Oh, D. (2010). The effect of mindfulness-based therapy on anxiety and depression: A meta-analytic review. Journal of consulting and clinical psychology, 78(2),

73 Chadwick, P., Hember, M., Mead, S., Lilley, B., & Dagnan, D. (2005). Responding mindfully to unpleasant thoughts and images: Reliability and validity of the Mindfulness Questionnaire. Unpublished manuscript, University of Southampton Royal South Hants Hospital, UK. Chiesa, A. (2013). The difficulty of defining mindfulness: current thought and critical issues. Mindfulness, 4(3), Jurkovič, M. (2014). Predpovedanie vlastných emočných stavov (Affective Forecasting) a výkon v inteligenčnom teste. In Ballová Mikušková, E., & Čavojová, V. (Eds.), Rozhodovanie v kontexte kognície, osobnosti a emócií IV : súčasné trendy v rozhodovaní. (97-104), Bratislava : Ústav experimentálnej psychológie SAV, Kabat Zinn, J. (2003). Mindfulness based interventions in context: past, present, and future. Clinical psychology: Science and practice, 10(2), Kermer, D. A., Driver-Linn, E., Wilson, T. D., & Gilbert, D. T. (2006). Loss aversion is an affective forecasting error. Psychological Science, 17, Killingsworth, M. A., & Gilbert, D. T. (2010). A wandering mind is an unhappy mind. Science, 330(6006), Killingsworth, M. a, & Gilbert, D. T. Khoury, B., Lecomte, T., Fortin, G., Masse, M., Therien, P., Bouchard, V., Chapleaua, M., Paquina, K. & Hofmann, S. G. (2013). Mindfulness-based therapy: A comprehensive meta-analysis. Clinical Psychology Review, 33(6), Shea, N., Boldt, A., Bang, D., Yeung, N., Heyes, C., & Frith, C. D. (2014). Supra-personal cognitive control and metacognition. Trends in Cognitive Sciences, 18(4), Silvia, P. J., & Gendolla, G. H. E. (2001). On introspection and self-perception: Does self-focused attention enable accurate self-knowledge? Review of General Psychology, 5, Stanovich, K. E. (2011). Rationality and the Reflective Mind. London: Oxford University Press. Teper, R., Segal, Z. V., & Inzlicht, M. (2013). Inside the Mindful Mind: How Mindfulness Enhances Emotion Regulation Through Improvements in Executive Control. Current Directions in Psychological Science, 22(6), Trope, Y., & Liberman, N. (2010). Construal-level theory of psychological distance. Psychological review, 117(2),

74 Kognícia a umelý život 2015, Trenčianske Teplice Prečo Wittgenstein odmietal filozofické teórie Dezider Kamhal Centrum pre kognitívnu vedu, Fakulta matematiky, fyziky a informatiky UK, Mlynská dolina, Bratislava [email protected] Abstrakt Dielo L. Wittgensteina napriek významným odlišnostiam v rôznych obdobiach jeho filozofovania spája idea filozofie ako činnosti, nie filozofie ako disciplíny, ponúkajúcej špecificky filozofické poznatky. Podľa neho filozofia nie je náuka, nie je empirickou ani apriórnou vedou. Svoje názory na filozofiu odvodzoval z logickej (neskôr pragmatickej) analýzy slov a viet jazyka, pričom v neskoršom období hralo rozhodujúcu úlohu pripomínanie bežného, a teda zrozumiteľného používania filozoficky problematických slov, fráz a viet v jazyku. Príspevok ponúka objasnenie Wittgensteinových dôvodov pre jeho chápanie filozofie ako činnosti a naznačuje niektoré dôsledky jeho postoja pre filozofické teórie, aj v rámci tzv. filozofie mysle. 1 Úvod V prvom rade treba povedať, čo nie je cieľom tohto príspevku. Nasledujúci text nemá byť propagovaním vyhraneného wittgensteinovského antiteoretického chápania filozofie, jeho nonkognitivizmu, ani hlásaním nekriticky prevzatých názorov. Jeho úlohou je skôr priblížiť Wittgensteinove dôvody odmietania filozofie ako náuky a upozorniť predovšetkým na sémantické či sémanticko-pragmatické základy jeho postojov. Zámerom je ďalej ukázať, čo ho priviedlo k zmene pôvodného pohľadu na jazyk. 2 Filozofia ako činnosť podľa Logickofilozofického traktátu Od interpretácie jeho Logicko-filozofického traktátu (ďalej LFT) ako diela, ktoré má riešiť výlučne problém povahy jazyka a logické predpoklady a dôsledky jeho vzťahu k svetu, sa postupne, napríklad aj vďaka zverejnenej korešpondencii a spomienok jeho priateľa Paula Engelmana, prijala interpretácia LFT ako diela, ktoré malo, aj keď pomerne zvláštnym spôsobom, ponúknuť svojské riešenie pre Wittgensteina naozaj dôležitých, teda hodnotových problémov, ktorých sa odpovede na vedecké problémy podľa neho ani len nedotknú. Ide o problémy, ktoré sa riešia v rámci etiky, jednej zo súčastí tradične chápanej filozofie. Traktát bol teda zamýšľaný ako text, v ktorom sa prostredníctvom viet, ktoré samy nespĺňajú kritérium zmysluplnosti (takisto sprostredkovanému vetami, ktoré ich nespĺňajú) ukazujú hranice zmysluplnej reči. K odmietnutiu filozofie ako náuky, ponúkajúcej špecificky filozofické poznatky, sa Wittgenstein dostal akoby okľukou. V čase, keď začal riešiť problémy, ktoré stáli na začiatku jeho Traktátu, bol predovšetkým logikom. So všetkým, čo k tomu patrí, teda aj s logickým videním jazyka a jeho úlohy. Ako logika ho zaujímala predovšetkým problematika skutočnej, čiže logickej štruktúry viet a osobitne povaha logiky. Predpokladal, že podstatu logiky, alebo vyjadrené inak to, čo robí logiku logikou odhalí tak, že nájde povahu znakov, nevyhnutných vzťahov medzi nimi a nevyhnutných vzťahov medzi znakmi a tým, čo označujú. Napokon sa jeho skúmania sústredili na pochopenie a objasnenie podstaty vetného znaku. 1 Tento problém možno formulovať viacerými spôsobmi, napríklad: Aká je podstata jazyka?, Čo robí vetu (ako súčasť jazyka) vetou?, Aká je všeobecná forma vety? Práve posledná formulácia je príznakom logického pohľadu na jazyk a odpoveď na takto formulovanú otázku môžeme nájsť aj na viacerých miestach v LFT. V súlade s odpoveďou, ktorú Wittgenstein ponúkol, musí mať každá veta myslí sa, samozrejme, každá zmysluplná veta štruktúru, ktorá spĺňa túto formu. 2.1 Obrazová teória významu Už v prvej vete LFT sa objavuje výraz, ktorým sa čosi nepriamo hovorí o všeobecnej forme viet: Svet je všetko, čo fakticky je. 2 Každá veta tak má mať formu, ktorú možno v bežnom jazyku vyjadriť takto: Je to tak a tak. ( Má sa to tak a tak. ) Znamená to, že vety jazyka majú deskriptívnu povahu. Vyjadrujeme nimi stavy vecí, možné fakty či možné situácie, a teda aj sám jazyk je svojou povahou opisný. Vety sú logickými 1 Celá moja úloha spočíva v tom, vysvetliť podstatu vety. To znamená, udať podstatu všetkých faktov, ktorých obrazom je veta. (Wittgenstein, L. (2005), s. 73) 2 Citované z novšieho slovenského prekladu. Tu však vhodnejšie vyznieva starší preklad z Wittgenstein (1968): Svet je všetko, čo sa má tak a tak. 74

75 obrazmi možných stavov vecí a akékoľvek zoskupenie symbolov, ktoré neplní túto funkciu, je nezmyselné, nepatrí do zmysluplného jazyka. Zmysluplné teda môžu byť len vety, ktoré sú o faktoch, inak povedané, empirické vety. Ak si filozofi tradične nárokovali schopnosť ponúkať nadskúsenostné alebo predskúsenostné poznatky, jednoducho sa pokúšali o nemožné. Všetky údajné filozofické problémy a odpovede na ne formulované v jazyku sa tak podľa traktátovského chápania jazyka musia pokladať za nezmysly. Logicky pravdivé a logicky nepravdivé vety, tautológie a kontradikcie, takisto nemôžu mať zmysel, pretože ich pravdivosť či nepravdivosť nezávisí od stavu sveta. Preto o ňom nič nehovoria, preto ho nemôžu zobrazovať. Na základné logicko-sémantické predpoklady Logicko-filozofického traktátu poukázal sám Wittgenstein v poznámkach zo svojho neskoršieho obdobia. Tieto poznámky slúžili zároveň ako pripomenutie evidentných faktov, týkajúcich sa bežnej jazykovej praxe, ktoré by mal akceptovať ktokoľvek, kto sa pokladá za jazykovo kompetentného. O ktoré predpoklady išlo a ako spolu so svojimi dôsledkami určovali Wittgensteinove názory na filozofiu? - všetky symboly zastupujú svoje významy, - symboly majú jednoznačný, definovateľný význam (vyžaduje sa určitosť ich významu), - okrem symbolov, ktoré zastupujú komplexy, musia existovať jednoduché, ďalej neanalyzovateľné symboly (keby neexistovali, nemohli by sme rozumieť komplexným symbolom, pretože by sme museli najprv zistiť, či sú pravdivé vety, ktoré opisujú komplexy zastúpené komplexnými symbolmi, a to by sme mohli len za predpokladu, že sme týmto vetám porozumeli, teda poznali komplexy alebo jednoduché predmety, ktoré sú zastúpené symbolmi; a vete musíme najprv rozumieť, až potom ju môžeme overovať), - jednoduché symboly, mená, pomenúvajú predmety a predmety sú ich významami, - významy jednoduchých symbolov chápeme priamo, nesprostredkovane, a to tak, že poznáme predmet, ktorý daný jednoduchý symbol pomenúva/zastupuje, - význam komplexného symbolu, napríklad vety, je funkciou významov svojich zložiek (významov elementárnych viet chápaných ako konfigurácií mien, a teda významov mien = jednoduchých predmetov a ich konfigurácií), - predmety sú súčasťou sveta a zároveň významami mien, a týmto spôsobom sa jazyk akoby dotýka sveta. Odmietnuť filozofiu ako náuku teda Wittgensteinovi umožnila stratégia, ktorá vymedzovala zmysluplnosť viet akoby zvnútra, prostredníctvom domyslenia názorov v pozadí jeho tzv. obrazovej teórie významu. K vete ako obrazu patrí aj zobrazovací vzťah, v ktorom sú prvky vety a prvky zobrazeného (logicky) možného faktu. Ak sa niekto pokúša formulovať poznatky o niečom inom ako o faktoch, ak konštruuje zoskupenia symbolov, ktoré nepredstavujú niektorú z logických možností, možností skutočnosti, 3 usiluje sa o niečo, čo sa v jazyku nedá vyjadriť. Ak nemožno k jeho vetám priradiť zobrazovací vzťah, nemožno im rozumieť, pretože jeho vety nemajú zmysel. Nezmyselné vety nemôžu byť pravdivé (ani nepravdivé), teda nemôžu vyjadrovať poznatok (ani omyl). V prípade, že sa filozofi explicitne hlásia k takému chápaniu filozofie, ktoré predpokladá, že predmetom filozofie je akási nadempirická alebo mimoempirická skutočnosť, netreba nezmyselnosť filozofických viet ukazovať jednu po druhej. V takomto prípade platí, že ak filozof vysloví zmysluplnú faktovú vetu, neponúka filozofický poznatok, a ak ponúka vetu, ktorá má vyjadriť takto chápaný filozofický poznatok, tak sa jednoducho mýli. Jeho omyl nespočíva v nepravdivosti inak zmysluplnej vety, ale v tom, že takúto vetu pokladá (a predkladá) ako zmysluplnú. Keď pri takomto kritériu zmysluplnosti viet (pri takomto chápaní podstaty vety) nebolo možné zachrániť filozofiu ako náuku, prichádzali do úvahy v zásade dve možnosti. Prvou bola možnosť úplne vylúčiť filozofiu z ríše zmysluplnej reči a nestarať sa o jej osud. Druhou bola možnosť, ktorú v LFT prijal Wittgenstein, totiž charakterizovať filozofiu ako činnosť, ktorá spočíva v logickom objasňovaní myšlienok. Výsledkom tejto činnosti však nemali byť filozofické vety, teda vety vyjadrujúce filozofické poznatky. 4 Toto vymedzenie filozofie ako filozofovania má však svoje vlastné úskalia. 5 Nezodpovedanou otázkou ostáva, ako všeobecne odlíšiť filozofické pseudovety od iných druhov nezmyslov, inak povedané, čím špecifickým sa vyznačujú filozofické nezmysly. V TLF sa v súvislosti s nemožnosťou hovoriť zmysluplne o hodnotách hovorí len o etike a estetike ako o súčastiach filozofie a o nemožnosti ich existencie ako (normatívne chápaných) vied. Práve normatívne chápané vety o hodnotách (o tom, čo je správne a nesprávne, ako sa má žiť a ako nie a pod.), ktoré by mohli ponúkať pre život najdôležitejšie odpovede, nemohli mať podľa Wittgensteinovho kritéria význam. Patrili k veciam, o ktorých nie je možné hovoriť. 3 Pre presnosť treba dodať, že neponúka ani zoskupenia symbolov, ktoré sú tautológiami alebo kontradikciami. 4 Účelom filozofie je logické vyjasňovanie myšlienok. Filozofia nie je náuka, ale činnosť. Filozofické dielo bytostne pozostáva z objasnení. Výsledkom filozofie nie sú filozofické vety, ale to, že sa vety stanú jasnými. Filozofia má myšlienky, ktoré sú inak akoby matné a hmlisté, vyjasniť a ostro ohraničiť. (Wittgenstein, 2003, 4.112, s. 73) 5 Pozri napr. Kamhal, D. (2008). 75

76 3 Filozofia ako činnosť podľa neskorého Wittgensteina Aj v neskoršom období Wittgenstein pokladal filozofické otázky a odpovede na ne za nezmyselné, aj keď filozofické konfúzie už nie sú spôsobené len tým, že nerozumieme (striktne chápanej) logike jazyka. Porozumieť jeho postoju a prípadne ho prijať možno najlepšie tak, ako to robil on pripomínaním si samozrejmostí týkajúcich sa bežného, každodenne používaného jazyka, ktoré ho zbavili niekdajších teoretických predsudkov. Tak ako v Logicko-filozofickom traktáte hovoril o podstate jazyka bez toho, aby sa zaoberal konkrétnymi jazykmi, v neskoršom období Wittgenstein hovoril o povahe filozofie bez toho, aby sa zaoberal rozmanitými druhmi filozofie či filozofovania. Mal na to však dobré dôvody. Po prvé, zaoberal sa hlavne svojimi vlastnými omylmi a konfúziami z raného obdobia a preto sa venoval hľadaniu ich zdrojov v tom, čo a ako sám kedysi ako logik-filozof robil. 6 Ako sme uviedli, predmetom jeho vtedajšieho záujmu bola logická povaha jazyka a jeho vzťahu k svetu. Po druhé, ak má filozofia ponúkať poznatky, teda pravdivé tvrdenia (ako výpovedné, komunikačné akty), aj jej tvrdenia musia spĺňať isté podmienky pre tento druh jazykového konania. Filozofi však vyslovujú a píšu vety, ktoré síce na prvý pohľad vyzerajú ako vety použité na vydarené tvrdenia, ale buď je vyslovenie týchto viet nezrozumiteľné z hľadiska rečového konania, alebo v lepšom prípade vyjadrujú to, s čím by mal súhlasiť každý kompetentný používateľ jazyka. 7 Navyše, filozofické tvrdenia majú byť odpoveďami na filozofické otázky, ktoré zase prinajmenšom často ignorujú podmienky zrozumiteľnosti otázok ako výpovedných aktov. 8 Druhý dôvod možno vyjadriť aj otázkami: Môžu vôbec filozofi ponúkať aj niečo iné než sú výpovede týkajúce sa tak či onak jazyka (významov výrazov, pojmov, významov výpovedí)? A môžu nimi vyjadriť niečo skutočne nové? 6 To bol dôvod, prečo podľa neho možno jeho nové myšlienky najlepšie pochopiť na pozadí LFT. Pozri Malcolm (1993), Bližšie objasnenie Wittgensteinovho stanoviska by si vyžadovalo oveľa viac priestoru. Rozdiel možno ilustrovať týmito dvoma príkladmi: 1. Bežné vlastné mená nie sú mená. (Parafráza názoru B. Russella), 2. Nejaký človek rozumie pozdravu vtedy, keď naň primerane reaguje. 8 Nasledujúci ilustračný príklad zároveň poukazuje na to, že aj keď sú v otázke bežne používané výrazy, zrejme sa nemôžu použiť bežným spôsobom, pretože inak by sme otázku pokladali za banálnu (kto a komu by ju položil?) a odpoveď na ňu za samozrejmú: Can we ever really know what is going on in someone else's mind? (Dennett, 1996), s. 1) 3.1 Jazykový výraz ako nástroj, význam výrazu ako jeho používanie Wittgenstein si uvedomil, že základným zdrojom omylov LFT bol predpoklad, že významom výrazu je nejaká entita, ktorú výraz zastupuje. Prestal chápať sémantiku výrazov na základe ich akoby samozrejmej analógie s vlastnými menami. Na slová a vety jazyka začal pozerať ako na nástroje, ktorými my, používatelia jazyka niečo robíme. Preto začal o význame nejakého výrazu hovoriť ako o jeho použití alebo používaní, o jazykovom úze, o jazykových zvyklostiach príslušnej jazykovej komunity. Pod použitím či používaním nejakého slova pritom nemal na mysli len ich vyslovenie za istých okolností, ale predovšetkým začlenenie ich vyslovenia, chápaného ako istý druh činnosti, do iných činností, správania, súboru činností, ktoré tvoria relatívne uzavretý celok a sú previazané s formami života. K traktátovskému zdroju možných omylov tak pribudlo množstvo ďalších možností. Vzhľadom na to, že Wittgenstein už nepovažoval jazyk za abstraktný systém, ale za konglomerát jazykových hier, relatívne samostatných s jazykom súvisiacich činností, navzájom prepojených prostredníctvom akýchsi rodinných podobností, mohlo byť oveľa viac logík (logík v inom zmysle slova ako v Traktáte). Každá jazyková hra má svoju vlastnú logiku, pravidlá, ktorými sa riadime, takže možno hovoriť o množstve druhov omylov, viazaných na rozmanité jazykové hry. Konfúzií súvisiacich s neadekvátnym použitím jazykových výrazov môže byť oveľa viac. Tie totiž už nespočívajú len v tom, že v nejakej vete sa nachádza výraz, ktorý nič nezastupuje, alebo v tom, že výrazy boli zle usporiadané, ale aj v tom, že výrazy, napríklad aj celé vety, môžu byť použité aj inými, zvláštnymi, nie bežnými spôsobmi, teda nezrozumiteľne. Pod bežným spôsobom použitia sa má na mysli obvyklé, zabehané, zrozumiteľné používanie príslušného výrazu v danej jazykovej komunite. Nezmyselným, nezrozumiteľným sa tak vlastne stáva vyslovenie 9 nejakého výrazu mimo rámca jazykových hier, v ktorých ho normálne používame. Ďalším kľúčovým prvkom je pripomenutie si toho, že výrazy, tak ako sa bežne používajú, nemajú ostré hranice. Ich význam nie je ostro vymedzený a nie je ani vymedziteľný. Nemožno ho vyjadriť v podobe striktnej definície, ak by taká definícia mala zachytávať jeho skutočné používanie. Samo skúmanie toho, čo nejaký výraz skutočne znamená, je veľmi zvláštna aktivita. Môže byť vôbec jasné, ako by mala takáto činnosť vyzerať? Ako by sme vôbec zistili, či bola úspešná? Čím by sme potvrdzovali alebo vyvracali tvrdenia o význame, ktoré by boli jej výsledkom? Samozrejme, nejde o odmietanie alebo podceňovanie definícií. Ľubovoľný výraz môžeme definovať ako len chceme, v tomto zmysle niet o definovateľnosti pochýb. Definície, najmä vo 9 Široko chápané, vrátane napísania. 76

77 vedeckých jazykoch, majú svoje dôležité miesto. Otázne však je, čo môžu priniesť, ak sa ponúkajú ako cesta k objasneniu významu nejakého bežne používaného výrazu. Pointa je v tom, že pri akejkoľvek definícii bežného výrazu ňou už meníme jeho význam. Výrazu s neostrými hranicami priraďujeme ostro vymedzený význam. Wittgenstein preto takto motivované filozofické pokusy o definovanie významov výrazov, ktoré sa používajú aj bežne, napríklad výrazov meno, veta, pravda, význam, mieniť atď. pokladal za zdroj konfúzií. Filozofi, ktorí tieto výrazy takto definujú, ich naďalej používajú aj v bežnom zmysle, a to nielen v živote, ale aj vo filozofických textoch. Stáva sa potom, že aj v tej istej vete použijú to isté slovo prinajmenšom dvoma spôsobmi, čo vedie buď ku kontradikcii, alebo ku konfúziám. Ako hovorí Wittgenstein, definovaním nejakého výrazu si určíme isté pravidlo a potom, keď podľa neho postupujeme, nejde to tak, ako sme predpokladali alebo vyjde to inak, ako sme mienili, a zapletáme sa tým do vlastných pravidiel. (Wittgenstein, 1979, 125, s. 76.) 3.2 Zhromažďovanie spomienok na určitý účel Jedným z hlavných zdrojov našich nedorozumení, keď hovoríme o slovách (pojmoch, významoch slov) je podľa Wittgensteina to, že nemáme jasný prehľad o používaní našich slov. Preto je vo filozofii mimoriadne dôležité usporadúvanie, dosahovanie prehľadného opisu toho, čo je nám už známe. Usporiadaním toho, čo už ako kompetentní používatelia jazyka vieme, môžeme (nielen) ako filozofi pochopiť, ako dochádza ku konfúziám. K takémuto prehľadu vedie pripomínanie si používania príslušných výrazov za bežných, normálnych okolností, za ktorých sme sa ich naučili používať a za ktorých je nám ich použitie zrozumiteľné. Podľa Wittgensteina je úlohou filozofa poukazovať na významové posuny alebo na skryté definície významov výrazov, ktoré vedú k filozofickým presudoproblémom. Paradoxom je, že filozofi ich ponúkajú najčastejšie podľa vlastného presvedčenia v podobe faktových tvrdení, aj keď vety, ktoré pritom vyslovujú, sú gramatické (vo wittgensteinovskom, pomerne svojskom zmysle tohto slova). 10 Alebo ešte výstižnejšie, úlohou filozofa je poukazovať na nezrozumiteľnosť filozofických použití výrazov, riešiť zmätky, ktoré vznikajú vtedy, keď jazyk beží akoby naprázdno.( Wittgenstein, 1979, s. 78.) Filozof to má robiť, ako som spomenul, pripomínaním bežného používania slov, ktoré sú filozoficky problematické. Práve konkrétny filozofický problém je tým účelom, o ktorých sa hovorí vo fráze zhromažďovanie spomienok na určitý účel.(wittgenstein, 1979, 127, s. 77.) Ak máme vo filozofii, napríklad aj vo filozofii 10 Pozri najmä jeho Modrú knihu. - Wittgenstein, L., (2002), mysle, problémy súvisiace napr. s výrazmi poznať, vedieť, tak pripomíname (sebe aj iným) vety a situácie bežného, každodenného jazyka, v ktorom sa slovo poznať vyskytuje a používa bežným zrozumiteľným spôsobom, aby sme tak sebe aj iným ukázali, v čom sa naše alebo ich použitie líši od bežného. Tým sa zbavujeme jedného zo zdrojov filozofických problémov, problémov, ktoré majú podľa Wittgensteina formu: Nevyznám sa. (Wittgenstein, 1979, s. 76.) 3.3 Náznak obvyklého postupu filozofická analýza výrazu poznanie Ak sa zhodneme s Wittgensteinom v tom, že filozofia či filozofovanie sa týka jazyka, konkrétne významu (použitia/používania) niektorých jeho filozoficky zaujímavých výrazov, môžeme si aspoň čiastočne naznačiť podivnosti takejto aktivity na príklade filozofického skúmania 11 významu výrazu poznanie. Na začiatku zvyčajne stojí otázka Čo je to poznanie? Potom nasledujú rôzne viac alebo menej rozvinuté pokusy odpovedať, napríklad takto: Poznanie je pravdivé zdôvodnené presvedčenie. Tieto odpovede sa pritom nechápu ako definície výrazu poznanie, ale ako opisy toho, čo nazývame poznaním. Za povšimnutie stojí, že už pri tejto odpovedi sa používanie slova poznanie svojvoľne obmedzuje len na niečo, čo sa dá vyjadriť tvrdením (vety formy Viem, že p, Vie, že p, kde p je propozícia). Ak sa narazí na prípad, ktorý spĺňa kritériá odpovede a pritom nejde o prípad toho, čo by sme nazvali poznaním, 12 alebo častejšie na prípad, ktorý nespĺňa kritériá ponúknuté v odpovediach a predsa by sme ho nazvali poznaním, pokračuje sa týmto spôsobom ďalej a ďalej. 13 Zdá sa, že naznačený postup je nielen v poriadku, ale navyše nám ponúka východisko zo šlamastiky spôsobenej neostrosťou výrazu poznanie v bežnom jazyku. Stačí sa však zamyslieť na tým, ako naozaj prebieha alebo ako by naozaj prebiehalo takéto odporúčané skúmanie. Naozaj nám spôsobuje neostrosť či mnohoznačnosť výrazu poznanie z bežného jazyka problémy? Aké? Čo získame, ak tento výraz presne vymedzíme? 11 Samozrejme, filozofické skúmania sa odlišujú od skúmania javov, predmetov či procesov vo vede. Ak si chce filozofia zachovať status samostatnej disciplíny (alebo aktivity osobitného druhu), aj sa musia odlišovať. Podotýkame, že nefilozofujú len filozofi. 12 Zamyslime sa: Ako vieme, čo by sme nazvali poznaním, aj keď to nespĺňa kritériá ponúknuté v definícii? 13 Pozri napr. Gettier, E. L. (1963) a rozsiahlu následnú diskusiu. 77

78 Samozrejme, nový definitoricky zavedený význam výrazu poznanie 14 môže byť pre nejaký účel užitočný, ale túto užitočnosť musí zdôvodniť ten, kto definíciu predkladá, ak si chce zabezpečiť jej prijatie. 15 Ak je pre nás ideálom vytvorenie teórie pracujúcej s jednoznačne vymedzeným výrazom poznanie, tento výraz si jednoducho musíme definovať. A keďže ide o definíciu, môžeme si ho definovať podľa vlastných preferencií. Čokoľvek však v príslušnej teórii povieme o poznaní, bude o poznaní zavedenom definitoricky, nie o tom, čo nazývame poznaním v bežnom jazyku. Navyše, všetky poznatky takejto teórie o poznaní sú len dôsledkami vyplývajúcimi z jeho definície. Napokon, príkladom takéhoto dôsledku je aj Dennettova otázka citovaná v poznámke č. 8. V jeho otázke sa implicitne predpokladá iný význam slova know. Takú otázku si môže vážne položiť len človek, ktorý je nespokojný s tým, ako sa používa slovo poznať ( vedieť) v bežnom jazyku. Je dôležité do dôsledkov si uvedomiť, že definícia ako taká je vecou konvencie a otázka jej pravdivosti a nepravdivosti potom nie je namieste. Ak chce niekto takouto koncepciou vychádzajúcou z definície objasniť význam (používanie) výrazu poznanie a príbuzných výrazov, jednoducho triafa mimo. Inak povedané, vyvstáva tu otázka účelu takýchto koncepcií, systematicky budovaných pojmových konštrukcií. V súvislosti s definíciami, ktorými sa stanovujú a zavádzajú nové významy, je teda nezrozumiteľné hovoriť o súhlase ako odobrení ich pravdivosti. Ich pravdivosť, ak o nej vôbec možno v tejto súvislosti hovoriť, je vecou nášho rozhodnutia. Inak povedané, ich pravdivosť sa nezisťuje, ale stanovuje. Tzv. analytické definície, o ktorých sa niekedy napríklad tvrdí, že pravdivo vyjadrujú vzťah medzi definiendom a definiensom v príslušnom jazyku 16 by boli akýmsi hybridným druhom výpovedí, ktorými sa niečo pravdivo tvrdí, a zároveň sa pravdivosť týchto výpovedí stanovuje. Dôležité je teda nezamieňať si výpovede o gramatických pravidlách s definíciami a ešte dôležitejšie je uvedomovať si, že ak pri hovorení o výrazoch jazyka neponúkame tvrdenia opisujúce a pripomínajúce faktické používanie jazyka (tvrdenia, ktoré, prirodzene, obsahujú výrazy bežného jazyka použité bežnými, zrozumiteľnými spôsobmi), ide zrejme o implicitné alebo v lepšom prípade explicitné definície. Tie potom môžeme prijať resp. neprijať, no nie na základe ich pravdivosti resp. nepravdivosti, ale podľa účelov, ktorým majú slúžiť. 14 Musí byť nový už len z toho dôvodu, že je iný ako význam výrazu poznať v bežnom jazyku. Ten sa ako údajne problematický má nahradiť presným, čiže neproblematickým. 15 Nejde totiž o pravdivosť, ale o praktickosť, užitočnosť, vhodnosť pre nejaký účel. 16 Pozri Bielik, L., Gahér, F., Zouhar, M. (2010), s Záver Nezrozumiteľnosť či nezmyselnosť v prípade jazyka sa neobmedzuje na abstraktne chápané jednoduché či zložené výrazy, ale týka sa špecifického druhu konania, totiž hovorenia a výpovedí chápaných ako výpovedné akty. Každý človek, teda aj filozof, používa výrazy a môže ich používať tak, ako sa zrozumiteľne a bezproblémovo používajú v normálnych situáciách, v ktorých sme sa ich naučili používať, alebo ich môže používať inak, pričom buď explicitne uvedie ako, alebo ich používa implicitne inak, pričom si to často neuvedomuje. Hlavným problémom filozofických teórií a otázok je, že narábajú s termínmi v rozpore s tým, ako ich samy vysvetľujú. Ako uvádza H.-J. Glock (1992, s. 84.), tieto filozofické koncepcie čelia trileme: buď sa im nedarí vysvetliť ich odborné použitie termínov, alebo používajú svoje termíny nezlučiteľne s ich neodborným použitím (ktoré používajú tiež, už pri formuláciách problémov a ktoré chcú objasniť), alebo používajú svoje termíny síce konzistentne, ale úplne mimo pôvodného filozofického problému, založeného na bežnom používaní termínov. Úplne na záver jeden obsiahlejší citát z Filozofických skúmaní, ktorý môže vniesť viac svetla do Wittgensteinovho stanoviska, ktoré sa v článku objasňuje: Keď hovorím o jazyku (slove, vete atď.), musím hovoriť jazykom každodenného života. Je tento jazyk azda prihrubý, primateriálny na to, čo chceme povedať? Ale ako sa potom tvorí iný jazyk? A aké zvláštne, že si s tým naším vôbec vieme čo počať! Už z toho, že pri svojich vysvetleniach týkajúcich sa jazyka musím použiť už úplný jazyk (a nielen nejaký prípravný, predbežný), vidieť, že o jazyku môžem povedať iba čosi vonkajškovité. (Wittgenstein 1979, 120, s. 75.) Poďakovanie Tento príspevok vznikol za podpory grantovej agentúry VEGA v rámci grantovej úlohy č. 1/0644/13 Metafilozofia ako pragmatická analýza filozofických výpovedí. Literatúra Bielik, L., Gahér, F., Zouhar, M. (2010). O definíciách a definovaní, Filozofia, roč. 65, č. 8, Dennett, D. (1996). Kinds of Minds, BasicBooks. Gettier, E. L., (1963). Is Justified True Belief Knowledge? Analysis, Vol. 23, No. 6, Glock, H.-J., (2003). Philosophical Investigations section 128: theses in philosophy and undogmatic 78

79 procedure. In: Arrington, R. L., Glock, H.-J. (2003), Wittgenstein's Philosophical Investigations. Text and Context, Routledge, vydanie e-library, Kamhal, D., (2008). Wittgensteinovo filozofovanie, V zborníku Wittgensteinovské skúmania, Schola Philosophica, Pusté Úľany, Malcolm, N., (1993). Ludwig Wittgenstein v spomienkach. Archa, Bratislava. Wittgenstein, L., (1968). Tractatus Logico- Philosophicus. Antológia z diel filozofov. Logický empirizmus a filozofia prírodných vied, Bratislava, VPL, Wittgenstein, L. (1979). Filozofické skúmania, Pravda, Bratislava. Wittgenstein, L. (2002). Modrá a Hnedá kniha. Kalligram, Bratislava. Wittgenstein, L. (2003). Tractatus logicophilosophicus. Kalligram, Bratislava. Wittgenstein, L. (2005). Denníky , Kalligram, Bratislava. 79

80 Kognícia a umelý život 2015, Trenčianske Teplice Rozhodnutia o živote a o peniazoch: Doménové špecifickosti v efekte rámcovania Matúš Konečný Fakulta sociálnych a ekonomických vied UK Mlynské luhy 4, Bratislava [email protected] Abstrakt Pozitívne rámcované alternatívy vyvolávajú u ľudí voľby, ktoré sú averznejšie k riziku ako tie isté alternatívy rámcované negatívne. Zdá sa však, že viaceré modely, ktoré ho označujú za chybu v racionalite, zanedbávajú niektoré aspekty bežného používania jazyka. V experimente (N = 979) sme porovnávali interpretácie opisov istých alternatív v rozhodovacích úlohách v doménach ľudských životov a peňazí. Zistili sme, že časť ľudí pravdepodobne neinterpretuje rôzne rámcované alternatívy ako logicky ekvivalentné. Interpretácie v doméne peňazí majú asi o niečo bližšie k splneniu klasického očakávania ekvivalencie rámcov. Tieto "nepresnosti", ktoré so sebou prináša používanie jazyka však môžu umožniť cielenú komunikáciu dodatočných významov. 1 Efekt rámcovania Efekt rámcovania (framing effect) začal lákať pozornosť výskumníkov v oblasti usudzovania a rozhodovania od prvého pozorovania Tverskym a Kahnemanom (1981). Jedným z najrozšírenejších typov úlohy s riskantnou voľbou sú modifikácie problému s ázijskou chorobou (ADP - asian disease problem), ktorý bol použitý aj v pôvodnej štúdii. Modifikované zadanie ADP: Predstav si, že vypukla epidémia choroby, na ktorú v prípade, že nebude prijaté žiadne opatrenie, zahynie 600 ľudí. Boli navrhnuté dve opatrenia na boj s chorobou. Presné dôsledky jednotlivých opatrení sú nasledovné. Ktoré z opatrení by si zvolil/a? Zatiaľ ADP môže pôsobiť ako úplne nevinná úloha, však manipulácia opisného rámca alternatív vyvoláva predikovateľné zmeny vo voľbách. Ľudia častejšie volia riskantnú alternatívu, keď sú možnosti rámcované negatívne: Opatrenie A: 400 ľudí zahynie. Opatrenie B: 1/3 pravdepodobnosť, že zahynie 0 ľudí a 2/3 pravdepodobnosť, že zahynie 600 ľudí. Keď sa teda ľudia rozhodujú medzi opatreniami A a B, majú tendenciu si vybrať riskantné opatrenie B. Preferencie mnohých sa však zmenia v prípade, ak majú na výber medzi "tými istými" 1 alternatívami, ktoré sú rámcované pozitívne: Opatrenie C: 200 ľudí bude zachránených. Opatrenie D: 1/3 pravdepodobnosť, že bude zachránených 600 ľudí a 2/3 pravdepodobnosť, že bude zachránených 0 ľudí. Pri pozitívnom rámcovaní si ľudia častejšie vyberú isté opatrenie C a len malá proporcia ľudí uprednostní opatrenie D. Efektom rámcovania sa označuje práve toto obrátenie preferencií v závislosti od rámcovania alternatív. Alternatívy prezentované z pohľadu ziskov (pozitívne rámcovanie) vyvolávajú u ľudí voľby, ktoré sú averznejšie k riziku ako keď sú im rovnaké alternatívy prezentované z pohľadu strát (negatívne rámcovanie). Popularita medzi výskumníkmi, ktorej sa tento fenomén teší, môže súvisieť s rozšírením významu pojmu "efekt rámcovania" na väčšiu množinu javov plynúcich z formulácií problémov posudzovaní a rozhodovaní. Označovanie odlišných javov rovnakou nálepkou "efekt rámcovania" vyústilo po dekádach do istého zmätku. Typológia, ktorá tento zmätok pomohla povšimnutiahodne upratať, rozlišuje základné kategórie efektov rámcovania rámcovanie cieľov, atribútov a riskantných volieb (Levin, Schneider a Gaeth, 1998). Zdá sa pravdepodobné, že tieto tri typy sa odlišujú aj na úrovni kognitívneho spracovania. Najodlišnejším z trojice je azda rámcovanie cieľov, ktoré zostáva mimo záujmu nášho výskumu. Ostatné dva typy sú o niečo príbuznejšie, však stále signifikantne líšiace sa. Kým rámcovanie atribútov sa zameriava na hodnotenie, teda posudzovanie (napr. kvality mäsa, výsledkov projektov), rámcovanie riskantných volieb meria efekty po procese rozhodovania. Efekt rámcovania je meta-analýzami overený efekt s bohatou minulosťou (Gambara a Piñon, 2005; Kühberger, 1998). Rámcovanie riskantných volieb patrí k najčastejšie skúmaným, spomedzi troch spomínaných typov efektu rámcovania. Prezentovaný výskum 1 Prečo boli použité úvodzovky sa dozviete ďalej. 80

81 adresuje otázky doménovej špecifickosti rámcovania riskantných volieb. 1.1 O životoch a peniazoch Problém ázijskej choroby (ADP) bol v originálnom zadaní rozhodovacou úlohou v doméne ľudských životov. Nie je to pravidlom pri všetkých jeho modifikáciách, ale zachovanie domény životov je v publikáciách frekventované. Okrem spomínaného ADP, boli už aj v pôvodnom výskume Tverskeho a Kahnemana (1981) použité ďalšie úlohy. Zvyšné úlohy sa však týkali inej domény peňazí. Typickým príkladom rámcovania v peňažnej úlohe (gamble - GBL) je problém 3 s problémom 4, ktorý použili Tversky a Kahneman (1986, p. 256). Problém 3 je opisom peňažnej úlohy v pozitívnom rámci: Predstav si, že si o $300 bohatší ako dnes. Musíš si vybrať medzi: A - istý zisk $100 B - 50% šanca získať $200 a 50% šanca získať nič Pri tejto úlohe, podobne ako pri ADP, majú ľudia v pozitívnom rámcovaní tendenciu zvoliť si istý zisk. Samozrejme, úloha GBL má aj svoju negatívne rámcované alternatívy: Predstav si, že si o $500 bohatší ako dnes. Musíš si vybrať medzi: C - istá strata $100 D - 50% šanca stratiť nič a 50% šanca stratiť $200 Pri tejto formulácii býva pozorované, už známe, obrátenie preferencií. Ľudia preferujú riskantnú možnosť D, napriek tomu, že finančné výsledky týchto možností sú úplne rovnaké, nezávisle od rámcovania. Výskumníci nevenujú veľa pozornosti odlišnostiam medzi voľbami v úlohách ako ADP a GBL 2 a tieto úlohy bývajú chápané ako veľmi podobné. Domnievame sa však, že z pohľadu toho, ako jednotlivci interpretujú informácie, ktoré sú im v zadaní úlohy poskytnuté, môže mať rozdiel v doménach medzi úlohami ako GBL a ADP závažný vplyv. Cieľom nášho výskumu bolo adresovať otázky interpretácie zadaní úloh v doméne financií a v doméne ľudských životov. 1.2 O ekvivalencii rôzne rámcovaných alternatív V úlohách ako ADP a GBL sa dajú rozlíšiť dve dimenzie ekvivalencie. Prvá dimenzia je medzi alternatívami, druhá medzi rámcami. Z pohľadu teórie očakávanej hodnoty sú alternatívy A a B v úlohe GBL rovnaké. Istota získať $100 má rovnakú očakávanú hodnotu ako 50% 2 Niektoré odlišnosti medzi úlohami ADP a GBL sú adresované v napr. Huang a Wang, 2010; Wang, pravdepodobnosť získať $ Takže z normatívneho hľadiska by racionálny agent riadiaci sa teóriou očakávaného úžitku nemal mať preferenciu medzi možnosťami A a B. Presne to isté platí medzi ľubovoľnými ostatnými pármi alternatív ako v GBL, tak aj v ADP. V našom výskume sa budeme zaujímať práve o druhú dimenziu ekvivalencie medzi rámcami. Ako už bolo spomenuté, efekt rámcovania je zmena v preferenciách ľudí, ktorá sa pozoruje vo voľbách medzi "tými istými", ale odlišne formulovanými alternatívami. Rámcovanými pozitívne a negatívne. To, či ide o "tie isté" alternatívy, aj keď sú inak rámcované provokatívne spochybnili McKenzie a Nelson (2003). Klasicky sa predpokladá, že pri alternatíve A (v úlohe ADP) bude človek usudzovať logicky a teda očakávať, že zomrie 400 ľudí a zvyšných 200 nezomrie. Formulácia alternatívy však nehovorí presne, čo sa s tými 200 tajomnými ľuďmi stane. Nie je teda úplne špecifikovaná. Podobne je na tom, pochopiteľne, aj alternatíva C. Z výroku, že bude zachránených 200 ľudí by malo logicky vyplývať, že zvyšných 400 zomrie. Je zmysluplné očakávať od ľudí takýto úsudok? Je iný úsudok nelogický? To, že rôzne rámcové alternatívy sú si navzájom logicky ekvivalentné je predpokladom argumentu, že efekt rámcovania je porušením pravidla deskriptívnej invariancie racionálnej voľby. McKenzie (2004) navrhuje, že zmena preferencií v závislosti od rámcovania alternatív môže byť normatívne obhájiteľná. Argumentuje, že výber rámcovania správy jej tvorcom poskytuje relevantné informácie o frekvencii výskytu opisovaného javu. Napríklad spozorovali, že keď ľudia opisovali účinky medicínskej terapie, tak tí, ktorí tvorili správu si vyberali skôr pozitívny rámec, keď predchádzajúca terapia bola menej úspešná (McKenzie a Nelson, 2003). Takže keď prišlo k zlepšeniu, hovorili o počte zachránených životov. Keď prišlo k zhoršeniu, pozitívny rámec si volili menej. Takáto tendencia však bola nájdená aj na strane príjemcov správ. Len na základe rámcovania správy, mali ľudia sklony usudzovať na úspešnosti predchádzajúcich medicínskych terapií tým istým spôsobom (McKenzie a Nelson, 2003). Autori zistenie interpretujú tak, že z rámca "pretekajú" informácie, ktoré nie sú explicitne vyjadrené v správe samotnej, ale môžu byť užitočné. Pri bežnom používaní jazyka máme schopnosť a tendenciu týmto spôsobom informácie kódovať aj dekódovať. Absencia úplnej špecifikácie istej alternatívy pri úlohách ako ADP môže viesť k tragickej zámene testovej situácie za bežnú jazykovú komunikáciu. Ľudia sa síce v laboratórnych podmienkach správajú inak ako v bežnom živote, ale prenos svojich jazykových návykov do laboratória nemôžeme vylúčiť. 3 Očakávaná hodnota alternatívy je sumou súčinov pravdedopodobností jednotlivých možných výsledkov a ich hodnôt. Takže: 0,5 x $200 =

82 Práve preto si myslíme, že bežné spôsoby používania jazyka ľuďmi by nemali byť vo výskume prehliadané. Javí sa, že isté alternatívy pri ADP, nemusia byť ľuďmi vždy interpretovane doslovne. Ako ukázal Mandel (2001), nezanedbateľná časť populácie môže interpretovať výsledok istej alternatívy pri ADP ako nejednoznačný. Po odpovedi na úlohy ADP nie sú všetci presvedčení, že ak prijmú isté opatrenie, tak nastanú presne opísané výsledky. Dá sa ale očakávať, že keď človek v úlohe GBL bude zvažovať alternatívu A, tak bude počítať so ziskom presne $100, nie $101 alebo $99? 1.3 Súčasný výskum Výskum je príspevkom k porozumeniu individuálnych interpretácií zadaní úloh frekventovane používaných na meranie efektu rámcovania ADP a GBL. Rozširuje investigáciu Mandela (2001) na doménu peňazí a porovnáva subjektívne interpretácie istých alternatív v rámcovaných rozhodovacích úlohách. Cieľom výskumu je porovnať nejednoznačnosti interpretácie v rozhodovacích úlohách v doménach ľudských životov a peňazí. Pri úlohe ADP bola očakávaná replikáciu predchádzajúcich pozorovaní. Pri interpretáciách alternatív v GBL úlohách je situácia menej zrejmá. Je možné, že istá alternatíva je interpretovaná rovnako nejednoznačne ako v prípade ADP. Však aj iné možnosti sú mysliteľné. Doména rozhodovania môže pôsobiť ako nezanedbateľný kontextový kľúč pri interpretácií informácií poskytnutých v úlohe. Javí sa, že kontextové kľúče implikujúce presnosť eliminujú efekty rámcovania v úlohách typu ADP. Naopak, kontext asociovaný s nejednoznačnosťou prispieva k vzniku efektu rámcovania (Bless, Betsch a Franzen, 1998). Domnievame sa, že doména peňazí môže indukovať tendenciu interpretovať číselne informácie presnejšie ako pri informáciách o účinnosti opatrení na záchranu ľudských životov. 2 Metódy 2.1 Participanti Regrutácia participantov prebiehala on-line v sociálnej sieti výskumníka. Participanti boli motivovaní k účasti na výskume obrázkom milej pandičky. Z celkového počtu N = 979, bolo 68% žien. Vek participantov sa pohyboval okolo M = 28 rokov, SD = Dizajn Bol použitý 2 X 2 experimentálny dizajn. Rámec (pozitívny / negatívny) a úloha (ADP / GBL) boli manipulované medzi subjektmi v 4 experimentálnych skupinách. 2.3 Procedúra a materiály Každý participant bol náhodne zaradený do jednej z experimentálnych skupín. Po súhlasení s účasťou, zadali základné demografické údaje. Nasledovala rozhodovacia úloha pre príslušnú experimentálnu skupinu. Úlohou, ktorá bola použitá pre doménu životov bola modifikovaná verzia problému ázijskej choroby (znenie v časti 1. Efekt rámcovania). Preformulovaním našej verzie ADP na doménu peňazí, sme vytvorili modifikovanú úlohu s finančnou hrou. GBL - úloha s finančnou hrou: Predstav si, že si práve dostal/a 600 euro. Nemôžeš si ich všetky len tak nechať. Máš na výber dve možnosti, čo s nimi spraviť. Ktorú z možností by si zvolil/a? pozitívne rámcovanie: Možnosť A: Nechať si 200 euro. Možnosť B: Vložiť peniaze do hry s 1/3 pravdepodobnosťou nechať si 600 euro a 2/3 pravdepodobnosťou nechať si 0 euro. negatívne rámcovanie: Možnosť A: Stratíš 400 euro. Možnosť B: Vložiť peniaze do hry s 1/3 pravdepodobnosťou, že stratíš 0 euro a 2/3 pravdepodobnosťou, že stratíš 600 euro. Po zadaní voľby bola na novej obrazovke položená otázka na interpretáciu istej alternatívy. Otázka na interpretáciu bola prispôsobená zneniam istých alternatív v jednotlivých experimentálnych skupinám. V nútenej voľbe mali participanti na výber z 3 možností. Otázka na interpretáciu v skupine GBL v pozitívnom rámcovaní: Ako ste si počas odpovedania na predchádzajúcu otázku vysvetlili následky Možnosti A? Informáciu "Možnosť A: Nechať si 200 euro." som vysvetlil/a tak, že: môže sa stať, že si nechám menej ako 200 euro nechám si presne 200 euro môže sa stať, že si nechám viac ako 200 euro Po zodpovedaní na otázku na interpretáciu istej možnosti, bolo participantom umožnené požiadať o zaslanie výsledkov výskumu. 3 Výsledky Prvým krokom analýzy bola overená prítomnosť efektu rámcovania. V ďalších častiach bola preskúmaná nejednoznačnosť interpretácie informácií v opisoch istých alternatív v rozhodovacích úlohách. 82

83 3.1 Efekt rámcovania V sumárnych voľbách z oboch domén v si pozitívnom rámcovaní vybralo riskantnú alternatívu 35% participantov. Pri negatívnom rámcovaní sa prejavila o niečo vyššia ochota riskovať a riskantnú možnosť si zvolilo 58%. Sumárny efekt rámcovania bol skôr malý φc =,235, aj keď vysoko štatisticky významný χ²(1) = 54,219; p <,001. Efekt rámcovania bol o niečo väčší pri ADP, kde si v porovnaní so 49% v skupine s pozitívnym rámcovaním, až 77% vybralo riskantnú alternatívu pri negatívnom rámcovaní χ²(1) = 39,993; p <,001; φc =,283. Pri úlohe GBL, bol medzi skupinami s rôznym rámcovaním rozdiel len 18 percentuálnych bodov. V prípade strát, si riskantnú možnosť vybralo 38% participantov. Efekt rámcovania bol však aj v tejto úlohe štatisticky významný χ²(1) = 18,948; p <,001, hoc menší φc =,200. Efekty rámcovania sa prejavili vo všetkých použitých úlohách. Prejavili sa malým až stredne veľkým priklonením preferencií k riskantných alternatív pri negatívnom rámcovaní. 3.2 Interpretácia istej alternatívy Väčšina participantov si znenie istej alternatívy vo svojej úlohe interpretovala ako presnú informáciu. Iba 22% odpovedalo inak. 13,5% označilo, že istú alternatívu chápalo tak, že: ADP "môže sa stať, že bude zachránených viac ako 200 / zahynie viac ako 400 ľudi" alebo GBL "môže sa stať, že si nechám viac ako 200 / stratím viac ako 400 euro". Ostatných 8,5% si, práve naopak, myslelo, že skutočné výsledky by mohli byť kvantitatívne menšie ako boli výsledky deklarované v opise istej alternatívy. interpretácia úloha výsledku ADP GBL < opis 11% 6% = opis 72% 84% > opis 17% 10% N Tab. 1: Proporcie presných a nepresných interpretácií výsledkov istých alternatív v jednotlivých úlohách Naši participanti si jednoznačnejšie interpretovali istú alternatívu pri úlohe GBL, kde až 84% označilo, že informácii o výsledku istej alternatívy rozumejú ako presnému číselnému údaju. Proporcia týchto interpretácií bola pri ADP o niečo nižšia 72%. Obe interpretácie istej možnosti ako nie presnej informácie zvýšili svoju frekvenciu približne rovnako (Tab. 1). Interpretácie informácií spomenutých v istej alternatíve boli závislé od úlohy χ²(2) = 19,399; p <,001. Pozorovaný rozdiel však nebol veľký φc =,141. Interpretácie sa celkovo nejavili byť závislé na predtým realizovanej voľbe χ²(2) = 0,262; p =,877. Nezávislosť od voľby nebola zamietnutá ani pri detailnejšej analýze v úlohe GBL χ²(2) = 1,882; p =,390. Naopak, pri úlohe ADP, participanti voliaci istú alternatívu, mali väčšiu tendenciu neinterpretovať ju ako presnú. Kým 76% tých, ktorí si zvolili riskantnú možnosť rozumelo istej možnosti ako presnému údaju, medzi participantmi voliacimi istú možnosť, ich bolo len 66%. Naše výsledky indikujú možný malý vzťah voľby s interpretáciou istej alternatívy χ²(2) = 6,780; p =,034; φc =,116. Napriek tomu, že isté alternatívy boli väčšinou interpretované ako presné informácie, dojem ich nejednoznačnosti bol celkom rozšírený. Pri úlohe GBL v doméne peňazí menej ako v ADS v doméne ľudských životov. Ako najviac nejednoznačná sa zdala informácia opísaná v istej alternatíve participantom, ktorí sa pre túto istú voľbu aj rozhodli. 4 Diskusia Pri oboch úlohách sme pozorovali efekty rámcovania. V negatívnom rámcovaní sa prejavili silnejšie tendencie voliť riskantné alternatívy. Veľkosti efektov konzistentné s predchádzajúcimi experimentmi napovedajú, že v našom výskume sme pozorovali voľby typické pre použitý typ úloh. V porovnaní s výsledkami Mandela (2001) sme našli o niečo menšie sklony interpretovať istú alternatívu ako nejednoznačnú. Takmer štvrtina, však, interpretovala opísané výsledky istej alternatívy ako nie presné číselné informácie. Toto pozorovanie napovedá, že vnímaná logická ekvivalencia rámcovaných opisov istých alternatív nemusí byť takou samozrejmosťou, za akú ju považuje napríklad prospektová teória. Zdá sa, že časť populácie by v prípade ohrozenia 600 ľudských životov nesúhlasila s tvrdením: "400 ľudí zomrie objektívne znamená presne to isté ako 200 ľudí bude zachránených." Opisy istých alternatív v doméne peňazí boli interpretované o niečo presnejšie ako opisy v doméne ľudských životov. Zároveň, efekt rámcovania bol v doméne peňazí o niečo slabší ako v doméne životov. Navrhujeme, že nájdené rozdiely môžu súvisieť s úlohou kontextu pri interpretácii opisov alternatív. Ako už bolo spomenuté, indukcia kontextu exaktnosti prispieva k zmenšovaniu efektu rámcovania v riskantných voľbách (Bless a spol., 1998). Domnievame sa, že podobným procesom mohla presnejšia interpretácia výsledkov alternatív v doméne peňazí viesť k menším efektom rámcovania. Porovnanie volieb v doméne peňazí v použitej úlohe s predchádzajúcimi výskumami nie je úplne priamočiare. Kvôli zachovaniu čo najväčšej miery zhody zadaní úloh v doménach peňazí a životov sme pozmenili viacero aspektov úlohy s finančnou hrou oproti bežne používaným. Aj preto je problematické usudzovať, do akej miery môžu byť predchádzajúce 83

84 pozorovania efektu rámcovania v riskantných voľbách v doméne peňazí spájateľné s našimi zisteniami. Ako je viditeľné aj z porovnania pôvodného zadania úlohy typu GBL (pozri časť 1.1. O životoch a peniazoch) s úlohou použitou v našom výskume, vyhli sme sa medzi-rámcovým rozdielom v základnej získanej sume peňazí (initial endowment). Mnohé ďalšie výskumy v doméne peňazí sa v tomto aspekte líšia, čo môže komplikovať separovanie vplyvov variácií základných súm medzi rámcami od klasického efektu rámcovania. Je však možné, že doména peňazí sama o sebe vedie k presnejšej interpretácii istých alternatív v rozhodovacích úlohách. Viacero indícií naznačuje, že práve interpretácia istej alternatívy úzko súvisí so vznikom efektu rámcovania (napr. Kühberger a Tanner, 2010; Mandel, 2001; McKenzie, 2004; Sher a McKenzie, 2006). Však, veľkosti efektov rámcovania v doméne peňazí a životov sú, podľa meta-analýz, prakticky rovnaké (Gambara a Piñon, 2005; Kühberger, 1998). Ak sa veľkosti efektov rámcovania medzi doménami podobajú, buď vznik efektu nesúvisí s interpretáciou istých alternatív, alebo k efektom rámcovania v rôznych doménach môžu prispievať čiastočne odlišné procesy. Výsledky nášho výskumu naznačujú, že nejednoznačnosť interpretácií môže byť odlišná v doménach peňazí a ľudských životov. Ďalšie skúmanie načrtnutých problémov môže prispieť k porozumeniu efektu rámcovania na úrovni kognitívnych procesov závislých a nezávislých od presnosti interpretácie opisov alternatív. Jednou z hlavných motivácií súčasného výskumu bol záujem reflektovať jazykovú stránku výskumu rozhodovania a posudzovania, či v iných disciplínach, ktoré sú odkázané na subjekty interpretujúce inštrukcie podávané ľudským jazykom. Výskum efektu rámcovania sa zdá byť jednou z oblastí, kde mohli zvyky ľudí z bežnej komunikácie interferovať s úmyslami výskumníkov počas formulovania úloh. Napriek tomu, že sme sa v súčasnom výskume venovali práve otázkam interpretácie, naša otázka na interpretáciu bola niektorými ľuďmi pravdepodobne inak interpretovaná. V neštruktúrovaných rozhovoroch, iniciovanými participantmi, viacerí popísali nespokojnosť s možnosťami odpovedí. Javilo sa však, že dôvodom ich nespokojnosti bolo porozumenie otázke spôsobom, ktorý nebol výskumníkom úplne zamýšľaný. Aj preto veríme, že je pri pokusoch o psychologickú interpretáciu pozorovaní správania dôležité brať do úvahy spôsoby ako ľudia používajú jazyk. Reflexia týchto aspektov výskumu je dôležitá pri predchádzaní nedorozumení plynúcich z niekedy nebežného používania jazyka vo výskumných úlohách. Poďakovanie Tento príspevok vznikol za podpory grantu Centrum excelentnosti SAV "Centrum strategických analýz" (CESTA) III/2/2011. Literatúra Bless, H., Betsch, T. a Franzen, A. (1998). Framing the framing effect: The impact of context cues on solutions to the Asian disease problem. European Journal of Social Psychology. 291: Gambara, H. a Piñon, A. (2005). A meta-analytic review of framing effect: Risky, attribute and goal framing. Psicothema. 17(2): Huang, Y. a Wang, L. (2010). Sex differences in framing effects across task domain. Personality and Individual Differences. 48(5): Kühberger, A. (1998). The influence of framing on risky decisions: A meta-analysis. Organizational Behavior and Human Decision Making. 75(1): Kühberger, A. a Tanner, C. (2010). Risky choice framing: Task versions and a comparison of prospect theory and fuzzy-trace theory. Journal of Behavioral Decision Making. 23(3): Levin, I. P., Schneider, S. a Gaeth, G. (1998). All Frames Are Not Created Equal: A Typology and Critical Analysis of Framing Effects. Organizational Behavior and Human Decision Processes. 76(2): Mandel, D. R. (2001). Gain-Loss Framing and Choice: Separating Outcome Formulations from Descriptor Formulations. Organizational Behavior and Human Decision Processes. 85(1): McKenzie, C. R. M. (2004). Framing effects in inference tasks--and why they are normatively defensible. Memory & Cognition. 32(6): McKenzie, C. R. M. a Nelson, J. D. (2003). What a speaker s choice of frame reveals: reference points, frame selection, and framing effects. Psychonomic Bulletin & Review. 10(3): Sher, S. a McKenzie, C. R. M. (2006). Information leakage from logically equivalent frames. Cognition. 101(3): Tversky, A. a Kahneman, D. (1981). The framing of decisions and the psychology of choice. Science. 211(4481): Tversky, A. a Kahneman, D. (1986). Rational choice and the framing of decisions. Journal of Business. 59(4): Wang, X. T. (1996). Framing Effects: Dynamics and Task Domains. Organizational Behavior and Human Decision Processes. 68(2):

85 Kognícia a umelý život 2015, Trenčianske Teplice Kedy platí "menej je viac"? Heuristika rozpoznania v rozhodovaní jednotlivcov a skupín Lenka Kostovičová, Katarína Dudeková Ústav experimentálnej psychológie SAV Dúbravská cesta 9, Bratislava [email protected], [email protected] Abstrakt Princíp heuristiky rozpoznania spočíva v pravidle: pokiaľ je práve jeden z dvoch objektov rozpoznaný, je mu v príslušnom kritériu prisúdená vyššia hodnota. V našej experimentálnej štúdii sa venujeme analýze binárnych volieb jednotlivcov a z nich vytvorených trojíc na základe početnosti, platnosti a úspešnosti použitých stratégií. Efekt menej je viac sa prejavil u konsenzuálne správnych položiek. Vo všeobecnosti sa úspešnosť stratégií založených na heuristike a na znalosti nelíšila. Avšak modely, zohľadňujúce vyšší vplyv členov používajúcich heuristiku rozpoznania, najlepšie predikujú reálne voľby skupín. Venujeme sa teoretickým a praktickým dôsledkom platnosti modelov individuálnych a skupinových volieb. Úvod "Nižšie individuálne kompetencie členov, z rôznych dôvodov, nemusia nevyhnutne viesť k horšiemu výkonu skupiny" (Luan a spol., 2012, s. 294). Nakoľko môže byť presný kolektívny odhad skupiny, pozostávajúcej z členov, ktorí majú o téme málo vedomostí? Prečo by zhluk niekoľkých znalých a informovaných ľudí, spolu s viacerými priemerne znalými a ďalšími málo až vôbec neznalými problematiky, mal vyprodukovať niečo lepšie než laický odhad? Ako by mohla skupina jednotlivcov s menej bohatými vedomosťami, informáciami, dospieť k lepšej voľbe než skupina, ktorá toho vie viac? Téma príspevku sa týka kolektívnej znalosti skupín v kontexte binárnej voľby. Zaujíma nás porovnanie rozhodovacích situácií, kedy sú vedomosti o predmetných alternatívach medzi členmi rôzne distribuované. Akú úlohu zohráva v procese rozhodovania skupín heuristika rozpoznania? Nájdeme dôkaz, že "menej (znalostí) je viac" - teda, že heuristika rozpoznania môže viesť k rovnakej úspešnosti odpovedí ako stratégia založená na vedomostiach? 1 Heuristika rozpoznania a efekt "menej je viac" v individuálnom a skupinovom rozhodovaní Ľudia používajú pri rozhodovaní mentálne skratky - heuristiky. Tie sú rýchle, výpočtovo nenáročné a fungujú dostatočne dobre v mnohých podmienkach (Gigerenzer a spol., 1999). Gigerenzer a Gaissmaier (2011), poprední predstavitelia prístupu ekologickej racionality 1, vymedzujú heuristiky ako stratégie ignorujúce niektoré informácie s cieľom posudzovať a rozhodnúť rýchlejšie, úspornejšie a(lebo) presnejšie ako prostredníctvom aplikácie komplexnejších metód. Adaptívne riešenie problémov a rozhodovanie šetria úsilie. Najdôležitejšími znakmi heuristík sú teda rýchlosť a úspornosť, vďaka čomu sú ľudia schopní, vzhľadom na obmedzenia plynúce z vlastnej kognitívnej kapacity a prostredia, adaptívne sa rozhodovať (Gigerenzer a spol., 1999). Koncepcia ekologickej racionality sa navyše snaží dokázať, že adaptívne rozhodovanie je v konečnom dôsledku efektívnejšie (Bačová, 2011). 1.1 Efekt "menej je viac" Fenomén "menej je viac" vyjadruje, že menej znalostí, informácií či mentálnej práce (napr. v zmysle výpočtov) vedie často k presnejším úsudkom a efektívnejším riešeniam ako viac výpočtov a informácií (Bačová, 2011). Medzi úrovňou presnosti / úspešnosti a potrebným úsilím je inverzný vzťah v tvare U - existuje bod, kedy "viac" neznamená lepšie, ba dokonca "viac" škodí (Gigerenzer & Gaissmaier, 2011). Gigerenzer (2008) konštatuje, že tieto a ďalšie výsledky oprávňujú pripisovať heuristikám rovnakú hodnotu ako štandardným modelom racionálnych kognícií. 1 Ekologická racionalita vychádza z koncepcie limitovanej racionality Herberta Simona. Zdôrazňuje neoddeliteľnosť kognitívnych procesov od prostredia a poukazuje na nezmyselnosť konštatovaní o racionalite ľudí, hodnotenie ktorej je založené na porovnaní s kontextovo neutrálnymi normatívnymi pravidlami. 85

86 1.2 Heuristika rozpoznania Heuristika rozpoznania vychádza z pravidla, že ak je práve jeden objekt rozpoznaný, usudzujeme, že má vyššiu hodnotu v danom kritériu. Môžeme ju teda použiť iba v prípade, keď nejaký z objektov nerozpoznáme. Jedným z ilustratívnych príkladov je porovnanie odpovedí amerických a nemeckých študentov na otázku, ktoré z miest, San Diego alebo San Antonio, má väčšiu populáciu. Goldstein a Gigerenzer (2002) uvádzajú, že Američania dopadli horšie, pričom jedným z vysvetlení je práve fakt, že na rozdiel od Nemcov častokrát poznali obe mestá, a preto nemohli pri rozhodovaní použiť heuristiku rozpoznania. Podobné zistenia môžu pripadať kontroverzne. Ako dokážu ľudia, disponujúci nižším množstvom informácií, skórovať lepšie? Pri štatistickej analýze spôsobujú chýbajúce dáta značné problémy. V reálnom prostredí, kde sú dáta zbierané prirodzeným, nie systematickým spôsobom ako v laboratórnych podmienkach, môžu byt chýbajúce vedomosti využité na vytváranie inteligentných úsudkov. Avšak neplatí to paušálne. Heuristika rozpoznania je efektívna v situáciách, kedy existuje silná - negatívna alebo pozitívna - korelácia medzi rozpoznaným objektom (mesto) a predmetným kritériom (veľkosť populácie). Inak povedané, ak sú v skupine vybraných miest väčšie práve tie, ktoré poznáme, heuristika je ekologicky racionálna - využíva štruktúru informácii v prirodzenom prostredí. Výskumná evidencia svedčí o tom, že heuristika rozpoznania je nielen funkčná, ale aj dobre opisuje reálne dáta: 90% inferencií v situáciách jedného rozpoznaného mesta z dvoch bolo práve to zvolené ako väčšie (Goldstein a Gigerenzer, 2002). Ľudia sa dokonca "držia" heuristiky aj v prípade, keď dostanú dodatočnú informáciu o vysoko valídnom vodítku, napr. o prítomnosti futbalového tímu alebo univerzity v danom meste. 2 O heuristickom uvažovaní a rozhodovaní jednotlivcov toho vieme pomerne dosť, ako je to však s heuristickými stratégiami v skupinových úsudkoch a voľbách? 1.3 Heuristika rozpoznania v rozhodovaní skupín Prečo skúmať heuristiku rozpoznania v skupinách? V prvom rade sa môžeme dozvedieť viac o fungovaní samotnej heuristiky: skutočne hrá špeciálnu rolu v procese ľudskej inferencie? Čo v prípadoch, kedy je v konflikte s inými vodítkami a najmä so znalosťami (ostatných členov)? Avšak na základe analýzy stratégií rozhodovania v skupinách máme možnosť dozvedieť sa tiež cenné informácie o skupinovom správaní. Efekt "menej je viac" má dôležité implikácie pre teórie uvažovania a rozhodovania a aj významné praktické dôsledky (Hertwig a Todd, 2003). Viažu sa však na výskumy individuálnych rozhodnutí. Môže aj v prípade spoločných rozhodnutí platiť "menej je viac"? Veď predsa veľká časť výskumov poukazuje na informačnú výhodu viacerých rozhodovateľov (pre diskusiu pozri Reimer a Hoffrage, 2003), čo ústi v návrhy, ako posilňovať výmenu vedomostí medzi členmi (napr. Stasser a spol., 1995). Vo východiskovej štúdii autori Reimer a Katsikopoulos (2004) skúmali, nakoľko sa heuristika rozpoznania zapája pri opakovaných binárnych voľbách v skupinách s troma členmi a či preváži nad inými rozhodovacími stratégiami. To napríklad znamená, či člen skupiny, ktorý pozná len jedno z dvoch miest, bude prehlasovaný zvyšnými členmi, ktorí poznajú obe mestá, alebo či môže mať takýto člen skupiny vyšší vplyv na finálnu voľbu skupiny. Autori predstavili a testovali modely stratégií, ktoré môžu byť využívané v rámci rozhodovania skupín. Skupiny sa môžu rozhodovať na základe majoritného pravidla, kedy možnosť, pre ktorú sa rozhodne väčšina rozhodovateľov, víťazí. To platí najmä pri úlohách, kedy správna odpoveď nie je jednoducho demonštrovateľná, čo je prípad našej experimentálnej úlohy. Ďalšie modely zohľadňujú vyšší vplyv členov, ktorí môžu použiť heuristiku alebo vedomosť. Pre výpočet efektu "menej je viac" a pre predikcie modelov sú kľúčovými parametrami podiel rozpoznaných objektov jednotlivými členmi (n), miera validity vedomosti (β) a validity rozpoznania (α). Výsledky, ku ktorým dospeli Reimer a Katsikopoulos (2004) naznačujú, že členovia, ktorí môžu použiť heuristiku, sú v rámci spoločného rozhodnutia vplyvnejší ako tí, ktorí ju použiť nemôžu (majú priveľa alebo primálo vedomostí). Model založený na heuristike rozpoznania lepšie predikoval reálne voľby a autori zaznamenali v skupinách efekt "menej je viac": úspešnosť stratégií na báze heuristiky bola vyššia ako v prípade postupov založených na znalosti. Pre overenie výskumných zistení na vzorke slovenskej populácie sme navrhli nasledovný experiment s materiálom s výrazne nižšou úrovňou validity oboch stratégií. 1.4 Cieľ výskumu Rozhodli sme sa pre experimentálne testovanie volieb jednotlivcov, a z nich zostavených skupín, v binárnych úlohách založených na posudzovaní veľkosti populácie amerických miest. Cieľom výskumu bolo overiť, nakoľko individuálne procesy rozpoznania položiek interagujú so skupinovými rozhodovacími procesmi. Pozrieme sa tiež na prítomnosť efektu "menej je viac" naprieč voľbami jednotlivcov a skupín a na početnosť, platnosť a úspešnosť použitých stratégií. 2 Pre kritiku experimentálneho skúmania a interpretácie výsledkov o rýchlych a úsporných heuristikách vo všeobecnosti pozri Oppenheimer (2003). 86

87 2 Metódy Samotnému experimentu predchádzala pilotná štúdia, slúžiaca na prípravu podkladov pre podnetový materiál. Konkrétne sme identifikovali americké mestá, ktoré väčšina (>75%) z 20 oslovených študentov spoločensko-vedných odborov (a) pozná, (b) nepozná, a tiež, ktoré (c) pozná zhruba polovica študentov. 2.1 Participanti Experimentu sa zúčastnilo 90 študentov denného bakalárskeho a magisterského štúdia Fakulty sociálnych a ekonomických vied, a tiež Pedagogickej fakulty, Univerzity Komenského (65 žien a 25 mužov, priemerný vek 21 rokov, SD = 2,2). Zber dát sa uskutočnil v troch sekciách (s desiatimi skupinami), s odmenou za účasť formou bodov na predmete. 2.2 Dizajn V rámci zmiešaného dizajnu nás zaujímalo porovnanie volieb jednotlivcov a z nich zostavených trojíc, a tiež porovnanie skupín, s rôznou distribúciou znalostí, navzájom. Hodnoty parametrov n - priemerný počet rozpoznaných objektov, α - validita rozpoznania a β - validita vedomosti, boli na základe pilotnej štúdie nastavené na n = 0,75 a α, β = 0, Materiál Participantom bol administrovaný zoznam 40 amerických miest a, opakovane, zoznam 52 dvojíc miest. Príkladmi všeobecne známych miest sú Detroit a Las Vegas, príkladmi všeobecne neznámych miest sú Fresno a Tucson, a mestá ako Portland alebo Sacramento poznala v pilotnom výskume zhuba polovica opýtaných. Ukážkou dvojice, kde všeobecne poznané mesto má väčšiu populáciu (rozpoznanie ako ekologicky valídne vodítko) je Chicago - Mesa, opačný prípad (rozpoznanie ako ekologicky nevalídne vodítko) predstavuje pár Boston - Fort Worth. 3 Výsledky 3.1 Jednotlivci Jednotlivci poznali v priemere 33 zo 40 miest (SD = 3,2), čo je viac, než sme očakávali na základe pilotnej štúdie. V dôsledku toho sa zredukoval počet možností, kedy mohla byť v rámci individuálnych i skupinových rozhodnutí použitá heuristika rozpoznania. Zo všetkých prípadov, kedy mali jednotlivci možnosť použiť heuristiku rozpoznania (Σ = 1378), aplikovali ju v 94,7% situácií (Σ = 1292). Vedomosť o oboch mestách mohli participanti využiť v 2917 prípadoch. Jednotlivec, ktorý rozpozná n z N objektov, môže použiť heuristiku rozpoznania s pravdepodobnosťou r(n) = 2n(N-n)/[N(N-1)], znalosť s pravdepodobnosťou k(n) = n(n-1)/[n(n-1)], a háda s pravdepodobnosťou u(n) = (N-n)(N-n-1)/[N(N-1)]. A teda, pre individuálnu úspešnosť volieb platí f(n) = r(n)α + k(n)β + u(n)(1/2) (Goldstein a Gigerenzer, 2002). V prípade aplikovania heuristiky rozpoznania bola celková úspešnosť na úrovni 65,6%, čo je významne viac ako u výsledkov situácií, kedy mohla byť použitá vedomosť - 60,9%, t(89) = 2,74; p = 0,007; d = 0,41. Zistenia sú v zhode s predpokladom výskytu efektu "menej je viac". 3.2 Skupiny Pre vyhodnotenie predikcií skupinových volieb sme použili nasledovné postupy podľa predlohy východiskovej štúdie Reimer a Katsikopoulos (2004). U všetkých rovníc člen c(m, i) predstavuje počet spôsobov, akými je možné vybrať i objektov z m objektov: (m!)/(m-i)!(i!). (1) Jednoduché majoritné pravidlo Ak F(i) je pravdepodobnosť, že presne i členov odpovie správne a skupina, používajúca jednoduché majoritné pravidlo, sa rozhodne správne, tak platí: 2.4 Procedúra V prvej fáze participanti pracovali jednotlivo. Najskôr vyplnili sociodemografické údaje, potom označili zo súboru amerických miest tie, ktoré nepoznajú. Ďalej vykonali 52 binárnych volieb, pričom bolo ich úlohou určiť, ktoré z dvoch ponúknutých miest má podľa nich väčšiu populáciu. Následne boli náhodne rozdelení do trojíc. Diskusiou v skupine mali dospieť v rámci identického materiálu párov miest k spoločnej voľbe mesta s odhadovanou početnejšou populáciou. Na záver boli informovaní o účele výskumu a mali možnosť pýtať sa doplňujúce otázky. Obr. 1: Výpočet pre jednoduché majoritné pravidlo (2) Stratégia založená na rozpoznaní Ak A(i) je pravdepodobnosť, že presne i členov, používajúcich heuristiku rozpoznania, odpovie správne a skupina, aplikujúca model na báze heuristiky, sa rozhodne správne, tak platí: 87

88 Obr. 2: Výpočet pre stratégiu na báze rozpoznania (3) Stratégia založená na vedomosti Ak B(i) je pravdepodobnosť, že presne i členov, používajúcich vedomosť, odpovie správne a skupina, aplikujúca model na báze vedomosti, sa rozhodne správne, tak platí: Obr. 3: Výpočet pre stratégiu na báze vedomosti Skupiny spolu vyprodukovali 1560 binárnych volieb. Jednoduché majoritné pravidlo (MP) bolo možné uplatniť v 1496 prípadoch, pričom 74,0% predikcií modelu je v zhode so skupinovými voľbami. Stratégiu na báze heuristiky rozpoznania (HR) mohli skupiny využiť u 728 párov miest, urobili tak v 94,5% prípadov. Stratégiu na báze vedomostí (SV) využili z 581 možností v 88,9% situácií. Rozdiel v predikčnej sile modelov je signifikantný (Obr.4), F(1, 29) = 39,35; p < 0,001; η² = 0,58. Úspešnosť stratégií sa navzájom významne nelíšila (MP: 69,0%, HR: 71,7%, SV: 69,6%), F(1, 29) = 2,08; p = 0,134; η² = 0,07. Bez zhody všetkých troch členov išlo o 667 prípadov, 73,0% s výsledkom v zhode s predikciou. Väčšinu týchto predikciám-zodpovedajúcich situácií predstavovali prípady, kedy majoritu tvorili dvaja členovia poznajúci jedno z miest - vtedy 93% volieb dopadlo v ich prospech. Naopak, len 70% rozhodnutí skupín s väčšinou poznajúcou obe mestá, dopadlo v prospech týchto dvojíc, t(29) = 8,35; p < 0,001; d = 0,55. Z toho usudzujeme, že členovia schopní použiť heuristiku rozpoznania, majú v procese rozhodovania skupiny vyšší vplyv než tí, čo tak učiniť nemôžu. Úspešnosť stratégií na báze dvoch typov väčšiny sa významne nelíšila (76,3% verzus 73,9% v prospech heuristiky), t(29) = 0,54; p = 0,592; d = 0,04. Obr. 4: Priemerný percentuálny podiel úspešných predikcií jednotlivých rozhodovacích stratégií (s 95%-nými intervalmi spoľahlivosti) Ďalej sme preskúmali tri špecifické typy prípadov, kedy modely na báze vedomosti a heuristiky predikovali rozdielne výsledky a zároveň: (a) dvaja členovia mohli použiť znalosť a jeden heuristiku (33 situácií), (b) jeden člen mohol použiť znalosť a dvaja heuristiku (40 situácií), (c) jeden člen mohol použiť znalosť, jeden heuristiku a jeden hádal (22 situácií): a) V prvom prípade išlo o situácie, kedy dvaja členovia skupiny poznali obe mestá a vybrali jedno z nich ako väčšie, avšak posledný člen rozpoznal len to druhé mesto a označil ho za väčšie. V 69,7% situácií dopadla finálna voľba v prospech tretieho člena. b) Ďalší typ situácie bol charakteristický rozpoznaním jedného z miest dvoma členmi skupiny, pričom tretí - poznajúci obe mestá - s danou voľbou nesúhlasil. Prevažná väčšina týchto prípadov (85%) sa skončila "výhrou" väčšiny. c) Ak každý zo skupiny rozpoznal iný počet miest a dvaja, ktorí poznali jedno alebo obe sa nezhodli, 68,2% volieb dopadlo v prospech heuristiky rozpoznania. Pozreli sme sa ešte na konsenzuálne správne a konsenzuálne nesprávne položky, t.j. páry, u ktorých prevažovala správna, respektíve nesprávna odpoveď. Keď mali participanti tendenciu sa mýliť, heuristická stratégia i voľba založená na znalosti mali nízku úspešnosť podobnej úrovne: 45,0% verzus 43,9%, t(29) = 0,44; p = 0,664; d = 0,03. Avšak keď išlo o voľby, ktoré ľudia zvládali prevažne úspešne, potvrdil sa efekt "menej je viac": heuristika rozpoznania s 87,0% v úspešnosti porazila stratégiu na báze znalosti so 78,9%, t(29) = 4,29; p < 0,001; d = 0,29. Sumarizujúc: identifikovali sme efekt "menej je viac" u jednotlivcov, a v rámci konsenzuálne správnych položiek aj u skupín. V rámci spoločných rozhodnutí sa stratégie všeobecne nelíšili v úspešnosti, avšak modely, zohľadňujúce vyšší vplyv členov používajúcich heuristiku rozpoznania, najlepšie predikovali reálne voľby skupín. 88

89 4 Diskusia Ľudia sa rozhodovali spoločne už v časoch dávnych civilizácií. Svedčia o tom publikácie pojednávajúce o správaní sa skupín lovcov či občanov starovekých Atén. Dnes je v demokratických krajinách a veľkých industriálnych organizáciách veľmi ojedinelé, že by zásadné voľby boli "na pleciach" jednotlivcov (Luan a spol., 2012). Skupiny vznikajú, aby vykonávali menej či viac závažné rozhodnutia a všeobecne sa má za to, že "dve hlavy sú viac než jedna" (Hastie a Kameda, 2005). Vzhľadom k dôležitosti, akú skupinové úsudky a voľby zohrávajú v našej spoločnosti, je prekvapivé, do akej nízkej miery sú stratégie rozhodovania skupín preskúmané. Naším výskumom sme potvrdili platnosť tvrdenia, že menej vedomostí nemusí byť nevýhodou. Efekt "menej je viac" sa prejavil u individuálnych rozhodnutí, a tiež u veľkej časti skupinových volieb, pričom validita heuristiky i znalosti bola nastavená na identickú, nízku hodnotu. Preukázali sme zároveň, že jednotlivci, ktorí môžu vďaka nižším znalostiam použiť heuristiku rozpoznania, sú vplyvnejší v rámci tvorby úsudkov v skupine. Rozhodovacia stratégia na báze heuristiky najlepšie predikovala skupinové voľby. A teda, naše zistenia sú v protiklade so zaužívaným tvrdením, že kľúčovým rozhodovateľom je najviac kompetentný člen (v zmysle vedomostí) a že skupiny robia lepšie rozhodnutia keď / preto, že disponujú väčším množstvom informácií. Mohlo by sa zdať, že je rozumné, aby boli do skupiny prijatí vysoko kompetentní členovia, ktorým bude zverená právomoc rozhodovať. Mnohé organizácie takýto postup roky aplikovali a sústredili svoju pozornosť na prilákanie talentovaných ľudí s potenciálom stať sa výnimočnými rozhodovateľmi. Na rozdiel od situácií individuálnych volieb, kedy spravidla šikovní ľudia robia rozumné rozhodnutia, je platnosť tohto intuitívneho predpokladu u rozhodnutí skupín otázna. Bez ohľadu na kompetenciu, je totiž dôležité, nakoľko sú rozhodnutia členov skupiny nezávislé. Akonáhle sú totiž ovplyvnené inými 3, presnosť a úspešnosť úsudkov klesá. Hlboko zakorenená dôvera voči expertíze a expertom na úkor kolektívnej inteligencie sa môže prejaviť preferovaním skupín s "nadbytočným individuálnym talentom", avšak bez dostatočnej diverzity ako celku (Luan a spol., 2012). Lekcia, ktorú je možné odniesť si z výsledkov (nielen) nášho výskumu je nasledovná. Pri výbere členov skupiny nie je vždy rozumné zvoliť tých, ktorí sa javia byť viac znalí, lepšie informovaní a(lebo) viac kompetentní. Tieto ich predispozície môžu byť vo výsledku vzájomne redundantné a kompetencie mohli 3 Pre diskusiu o sociálnych vplyvoch v rozhodovaní pozri monografiu Masaryk, Ed. (2013) alebo príspevok Hatoková (2014). nadobudnúť rovnakými prostriedkami. A preto výskyt viacerých takýchto členov neprospeje skupine viac, než keď je v nej iba jeden z nich. U mnohých úloh je diverzita tým, čo skupina primárne potrebuje, dokonca ak to znamená prijatie a začlenenie do rozhodovacieho procesu člena, ktorý "nemá šajnu" o predmetnej úlohe (Luan a spol., 2012). Keďže v našej štúdii sme na stratégie použité pri rozhodovaní skupín usudzovali len implicitne a nezohľadňovali sme ďalšie možné faktory, ktoré vstupujú do procesu od zvažovania alternatív až po finálnu voľbu, pre ďalšie skúmanie aspektov sociálneho rozhodovania navrhujeme použitie kvalitatívnych metód pre získanie podrobnejších dát (Masaryk, 2014), predovšetkým analýzu verbálnych protokolov, prípadne retrospektívne rozhovory. V duchu nedávnych štúdií v časopise Science od autorov Bahrami a spol. (2010) a Koriat (2012) by bolo zaujímavé pozrieť sa na interakcie rozhodovateľov jednak z hľadiska (ne)rovnakej distribúcie vedomostí, a tiež istoty odpovedí - pričom hypotézy znejú, že fenomén "dve hlavy sú viac než jedna" platí len pri konštelácií podobných distribúcií informácií; na druhej strane miera istoty je v pozitívnom vzťahu s úspešnosťou, avšak len u konsenzuálne správnych položiek. Práve komunikácia istoty odpovedí členmi skupiny navzájom sa javí byť kľúčová pre úspešnosť volieb. Zaujímavou cestou ďalšieho výskumu by mohla byť konfrontácia modelov stratégií jednotlivcov (Ballová Mikušková a spol., 2014) v kontexte posudzovania a rozhodovania skupín. Konštatujeme, že hromadiaca sa evidencia koriguje pohľad na heuristiky ako "slabé" náhrady analytických postupov - predstavujú skôr rovnocennú alternatívu. Na rozdiel od optimalizačných procedúr využívajú vyvinuté kapacity mysle, formované počas evolúcie (Todd a spol., 2012). O to väčší dôraz by sa mal klásť na hlbšie preskúmanie heuristík v procesoch usudzovania a rozhodovania skupín, poznanie ktorých môže slúžiť ako podklad pri zostavovaní pracovných tímov či komisií, pre predikcie a modelovanie skupinového správania. Či je "menej viac" alebo "viac viac" závisí od interakcie medzi stratégiami jednotlivcov v skupine a prostredím, v ktorom sa úloha odohráva. Nie všetky heuristiky sú vhodné pre každú úlohu, a i v rámci toho istého typu úloh môžu "nezapasovať", ak nie sú ekologicky valídne. Dôležité je, nakoľko modely zodpovedajú reálnym voľbám v prirodzenom prostredí. Bez dostatočného porozumenia kontextu rozhodovacieho problému môžeme skĺznuť k skresleným záverom o racionalite jednotlivcov i skupín. Poďakovanie Príspevok vznikol za podpory nasledovných grantov: VEGA 2/0154/13 "Sociálne vplyvy v individuálnom rozhodovaní", Centrum excelentnosti SAV "Centrum 89

90 strategických analýz" (CESTA) III/2/2011, Štipendium Vzdelávacej nadácie Jána Husa a Nadácie Univerzity P. J. Šafárika v Košiciach. Literatúra Bačová, V. (2011). Klasická a ekologická racionalita v rozhodovaní: Spor o heuristiky. V knihe Rozhodovanie a usudzovanie II. Oblasti a koncepcie. Ústav experimentálnej psychológie SAV, str Bahrami, B., Olsen, K., Latham, P. E., Roepstorff, A., Rees, G. a Frith, Ch. D. (2010). Optimally interacting minds. Science. 329(5995): Ballová Mikušková, E., Čavojová, V. a Hanák, R. (2014). Stratégie rozhodovania: prehľad a možnosti overovania. V zborníku Rozhodovanie v kontexte kognície, osobnosti a emócií IV. Súčasné trendy v rozhodovaní. Ústav experimentálnej psychológie SAV, str Gigerenzer, G. (2008). Rationality for mortals: How people cope with uncertainty. Oxford University Press. Masaryk, R. (2014). Researching social influences on decision making: The case for qualitative methods, Human Affairs. 24(3): Oppenheimer, D. (2003). Not so fast! (and not so frugal!): rethinking the recognition heuristic. Cognition. 90(1): B1 B9 Reimer, T. a Hoffrage, U. (2003). Information aggregation in groups: The approach of simple group heuristics (SIGH). V zborníku Proceedings of the Twenty-Fifth Annual Conference of the Cognitive Science Society. Psychology Press, str Reimer, T. a Katsikopoulos, K. V. (2004). The use of recognition in group decision-making. Cognitive Science. 28(6): Stasser, G., Stewart, D. D. a Wittenbaum, G. M. (1995). Expert roles and information exchange during discussion: The importance of knowing who knows what. Journal of Experimental Social Psychology. 31(3): Todd, P. M., Gigerenzer, G. a the ABC Research Group (2012). Ecological rationality: Intelligence in the world. Oxford University Press. Gigerenzer, G. a Gaissmaier, W. (2011). Heuristic decision making. Annual Review of Psychology. 62: Goldstein, D. G. a Gigerenzer, G. (2002). Models of ecological rationality: The recognition heuristic. Psychological Review. 109(1): Hastie, R. a Kameda, T. (2005). The robust beauty of majority rules in group decisions. Psychological Review. 112(2): Hatoková, M. (2014). Sme pri rozhodovaní obeťami sociálnych vplyvov? V zborníku Rozhodovanie v kontexte kognície, osobnosti a emócií IV. Súčasné trendy v rozhodovaní. Ústav experimentálnej psychológie SAV, str Hertwig, R. a Todd, P. M. (2003). More is not always better: The benefits of cognitive limits. V knihe Judgment and decision making. Wiley, str Koriat, A. (2012). When are two heads better than one and why? Science. 336(6079): Luan, S., Katsikopoulos, K. V. a Reimer, T. (2012). The "less-is-more" effect in group decision making. V knihe Simple heuristics in a social world. Oxford University Press, str Masaryk, R. (Ed.) (2013). Rozhodovanie a usudzovanie V. Sociálne vplyvy v rozhodovaní. Ústav experimentálnej psychológie SAV. 90

91 Kognícia a umelý život 2015, Trenčianske Teplice Emergencia komunikácie v laboratóriu: triadická interakcia Veronika Kundlová, Ľudovít Malinovský, Kristína Rebrová, Matej Sedláček Centrum pre kognitívnu vedu, KAI FMFI UK, Univerzita Komenského v Bratislave Mlynská dolina, Bratislava [email protected] Abstrakt Problém zavádzania v evolúcii jazyka spočíva v tom, že nevieme vysvetliť dôveryhodnosť lacných správ, ktoré sú pre ľudský jazyk typické. Potenciálnym riešením je potreba kolektívneho zavádzania a vytvorenie softistikovanejšej formy komunikácie. V príspevku popíšeme experimenty, v ktorých ľudské subjekty v oddelených miestnostiach vytvárali nové komunikačné formy prostredníctvom takzvaných komunikačných hier v zdielanom virtuálnom prostredí. V našom príspevku predvedieme návrh triadickej komunikačnej hry, ktorý zatiaľ nebol nikdy realizovaný. Konkrétne ide o adaptáciu tichej komunikačnej hry, upravenú pre troch hráčov: dvoch komunikujúcich partnerov a odpočúvača, ktorý sa snaží prelomiť ich komunikačný kód. Hlavnou motiváciou pre vytvorenie triadickej komunikačnej hry je možnosť sledovať a skúmať nárast komplexnosti komunikačného kódu v prípade, že správy odpočúva tretia strana. V neposlednom rade, získané výsledky z experimentov s ľuďmi hrajúcimi sa našu triadickú hru môžeme konfrontovať s výsledkami z výpočtového modelu zavádzania ako spoločnej akcie prezentovanom na predošlých ročníkoch konferencie KUZ. 1 Úvod Za vrchol evolúcie života sa považuje vznik komplexného a kultúrne závislého dorozumievacieho prostriedku, ľudského jazyka (Szathmáry a Smith, 1995). Vznik jazyka úzko súvisí s potrebou koordinovať úsilie skupiny jednotlivcov za účelom osobného, či skupinového prospechu, z ktorej vyplýva aj potreba zdieľať vnútorné stavy s ostatnými členmi skupiny (Tomasello, 2009). Schopnosť odhadnúť vnútorný stav iného jedinca, takzvaná teória mysle, sa s najväčšou pravdepodobnosťou vyvíjala v spojitosti s jazykom pod tlakom kooperatívno-kompetitívneho prostredia (Malinovský, 2011). Jednou z najhlavnejších tém pri skúmaní evolúcie ľudského jazyka je prechod od jednoduchších spôsobov komunikácie k plnohodnotnému ľudskému jazyku vyznačujúcemu sa zložitou morfológiou a syntaxou, arbitrárnym priradením medzi symbolmi a významami a kultúrnym spôsobom prenosu na ďalšiu generáciu. Vzhľadom na to, že evolúciu celkovo nemožno skúmať priamym experimentom, dominantnou metodológiou v tejto oblasti sú výpočtové modely a simulácie. Ďalším zaujímavým spôsobom skúmania určitých aspektov emergencie jazyka sú experimenty na báze takzvaných jazykových hier s ľudskými subjektami v laboratóriu. Základom takýchto hier je, že probandi, ktorí tvoria, tím sedia v odlišných miestnostiach a komunikujú spolu v reálnom čase pomocou obmedzených prostriedkov tak, aby nemohli používať žiaden už existujúci jazyk, morseovku a podobne. Cieľom tímu je dorozumieť sa, skoordinovať sa a vykonať správne akcie (napríklad pohybom avatara po obrazovke). Pod tlakom obmedzených prostriedkov a bodovania za úspešnosť v zadanej úlohe účastníci experimentu vytvárajú nové komunikačné formy a významy. Napriek tomu, že primárny účel jazyka je koordinácia komunikujúcich jedincov, pri skúmaní evolúcie jazyka nemožno zanedbať aj situácie, kedy aktéri nejednajú v spoločnom záujme alebo dochádza k interakcii medzi spolupracujúcim tímom a nepriateľskou treťou stranou, a nastáva potreba komunikačnej formy umožňujúcej zavádzanie. Na rozdiel od komunikácie u zvierat, ktoré za hodnovernosť svojich signálov platia určitú cenu v zmysle náročnosti komunikačného aktu (Zahavi, 1993), je ľudský jazyk veľmi lacný a dôveryhodnosť hovorcu musí teda byť vyhodnocovaná iným spôsobom (Maynard Smith, 1994). Ako je možné, že jazyk je v skutočnosti plný zavádzania, inotajov, narážok, dvojzmyslov i klamania? Významy v jazyku sú na rôznych úrovniach postavené na metafore, no napriek tomu im rozumieme aj v zdanlivo nejasných kontextoch. Mnohé teórie považujú jazyk za výsledok boja (sociálnych) skupín (Pagel, 2012) a zdôrazňujú význam súčasnej evolúcie rituálov a jazyka (Knight, 1998) spolu so zavádzaním a ohováraním. Podľa paradoxu rozprávania v kódoch (Code-talker paradox Baker, 2008) jazyk neslúži len na komunikáciu, ale aj na zabránenie komunikácie. Ak teda vysielame nejakú správu a nechceme pri tom zdôrazňovať jej dôležitosť náročnými gestami ako zvieratá, potrebujeme na komunikáciu jazyk s viacerými úrovňami významu a možnosťou ukryť informáciu tak, aby správu nepochopili všetci, iba vybraní jedinci. Malinovský a Farkaš (2012) navrhujú skúmať úlohu a charakter zavádzania v jazyku na báze triadickej komunikačnej hry. Základný princíp tlaku na emergenciu komunikácie a vlastnosti vzniknutej komunikačnej formy je pri triadickej interakcii prítomnosť tretej strany, ktorá zachytáva komunikáciu dvoch hráčov v tíme a pôsobí na nich antagonisticky. Výsledky z triadickej interakcie medzi simulovanými agentami na báze umelých neuróno- 91

92 vých sietí a učenia posilňovaním ukazujú, že za prítomnosti tretej nepriateľskej strany medzi agentami vzniká komplexná interakcia (Malinovský, 2014). Potreba oklamať nepriateľa podporuje vznik efektu červenej kráľovnej (Van Valen, 1973), podľa ktorého je konštantná adaptácia, a adaptácia na predošlé adaptácie seba a ostatných, nutnou súčasťou evolúcie. Ako spomína už Malinovský (2013), výzvou v oblasti skúmania emergencie jazyka je porovnať správanie sa a vlastnosti výpočtového modelu s výsledkami obdobných experimentov na ľuďoch. V našom príspevku navrhujeme novú triadickú komunikačnú hru ako základ pre experimenty s ľuďmi. Triadická komunikácia patrí celkovo medzi fenomény, ktoré zatiaľ nie sú v psychológii veľmi rozšírené, no majú veľký potenciál (Hill a McGrath, 2008). Podľa našich informácií ide celkovo o prvý návrh triadickej komunikačnej hry. 2 Emergencia komunikácie v laboratóriu Koncept takzvaných jazykových hier zaviedol Steels (2003) v oblasti kognitívnej robotiky. V jeho experimentoch vzniká prostredníctvom hrania hier medzi dvoma a viacerými agentami komunikačný systém, akýsi protojazyk. Hlavným mechanizmom vzniku jazyka medzi agentami je stelesnená komunikácia a sociálno-kultúrne vyjednávanie. Podobne ako prenos jazyka v rámci jednej populácie jedincov skúmal Steels a Belpaeme (2005) aj evolúciu jazyka u generácii agentov. Napriek tomu, že drvivá väčšina ľudskej komunikácie prebieha prostredníctvom zaužívaných konvenčných prostriedkov, problém vzájomného porozumenia intencii medzi interagujúcimi ľudmi je skôr otázkou neverbálnych stelesnených mentálnych procesov (De Ruiter a spol., 2007) a je vhodné skúmať medziľudskú komunikáciu v situáciách, kde nie je možné používať jazyk ani iné konvenčné prostriedky. 2.1 Stelesnená hra s neštandardným komunikačným médiom Ako prvý predstavil Galantucci (2005) komunikačnú hru pre ľudí, ktorá nie je závislá na žiadnom existujúcom jazyku, či už prirodzenom alebo umelo vytvorenom experimentátorom a teda simuluje vznik jazyka v laboratóriu. Pri tejto hre sa dvojica hráčov, ktorí sa navzájom nevidia hrajú videohru s dvoma postavami, v ktorej zdieľajú virtuálny priestor a každý z hráčov ovláda jedného agenta (avatara). Virtuálny priestor hry tvorí štvorica miestností označených symbolmi. Hráči sa môžu v každom kroku nachádzať v jednej z nich, kde vidia, akým symbolom je označená a môžu sa presunúť do susedných dvoch miestností. Navzájom sa vidia len v prípade, že sa nachádzajú v rovnakej miestnosti. Výsledným cieľom hry je, aby hráči vedeli po dohode umiestniť svojich avatarov do rovnakej miestnosti tak, aby každý hráč vykonal maximálne jeden presun do inej miestnosti. Inými slovami, musia si odkomunikovať, v ktorej miestnosti sa ktorý nachádza, a dohodnúť sa, v ktorej sa stretnú. Na vytvorenie komunikačného protokolu alebo jazyka majú hráči spravidla mnoho pokusov. Tiež majú predtým, než začnú komunikovať, možnosť poprechádzať sa po miestnostiach hry. Pre zamedzenie používania konvenčnej komunikácie medzi hráčmi použil Galantucci špeciálne komunikačné médium, konkrétne išlo o pohyblivú podložku a magnetický stylus (pero), pomocou ktorých nemohli probandi komunikovať ani len morseovkou. Dizajn komunikačného média je schematicky zobrazený na obrázku 1. Každý z hráčov ovláda avatara pomocou klávesnice a komunikuje so svojím partnerom pomocou digitalizačnej podložky a stylusu (A), no signál, ktorý si posielajú, má spojitý charakter a pripomína výstup zo seismografu. Tým pádom sa rovnaký tvar, napríklad kruh, premietne do výsledku rôzne v závislosti od rýchlosti kreslenia (C) a konvenčné tvary ako čísla alebo písmená splývajú (D) a stávajú sa nepoužiteľnými pre zmysluplnú komunikáciu. Obr. 1: Schematické zobrazenie komunikácie z Galantucciho experimentu. Experiment Galantucci (2005) ukázal, že vzniknuté komunikačné systémy vznikajú rôznymi spôsbmi, či už priamo pri používaní alebo pomocou takzvaných pomenovávacích procedúr. Ďalej, že takéto komunikačné systémy vznikajú na princípe skúposti a teda vyhraňujú významy symbolov jednoznačne a ekonomicky, s čím tiež súvisí ďalšia vlastnosť a to, že vzniknuté symboly sú dobre perceptuálne rozlíšiteľné, ľahko použiteľné a odolné voči variáciám. 2.2 Tichá komunikačná hra De Ruiter a spol. (2007) vytvorili koncept takzvanej tichej komunikačnej hry (tacit communication game, TCG), v ktorej je na rozdiel od predošlého prípadu vopred stanovená úloha odosielateľa (signalizátor) a prijímateľa (recipient). Podobne ako v predošlom prípade hra pozostáva z virtuálneho priestoru s miestnosťami (3x3 polia) a avatarmi hráčov (geometrické tvary), avšak v tomto prípade hráči vidia celú hraciu plochu a komunikujú len prostredníctvom pohybu na nej, nemajú k dispozícii žiaden 92

93 ďalší komunikačný kanál. Na začiatku hry dostane signalizátor informáciu o cieľovej konfigurácii, v ktorej sa na konci hry majú avatari hráčov nachádzať, ďalej dostane možnosť pohybovať sa po hracej ploche v konkrétnom časovom limite. Množina pohybov, respektíve akcií, ktoré má signalizátor k dispozícii sú pohyby do 4 smerov (hore, dolu, doľava, doprava), ďalej zastavenie sa a ohlásenie konca ťahu. Akcie signalizátora vidí recipient v reálnom čase a na ťah sa dostáva buď po uplynutí času alebo po tom, čo signalizátor pošle signál o konci jeho ťahu. Úlohou recipienta je na základe pohybovej informácie od signalizátora zaujať pozíciu v cieľovej konfigurácii (poloha a natočenie geometrického tvaru avatara). Jedno kolo TCG ilustrujeme na obrázku naznačil cieľové natočenie. Zaujímavé je, že vysielateľ na zakódovanie informácie použil ten istý repertoár akcií ako na samotnú akciu v hre, čiže recipient musel odlíšiť, kedy signalizátor vykonáva komunikačnú akciu a kedy sa už presúva na miesto. 2.3 Stelesnená komunikačná hra Ďalším významným predstaviteľom hier zameraných na emergenciu jazyka je takzvaná stelesnená komunikačná hra (embodied communication game, ECG) (Scott- Phillips a spol., 2009). Táto hra podobne ako dve predošlé spočíva v pohybe avatarov na štvorcovej mriežke s 4 možnými umiestneniami. Sada možných akcií je totožná s TCG, ide teda čisto o komunikáciu pomocou jednoduchých akcií s hlavným rozdielom, že každý hráč má svoj vlastný hrací plán. Podobne ako v Galantucciho experimente nemajú hráči definované role signalizátora a recipienta a pohybujú sa súčasne, nie po ťahoch. Polia hracích plánov ECG sú odlíšené farebne a farby polí sa môžu dokonca aj opakovať. Cieľom hráčov je dostať sa na políčko rovnakej farby bez ohľadu na to, na akej pozícii je na ich hracom pláne. Počas hry vidí každý hráč farby svojho hracieho plánu, no nevie, akej farby sú polia hracieho plánu jeho spoluhráča. Túto informáciu dostane každý hráč až na konci kola ako spätnú väzbu o úspešnosti daného kola. Priebeh jedného kola schematicky zobrazuje obrázok 3. Obr. 2: Schematické zobrazenie tichej komunikačnej hry (TCG) v štyroch fázach. 1. signalizátor vidí cieľovú konfiguráciu; 2. signalizátor vykoná pohyb; 3. recipient vykoná pohyb; 4. výsledná konfigurácia zhoda s cieľovou. Po skončení ťahu recipienta dostávajú obaja hráči informáciu o úspechu alebo neúspechu herného kola, pričom za úspešné kolo sú hráči odmenení a celkovo sú motivovaní odohrať počas herného času najviac úspešných hier. Podobne ako v predošlej hre vykonáva dvojica takýchto kôl niekoľko desiatok. Veľmi pozitívnym výsledkom štúdie bolo, že až 83% párov probandov bolo schopných úspešne vytvoriť komunikačný systém (De Ruiter a spol., 2010). De Ruiter a spol. (2007) zdôrazňujú, že napriek tomu, že komunikácia neprebieha explicitne, ide v tejto hre o vznik komunikácie, nie len kooperácie, čo overili na základe kontrolných experimentov. Z výsledkov (De Ruiter a spol., 2007) vyplýva, že úspešní hráči si spravidla vyvinuli systém signálov, ktorý možno považovať za meta jazyk. V praxi sa napríklad signalizátor pred tým, než prišiel na svoju cieľovú pozíciu, presunul na cieľovú pozíciu druhého hráča a chvíľu na nej počkal alebo opakovaným pohybom niektorým smerom Obr. 3: Schematické zobrazenie stelesnenej komunikačnej hry (ECG). A) hra z pohľadu čierneho hráča; B) hra z pohľadu bieleho hráča; C) výsledná spoločná akcia a kontrola zhody farby. Úspech probandov pri ECG bol síce menší než pri TCG, ale tiež platí, že všetky páry, čo boli úspešné, si počas hrania hry vytvorili vlastný komunikačný kód. Zaujímavé je, že podobne ako pri experimentoch s emergenciou jazyka pomocou jazykových hier u simulovaných agentov (Steels a Belpaeme, 2005), aj u ľudí vznikali pre farby políčok postupne najprv jednoduché a neskôr zložitejšie kódy. Prednostne si však hráči, podobne ako u 93

94 TCG, volili farby s jednoduchším kódom, čo je v súlade s teóriou kognitívnej ekonómie pri kategorizácii (Rosch, 1999). 3 Triadická tichá komunikačná hra Výpočtový model zavádzania ako spoločnej akcie, v ktorom je interakcia medzi simulovanými agentami modelovaná práve na základe TCG a ECG, a výsledky experimentov s ním (Malinovský, 2013, 2014) ukazujú výrazný vplyv tretej strany na vzniknutý komunikačný systém. Na základe spomínaných jazykových (komunikačných) hier a tohto modelu navrhujeme zaviesť triadickú interakciu do tichej komunikačnej hry (TCG). Experimenty na báze nami navrhovanej hry nám umožnia otestovať spomínaný formálny model triadickej hry na ľuďoch a overiť vhodnosť našej minimálnej reprezentácie agenta pre emergenciu komunikácie. Napriek tomu, že pôvodný výpočtový model vystihuje skôr stelesnenú komunikačnú hru (ECG), rozhodli sme sa ako východisko pre našu hru použiť tichú komunikačnú hru (TCG). Hlavným dôvodom je vyššia úspešnosť hráčov v TCG a tiež zložitosť respektíve jednoduchosť priebehu a cieľov hry. Ďalším dôležitým faktorom je možnosť vyhodnotenia úspešnosti hier a komunikačnej formy, ktorá medzi hráčmi vzniká. V neposlednom rade, pôvodný výpočtový model zavádzania ako spoločnej akcie možno osadiť do nami navrhnutej hry a výsledky simulácií konfrontovať s výsledkami experimentov s ľudmi. 3.1 Tretí hráč v tichej komunikačnej hre Metódy a štruktúra dyadickej TCG sú dobrým základom pre vytvorenie tichej komunikačnej hry pre troch hráčov. Tak ako v TCG aj v našej hre vystupujú dvaja hráči vo vopred (náhodne) stanovenej roli signalizátora (S) a recipienta (R). Našu hru možno chápať ako rozšírenie TCG. Tretím hráčom v hre je odpočúvač eavesdropper (z angličtiny), označený písmenom E. V našej hre budeme tohto hráča nazývať eštebák. Úlohou eštebáka je odpočúvať komunikáciu medzi hráčmi S a R a zistiť, na akej cieľovej konfigurácií sa tím hráčov snaží dohovoriť. Rovnako ako pri TCG sa pohybujú všetci hráči po rovnakom hernom pláne a striedajú sa po ťahoch. Ako prvý je na ťahu signalizátor. Tak ako v TCG najprv dostáva zadanie cieľovej konfigurácie. Ďalej má príležitosť vykonať svoje pohyby. Ťah signalizátora končí po uplynutí časového limitu alebo keď dá hráč znamenie, že skončil. R sleduje S a keď sa dostane na ťah, snaží sa umiestniť avatara na pláne do zadanej konfigurácie (poloha na hernom pláne). Hlavný rozdiel oproti pôvodnému scenáru je, že súčasne s recipientom príde na ťah tretí hráč eštebák. E rovnako ako R sleduje S a snaží sa rozlúštiť kód, pod ktorým si tím hráčov odovzdáva informácie. E sa teda na konci svojho ťahu snaží skončiť na rovnakom poli ako R. Podobne ako v pôvodnej TCG majú R aj E obmedzený čas, v ktorom musia v svojom kole zaujať výslednú konfiguráciu (tento časový limit je značne menší než u hráča S). Naša triadická tichá hra čerpá zo skutočnosti, že komunikáciu medzi troma stranami možno považovať za najtriviálnejšiu variantu komunikácie typu broadcast (Malinovský a Farkaš, 2012), teda signalizátor posiela správy, ktoré môže prijímať ktokoľvek. Triadická TCG teda vystihuje typickú situáciu z kryptografie, kedy jedna strana používa zavádzanie pre utajenie komunikovaných informácií (Malinovský a Farkaš, 2012). Jedným z hlavných problémov takto navrhnutej hry môže byť situácia, kedy si tím hráčov nevytvorí spoločný jazyk, pretože nedostane kvôli interferencii od eštebáka príležitosť a dostatok spätnej väzby vytvoriť si komunikačný systém. Podobne aj šifry a kódy v kryptografii vznikajú v uzatvorenom prostredí a až potom sú testované v nechránenom prenose informácií. Pre tento účel sme v našej triadickej TCG vyhradili dve herné fázy, ktoré sú charakteristické hlavne tým, či v nich vystupuje alebo nevystupuje tretí hráč eštebák. 3.2 Priebeh hry Fázy triadickej TCG znázorňujeme na obrázku 4. Z hľadiska cieľa a obsahu rozdeľujeme fázy do troch kategórií, a to: inicializácia hry, ktorá prebieha vždy raz na začiatku hry; fáza komunikácie, kde interagujú len S a R a vytvárajú si komunikačný systém (kód); a fáza zavádzania, kde do hry vstupuje E a snaží sa odhaliť kód, ktorý vytvorili S a R. Hráči S a R majú počas ktorejkoľvek fázy zavádzania možnosť vrátiť sa do fázy komunikácie, kde ich nesleduje E, aby si upravili svoj dorozumievací systém v prípade, že boli odhalení. Na prechode medzi fázami sa musia hráči zhodnúť jednohlasne, no každý z nich má možnosť takýto prechod navrhnúť prostredníctvom tlačidla v hernom rozhraní. Obrázok 4 zobrazuje možné fázy hry a stavové prechody medzi nimi. Hlavným obmedzením pre stredanie kôl a fáz je v našej hre čas. Hráči majú spolu 40 minút na to, aby úspešne vytvorili kód a otestovali ho v prítomosti eštebáka. Aby boli S a R motivovaní ukončiť fázu komunikácie a otestovať svoj komunikačný systém, počas tejto fázy nedostávajú žiadne body. Komunikačnú fázu teda môžeme chápať aj ako trénovaciu. Hráči teda získavajú bodové ohodnotenie len vo fáze zavádzania. 3.3 Viditeľnosť hráčov a spätná väzba Obrázok 5 ilustruje vzájomnú viditeľnosť hráčov v hre ako aj informácie, ktoré dostávajú hráči v jednotlivých rolách po skončení ťahu. Hráč S vidí okrem svojho pohybu aj pohyb R a jeho výslednú konfiguráciu, čiže bezprostredne vidí, či boli v komunikačnej hre úspešní. Rovnako hráč R vidí pohyby S a výslednú konfiguráciu oboch. Po ukončení jedného kola dostávajú obaja hráči spätnú 94

95 Signalizátor Recipient Eštebák Počas priebehu kola Po ukončení kola Úspech tímu v kole Oznam o odhalení Konfigurácia S & R Obr. 5: Graf vzájomnej viditeľnosti jednotlivých hráčov. Šípky naznačujú vzájomnú viditeľnosť. v spodnej časti znázorňujeme spätnú väzbu pre hráčov po skončení kola. konkrétne hodnoty z experimentov de Ruitera a kolegov spolu s hodnotami navrhnutými pre našu triadickú hru. Vzhľadom na to, že v našej hre rozlišujeme v princípe dva herné stavy (s eštebákom a bez neho) a predpokladáme, že hráči budú v mnohých prípadoch nútení modifikovať či úplne zmeniť svoj komunikačný systém, alokovali sme pre celú hru väčšie množstvo času. Obr. 4: Fázy hry. Po inicializácii prechádza hra do fázy komunikácie, kde hrajú len S a R. Z tejto môže hra prejsť do fázy zavádzania kedy hrajú všetci traja hráči a naspäť. väzbu o ich úspechu alebo neúspechu pri zaujatí cieľovej konfigurácie. Vo fáze zavádzania dostávajú navyše S a R informáciu o tom, či bol ich kód prelomený, čo znamená, že hráča E vlastne nikdy nevidia. E vidí pohyby S, no nevidí pohyb R, s ktorým jednajú paralelne. Po skončení kola dostáva E k dispozícii informáciu o konfigurácii, ktorú S a R zaujali. Ďalšou formou spätnej väzby je informácia o odhalení komunikačného kódu. Táto informácia sa vyhodnocuje priebežne na konci každého kola na základe vzorca (algoritmu) popísaného v 3.4. V prípade, že v danom kole došlo k prelomeniu šifry, na konci kola sa táto informácia zobrazí všetkým trom hráčom. Tým, že hráči S a R nevedia v akej konfigurácii skončil hráč E a dostávajú spätnú väzbu o úspešnosti ich taktiky v nepravidelných intervaloch a nie bezprostredne po každom pokuse, možno chápať tento systém odmeny ako paralelu učenia posilňovaním (Doya, 2000). 3.4 Detekcia prelomenia kódu a ďalšie parametre Iniciálne parametre ako je časový limit pre celú hru ako aj pre jednotlivé kolá, v ktorých hráči vykonávajú svoje pohyby, sme stanovili na základe pôvodnej tichej komunikačnej hry (De Ruiter a spol., 2007). Tabuľka 1 zobrazuje Parameter TCG TTCG celá hra 40 min 80 min prvá komunikačná fáza 20 min max. ťah S 5s 60s max. ťah R a E 5s 10s Tab. 1: Časové limity v klasickej dyadickej TCG (z De Ruiter a spol. (2010)) a triadickej TCG (TTCG). Cieľom limitu pre dĺžku trvania jedného ťahu v hernom kole je motivovať hráčov konať promptne a nezdržiavať sa. 1 Keďže hlavnú komunikačnú snahu vyvíja hráč S, maximálna dĺžka jeho ťahu je značne dlhšia ako u hráčov E a R. Rizikovým faktorom pri modeli hry, kde si hráči môžu sami zvoliť, kedy prechádzajú od nebodovanej fázy komunikácie do bodovanej fázy zavádzania je, že sa hráči zaseknú na pridlhú dobu v prvej fáze komunikácie. Aby sme sa takejto situácii vyhli, rozhodli sme sa limitovať aj dĺžku tejto hernej fázy. Ako sme spomenuli už vyššie, inováciou v našej hre je, že všetci hráči dostávajú informáciu o odhalení od hry externe. Našou hlavnou motiváciou pre zavedenie tohto postupu je zamedzenie situácii, kedy bude E v hre úspešný len náhodou. Rozhodli sme sa teda zisťovať, či došlo k odhaleniu na základe vopred stanoveného vzorca, respektíve algoritmu. Ako prvý mechanizmus, ktorý použijeme aj v pilotnom experimente, bude limit na počet za sebou idúcich úspešných odhalení výslednej konfigu- 1 Napriek tomu, že je pre hráčov výhodné vykonávať pohyby rýchlo a pomerne často testovať svoj jazyk vo fáze zavádzania, predpokladáme, že si mnoho dvojíc túto skutočnosť spočiatku neuvedomí. 95

96 rácie S a R, ktorý nazývame prah odhalenia komunikácie (POK). Pre pilotný experiment sme zvolili POK = 5. Mechanizmom oddeleného oznamovania o prelomení kódu predchádzame jednorázovým náhodným výhram eštebáka, ktoré by sa mohli hráčom S a R javiť ako mylná informácia o čase odhalenia (aj keď E v skutočnosti ich jazyku nerozumie). Mohlo by teda dôsť k tomu, že sa hráči okamžite po prvej výhre E rozhodnú vrátiť do fázy bezpečnej komunkácie a zmeniť svoj jazyk aj v prípade, že by to v skutočnosti nebolo potrebné. 3.5 Bodové ohodnotenie hráčov Hlavnou motiváciou hráčov v našej hre je získavať čo najvyššie skóre. De Ruiter a spol. (2007) dávali probandom finančnú odmenu, pričom tímy, ktoré získali najviac bodov, získali aj najväčšiu sumu peňazí. Pri realizácii nášho experimentu plánujeme použiť (podľa našich možností) veľmi podobný princíp. Na rozdiel od pôvodnej hry musíme v našej hre motivovať aj tretieho hráča E. Podobne ako S a R, budú aj hráči v úlohe eštebáka súťažiť skôr medzi sebou, aj keď v hre hrajú proti komunikujúcemu páru. Body, ktoré sa spočítavajú do výsledného herného skóre, môžu v triadickej TCG získať všetci hráči len vo fáze zavádzania a to nasledujúcim spôsobom: Hráči signalizátor a recipient: získavajú 10 bodov za každé kolo, kde sa im podarí dostať sa do cieľovej konfigurácie, strácajú 100 bodov ak sa v danom kole ukázalo, že boli odhalení. CIEĽ SENDER ČAS: 00:00 RECIEVER Ukonči svoj ťah Spusti fázu zavádzania Obr. 6: Náčrt grafického prostredia pre signalizátora SENDER ČAS: 00:00 RECIEVER Ukonči svoj ťah Spusti fázu zavádzania Obr. 7: Náčrt grafického prostredia pre recipienta krížikom ako zobrazujeme na obrázku 8. Ďalším rozdielom oproti klasickej TCG popísaným v kapitole 3.3 je vzájomná viditeľnosť hráčov ako vidíme na obrázku 5. Navyše pribúda niekoľko nových tlačidiel, napríklad tlačidlo na zahájenie prechodu medzi hernými fázami (z komunikačnej do zavádzacej a naspäť). SENDER ČAS: 00:00 EAVESDROPPER Hráč eštebák: získava 5 bodov za každé kolo, kde sa mu podarí dostať sa do rovnakej konfigurácie ako R, získava ďalších 50, ktoré môže získať za každé kolo, ak sa v danom kole ukázalo, že odhalil svojich protihráčov. 3.6 Implementácia a užívateľské rozhranie Pre jednoduchosť administrácie sme sa rozhodli zvoliť ako prostriedok na hranie našej hry štandardný webový browser. Probandi vidia zdieľané prostredie prispôsobené podľa svojej roly, informácie o odmene a ovládacie prvky. Obrázok 6 zobrazuje náčrt užívateľského rozhrania pre signalizátora, obrázok 7 pre signalizátora a obrázok 8 pre eštebáka. Pri tvorbe grafického rozhrania sme sa opäť inšpirovali klasickou TCG. Prvým rozdielom je, že S a R sú zastúpení novými avatarmi, a to konkrétne kruhmi rozdielnej farby. Hráč E má avatara s iným tvarom, a to RECIEVER Ukonči svoj ťah Obr. 8: Náčrt grafického prostredia pre eštebáka 4 Záver V príspevku sme predstavili návrh novej komunikačnej hry založenej na tichej komunikačnej hre, takzvanú triadickú tichú komunikačnú hru (TTCG). Najcharakteristickejšou inováciou nášho návrhu je pridanie tretieho hráča, takzvaného eštebáka (E), ktorý sleduje interakciu medzi dvoma partnerskými hráčmi signalizátorom a recipientom, a snaží sa odhaliť ich komunikačný kód. Hráči signalizátor a recipient majú možnosť svoju komu- 96

97 nikáciu zveľaďovať a trénovať bez prítomnosti hráča E. V tomto prípade, však, nemajú možnosť získavať v hre body. Podobne ako pri TCG, hlavnou motiváciou hráčov v TTCG je skutočnosť, že najúspešneší získavajú najväčšiu odmenu. Tímy hráčov S a R a jednotlivci E teda súťažia skôr medzi sebou, aj keď ich úlohou je poraziť druhú stranu. Medzi hlavné ciele sledované pomocou takejto hry je skúmanie vplyvu tretej strany na komplexnosť vzniknutej komunikačnej formy a súčasne možnosť konfrontovať pôvodný výpočtový model zavádzania ako spoločnej akcie s výsledkami experimentov s ľuďmi. Poďakovanie Tento príspevok vznikol za podpory grantovej agentúry VEGA v rámci grantovej úlohy 1/0898/14 a grantovej agentúry KEGA v rámci grantovej úlohy 076UK-4/2013 a s podporou študentského grantu od firmy Nuabi, s.r.o. Ďalej za finančnú podporu ďakujeme Ľudovítovi Malinovskému. V neposlednom rade ďakujeme Martinovi Takáčovi za spätnú väzbu a dobré tipy. Literatúra Baker, M. C. (2008). The Atoms of Language: The Mind s Hidden Rules of Grammar. Basic Books. De Ruiter, J. P., Noordzij, M., Newman-Norlund, S., Hagoort, P. a Toni, I. (2007). On the origin of intentions. Attention & Performance XXII, str De Ruiter, J. P., Noordzij, M. L., Newman-Norlund, S., Newman-Norlund, R., Hagoort, P., Levinson, S. C. a Toni, I. (2010). Exploring the cognitive infrastructure of communication. Interaction Studies, 11(1): Doya, K. (2000). Reinforcement learning in continuous time and space. Neural Computation, 12(1): Galantucci, B. (2005). An experimental study of the emergence of human communication systems. Cognitive science, 29(5): Malinovský, Ľ. (2013). Vypočtový model zavádzania ako spoločnej akcie. V Kognitivní věda a umělý život, str Slezská univerzita, Opava. Malinovský, Ľ. (2014). Broadcasting to the enemy: deception as a solution in evolution of language. V Evolution Of Language: Proceedings Of The 10Th International Conference Evolang 10, str World Scientific Publishing, Singapore. Malinovský, Ľ. a Farkaš, I. (2012). Triadická interakcia v emergencii komunikácie. V Kognice a umělý život XII, str Agentura Action M, Prague. Maynard Smith, J. (1994). Must reliable signals always be costly? Animal behaviour, 47(5): Pagel, M. (2012). War of words: the language paradox explained. New Scientist, 216(2894): Rosch, E. (1999). Principles of categorization. MIT Press, Cambridge, MA. Scott-Phillips, T. C., Kirby, S. a Ritchie, G. R. (2009). Signalling signalhood and the emergence of communication. Cognition, 113(2): Steels, L. (2003). Evolving grounded communication for robots. Trends in Cognitive Sciences, 7(7): Steels, L. a Belpaeme, T. (2005). Coordinating perceptually grounded categories through language: A case study for colour. Behavioral and brain sciences, 28(04): Szathmáry, E. a Smith, J. M. (1995). The major evolutionary transitions. Nature, 374(6519): Tomasello, M. (2009). The cultural origins of human cognition. Harvard University Press. Van Valen, L. (1973). A new evolutionary law. Evolutionary theory, 1:1 30. Zahavi, A. (1993). The fallacy of conventional signalling. Philosophical Transactions of the Royal Society of London. Series B: Biological Sciences, 340(1292): Hill, L. B. a McGrath, J. M. (2008). Communication within the triadic context: Intercultural prospects1. Intercultural Communication Studies, 17: Knight, C. (1998). Ritual/speech coevolution: a solution to the problem of deception. V Approaches to the Evolution of Language: Social and Congnitive Bases, str Cambridge University Press, Cambridge. Malinovský, Ľ. (2011). Modelovanie biologickokultúrnej koevolúcie jazyka a teórie mysle. V Kognice a umělý život XI, str Slezská univerzita, Opava. 97

98 Kognícia a umelý život 2015, Trenčianske Teplice Automatická tvorba učebných plánov pre strojové učenie Tomáš Kuzma, Igor Farkaš Centrum pre kognitívnu vedu, KAI FMFI UK, Univerzita Komenského v Bratislave Mlynská dolina, Bratislava {tomas.kuzma,igor.farkas}@fmph.uniba.sk Abstrakt Pri tvorbe učebných plánov sa často používa jednoduchá zásada na začiatku učenia sa študentovi predkladajú jednoduché príklady a s postupom času sa zaraďujú aj príklady ťažšie. Cieľom tohoto postupu je pomôcť správnemu zovšeobecňovaniu v danej úlohe a urýchliť a zjednodušiť proces učenia. S myšlienkou použiť túto zásadu aj na trénovanie umelých neurónových sietí prišiel Elman (1993), pričom zvýšil úspešnosť učenia na syntetickej jazykovej úlohe pomocou ručne vytvoreného plánu. Na túto prácu nadväzujú aj Bengio a spol. (2009), demonštrujúc efektivitu tejto metódy (pod názvom curriculum learning) na ručne vytvorených plánoch pre viacero modelov a syntetických úloh. V tejto práci navrhneme niekoľko metód, ako takýto učebný plán (curriculum) tvoriť automaticky, a otestujeme ich efektívnosť na syntetických, ale aj praktických problémoch. 1 Úvod V oblasti vzdelávania sa pri tvorbe učebných plánov často využíva nasledujúci princíp: ako prvé sa v preberanej látke objavujú príklady, ktoré sú jednoduchšie, menšie, či majú menej súvislostí, a v priebehu výučby sa táto náročnosť zväčšuje. Úlohou tohoto postupu je najprv naučiť študentov základy, a potom postupne pridávať rôzne rozšírenia a špeciálne prípady, ktoré by inak mohli byť na začiatku mätúce. Hypotézu, že takéto postupné učenie (curriculum learning) by mohlo byť prospešné aj pri učení (trénovaní) modelov v strojom učení, predstavil Elman (1993). Vo svojom prvom experimente učil jednoduchú rekurentnú neurónovú sieť s kontextovou vrstvou predikovať nasledujúce slovo vo vete, pričom tieto vety boli generované jednoduchou umelou gramatikou. Sieť sa podarilo úspešne natrénovať len vtedy, keď sa najprv trénovala na kratších a jednoduchších vetách. (Vo svojom druhom experimente tiež dosiahol podobne pozitívne výsledky inou metódou, kde postupný nárast zložitosti učenia nebol dosiahnutý zmenami distribúcie vstupných dát, ale postupným nárastom reprezentačných možností trénovaného modelu. Sieť počas trénovania zabúdala, čo bolo implementované pomocou mazania skrytej kontextovej vrstvy po istom počte krokov.) V nedávnej dobe sa k tejto myšlienke pod názvom curriculum learning (postupné učenie) vrátili v rovnomennom článku Bengio a spol. (2009), kde k nej tiež poskytli formálnu definíciu postupnosť distribúcií nad trénovacími príkladmi s narastajúcou entropiou a demonštrovali jej efektivitu na zmesi syntetických úloh: hľadanie Bayesovského klasifikátora, klasifikácia lineárne oddeliteľných dát a rozpoznávanie geometrických útvarov; a tiež na predikcii reálneho jazyka, pri ktorej sa hľadá skóre pre možné pokračovania začatej vety. Vo všetkých týchto scenároch dosiahli mierne, no signifikantné zlepšenie schopnosti generalizácie. V tomto článku sa ďalej budeme venovať skúmaniu metód, ktoré budú takéto učebné plány vytvárať bez ďalších znalostí či už o úlohe, alebo hlbšej štruktúre jej vstupných dát. 2 Tvorba plánu Základom nášho prístupu je myšlienka, že lineárne oddeliteľné rozhodovacie problémy sú exaktne reprezentovateľné a ľahko naučiteľné pre skoro všetky modely používané v strojovom učení. Pre problémy, ktoré ale lineárne oddeliteľné nie sú, by v duchu postupného učenia dobrým začiatočným bodom mohla byť čo najväčšia lineárne oddeliteľná podmnožina vstupov. Naším počiatočným problémom je teda rozhodovacia úloha, ktorej dve triedy nie sú (v priestore vstupov) lineárne oddeliteľné, a chceme z nich vybrať podmnožinu, ktorá by už lineárne oddeliteľná bola. Je zjavné, že táto formulácia úlohy je veľmi nejednoznačná. Keby sme uvažovali podmienku, že vybraná množina má byť najväčšia spomedzi všetkých vyhovujúcich, narazíme na problém úloha síce má jednoznačné riešenie, no už nie je efektívne riešiteľná. Približná verzia nášho problému sa ale rieši implicitne pri trénovaní akéhokoľvek lineárneho klasifikátora po natrénovaní klasifikátora sú totiž dáta, ktoré klasifikuje správne, lineárne oddeliteľné. Pre dobre natrénovaný klasifikátor bude navyše táto množina približne najväčšia možná (no nie vždy exaktne najväčšia). Z dôvodov efektivity sa teda budeme musieť uspokojiť s takýmto rýchlym približným riešením. 98

99 2.1 Stroje s podpornými vektormi S veľmi efektívnym riešením problému (nielen) lineárnej klasifikácie prišli Cortes a Vapnik (1995) vo svojom modeli stroj s podpornými vektormi (Support Vector Machine), kde sa hľadá oddeľujúca nadrovina, od ktorej sú všetky trénovacie body čo najďalej, a to v správnom smere (taká môže zjavne existovať len pre lineárne oddeliteľné problémy); vo variante s mäkkými okrajmi (soft margin) sa navyše umožňuje túto vlastnosť porušovať, ale takéto porušenie je penalizované. Ak si označíme počet vstupov n, dimenziu vstupov d, vstupy x i R d a triedy y i = ±1, našou úlohou je nájsť optimálne hodnoty pre koeficienty deliacej roviny (w R d, b R) a vo variante s mäkkými okrajmi navyše aj hodnoty pre vedľajšie 1 premenné (ξ i R + 0 ). Za cieľ si volíme maximalizovať vzdialenosť medzi triedami a navyše vedľajšie premenné penalizujeme regularizačným parametrom C R + ; dostávame teda tento kvadratický program: min: 1 2 w 2 + C n i=1 s podmienkou: y i (w x i b) 1 ξ i ( 1 i n) Nakoľko takto sformulovaný kvadratický problém je pozitívne definitný, je možné ho efektívne riešiť (všeobecné kvadratické programovanie je NP-ťažké) niekoľkými spôsobmi, a to v primálnej i duálnej forme. 2.2 Rozhodovacie úlohy Náš postup teda spočíva v natrénovaní stroja s podpornými vektormi na vstupných dátach a použitím tohoto modelu na vybratie jednoduchších trénovacích vzorov z celkovej množiny. Pre každý vstupný vzor si vypočítame jeho orientovanú vzdialenosť od rozhodovacej nadroviny (ďalej len okraj), pričom vzory ležiace ďalej od tejto roviny v správnom smere budeme považovať za jednoduchšie. Do sady jednoduchších dát pripustíme iba vzory, kde tento okraj je väčší ako nejaká hodnota prah. Pre kladné hodnoty tohoto prahu dostaneme jednoduchšiu množinu, ktorá je už lineárne oddeliteľná; záporné hodnoty tohto parametra vyberajú aj už lineárne neoddeliteľné vstupy, no stále zahadzujú viac vytŕčajúce dáta (outliers). 2.3 Klasifikačné úlohy Pre úlohy, ktoré majú k > 2 tried, už takýto jednoduchý postup nie je možný viac tried sa nedá oddeliť použitím jednej roviny. Dá sa ale uvažovať nad použitím súboru viacerých lineárnych klasifikátorov, ktorého jednotlivé binárne rozhodnutia budú určovať výslednú klasifikáciu. 1 Tieto nám umožňujú, aby niektoré body boli bližšie k rovine, ako majú byť (geometrická vzdialenosť 1 ). Vo formulácii SVM bez w mäkkých okrajov sa tieto premenné nenachádzajú (sú rovné nule). ξ i Ukázalo sa, že zmena vzájomnej početnosti jednotlivých tried má zásadný vplyv na úspešnosť trénovania; do našej sady jednoduchších dát preto budeme brať zástupcov všetkých tried rovnomerne. Budeme skúmať dva takéto prístupy: one vs rest, ktorý používa k klasifikátorov, a one vs one, ktorý používa ( k 2) klasifikátorov One vs rest V jednoduchšom variante sa pre k vstupných tried natrénuje k klasifikátorov, pričom i-ty oddeľuje triedu i od zvyšných. Výsledným okrajom pre vzor patriaci do i-tej triedy je v tomto prípade vzdialenosť daného bodu od i-tej rozhodovacej nadroviny. Výhodou tohoto postupu je jeho jednoduchosť a výpočtová nenáročnosť, no iba veľmi málo problémov sa dá úspešne riešiť takýmto súborom k klasifikátorov. Obmedzenia tejto metódy si môžeme ilustrovať napríklad na známej dátovej sade Iris flower data set (Fisher, 1936; Anderson, 1935) (pozri obr. 1). Oddeliť červené body od zvyšných je možné exaktne, modré body od zvyšných s vysokou presnosťou. Zelené body sú ale obkolesené zvyšnými triedami z dvoch strán a ani približné oddelenie nie je možné. (Zobrazené sú iba posledné dva rozmery; oddelenie je ale podobne beznádejné aj s použitím všetkých štyroch rozmerov.) petal width Iris setosa Iris versicolor Iris virginica petal length Obr. 1: Iris flower data set, zobrazené sú posledné dva rozmery: šírka a dĺžka okvetných lístkov One vs one Zmysluplnejšie okraje sa dajú dosiahnuť trénovaním klasifikátorov, ktoré oddeľujú dvojicu tried i a j, takýchto klasifikátorov ale potrebujeme ( k 2) =O(k 2 ). Výhodou je, že každý klasifikátor počas svojho trénovania vidí len časť vstupných dát, a nie všetky, ako v prípade prístupu one vs rest, čo znižuje výpočtovú náročnosť trénovania veľkého množstva klasifikátorov. Situáciu, kde mala metóda one vs rest ťažkosti, metóda one vs one rieši uspokojivo. Oddelenie dvojíc tried prebehne bez problémov, najťažšie je oddelenie Iris versicolor a Iris virginica (pozri obr. 2); výsledné skóre 99

100 ukazuje obr. 3. Je dobré si všimnúť, že konečné okraje sú celkom intuitívne: pre vzory na okrajoch tried sú vysoké, a na miestach, kde sa triedy prelínajú, sa pohybujú okolo nuly. sepal width sepal length 0.61 Iris setosa Iris versicolor Iris virginica Obr. 2: Nedokonalé lineárne oddelenie kvetov Iris versicolor od kvetov Iris virginica dva zo sto kvetov sa nachádzajú na nesprávnej strane oddeľovacej nadroviny. (Zobrazená je projekcia na prvé dva vstupné atribúty zo štyroch: šírka a dĺžka kališných listov; čísla nad bodmi znázorňujú vzdialenosť od oddeľujúcej nadroviny; záporné okraje sú kreslené červenou.) sepal width Iris setosa 0.92 Iris versicolor 0.98 Iris virginica sepal length Obr. 3: Konečné skóre pre všetky vstupné vzory. (Zobrazená je projekcia na prvé dva vstupné atribúty zo štyroch: šírka a dĺžka kališných listov; čísla nad bodmi znázorňujú vzdialenosť od oddeľujúcej nadroviny; záporné okraje sú kreslené červenou.) 3 Pokusy na syntetických úlohách Úspešnosť nášho postupu sme skúmali na umelej úlohe klasifikácie geometrických tvarov, ktorú predstavili (Bengio a spol., 2009): cieľom je klasifikovať obrázky v odtieňoch šedej s veľkosťou bodov do troch kategórií (elipsy, obdĺžniky a trojuholníky). Pre túto úlohu vytvorili aj učebný plán, čo nám umožňuje porovnať jeho efektivitu s naším učebným plánom. V snahe priblížiť sa čo najviac pôvodným experimentom sme robili pokusy na umelej neurónovej sieti obsahujúcej tri skryté vrstvy (so soft-sign aktiváciou) po 400 neurónoch nasledované výstupnou softmax vrstvou (jednotlivé triedy boli reprezentované pomocou one-hot kódovania). Sieť sme trénovali metódou poklesu gradientu s využitím vysokého momenta po 256 epoch 2. Výsledky pre 50 behov sú uvedené v tabuľke 1. variant estimácia validácia testovanie bez plánu 13.43± ± ±1.00 one vs one 9.92± ± ±1.60 Bengiov plán 7.60± ± ±1.20 Tab. 1: Priemerné klasifikačné chyby (v %) dosiahnuté na pôvodnej verzii úlohy GeomShapes (odtiene šedej). Ukázalo sa, že pre lineárny model je mimoriadne náročné mať v jednej triede aj svetlé útvary na tmavom pozadí, aj naopak. Vytvorili sme teda zjednodušenú monochromatickú verziu dát, kde je útvar vždy biely a pozadie vždy čierne. Táto úloha sa prekvapivo ukázala byť omnoho jednoduchšia aj pre nelineárnu neurónovú sieť; výsledky 50-tich behov sumarizuje tabuľka 2. variant estimácia validácia testovanie bez plánu 0.03± ± ±0.48 one vs one 0.04± ± ±0.35 Bengiov plán 0.04± ± ±0.51 Tab. 2: Priemerné klasifikačné chyby (v %) dosiahnuté na monochromatickej verzii úlohy GeomShapes. 4 Pokusy na praktických úlohách Ako praktickú úlohu sme si vybrali štandardnú sadu rukou písaných číslic MNIST (LeCun a Cortes, 2010). V tejto úlohe je potrebné klasifikovať číslice 0 až 9, ako vstup slúžia obrázky, ktoré majú majú obrazových bodov v odtieňoch šedej. Na testovanie sme použili rovnaký postup a architektúru ako pri predchádzajúcej úlohe, nakoľko majú podobný charakter a typ vstupu. Jedinou zmenou je zmenšenie počtu vstupných neurónov z na a zníženie počtu epoch na 60. Výsledky pre 50 nezávislých behov uvádza tabuľka 3. variant estimácia validácia testovanie bez plánu 0.03± ± ±0.08 one vs one 0.02± ± ±0.08 Tab. 3: Priemerné klasifikačné chyby (v %) dosiahnuté na úlohe MNIST; na validáciu sme vybrali náhodnú šestinu trénovacích dát. 2 V prípade Bengiovho plánu sme trénovali sieť 128 epoch na ľahších a následne ďalších 128 epoch na ťažších dátach; pre náš plán, ktorý má v jednoduchej množine menej dát ako Bengio, sa ukázalo byť vhodné zvoliť dĺžku trénovania epoch. 100

101 5 Implementačné detaily Na efektívne trénovanie lineárnych SVM používame knižnicu liblinear (Fan a spol., 2008). Trénovanie na d- rozmernej dátovej množine obsahujúcej n vzorov má časovú zložitosť O(d n), zatiaľ čo trénovanie všeobecnejších SVM má zložitosť O(d n 2 ). Pri použití metódy one vs rest sa trénuje k klasifikátorov jeden pre každú triedu. Trénovanie jedného takéhoto klasifikátora má zložitosť O(d n), pričom všetky trénovania sú nezávislé a dajú sa ľahko paralelizovať. Celková zložitosť je teda O (k n d). ( Pri použití metódy one vs one trénujeme dokonca k ) 2 = O(k 2 ) klasifikátorov, pričom každý oddeľuje nejakú triedu i od inej triedy j; tieto klasifikátory sa takisto dajú trénovať paralelne. Celková zložitosť je teda O(k 2 d n), ale za predpokladu, že v každej triede je zhruba rovnaké množstvo dát, O(n/k), čo platí napríklad pre všetky dátové množiny použité v tomto článku, je možné získať jemnejší odhad. Pre trénovanie klasifikátora rozhodujúceho sa medzi triedami i a j sú totiž potrebné len dáta patriace do týchto tried, ktorých nie je n, ale len 2 O(n/k) získavame teda zložitosť: O (( ) ) k 2 2 k n d = O(k n d) Na trénovanie dopredných neurónových sietí používame vlastnú implementáciu v jazyku Python, pričom na samotné výpočty používame knižnicu Theano (Bergstra a spol., 2010; Bastien a spol., 2012) tá oproti naivnej implementácii prináša niekoľko výhod, vrátane optimalizácií na numerickú stabilitu a rýchlosť výpočtu a umožňuje Just-in-Time generovanie a kompiláciu zdrojového kódu pre výpočty. Výsledný strojový kód môže byť efektívne vykonávaný priamo na procesore (pričom využíva špecifickú inštrukčnú sadu konkrétneho procesora, dosahujúc zhruba 5-násobné zrýchlenie), alebo pomocou grafickej karty (ktorá dokáže mnohé operácie vykonávať paralelne na stovkách špecializovaných výpočtových jadier, s praktickým zrýchlením v ráde desiatok až stoviek). 6 Záver Pokusy na syntetických dátach ukázali, že s použitím automaticky vytvoreného učebného plánu je možné dosiahnuť zlepšenie na skoro tak vysokej úrovni, ako s ručne vytvoreným plánom. Vytvorili sme tiež modifikovanú verziu tejto úlohy, ktorá je pre lineárny klasifikátor jednoduchšia. V tejto verzii získané okraje lepšie popisujú zložitosť jednotlivých vstupov a preto automaticky vytvorený plán dosahuje dokonca lepšie výsledky, ako plán vytvorený ručne. 3 Ďalšie skúmanie možno odhalí, prečo nám automaticky tvorený plán na praktických dátach nepriniesol žiadne zlepšenie. 3 ktorý bol ale vytvorený pre nemodifikovanú úlohu Pôvodný článok (Elman, 1993) podrobili ostrej kritike Rohde a Plaut (1999), pričom ukázali, že na ich variantoch pôvodnej úlohy a pôvodného modelu postupné učenie nielen nepomáha, ale dokonca výsledky zhoršuje. Dá sa teda predpokladať, že techniky postupného učenia nie sú úplne univerzálne a nedajú sa úspešne použiť na ľubovoľný typ úloh. Poďakovanie Tento príspevok vznikol za podpory grantovej agentúry VEGA v rámci grantovej úlohy 1/0898/14 a grantovej agentúry KEGA v rámci grantovej úlohy 076UK-4/2013. Literatúra Anderson, E. (1935). The irises of the gaspe peninsula. Bulletin of the American Iris Society, 59:2 5. Bastien, F., Lamblin, P., Pascanu, R., Bergstra, J., Goodfellow, I. J., Bergeron, A., Bouchard, N. a Bengio, Y. (2012). Theano: new features and speed improvements. Deep Learning and Unsupervised Feature Learning NIPS 2012 Workshop. Bengio, Y., Louradour, J., Collobert, R. a Weston, J. (2009). Curriculum learning. V Proceedings of the 26th International Conference on Machine Learning (ICML-09), str Bergstra, J., Breuleux, O., Bastien, F., Lamblin, P., Pascanu, R., Desjardins, G., Turian, J., Warde-Farley, D. a Bengio, Y. (2010). Theano: a CPU and GPU math compiler in python. V Proceedings of the 9th Python in Science Conference (SciPy 2010), str Cortes, C. a Vapnik, V. (1995). Support-vector networks. Machine Learning, 20: Elman, J. L. (1993). Learning and development in neural networks: the importance of starting small. Cognition, 48: Fan, R.-E., Chang, K.-W., Hsieh, C.-J., Wang, X.-R. a Lin, C.-J. (2008). LIBLINEAR: A library for large linear classification. Journal of Machine Learning Research, 9: Fisher, R. A. (1936). The use of multiple measurements in taxonomic problems. Annals of Eugenics, 7: LeCun, Y. a Cortes, C. (2010). MNIST handwritten digit database. Rohde, D. L. T. a Plaut, D. C. (1999). Language acquisition in the absence of explicit negative evidence: how important is starting small? Cognition, 72:

102 Kognícia a umelý život 2015, Trenčianske Teplice Modelová složitost neuronových sítí - zdánlivý paradox Věra Kůrková Ústav informatiky, Akademie věd České republiky Pod Vodárenskou věží 2, Praha [email protected] Abstrakt V článku jsou studovány limity schopností umělých neuronových sítí s jednou skrytou vrstvou výpočetních jednotek při řešení vysoce dimenzionálních úloh. Na základě vlastnosti koncentrace míry eukleidovských prostorů vyšších dimenzí je ukázáno, že reprezentace náhodně vybrané funkce na dostatečně velké doméně s velkou pravděpodobností vyžaduje síť s počtem jednotek nebo velikostí vah závisející na vstupní dimenzi sítě exponencionálně. Je zdánlivým paradoxem, že najít konkrétní příklad takové funkce je obtížné. Možným vysvětlením je, že jak reálné úlohy modelované neuronovými sítěmi, tak funkce popsané matematickými formulemi patří do malé množiny funkcí, které mají strukturu, která se dá realizovat neuronovými sítěmi přijatelných velikostí. Situace připomíná známý paradox z teorie kódování Každý kód, který nemůžeme vymyslet, je dobrý. 1 Úvod Ačkoliv biologicky inspirované perceptronové sítě byly původně navrženy jako vícevrstvé architektury, nejrozšířenějším typem sítí se postupně staly sítě s vrstvou vstupů následovanou jednou skrytou vrstvou výpočetních jednotek a jednou výstupní jednotkou. Sítě s jednou skrytou vrstvou byly úspěšně využity v mnoha praktických aplikacích. Teprve v nedávné době došlo k obnovení zájmu o vícevrstvé architektury v podobě tzv. hlubokých sítí (Hinton a spol., 2006; Bengio, 2009). Efektivní učení sítí s několika skrytými vrstvami umožnil rozvoj hardwaru. Algoritmy učení těchto sítí využívají totiž GPU (graphic processing units), které byly vyvinuty pro potřeby počítačových her. Zcela ale chybí teoretická analýza výhod a nevýhod hlubokých sítí a porovnání jejich vlastností s vlastnostmi sítí s jednou skrytou vrstvou (kterým se začalo říkat mělké pro odlišení od hlubokých sítí). Je známo, že mělké sítě s mnoha různými typy výpočetních jednotek dovedou dobře aproximovat spojité funkce na kompaktních množinách (viz např. (Pinkus, 1999)). V praktických aplikacích počítají neuronové sítě funkce na konečných množinách obsahujících pixely zpracovávaných obrázků nebo data, která mají být klasifikována. Všechny funkce na konečných doménách v R d lze přesně reprezentovat mělkými sítěmi s populárními typy jednotek jako jsou perceptrony (Ito, 1992) nebo radiální jednotky (Micchelli, 1986). Výsledky o univerzálních aproximačních a reprezentačních vlastnostech neuronových sítí předpokládají, že počet jednotek sítě je neomezený nebo, v případě konečných domén, je roven jejich velikosti. Modelová složitost sítě měřená počtem jednotek je ovšem limitujícím faktorem pro praktické aplikace. Řada horních odhadů této složitosti byla odvozena pomocí metod teorie nelineární aproximace funkcí (viz např. (Kainen a spol., 2009, 2012; Kůrková, 2012)) a umožnila popis tříd úloh, které lze řešit pomocí sítí s přijatelnou velikostí. Na rozdíl od horních odhadů, které pouze vyžadují nalezení vhodného způsobu aproximace nebo reprezentace dané třídy funkcí mělkými sítěmi s určitým počtem výpočetních jednotek, získání dolních odhadů bývá mnohem obtížnější. Vyžaduje důkazy, že dané typy funkcí nelze žádným způsobem sítěmi omezené velikosti reprezentovat nebo aproximovat. V tomto článku se zabýváme limity schopností mělkých neuronových sítí. Motivací je hledání porozumnění situacím, kdy jsou dvě a více skrytých vrstev výhodnější než jedna. Zkoumáme proto případy, kdy je využití mělkých sítí nevýhodné, protože má přílišné nároky na počet jednotek sítě nebo na velikost jejích parametrů. Zaměřujeme se na dolní odhady počtu jednotek a velikosti parametrů sítí reprezentujících funkce na konečných množinách. Množiny funkcí na konečných doménách lze reprezentovat jako eukleidovské prostory dimenzí rovných velikostem těchto domén. Vzhledem k tomu, že domény funkcí bývají v typických aplikacích neuronových sítí velké, projevují se při zkoumání složitosti sítí reprezentujících funkce na těchto doménách geometrické vlastnosti vysoce dimenzionálních prostorů. Jednou z nich je tzv. vlastnost koncentrace míry, která spočívá v tom, že s rostoucí dimenzí d se dostává většina povrchu d-dimenzionální koule do malé vzdálenosti od rovníku. Tyto geometrické vlastnosti eukleidovských prostorů kombinované s relativně malou velikostí množin funkcí, které lze počítat běžnými výpočetními jednotkami (jako jsou perceptrony nebo jádrové jednotky používané v algoritmu Support Vector Machine), využíváme v tomto článku pro odvození dolních odhadů modelové složitosti mělkých sítí. Dokazujeme, že s rostoucí dimenzí exponencionálně klesá pravděpodobnost, že uniformě odně vybranou funkci lze reprezentovat sítí s počtem jednotek a velikostí výstupních vah závisejících na dimenzi 102

103 polynomiálně. Je zdánlivým paradoxem, že ačkoliv jen relativně malá část množiny všech funkcí na dané konečné doméně se dá reprezentovat sítěmi přijatelné velikosti, sestrojení funkcí, které do této malé množiny nepatří, je obtížné. Situace připomíná teorii kódování, kde název článku Any code of which we cannot think is good (Coffey and Goodman, 1990) vyjadřuje skutečnost, že kódy, které v sobě nemají nějakou pravidelnost, nedokážeme vymyslet. Obdobně je obtížné vymyslet funkce nebo popsat vztahy mezi reálnými daty, které v sobě nemají nějakou strukturu, která se dá dobře modelovat mělkými sítěmi s vhodnými typy jednotek. 2 Slovníky výpočetních jednotek Mělké sítě s lineární výstupní jednotkou počítají funkce vstup-výstup, které patří do množin tvaru { n } span n G := w i g i w i R, g i G, i=1 kde G je množina funkcí, které počítají výpočetní jednotky daného typu (často nazývaná slovník), w i jsou výstupní váhy a n je počet skrytých jednotek, jímž bývá měřena modelová složitost. Typické slovníky výpočetních jednotek jsou parametrické množiny funkcí tvaru G φ (X, U), kde φ : X U R je funkce dvou proměnných, X R d je množina vstupů a U R r je množina parametrů, které jsou optimalizovány během učení. Původní výpočetní jednotky využívané v neuronových sítích jsou perceptrony, které počítají funkce tvaru σ(v. + b) : X R, kde σ : R R je aktivační funkce. Nejčastěji má tvar sigmoidy, tj. je neklesající a lim t σ(t) = 0 a lim t σ(t) = 1. Důležité typy sigmoid jsou Heavisidova funkce ϑ : R {0, 1} ϑ(t) := 0 pro t < 0 a ϑ(t) := 1 pro t 0 a funkce signum sgn : R { 1, 1} sgn(t) := 1 pro t < 0 a sgn(t) := 1 pro t 0. H d (X) značí slovník funkcí na X R d počítatelných Heavisidovými perceptrony, tj. H d (X) := {ϑ(v. + b) : X {0, 1} v R d, b R} a P d (X) slovník funkcí na X počítatelných signum perceptrony, tj. P d (X) := {sgn(v.+b) : X { 1, 1} v R d, b R}. V tomto článku se z technických důvodů zaměřujeme na signum perceptrony, protože všechny funkce z P d (X) mají stejné normy rovné (card X) 1/2. Z hlediska modelové složitosti je jen zanedbatelný rozdíl mezi sítěmi se signum a Heavisideovými perceptrony, protože platí sgn(t) = 2ϑ(t) 1 a ϑ(t) = sgn(t)+1 2. Libovolnou síť s n signum perceptrony lze tedy nahradit sítí s n + 1 Heavisidovými perceptrony. Dalším hojně využívaným typem jednotek jsou jádrové jednotky. Pro jádro K d : X U R značíme F Kd (X, U) slovník jádrových jednotek s parametry v U, tj. F Kd (X, U) := {K d (., u) : X R u U}. Je-li X = U, píšeme F Kd (X). Slovníky tohoto typu využívá algoritmus Support Vector Machine (SVM), který hledá vhodné parametry jednotek v množině U = {u 1,..., u l } vstupních dat. Nejrozšířenejším typem jádra je gaussovské jádro. V tomto článku se zabýváme schopnostmi mělkých sítí reprezentovat funkce na konečných množinách v R d. Pro X R d značíme F(X) := {f f : X R} lineární prostor všech funkcí na X. B(X) značí podmnožinu F(X) tvořenou funkcemi s hodnotami 1 a 1, tj. B(X) := {f : X { 1, 1}}. Je-li X R d konečná množina, potom F(X) je izomorfní s konečně dimenzionálním prostorem R card X. Tento izomorfismus indukuje na F(X) eukleidovský skalární součin a eukleidovskou normu S m 1 r f, g := u X f(u)g(u) f := f, f. značí sféru o poloměru r v R m a S r (X) := {f F(X) f = r} značí sféru o poloměru r v F(X). Abychom odlišili skalární součin na R d od skalárního součinu.,. na F(X), značíme ho d u v := u i v i. i=1 3 Modelová složitost a variace funkcí Užitečným nástrojem pro získávání odhadů závislosti přesnosti aproximace funkcí neuronovými sítěmi na počtu výpočetních jednotek je norma měřící korelaci aproximované funkce s typem výpočetních jednotek. Tuto normu lze také využít pro získání dolních odhadů počtu výpočetních jednotek nebo velikostí výstupních vah sítě. 103

104 Pro omezenou podmnožinu G normovaného lineárního prostoru (X,. X ), G-variace (variace vzhledem k množině G), označovaná. G, je definovaná f G := inf {c R + f/c cl X conv (G G)}, kde G := { g g G}, cl X značí uzávěr vzhledem k topologii indukované normou X a conv značí konvexní obal. Tento pojem zavedl Barron (1992) pro množiny funkcí počítatelných perceptrony a Kůrková (1997) definovala variaci vzhledem k libovolné omezené množině a aplikovala na různé typy výpočetních jednotek. Pomocí této normy byly odvozeny odhady rychlostí klesání aproximačních chyb s rostoucím počtem jednotek mělkých sítí (viz např. (Kůrková, 2003; Kainen a spol., 2012)). Variační norma může být také využita pro studium modelové složitosti sítí reprezentujících funkce na konečných množinách. Z její definice lze snadno odvodit následující tvrzení. Tvrzení 3.1 Nechť G je konečná množina funkcí na X R d, card G = k, potom pro každou { funkci f : X R platí f G = k min i=1 w i f = } k i=1 w i g i, w i R, g i G. Toto tvrzení ukazuje, že pokud má funkce velkou variaci vzhledem ke slovníku výpočetních jednotek G, potom každá reprezentace této funkce mělkou sítí s jednotkami z G musí mít velký počet jednotek nebo musí být velké některé z výstupních vah. Charakterizace funkcí s velkou variací vede tedy k popisu tříd funkcí, jejichž reprezentace vyžaduje velký počet jednotek nebo některou velkou výstupní váhu. Oboje může limitovat možnosti implementace. Je pozoruhodné, že rovněž v teorii složitosti obvodů hrají důležitou roli třídy funkcí definované pomocí podmínek omezujících polynomiálně současně počet jednotek a velikosti vah. Pro popis tříd funkcí s velkou variací využijeme následující větu vycházející z geometrické charakterizace variace (Kůrková, 2012). G značí ortogonální doplněk G. Věta 3.1 Nechť X R d a G je omezená podmnožina prostoru F(X), potom pro všechna f F(X) \ G platí f G f 2 sup g G g, f. Věta 3.1 ukazuje, že funkce, které jsou téměř ortogonální ke všem funkcím z G, mají velkou G-variaci. Složitost sítí s jednotkami ze slovníku G tedy záleží na tom, jak je reprezentovaná funkce korelována s funkcemi z G. 4 Variace funkcí na velkých doménách V této části ukazujeme, že geometrické vlastnosti eukleidovských prostorů vyšších dimenzí vedou k tomu, že množiny funkcí korelovaných s jednotlivými výpočetními jednotkami jsou poměrně malé. To plyne z tzv. vlastnosti koncentrace míry, jejímž speciálním případem je exponencionální pokles velikosti polárních čepiček sfér s rostoucí dimenzí eukleidovských prostorů (viz např. (Ball, 1997)). Pro g Sr m 1 a ε (0, 1) označme C(g, ε) := {h Sr m 1 h o, g o ε}. Potom pro všechna g Sr m 1, ε (0, 1) a µ uniformní pravděpodobnostní míru na Sr m 1 platí µ(c(g, ε)) e mε2 2. (1) Následující věta využívající odhad (1) ukazuje, že pokud slovník výpočetních jednotek na velké doméně je relativně malý vzhledem k velikosti množiny všech funkcí na této doméně, potom s velkou pravděpodobností reprezentace náhodně vybrané funkce vyžaduje mělkou síť s velkým počtem jednotek nebo velkou velikostí vah. Věta 4.1 Nechť X R d, card X = m, G(X) F(X) takový, že card G(X) = k, b, r > 0, a pro všechna g G(X), f = r. Potom (i) pro každou uniformní pravděpodobnostní míru µ na S r (X) platí, µ({f F(X) f G(X) b}) 1 2k e m 2b 2 ; (ii) je-li G(X) B(X), a f je uniformě náhodně vybraná funkce z B(X), potom Pr( f G(X) b) 1 2k e m 2b 2. Obě části Věty 4.1 plynou z Věty 3.1 a z geometrických vlastností eukleidovských prostorů (důkaz viz (Kůrková, 2014; Kůrková and Sanguineti, 2014)). Prostor F(X) je isometrický s prostorem R card X. S rostoucí velikostí domény card X = m, pravděpodobnostní míra množin vektorů korelovaných s výpočetními jednotkami ze slovníku G(X) klesá exponencionálně. Odhady velikostí těchto měr plynou z vlastnosti koncentrace míry (1) a z Chernoffova odhadu (Chernoff, 1952) z teorie pravděpodobnosti. Z Věty 4.1 plyne, že uniformní pravděpodobnostní míra množiny funkcí s variací větší než b je alespoň 1 2 card G(X) e m 2b 2. Například pro b = m 1/4 je tato míra alespoň 1 2 card G(X) e m1/2 2. (2) 104

105 Pro relativně malé slovníky a velké domény X je dolní (2) mez blízko 1. Mezi relativně malé slovníky patří slovníky F Kd (X) tvořené jádrovými jednotkami se středy v trénovacích vstupních datech, které se používají v algoritmu Support Vector Machine (SVM), který vybírá výpočetní jednotky (tzv. support vectors) pouze mezi jednotkami s parametry danými vstupními trénovacími daty. V tomto případě platí card G(X) = k = card X = m. Takže pro slovníky používané v SVM plyne z Věty 4.1, že míra množiny funkcí s variací větší než b je alespoň 1 2m e m 2b 2. Pro b = m 1/4 dostaneme dolní odhad této míry 1 2m e m1/2 2. Je-li doména X d-dimenzionální boolovská krychle X = {0, 1} d, je její velikost m = 2 d a z (2) plyne dolní odhad 1 2 d+1 e 2d/2 1 velikosti množiny funkcí, které mají variaci větší než 2 d/4. Také slovník signum perceptronů P d (X) je relativně malý. Odhad jeho velikosti v závislosti na velikosti m domény X a dimenzi d prostoru R d, v němž jsou body z X umístěny, plyne z odhadů počtu lineárně separovatelných dichotomií, které odvodil již v 19. století švýcarský matematik Schläfli (viz Schläfli (1901)). Modernější výklad jeho výsledků lze nalézt v článku (Cover, 1965). Věta 4.2 Pro každé d a každou podmnožinu X R d velikosti card X = m platí card P d (X) 2 d ( ) m 1 2 md i d!. i=0 Z Věty 4.2 například plyne, že slovník funkcí počítatelných signum perceptrony na d-dimenzionální boolovské krychli {0, 1} d má velikost menší než 2 d2. To znamená, že jen malou část množiny B({0, 1} d ) velikosti 2 2d tvoří funkce počítatelné signum perceptrony. Na základě Vět 4.1 a 4.2 dostaneme následující odhad pravděpodobnostního rozložení funkcí s velkými variacemi vzhledem k signum perceptronům. Důsledek 4.1 Nechť X R d, card X = m, G(X) B(X) takový, že card G(X) = k, b > 0 a f je uniformě náhodně vybraná funkce z B(X), potom Pr ( f Pd (X) b ) 1 4 md d! e m 2b 2. Např. pro doménu velikosti m = 2 d dostaneme na základě Důsledku 4.1 dolní odhad 1 4 2d2 d/2 1 d! e 2 velikosti množiny funkcí, které mají variaci vzhledem k percepronům větší než b = 2 d/4. 5 Konstrukce funkcí s velkou variací vzhledem k perceptronům Výsledky odvozené v předchozí části jsou existencionální. Plyne z nich, že s rostoucí velikostí domény X se zvyšuje pravděpodobnost, že perceptronová síť reprezentující náhodně vybranou binární klasifikační úlohu na X má velký počet jednotek nebo některé z výstupních vah této sítě jsou velké. Přestože má většina funkcí velkou variaci vzhledem k perceptronům, sestrojit konkrétní příklad takové funkce není snadné. V této sekci popíšeme jediný typ konstrukce takových funkcí, který je nám znám. Důležitý příklad z teorie boolovských funkcí je funkce inner product mod 2, která nepatří do třídy LT 2 okruhů hloubky 2 polynomiální velikosti s prahovými jednotkami s polynomiálně omezenými vahami (Roychowdhury a spol., 1994). Tato funkce β d : {0, 1} d {0, 1} je definovaná na boolovských krychlích sudé dimenze {0, 1} d takto: β d := (l(x) r(x)) mod 2, kde l(x), r(x) {0, 1} d/2 jsou definovány l(x) i := x i pro i = 1,..., d 2 a r(x) i := x d 2 +i pro i = 1,..., d 2. Nahrazením oboru hodnot {0, 1} oborem hodnot { 1, 1} dostaneme funkci β d := ( 1) l(x) r(x). Každou funkci f na boolovské krychli {0, 1} d sudé dimenze lze reprezentovat jako 2 d/2 2 d/2 matici M definovanou M u,v = f(u v), kde u, v {0, 1} d/2 a u v značí konkatenaci vectorů u a v. Dá se ukázat, že matice reprezentující funkci β d je tzv. Hadamardova matice, tj. její řádky (ekvivalentně sloupce) jsou navzájem kolmé. Na základě důkazu, že funkce β d není ve třídě LT 2 (Hajnal a spol., 1993), dokázali Kůrková a spol. (1998), že variace vzhledem k perceptronům každé boolovské funkce, kterou lze reprezentovat jako Hadamardovu matici, závisí na d exponencionálně. Tento výsledek lze rozšířit na funkce na doménách X R d tvaru X = Y Z, kde card Y = card Z = n, definované pomocí n n Hadamardových matic M jako f(x, y) = M x,y. Variace vzhledem k perceptronům těchto funkcí je omezená zdola m log 2 m, kde m = n n (Kůrková, 2015). 105

106 Poděkování Tato práce vznikla za podpory grantu MŠMT COST LD1302 a institucionální podpory Ústavu informatiky AVČR RVO Literatura Ball, K. (1997). An elementary introduction to modern convex geometry. Levy, S. (ed.), In Flavors of Geometry, pp Cambridge University Press. Barron, A. R. (1992). Neural net approximation. Narendra, K. S. (ed.), In Proc. 7th Yale Workshop on Adaptive and Learning Systems, pp Yale University Press. Bengio, Y. (2009). Learning deep architectures for AI. Foundations and Trends in Machine Learning, 2: Chernoff, H. (1952). A measure of asymptotic efficiency for tests of a hypothesis based on the sum of observations. The Annals of Mathematical Statistics, 23: Coffey, J. T. a Goodman, R. M. (1990). Any code of which we cannot think is good. IEEE Transactions on Information Theory, 36: Cover, T. (1965). Geometrical and statistical properties of systems of linear inequalities with applictions in pattern recognition. IEEE Transactions on Electronic Computers, 14: Hajnal, A., Maass, W., Pudlák, P., Szegedy, M. and Turán, G. (1993). Threshold circuits of bounded depth. Journal of Computer and System Sciences, 46: Hinton, G. E., Osindero, S. and Teh, Y. W. (2006). A fast learning algorithm for deep belief nets. Neural Computation, 18: Ito, Y. (1992). Finite mapping by neural networks and truth functions. Mathematical Scientist, 17: Kainen, P. C., Kůrková, V. and Sanguineti, M. (2009). Complexity of Gaussian radial-basis networks approximating smooth functions. Journal of Complexity, 25: Kainen, P. C., Kůrková, V. and Sanguineti, M. (2012). Dependence of computational models on input dimension: Tractability of approximation and optimization tasks. IEEE Transactions on Information Theory, 58: Control and Signal Processing. The Curse of Dimensionality, pp Birkhäuser, Boston, MA. Kůrková, V. (2003). High-dimensional approximation and optimization by neural networks. Suykens, J. (ed.), In Advances in Learning Theory: Methods, Models, and Application, vol. 190 NATO Science Series III: Computer & Systems Sciences, pp IOS Press, Amsterdam. Kůrková, V. (2012). Complexity estimates based on integral transforms induced by computational units. Neural Networks, 33: Kůrková, V. (2014). Representations of highly-varying functions by one-hidden-layer networks. Rutkowski, L. (ed.), In Proceedings of ICAISC 2014, vol LNAI, pp. I Springer. Kůrková, V. (2015). Complexity of shallow networks representing finite mappings. Rutkowski, L. (ed.), In Proceedings of ICAISC 2015, LNAI, Springer (to appear). Kůrková, V. a Sanguineti, M. (2014). Complexity of shallow networks representing functions with large variations. Wermter, S., Weber, C., Duch, W., Honkela, T., Koprinkova-Hristova, P., Magg, S., Palm, G. and Villa, A. (ed.), In Artificial Neural Networks and Machine Learning, Proceedings of ICANN 2014, vol LNCS, pp Springer. Kůrková, V., Savický, P. and Hlaváčková, K. (1998). Representations and rates of approximation of real-valued Boolean functions by neural networks. Neural Networks, 11: Micchelli, C. A. (1986). Interpolation of scattered data: Distance matrices and conditionally positive definite functions. Constructive Approximation, 2: Pinkus, A. (1999). Approximation theory of the MLP model in neural networks. Acta Numerica, 8: Roychowdhury, V., Siu, K.-Y. and Orlitsky, A. (1994). Neural models and spectral methods. Roychowdhury, V., Siu, K. and Orlitsky, A. (ed.), In Theoretical Advances in Neural Computation and Learning, pp Springer, New York. Schläfli, L. (1901). Theorie der vielfachen Kontinuität. Zürcher & Furrer, Zürich. Kůrková, V. (1997). Dimension-independent rates of approximation by neural networks. Warwick, K. and Kárný, M. (ed.), In Computer-Intensive Methods in 106

107 Kognícia a umelý život 2015, Trenčianske Teplice Pohľad umelej inteligencie a kognitívnej vedy na kolektívnu pamäť Vladimír Kvasnička Ústav aplikovanej informatiky, Fakulta informatiky a informačných technológií, Slovenská technická univerzita, Bratislava, [email protected]. Abstrakt Práca sa zaoberá pohľadom umelej inteligencie a kognitívnej vedy na Halbwachsovu koncepciu kolektívnej pamäti v sociálnych vedách, ktorá v súčasnosti patrí medzí často používaný prístup k interpretácii sociálnych javov a procesov. Ako určitý odraz tejto skutočnosti je, že koncepcia kolektívnej pamäti sa stala v priebehu ostatných rokov centrom pozornosti aj v umelej inteligencii ako efektívny prostriedok pre akceleráciu adaptívnych a evolučných procesov v multiagentových systémoch, ktorý umožňuje využitie histórie adaptívneho procesu k návrhu aktuálneho riešenia. Použitím pojmového aparátu teórie multiagentových systémov sme schopní pristúpiť k štúdiu koncepcie kolektívnej pamäti v sociálnych vedách ako k fenoménu, ktorý emerguje v danom sociálnom systéme ako nová vlastnosť, ktorá je tvorená vznikom špeciálnej kultúrnej informácie, ktorá umožňuje prekonávať medzigeneračné poznatkové bariéry a ktorá je vhodným prostriedkom k predikcii budúcich stavov systému na základe jeho histórie. 1 Úvodné poznámky o umelej inteligencii a kognitívne vede a ich vzájomnému vzťahu Hlavným cieľom tohto článku je oboznámiť čitateľov pôsobiacich v humanitných a sociálnych vedách s novým nekonvenčným informatickým prístupom, ktorý bude použitý na netradičnú interpretáciu koncepcie kolektívnej pamäti, ktorá sa v súčasnosti často využíva v sociálnych a humanitných vedách ako efektívna metafora k vysvetleniu kohézivity sociálnych skupín. Tento informatický pohľad je založený na dvoch moderných vedných disciplínach: umelej inteligencii, ktorá patrí do informatiky, a multidisciplinárnej kognitívnej vedy, ktorá študuje všeobecné zákonitosti ľudskej kognície. K špecifikácii obsahu týchto moderných vedných oblastí a ich vzájomnému vzťahu musím urobiť krátku exkurziu do ich histórie. Umelá inteligencia patrí do oblasti informatických vied (môžeme povedať, že je integrálnou súčasťou informatiky), vznikla v r. 1956, keď na pôde Darmouthskeho kolégia (Darmouth College v USA) informatik John McCarthy (tvorca programovacieho jazyku LISP, ktorý práve nedávno zomrel v októbri 2011, ako 84 ročný) organizoval letnú školu, na ktorú pozval M. Minskeho, C. Shannona, A. Samuela, známu dvojicu vtedy ešte neinformatikov A. Newella a H. Simona, a ďalších odborníkov, ktorí sa zaoberali riešením komplikovaných problémov vyžadujúcich ľudskú inteligenciu. Pri návrhu grantu na podporu tejto akcie McCarthy použil termín umelá inteligencia a špecifikoval ju ako tú oblasť informatiky, ktorá sa zaoberá riešením zložitých problémov (hra šachu alebo dámy, riešenie zložitých problémov, porozumeniu ľudskej reči, a pod.). Minsky prednášal o svojom výskume v neurónových sieťach, Shannon prezentoval svoje výsledky o teórii logických obvodov založenej na Boolovej algebre, Samuel prednášal o programe, ktorý napísal na jednom z prvých komerčne predávaných počítačov IBM 701 a ktorý bol schopný hrať dámu na veľmajstrovskej úrovni. Newel a Simon prednášali o počítačovom programe Logic Theorist, ktorý bol schopný dokázať všetky tautológie (zákony) výrokovej logiky z Whiteheadovej a Russellovej monumentálnej Principia Mathematica. V súčasnosti je umelá inteligencia už dobre etablovanou informatickou disciplínou, u nás na Slovensku sa dokonca dá študovať umelá inteligencia ako samostatný odbor inžinierskeho a doktorandského štúdia na košickej technike. História kognitívnej vedy nie je taká priamočiara ako história umelej inteligencie (Friedenberg, Silverman, 2006). Jej vznik sa datuje približne do rovnakého obdobia, ako vznik umelej inteligencie, keď sa stalo evidentným (30. a 40. roky minulého storočia), že kognitívne procesy môžu byť študované nielen psychologickými metódami, ale ich plné a vyčerpávajúce pochopenie vyžaduje využitie aj iných vedných oblastí. Jedná sa o interdisciplinárnu vednú oblasť (kde sa obvykle uvádzajú tieto participujúce disciplíny: umelá inteligencia, neuroveda, psychológia, lingvistika, a filozofia), ktorá študuje myseľ a jej procesy. Zahŕňa výskum informačných procesov akými sú vnímanie, jazyk, pamäť, usudzovanie, riešenie problémov, a pod. Skúmanie týchto procesov v kognitívnej vede vychádza z neurovedného základu, pre ktorý je ľudský mozog obrovská neurónová sieť obsahujúca niekoľko miliárd nervových buniek neurónov, ktoré sú medzi sebou poprepájané synapsiami (nervovými spojmi, ktoré sú schopné jednosmerne prenášať binárne signály pomocou elektrochemických procesov). Mozog môžeme interpretovať ako mohutný paralelný počítač realizovaný neurónovou sieťou, ktorý transformuje vstupnú informáciu na výstupnú informáciu, 107

108 pričom táto transformácia je ovplyvňovaná vnútorným stavom (pozri obr. 1). α A σ β α α 1 α 2 β 2 α a vstupné neuróny σ 1 σ 2 σ 3 σ 3 skryté neuróny B výstupné neuróny β 1 β b β Zmienená publikácia McCullocha a Pittsa (1943) je považovaná historikmi vedy za jeden z počiatkov nielen umelej inteligencie ale aj kognitívnej vedy, v tejto práci bola vytvorená koncepcia neurónovej siete, ktorá sa neskoršie ukázala ako mimoriadne vhodný prostriedok na štúdium centrálneho problému kognitívnej vedy - štúdium vlastností mysle v celej jej šírke a hĺbke. x 1 x 2 x 3 w 1 w 2 w 3... w n ϑ 1 ( w1 x wn xn ϑ) y = 0 ( w1 x wn xn < ϑ) C 8 I * symboly neuróny z najvyšej vrstvy siete x n C Obrázok 1. Diagram A znázorňuje kybernetickú interpretáciu mozgu zavedenú N. Wienerom v polovici 40 rokov minulého storočia. Mozog je interpretovaný ako systém - čierna skrínka ktorá transformuje vstup α (signály perceptívnych neurónov) na výstup b (signály motorických neurónov), pričom transformácia závisí na vnútornom stave systému - mozgu; formálne môžeme túto skutočnosť vyjadriť formulou α, kde funkcia F je určená vnútornou štruktúrou systému. To σ znamená, že pre dva rôzne vnútorné stavy, 1 σ2 α odozva na rovnaký vstup α môže byť rôzna, 1 α 2. Diagram B je reprezentáciou predchádzajúcej schémy pomocou neurónovej siete, ktorá je zložená z jednoduchých výpočtových zariadení nazývaných neuróny, vnútorný stav neurónovej siete je určený aktivitami vnútorných neurónov. Štruktúra (tiež sa používa termín topológia) tejto neurónovej siete jednoznačne špecifikuje funkciu F, ktorá u Wienera bola formulovaná pomocou fenomenologického modelu systému. Diagram C špecifikuje elementárne výpočtové zariadenie - neurón, ktorý obsahuje n vstupných spojov dendritických synapsií, ktoré majú binárne (t. j. 0 alebo 1) aktivity x1, x2,..., xn, pričom každý spoj je ohodnotený váhovým koeficientom wi, ak je tento koeficient wi = 1 (tzv. excitačný spoj) alebo wi = -1 (tzv. inhibičný spoj), neurón je špecifikovaný prahovým koeficientom ϑ. Aktivita y výstupného spoja axóna sa rovná 1, ak vážená suma vstupných aktivít je väčšia alebo rovná prahovému koeficientu ϑ, v opačnom prípade je nulová. Tento informatický model mozgu bol prvý krát teoreticky študovaný v r W. McCullochom a W. Pittsom (1943) pri návrhu konštrukcie neurónovej siete s jednoduchými prahovými neurónmi (pozri diagram C, obr. 1). Takto zostrojená neurónová sieť mala zaujimavú a objavnú vlastnosť, je univerzálnym výpočtovým zariadením v doméne boolových funkcií. Poznamenajme, že popis práce neurónu na princípe všetko alebo nič pochádza s prelomu rokov minulého storočia keď anglický elektrofyziológ a lekár Sir Adrian sledoval výstupnú aktivitu neurónu pomocou, na tú dobu, veľmi moderného elektronického vybavenia, svoje experimentálne výsledky formuloval pomocou pravidla všetko alebo nič (angl. all or nothing ), ktoré je znázornené aj na diagrame C, obr. 1. neurónová sieť Obrázok 2. Smolenského (1987) idea hierarchicky usporiadanej neurónovej siete, kde neuróny z najvyššej vrstvy reprezentujú symboly. Podľa jednej zo základných paradigiem modernej kognitívnej vedy (Friedenberg, Silverman, 2006) je predstava, že ľudský mozog je počítač, ktorý pracuje podľa týchto princípov (ktoré tvoria základ tzv. symbolickej paradigmy kognitívnej vedy, Smolensky, 1987), pozri obr. 2: transformuje symboly pomocou syntaktických pravidiel na iné symboly, pričom myšlienky sú symbolické reprezentácie implementované pomocou jazyka myslenia, a mentálne procesy sú kauzálne sekvencie symbolov generované syntaktickými pravidlami. Použitie termínu počítač obvykle evokuje predstavu sekvenčného počítača von neumannovskej architektúry (napr. personálne počítače majú túto architektúru), kde je možné striktne oddeliť hardware od software; kde na tom istom počítači hardware môže byť vykonávaných nepreberné množstvo rozdielnych programov softwarov. Pre tieto počítače existuje striktná dichotómia medzi počítačom a programom t. j. medzi hardwarom a softwarom. Žiaľ, paradigma mysle ako počítača implikuje u mnohých ľudí predstavu, že je možné oddeliť mozog od mysle, ako dva nezávislé fenomény, kde mozog hrá úlohu hardwaru, zatiaľ čo myseľ je software (vykonávaný na hardwaru mozgu). Obráťme našu pozornosť na moderný neurovedný prístup k chápaniu vzťahu medzi mozgom a mysľou (Friedenberg a spol., 2006; Gáliková, 2009a, 2009b), ktorý je založený na neurovednom (hovoríme tiež o konekcionistickom) poňatí tak mozgu, ako aj mysle. Základná predstava o mozgu (založená na experimentálnych neurovedných poznatkoch) je, že je tvorený z neurónov navzájom poprepájaných pomocou jednosmerných synaptických spojov. Ľudský mozog vykazuje neobyčajnú plasticitu (pozri diagram B, obr. 1) (Kvasnička a spol., 1997; Rojas, 1996), v priebehu učenia neustále vznikajú (ale taktiež aj zanikajú) synaptické spoje. Architektúra mozgu je určená spojmi 108

109 - konexiami medzi neurónmi, ich inhibičným alebo excitačným charakterom. Možno konštatovať, že schopnosť mozgu vykonávať nielen kognitívne aktivity, ale byť aj pamäťou, je plne zakódovaná do jeho architektúry. Na základe týchto neurovedných poznatkov bazálneho charakteru môžeme konštatovať, že počítačová paradigma ľudského mozgu sa musí formulovať tak, že mozog je paralelne distribuovaný počítač (obsahujúci mnoho miliárd neurónov, elementárnych procesorov, ktoré sú medzi sebou poprepájané do zložitej neurónovej siete). Program v tomto paralelnom počítači je priamo zabudovaný do architektúry neurónovej siete, t. j. ľudský mozog je jednoúčelový paralelný počítač reprezentovaný neurónovou sieťou, ktorý nie je možné preprogramovať bez zmeny jeho architektúry. Z týchto všeobecných úvah vyplýva, že myseľ s mozgom tvoria jeden integrálny celok; myseľ je v tomto prístupe možné chápať ako program vykonávaný mozgom, avšak tento program je špecifikovaný architektúrou distribuovanej neurónovej siete reprezentujúcej mozog. Mozog a myseľ tvoria dva rôzne pohľady na ten istý objektu: Keď hovoríme o mozgu, myslíme tým hardwarovú štruktúru, biologicky realizovanú neurónmi a ich synaptickými spojmi (formálne reprezentovanú neurónovou sieťou), v opačnom prípade, keď hovoríme o mysli, myslíme tým kognitívne a iné aktivity mozgu, realizované výpočtami neurónovej siete reprezentujúcej mozog. Na záver tejto úvodnej kapitoly uvedieme niekoľko poznámok o vzťahu medzi umelou inteligenciou a kognitívnou vedou. Už priamo z definície kognitívnej vedy ako interdisciplinárneho pohľadu na myseľ vyplýva, že umelá inteligencia spolu s neurovedou tvoria dôležité súčasti tohto pohľadu. Umelá inteligencia už viac ako polstoročie sa intenzívne zaoberá rôznymi problémami ľudskej mysle, pričom intenzívne využíva inšpirácie z neurovedy a kognitívnej vedy. Tak napríklad, technika neurónových sietí je v súčasnosti integrálnou časťou umelej inteligencie, kde spolu s evolučnými algoritmami a fuzzy logikou tvorí teoretický základ tzv. výpočtovej inteligencie, ktorá v súčasnosti slávi veľké úspechy pri riešení inžinierskych problémov riadenia zložitých systémov. Môžeme konštatovať, že v súčasnosti je vzťah medzi umelou inteligenciou a kognitívnou vedou veľmi úzky, skutočnosť, že sa medzi nimi rozlišuje ma väčšinou buď historické a/alebo personálne dôvody. Tento úzky vzťah medzi umelou inteligenciou a kognitívnou vedou je markantne viditeľný napr. v humanoidnej robotike, kde dochádza k veľkému prekryvu medzi umelou inteligenciou a kognitívnou vedou a kde sa diskutujú filozoficko-etické problémy robotov podobných človeku nielen svojim výzorom ale hlavne ich kognitívnymi schopnosťami. Tieto problémy boli donedávna hlavne doménou humanitne orientovaných odborníkov, ale v súčasnosti sa stali súčasťou každodennej výskumne práci inžinierskych pracovníkov. Katedra aplikovanej informatiky na FMFI UK v Bratislave zabezpečuje magisterskú výučbu kognitívnej vedy, a taktiež, na FIIT STU v Bratislave a FEI TU v Košiciach sa existujú prednášky a semináre z kognitívnej vedy v rámci inžinierskeho a doktorandského štúdia. 2 Kolektívna pamäť Kolektívna pamäť, tak ako bola prvý krát zavedená M. Halbwachsom (1992) a taktiež ako je aj interpretovaná v sociálnych vedách (menovite v sociológii) (Assmann, 2008; Manier et al., 2008;), sa chápe ako špeciálny a unikátny typ pamäti, ktorý sa líši od obvyklých kognitívno-neurovedných typov pamätí (Roediger III et al., 2007; Rojas, 1996). Pod kolektívnou pamäťou rozumieme takú pamäť, ktorá tvorí distribuovaný systém jednotlivých mozgov myslí pamätí patriacich do relevantnej sociálnej skupiny a ktorá je (pamäť) súčasťou jej aktuálnej kultúry (Assmann, 2008). Aj napriek tomu, že podstatné časti kolektívnej pamäti sú umiestnené v jednotlivých mozgoch, jej vznik a pretrvávanie sa považuje za emergentnú kolektívnu vlastnosť danej sociálnej skupiny, ktorá zvyšuje jej kohezivitu. Patrí medzi základné atribúty sociálnej skupiny, ktoré ju špecifikujú a ktoré sú prenášané negenetickými (kultúrnymi) metódami v priebehu života jednotlivých indivíduí skupiny. Z toho pohľadu má koncepcia kolektívnej pamäti mnoho spoločného s memetickým prístupom evolučného biológa R. Dawkinsa (Dawkins, 1976; Blackmore, 1999) tak, ako je v súčasnosti chápaný (Kvasnička a spol., 2003). Pomocou webovských prehliadačov ľahko zistíme, že na Internete má výskyt pojmu "kolektívna pamäť" dve maxima, jedno maximum je v sociálnych vedách a druhé maximum je v umelej inteligencii. Môže nás toto zistenie prekvapiť, že v tak disjunktných vedných oblastiach existuje spoločný odborný termín s veľmi vysokou frekvenciou používania? Reflexívnym vysvetlením tejto skutočnosti môže byť názor, že sa jedná o dve úplne odlišné veci, ktoré spolu nesúvisia (až na ich verbálnu podobnosť). Avšak je potrebné na tomto mieste zdôrazniť, že moderná umelá intligencia, hlavne zásluhou jej časti tvorenou teóriou multiagentových systémov, sa stala schopnou vykonávať teoretické štúdie a počítačové simulácie rôznych javov a procesov prebiehajúcich v sociálnych systémoch a ktoré súvisia s koncepciou kolektívnej pamäti. Z tohto pohľadu sa teda nejedná o náhodu, že sa rovnaký pojem vyskytuje dvoch diametrálne odlišných vedných oblastiach, v informatike a v sociálnych vedách. Súčasne možnosti prieniku prístupov umelej inteligencie do sociálnych vied sú však nepomerne väčšie než tie, aké boli pred rokmi, keď prebiehal známy (žiaľ, nie moc uspešný) experiment s použitím synergetickej fyzikálnej terminológie v sociálnych vedách (Krempaský, 1988; Schenk, 1993). 109

110 Moderný informatický odbor umelá inteligencia vypracoval teoretický aparát, ktorý je mimoriadne vhodný (a k tomu bol vlastne zostrojený) k štúdiu vzniku (hovoríme emergencie) sociálnych štruktúr v systémoch, ktoré obsahujú veľké množstvo podobných elementov indivíduí - agentov, ktoré sa správajú "racionálne" na základe určitých pravidiel, ktoré sú im imanentne vlastné - môžeme povedať, že predpísané. Tento prístup, ktorý sa nazýva "multiagentový systém" (Wooldridge, 2000; Wooldridge, 2002), v súčasnosti patrí medzi búrlivo sa rozvíjajúce oblasti umelej inteligencie, s množstvom efektívnych aplikácii v rôznych oblastiach nielen informatiky ale aj mimo nej. Možno konštatovať, že multiagentový prístup zmenil paradigmu výskumu systémov, ktoré obsahujú množstvo podobných elementov agentov a ktoré medzi sebou interagujú na základe jednoduchých pravidiel typu "ak..., potom...". Tieto štúdie multiagentových systémov patria do triedy počítačových simulácií, kde priebeh "adaptívneho" procesu sa dá dobre sledovať pomocou rôznych parametrov a počítačovej grafiky. Na Slovensku sa zaoberá aplikáciami multiagentových systémov v sociálnych vedách sociológ prof. Juraj Schenk (Schenk, 2011). Koncom minulého storočia bolo publikovaných mnoho prác z multiagentových systémov, ktoré sa zaoberali štúdiom emergencie kooperácie, komunikácie, sociálnych štruktúr a pod. v týchto systémoch. Menovite zásluhou amerického politológa R. Axelroda (Axelrod, 1984) bolo ukázané, že sa jedná o neobyčajné plodný smer rozvíjania interdisciplinárnej spolupráce medzi politológiou a umelou inteligenciou, kde kooperácia medzi antagonistickými - sebeckými agentmi vzniká ako výsledok racionálnych dôvodov jej výhodnosti. To znamená, že rôzne ideologické špekulatívne dôvody vzájomnej výhodnosti alebo nevýhodnosti spolupráce sú nahradené racionálnou argumentáciou založenej na multiagentovom prístupe. V ďalšej etape histórie multiagentových systémov (90. roky minulého storočia) bola jednoduchá forma intencionálnych agentov, ktorí vykonávajú reflexívne úzko špecifikované aktivity zovšeobecnená na sofistikovanejších agentov majúcich už individuálnu myseľ reprezentovanú informačnou databázou zloženou z užitočných poznatkov, pomocou ktorej sa agenti samostatne nereflexívne rozhodujú či vykonajú alebo nevykonajú nejakú aktivitu. Toto významné zovšeobecnenie multiagentového prístupu môže byť chápané, ako určitá špecifická verzia použitia memetického princípu, ktorý do evolučnej biológie už pred viac ako 30 rokmi zaviedol R. Dawkins v jeho slávnej knihe The Selfish Gene (Dawkins, 1976) (pozri tiež Blackmore, 1999), kde prezentoval svoje predstavy o radikálnom neodarwinizme. Dawkins v tejto knihe (v 7. kapitole) rozšíril pojem génu (alebo genotypu) o ďalšiu zložku, ktorá obsahuje informáciu, ktorá mení fitnes daného agenta (napr. informácie o prostredí, jeho regularitách alebo irregularitách, a pod). V tomto prístupe je evolučný princíp nahradený koevolučným, kde prebieha koevolúcia genotypu a memetypu, dochádza k spoločnej adaptácii oboch zložiek tohto rozšíreného 2-zložkového genotypu. Táto evolučná zmena memetypu je považovaná v memetike za príklad evolučného vzniku kultúry. Poznamenajme, že prvé snahy rozšíriť vlastnosti multiagentových systémov o individuálnu pamäť reprezentovanú databázou poznatkov, ktoré pomáhajú prežiť agentom v populácii (čiže ovplyvňuje ich fitnes), boli urobené (Kvasnička, 2003) autorom tejto state pred 10 rokmi pre aplikáciu multiagentového prístupu k formulácii memetiky. A C Obrázok 3. Rôzne reprezentácie agentov. (A) Hypotetický agent, ktorý obsahuje percepčný orgán (vidí), výstupy z tohto orgánu vstupujú do kognitívneho orgánu mozgu, motorické výstupy z tohto mozgu riadia pohybové orgány agenta. (B) Mechanicko-elektronický agent šváb, ktorý sa dokáže v prostredí pohybovať pomocou 6 nôh a optickým zariadením (zrakom) vníma okolie. Pohyb agenta je riadený malou neurónovou sieťou. (C) Japonská robotická hračka pes Aibo, dokáže sa pohybovať, vníma svoje okolie, vníma hlasové povely, atď. Cieľom tejto práce je diskutovať koncepciu kolektívnej pamäti v rámci multiagentového prístupu (Wooldridge, 2000, 2002), poukázať na skutočnosť, že tento prístup k existencii pamäti v multiagentových systémoch je veľmi blízky ku koncepcii kolektívnej pamäti tak, ako sa používa v sociálnych vedách, pričom jeho hlavný význam spočíva v tom, že akceleruje procesy adaptácie v multiagentovom systému (Kvasnička, Pospíchal, 2014). Verím, že multiagentový prístup k štúdiu tak individuálnej ako aj kolektívnej pamäti poskytuje efektívny a jednoduchý interdisciplinárny formalizmus, ktorý sa pomerne ľahko dá aplikovať v sociálnych vedách. B 110

111 3 Agenti s mysľou V predchádzajúcej časti tejto práce boli špecifikovaní najjednoduchší agenti, ktorých inteligencia bola ohraničená len na vykonávanie predpísaných reflexívnych aktivít spolupracovať alebo nespolupracovať s nejakým iným agentom, vyhýbať sa prekážkam alebo zbierať potravu v blízkom okolí, a pod. V tejto kapitole popíšeme vlastnosti agentov, ktorý už majú elementárnu myseľ, ktorá je tvorená (1) pamäťou (reprezentovanou množinou poznatkov, nazývanou v matematickej logike teória) a (2) inferenčným aparátom, pomocou ktorého je schopný agent vykonávať nad teóriou rozšírenou pozorovaním o nové poznatky jednoduché usudzovanie. 3.1 Symbolická špecifikácia mysle agenta K špecifikácii mysle použijeme jednoduchý symbolický prístup založený na elementárnej prvorádovej logike (Kvasnička, Pospíchal, 2006). Postulujme, že v multiagentovom systéme A = A,A,...,A každý agent A A obsahuje teóriu { 1 2 n} - množinu poznatkov T {,,...} A = ϕ1 ϕ 2 (kde ϕ1, ϕ 2,... sú formule prvorádovej logiky, ktoré reprezentujú poznatky agenta) a inferenčný aparát reprezentovaný reláciou logického vyplývania. Inferenčný aparát môže byť reprezentovaný elementárnymi zákonmi r1, r2, r3,... prirodzenej dedukcie (Kvasnička, Pospíchal, 2006), tak napr. obsahuje pravidlá modus ponens a modus tollens, hypotetický sylogizmus, konkretizácia univerzálneho kvantifikátora a pod. p q p q p q p q q r ( x) P( x) A = { r 1,r 2,r 3,... } =,,,... q p p r P( t) r1 r2 r3 r4 (1) Použitím tohto inferenčného aparátu je agent schopný = ψ, ψ,..., dedukovať na základe pozorovania { } A 1 2 kde ψ1, ψ2,... sú poznatky tohto pozorovania, nový poznatok χ TA A χ (2) Formálne, myseľ agenta A je špecifikovaná M = T,, t. j. myseľ je usporiadanou dvojicou ( ) A A A špecifikovaná pamäťou tvorenou množinou poznatkov TA a inferenčnou reláciou A. Môžeme povedať, že teória tvorená poznatkami reprezentuje individuálnu pamäť agenta a inferenčná relácia reprezentuje mozog, ktorý je schopný usudzovať. 3.2 Revízia poznatkov Problém revízie poznatkov má vo filozofii a v logike dlhú tradíciu. Stal sa integrálnou súčasťou mnohých traktátov a monografií z filozofie poznania (epistemológie) a logiky od staroveku až po súčasnosť, ktoré obsahovali rozsiahle kapitoly, kde väčšinou na fenomenologicko-špekulatívnej úrovni sa formulovali zásady nášho myslenia, argumentácie a zmeny poznatkov vyplývajúcich zo zmien východiskových predpokladov, ich rozšírenia alebo čiastočnej falzifikácie. Táto zaujímavá problematika sa stala súčasťou aplikovanej matematickej logiky až koncom minulého storočia, kedy jej formálny aparát bol použitý na formuláciu teórie revízie poznatkov. Taktiež, problém revízie poznatkov sa stal v súčasnosti integrálnou časťou informatiky a umelej inteligencie a tým musel prejsť z roviny všeobecno špekulatívnej k rovine formálno exaktnej, ktorá môže slúžiť ako základ algoritmizácie problematiky revízie poznatkov na počítačoch. Tak napríklad, ak chceme špecifikovať základné epistemické princípy vývinu vedy, dynamiku jej vývoja v čase, tento cieľ môže byť realizovaný na abstraktnej úrovni tak, že študujeme danú konzistentnú databázu poznatkov. Táto databáza je v čase postupne modifikovaná elementárnymi operáciami, akými sú dodanie nového poznatku a odstránenie pôvodného poznatku. V obidvoch prípadoch tieto operácie zmeny môžu ovplyvňovať ostatné poznatky, preto sa vykonáva ich revízia, aby sa odstránili prípadné nekonzistentosti. V počiatočnom období vzniku teórie revízie poznatkov (80. roky minulého storočia) základné idey boli formulované švédskym kognitívnym vedcom Petrom Gärdenforsom (1992) a dvojicou amerických logikov Carlosom Alchourrrónom a Davidom Makinsomom, ktorí spoločne v r publikovali v Journal of Symbolic Logic významnú prácu (Alchourròn, Gärdenfors, Makinson, 1985) (ktorá sa v odbornej literatúre označuje akronymom AGM počiatočných písmen ich priezvisk v abecednom poriadku jej autorov), v ktorej formulovali základné princípy, koncepcie a konštrukcie teórie revízie poznatkov. Poznamenajme, že myseľ MA nie je konštantnou nemennou v priebehu existencie agenta A, ale môže sa meniť prostredníctvom procesu revízie, kde sa buď pridáva alebo uberá nejaký poznatok tak, aby výsledná pamäť bola konzistentná. Budeme rozlišovať tieto štyri spôsoby revízie databázy poznatkov T: (1) Expanzia, nové poznatky, reprezentované formulami z konzistentnej množiny T ɶ sú dodané do pôvodnej konzistentnej teórie T, za vzniku novej konzistentnej teórie T ' = T T %, čo indukuje rozšírenie jej logických dôsledkov o nové poznatky, ktoré sú logickým dôsledkom rozšírenej teórie Φ. Databáza poznatkov priradená rozšírenej teórii Φ je označená T + = T T% (3) ( ) T% def 111

112 (2) Kontrakcia, minimálna podmnožina Τ je odstránená z nekonzistentnej teórie T za vzniku maximálnej konzistentnej podmnožiny teórie T = T. Databáza poznatkov priradená zúženej teórii T je označená ( ) T = T (4) def (3) Revízia je kombináciou predchádzajúcich dvoch operácii expanzie a kontrakcie, pôvodne konzistentná teória T je expanziou rozšírená o nové poznatky z T ɶ, čím sa stane nekonzistentnou, z takto rozšírenej teórie je pomocou kontrakcie je odstránená podmnožina T T %, výsledkom tohto procesu je konzistentná T = T T%. Pôvodná databáza T priradená teória ( ) modifikovanej rozšíreno zúženej teórii T je označená +, T = T, def T T% % (5) ( ) ( ) (4) Spájanie poznatkov T 1,T 2,...T n do jedného spoločného poznatku prebieha tak, že všetky prijaté poznatky spojíme do jednej množiny T1 T 2... Tn, v prípade jej nekonzistentnosti hľadáme takú minimálnu množinu poznatkov, ktotú keď odstránime zo zjednotenej množiny, potom výsledná množina (teória) je konzistentná. merge T,T,...T = T T... T (6) ( ) ( ) 1 2 n def 1 2 n Pre ilustráciu tohto prístupe, predstavme si multiagentový systém, kde úlohou každého agenta prieskumníka je zbierať poznatky o danom prostredí (napr. ako sú rozložené prekážky, potrava a ostatní agenti). Po určitom čase agent sa vráti do centrály a odovzdá svoje poznatky agentovi - integrátorovi, ktorý má na starosti spájanie poznatkov získaných od rôznych agentov prieskumníkov do jednej databázy poznatkov o danom prostredí. Môže sa stať, že poznatky získané dvoma rôznymi agentmi sú navzájom kontroverzné, t. j. agent integrátor stojí pred neľahkou úlohou rozhodnúť sa, ktoré poznatky budú/nebudú použité pri vytváraní spojenej databázy poznatkov. Problém spájania poznatkov do jednotného väčšieho celku spojenej databázy poznatkov patrí v umelej inteligencii medzi základné problémy distribuovanej inteligencie (napr. multiagentových systémov). Tento problém môžeme byť v rámci výrokovej (alebo aj predikátovej) logiky jednoducho formalizovaný, pričom na sémantickej úrovni môžeme špecifikovať mimologické prostriedky ako riešiť nekonzistentnosti vyskytujúce sa pri spájaní nových poznatkov. individálna pamäť učenie 1. stupeň A učenie 3. stupeň T coll učenie individálna pamäť 2. stupeň B učenie kolektívna pamäť... T, kognitívny orgán T, individálna T, individálna T, pamäť pamäť C Obrázok 4. Diagramatická ilustrácia troch stupňov zložitosti agentov (myseľ je na diagramoch reprezentovaná databázou poznatkov T a inferenčnou reláciou vyplývania ). (A) Diagram znázorňuje prvý stupeň agenta, ktorý má jednoduchú neurónovú sieť, ktorá nie je pamäťou. Aktivity v multiagentovom systéme sú plne špecifikovaná jeho neurónovou sieťou, ktorá je plne špecifikovaná jeho genotypom, t. j. inštinkty sú plne reflexívneho charakteru, fitnes agenta je plne určené len zložením genotype. Prebiehajúce učenie má charakter adaptácie štruktúry neurónovej siete tak, aby presnejšie predvídala vhodné aktivity. (B) Diagram znázorňuje druhý stupeň zložitosti agentov, ktoré už majú vlastnú individuálnu myseľ M = T,. To znamená že sú schopní učenia, t. j. ( ) i adaptívne reagujú na zmenené okolie tak, že sa modifikuje aj jej pamäť. (C) Najzložitejší tretí stupeň zložitosti mysle, ktorý dostaneme z 2. úrovne, keď z jednotlivých individuálnych pamätí vytvoríme spájaním individuálnu poznatkov kolektívnu pamäť Tcoll, ktorá je pre celý multiagentový systém rovnaká, obsahuje dôležité skúsenosti a faktu z predchádzajúcej histórie adaptačného procesu. 3.3 Tri stupne zložitosti agentov Budeme rozlišovať tri stupne zložitosti (alebo evolúcie ) agentov, táto klasifikácia vychádza z ich vlastností, či obsahujú alebo neobsahujú pamäť, ak obsahujú pamäť, potom aký jej typ, či individuálnu alebo jej rozšírenie aj o kolektívnu pamäť (pozri obr. 4). 1. stupeň. Aktivity agenta sú reflexívne, t. j. nie sú založené na inferenčnom procese mysle ale na jednoduchej neurónovej sieti (ktorá ešte nie je pamäťou, v ktorej by boli uložené dôležité skutočnosti predchádzajúceho adaptačného problému.). Táto pamäť zobrazuje prostredie agenta na reflexívne aktivity agenta. Poznamenajme, že už na tejto reflexívnej učenie 112

113 úrovni prebieha proces učenia, ktorý spočíva v hľadaní vhodnej štruktúry (Baldwin, 1896) jednoduchej neurónovej sieti tak, aby sa zvýšila presnosť predpovedi. Agenti ešte nemajú pamäť, v ktorej by boli uložené dôležité skutočnosti predchádzajúceho adaptačného procesu. Tento typ zložitosti sa vyskytuje u sociálneho hmyzu, ktorých neurónová sieť obsahuje niekoľko desiatok neurónov, pričom jej štruktúra je plne určená genotypom agenta. gén rodič replication vertikálny prenos mémov mém potomok vzdelávanie potomka výsledný potomok horizontálny prenos mémov susedný agent úprava mému potomka vzdelávaním Obrázok 5. Schematické znázornenie kolektívnej pamäti tretieho stupňa (pozri obr. 4). Elementárna dvojica v tom prístupe je gén mém, kde gén špecifikuje fenotyp agenta a mém špecifikuje informáciu, ktorú agent potrebuje na úspešné prežitie v danom prostredí. Idúc zhora-nadol v tomto schémate, prvý elementárny krok je reprodukcia, keď rodič zreprodukuje svoj gén a kultúrnym vertikálnym procesom výchovy mu vytvorí mém. Pripomeňme, že oba tieto elementy pri vytváraní potomka sú ľahko zmutované formy rodičovského génu a mému. V ďalšom kroku takto vytvorený komplex gén mém je zmodifikovaný horizontálnym kultúrnym prenosom. V nasledujúcom treťom kroku komplex gén mém sa modifikuje životými skúsenosťami vzdelávaním agenta. V dolnej časti obrázku je uvedený komplex mém gén, ktorý je výsledkom genetického reprodukčného procesu rodičovského génu a následných kultúrnych procesov vytvárania mému. 2. stupeň. Agenti populácie majú myseľ = ( T, ) M, pomocou ktorej môžu riadiť jednoduché aktivity spočívajúce v efektívnejšej orientácii v prostredí, vyhodnocovaní blízkeho okolia, a pod. Obvykle, relácia logického vyplývania je rovnaká pre všetkých agentov, môžeme konštatovať, že inferenčný aparát agenta je špecifikovaný genotypom. Individuálna pamäť agenta Ti môže mať memetický mechanizmus (Kvasnička, 2003) svojho pôvodu: (a) horizontálnym prenosom (výchova potomkov) od rodiča, (b) vertikálnym prenosom (od iného agenta), i (c) vlastným pozorovaním, t. j. individuálna pamäť je postupne rozširovaná o skúsenosti agenta. Na záver životného cyklu, keď agent vstupuje do reprodukčného procesu, svojmu potomkovi odovzdáva len svoj gén v ľahko zmutovanej forme, t. j. agent - potomok nededí priamo od rodičov pamäť (t. j. evolúcia je striktne darvinovská), ale dedí v ľahko zmutovanej forme jeho inferenčný aparát. Avšak, pomocou horizontálneho prenosu potomok získa od rodiča, určitý základný balík poznatkov - mémov, ktoré v priebehu jeho životného cyklu mu môžu podstatne zvýšiť fitness (pozri obr. 5). 3. stupeň. Agenti vybavení mysľou = ( T, ) M majú taktiež kolektívnu pamäť Tc, ktorá je spoločná pre celý multiagentový systém. Najjednoduchší prístup k existencii kolektívnej pamäti je postulovanie tzv. vyhľadávacích agentov, ktorý majú privilégium vstupovať do individuálnych pamätí jednotlivých agentov a vyhľadávať vhodnú informáciu všeobecného charakteru, ktorá bude tvoriť kolektívnu pamäť. Títo špecializovaní agenti pri tvorbe kolektívnej pamäti majú tiež dôležitú úlohu, aby zabezpečili je konzistentnosť, t. j. nesmie obsahovať súčasne nejakú informáciu χ a jej negáciu χ (poznamenajme, že v logike je problém vytvárania, revízie a spájania databáz poznatkov veľmi intenzívne študovaný (Lin, Mendelzon, 1998)). 4 Tri rôzne scenáre kolektívnej pamäti v sociálnych systémoch Cieľom tejto kapitoly je špecifikovať pojem kolektívnej pamäti v sociálnych systémoch pomocou klasifikácie agentov vykonanej v predchádzajúcej kapitole (pozri obr. 5). Prvý typ kolektívnej pamäti je špecifikovaný najjednoduchšími agentmi - sociálnym hmyzom, ktorý interaguje s prostredím alebo medzi sebou len pomocou inštinktov. Ak nejakým spôsobom odstránime v tomto spoločenstve sociálneho hmyzu inštinkty (napr. pomocou falošných feromónov), hmyzie spoločenstve sa okamžite zmení na chaotický súbor jedincov, ktorí prestali vykonávať koordinované akcie (napr. zber potravy). V tomto prípade neexistuje žiadny memetický-kultúrny prenos informácie, fitnes jednotlivcov je určené len zložením genotypu. Avšak, ako bolo ukázané koncom 19. storočia americkým psychológom J. M. Baldwinom (1896) v práci A New Factor in Evolution, darvinovská evolúcia využíva tzv. fenotypovú plasticitu (schopnosť organizmu adaptovať svoje orgány v priebehu života tak, aby lepšie vykonávali svoju funkciu); táto skutočnosť môže významne ovplyvňovať fitness jednotlivcov v populácii. Baldwin menovite vyzdvihol do popredia schopnosť učiť sa, ktorá sa prenáša geneticky a podstatne môže ovplyvňovať fitness agentov. Táto i 113

114 vlastnosť ak sa trvalo vyskytuje v populácii, ktorá je v nemennom prostredí môže až viest ku kanalizácii vlastnosti fenotypu, k jeho genetickej zafixovanosti v adaptovanej forme, t. j. vo forme inštinktu. Podľa Baldwina takto vznikli inštinkty u hmyzu, ktoré sú genericky zafixované a nemusia sa učiť, podstatne uľahčuje agentom riešenie niektorých organizačných a komunikačných problémov. Poznamenajme, že v tomto najjednoduchšom prípade, v populácii sa nešíri informácia (vertikálne alebo horizontálne), agenti nemajú nielen svoju pamäť ale taktiež neexistuje ani spoločná kolektívna pamäť. Domnievame sa, že už aj v tomto najjednoduchšom prípade, keď agenti sú vybavení len inštinktami, môžeme hovoriť (aspoň v náznakoch) o kolektívnej pamäti, ktorá uľahčuje agentom kolektívne správanie. Druhý typ kolektívnej pamäti je špecifikovaný pre agentov s vnútornou individuálnou pamäťou. Pre tento typ multiagentových systémov s agentmi, ktorí majú individuálnu pamäť, už môže prebiehať memetická komunikácia (horizontálny prenos z rodiča na potomkov, vertikálny prenos medzi dvojicou agentov, a taktiež v priebehu životného cyklu každého agenta sa zväčšuje informácia uložená v pamäti). Zrejme, v týchto multiagentových systémoch určitá časť mémov môže fungovať (povesti, história, mýty,...) tak, že zvyšuje kohéznosť sociálnej skupiny (multiagentového systému), čo je jedna z hlavných podmienok podľa Halbwachsa, požadovaných od kolektívnej pamäti. Vidíme, že tento typ kolektívnej pamäti je jednoducho realizovateľný pomocou memetického prístupu, ktorý sa týmto stáva veľmi blízkym prístupu kolektívnej pamäti. Tretí typ kolektívnej pamäti je zavedený pre najzložitejších agentov, ktorý vytvárajú sociálne systémy s kolektívnou pamäťou. Pripomeňme, že pre tieto systémy každý agent má svoju súkromnú kolektívnu pamäť, takže môžeme predpokladať medzi jednotlivými agentmi memetickú komunikáciu. Avšak existencia spoločnej kolektívnej pamäti, spoločnej pre celý multiagentový systém je významnou črtou multiagentových systémov, ktorá ich striktne oddeľuje od systémov s prvým a druhým typom kolektívnej pamäti. Obrazne povedané, tento typ kolektívnej pamäti môžeme inštitucionalizovať tak, že predpokladáme v danom multiagentovom systéme existenciu samostatnej štruktúry v ktorej je táto pamäť uložená. Takže v tomto type kolektívnej pamäti vedľa seba koexistujú tak lokálna (osobná) kolektívna pamäť ako aj spoločná kolektívna pamäť pre celý multiagentový systém. Existencia tretieho typu kolektívnej pamäti už vyžaduje existenciu špecializovaných agentov, ktorí sa starajú o údržbu pamäti (vkladanie nových poznatkov, zabezpečenie konzistentnosti, a pod.). 5 Záverečné poznámky V tejto práci sme ukázali, že Halbwachsova koncepcia (1992) kolektívnej pamäti má v modernej umelej inteligencii a kognitívnej vede pomerne jednoduchú interpretáciu pomocou techniky multiagentového systému. Vychádzajúc z moderných výsledkov umelej inteligencie, môžeme formulovať hypotézu, že aplikácia tejto informatickej disciplíny v sociálnych vedách poskytuje racionálne vysvetlenia mnohých sociálnych vlastností a procesov, pričom tieto vysvetlenia nie sú zaťažené zbytočných ideologickým balastom. Klasickým príkladom sú Axelrodove výsledky (Axelrod, 1984) o vzniku kooperácia medzi sebeckými agentmi. Tieto simulačné výpočty sú implementované pomocou jednoduchých evolučných algoritmov (Holland, 1975, Kvasnicka a spol. 2000), ktoré optimalizujú dlhodobý benefit opakovanej interakcie medzi agentmi, pričom rezultuje relatívne jednoduchá stratégia heuristika tit for tat (volne preložené ako ty mne, tak ja tebe ). Tento výsledok môžeme chápať ako racionálnu morálnu heuristiku pre štúdium interakcií v multiagentových systémoch. Tento prístup bol zovšeobecnený autorom (Kvasnička a spol. 1999) aj pre štúdium etnických konfliktov medzi dvoma etnicky rôznými populáciami. Získané výsledky racionalizujú koncepciu kolektívnej viny, okolo ktorej v literatúre existujú navzájom protirečivé názory o jej význame a akceptovateľnosti. Zo získaných simulácií vyplýva, že princíp kolektívnej viny má vždy fatálne dôsledky pre kooperáciu medzi rôznymi etnickými skupinami V sociálnych a humanitných vedách koncepcia kolektívnej pamäti sa prekrýva s memetikou (Dawkins, 1976; Blackmore, 1999; Kvasnička, 2003). Podobne ako v kolektívnej pamäti, tak aj v memetike, obsiahnutá informácia napomáha agentom k prežitiu; tak napríklad obsahuje popis prostredia, jeho nepravideľnosti, skryté vlastnosti. Podľa mienky autora tejto stati, memeticky prístup môže byť preformulovaný do koncepcie kolektívnej pamäti, obsahuje napr. historické skúsenosti agentov z predchádzajúcich etáp adaptačného procesu. Hlavným výsledkom tejto práce je zistenie, že moderný aparát umelej inteligencie (menovite multiagentových systémov) a kognitívnej vedy vedie pomerne priamočiaro k zisteniu, že v multiagentových systémoch môže byť naformulovaná idea kolektívnej pamäti, v ktorej sú naakumulované zistenia a pozorovania priebehu adaptačného systému. Skutočnosti obsiahnuté v kolektívnej pamäti môžu byť efektívne využité pri konštrukcii aktuálneho adsaptačného kroku, odrážajú skúsenosti z predchádzajúcich adsaptačných krokov. To znamená, že aktuálny adaptačný krok už nie je zostrojený náhodne (napr. náhodne mutácie genotypu pri reprodukčnom procesu), ale obsahujú už aj historické skúsenosti agentov z predchádzajúchich adaptačných krokov. Tento dôležitý záver o akcelerácii adaptačného 114

115 procesu v multiagentovom systému, môže byť priamo použitý aj v rámci sociálnych a humanitných vied. Vtomto prípade prístup kolektívnej pamäti môže byť na základe tejto analógie priamo použitá aj v týchto, relatívne vzdialených vedných oblastiach. V tomto prípade koncepcia kolektívnej pamäti môže byť interpretovaná ako dôležitý akceleračný prvok adaptačných procesov (Kvasnicka, Pospíchal, 2014) daného sociálneho systému, kde počiatočná stochastičnosť adaptácie ja nahradená zákonitostiami z predchádzajúcej adaptačnej histórie sociálneho systému. Poďakovanie Táto práca bola vypracovaná v rámci riešenia úlohy VEGA, grant 1/0141/10. Literatúra Alchourròn, C. E., Gärdenfors, P., Makinson, D. (1985). On the logic of theory change: Partial meet contraction and revision functions. Journal of Symbolic Logic, 50, Assmann, J. (2008). Communicative and Cultural MemoryManier. In Erll, A., Nünning, A., Young, S. B. (eds.): Cultural Memory Studies. An International and Interdisciplinary Handbook. Berlin: Walter de Gruyter, pp Axelrod, R. (1984): The Evolution of Cooperation. New York: Basic Books. Baldwin, J.M. (1896): A New Factor In Evolution, American Naturalist 30, , Blackmore, S. (1999): The meme machine. Oxford, UK: Oxford University Press (český preklad: Teorie memů: Kultura a její evoluce. Praha: Portál, 2000). Dawkins, R. (1976). The Selfish Gene. Oxford, UK: Oxford University Press. Dudai, Y. (2002). Memory From A to Z, Keywords, Concepts, and Beyond. Oxford University Press, Oxford, UK,, heslo Collective memory, pp Friedenberg, F., Silverman. G. (2006). Cognitive Science. An Introduction to the Study of Mind. Thousand Oaks, CA: Sage Publications. Gabbay, D.M., Rodrigues, O.T., Russo, A. (2010). Revision, Acceptability, and Context. Theoretical and Algorithmic Aspects. Berlin: Springer. Gáliková, S. (2009a): Úvod do filozofie vedomia. Trnava: Filozofická fakulta Trnavskej university. Gáliková, S. (2009b). Úvod do kognitívnej vedy. Trnava: Filozofická fakulta Trnavskej university. Gärdenfors, P. (ed.) (1992). Belief Revision. Cambridge (UK): Cambridge University Press. Halbwachs, M. (1992). On collective memory. Chicago: The University of Chicago Press, (existuje český preklad Halbwach M. (2010): Kolektivní pamět. Praha: Vydavateľství Slon). Holland, J. H. (1975). Adaptation in Natural and Artificial Systems. Ann Arbor, MI: University of Michigan Press. Konieczny, S., Perez, R. (2011). Logic Based Merging. Journal of Philosophical Logic 40, Krempaský, J. a kol. (1988): Synergetika, Bratislava: Veda SAV. Kvasnicka, V., Pospichal, J. (1999): Evolutionary study of interethnic cooperation. Adv. Complex Systems Kvasnička, V., Pospíchal. J., Tiňo, P. (2000): Evolučné algoritmy. Bratislava: Vydavateľstvo STU. Kvasnička, V., Pospíchal. J. (2006). Matematická logika. Bratislava: Vydavateľstvo STU. Kvasnička, V. (2003). Replicator theory of coevolution of genes and memes. Neural Network World 13, Kvasnička, V., Beňušková, Ľ., Pospíchal, J., Farkaš, I., Tiňo, P., Kráľ, A. (1997). Úvod do teórie neurónových sietí. Iris, Bratisalava. Kvasnička, V., Pospíchal J. (2007). Artificial Chemistry and Replicator Theory of Coevolution of Genes and Memes. Collect. Czech. Chem. Commun. 72, Kvasnička, V., Pospíchal, J. (2014). An extension of hill-climbing with learning applied to a concept of collective memory. Evolutionary Computing (to be published). Lin, J., Mendelzon, A.O. (1998). Merging databases under constraints. International Journal of Cooperative Information Systems 7, Manier, D., Hirst, W. (2008). A Cognitive Taxonomy of Collective Memories. In Erll, A., Nünning, A., Young, S. B. (eds.): Cultural Memory Studies. An International and Interdisciplinary Handbook. Walter de Gruyter, Berlin, pp

116 Roediger III, H. L:, Dudai, Y., Fitzpatrick, S. (2007). Science of Memory: Concepts. Oxford University Press, New York. Rojas, R, (1996). Neural Networks. A Systematic Introduction. Berlin, Springer. Rott, S. (2001). Change, Choice and Inference. Oxford University Press, Oxford (UK). Schenk, J. (1993). Samoorganizácia sociálnych systémov (Metodologické problémy synergetického prístupu v sociológii). Bratislava: IRIS. Schenk, J. (2011). Metodologické problémy multiagentového modelovania v sociológii. Bratislava: Stimul. Smolensky, P. (1987). Connectionist AI, Symbolic AI, and the Brain. Artificial Intelligence Review 1, Wooldridge, M. (2000). Reasoning about Rational Agents. Cambridge, MA: The MIT Press. Wooldridge, M. (2002). An Introduction to Multiagent Systems. New York: J.Wiley & Sons. 116

117 Kognícia a umelý život 2015, Trenčianske Teplice Síla pozičních ekogramatických systémů Miroslav Langer IT4Innovation a Slezská univerzita v Opavě Bezručovo nám. 13, Opava [email protected] Abstrakt Poziční ekogramatické systémy (zkráceně PEG systémy) byly zavedeny v Langer (2005a). V tomto příspěvku shrnujeme pohled na generativní sílu PEG systémů. Zabýváme se generativní silou PEG systémů jak v kontextu jiných gramatik a gramatických systémů, tak s ohledem na vlastnosti PEG systémů samotných, čili na generativní sílu s ohledem na počet agentů v prostředí a počet typů agentů v definici PEG systému. 1 Úvod V tomto příspěvku se budeme věnovat pozičním ekogramatickým systémům (zkráceně PEG systémy) (viz Langer (2005a)). Jedná se o model multiagentového systému zavedeného v roce Agenti jsou vsazeni do vyvíjejícího se prostředí, přičemž klademe důraz na fyzickou přítomnost agenta v prostředí. Agentova přítomnost v prostředí je dána speciálním identifikátorem. Motivace k zavedení našeho modelu byla inspirována dvěma již zavedenými modely, ekogramatickými systémy a PMkoloniemi. Ekogramatické systémy byly zavedeny v Csuhaj-Varjú a spol. (1994) ve snaze popsat vzájemné působení mezi komunitou agentů a vyvíjejícím se prostředím, ve kterém žijí. Prostředí, 0L schéma, je dvojice E = (V E, P ), kde V E je abeceda a P je konečná množina pravidel typu a α, a V E, α VE. Každý agent ekogramatického systému je dán svým 0L schématem, konečnou množinou akčních pravidel a konečnou množinou evolučních pravidel. Prostředí i agenti se tedy mohou vyvíjet na základě vlastních evolučních pravidel. Vzájemná interakce mezi prostředím a agenty je zachycena pomocí funkcí ϕ a ψ. Funkce ϕ vybírá evoluční pravidla agentů na základě stavu prostředí, podle kterých dochází k vývoji agenta. Funkce ψ vybírá akční pravidla agenta na základě stavu agenta, pomocí kterých agent působí v prostředí. Vývoj agenta je tudíž ovlivněn stavem prostředí a zásahy agenta v prostředí jsou ovlivněny jeho stavem. PM-kolonie na rozdíl od ekogramatických systémů nemají vyvíjející se prostředí. Prostředí je tvořeno řetězcem nad abecedou V a je ohraničeno speciálními hraničními symboly. Společenství agentů žijících v prostředí jej může ovlivňovat svými akčními pravidly. Akční pravidla mají formu (a, A, b) α, kde A je identifikátor agenta, symboly a, b V symbolizují kontext agenta A. Agenti působí v prostředí pomocí svých akčních pravidel. Agent se může v prostředí pohybovat, může nahradit, vložit nebo vymazat znak prostředí nebo může zaniknout. Interakce mezi prostředím a agenty je zachycena v pravidlech agentů. Na základě kontextu, čili stavu prostředí v jeho bezprostředním okolí, agent může buď působit na prostředí, nebo může zaniknout. Na rozdíl od PM-kolonií (Martin-Vide a Păun (1998)) mají PEG systémy vyvíjející se prostředí, 0L schéma, a agenti PEG systémů mají pouze jednostranný kontext. Agenti PEG systémů mohou do prostředí vkládat víc než jeden symbol. Na rozdíl od agentů ekogramatických systémů jsou přítomni přímo v prostředí a jejich přítomnost je dána speciálním symbolem. Sami se nevyvíjejí a prostředí modifikují pomocí svých pravidel na základě svého kontextu. Taktéž nemohou, na rozdíl od agentů ekogramatických systémů, ve dvou po sobě jdoucích derivačních krocích působit na symboly vzdálené od sebe více jak jeden symbol. To nám dovoluje studovat lokální změny prostředí, které agenti způsobují. Přesné určení pozice agenta speciálním symbolem nám do jisté míry dovoluje predikovat jejich chování a taktéž řídit evoluci prostředí. Motivací pro zavedení PEG systémů je snaha zachytit interakci mezi vyvíjejícím se prostředím a komunitou agentů žijících v tomto prostředí, přičemž klademe důraz na fyzickou přítomnost agenta v prostředí. Inspiraci můžeme hledat kdekoliv, kde komunita agentů působí na vyvíjející se prostředí. Primárním zájmem je studium lokálních změn prostředí v okolí agenta. Vývoj agenta je potlačen, je nedůležitý nebo jej lze popsat pomocí typů agentů. Takovým systémem může být kupříkladu živá tkáň napadená virovým onemocněním. Inspiraci můžeme hledat například i na listech broskvoní napadených kadeřavostí. Působením parazitických organizmů dochází k degeneraci části rostliny. Změny jsou pouze lokálního charakteru, v místech napadení. Růst rostlin lze navíc popsat Lindenmayerovými systémy, které tvoří prostředí PEG systémů. Působení agentů pak může zapříčinit lokální deformace, změnu vývoje prostředí. 117

118 2 Poziční ekogramatické systémy V této kapitole uvedeme definice pozičních ekogramatických systémů. Prostředím PEG systémů je 0L schéma. Agenti jsou přítomni v prostředí a jejich umístění je dáno identifikátorem. Pravidla agentů jsou typu a[1] α nebo [1]a α, kde [1] je identifikátor agenta, a je symbol prostředí a α je řetězec složený z libovolného počtu znaků prostředí a identifikátorů agentů v libovolném pořadí. Z toho plyne, že agent může modifikovat svůj kontext, vkládat libovolný počet znaků prostředí, vytvořit libovolný počet agentů, transformovat se na jiný typ agenta, případně se vymazat. Každý agent v každém derivačním kroku musí aplikovat jedno ze svých pravidel, jinak je derivace zastavena, stejně tak, pokud se dva agenti pokusí modifikovat týž symbol. Tyto dvě vlastnosti se v průběhu výzkumu ukázaly být velmi užitečné. Jsou velmi silným nástrojem pro simulaci jiných systémů a gramatik. Definice 1 Poziční ekogramatický systém (zkráceně P EG systém) stupně m, m 1, je (m + 3) - tice Σ = (V E, N B, E, B 1,..., B m ), kde V E je konečná neprázdná abeceda prostředí, N B = {[j] : 1 j m} je množina identifikátorů agentů, [j] určuje pozici j. typu agenta v prostředí, E = (V E, P E ) je 0L schéma s abecedou V E a vývojových pravidel P E prostředí, B j = ([j], Q j ), je j. typ agenta pro 1 j m a Q j množina pravidel typu a[j]b u, kde ab V E je symbol po pravé nebo levé straně agenta [j] a u (V E N B ). V definici pozičního ekogramatického systému vyžadujeme přítomnost alespoň jednoho typu agenta. Vnitřní agent může vzniknout nebo zaniknout prostřednictvím pravidel a jeho přítomnost v prostředí je dána symbolem z množiny N B. V prostředí se může vyskytovat několik kopií jednoho typu agenta. Agenti pracují paralelně. Zbylé symboly, které nebyly přepsány agenty, jsou paralelně přepsány pravidly prostředí. Definice 2 Konfigurace P EG systému Σ = (V E, N B, E, B 1,..., B m ) je řetězec v nad (V E N B ). Počáteční konfiguraci budeme nazývat axiom. Definice 3 Průmět slova w (V N B ) do množiny V E je morfismus γ(a) = a pro a V E a γ(b) = ε pro b N B. Definice 4 Průmět slova w (V N B ) do množiny N B je morfismus γ(a) = ε pro a V E a γ(b) = b pro b N B. Definice 5 Derivační krok P EG systému Σ = (V E, N B, E, B 1,..., B m ) je binární relace = Σ nad (V E N B ) taková, že w = Σ w tehdy a jen tehdy, když w = α 0 a 1 [j 1 ]b 1 α 1... α m 1 a m [j m ]b m α m, kde α k V E pro 0 k m a a kb k V E, [j k ] N B, 1 k m, w = α 0β 1 α 1... α m 1β m α m, kde a k [j k ]b k β k Q k pro 1 k m a α k E α k pro 0 k m. Zápisem = označujeme reflexivní a tranzitivní uzávěr relace =. V každém kroku derivace agent přepíše jeden symbol po své levé či pravé straně. Ostatní symboly se přepíší podle pravidel 0L prostředí. Všichni agenti pracují paralelně. V případě konfliktu nebo neaktivity kteréhokoliv agenta je odvození zablokováno. Konfliktem rozumíme případ, kdy se dva agenti snaží aplikovat své pravidlo na týž symbol. Neaktivitou potom stav, kdy agent nemůže aplikovat žádné ze svých pravidel. Jazyk definovaný pozičním ekogramatickým systémem je množina všech slov, která mohou být odvozena z axiomu a ze kterých vynecháme identifikátory vnitřních agentů. Definice 6 Jazyk definovaný P EG systémem Σ = (V E, N B, E, B 1,..., B m ) a axiomem w (V E N B ) je množina slov L(Σ, w) = {γ(u) V E : w Σ u, u (V E N B ) }. Třídu všech jazyků definovanou PEG systémy (P EG jazyky) budeme označovat L (P EG). 3 Síla PEG systémů V průběhu výzkumu PEG systémů jsme se zabývali stanovením generativní síly, jednak v kontextu již zavedených gramatik a systémů, tak v kontextu vlastností PEG systémů, jako je počet agentů v prostředí a počet typů agentů v definici PEG systému. V této kapitole předkládáme nejdůležitější výsledky. Ukážeme, že PEG systémy nejsou výpočetně kompletní a stanovíme hierarchii PEG systémů v závislosti na počtu agentů v prostředí a v závislosti na počtu typů agentů v prostředí. 3.1 Horní hranice generativní síly PEG systémů V Langer a Kelemenová (2013) jsme ukázali, že třída generovaná čistými gramatikami typu 0 je vlastní podtřídou PEG jazyků. Agent pohybující se v prostředí může připomínat hlavu Turingova stroje a vyvolat tak pocit, že jsme schopni generovat i všechny rekurzivně vyčíslitelné jazyky. V následující větě ukážeme, že tomu tak není, čímž ukážeme horní hranici generativní síly PEG systémů. Věta 1 PEG systémy nejsou výpočetně kompletní L (P EG) L (RE). 118

119 Důkaz: Mějme jazyk L = L(Σ, α) generovaný PEG systémem Σ s axiomem α. Nejprve ukážeme, že pro nějaké k 1 takové, že pro každé w L \ {α} existuje u L takové, že w k u. Mějme v PEG systému Σ odvození: α ū w a w = γ( w), u = γ(ū). Poslední krok odvození zajistí, že pro každý symbol z N B existuje v řetězci ū alespoň jeden symbol z V E, čili u ū 2 u, kde u = γ(ū). Označme p E délku nejdelší pravé strany pravidla prostředí, p E = max{ β : a β P E, a V E } a q označme délku nejdelší pravé strany pravidla agenta bez identifikátorů agentů, q = max{ γ(β ) : a[i]b β Q i, ab V E, 1 i m}. Pak w w max{p E, p A } ū 2max{p E, p A } u, tudíž k = 2max{p E, p A }. Z poslední nerovnosti plyne, že například jazyk L = {a nn : n 0} nemůže být generovaný žádným PEG systémem, a PEG systémy tudíž nejsou výpočetně kompletní. 3.2 Generativní síla podle vlastností PEG systémů V pozičních ekogramatických systémech je pozice agentů v prostředí dána speciálními symboly. Tyto komponenty způsobují v paralelním prostředí lokální změny v konfiguraci systému. Umístění agenta v prostředí a jeho kontext přímo ovlivňuje generativní sílu PEG systému. V této podkapitole rozdělíme PEG systémy s ohledem na maximální počet typů agentů v definici PEG systému a s ohledem na maximální počet agentů v prostředí. Ukážeme, že v obou případech toto rozdělení určuje nekonečnou hierarchii PEG jazyků Hierarchie na základě počtu agentů v prostředí V této podkapitole se budeme věnovat rozdělení PEG systémů na základě počtu agentů přítomných v prostředí. Budeme uvažovat PEG systémy s maximálně n agenty libovolného typu v prostředí v každém derivačním kroku. Jinými slovy, zajímá nás celkový počet identifikátorů agentů v prostředí. Definice 7 P EG systém Σ = (V E, N B, E, B 1,..., B m ) s axiomem w, w (V E N B ) + je PEG systém s indexem n, značíme (Σ, w) P EG n, jestliže u NB n pro všechna u (V E N B ) taková, že w Σ u. Jazyk L je PEG jazyk s indexem n, L L (P EG n ), jestliže existuje P EG n systém Σ s axiomem w takový, že L = L(Σ, w) a pro žádný P EG m systém Σ a w m < n neplatí L = L(Σ, w ). Příklad 1 Mějme jazyk L 1 = {a i b i c i : i 1} a PEG systém Σ 1 = ({a, b, c}, {[1]}, E, B 1 ), kde: E = ({a, b, c}, {a a, b b, c c}), B 1 = ([1], {a[1] aa[1]b, [1]c [1]cc}). Nechť w 1 = a[1]b[1]c je axiom systému Σ 1. Pak a[1]b[1]c aa[1]bb[1]cc n 2 a n [1]b n [1]c n a n a[1]bb n [1]cc n... Protože L(Σ 1, w 1 ) = L 1 a (Σ 1, w 1 ) je s indexem 2, pak (Σ 1, w 1 ) P EG 2. Tudíž L 1 L (P EG t ) pro t 2. Abychom dokázali, že L 1 L (P EG 2 ), ověříme, že L 1 nenáleží do L (P EG 1 ), tudíž neexistuje PEG systém Σ s axiomem w s indexem 1 takový, že L(Σ, w) = L 1. Předpokládejme naopak, že L 1 náleží do L (P EG 1 ) a P EG 1 systém Σ 0 = ({a, b, c}, {[1]}, E, B 1,..., B m ) s axiomem w 0 = u 0 [1]v 0 generuje L 1. Čtenář si může ověřit, že E = ({a, b, c}, P ) v Σ 0 je deterministický a P = {a a, b b, c c}. Všechny změny v prostředí tedy zajišťují agenti. Nechť je u[j]v, 1 j m slovo odvozené ze Σ 0 z axiomu a uv = a t b t c t pro nějaké t 1. Předpokládejme, že v dalším derivačním kroku je použito pravidlo x[j]y z, kde x, y {a, b, c, ε}, x = suf(u), y = pref(v), jeden ze symbolů x, y je prázdný a v z je přítomen libovolný agent [i]. Agent [j] se může nacházet v následujících pozicích, pro které platí: y = a. Pak musí být v následujícím kroku použito pravidlo typu a[j] a r [i] nebo [j]a a r [i] pro nějaké r 1. (Pozice a typ agenta [i] na pravé straně použitého pravidla jsou libovolné.) Tudíž pro u[j]v w platí w a w b a γ(w) nenáleží do L 1. y = b. Pak aplikací u[j]v w získáme w c < w a a w c < w b. Čili γ(w) nenáleží do L 1. y = c. Pak u[j]v w, kde w a < w b, nebo w a < w c. Čili γ(w) není slovo z jazyka L 1. Ve všech možných případe dostaneme spor s předpokladem, že L 1 patří do L (P EG 1 ), tudíž L 1 L (P EG 2 ). Na základě této úvahy můžeme vyslovit následující teorém. Věta 2 Třída PEG jazyků tvoří, s ohledem na index PEG systému, nekonečnou hierarchii: L (P EG n ) L (P EG n+1 ) pro n 1 (tj. vlastní podmnožina). Důkaz: Zjevně L (P EG n ) L (P EG n+1 ) pro n 1. Uvažujme jazyk L n+1 = {a i 1a i 2... a i 2na i 2n+1 : i 1}. Ukážeme, že L n+1 L (P EG n+1 ) L (P EG n ). Nejprve sestrojíme PEG systém Σ n+1, který z axiomu w generuje jazyk L n+1 a v jehož prostředí se vyskytuje n + 1 kopií agenta [1]: Σ n+1 = (V E, {[1]}, E, B), kde 119

120 V E = {a 1, a 2,..., a 2n+1 }, E = (V E, {a 1 a 1, a 2 a 2,..., a 2n+1 a 2n+1 }), B = ({[1]}, {a 2k 1 [1] a 2 2k 1 [1]a 2k : 1 k n} {[1]a 2n+1 [1]a 2 2n+1}). Axiom systému P EG n+1 je w = a 1 [1]a 2 a 3 [1]a 4... a 2n 1 [1]a 2n [1]a 2n+1. Odvození probíhá následovně: a 1 [1]a 2... a 2n 1 [1]a 2n [1]a 2n+1 a 2 1[1]a a 2 2n 1[1]a 2 2n[1]a 2 2n+1 a 3 1[1]a a 3 2n 1[1]a 3 2n[1]a 3 2n+1 a 4 1[1]a a 4 2n 1[1]a 4 2n[1]a 4 2n+1... Tudíž L(Σ n+1, w) = {a i 1a i 2... a i 2na i 2n+1 : i 1}. Protože L(Σ n+1, w) = L n+1 a Σ n+1 je indexu n+1, tj. L(Σ n+1, w) P EG n+1. Pak L n+1 L (P EG t ), pro nějaké t, t n + 1. Abychom dokázali, že L n+1 L (P EG n+1 ), prověříme, že L n+1 / L (P EG n ), tj. neexistuje PEG systém Σ s indexem n a axiom w takový, že L(Σ, w) = L n+1. Předpokládejme naopak, že L n+1 patří do L (P EG n ) a P EG n systém Σ n = (V E, N B, E, B 1,..., B m ) s axiomem w n generuje L n+1. Ověříme, že E = (V E, P ) ze Σ n je deterministický a P = {a i a i : 1 i 2n + 1}. Ze struktury jazyka L n+1 vyplývá, že pro a i α P je α = a s i pro nějaké s. Předpokládejme, že P není deterministické a a i a j i, a i a k i P, pro j < k. Nechť je v odvození u = a r 1a r 2... a r 2na r 2n+1 L n+1, pro nějaké r použito pravidlo a i a j i. Pak ale i slovo v = a r 1a r 2... a r+k j i... a r 2na r 2n+1 L(Σ n, w), ale v / L n+1. Zjevně tedy a i a j i, 1 i 2n + 1 v deterministickém P platí j = 1. Tudíž všechny změny prostředí vykonávají agenti. Nechť u[j]v w náleží B j. pak ze struktury jazyka L n+1 vyplývá, že γ(w) V E 2. Tím pro odvození x y, kde x obsahuje nejvýše n symbolů z N B platí, x ai = y ai, pro alespoň jedno i. Tudíž buď γ(x), nebo γ(y) nepatří do L n+1 a L(Σ n, w n ) L n Hierarchie na základě počtu typů agentů V této podkapitole se budeme zabývat rozdělením pozičních ekogramatických systémů na základě počtu typů agentů v definici PEG systému. Ukážeme, že počet typů agentů v definici PEG systému (čili kardinalita množiny N B ) ovlivňuje generativní sílu PEG systému. Abychom ukázali, že takováto hierarchie existuje, musíme najít jazyk L, který není 0L jazykem a pro který platí, že L nelze generovat PEG systémem s n typy agentů, ale lze jej generovat PEG systémem s n + 1 typy agentů. Zcela nepřekvapivě je struktura takového jazyka podobná struktuře jazyka použitého v předešlém důkazu. Definice 8 PEG systém s nejvýše n typy agentů je takový PEG systém Σ = (V E, N B, E, B 1,..., B m ), kde n N B, a značíme jej P EG n. Třídu jazyků generovanou P EG n systémem označíme L (P EG n ). Ukažme si nejprve jednoduchý příklad. Příklad 2 Uvažujme jazyk L 2 = {a i b i a j b j a k : i 1, j = 2i, k = 3i} a PEG systém Σ 2 = ({a, b}, {[1], [2]}, E, B 1, B 2 ), kde: E = ({a, b}, {a a, b b}), B 1 = ([1], {[1]a a[1]ab, [1]b aa[1]bbb}), B 2 = ([2], {a[2] aaaa[2]}). Nechť axiom systému je w 2 = [1]abaaa[1]bbbaaa[2], pak [1]abaaa[1]bbbaaa[2] a[1]abbaaaa[1]bbbbaaaaaa[2] aa[1]ab 3 a 6 [1]b 6 a 9 [2] a 3 [1]ab 4 a 8 [1]b 8 a 12 [2] a 4 [1]ab 5 a 10 [1]b 10 a 15 [2]..., tudíž L(Σ 2, w 2 ) = L 2, Σ má dva typy agentů, a proto L 2 L (P EG t ) pro t 2. Abychom ukázali, že L 2 L (P EG 2 ), ověříme, že L 2 nepatří do L (P EG 1 ), tj. neexistuje PEG systém Σ s N B = 1 a axiom w, takové, že L(Σ, w) = L 2. Předpokládejme naopak, že L 2 patří do L (P EG 1 ) a P EG 1 systém Σ 1 = ({a, b}, {[1]}, E, B 1 ) s axiomem w 0 = u 0 [1]v 0 [1]x 0 [1]y 0 generuje L 2. Laskavý čtenář si snadno ověří, že E = ({a, b}, P ) systému Σ 1 je deterministické a P = {a a, b b}. Tudíž že všechny změny prostředí zajišťují agenti. Nechť jsou u[1]v[1]x[1]y slova odvozená z axiomu v Σ 1 a uvxy = a t b t a 2t b 2t a 3t pro nějaké t 1. Podle definice PEG systému může každý agent reagovat pouze na symbol po své levé nebo pravé straně, nikoli s oběma současně. Toto omezení nám dovolí uvažovat následující případy: Nechť u = a t 1, v = ab t a 2t, x = b 2t a 3t, y = ε, pak Q 1 musí obsahovat pravidla [1]a a[1]ab, [1]b aa[1]bbb, a[1] aaaa[1]. Tato sada pravidel umožnuje v následujícím derivačním kroku odvodit slovo w, pro které platí, že γ(w) = a t+3 b t+1 a t+2 b t+2 a t+3, které však nenáleží do L 2. Nechť u = a t 1, v = ab t a 2t, x = b 2t, y = a 3t, pak Q 1 musí obsahovat pravidla [1]a a[1]ab, [1]b aa[1]bbb, [1]a [1]aaaa. Tato sada pravidel umožnuje v následujícím derivačním kroku odvodit slovo w, pro které platí, že γ(w) = a t+3 b t+1 a 2t+2 b 2t+2 a 3t+3, které však nenáleží do L 2. Nechť u = a t 1, v = ab t a 2t, x = b 2t, y = a 3t, pak Q 1 musí obsahovat pravidla [1]a a[1]ab, [1]b aa[1]bbb, b[1] b[1]aaa. Tato 120

121 sada pravidel umožnuje v následujícím derivačním kroku odvodit slovo w, pro které platí, že γ(w) = a t+1 b t+1 a 2t+2 b 2t+2 aba 3t, které však nenáleží do L 2. Ve všech případech dostáváme spor s předpokladem, že L 2 patří do L (P EG 1 ), tudíž L 2 L (P EG 2 ). Obecně můžeme říct, že fakt, že agent může použít pouze jednostranný kontext, nám dovolí inkrementovat dva shodné podřetězce typu a i b i o pouze dvě odlišná čísla. Věta 3 Třída PEG jazyků s ohledem na počet typů agentů tvoří nekonečnou hierarchii: L (P EG n ) L (P EG n+1 ) pro n 1 (tj. vlastní podmnožinu). Důkaz: Zjevně L (P EG n ) L (P EG n+1 ) pro n 1. Uvažujme jazyk L n+1 = {a i b i a 2i b 2i a (2n 1)i b (2n 1)i a 2ni b 2ni a (2n+1)i : i 1}. Ukážeme, že L n+1 L (P EG n+1 ) L (P EG n ). Tudíž ukážeme, že potřebujeme alespoň n + 1 typů agentů ke generování jazyka L n+1, n typů agentů nepostačuje. Nejprve sestavíme PEG systém Σ n+1 s n + 1 typy agentů, který generuje jazyk L n+1 : Σ n+1 = (V E, {[1]}, E, B 1, B 2,..., B n, B n+1 ), kde V E = {a, b}, E = (V E, {a a, b b}), B 1 = ([1], {[1]a a[1]ab, [1]b aa[1]bbb}), B 2 = ([2], {[2]a aaa[2]abbb, [2]b aaaa[2]bbbbb}),... B n = ([n], {[n]a a 2n 1 [n]ab 2n 1, [n]b a 2n [n]bb 2n }), B n+1 = ([n + 1], {a[n + 1] aa 2n+1 [n + 1]}). Axiom systému P EG n+1 je w = [1]abaa[1]bbaa[2]abbbaaaa[2]bbbb a 2n 2 [n]ab 2n 1 a 2n [n]b 2n a 2n+1 [n + 1]. Ukážeme několik prvních kroků odvození: [1]abaa[1]bbaa[2]abbbaaaa[2]bbbb a 2n 2 [n]ab 2n 1 a 2n [n]b 2n a 2n+1 [n + 1] a[1]abba 4 [1]b 4 a 5 [2]ab 6 a 8 [2]b a 4n 3 [n]ab 4n 2 a 4n [n]b 4n a 4n+2 [n + 1] aa[1]abbba 6 [1]b 6 a 8 [2]ab 9 a 12 [2]b a 6n 4 [n]ab 6n 3 a 6n [n]b 6n a 6n+3 [n + 1]... Tudíž L(Σ n+1, w) = {a i b i a 2i b 2i... a (2n 1)i b (2n 1)i a 2ni b 2ni a (2n+1)i : i 1}. Abychom ukázali, že L n+1 L (P EG n+1 ), ověříme, že L n+1 / L (P EG n ), čili neexistuje PEG systém Σ s N B = n a axiom w takový, že L(Σ, w) = L n+1. Předpokládejme naopak, že L n+1 patří do L (P EG n ) a P EG n systém Σ n = (V E, N B, E, B 1,..., B n ) s axiomem w n generuje L n+1. Ověříme, že E = (V E, P ) v Σ n je deterministické a P = {z z : z {a, b}}. Ze struktury jazyka L n+1 plyne, že pro z α P je α = z s pro nějaké s. Předpokládejme, že P není deterministická a z z j P pro j 0. Nechť je v odvození u = a r b r a 2r b 2r... a (2n 1)r b (2n 1)r a 2nr b 2nr a (2n+1)r L n+1 pro nějaké r použito pravidlo z z j. Pak ale i slovo v = a j(r 2)+1 b r a 2(r) b 2(r)... a r(2n 1) b r(2n 1) a 2nr b 2nr a r(2n+1) L(Σ, w), ale v / L n+1. Zjevně pro pravidla z z j v deterministické P platí j = 1. V opačném případě ne všechna slova z L n+1 jsou v L(Σ n, w n ) Tudíž všechny změny v prostředí způsobují svou aktivitou agenti. Nechť u 0 [1]u 1 [1]u 2 [2]u 3 [2]... u 2n 1 [n]u 2n [n]u 2n+2 [o]u 2n+3, kde u 0 = a t 1, u 1 = ab t a 2t, u 2 = b 2t a 3t 1, u 3 = ab 3t a 4t,..., 1 o n, je slovo odvozené z axiomu v Σ n a u 0... u 2n+3 = a t b t a 2t b 2t... a (2n 1)t b (2n 1)t a 2nt b 2nt a (2n+1)t pro nějaké t 1. Bez újmy na obecnosti můžeme předpokládat, že o = 1. V souladu s definicí PEG systému může každý agent přepsat symbol po své pravé nebo levé straně, ale ne oba současně. Díky tomuto omezení můžeme brát v potaz pouze podřetězec u 2n+2 [o]u 2n+3, a to v následujících případech: Nechť u 2n+2 = b 2nt 1, u 2n+3 = ba t(2n+1), pak Q 1 musí obsahovat pravidla [1]a a[1]ab, [1]b aa[1]bbb, [1]b [1]ba 2n+1. Taková sada pravidel nám však dovolí odvodit v následujícím kroku odvození slovo w takové, že γ(w) = a t+1 b t+1 a t ba 2n+1 b t... a 2n(t+1) b 2n(t+1) a (2n+1)(t+1), které ovšem nepatří do L n+1. Nechť u 2n+2 = b 2nt, u 2n+3 = a t(2n+l), pak Q 1 musí obsahovat pravidla [1]a a[1]ab, [1]b aa[1]bbb, b[1] b[1]a 2n+1. Taková sada pravidel nám však dovolí odvodit v následujícím kroku odvození slovo w takové, že γ(w) = a t+1 b t+1 a t+2 b t+2... a 2n(t+1) b 2n(t+1) aaba t(2n+1) 1, které ovšem nepatří do L n+1. Nechť u 2n+2 = b 2nt, u 2n+3 = a t(2n+l), pak Q 1 musí obsahovat pravidla [1]a a[1]ab, [1]b aa[1]bbb, [1]a [1]aa 2n+1. Taková sada pravidel nám však dovolí odvodit v následujícím kroku odvození slovo w takové, že γ(w) = a t+2n+1 b t a t+2 b t+2... a 2n(t+1) b 2n(t+1) a (2n+1)(t+1), které ovšem nepatří do L n

122 Nechť u 2n+2 = b 2nt a k, u 2n+3 = a l, kde k + l = t(2n + 1), pak Q 1 musí obsahovat pravidla [1]a a[1]ab, [1]b aa[1]bbb, [1]a [1]aa 2n+1. Taková sada pravidel nám však dovolí odvodit v následujícím kroku odvození slovo w takové, že γ(w) = a t+2n+1 b t a t+2 b t+2... a 2n(t+1) b 2n(t+1) a (2n+1)(t+1), které ovšem nepatří do L n+1. Nechť u 2n+2 = b 2nt a k, u 2n+3 = a l, kde k + l = t(2n + 1), pak Q 1 musí obsahovat pravidla [1]a a[1]ab, [1]b aa[1]bbb, a[1] a 2n+1 a[1]. Taková sada pravidel nám však dovolí odvodit v následujícím kroku odvození slovo w takové, že γ(w) = a t+2n+1 b t a t+2 b t+2... a 2n(t+1) b 2n(t+1) a (2n+1)(t+1), které ovšem nepatří do L n+1. Nechť u 2n+2 = b 2nt, u 2n+3 = a t(2n+1), pak Q 1 musí obsahovat pravidla [1]a a[1]ab, [1]b aa[1]bbb, a[1] a 2n+1 a[1]. Taková sada pravidel nám však dovolí odvodit v následujícím kroku odvození slovo w takové, že γ(w) = a t+2n+1 b t+1 a t ba 2n+1 b t... a 2n(t+1) b 2n(t+1) a (2n+1)(t+1), které ovšem nepatří do L n+1. Ve všech případech dostaneme spor s předpokladem, že L n+1 patří do L (P EG n ) a platí L n+1 L (P EG n+1 ). Tudíž L (P EG n ) L (P EG n+1 ). Literatura Csuhaj-Varjú, E., Kelemen, J., Kelemenová, A. a Păun, G. (1994). Eco(grammar) systems a preview. Cybernetics and Systems 94, str Langer, M. (2005a). Agents placed in the environment of eco-grammar systems positioned eco-grammar systems. V Pre-Procs. of the 1st Doctoral Workshop on Mathematical a Engineering Methods in Computer Science, str Langer, M. (2005b). Agenty umístěné v prostředí ekogramatických systém u poziční ekogramatické systémy. V Kognice a umělý život V, str Langer, M. (2007). Poziční ekogramatické systémy a (řízené) pure gramatiky. V Kognice a umělý život VII, str Langer, M. a Kelemenová, A. (2012). Positioned agents in eco-grammar systems with border markers and pure regulated grammars. Kybernetika, 48: Langer, M. a Kelemenová, A. (2013). On positioned eco-grammar systems and pure grammars of type 0. Neural Network World, 2(13): Martin-Vide, C. a Păun, G. (1998). Pm-colonies. Computers and Artificial Intelligence, 17: Závěr V tomto článku jsme předložili nejdůležitější výsledky týkající se generativní síly PEG systémů. Stanovili jsme horní hranici a ukázali jsme, že generativní síla je závislá jak na počtu agentů působících v prostředí, tak na počtu typů agentů v definici PEG systému. Byť jsme schopni pomocí PEG systémů generovat víc než čisté jazyky typu 0, PEG systémy nejsou výpočetně kompletní. Další výsledky týkající se generativní síly PEG systémů, zejména jejich vztah k čistým řízeným gramatikám, lze najít v Langer (2007), Langer a Kelemenová (2012), Langer a Kelemenová (2013). Nadále zůstává nezodpovězena otázka, jaký je vztah PEG systémů a čistých řízených gramatik s kontrolou výskytu. Další výsledky, které se týkají především uzávěrových vlastností PEG systémů, nalezneme např. v Langer (2005a), Langer (2005b). Poděkování Článek vznikl ve spojitosti s projektem IT4Innovations Centre of Excellence, reg. no. CZ.1.05/1.1.00/ Výzkum je dále podpořený projektem SGS/24/

123 Kognícia a umelý život 2015, Trenčianske Teplice Agentovo-orientované programovanie v perspektíve vývoja programovania Andrej Lúčny Katedra aplikovanej informatiky, Fakulta matematiky, fyziky a informatiky, Univerzita Komenského Mlynská Dolina, Bratislava [email protected] Abstrakt Programovacie jazyky a techniky ich použitia vieme historicky usporiadať pomocou prostriedkov, ktorými sa entity reálneho sveta prenášajú do virtuálneho prostredia počítača. Na základe tohto pohľadu rozlišujeme tradične neštruktúrované, štruktúrované a objektovo - orientované programovanie. Ukážeme, že ako logicky ďalší krok k nim možno položiť špecifický typ programovania, ktoré môžeme nazvať agentovo - orientovaným. Vyhodnotíme výhody tohto typu programovania a vhodnú aplikačnú oblasť z ktorej sú mnohé úlohy považované za tzv. úlohy umelej inteligencie. 1 Úvod Pojem agentovo-orientované programovanie pochádza od Yoava Shohama [Shoham 1993] a z obdobia kedy si viac rôznych výskumných prúdov uvedomovalo, že pracujú s analogickým druhom modularity a pokúsili sa ju vyjadriť v abstraktnej forme. Tým vznikol obor s názvom multiagentové systémy [Wooldridge Jennings 1995] [Wooldridge 2009]. Tento proces od začiatku sprevádzal zápas o to, ako rozsiahla bude táto abstrakcia, čo dobre dokumentuje monotematické číslo Communication of ACM z júla 1994 [Riecken 1994], v ktorom sú zastúpené aj prúdy, ktoré sa neskôr používania názvu agent a multiagentový zriekli ako napr. Marvin Minsky. Tento zápas nie je uzavretý dodnes a aj tento príspevok možno vnímať ako jeho súčasť. Na druhej strane je užitočný, lebo pri ňom dochádza k vzájomnej inšpirácii rôznych názorových prúdov. Yoav Shoham každopádne vnímal ním zavedenú predstavu o vývoji software ako súčasť sieťového programovania, v ktorom je multiagentový systém vnímaný ako špecifický druh middleware t.j. implementácie relačnej a prezentačnej vrstvy v OSI modeli [ITU-T 1993], teda riadia komunikačný dialóg a definujú formát dát pre proces marshallingu a demarshallingu. Dôraz taktiež kládol na pripisovanie mentálnych stavov agentom. Kým prvé zodpovedá reálnemu stavu multiagentové systémy sú dodnes predovšetkým záležitosťou sieťového programovania nad druhým by sme sa dnes skôr pousmiali s tým, že každá motivácia môže osožiť, pokiaľ sa dielo od tých menej vhodných neskôr očistí. V tomto článku sa budeme snažiť pristupovať k multiagentovému systému z čisto abstraktného pohľadu. Vďaka tomuto prístupu sme v [Lucny 2004] navrhli multiagentovú architektúru Agent-Space, ktorá umožňuje vyjadriť myšlienky Brooksovej subsumpčnej architektúry [Brooks 1999] a Minského societného modelu mysle [Minsky 1986], ktoré slovenskej vedeckej komunite priblížil Jozef Kelemen [Kelemen 1994, 2003]. Základným technickým prvkom tejto architektúry je kalkul dátovej výmeny medzi agentmi realizovaný cez pomenované odkazy na nástenke zvanej space, čím tento prístup nadväzuje na podobné koncepty ako je Gelerntnerov tupple space [Gelernter 1985] a Java Space [Waldo 2001], vyvinutý v rámci technológie pre tzv. sieť vecí Java Jini. Z hľadiska multiagentového prístupu tu z istého uhľa pohľadu teda ide o obmedzenie sa na nepriamu komunikáciu, podobne ako je tomu u multiagentového prostredia Cougaar. Tento spôsob komunikácie sa nazýva aj stigmergickým [Valckenaers 2001]. Agent-Space slúži na vývoj riadiacich systémov robotov a modelov robotov či biologických organizmov v rôznych simulátoroch [Lucny 2007, 2011]. Ako sme už uviedli, neviaže sa nevyhnutne na sieťové programovanie. Nie je teda implementovaná ako druh middleware, hoci sa dá aj týmto spôsobom ľahko rozšíriť. Jej implementácia sa opiera o multivláknové prostredie, v ktorom space slúži ako prostriedok dátovej výmeny medzi vláknami a k tomu potrebnej synchronizácie. (Implementácie v jazykoch Java a C++ sú dostupné na Z hľadiska našej argumentácie nebude zásadný fakt, že ako príklad multiagentovej architektúry budeme mať na mysli práve Agent-Space, väčšina toho čím sa budeme zaoberať je rovnako platná pre ľubovoľnú multiagentovú platformu. V našom príspevku sa pokúsime rozvinúť predstavu Shohama, ktorý v ním navrhnutom štýle programovania videl nový spôsob ako vyvíjať software. Preto mu aj dal špecifické pomenovanie. Vychádzajúc z filozofie, ktorá stála za zrodom objektovo-orientovaného programovania budeme argumentovať v prospech oprávnenosti tohto prístupu. Túto filozofiu, ktorá ako mnoho užitočných vecí napríklad grafické užívateľské rozhranie vznikla vo firme Xerox PARC pri zrode jazyka Smalltalk, 123

124 popisujeme a jej rozšírenie na rôzne spôsoby programovania podávame v kapitole 2. Výklad týchto spôsobov na konkrétnom príklade, podávame v kapitole 3. V kapitole 4 začleníme do tejto koncepcie agentovo - orientované programovanie. V závere diskutujeme o význame takéhoto pohľadu a pravdepodobnom vývoji programovania v budúcnosti, ktoré z neho vyplývajú. 2 Filozofia prenosu reálneho do virtuálneho Objektovo-orientované programovanie pri svojom vzniku bolo podložené predstavou, že ide o novátorský spôsob ako v počítači reprezentovať entity reálneho sveta. Entity mali byť reprezentované ako tzv. objekty a vzťahy medzi entitami realizované posielaním správ medzi objektmi. V triedno-inštančnom modeli zodpovedá toto posielanie správ zavolaniu metódy s argumentmi, ktoré zodpovedajú obsahu správy, čo má za následok vygenerovanie návratovej hodnoty, ktorý zodpovedá odpovedi na správu. Kľúčovým pokrokom tu bolo priradenie kódu, ktorý metódu implementuje, do definície reprezentácie entity. To predtým bolo nezvyčajné, hoci sa to niekedy robievalo pomocou smerníkov na funkcie, ktoré mohli byť hodnotou niektorého z atribútov štruktúry reprezentujúcej danú entitu. Bývali ale časy, keď nebolo v počítači vôbec možné vyjadriť, že niektoré premenné opisujú jedinú entitu a teda patria logicky k sebe. Prvé programovacie jazyky ako FORTRAN poznali len základné typy a neumožňovali ich kompozíciu do typov zložených. Bolo úlohou programátora strážiť, že určitá skupina premenných patrí k sebe, lebo popisujú rovnakú entitu. Veľmi problematické bolo taktiež tieto entity namnožiť. Najobľúbenejší spôsob bol reprezentovať ich opisné premenné ako polia a použiť index do týchto polí tzv. deskriptor na určenie, s ktorou z entít daného druhu sa práve bavíme. Išlo tu teda o spôsob reprezentácie, ktorý by sme mohli vzhľadom na to, čo prišlo po ňom nazvať neštruktúrovaným. S jazykmi ALGOL a COBOL prišla éra tzv. štruktúrovaného programovania. Okrem zloženého príkazu, ktorý vystriedal používanie skokov a dal tomuto štýlu programovania meno, priniesol zložený typ tzv. štruktúru (struct, record) pomocou ktorej bolo možné spojiť všetky premenné opisujúce určitú entitu do jedného celku. Prístup k týmto premenným bol zabezpečený smerníkom na danú štruktúru, čím sa vyriešila aj správa viacerých inštancií štruktúr rovnakého typu. Štruktúrou reprezentovaná entita už teda tvorila celok nielen v mysli vývojára, ale aj v ním napísanom programe. Bola to však entita pasívna, čokoľvek sa na nej malo zmeniť, muselo sa udiať externe. Nebol jej formálne priradený žiaden kód a takéto priradenie existovalo opäť len v mysli vývojára. Jedinou výnimkou bola už vyššie zmienená možnosť priradiť do premennej smerník na funkciu určitého prototypu, čím vzniká tzv. dynamická väzba umožňujúca dokonca niečo ako dedenie. Ďalší pokrok prináša objektovo-orientované programovanie, ktoré v podobe objektov obohacuje štruktúru o kód. Tento kód dokáže vykonať potrebnú manipuláciu atribútov objektu, kedykoľvek je zvonku vyvolaná. Na rôzne etapy vývoja programovania sa teda môžeme dívať ako na spôsoby prenosu entít reálneho sveta do virtuálneho sveta počítača. Neštruktúrované programovanie realizuje tento prenos pomocou premenných, ktoré formálne nesúvisia. Štruktúrované programovanie robí to isté pomocou štruktúr, ktoré v počítači tieto premenné formálne spoja. Objektovoorientované programovanie k nim vie pomocou objektov formálne pripojiť aj kód. Postupne sa teda formálna reprezentácia reálneho vo virtuálnom stáva bohatšou a schopnejšou zachytiť viac aspektov reálnej entity a formálne ich vyjadriť. Ako by mal logicky tento proces pokračovať ďalej? Aký ďalší aspekt reálnej entity je na rade, aby bol formálne vyjadrený a obohatil jej virtuálnu reprezentáciu? Obr. 1.: Príklad deja simulovaného v počítači 3 Motivačný príklad Hľadať odpoveď na túto otázku budeme na konkrétnom príklade. Zoberme si nejakú vhodnú entitu reálneho sveta, napríklad guličku. Ignorujme jej polomer a hmotnosť a zamerajme sa polohu a rýchlosť. Ako prostredie, v ktorom sa nachádza, budeme pre jednoduchosť uvažovať len naklonenú rovinu, ktorú popisuje uhol ϕ (napr. 30º), pričom poloha bude vyjadrená len dvomi súradnicami x a y (na počiatku 0 a 2500 cm). Ako dej, ktorý sa bude v počítači s virtuálnym náprotivkom guličky odohrávať, uvažujeme jej kotúľanie sa po danej naklonenej rovine, pričom čas považujeme za diskrétny s krokom 100ms. Celá simulácia bude trvať 10 sekúnd, čiže 100 krokov (obr. 1). V kóde abstrahujeme od potreby guličku nejako zobrazovať, či vypisovať parametre pre toto zobrazenie, stačí nám, že sa v pamäti počítača tieto parametre správne v čase menia. 124

125 Takže ako by také kotúľanie vyzeralo pri neštruktúrovanom programovaní? Každému parametru bude zodpovedať jedna premenná, označme ich typicky poloha x, y, rýchlosť v a gravitačné zrýchlenie g. Čas označíme identifikátorom t a jeho zmenu dt. Súčin g.dt označíme ako gdt (kód 1). int main() { float fi = 0.52; float x = 0, y = 2500; float v = 0; float gdt = 10.0*100/1000; for (int t=0; t<10000; t+=100) { v += gdt; x += v*cos(fi); y -= v*sin(fi); usleep(100000); } return 0; } Kód 1: Príklad kódu podľa neštruktúrovaného programovania #define MAXN 10 float x[maxn]; float y[maxn]; float v[maxn]; int dscr = 0; void set (int index) { dscr = index; } int init (float x0, float y0) { x[dscr] = x0; y[dscr] = y0; } int roll (float gdt, float fi) { v[dscr] += gdt; x[dscr] += v[dscr]*cos(fi); y[dscr] -= v[dscr]*sin(fi); } int main() { float fi = 0.52; float gdt = 10.0*100/1000; set(0); init(0,2500); set(1); init(0,2500); for (int t=0; t<10000; t+=100) { set(0); roll(gdt,fi); set(1); roll(gdt,fi); usleep(100000); } return 0; } Kód 2: Riešenie viacerých entít pomocou deskriptorov Vidíme, že príslušný program je jednoduchý. Čo v ňom však nevidíme je virtuálna gulička. Podstatne zložitejšie by bolo kotúľať viac guličiek (kód 2), čo nás prinúti vytiahnuť z hlavného programu časti kódu do funkcií. Ale ani v tomto riešení nevidíme formálnu reprezentáciu guličky. To nám umožní až riešenie v štýle štruktúrovaného programovania (kód 3). typedef struct { float x; float y; float v; } BALL; void init (BALL *b, float x0, float y0) { b->x = x0; b->y = y0; b->v = 0; } void roll (BALL *b, float fi, float gdt) { b->v += gdt; b->x += b->v*cos(fi); b->y -= b->v*sin(fi); } int main() { float fi = 0.52; float gdt = 10.0*100/1000; BALL *b = (BALL *) malloc(sizeof(ball)); init(b,0,2500); for (int t=0; t<10000; t+=100) { roll(b,fi,gdt); usleep(100000); } return 0; } Kód. 3: Príklad kódu podľa štruktúrovaného programovania Spravovať viac guličiek je pri tomto riešení ľahké, stačí alokovať ďalší pamäťový priestor a smerník naň používať na prístup k nemu. Pretože tu už máme formálne guličku v podobe zloženého typu. Táto gulička so sebou nič nevie urobiť, ale už je tam. Ďalším krokom, ako ju obohatiť o kód, t.j. ako formálne povedať, že funkcia na jej kotúľanie k nej patrí, je použitie smerníkov na funkciu (kód 4). typedef struct ball { float x; float y; float v; void (*init) (struct ball *, float, float); void (*roll) (struct ball *, float, float); } BALL; void ball_init (BALL *b, float x0, float y0) { b->x = x0; b->y = y0; b->v = 0; } void ball_roll (BALL *b, float fi, float gdt) { b->v += gdt; b->x += b->v*cos(fi); b->y -= b->v*sin(fi); } 125

126 int main() { float fi = 0.52; float gdt = 10.0*100/1000; int t; BALL *b = (BALL *) malloc(sizeof(ball)); b->init = ball_init; b->roll = ball_roll; b->init(b,0,2500); for (t=0; t<10000; t+=100) { b->roll(b,fi,gdt); usleep(100000); } return 0; } Kód. 4: Použitie smerníkov na funkciu V skutku takto podobne vyzerá kód v jazyku C skompilovaný z objektovo-orientovaného jazyka C++. Nakoniec môžeme tieto konštrukty začleniť do programovacieho jazyka a dostaneme riešenie v štýle objektovo-orientovaného programovania (kód 5). class Ball { private: float x; float y; float v; public: Ball(float x0, float y0); ~Ball(); void roll (float gdt, float fi); }; Ball::Ball (float x0, float y0) { x = x0; y = y0; v = 0; } Ball::~Ball () {}; void Ball::roll (float fi, float gdt) { v += gdt; x += v*cos(fi); y -= v*sin(fi); } int main() { float fi = 0.52; float gdt = 10.0*100/1000; Ball *b = new Ball(0,2500); for (int t=0; t<10000; t+=100) { b->roll(fi,gdt); usleep(100000); } return 0; } Kód. 5: Príklad kódu podľa objektovo-orientovaného programovania Ukázali sme si na konkrétnom príklade vývoj programovania v troch fázach: neštruktúrované, štruktúrované a objektovo-orientované. Vidíme, že každá fáza zavádza do jazyka nejaký zásadný konštrukt: štruktúrované programovanie zložený typ (štruktúru) a objektovo orientované triedy s atribútmi aj metódami. Vidíme i to, že tomuto konštruktu predchádza určitá praktika používania prostriedkov bez neho, ktorá ho predznamenáva. Ako to teraz pôjde ďalej? Na to porovnávajme hlavné programy jednotlivých riešení. Vidíme, že kým v prvej fáze sa dal celý program napísať ako hlavný, postupne z neho boli kusy kódy vytiahnuté mimo neho. Najprv šla preč definícia parametrov modelovanej entity, potom detaily jej pohybu a inicializácia jej reprezentácie. Čo je ďalšie na rade, čo by mohlo z hlavného programu zmiznúť? 4 Agentovo-orientované programovanie Pozorný čitateľ si v tejto chvíli pravdepodobne vie aj sám na otázku položenú na konci prechádzajúcej kapitoly odpovedať: z hlavného programu zmizne cyklus! Proste spravíme guličku a necháme ju nech sa sama kotúľa (kód 6). Na prvý pohľad nemusí byť zrejmé v čom nám to prináša výhodu. A to preto, lebo zatiaľ sme kotúľali len jednu guličku, prípadne dve guličky ale iba synchrónne. Pokiaľ by sme však kotúľali každú guličku inokedy, cyklus v hlavnom programe by nebol taký jednoduchý. Zatiaľ čo keď ho eliminujeme, tento problém odpadne. class Ball : public Agent { private: float x; float y; float v; protected: void init (string args) { v = 0; timer_attach(100,100); } void sense_select_act (int pid) { float dflt = 0.0; float gdt = (float) space_read("gdt",dflt); float fi = (float) space_read("fi",dflt); v += gdt; x += v*cos(fi); y -= v*sin(fi); } public: Ball (float x0, float y0) : Agent("") { x = x0; y = y0; }; }; int main () { float dgdt = 10.0*100/1000; float dfi = 0.52; Space_write("gdt",dgdt); Space_write("fi",dfi); Ball b(0,2500); 126

127 delay(10000); } Kód. 6: Príklad kódu podľa agentovo-orientovaného programovania Iný problém sa však objaví: nemáme ako do volania roll() odovzdať parametre naklonenej roviny (predpokladajme, že by sa teoreticky mohli meniť počas simulácie, takže sa to nedá vybaviť pri inicializácii). Multiagentový systém to umožňuje riešiť komunikáciou medzi agentami a to priamou, t.j. poslaním správy (napr. zavolaním metódy), alebo nepriamou, t.j. vložením hodnôt týchto parametrov na nejakú nástenku, onen vyššie zmienený space, ktorá je v rámci celého programu tzv. singletonom, takže každý má k nej prístup. V riešení, ktoré prezentuje kód 6 je použitý druhý zo zmieňovaných prístupov. class Ball { private: float x; float y; float v; protected:.ball(int pid) { float gdt =.gdt(0.0); float fi =.fi(0.0); v += gdt; x += v*cos(fi(); y -= v*sin(fi); } public: Ball (float x0, float y0) { x = x0; y = y0; v = 0; timer 100,100; // pid = trigger.gdt; }; }; int main () { float.dgdt = 10.0*100/1000; float.dfi = 0.52; Ball b(0,2500); delay(10000); } Kód. 7: Fikcia kódu podľa agentovo-orientovaného programovania V tomto riešení vidíme aj to, že z hľadiska pokroku technológie ide o určitú medzifázu. Podobne ako boli prvé štruktúry naprogramované pomocou deskriptorov a prvé objekty pomocou smerníkov na funkcie, tu je agent naprogramovaný ako objekt s vlastným vláknom (čo je ukryté v implementácii triedy Agent od ktorej je náš konkrétny agent Ball odvodený). Je preto možné očakávať nejaké zakotvenie tohto mechanizmu v jazyku. Našu fikciu možno vidieť na kód 7. Okrem špeciálnej metódy, ktorá obsluhuje jeden prechod základným cyklom agenta a špeciálnej notácie pre operácie čítania a zápisu v space, tam vidíme kľúčové slová timer a (nepoužitý ale teoreticky potrebný) trigger, ktoré definujú podmienky budenia tohto cyklu. Pre zložitejšie úlohy by sme potrebovali toho ešte viac, najmä syntaktické vyjadrenie hromadných operácii nad dátami v space. Hoci existuje viacero programovacích prostredí, ktoré si dávajú do názvu agent programming language ako napr. SARL [Rodriguez 2014], JADEX či dokonca JADE, nielen že nezapadajú do našej úvahy, ale neprinášajú žiadne nové jazykové konštrukty, ktoré by sa museli riešiť kompiláciou podobne ako sa kód C++ kompiluje do C. Taký programovací jazyk nám nie je známy. 5 Záver V príspevku sme sa pokúšali o zaradenie techniky programovania, ktorá sa v rôznych podobách objavuje posledných dvadsať rokov a je známa pod názvom agentovo-orientované programovanie. Snažili sme mu vykresať takú podobu, v ktorej by sme ho mohli položiť do hlavnej vývojovej línie programovacích jazykov. To si žiadalo značné očistenie konceptu, čo na jednej strane možno hodnoť ako našu opovážlivosť, na druhej ako náš netriviálny vklad k danej problematike. Ostáva zodpovedať otázku, čo sme tým sledovali. Kým štruktúrované programovanie prinieslo možnosť implementovať systémy s komplikovanými dátami a objektovo - orientované s komplikovaným kódom, prínosom agentovo - orientovaného programovania by mali byť systémy skomplikovaným riadením. Ide o komplexné systémy, v ktorých prebieha množstvo procesov, ktoré sa vzájomne ovplyvňujú a podporujú. Jednou vetou systémy, ktoré sa viac podobajú živým organizmom či našej mysli. Zmyslom použitia tohto nástroja je teda práve vývoj systémov s umelou inteligenciou. Poďakovanie Tento príspevok vznikol za podpory grantovej agentúry ASFEU v rámci grantovej úlohy KC-INTELINSYS, ITMS Literatúra Brooks, R.: Cambrian Intelligence, The MIT Press, Cambridge, Mass.,

128 Gelernter D.: Generative Communication in LINDA. ACM on Transactions on Programming Languages and Systems, Volume 7(1), , 1985 ITU-T: Architecture Framework for the development of signalling and OA&M protocols using OSI concepts. Telecommunication standardization sector. Recommendation Q.1400, 03/1993 Kelemen, J.: Strojovia a agenty. Archa, Bratislava, 1994 Kelemen, J.: The Agent Paradigm. Computing and Informatics, Vol.22. (2003), pp Lúčny, A.: Building Complex Systems with Agent-Space Architecture. Computing and Informatics, Vol. 23 (2004), pp Lúčny, A.: Od medzimodulových spojení k nepriamej komunikácii medzi agentami. Znalosti, VŠE Ostrava, Lúčny, A.: Multiagentový prístup k modelovaniu mysle - alebo ako sledovať pingpongovú loptičku. In: Umelá inteligencia a kognitívna veda III. (Kvasnička V. ed.), STU, Bratisva, 2011 Lúčny, A.: Otvorená implementácia architektúry Agent- Space. In: Kognice a umělý život XII. (Kvasnička, V. - Wiedermann, J. eds.), Agentura Action M, Praha, 2012, pp Minsky, M.: Society of Mind. Simon & Schuster, New York, 1986 Riecken, D. Intelligent Agents. Communication of ACM 37 (7). Rodriguez, S. - Gaud, N. - Galland, S.: SARL: a generalpurpose agent-oriented programming language. In The 2014 IEEE/WIC/ACM International Conference on Intelligent Agent Technology. Warsaw, Poland: IEEE Computer Society Press, 2014 Shoham, Y. Agent-Oriented Programming. Artificial Intelligence 60 (1993), pp Šešera, L. - Mičovský, A.: Objektovo-orientovaná tvorba systémov (analýza, návrh, implementácia) a jazyk C++. Bratislava: Alfa, 1993 Valckenaers, P. - Van Brussel, H. - Kollingbaum, M. - Bochmann O.: Multi-agent Coordination and Control Using Stigmery Applied. In: Multi-Agent Systems and Applications (Luck, M. - Maøík, V. - Štepánková, O. - Trappl, R., eds.), EASSS, Prague, 2001, pp Waldo J: Mobile Code, Coordination and Changing Networks. CONCOORD, Lipari, 2001 Wooldridge, M.: An Introduction to MultiAgent Systems - Second Edition, John Wiley & Sons, 2009 Wooldridge, M. Jennings, N. R.: Agent Theories, Architectures, and Languages: a Survey. Intelligent Agents. Ed.: Wooldridge, M., Jennings, N. R. Berlin: Springer-Verlag,

129 Kognícia a umelý život 2015, Trenčianske Teplice Koncept Hayekova stroje pro řízení robotů Khepera IV Lukáš Mamula Slezská univerzita v Opavě, Filozoficko-přírodovědecká fakulta v Opavě Bezručovo náměstí 13, Opava [email protected] Abstrakt V tomto článku si ukážeme koncept disertační práce, na které v současnosti pracujeme. Článek vychází z předchozích studií, které byly zasvěceny fuzzy logice v multiagentových systémech. Díky doposud zjištěným informacím a použitých programových knihoven jsme nyní schopni náš vyvíjený simulátor pohybu robota upravit tak, aby bylo možno s naší vytvořenou aplikací řídit nejen robota v abstraktním prostředí, ale hlavně fyzického robota. S fyzickým robotem jsme schopni postoupit ve vývoji aplikace do mnohem robustnějších rozměrů. Ukážeme si v článku jak budeme pokračovat v dosažení toho, abychom vytvořili umělou inteligenci, která bude schopna ovládat robota na dálku. Předpokládáme vznik nových situací, do kterých se robot může dostávat a které nemohly vzniknout v abstraktním světě s omezenou množinou stavů světa. Pro náš výzkum jsme zvolili robota: Khepera IV. Tito roboti jsou vybaveni ultrazvukovým a také infračervenými senzory pomoci nichž budeme schopni vybudovat bázi znalostí a reprezentaci prostředí. 1 Úvod Umělá inteligence a přístupy k této problematice spadají do vědní disciplíny, která si zasluhuje obzvlášť velkou pozornost. I v tomto článku se podíváme na jeden z možných způsobů, jak dosáhnout takového jevu. Jevu, který se pozorovateli fyzického zařízení (robota) nebo softwarové aplikace, může jevit jako samostatně fungující entita. V našem článku se zaměříme na vývoj umělé inteligence pomocí konceptu Hayekova stroje. Tento stroj je značně odlišný od toho, co popisuje ve své knize A. Kubík (2004). Náš koncept vychází z diplomové práce, která je také uvedena v literatuře. Již v první kapitole si ukážeme, jakým způsobem jsme vytvořili koncept mechanismu. Díky vytvořeného mechanismu jsme mohli ve virtuálním prostředí vidět a udělat si představu, jak by mohla naše aplikace ovládat robota. Během vývoje jsme se setkali s několika problémy, které v tomto článku také zmíníme a samozřejmě zmíníme i možné řešení, ke kterému jsme došli. Podíváme se na využití fuzzy logiky ve spolupráci s externími knihovnami, které používáme v našem projektu a na přínosy těchto knihoven. Čtenáře zasvětíme do parametrů robota Khepera IV a okrajově nastíníme náš záměr. Záměrem myslíme ovládání výše zmíněného robota pomocí naší vyvíjené aplikace. Nyní se posuneme k následující kapitole a podrobně si vysvětlíme naši pozici ve vývoji a kam chceme dále směřovat. 2 Aktuální stav Na začátku této kapitoly je potřeba čtenáře upozornit, že v době, kdy byl tento článek psán (březen 2015), jsme pracovali na velice důležité části tohoto projektu, kterou jak doufáme využijeme při práci s fyzickým robotem. Tato část je vyvíjena paralelně spolu s klíčovou aplikací a bude použita jako softwarový balík pro další studium. Balík, který vytvoříme bude inferenčním mechanismem pro transparentní intenzionální logiku, o které budeme diskutovat v některém z dalších článků a která je velice dobře zpracována v knize M. Duží (2012). Ale proč tuto informaci zmiňujeme? V následujících měsících byly veškeré údaje, které zde v tomto článku uvedeme aplikovány do fyzického robota. Takže ačkoliv článek vychází z teoretických poznatků, tyto poznatky jsou v době psaní tohoto článku již ověřovány v praktickém měřítku. Nyní se přesuneme k první části této kapitoly, kde si velice jednoduše popíšeme kooperační mechanismus, pomocí něhož zajišťujeme výsledný pohyb robota ať už v reálném nebo virtuálním prostředí. Podrobněji je tento mechanismus popsán L. Mamula (2014). 2.1 Popis kooperačního mechanismu Pro popis kooperačního mechanismu použijeme Obr. 1. Na tomto obrázku můžeme vidět jednoduchou topologii, ve které máme dva počítače. Druh počítačů pro naše účely není až tak důležitý. Operační systém používáme od společnosti Microsoft, ale protože je aplikace psaná v Java SE, je možné použít i jiné platformy. Celá topologie by v případě simulace pohybu ve virtuálním prostředí mohla být navržena i jako model peer to peer. 129

130 Obr. 1: Popis kooperačního mechanismu Přejdeme k vysvětlení kooperačního mechanismu. V našem stroji nepoužíváme genetické algoritmy, tak jako bylo použito v knize A. Kubíka. Zaměřili jsme se v našem případě na jeden z mnoha ekonomických mechanismů s přihlédnutím na myšlenky F. von Hayeka. Jako kooperační mechanismus jsme zvolili nabídku a poptávku na trhu práce. Mechanismus jsme modifikovali pro vlastní účel. Tímto mechanismem jsme vytvořili vnitřní procesy, které nám umožnili libovolně pohybovat s robotem (v rámci 2D prostoru). Na Obr. 1 máme celý mechanismus popsán a protože jsme se o tomto mechanismu zmiňovali již v dřívějších pracích, popíšeme si tento mechanismus velice zkráceně. V následující kapitole budeme vidět stavový diagram, ve kterém si znázorníme celý mechanismus. Kooperační mechanismus je vytvořen ve smyslu odměňování a trestání. Na začátku má manažerský agent, který se stará o systém nabídek práce a přiřazování práce, nastaveno defaultní množství bohatství. Po nastavení bohatství jsou spuštěny senzory, z kterých se vytvoří řetězec reprezentující aktuální polohu robota. Ze získaného řetězce se vytvoří nabídka práce a cena za práci. Mechanismus vytváření ceny za práci je trochu složitější a záleží na více podmínkách. Nejdůležitější podmínkou je, zda agent svou prací splní stav robota. Stavy robota jsou tři: nese, sbírá a potrava. Spolu s výše popsanými procesy je paralelně na druhém PC spuštěna aplikace, jenž reprezentuje řešitelské agenty. I v této aplikaci je jednotlivým agentům přiřazeno defaultní bohatství. Pokud máme vytvořenou cenu za práci, manažerský agent kontroluje, zda jsou přihlášeny řešitelské agenty, které budou chtít získat nabízenou práci. Řešitelské agenty z paralelně běžící aplikace se přihlásí manažerskému agentu. Spolu s přihlášením (jméno agenta) poskytnou manažerskému agentu také cenu, za kterou svou práci budou vykonávat. Tato cena je vytvářena na základě více informací. Cena, za kterou budou řešitelské agenty vykonávat svou práci se odvíjí od aktuálního bohatství. Jak už jsme naznačili výše, řešitelské agenty stejně jako manažerský agent dostanou na začátku defaultní množství bohatství. V případě řešitelských agentů se toto bohatství mění více dynamičtěji něž u manažerského agenta. V případě řešitelských agentů se změna bohatství projevuje získáním práce a následným vyhodnocením jeho práce. Pokud některý z řešitelských agentů získá práci a vykoná svou práci, je kontrolováno, zda po vykonání práce se změnil stav robota, ve kterém se robot nacházel. Když se zjistí, že stav robota je stále stejný, pak řešitelský agent, který provedl práci, ztratí část svého bohatství. V opačném případě se k jeho bohatství přičte odměna. Tato odměna se odečítá z bohatství manažerského agenta (bohatství systému). Pokud se některý z řešitelských agentů dostane do stavu, že není schopný pracovat z důvodu malého bohatství, může požádat o pomoc manažerského agenta. Ten mu zašle z jeho bohatství částku, aby se řešitelský agent mohl účastnit dalších řízení. Tento proces částečně simuluje palivo resp. stav baterie ve fyzickém robotu. Pokud manažerskému agentu dojde bohatství, pak se to projeví tím, že robot přestane pracovat z nedostatku energie. A s tímto procesem také souvisí jiný proces a to přechod do stavu potrava. Robot se dostane do stavu potrava pouze v té chvíli, pokud bohatství manažerského agenta dosáhne hraniční úrovně. Za tohoto předpokladu robot začne vyhledávat v prostoru zdroj potravy (energie). Zatím jsme v tomto projektu neřešili problém reprezentace prostředí. V našem simulátoru jsme měli umístěný zdroj potravy a místo, kde robot nosil odpad, na jednom neměnném místě. Jeho úkolem bylo prohledávat prostor bez potřeby zaznamenávat nebo si vytvářet mapu. Na tento problém se podíváme v některé z dalších kapitol. Nyní jsme si připomněli, jak pracuje náš kooperační mechanismus. Teď se přesuneme do další kapitoly, kde si popíšeme, jak pracuje proces výběrového řízení. Výběr vítězného agenta, který provede práci a následně je za ní ohodnocen, tak jak jsme popsali výše. 2.2 Báze znalostí s použitím fuzzy logiky V této kapitole se zaměříme na fuzzy logiku, kterou jsme také řešili v článku uvedeném jako L. Mamula (2014). V tomto článku se nebudeme příliš podrobně zabývat touto oblastí, pouze si předvedeme fakta, na které jsme v průběhu přišli popřípadě řešení, které jsme zjistili. Fuzzy logika v našem systému představuje velmi důležitou část. Tuto součást systému používáme v procesu výběrového řízení, kde se snažíme co 130

131 nejefektivnějším způsobem vybrat agenta, který získá práci. Výběr vítězného agenta je závislý právě na výsledku z procesu fuzzifikace a defuzzifikace. Pro práci s fuzzy logikou jsme použili Java knihovnu jfuzzylogic. Podrobný popis této knihovny nalezneme na webových stránkách, kde také můžeme tuto knihovnu stáhnout 1. Díky této knihovně jsme vytvořili pravidla pro náš systém. Nedílnou součástí tvorby báze znalostí a samotná práce s fuzzy logikou bylo navrhnout fuzzy množiny tak, abychom mohli pracovat se systémem, jak potřebujeme. Na následujícím obrázku můžeme vidět, jak z již vytvořených fuzzy množin vytváříme pravidla. Můžeme si všimnout, že zde vzniká obrazec bipartitního grafu. Pokud se podíváme na Obr. 2, je zřejmé, že zde kombinujeme všechny množiny. Tímto kombinováním získáme kolem 320 pravidel. Ne každé pravidlo je důležité, proto zde uplatníme na některé pravidla substituci, čímž snížíme množství pravidel. Obr. 2: Znázornění tvorby pravidel. váženého průměru, kterou jsme chtěli použít pro proces defuzzifikace. Nyní můžeme použít metodu Centroid, která je mnohem přesnější než výše zmiňovaná metoda váženého průměru. Po defuzzifikaci vstupních dat, získáme nové číslo z množiny reálných čísel. Toto číslo nám reprezentuje nebo spíše určí, který z agentů se nejvíce hodí pro vykonání aktuální práce. Používání fuzzy logiky, kterou jsme si v této kapitole popsali, je velice důležité v procesu výběrového řízení. Tato metoda nám umožňuje velice efektivně vybrat vítězného agenta, díky čemuž se pohyb robota zdá více přirozený. V další kapitole se podíváme na fyzického robota, s kterým v tomto projektu budeme pracovat. 3 Hayekův stroj a Khepera IV V této kapitole se podíváme na několik obrázků stavových diagramů a projdeme si, jaké úpravy musí být provedeny, abychom náš kooperační mechanismus mohli použít pro ovládání robotů typu Khepera IV. Na prvním obrázku v této kapitole přesněji na Obr. 4 máme znázorněn stavový diagram, který reprezentuje kooperační mechanismus tak, jak jsme si jej vysvětlili v předchozí kapitole. Nyní se zaměříme na některé ze stavů, které na obrázku můžeme vidět. Na Obr. 2 nám jednotlivé body znázorňují konkrétní fuzzy množinu. Fuzzy množiny jsou uzavřeny vždy barevným obdélníkem. Popisek nad barevným obdélníkem nám označuje název fuzzy množin. Na dalším obrázku lépe pochopíme jednotlivé názvy a propojení v našem grafu. Obr. 4: Stavový diagram kooperačního mechanismu První stav z Obr. 4, na který se zaměříme je stav login. Tento stav v našem diagramu tvoří substroj, který si můžeme představit tak, jak můžeme vidět na následujícím obrázku. Obr. 3: Fuzzy množiny a jejich grafová reprezentace. Generováno programově. Na Obr. 3 máme vytvořeny konkrétní fuzzy množiny zobrazeny v soustavě souřadnic. Z obrázku je patrné, že máme šest grafů, přičemž sedmý slouží k získání výsledného crisp-u. Díky využité programové knihovně jsme mohli upustit od plánované metody 1 Obr. 5: Stavový diagram znázorňující životní cyklus řešitelského agenta. Obr. 5 nám zobrazuje výše zmíněný substroj s názvem login. V tomto diagramu můžeme přesně vidět posloupnost kroků, od začátku životního cyklu agenta až po ukončení cyklu. 131

132 Následující obrázek nám znázorňuje stavový diagram, kde můžeme vidět výběr vítězného agenta. Opět se jedná o jeden substroj z Obr. 4. ho agenta. Obr. 6: S tavo vý diag ram výb ěru vítě zné Na Obr. 6 máme zakreslen proces výběrového řízení, které jsme si popisovali v předchozích kapitolách. Pro naše účely jsme popis mechanismu vyčerpali do dostatečné úrovně a nyní se můžeme přesunout dále v našem článku. 3.1 Khepera IV Tento typ robota je ideální pro náš výzkum. S ohledem na jeho hardwarové vybavení jsme schopni aplikovat náš koncept tak, aby robot byl schopný pracovat v prostoru bez větších chyb. Technické parametry tohoto robota najdeme na stránkách, které jsou uvedeny u popisku Obr. 7. Obr. 7: Khepera IV. Dostupné na WWW: Robot Khepera IV se pohybuje v 2D světě (pokud nepočítáme čas jako další dimenzi). Tento fakt využijeme, protože v současnosti také nepočítáme s pohybem v 3D prostoru (možná v budoucích studiích). Další zajímavostí může být, že robot má v sobě C/C++ překladač. Zde bychom chtěli upozornit na velkou výhodu naší práce. Protože naše aplikace pracuje s vlastními protokoly, které jsme navrhli pro komunikaci mezi agenty, vzniká zde nezávislost na jazyce, v jakém bude programován robot. Tuto informaci si více rozebereme. Zprávy, které si mezi sebou agenty posílají, jsou zasílány skrze standardní TCP/IP. Toho jsme využili v náš prospěch, abychom zaručili mlutiplatformní programování. Robot může být programován v libovolném jazyce, musí být dodržen pouze formát přijímaných zpráv a formát odesílaných zpráv. Pokud se formát zpráv zachová, pak druhá strana bude vždy vědět, o jaký příkaz jde, ať už je robot programován v jakémkoli jazyce. 3.2 Reprezentace prostředí Již v některé předchozí kapitole jsme zmínili absenci reprezentace prostředí v našem projektu. Absence reprezentace prostředí není z důvodu, že bychom nechtěli řešit tuto problematiku, právě naopak. Rozsah řešení této problematiky je značně složitý a proto z tohoto důvodu při rozdělení naší práce na dílčí subprojekty, jsme se museli i my zaměřit pouze na jeden problém, což byl kooperační mechanismus. Nutnost řešení reprezentace prostředí nebylo až tak důležité také z toho důvodu, že jsme pohyb robota simulovali v uměle vytvořeném prostředí našeho simulátoru. Ovšem dostali jsme do fáze projektu, kdy musíme začít řešit i prostředí, do kterého robota umístíme. Reprezentaci prostředí můžeme řešit mnoha způsoby. My se zaměříme pouze na jeden, který se pokusíme v následujícím textu popsat. Mapování prostoru je velice těžký problém. V našem případě budeme prostor mapovat způsobem, který je analogicky podobný způsobu mapování prostředí slepým člověkem, který je umístěný do neznámého prostředí. Na začátku robot nebude mít žádnou představu o tom, kde se nachází nebo, co má kolem sebe. Postupným pohybem a získáváním dat ze senzorů si bude černá nezmapovaná místa zaznamenávat jednoduchými značkami. Protože v našem simulátoru robot nemohl za definované hranice, i v novém řešení bychom robota omezili pouze na ohraničenou oblast definovanou jednotkami vzdálenosti (cm, m). Pokud by robot danou oblast zmapoval celou, uložil by si danou oblast. Ve chvíli, kdy by naše aplikace zjistila, že má zpracovaný celý prostor například tím, že by robot prohledával stále stejný prostor, mohl by si systém vytvořit spojitý model prostředí (například půdorys bytu). Na základě tohoto modelu bychom upravili složitost některých procesů v systému v některých z etap životního cyklu manažerského agenta. Manažerského agenta z toho důvodu, protože se stará o spouštění senzorů a zpracovávání dat ze senzorů. Robot by nemusel tak často využívat senzorů pro skenování okolí. Zde bychom mohli opět použít analogicky podobný příklad se slepcem. Pokud jsme slepý člověk, který obývá nějaký prostor, většinou si tento prostor nastavíme tak, aby se rozložení jeho vybavení měnilo co nejméně. Ve své domácnosti se pak pohybujeme na základě paměti. Pamatujeme si rozložení nábytku a jiného vybavení v prostoru. Toto řešení má své nevýhody. Jedna z největších nevýhod je i malá změna prostředí. Problém by se dal vyřešit tak, že bychom senzory nechali kontinuálně běžet na pozadí aplikace. Pokud bychom na senzorech zaznamenali kritickou hodnotu, tedy hodnotu, kdy by 132

133 mohlo dojit ke kolizi s jiným objektem, vypnul by se autopilot, který řídil robota podle zaznamenaného prostředí. Po vypnutí autopilota, bychom opět začali mapovat prostředí do té chvíle než bychom zaznamenali všechny změny. Reprezentací prostředí se budeme jistě zabývat v některé další studii, kde bychom také rádi použili naši studii transparentní intezionální logiky. S ohledem na rozsáhlost tohoto problému, ale musíme postoupit dále a nezacházet do příliš velkých detailů. 3.3 Adaptace kooperačního mechanismu O kooperačním mechanismu, který v našem projektu používáme, jsme si v tomto článku řekli spoustu užitečných informací. V této kapitole již nebudeme věnovat tolik času dalšímu vysvětlování, zaměříme se zde na konkrétní úpravy výše popsaného mechanismu. Úpravy poslouží pro adaptaci naší aplikace k ovládání fyzického robota nikoli robota v simulátoru. Nejdůležitější úpravou našeho mechanismu je pohyb robota. V simulátoru se robot pohyboval v prostoru souřadnic. V reálném prostředí se robot po souřadnicích pohybovat nemůže. Zde musíme souřadnice nahradit jednotkami vzdálenosti. Takže první velká úprava je výpočet, který vykonávají řešitelské agenty. Nyní řešitelské agenty nebudou vypočítávat novou souřadnici robota, ale vzdálenost, o kterou se robot posune určitým směrem. Další programovou úpravou bude vytvoření nového stavu. V předchozích kapitolách jsme si říkali, že robot může být ve třech stavech: nese, sbírá a potrava. Tyto stavy nadále zůstanou, ale nyní musíme počítat ještě s jedním faktem. Robot na začátku nebude mít představu o tom, kam má odpad odnést nebo kde nalezne potravu (dobíjecí zařízení). Proto nám přibude jeden nový stav a to mapuje. Problém s nalezením napájení můžeme vyřešit velice jednoduše. Místo odkud robot vyjede, bude nastaveno jako defaultní a v jeho reprezentaci prostředí bude zaznačeno hned od začátku jako místo, kde nalezne zdroj napájení. Ve chvíli, kdy přejde na režim autopilot změní svůj stav na sbírá a jeho práce může začít. Důležitá programová úprava nastane v souvislosti se stavem nese. Doposud jsme se zde bavili pouze o pohybu robota. Co ale bude cílem robota? Kdy se změní stav sbírá na stav nese? Tyto otázky jsou důkazem složitosti našeho projektu. Součástí dalších studií, jak už čtenáři může být patrné, budou algoritmy rozpoznávání obrazů. Robot bude muset rozpoznat objekt, který mu nahrajeme do distribuované databáze objektů. Časová náročnost tohoto řešení, které budeme uvádět do praxe, bude značná a proto se nebudeme nyní pouštět do dalších teoretických spekulací. Další změnou kooperačního mechanismu je práce s centrální bází znalostí. Tímto problémem se zde nebude zatím příliš zabývat, opět tuto část projektu necháváme pro budoucí studie a publikace. Pouze zde naznačíme možná řešení, která ovšem nejsou ověřena. Robot bude v čase mapování sbírat zkušenosti. Tyto zkušenosti budou zapsána v podobě pravidel, které se budou buď dávkově zasílat do centrální báze znalostí nebo kontinuálně (realtime). 4 Praktické využití Zaměříme se na praktické využití práce, kterou jsme v předchozích kapitolách v tomto článku popisovali. Praktické využití tohoto projektu může být velice rozmanité. Podíváme se na jednu z možností, kterou si trochu popíšeme. Na Obr. 8 máme znázorněnou základní myšlenku použití našeho konceptu. Můžeme zde vidět pyramidové znázornění, kde jsme se snažili zobrazit tři vrstvy resp. tři úrovňový pohled na naši aplikaci. Obr. 8: Praktické využití konceptu Hayekova stroje pro řízení robotů. Základna pyramidy je tvořena obrázky robotů. V této vrstvě poukazujeme na již zmiňovanou informaci, že robot může být programován v libovolném jazyce. Komunikace probíhá skrze předem navrhnutých postupů komunikace. Další vrstvu obrázku znázorňují počítače. Zde jsme se snažili znázornit přímo naši řídící aplikaci, na které pracuje náš kooperační mechanismus. Význam šipek mezi spodními vrstvami by měl být čtenáři zřejmý z předchozích kapitol. Poslední vrstva znázorňuje datové uložiště. Zde se dostáváme k hlavní myšlence. Jedná se o to, že bychom chtěli docílit, aby naše aplikace dokázala ovládat libovolný počet robotů. S tím samozřejmě souvisí i vytížení výkonu fyzického zařízení (stolního počítače, notebooku), na kterém naše řídící aplikace poběží. Řídících aplikací může být spuštěno také větší množství na různých zařízeních a každá řídící aplikace bude řídit jen určitou množinu robotů. Tohoto výsledku jsme schopni dosáhnout, avšak myšlenka jde dále. Pokud bychom vytvořili aplikaci, která by byla schopna řídít nějakou množinu robotů, chtěli bychom také mít distribuovanou bázi znalostí. Tato báze 133

134 znalostí by se dynamicky rozšiřovala, pomocí sběru dat každým robotem. Roboti by zasílaly nové situace nebo poznatky do řídící aplikace. Každá řídící aplikace by následně ukládala nové situace nebo poznatky do centrální báze znalostí. Tím bychom dosáhli obrovských rychlostí učení našeho systému jako celku. Každy robot s minimálním programovým vybavením by se mohl rozhodovat na základě informací, které by zjistili v pruběhu života jiní roboti. Myšlenka by se dala použít i v komerčním sektoru. Problém, který v tomto řešení vzniká, je komunikace skrz veřejné a privátní sítě. Protože v našem řešení počítáme se vzdálenými přístupy k datovému uložišti a také je zde nutná komunikace mezi agenty v řídící aplikaci. Neposlední a důležitá komunikace je také mezi řídící aplikací a samotným robotem. Pokud bychom zajistili, že komunikace bude probíhat bez chyb a bez možných výpadků, pak by bylo možné naše praktické řešení aplikovat. Tento problém by mohl vyřešit vzdálený přístup skrz VPN 2 technologie popřípadě jinou síťovou technologií. Ovšem hledání řešení výše zmíněného problému, budeme věnovat čas v některém z dalších článků. 5 Závěr Závěrem této práce bychom si měli vyhodnotit informace, které jsme získali. V první části tohoto článku jsme si připomněli jaký kooperační mechanismus jsme vybrali v našem projektu. Tento mechanismus byl stručně popsán s ohledem na starší práce, kde jsme se na kooperační mechanismus přímo zaměřili. Zmínili jsme se zde o fuzzy logice, kterou v našem projektu používáme za koprodukce Java knihovny. Další část této práce byla zaměřena na popis fyzického robota, s kterým budeme pracovat. Zaměřili jsme se na popis a možnost reprezentace prostředí. V poslední fázi této části článku jsme si vysvětlili, jak používáme kooperačního mechanismu při ovládání robota. Poslední část tohoto článku jsme zaměřili na praktické využití našeho výzkumu. Jak bylo možno vidět, využití našeho systému není zatím mnoho. My ale věříme, že v průběhu vývoje získá náš systém mnohem komplexnější podobu, která již bude schopna konkurovat jiným nástrojům k řízení robotů, jenž jsou na trhu. Projekt jak již bylo zmíněno na začátku je stále v pohybu. Proto při čtení tohoto článku, je nutno brát v úvahu také pokrok při vývoji, popřípadě samotnou změnu cesty ve vývoji. Poděkování Tento článek vznikl za podpory projektu Biologicky motivované výpočetní modely, aplikace ( ) s kódem projektu SGS/24/2013. Literatura Mamula, L. (2013). Simulace hněvu v Hayekově multiagentovém systému. Diplomová práce, Opava. Kubík, A. (2004). Inteligentní agenty. Computer Press, a.s. Brno. ISBN: Spell B. (2002). Java Programujeme profesionálně. Computer Press, a.s. Praha. ISBN: Thagard P. (2001). Úvod do kognitivní vědy. Mysl a myšlení. Portál, s.r.o. Praha. ISBN: Petrů M. (2007). Fyziologie mysli. Triton. Praha. ISBN Mamula L. (2014). Fuzzy logika v multiagentovém systému s umělou ekonomií. Kognitivní věda a umělý život. 2: Duží M. (2012). TIL jako procedurální logika. Aleph. Bratislava. ISBN Virtual private network 134

135 Kognícia a umelý život 2015, Trenčianske Teplice Rozšiřování kognitivních schopností: neuro-implantáty a HTM model neocortexu Marek Otáhal, Jaroslav Vítků, Pavel Nahodil ČVUT FEL, kat. Kybernetiky Karlovo náměstí 13, Praha [email protected] Abstrakt Přehled přístupů v oblasti neuro-biologicky inspirovaných technologií 1 a jejich rozdělení, ukázky využití a metody rozšiřování kognitivních schopností člověka. Konkrétněji se pak zaměříme na Hierarchical Temporal Memory-Cortical Learning Algorithm (HTM/CLA) paměťový model jehož princip vychází z biologické inspirace mozkovou kůrou savců - neopalliem, a který využíváme například pro rozpoznávání anomálií v sekvenčních datech (EKG, video,...) a výzkum senzomotorických signálů (robotika). Třetí část je věnována metodám interakce člověka a stroje na úrovni centrální nervové soustavy (CNS) či přímo mozku (brain-computer interface - BCI) a rozvedeme diskusi o možných vylepšeních kognitivních schopností lidí využitím a propojením biologických a umělých neuronových sítí v jeden funkční celek a možné dopady na společnost a psychiku jedince. Klíčová slova: neuromorphic HW, brain-computer interface, BCI, Hierarchical Temporal Memory, HTM/CLA, enhancement 1 Úvod do současného stavu výzkumu a technologií v neurovědách Po století páry a počítačů bývá to 21. mnohými označováno za století mozku. Umožnily to nové poznatky v neurovědách, rozvoj technologií pro sledování mozku, jako fmri, neuro-sondy apod, zvyšování výkonu procesorů zase přineslo renezanci neuronových sítí obecně a vznikají modely umělých neuronových sítí simulující svou biologickou předlohu do stále lepších detailů. To se projevuje i na politické úrovni - EU i USA podporují velké vědecké projekty zaměřené na mapování a simulaci funkce celého mozku, tzv. connectomy 2 Příkladem je např. connectome háďátka obecného na obr. 1. Tento pokrok prudce akceleruje zájem o obor, zapojují se mnohé komerční subjekty a vzniká specializovaný hardware - 1 neuromorphic hardware, biologické modely neuronových sítí, connectomy 2 connectome = detailní mapa nervových spojení mozku, diagram zadrátování, např.: The BlueBrain Project, The Connectome Project, The Human Brain Project,.. Gewaltig (2013), Frackowiak (1998) brain-chipy, retina implantáty,...hsu (2014); Stingl a spol. (2015) Obr. 1: Connectome háďátka obecného (C. Elegans), je v podstatě triviální v porovnání se snahou o model mozku myši či člověka, nicméně je kompletně hotový a umožňuje 3D simulaci nervové, svalové i trávicí soustavy háďátka ve virtualním prostredí. Zdroj: OpenWorm ProjectSzigeti a spol. (2014) 1.1 Rozdělení technologií v neurovědách Přehledově bychom mohli pokrok rozdělit podle použitých technologií: hardware senzory (oční, sluchové či hmatové implantáty) měření aktivity mozku (sondy, pole, fmri, EEG) neuroprostetika (např protéza ruky napojená na zbylá nervová zakončení) software connectomy, mapy nervových HUBů, atlasy neuronů biologicky inspirované umělé neuronové sítě (ANNs) - od deeplearningu, přes HTM, spiking ANNs až po např. BlueBrain project, OpenWorm project 1 135

136 Případně dělit pokrok podle nasazení: Lékařské poznatky zaměřené na člověka zahrnují vývoj léků (simulováno právě na reálných modelech CNS/mozku), neuro-stimulátory umožňují potlačit např. vliv Parkinsonovy choroby, nebo zmiňovaná neuroprostetika (snaha o navrácení funkčnosti nejčastěji zraku (viz. obr. 7), sluchu či pohyblivosti končetin, ať už přímo, nebo přes jiný smyslový orgán). Kde nejsou dostupné implantáty, snažíme se pacientovi poskytnout alespoň lepší možnosti komunikace - přes rozhraní mezi člověkem a počítačem (human-computer interface, HCI), či přímo mezi mozkem a strojem (brain-machine interface, BMI, Hsu (2015)). O poslední zmiňované má jistě zájem i armáda. Na různé úrovni se projevuje pokrok i v běžně používaných technologiích: hlasové/zrakové ovládání, monitorování biologických signálů, asistované rozhodování, predikce, detekce anomálií, rozpoznávání, komunikace,... např. při řízení letadel (i modelů - dronů), chir. operacích nebo třeba modelování, tréninku lékařů i vojáků anebo obchodování na burze. Za tím stojí i rozvoj obecné umělé inteligence (AI), která modeluje obrovská množství, často sekvenčních, streamovaných dat z různých zdrojů a dovoluje nám nad nimi uvažovat, či dovoluje simulovat mozek na dostatečně detailní úrovni (Gewaltig, 2013) a realizovat tak některé experimenty výrazně rychleji a z prostředí kanceláře. Na jeden z těchto modelů se podíváme v další kapitole, v poslední části pak rozebereme teoretické možnosti vylepšování kognitivních schopností zdravých lidí v blízké budoucnosti. 2 Hierarchická temporální paměť (HTM) Tato kapitola seznamuje s pojmem hierarchické temporální paměti (hierarchical temporal memory, HTM)(Hawkins a George, 2006; Hawkins, 2010; Mishkin a spol., 1997), což je biologicky inspirovaný model neuronových sítí, vycházející z inspirace mozkovou kůrou savců (neopallium, neocortex). Podle úrovně, o jak přesný biologický model jde, se HTM řadí mezi deeplearning, spiking-nns a connectomy, poměrně detailně modeluje důležité principy mozkové kůry (synapse, sloupce, inhibice, struktura, proces učení), ale zavádí některá zjednodušení (např. binární váhy, neurony stejného typu, zjednodušený synaptický potenciál) protože se snaží modelovat globální funkcionalitu - spatio-temporální paměť, detekce anomálií, online učení, reprezentace vzorů (ne tolik už například přenosy mezi synapsemi). Místo podrobného popisu HTM, které se dosti výrazně liší od klasických ANNs, bych zde rád představil hlavní myšlenky této teorie, používané koncepty a její výhody a uplatnění. Detaily lze prostudovat v Hawkins Obr. 2: Three Golden Columns - Mozková kůra se skládá z tisíců sloupců tvořených jednotlivými neurony. Každý sloupec má průměr cca 0.5mm a obsahuje zhruba neuronů. Kůru je také možné organizovat horizontálně do vrstev, žluté neurony na obrázku jsou velké pyramidové neurony v 5. vrstvě, na pozadí neurony dalších typů utvářející jeden sloupec kůry. Zdroj: IBM/EPFL Blue Brain Project (2010), případně kontaktovat komunitu NuPIC, která je velmi aktivní ve vývoji i výzkumu a jejímž jsem členem, algoritmus je imlementovaný jako open-source a poměrně dobře nasaditelný v praxi. 2.1 Teorie neocortexu Mozková kůra u savců má několik velmi zajímavých funkcí a vlastností, a právě z tohoto důvodu byla zvolena za biologickou inspiraci pro HTM teorii. Mezi důvody patří: Modeluje vyšší kognitivní funkce V lidské mozkové kůře je realizováno zpracování řeči, vidění, slyšení, uchování epizodické paměti, detekce anomálií v sekvenčních datech, spojení informací z různých smyslových vjemů i senzomotorické chování. Tyto úlohy patří i v dnešní době k velmi obtížně algoritmicky zpracovávaným. (Pulvermüller a spol., 2014) Jednotný princip a struktura Přes poměrně velké rozdíly ve výše popisovaných aktivitách zpracovávaných kortexem je velmi zajímavé, že neocortex má v podstatě homogenní strukturu, což vedlo k myšlence, že i všechny jeho oblasti pracují na stejném principu a mělo by tedy být možné je řešit stejným algoritmem - to vedlo ke vzniku teorie HTM. Neocortex je tvořen neurony ve vertikálních sloupcích, a také horizontálními vrstvami a zpětnými spojeními mezi nimi (viz obr. 2). Zjednodušeně, sloupce vykonávají stejnou funkcionalitu a vrstvy pracují na stejné úrovni abstrakce. (Creutzfeldt, 1977) Hierarchie, abstrakce a stabilní reprezentace Hierarchické uspořádání, stejně jako u deep-nn, vytváří abstraktnější reprezentace. Neocortex má také hierarchickou strukturu, jak vidíme na obr. 2. Důležité jsou zpětné vazby jdoucí z vyšších vrstev 136

137 (stabilnější) do nižších, tím vznikají stabilní reprezentace na vyšších vrstvách pro celé sekvence. (Fuster, 2009) Online učení, predikce a detekce anomálií HTM se učí na proudech dat (stream), online a bez učitele; zpracování sekvencí je důležité, protože mnohá smyslová data (krom zraku) nejdou rozpoznat z jednoho doteku, je potřeba si věc osahat sekvencí akcí a vytvořit si tak její model v paměti. To lze uvést na příkladu rozpoznávání písničky podle not, z jedné noty nepoznáme nic, ale už z pár not je znát celá písnička. Stejně tak neustále probíhá detekce anomálií, které plní funkci pozornosti (attention), kde v pokoji si nevšímáme věcí postupně, ale ihned si všimneme chybějící vázy. (Hawkins, 2013) Obr. 4: Ukázka konceptu v sparse, distributed reprezentaci - SDR. Koncept je tvořen sjednocením aktivních buněk z bottom-up vstupu (červeně) a predikovaných buněk z horizontálních synapsí (zeleně). Jeden koncept v SDR může fuzzy reprezentovat několik konceptů najednou. Zdroj: Numenta, Modelling Data Streams workshop Obr. 3: (a) Hierarchická struktura regionů v HTM. (b) Vznik stabilních reprezentací sekvencí na vyšších úrovních hierarchie. Zdroj: Hawkins & George, Sequence memory for prediction, inference and behaviour 2.2 Koncepty v HTM Tato sekce seznamuje s termíny zaběhlými v HTM, které usnadní případné čtení dalších článků. Sparse, Distributed Reprezentace (SDR) V HTM jsou myšlenky, vzory reprezentovány výstupem sloupců, tedy binárními vektory. Této reprezentaci se říká sparse distributed - SDR - Ahmad a Hawkins (2015). Distributed je něco mezi úplným kódováním a grandmother cell 3, je v něm jeden neuron (sloupec) přepoužit ve více reprezentacích, a přitom jedna reprezentace je vždy skupinou několika aktivních neuronů. Sparse znamená, že je aktivní vždy stabilní (a malé, cca 2%) procento buněk. Příklad takové reprezentace na obr. 4. SDR mají další zajímavé vlastnosti: podobné koncepty mají podobné reprezentace a existuje aritmetika, významová suma konceptů se vyjádří sumou (log. OR) reprezentací - např. ovoce = jablka + hrušky +... Síť, region, sloupec, vrstva, neuron HTM tvoří síť regionů s dopřednými a zpětnovazeb- 3 Úplné kódování - max hustota informace, bin. kód; Grandmothercell - opak, jeden neuron reprezentuje jeden koncept. nými vstupy, region je skupina sloupců, které vykonávají stejnou funkci (např. V1 region pro vidění), tyto sloupce jsou tvořeny neurony. Sloupce šíří informaci vertikálně, neurony horizontálně v rámci regionu. Regiony mohou tvořit horizontální vrstvy s podobnou úrovní abstrakce. Pak se vyskytují synapse v segmentech, to jsou nejmenší modelované jednotky. Spatial Pooler, Temporal Pooler, Temporal Memory Spatial Pooler (SP) je fuknční (algoritmický) koncept, který realizuje prostorovou paměť, vstupy do systému převádí na SDR. Temporal Pooler (TP) - sekvenční paměť, vytváří kontext. Pro každý vstup generuje predikce pro další krok a udává anomálnost aktuálního vstupu. Temporal Memory (TM) obdobně provádí temporální pooling - abstrahuje časté sekvence do nového konceptu SDR. Učení - Cortical Learning Algorithm (CLA) Učení probíhá online na principu Hebbovského učení, pokud neurony správně predikovaly v čase T- 1 aktivitu, posílí se váha spojení s neurony aktivními v čase T. Schematické znázornění učení v HTM na obr. 3 a 5, blíže v Hawkins (2010); Hawkins a George (2006). 2.3 Vhodné úlohy Z principu je HTM vhodná pro podobné úlohy, které řeší neocortex. Naopak nevýhody vyplývají z online učení bez učitele, nevhodné je učit se z malého množství labelovaných dat, dobře dokáže detekovat anomálie ve streamovaných datech Hawkins (2013), v datech s dírami, sjednocovat data s různou modalitou nebo reprezentovat 137

138 Obr. 5: Tvorba kontextu pomocí více buněk ve sloupci (zde 4), kde různé buňky mají různá synaptická spojení mezi sebou, čímž dokáží odlišit stejnou věc v různých kontextech. Výsledný vzor pak odpovídá sjednocení aktivity všech buněk ve sloupci. Zdroj: Numenta, Modelling Data Streams workshop celé sekvence (akce, např. pohyb ruky robota) novým konceptem. Tématicky je HTM vhodné pro predikci v sekvenčních datech a detekci anomálií (na obr. 6 detekce anomálií v signálu EKG.), ve stádiu výzkumu je NLP, zpracování video a audio dat a motor-cotrol. (Valentin, 2014) Předchozí část seznámila s hierarchickou temporální pamětí (HTM) a popsala její výhody a nasazení, tato kapitola se zaměří na možnosti rozšiřování kognitivních schopností zdravého jedince využitím speciálních senzorů, biologických neuronových sítí a brain-computer rozhraní (BCI). Metod (s různou mírou důvěryhodnosti) pro zlepšení kognitivních schopností existuje mnoho druhů - pomocí podpůrných léků (nootropik), zdravý životní styl a cvičení (prokrvení, dostatek spánku), meditace (pozitivní nálada, uklidnění se prokazatelně přepíná mozek do jiných stavů, kde se lépe učí), sankalpa 4, laterální myšlení (hledání kreativních řešení v době, kdy je mozek mimo soustředění, tedy unaven), udržování si neuroplasticity (různé kognitivní hry, předkládání stále nových problémů k řešení), učení se cizím jazykům (vytváří jiné reprezentace pro koncepty slov a tím jiné myšlení) Na biologické úrovni tyto metody mají společné: výživu neuronů (strava, spánek - odplavování nečistot, cvičení - okysličení), posilování a růst nových spojení (mentální aktivita). V následujících sekcích se podíváme na různé možnosti zlepšení mozkové aktivity - neuro-enhancementu. 3.1 Neuro-implantáty, human-machine rozhraní Jedná se o připojování nových senzorů (častější) a aktuátorů k člověku. Nejčastěji jde o nějaký neuromorfický hardware, který se pomocí HMI/BCI připojuje k centrální nervové soustavě (to je jednodušší) nebo přímo do mozku. Díky neuroplasticitě a díky velké redundanci (jak ukazuje HTM model) je možné se přizpůsobit novým vjemům i z jiné modality (druhu), ovšem přeučení se na pouze pozměněný typ je snažší. Příkladem je např. infra-červené vidění - napojení kamery s jiným spektrem snímání než má lidské oko na optický nerv (obr. 7), 3. oko - přídavný vizuální senzor napojený na jiný senzorický vstup (jazyk), Magnetickýsmysl v prstu napojený na hmatové vnímání, tepelné čidlo, nebo exotičtější - třeba vnímání hodnoty akcií v čase přes haptický nerv. Možností je opravdu mnoho, v podstatě lze zvolit jakýkoli fyzikální senzor, či libovolný informační zdroj, vhodně ho převést do neuronové reprezentace, připojit na (existující) smyslový vstup a naučit se ho používat - rozlišovat Asistované učení Obr. 6: Detekce anomálií v EKG signálu pomocí HTM. Zdroj: Numenta 3 Návrhy zlepšení kognitivních schopností člověka za použití neuronových sítí Po připojení nového smyslového senzoru se na něj musí nervová soustava adaptovat, to otevírá novou zajímavou větev výzkumu - asistované neuro-učení. Jde o to se co nejdříve naučit správně interpretovat signály jdoucí z/do senzoru. To je případ učení s učitelem (supervisedlearning), kde využijeme spatio-temporální paměti a Hebbovského učení 5 Můžeme stimulovat výstup ze senzoru, vstup na připojených nervech, nebo přímo i mozkové 4 Sankalpa - technika práce s podvědomím před spánkem pomocí pozitivní motivace a navození myšlenek 5 Hebb. pravidlo - Who fire together, wire together, blízké události mají kauzální linku. 138

139 3.2.1 Brain-AI interface, uvažování asistované AI Obr. 7: Neuroimplantát umělé sítnice připojený na optický nerv, nový úspěch - 30x40pixelů! Umožňuje znovu vidět pacientům se ztrátou zraku. Zdroj: Retina Implant AG, 2010 regiony. Dalším využitím by bylo zrychlování reflexů 6 pro sportovce či armádu (trénování sešlápnutí brzdy v (předpřipravené) krizové situaci, ještě dříve, než ji mozek vyhodnotil jako nebezpečnou a signál došel zpět do nervů (ruky),...) 3.2 Brain-brain interface, Brain-computer interface, rozšiřování paměti Následující postupy by vyžadovaly výrazně složitější hardware pro I/O rozhraní - muselo by být přímo v mozku a napojovat skupinu neuronů, tomu se říká electrode array a pokusy s nimi byly provedeny zatím jen na zvířatech. (Weyand a spol., 2015; Grandchamp a Delorme, 2009) Brain-brain interface: pokud by se zdálo, že existuje univerzální formát reprezentace informace v mozku (např. SDR), šlo by se naučit mapování mezi SDR1 pro člověka1 a SDR2 pro člověka2, pak by Č1 a Č2 mohli komunikovat posíláním zpráv přímo mezi svými mozky - telepaticky. Podobným způsobem přes mapování reprezentací v mozku, by bylo možné realizovat rozšíření paměti, ať už sdílením zkušeností někoho jiného (viz. případ výše), i odhadnutím vlastního mapování (např. pro doménu rozpoznávání hub), a příslušného dotrénování v umělém paměťovém modulu (HTM). Při vyhodnocování by se pak vstupní signál posílal do obou center současně (biologického i umělého) a to, které by vracelo výstup s větší jistotou by bylo použito jako dominantní. 6 Podle jedné studie jsou naše reflexy výrazně pomalejší než u lidí žijích v 18. století. Pravděpodobně je to dáno způsobem obživy. I v dnešní populaci jsou trénovaní jedinci s výrazně menšími reakčními časy Navázáním na témata výše je rozšíření funkcionality mozku o nové/jiné výpočetní schopnosti - upravením HTM dokážeme dělat různé transformace s procházejícími myšlenkami. Jednalo by se o nový NN modul zapojený do cest (neural pathway) v mozku, vstupem je SDR, uvnitř transformační model HTM, výstupem zase SDR. Například bychom mohli detekovat anomálie v signálech, pomáhat při plánování (predikce N-kroků vpřed) nebo myslet abstraktněji - HTM namapované jen na podčást prostoru se SDR provádí kompresi informace (ale co nejvíce bezeztrátovou ) a tím efektivně generalizuje; či kreativně - provede kompresi směrem nahoru v hierarchii, ale pak i zpětnou dekompresi s náhodným šumem - dochází k nepřesnému re-kódování vstupu a tím vzniku alternativní/kreativní reprezentace konceptu. 4 Diskuse Myšlenky zmiňované v poslední kapitole představují výzkumné výzvy, co se neurobiologických modelů mozku týče, především je potřeba prozkoumat možnosti propojení mezi umělými a biologickými sítěmi. Na poli hardwaru je hlavně otázka (pro neuronová pole), jak co nejpřesněji a nejšetrněji stimulovat a číst nervová zakončení či přímo neurony/synapse v mozku. Pro experimenty by zatím bylo vhodné použít modely connectomů, případně opatrně testovat na zvířatech v laboratoři. Zajímavou otázkou je, jak by se mozek vyrovnal s tak výraznou změnou - přidání nového modulu/smyslu, za povšimnutí ovšem stojí nedávno provedená transplantace hlavy na úplně jiné tělo! Krom dopadů na psychiku jsou zde i zajímavé problémy etické a sociologické. Poděkování Tato práce byla podpořena z výzkumného grantu No. SGS14/144/OHK3/2T/13. Literatura Ahmad, S. a Hawkins, J. (2015). Properties of Sparse Distributed Representations and their Application to Hierarchical Temporal Memory. Creutzfeldt, O. D. (1977). Generality of the Functional Structure of the Neocortex. Naturwissenshaften, 64: Frackowiak, R. (1998). Recreating the Brain Online. Science, 279(5355):p Fuster, J. M. (2009). Cortex and memory: emergence of a new paradigm. J Cogn Neurosci, 21(11):

140 Gewaltig, M.-O. (2013). The Human Brain Project: Chances and Challenges for Computer Science. Horbach, M. (zost.), V GI-Jahrestagung, vol. 220 z LNI, str. 16. GI. Grandchamp, R. a Delorme, A. (2009). NeuroTRIP: A Framework for Bridging between Open Source Software. Application to Training a Brain Machine Interface. V Signal-Image Technology Internet-Based Systems (SITIS), 2009 Fifth International Conference on, str Weyand, S., Takehara-Nishiuchi, K. a Chau, T. (2015). Weaning off Mental Tasks to Achieve Voluntary Self- Regulatory Control of a Near-Infrared Spectroscopy Brain-Computer Interface. Neural Systems and Rehabilitation Engineering, IEEE Transactions on, PP(99):1 1. Hawkins, D. D. J. (2010). Hierarchical Temporal Memory including HTM Cortical Learning Algorithms. Technická správa. Hawkins, F. a George, D. (2006). Hierarchical Temporal Memory: Concepts, Theory, and Terminology. Technická správa, Numenta Inc. Hawkins, J. (2013). Online Learning from Streaming Data. V Proceedings of the 22Nd ACM International Conference on Conference on Information & Knowledge Management, CIKM 13, str , New York, NY, USA. ACM. Hsu, J. (2014). IBM s new brain [News]. Spectrum, IEEE, 51(10): Hsu, W.-Y. (2015). Brain-computer interface: The next frontier of telemedicine in human-computer interaction. Telematics and Informatics, 32(1): Mishkin, M., Suzuki, W. A., Gadian, D. G. a Vargha- Khadem, F. (1997). Hierarchical Organization of Cognitive Memory. Philosophical Transactions: Biological Sciences, 352(1360): Pulvermüller, F., Garagnani, M. a Wennekers, T. (2014). Thinking in Circuits: Toward Neurobiological Explanation in Cognitive Neuroscience. Biol. Cybern., 108(5): Stingl, K., Bartz-Schmidt, K.-U., Besch, D., Chee, C. K., Cottrial, C., Gekeler, F., Groppe, M., Jackson, T. L., MacLaren, R. E., Koitschev, A., Kusnyerik, A., Neffendorf, J., Nemeth, J., Naeem, M. A. N., Peters, T., Sachs, H., Simpson, A., Singh, M. S., Wilhelm, B., Wong, D. a Zrenner, E. (2015). Subretinal visual Implant Alpha IMS - Clinical trial interim report. Vision Res. Szigeti, B., Gleeson, P., Vella, M., Khayrulin, S., Palyanov, A., Hokanson, J., Currie, M., Cantarelli, M., Idili, G. a Larson, S. (2014). OpenWorm: an open-science approach to modeling Caenorhabditis elegans. Front Comput Neurosci, 8:137. Valentin, K. (2014). Invariant Visual Object RecognitionUsing Hierarchical Temporal Memory. thesis. 140

141 Kognícia a umelý život 2015, Trenčianske Teplice Jazyk pre špecifikáciu pravidiel stolných hier ako základ automatického inteligentného hracieho robotického systému Pavel Petrovič Comenius University in Bratislava Mlynská dolina, Bratislava [email protected] Abstrakt Stolové hry sú ideálnou platformou pre štúdium rôznych aspektov umelej inteligencie. Predstavujeme systém pozostávajúci z robotického ramena, univerzálneho softvérového frameworku a jazyka na popis pravidiel stolových hier. Systém bol vyvinutý pre projekt na Letnej škole vedy v Požege v lete Predmetom záujmu je najmä deklaratívny jazyk s procedurálnymi prvkami. Pravidlá zapísané v tomto jazyku sú stručné, dobre čitateľné a efektívne interpretovateľné. Framework slúži na výskumné a výukové projekty zamerané na algoritmy pre hranie hier a špecifikačné deklaratívne jazyky. 1 Úvod Jedným z centrálnych problémov v umelej inteligencii je adekvátna reprezentácia poznatkov. Neexistuje jediný vhodný, správny a najefektívnejší spôsob reprezentácie. Naopak, jej výber je podmienený konkrétnou množinou úloh, ktorú má daný inteligentný systém plniť a z nej vyplývajúcej sady požiadaviek na reprezentáciu: Bude potrebné vykonávať akcie v spojitom priestore? Bude potrebné prijímať logické závery? Bude potrebné, aby systém vedel okamžite reagovať na podnety z prostredia (reaktivita)? Bude potrebné pracovať s neurčitou informáciou? Bude treba riešiť nemonotónne usudzovanie? Bude potrebné modifikovať reprezentáciu učením sa na základe skúsenosti? Ak áno, v akom režime s učiteľom, bez učiteľa, odmenou a trestom? Priamym zadaním inštrukcií? Bude potrebné reprezentovať procedurálne znalosti? Má ich systém byť schopný sám modifikovať? Bude treba riešiť ťažké problémy/úlohy? Má byť proces usudzovania a prijímania rozhodnutí dobre vysvetliteľný, zdôvodniteľný a človeku zrozumiteľný? V snahe konštruovať umelé inteligentné pre človeka užitočné systémy, ktorou sa odlišujeme od práce Všemohúceho a od zvrátených snáh o zostrojenie človeka s dvojnásobne veľkou hlavou a mozgovou kapacitou, si volíme také reprezentácie, ktoré sú v danej čiastkovej alebo celkovej úlohe najprimeranejšie. Preto nadmieru nevyzdvihujeme reprezentácie podobné inteligentným biologickým systémom, hoci sa nimi v prípade zjavnej užitočnosti bez zdráhania inšpirujeme a nebiologická plausibilita nám väčšinou pripadá vhodnejšia ako plausibilita biologická, keďže naše umelé systémy majú s biológiou a v prírode prebiehajúcimi metabolickými, reprodukčnými, evolučnými, enzymatickými a inými procesmi (aby sme pomenovali aspoň niektoré z mnohých) a ich magnitúdou spoločné asi toľko, ako majú príbehy o včielke Maji spoločné s výrobou plošných spojov do medzihviezdnych vesmírnych sond. Tým samozrejme nijako neznevažujeme vedeckú prácu kolegov biológov, lekárov a niektorých psychológov, ktorí skúmajú procesy v človeku a prípadne v ostatných živých tvoroch, ale predstavu o zostrojení niečoho mäkkého, príjemného, mysliaceho, chodiaceho po dvoch nohách ako my a komunikujúceho s nami rovnocenným spôsobom v tomto tisícročí, alebo prinajmenšom v tomto storočí najmä z pragmatických dôvodov nezdieľame. Nachádzame sa v ére drsných, tvrdých silikónových tvorov, ktoré nás porážajú svojou výpočtovou silou, presnosťou a spoľahlivosťou senzorov, množstvom naraz spracovávanej informácie, obrovskou fyzickou silou a rýchlosťou, pevnosťou, pružnosťou a odolnosťou materiálov. Sú našimi bezpodmienečnými otrokmi, ku ktorým sa správame chladnokrvne a neprisudzujeme im žiadne slobody a práva. Tieto tvory si preto vyžadujú celkom iné postupy a prístupy k návrhu, konštrukcii i riadiacej logike ako doposiaľ objavila príroda. Aj preto aj v dnešnej dobe pre pokrok prináša viac matematika ako konekcionizmus, napríklad. V tejto práci sa venujeme návrhu inteligentného systému, ktorý hrá stolové hry proti ľudskému hráčovi v prípade hier pre dvoch hráčov, alebo sám hry pre jedného hráča. Hlavným cieľom je vytvorenie systému, ktorý je univerzálny, čiže nie je predurčený na jednu konkrétnu hru alebo skupinu hier. Nové hry je možné systém naučiť hrať špecifikáciou pravidiel hry, ktorá sa zapisuje v našom vlastnom deklaratívnom jazyku s procedurálnymi prvkami a ktorý je jadrom tejto práce. Deklaratívne jazyky sú veľmi vhodné pre systémy umelej inteligencie, kde znalosti vkladá (alebo aspoň programuje) človek vďaka dobrej prehľadnosti a symbolickej povahe, ktorá je človeku zrozumiteľná a je 141

142 tiež formálne analyzovateľná na rozdiel od subsymbolických distribuovaných reprezentácií. Čiastočne obmedzujúce sa nám zdá byť ich časté jednostranné zameranie na niektorý inferenčný mechanizmus alebo výpočtový model: napríklad jazyk Prolog, pracujúci s Hornovými klauzulami využíva SLD rezolvenciu, alebo jazyk Scheme teoreticky vybudovaný na jedinom operátore lambda bez akýchkoľvek bočných efektov. Na jednej strane sú vhodnými prostriedkami pre formálne metódy analýzy programov, na druhej strane tieto zaväzujúce predpoklady môžu viesť k nepraktickým scenárom použitia a implementáciám. Myslíme si, že reprezentačný jazyk by mal dobre umožňovať nielen deklarovanie bázy poznatkov, ale poskytovať vyjadrovacie prostriedky pre ich procedurálne realizácie a to flexiblne nielen jedným vyhraneným štýlom interpretácie programu. Na druhej strane, miera všeobecnosti každého nástroja je ohraničená cieleným záberom a každá aplikácia má svoje hranice. Vytvorený jazyk je teda akýmsi hybridným diskusným príspevkom do tejto témy medzi mantinelmi všeobecnej a špecifickej vyjadrovacej sily, deklaratívneho a procedurálneho štýlu zápisu, formálnej čistoty a ad-hoc riešeniami s bočnými efektami. Je kompromisom vyplývajúcim zo série pragmatických rozhodnutí, ale z nášho hľadiska plní svoj účel dobre. V nasledujúcich statiach príspevku vysvetlíme špecifikáciu problému, ktorý sme riešili, opíšeme fyzický hardvér systému, softvérový framework pre experimenty so systémom, ktorý sme navrhli a implementovali v jazyku Java, definujeme jazyk na reprezentáciu pravidiel hier, uvedieme a analyzujeme príklady niekoľkých hier, prediskutujeme prepojenie jazyka s frameworkom, zmienime sa o alternatívnom prístupe, ktorý je predmetom aktuálne riešenej diplomovej práce a myšlienky na záver zhrnieme. 2 Problém Pôvodnou motiváciou pre túto prácu bola ústna komunikácia s kolegom Ľuborom Illekom, ktorý našej skupine vyčítavo pripomenul prečo už dávno nemáme na Matfyze robota, proti ktorému by bolo možné hrať dámu, človeče, prípadne šach a iné stolové hry? Túto myšlienku sme si osvojili a keďže sme získali jednoduché robotické rameno, zadali sme diplomovú prácu na túto tému. Okrem toho sme boli neskôr pozvaní ako projektoví vedúci na vyše týždňové intenzívne medzinárodné sústredenie pre stredoškolákov, Summer School of Science (S3), Požega, Chorvátsko Keďže rýchlosť postupu na diplomovej práci bola štandardná, rozhodli sme sa nezávisle od diplomanta radšej pripraviť vlastný framework, na ktorom by študenti na letnej škole mohli realizovať sadu experimentov o využití umelej inteligencie na hranie hier. Vychádzali sme z nasledujúcich predpokladov: systém bude hrať hry pre jedného alebo dvoch hráčov, ktorí sa v ťahoch striedajú hra pozostáva z postupnosti ťahov hra má cieľ, ktorému spravidla zodpovedá nejaká konfigurácia hry alebo jej parametre jeden ťah pozostáva z jedného alebo viacerých preložení kameňov - figúrok, ktoré sa smú klásť len na definované miesta ťahy by mali byť realizovateľné robotickým ramenom v štýle akcií pick & place situáciu hry a najmä jednotlivé kroky ťahov dokáže rozpoznať kamera hru je možné hrať aj virtuálne na simulovanej hracej ploche na každom mieste môže byť naraz iba jedna figúrka ostatné prípady sa riešia zmenou stavu figúrky, prípadne duplicitnými miestami každý kameň aj miesto, kam sa kamene ukladajú, majú svoj jednoznačný identifikátor a typ Pred príchodom na letnú školu sme museli vyriešiť nasledujúce úlohy: navrhnúť vhodný reprezentačný formalizmus pre popis pravidiel hry navrhnúť a implementovať parser pre tento formalizmus, ktorého výstupom je vnútorná reprezentácia stavu hry a pravidiel zabezpečiť kontrolu správnosti ťahov, generovanie možných ťahov v danej hernej konfigurácii a testovanie konca hry implementovať softvérové riadenie robota a spracovanie obrazovej informácie z kamery implementovať virtuálnu hraciu plochu a umožniť hráčovi hrať v grafickom simulátore pripraviť modulárny framework pre testovanie rozličných algoritmov umelej inteligencie, ktorých výstup by riadil robotické rameno a vstup by bol získavaný analýzou obrazu zachytávajúceho aktuálnu hernú situáciu, alebo ktoré môžu riadiť hráča v simulovanej hre vrátane vzájomných turnajov jednotlivých algoritmov, ktoré by mali byť spracované automaticky a vygenerovať logy vhodné na ďalšie štatistické spracovanie implementovať prvé príklady algoritmov umelej inteligencie do nášho frameworku ako východisko pre projekt na S3 vytvoriť niekoľko ukážkových špecifikácií hier. Všetky uvedené úlohy sme pred začiatkom S3 splnili a na S3 sme s tromi študentami vo veku okolo 16 rokov realizovali úspešný a pre nás v mnohom inšpiratívny projekt. Výstupom ich práce bol článok prezentovaný na konferencii ELMAR, Cvijović, Unger, Corazza (2013). V ďalšom opíšeme stručnú 142

143 motiváciu k stolovým hrám a komponenty vytvoreného systému. 3 Stolové hry Stolové hry sú tradičná oblasť výskumu (i výuky) v oblasti umelej inteligencie. Na ich úspešné hranie často nestačia bežné deterministické algoritmy. Pri ich hraní sa možno zdokonaľovať rôznymi spôsobmi učenia sa, možno využívať usudzovanie a uvažovanie, sú ideálnou platformou pre skúmanie tvorby analógií, induktívneho i deduktívneho uvažovania, reprezentácie poznatkov, plánovania a modelovania, generalizácie, či učenia sa z príkladov, Petrovič (1997). Niekto by dokonca mohol tvrdiť, že umelá inteligencia na úrovni základného výskumu iné problémy ako hry ani nepotrebuje, všetko ostatné sú buď aplikácie alebo niečo iné. Ľudia sa hrali stolové hry ešte keď stôl ani nevedeli vyrobiť. Stolové hry sa tešili popularite krížom skrz celú históriu ľudstva. Formovali inteligenciu, kombinačné schopnosti, úsudok ľudí a poskytovali potrebnú zábavu a rozptýlenie. 4 Systém Základ robotického herného systému tvorí rameno Lynxmotion AL5D so 6 stupňami voľnosti zakončené chápadlom otvoriteľným do šírky 3,175cm, obr.1. Sevromotory ramena sú riadené rozhraním SSC-32U, ktoré prijíma a interpretuje príkazy na sériovej linke pripojiteľnej cez adaptér do bežného portu USB a z programovacieho jazyka Java dostupného napríklad pomocou knižnice RXTX. Všetky odkazy možno nájsť na stránke Manipulátory na KAI (2015). intervalmi hodnôt vo farebnom modeli HSV a intervalom prípustnej veľkosti farebného segmentu v obraze. Vizuálnu informáciu spracováva samostatná za behu konfigurovateľná aplikácia vytvorená v C++. Pre jednoduchosť využíva na získavanie obrazu knižnicu OpenCV. S hlavným frameworkom komunikuje cez svoj štandardný vstup a výstup, ktoré sú frameworkom presmerované do komunikačnej rúry (pipe). Namiesto inverznej kinematiky pre určenie konfigurácií ramena, ktorú nám neskôr dodá diplomant, keď bude hotový, využívame jednoduchší spôsob. Pri definovaní pravidiel hry používateľ pomocou klávesnice riadi rameno robota a označí cieľové pozície, ktoré sa uložia do súboru. Tie sa potom využívajú počas bežného hrania hry na takto definovanej hracej ploche. Herná plocha je vždy pripevnená na rovnakej pozícii vzhľadom na súradnicový systém ramena robota. Priblíženie sa k figúrkam pred uchopením sa vykonáva v štyroch krokoch: rameno sa najskôr presunie nad danú pozíciu, potom sa priblíži kolmým pohybom nadol tak, aby bola figúrka medzi prstami chápadla, ktoré sa vzápätí uzavrie a v poslednom kroku sa opäť vráti na miesto niekoľko centimetrov nad figúrkou. Preto systém eviduje o každej pozícii dve sady nastavení pre servomotory: jednu pre pozíciu nad figúrkou a druhú pre jej pozíciu vhodnú na uchopenie. Problém hier, kde sa kamene umiestňujú do hry postupne, sme vyriešili množstvom prekrývajúcich sa políčok, na ktorých sú na začiatku uložené všetky figúrky a tieto políčka majú v špecifikácii hry atribút relevant=no, čo znamená, že ich obsah sa pri kontrole korektnosti ťahu nekontroluje striktne, ale vezme sa ľubovoľné z prekrývajúcich sa políčok, ktoré ešte malo obsahovať presunutý kameň. V praxi teda na toto prekrývajúce miesto robotovi pred uskutočnením jeho ťahu vždy podáme ďalší kameň. Obr. 1: Robotické rameno Lynxmotion AL5D s rozhraním SSC-32U. Herná plocha veľkosti približne jedného hárku A4 sa ukladá na drevenú podložku, nad ktorou je na hliníkových profiloch upevnená bežná USB webkamera. Figúrky do hier sú vyrezané z drevených profilov, alebo vypožičané z bežných stolových hier. Systém ich rozlišuje na základe farby, sú určené Obr. 2: Príklad hry pre jedného hráča (Frogs). Cieľom je vymeniť pozíciu zelených a hnedých žiab, ktoré môžu robiť iba krok alebo skok vpred. 5 Softvérový framework Framework s3games je vytvorený v jazyku Java v prostredí Netbeans. Z používateľského hľadiska ide o 143

144 grafickú aplikáciu s hlavným riadiacim oknom, oknom na vizualizáciu pohľadu z kamery a oknom na vizualizáciu herného plánu s aktuálnym stavom hry. V ňom ľudský hráč robí svoje ťahy, ak si zvolil simulovanú verziu hry. Napokon aplikácia disponuje riadiacim oknom pre robotické rameno s funkciami na pripojenie a inicializáciu robota, potvrdenie konca ťahu, ak je to potrebné a na priame riadenie ramena v režime definovania pozícií pre nový herný plán. Z vývojárskeho hľadiska je framework rozdelený na 1) modul komunikácie s robotom a C++ aplikáciou na spracovanie obrazu kamery, 2) modul grafického používateľského rozhrania, 3) modul riadenia hry (základný engine) vrátane parsera jazyka a operátorov nad vnútornou reprezentáciou hry a 4) modul s rozličnými stratégiami hry, algoritmami prehľadávania stavového priestoru a heuristikami. Špecifikácia hry je uložená v textovom súbore vo formáte Windows-like INI-súborov, rozdelenom na [Pomenované Sekcie] a dvojicami premenná=hodnota a časťou s voľným textom obsahujúcim definície funkcií a logických podmienok. Parsovanie premenných je priamočiare (nejde tu o nejaké premenné programovacieho jazyka, ale nastavenia rozličných parametrov a atribútov popisujúcich špecifikáciu hry). Definície funkcií a logických podmienok sú spracované dvojfázovo najskôr sú vytvorené postupnosti lexém, ktoré sú následne interpretáciou gramatiky popisujúcej jazyk prevedené do internej reprezentácie výrazov, ktorá podstatne urýchľuje ich vyhodnocovanie počas hry, keďže nie je potrebné ich za behu interpretovať z podoby textových reťazcov. Z hľadiska umelej inteligencie je najzaujímavejší základný engine, ktorý v krátkosti vysvetlíme. Hra je definovaná ako n-tica (ET, LT, L, E, EX, SC, EG, GR), pričom význam komponentov je nasledujúci: ET množina typov kameňov (element types) LT množina typov miest, kam je možné kameňe umiestňovať (location types) L množina miest, kde je možné kamene umiestňovať E množina kameňov a ich začiatočná poloha EX pomocné funkcie, ktoré sa môžu využívať v pravidlách, podrobnejšie ich vysvetlíme v stati o jazyku SC pravidlá o získavaní skóre v rozličných situáciách EG pravidlá o ukončení hry v rozličných situáciách GR pravidlá hry, podľa ktorých je možné ťahať. Okrem toho k definícii hry patrí: parametre figúrok na ich rozpozanie v obraze pre každý typ kameňov, obrázky, ktorými sa jednotlivé typy kameňov a typy políčok vizualizujú vo virtuálnej verzii hry, tvar a rozmery klikateľnej oblasti a relatívny posun každého zobrazeného obrázka, nastavenia servomotorov ramena pre dosiahnutie každého políčka a obrázok pozadia virtuálnej hracej plochy. Takto definovaná hra sa pri štarte hry inicializuje podľa začiatočných polôh všetkých kameňov a počas hry pozostáva aktuálny stav hry z n-tice (ES, EL, P, O, CP, W, SC, ZI, K), kde: ES je funkcia E->N priraďujúca každému kameňu jeho číslo stavu EL: E->L priraďuje každému kameňu miesto, na ktorom je práve položený P: L->E je opačné zobrazenie, každému miestu priraďuje kameň, ktorý je na ňom práve položený (alebo null, ak tam žiaden nie je), O: E->N priraďuje každému kameňu číslo hráča, ktorému daný kameň aktuálne patrí CP je číslo hráča na ťahu W je číslo vyhrávajúceho hráča (alebo -1 kým hra beží) SC: N->N je dosiahnuté skóre každého hráča ZI: E->N je zindex jednotlivých figúrok a má zmysel len kvôli vizualizácii vo virtuálnej verzii hry, voliteľne možno jeho východziu hodnotu zadať aj v definícii hry K je kontext hry, kde sú uložené hodnoty všetkých globálnych premenných, ktoré boli nastavené počas vyhodnocovania pravidiel. V mnohých hrách majú všetky kamene jediný povolený stav, možnosť zmeny stavu zodpovedá napríklad umiestneniu dekorácie na figúrku, prípadne slúži na zapamätanie stavovej informácie o priebehu hry, ktorá nie je vyjadrená iba pozíciou figúrky, napríklad: figúrka už bola v cieli a musí sa dostať naspäť do domčeka. Okrem stavu hry (trieda GameState) framework definuje triedu Game, ktorá riadi všeobecný priebeh hry: zabezpečuje striedanie hráčov v ťahoch a aktualizáciu stavu hry a abstraktnú triedu Player ktorej konkretizáciami sú buď jednotlivé algoritmy umelej inteligencie, ktoré dokážu podľa aktuálneho stavu hry určiť nasledujúcu akciu, alebo triedy zastupujúce ľudského hráča či už klikajúceho myšou vo virtuálnej verzii hry (MousePlayer), alebo presúvajúceho figúrky na reálnom hernom pláne rozpoznávanom kamerou (CameraPlayer). V prípade virtuálnej hry sa navrhované ťahy zobrazujú v okne a v prípade reálnej hry realizujú aj robotickým ramenom: zabezpečujú to metódy GameWindow.setState(state) a Robot.moveRobot(nextMove). Podtrieda abstraktnej triedy Player musí definovať najmä metódu Move move(gamestate state, ArrayList<Move> allowedmoves), ktorá na základe aktuálneho stavu hry vyberie z množiny možných prípustných ťahov nasledujúci. Môže tiež definovať metódu void othermoved(move move, GameState newstate), pokiaľ chce byť detailne informovaná o ťahu súpera. Framework získava množinu prípustných ťahov tak, že sa pokúsi aplikovať každé pravidlo o ťahaní kameňov na každý kameň aktuálneho stavu a na každú voľnú cieľovú pozíciu na ploche. Tento operátor realizuje metóda allpossiblemoves() triedy GameState. Výsledný zoznam je potrebné odfiltrovať od množstva duplicitných stavov, ktoré sa líšia len na políčkach označených ako relevant=no. Ak daný triplet (kameň, odkiaľ, kam) pravidlu vyhovuje, cieľovú pozíciu pridá do množiny. Pre každý ťah hráča navrhovaný metódou prekrývajúcou abstraktnú metódu Player.move() sa podobným spôsobom overuje jeho korektnosť 144

145 approved = state.moveallowed(nextmove). Ak nedovolený ťah vykoná ľudský hráč, je informovaný a má možnosť svoj ťah opraviť, v prípade automatického hráča je hra zastavená a hráč diskvalifikovaný z hry. Trieda Player obsahuje aj metódy na sledovanie maximálneho povoleného času na jeden ťah, ktorý je možné nastaviť v grafickom riadiacom okne aplikácie. Pridanie nového typu algoritmu teda znamená zadefinovanie novej triedy odvodenej od triedy Player (a zodpovedajúcej triedy odvodenej od triedy Strategy, ktorá je len adaptérom) a pridanie novej stratégie do zoznamu stratégii v Strategy.availableStrategies(). Okrem toho je možné definovať heuristiky, ktoré musia implementovať metódu určujúcu odhad kvality double heuristic(gamestate gamestate, int forplayer) stavu hry pre hráča napr. v prípade algoritmu A* ide o odhad vzdialenosti do cieľovej/výhernej konfigurácie z aktuálneho stavu. Heuristika je odvodená od triedy Heuristic a stačí ju pridať do zoznamu podporovaných heuristík v Heuristic.availableHeuristics(). Pridanie nového typu hry znamená len vytvorenie textového súboru s popisom hry a jej pravidiel a pridanie zodpovedajúcich obrázkov pre virtuálnu verziu hry, nastavenie pozícii v kamere a na servomotoroch ramena, zadefinovanie rozpoznávaných farieb pre jednotlivé typy figúrok a doplnenie do zoznamu hier Controller.getGameNames(). Vidíme, že navrhnutý a implementovaný framework je dostatočne všeobecný a okrem didaktickej hodnoty o hrách ako takých a prehľadávacích algoritmoch umožňuje experimenty s rôznymi typmi hier: za účelom testovania vyjadrovacej sily špecifikačného jazyka, alebo pre porovnávanie úspešnosti, prípadne časovej náročnosti jednotlivých prehľadávacích algoritmov a heuristík. Framework má predpripravenú podporu pre učiace algoritmy (napr. pre Reinforcement Learning), ale jej realizácia zatiaľ čaká na nasledujúce použitie tohto projektu. heuristiku ohodnocujúcu stav hry z pohľadu hráča na ťahu vtedy, keď ohodnotenie stavu hry v danom uzle nie je zistiteľné. Algoritmus prehľadá len takú časť priestoru, akú mu stanovený čas na jeden ťah umožní, potom urobí spätné ohodnotenie od listov ku koreňu a vyberie najlepší známy ťah; MonteCarloPlayer vychádza z predpokladu, že prehľadávací priestor je natoľko rozsiahly, že ho aj tak nestačí celý ohodnotiť. Preto pre každý z nasledujúcich možných ťahov odohrá N kompletných náhodných hier a pozrie sa akú v nich má priemernú úspešnosť. Potom vyberie taký nasledujúci ťah, ktorý mal najlepšiu priemernú úspešnosť. Jeho výhodou je, že nepotrebuje konštruovať kompletný strom, ale vždy iba jednu cestu v prehľadávanom grafe a teda v porovnaní s MiniMax výrazne šetrí pamäť a teda potenciálne stihne preskúmať väčší prehľadávaný priestor, lebo vytváranie a uvoľňovanie rozsiahlych pamäťových štruktúr v jazyku Java nie je z časového hľadiska zadarmo. Naviac každú hru zahrá až do konca, takže používa informácie s vyššou vierohodnosťou. Študenti na S3 kompletne navrhli a vyšpecifikovali pravidlá hry Connect4 (ľudovo známa ako padacie piškvorky) použitím nášho špecifikačného jazyka, zostrojili herný plán a naučili robota hrať proti človeku algoritmami, ktoré už vo frameworku boli implementované. Potom sa zamerali na ich modifikáciu a experimentálne porovnanie rozličných verzií, zbehnutie štatisticky relevantného počtu hier a vyhodnotenie a zdokumentovanie výsledkov. 6 Experimenty na S3 Pred začiatkom S3 sme do frameworku naimplementovali niekoľko základných algoritmov: RandomGeneralPlayer ktorý pre ľubovoľnú hru generuje náhodné ťahy; DepthFirstSearchPlayer pre hry pre jedného hráča, prehľadáva stavový priestor do hĺbky a vyberá ťah, ktorý smeruje k prvej nájdenej víťaznej konfigurácii; BreadthFirstSearchPlayer pre hry jedného hráča, prehľadáva stavový priestor do šírky a vyberá ťah, ktorý vedie smerom k víťaznej konfigurácii, ktorá je najbližšie; AStarPlayer ako BFSP, ale priestor prehľadáva efektívnejším algoritmom A* pomocou dodanej heuristiky, MiniMaxPlayer pre hry pre dvoch hráčov, pričom vyberá ťah podľa algoritmu MINIMAX v strome konfigurácii hry ohodnoteného podľa toho, či hráč v danej konfigurácii vyhral, prehral, alebo remizoval. V našej modifikácii zvýhodňuje tie uzly, ktoré sú bližšie k východzej situácii. Tento algoritmus tiež dokáže využiť Obr. 3: Riadiace okno aplikácie a virtuálna hracia plocha pre hru Connect4. Testovali rôzne modifkácie algoritmov MiniMax a MonteCarlo. MiniMax Stochastic, kombinoval presnosť odhadu MiniMax s výhodami stochastického prehľadávania. Algoritmus sa vzdal ambície úplného prehľadania priestoru za cenu neotvárania niektorých ťahov. Táto modifikácia však viedla k fatálnym chybám. V prípadoch, keď algoritmus neotvoril práve taký ťah, ktorý bol pre neho prehrávajúci, tradičný MiniMax svoju výhodu dôsledného prehľadávania vždy využil. Keďže táto hra pozostáva z dlhej postupnosti ťahov a množstva otvorených hrozieb, pravdepodobnosť, že stochastický algoritmus bude nachytaný, bola priveľká. 145

146 Modifkácie algoritmu MonteCarlo vychádzali z toho, že algoritmus nebral do úvahy pravdepodobnosť dosiahnutia započítavaných výsledkov hier čiže počet celkovo uskutočnených ťahov v danej náhodnej hre, kým niektorý hráč nevyhral a mieru vetvenia v jednotlivých stavoch počas hry. Preto sme vyskúšali deliť hodnotu výsledného uzla jeho viditeľnosťou z koreňa čiže pravdepodobnosťou, že hra sa z koreňa Obr. 4: Robotické rameno hrá Connect4 proti človeku. dostane do tohto cieľa pri náhodnom výbere hrán, berúc do úvahy stupeň vetvenia v súperových uzloch. V tomto prípade však boli príspevky víťazných hier hlbšie v strome s veľkým vetvením príliš malé, čo zvýhodňovalo horšie ťahy s inak vetvenou štruktúrou stromu. Iná testovaná modifikácia nebrala do úvahy stupeň vetvenia v súperových uzloch, ale iba hĺbku víťazneho uzla a so vzdialenosťou od koreňa ohodnotenie neklesalo tak prudko. Ako vidno z tabuľky 1, druhá metóda (MCR2) dosahovala v hrách proti prvej (MCR) lepšie výsledky. MCR MCR2 MCR 31,93 MCR2 68,07 Tab. 1: Percentá vyhraných hier medzi jednotlivými verziami algoritmov modifikovaných algoritmov MonteCarlo, priemer z hier, každý hráč začínal v polovici hier. Podľa Cvijović, Unger, Corazza (2013). MM MMS MC MCR2 MM 82,93 41,30 48,08 MMS 8,54 11,67 3,19 MC 54,35 88,33 51,72 MCR2 44,23 96,81 46,55 Tab. 2: Percentá vyhraných hier medzi jednotlivými verziami algoritmov, priemer z hier, každý hráč začínal v polovici hier. Podľa Cvijović, Unger, Corazza (2013). Ďalej sme teda využili iba algoritmus MCR2 a porovnanie celkových výsledkov odohraných hier je v tabuľke 2. Z výsledkov vidno, že úspešnosť MCR2 voči stochastickému MiniMaxu bola významne lepšia ako pôvodného MonteCarlo, hoci jeho úspešnosť voči podstatne kvalitnejšiemu pôvodnému MiniMax bola o niečo nižšia. Podstatnejší (a prirodzený) záver tejto etudy je, že pokiaľ nepoužijeme priamo víťaznú stratégiu, každá stratégia bude mať rozličnú úspešnosť v závislosti od jej ad-hoc schopnosti nájsť slabé miesta v stratégii súpera. Na rozličných typoch hier a teda prehľadávacích stromoch s inými vlastnosťami budeme dostávať odlišné výsledky. Vo frameworku boli špecifikované nasledujúce hry pre jedného hráča: Frogs pozri obr.1, toto bola kompletne realizovaná východisková hra pre jedného hráča pred S3 Puzzle8 klasický puzzle na gride 3x3 RiverCrossing hádanka o prechádzaní rieky cez deravý most MasterMind klasická hra Logik pre jedného hráča cieľová konfigurácia je určená a dá sa zmeniť v špecifikácii. Toto je príklad chýbajúceho operátora generátora náhodných čísel, ktorý by umožnil vytvorenie inej náhodnej konfigurácie v každej hre, aktuálna verzia pravidiel je čisto deterministická. Vo frameworku boli špecifikované nasledujúce hry pre dvoch hráčov: Alquerque historická verzia hry dáma táto hra demonštruje vyjadrovaciu silu špecifikačného jazyka TicTacToe klasické piškovorky 3x3 pre 2 hráčov toto bola kompletne realizovaná východisková hra pre dvoch hráčov pred S3 Nim odoberanie zápaliek tradičná hra s optimálnou stratégiou založenou na zvyškových triedach Reversi kde kamene neustále menia farbu, čo sa realizuje zmenou ich stavu a hra má zmysel len vo virtuálnej verzii Connect4 kompletne realizovaná hra na S3 Squares v dvoch verziách, hra kde používatelia striedavo spájajú mrežové body a každý, kto vytvorí jednotkový štvorec, získava bod Skipping je podobná u nás známej hre Halme, hrá sa na šachovnici Mill známa hra Mlyn, pričom je špecifikovaná len prvá fáza hry. Celý framework a vytvorené špecifikácie hier sú open-source, dostupné na stránke Manipulátory na KAI (2015) a autori radi poskytnú podporu v prípade využitia v študentských projektoch, výuke, alebo v závečných prácach. 7 Jazyk pre špecifikáciu hry Jadrom tohto príspevku je analýza špecifikačného jazyka navrhnutého pre popis stolových hier a ich pravidiel. Ako sme uviedli vyššie, hra je určená n-ticou (ET, LT, L, E, EX, SC, EG, GR). Prvé štyri časti len 146

147 popisujú vyššie pomenované množiny a nevyhnutné a voliteľné atribúty ich prvkov detaily sa nachádzajú na stránke s popisom špecifikácie hry. Tu sa zameriame na posledné štyri, resp. tri, keďže EX množina používateľom definovaných výrazov (expressions) definuje výrazy, ktoré môžu byť použité v SC, EG, aj GR. Bodovanie hráčov (SC scoring) obsahuje niekoľko trojíc vo formáte: situation=výraz player=číslo_hráča score=výraz každá trojica sa aplikuje na výpočet aktuálneho prírastku skóre určeného hráča za podmienky, že výraz situácie je platný. Napríklad, ak biely hráč hrá proti čiernemu, typicky je biely hráč číslo jeden a čierny je číslo dva. V hre Reversi po každom kroku vyhodnotíme skóre oboch hráčov takto: situation=true player=1 score=stones(2)-score(1) player=2 score=stones(1)-score(2) Pričom Stones($HRAC) je používateľom definovaný výraz, ktorý vypočíta počet kameňov zadaného hráča a SCORE($HRAC) je súčet skóre, ktoré zadaný hráč získal vo všetkých predchádzajúcich ťahoch. Tento rozdiel teda určí o koľko sa zvýšil počet kameňov zadaného hráča a o túto hodnotu sa celkové skóre zvýši. Koniec hry (EG end of game) pozostáva z dvojíc: situation=výraz winner=číslo_hráča a znamená ukončenie hry v prípade splnenia daného výrazu. Víťazom sa stáva určený hráč. SC aj EG môže obsahovať výraz na pravej strane každého z riadkov. Pravidlá ťahania kameňmi (GR game rules) je množina pravidiel typu čo odkiaľ kam, pričom každé z nich je podrobne určené nasledujúcimi položkami (v = voliteľná položka): name=meno_pravidla element=určenie_kameňa v state=určenie_stavu_kameňa v player=číslo_hráča from=určenie_východzieho_miesta to=určenie_cieľového_miesta condition=výraz v awardplayer=číslo_hráča v withscore=výraz v followup=výraz v riadku condition je možné uviesť podmienku, ktorá musí platiť, aby sa pravidlo mohlo použiť a môže to byť ľubovoľný výraz. Riadky awardplayer a withscore určujú hráča, ktorému sa majú za vykonanie kroku podľa tohto pravidla pridať body. Môžu taktiež obsahovať ľubovoľný výraz. Ak matchuje viacero pravidiel, vždy sa vyberie to, ktoré pridelí najviac bodov. Ľubovoľný výraz followup sa vyhodnotí vždy po vykonaní kroku podľa tohto pravidla. Napríklad v prípade preskočenia figúrky v hre Dáma sa táto figúrka z ihriska odstraňuje. V reálnej hre ju teda rameno robota vezme a odstráni, t.j. presunie na určené nerelevantné miesto. Generalizácia v našom druhu špecifikácie pravidiel je skrytá v tom, že kameň, jeho stav, hráč, východzie aj cieľové miesto môžu byť zadané s indexom, čiže napriklad figurka($i), prípadne s dvoma či viacerými indexami: figurka($a,$b). Takéto pravidlo aplikované na kameň s názvom napr. figurka(2) automaticky do premennej $I namapuje hodnotu 2. Vo výrazoch použitých v ostatných riadkoch pravidla sa potom tieto premenné môžu použiť a budú v nich zodpovedajúce hodnoty, napr. $I==2. Scoping premenných je výlučne globálny, sú uložené v tzv. kontexte reprezentovanom triedou Context, ktorej inštancia sa vytvorí na začiatku hry a zotrvá do jej konca. Uveďme si dva príklady hier s vysvetlením pravidiel: Toto sú pravidlá hry Frogs pre jedného hráča, v ktorej si žabky vymieňajú pozície, pozri obr.2: name=greenstep element=gf($j) from=s($k) to=s($l) condition=$l==$k+1 name=greenjump element=gf($j) from=s($k) to=s($l) condition=stoneoccupied($k+1) AND ($L==$K+2) name=redstep element=rf($j) from=s($k) to=s($l) condition=$l==$k-1 name=redjump element=rf($j) from=s($k) to=s($l) condition=stoneoccupied($k-1) AND ($L==$K-2) Druhým príkladom je hra River Crossing pre jedného hráča, kde 4 ľudia, ale najviac dvaja naraz, musia prejsť cez most nad riekou pomocou jediného lampáša. Každý z nich potrebuje rozdielny čas: 1,2,5, alebo 10 minút. Časy interpretujeme ako záporné hodnoty a odrátavame ich od začiatočného skóre 50 bodov. Pri mostíku sú po dve miesta, kde sa zhromažďujú pred prejdením rieky: leftstack(1-2), rightstack(1-2). Prejdenie cez mostík zariadime symbolicky preložením lampáša, poprekladanie figúrok už zabezpečia výrazy v riadku followup: name=tolstack element=person($j) from=left($k) to=leftstack($s) condition=not EMPTY("lightLeft") name=torstack 147

148 element=person($j) from=right($k) to=rightstack($s) condition=not EMPTY("lightRight") name=toleft element=lg from=lightright to=lightleft condition=checkstackr awardplayer=1 withscore=min(timeof("rightstack(2)"),timeof("rightst ack(1)")) followup=crosstoleft name=toright element=lg from=lightleft to=lightright condition=checkstackl awardplayer=1 withscore=min(timeof("leftstack(2)"),timeof("leftstac k(1)")) followup=crosstoright Keďže už máme aspoň približnú predstavu o špecifikácii pravidiel hry, môžeme sa konečne zamerať na jadro jazyk výrazov, na ktoré sa v pravidlách odvolávame. Výrazy sú buď jednoriadkové anonymné, alebo viacriadkové pomenované s 0 alebo viac formálnymi parametrami. Výsledkom vyhodnotenia výrazov je nejaká hodnota. Hodnoty majú implicitný typ: string/symbol, ktorý môže byť aj indexovaný číslami, alebo premennými, napr. "hello", "hello(3)", "hello($i,$j)", číselná hodnota, napr. 3, množina, napr. {1,2, hello }, logická hodnota true/false, prípadne prázdny string, či prázdna množina "" a {}. Ak je výsledkom vyhodnotenia výrazu false, hovoríme, že výraz nie je splnený, inak je splnený a to aj keď výsledkom nie je true, ale iná hodnota. Výsledkom vyhodnotenia viacriadkových výrazov je buď false, ak sa niektorý riadok vyhodnotí ako false a vtedy sa nasledujúce riadky už nevyhodnotnia, alebo hodnota na ktorú sa vyhodnotí posledný riadok z logického hľadiska tvoria viacriadkové výrazy konjunkciu medzi jednotlivými riadkami a na všetky výrazy sa možno dívať aj ako na logické formuly. Vďaka tomu dokážeme pohodlne kontrolovať sadu potrebných podmienok, ktoré majú platiť pri aplikácii pravidla bez potreby ďalšieho zbytočného syntaktického cukru bez straty čitateľnosti a zrozumiteľnosti. Na druhej strane zavádzame pomerne bohatú sadu operátorov a primitívnych funkcií jazyka, pričom niektoré z nich majú aj bočné efekty je to až nevyhnutné, pretože v mnohých hrách je potrebné priebežne modifikovať stav hry aj inak, ako len čisto presunutím kameňa z iniciatívy hráča. To však nebráni písať pekné logické formuly, ak to jednoduchosť hry dovoľuje. Tabuľka 3 obsahuje stručný prehľad operátorov, tabuľka 4 zoznam preddefinovaných funkcií a tabuľka 5 zoznam preddefinovaných funkcií s bočným efektom. Pozrime sa na príklady viacriadkových výrazov použitých v pravidlách hier uvedených vyššie. V definíciach výrazov sa na jednotlivých riadkoch môžu nachádzať biele znaky (medzera, tab) na ľubovoľnom mieste. FrogsAtHome FORALL($J,1,3,ELTYPE(CONTENT("s($J)")) == "redfrog") FORALL($J,5,7,ELTYPE(CONTENT("s($J)")) == "greenfrog") END StoneOccupied($POS) $POS > 0 $POS <= 7 NOT EMPTY("s($POS)") END CheckStackL (NOT EMPTY("leftstack(1)")) OR (NOT EMPTY("leftstack(2)")) END movetoright($el,$from) $I = INDEX($EL) MOVE($EL,$FROM,"right($I)") END crosstoright $M = CONTENT("leftstack(1)") $N = CONTENT("leftstack(2)") IF(NOT EMPTY("leftstack(1)"), movetoright($m, "leftstack(1)"), true) IF(NOT EMPTY("leftstack(2)"), movetoright($n, "leftstack(2)"),true) END Min($NUM1,$NUM2) IF($NUM1 < $NUM2, $NUM1, $NUM2) END timeof($place) $WHO=ELTYPE(CONTENT($PLACE)) $PTS=0 PtsMother($WHO) OR PtsFather($WHO) OR PtsEmily($WHO) OR PtsBob($WHO) OR true $PTS END PtsMother($W) $W == "mother" $PTS = (-10) END PtsBob($W) $W == "bob" $PTS = (-1) END 148

149 Prvý výraz FrogsAtHome kontroluje cieľovú konfiguráciu, teda či sa na všetkých políčkach s(1)..s(3) nachádzajú červené žaby a na všetkých políčkach s(5)..s(7) sa nachádzajú zelené žaby. StoneOccupied overuje, či požadované miesto je na Operator t1 t2 Description val1 == val2 a l values equal val1!= val2 a l values not equal constant a a value of that constant val1 < val2 i l less than val1 > val2 i l more than val1 <= val2 i l less or equal than val1 >= val2 i l more or equal than val1 + val2 i i add val1 - val2 i i subtract val1 * val2 i i multiply val1 / val2 i i integer division val1 % val2 i i integer quotient ABS val i i absolute value s1 ISPARTOF s2 s l subset val IN set as l is member s1 EXCEPTOF s2 s s set difference s1 UNION s2 s s set union s1 INTERSECT s2 s s set intersection val1 AND val2 l l logical AND val1 OR val2 l l logical OR NOT val l l logical NOT IF(v1,v2,v3) la a conditional, result is v2 if v1 is true, otherwise v3 FORALL ($X,X1,XN,val) FORSOME ($X,X1,XN,val) ia a ia a val evaluates to true for all values of variable $X from X1 to XN val evaluates to true for at least one value of variable between X1 and XN incl. EXPRNAME - a evaluate the nuladic expression with the given name EXPRNAME (v1,...,vn) a a evaluate the expression with the given name and arguments, which are arbitrary expressions $VAR = val a l assignment, result is true $VAR - a value of the variable Tab. 3: Zoznam operátorov jazyka výrazov. Typy sú i celé číslo, a ľubovoľný, l logická hodnota, s množina. Stĺpec t1 určuje typy argumentov, t2 je typ výslednej hodnoty. LOCTYPE(loc) ELTYPE(elmnt) STATE(elmnt) g type of location g type of movable element i state of movable element LOCATION(elmnt) g current location of element CONTENT(loc) EMPTY(loc) INDEX(string) INDEXA(string) g current content of location l location is empty i first index in a given string "name(123)" -> 123 i i-th index in a given string UNINDEX(string) g name without indexing "name(123)" -> "name" OWNER(elmnt) i current owner of element PLAYER i current player on move 1+ SCORE(player) i current score of the player ZINDEX(elmnt) i current ZINDEX of the specified element Tab. 4: Zoznam zabudovaných primitívnych funkcií. Typ g označuje string. MOVE (elem,loc1,loc2) SETOWNER (elem,int) SETSTATE (elem,int) SETZINDEX (elem,int) l moves element from loc1 to loc2, false if occuppied or not present t set the owner of the element to given player number t set the state of the elment t set the zindex of the element NEXTPLAYER t finish the move of this player Tab. 5: Zoznam zabudovaných primitívnych funkcií s bočným efektom. Typ t označuje logickú hodnotu true. CheckStackL je nutná podmienka na prenesenie lampáša z ľavého brehu rieky na pravý, lebo aspoň jedna z pozícií, kde sa postavičky pripravujú na cestu cez most, musí byť obsadená. MoveToRight zabezpečí prechod jednej postavičky cez most a jej umiestnenie na jej cieľové vyhradené miesto (s rovnakým indexom ako je v jej mene) na pravej strane rieky. CrossToRight zabezpečuje prechod všetkých pripravených postavičiek na druhú stranu pomocou výrazu MoveToRight. Min je príklad používateľom definovanej aritmetickej funkcie a využitia podmienkového príkazu. timeof a zostávajúce dve 149

150 funkcie zisťujú čas, ktorý potrebuje na pechod cez rieku postavička, ktorá stojí na určenom políčku, využívajúc, že vyhodnocovanie argumentov operátora OR sa zastaví akonáhle sa jeden z nich nerovná false. 8 Prepojenie jazyka s frameworkom Špecifikácia každej hry je uvedená v jedinom textovom súbore. Parserom je načítaná a prevedená do vnútornej reprezentácie, ktorá je efektívne interpretovaná počas hrania hry. V aktuálnej verzii sa rameno po vykonaní každého ťahu vráti do pohotovostnej polohy jednak aby uvoľnilo priestor a svoj ťah mohol vykonať človek a jednak preto, aby kamera mala netienený výhľad na celú scénu. Obrovskou výzvou bolo zladiť s reálnym svetom tie typy hier, kde nie sú všetky figúrky naraz na ploche tak, aby to výrazne nepoškodilo prehľadávacie algoritmy zbytočnou kombinatorickou explóziou. Atribút políčka relevant=no teda spôsobí nielen to, že si dané miesto kamera nevšíma. Okrem toho sú ťahy z nerelevantných políčok rovnakého typu na rovnaké cieľové políčko s kameňom rovnakého typu (hoci iného mena) považované za ekvivalentné. Problém nastáva, keď potreujeme zadefinovať ťahy na rôzne nerelevantné políčka rovnakého typu, ktoré nemajú byť považované za rovnaké, alebo keď treba vygenerovať cieľové políčka, ktoré kamera už nevidí alebo ignoruje a to sú len ukážky príkladov, kedy nami zvolená abstrakcia (ako každá iná) naráža na svoje hranice vyjadrovacej sily, hoci vždy existuje nejaký spôsob, ako sa s problémom vyrovnať. 9 Alternatívny prístup Prebiehajúca diplomová práca Petra Pukančíka, ktorej pôvodným cieľom bolo zostrojiť framework nie nepodobný nášmu, sa postupne zamerala na alternatívny spôsob špecifikácie pravidiel. Náš spôsob uvažovania bol nasledujúci: ak hráč vykonal ťah, postupne prejdeme cez zoznam všetkých pravidiel a zistíme, či niektoré z nich vyhovuje. Ak áno, ťah akceptujeme, inak ho odmietneme. Viac práce však máme, keď z danej konfigurácie hry máme vygenerovať zoznam všetkých možných ťahov: vtedy skúšame aplikovať všetky pravidlá na všetky položené kamene a všetky možné voľné cieľové pozície. Alternatívny prístup k tvorbe pravidiel je založený na ASP solveri logického programovania. Pre zadanú figúrku a jej pozíciu priamo vygeneruje všetky prípustné ťahy. Od tohto prístupu očakávame vyššiu efektivitu a zostávame v očakávaniach výsledkov porovnania oboch metód aj z hľadiska prehľadnosti a zrozumiteľnosti zápisu špecifikácie. 10 Záver Práca je prvá podrobnejšia informácia o univerzálnom systéme na hranie stolových hier pozostávajúceho z robotického ramena, kamery a softvérového frameworku, ktorý sme vyvinuli na Katedre aplikovanej informatiky, FMFI UK. Systém dovoľuje zadefinovať nové hry pomocou deklaratívneho špecifikačného jazyka s procedurálnymi prvkami a len na základe tejto špecifikácie systém dokáže hrať zadefinovanú hru proti človeku na netriviálnej úrovni. Experimenty so živými subjektami na letnej škole vedy S3 v Chorvátskej Požege ukázali, že náš systém bez problémov dokáže poraziť priemerného ľudského hráča. Na sade expriementov realizovaných na S3 sme demonštrovali, že navrhnutý framework je vhodný na porovnávanie algoritmov umelej inteligencie, výskum jazykov na špecifikáciu a interpretáciu hier, a výuku a študentské projekty a záverečné práce. V ďalších projektoch s frameworkom S3games by sme radi vyskúšali učiace sa algoritmy, ktoré budú zlepšovať schopnosť systému hrať hry na základe získaných skúseností z hier. Plánujeme zaintegrovať modul inverznej kinematiky pre automatické zadefinovanie pozícií na hracom pláne z obrazu a pokračovať vo vylepšovaní impelemtnovaných algoritmov a ponuke hier, ktoré systém dokáže hrať. Poďakovanie Tento príspevok vznikol za podpory grantovej agentúry KEGA v rámci grantovej úlohy 076UK-4/2013. Hardvér pre robotické rameno bol zaobstaraný vďaka finančnému daru od Nadácie Alexandra von Humboldt v roku Úprimné poďakovanie patrí Mgr. Zuzane Koyšovej, ktorá sa na S3 podujala na prevzatie úlohy hlavného vedúceho projektu, podieľala sa na implementácii frameworku a vytvorení špecifikácie viacerých hier. Literatúra Cvijović, Unger, Corazza (2013). The Art of Playing Games. Student session at 55 th International Symposium ELMAR-2013, Zadar. Petrovič (1997). Design and Play in Comenius Logo: A microworld for designing and exploring games. V zborníku Sixth European Logo Conference EUROLOGO'97. Manipulátory na KAI (2015). Odkazy na všetky relevantné knižnice, špecifikácie a dokumentáciu a zdrojové kódy impelemntovaného frameworku, Katedra aplikovanej informatiky, FMFI UK Bratislava, dostupné online: 150

151 Kognícia a umelý život 2015, Trenčianske Teplice Vplyv zrkadlového tréningu na moduláciu motorických rytmov: elektrofyziologická a klinická štúdia pacienta s hemiparézou po mozgovom infarkte Roman Rosipal Ústav merania SAV, Dúbravská cesta 9, Bratislava [email protected] Barbora Cimrová, Lukáš Rückschloss, Zdenko Kohút, Igor Farkaš Centrum pre kognitívnu vedu, KAI FMFI UK, Mlynská dolina, v Bratislave {cimrova,farkas}@fmph.uniba.sk Natália Porubcová Poliklinika ProCare Central, Jelačičova 7, Bratislava [email protected] Abstrakt Zrkadlová terapia sa začala využívať ako rehabilitačná metóda pri obnove funkcie poškodených motorických dráh u pacientov s poruchou hybnosti končatín najčastejšie v dôsledku náhlej cievnej mozgovej príhody. Táto terapia je založená na vizuálnej spätnej väzbe umožnenej vďaka optickej ilúzii, ktorá vzniká počas pozerania sa do zrkadla na pohybujúcu sa zdravú končatinu. Neurálne mechanizmy tohto ozdravovacieho procesu nie sú dostatočne preskúmané, pričom existujú viaceré vysvetľujúce hypotézy. V príspevku sa zaoberáme pilotným využitím tejto terapie v súvislosti s meraním motorických rytmov mozgu počas relaxácie subjektu. V prípade hemiparetického pacienta s akcentovanou poruchou motoriky hornej končatiny bol výsledkom dlhodobého tréningu (9 mesiacov) systematický nárast mí (µ) rytmu počas relaxácie po tréningu, ako pozitívny indikátor pre ďalšiu neurorehabilitáciu s využitím rozhrania mozog počítač. V prípade zdravých subjektov neboli pozorované signifikantné zmeny individuálnych µ-rytmov počas relaxácie po tréningu. 1 Úvod Zrkadlová terapia bola zavedená ako neurorehabillitačná metóda u pacientov, ktorí trpia fantómovými bolesťami končatín (Ramachandran a spol., 1995). Táto terapia je založená na vizuálnej spätnej väzbe (mirror visual feedback; MVF), s ktorou je asociovaná optická ilúzia vznikajúca počas pozerania sa do zrkadla (na pohybujúcu sa zdravú končatinu). V neurovede sú optické ilúzie považované za zadné vrátka, spôsob ako nahliadnuť do mysle subjektu a poskytujú možnosť študovať neurálne mechanizmy stojace za vnímaním a konaním (Gregory, 1968). Neskôr sa zrkadlová paradigma začala používať aj v kontexte obnovenia motorických dráh, napríklad u hemiparetických pacientov po cievnej mozgovej príhode (CMP). 1 Napriek v súčasnosti rozšírenému využitiu MVF v neurorehabilitácii a napriek tvrdeniu, že terapia pomocou MVF vedie k neuroplastickým zmenám, v literatúre neexistuje konsenzus ohľadne mechanizmu, ktorý by túto plasticitu uspokojivo vysvetľoval. Boli navrhnuté tri rôzne, no navzájom neprotirečivé hypotézy. Prvá hypotéza sa týka systému zrkadliacich neurónov (mirror neuron system; MNS) (Rosen a Lundborg, 2005; Sütbeyaz a spol., 2007; Yavuzer a spol., 2008). Zrkadliace neuróny sú aktívne, keď subjekt vykonáva akciu, ale aj keď ju pozoruje (u niekoho iného). Sieť neurónov, vrátane premotorickej kôry, suplementárnej motorickej kôry, dolného čelového laloka, a kôry bázy (temenného) parietálneho laloka, hrá dôležitú úlohu pri rozpoznávaní akcií a motorickom učení alebo rehabilitácii (Buccino a spol., 2006). Observačno-exekučný mechanizmus párovania, podľa ktorého pozorovanie akcie aktivuje kľúčové časti motorického systému u pozorovateľa, pravdepodobne indukuje motorické učenie (Iacoboni, 1999). Pozorovanie pohybu aktivizuje kortikospinálnu dráhu a tento neuronálny vzorec sa využíva v neurorehabilitácii v snahe o zlepšenie motorických funkcií (Pomeroy a spol., 2005). Podľa MNS hypotézy je zrkadlový box prostriedkom na zjednodušenie pozorovania pohybu, a preto sa predpokladá, že MVF aktivuje MNS podobným spôsobom ako priame pozorovanie pohybu. Druhá hypotéza hovorí, že MVF podporuje zapojenie ipsilaterálnych motorických dráh (Ezendam a spol., 2009). Týmto motorickým dráham, ktoré existujú v nepostihnutej hemisfére a majú ipsilaterálnu projek- 1 Cievna mozgová príhoda (mozgový infarkt) patrí medzi najčastejšie príčiny porúch hybnosti končatín v dôsledku poškodenia mozgových funkcií rôzneho stupňa. Môže spôsobiť mierne až veľmi výrazné poškodenie či dokonca smrť. 151

152 ciu na paretickú stranu tela, bola pripísaná netriviálna úloha pri obnovovaní motorickej funkcie v hemiparéze (napr. Staudt a spol. 2002). Bola vyslovená hypotéza, že MVF možno podporuje oživenie spiacich ipsilaterálnych neurálnych projekcií, ktoré sú za normálnych okolností inhibované. Podľa tretej hypotézy, MVF alebo s ňou asociovaná ilúzia zvyšujú (priestorovú) pozornosť subjektu smerom k skrytej (postihnutej) končatine (Dohle a spol., 2009). Pacienti s hemiparézou sa zvyknú dostať do stavu naučenej nepoužiteľnosti postihnutej končatiny tým, že sa kontinuálne nesnažia ju používať, alebo kvôli patofyziologickému narušeniu eferentno aferentnej slučky (Taub a spol., 1998). Preto je odôvodnený predpoklad, že zvýšená pozornosť smerom k postihnutej, liečenej končatine, umožnená optickou ilúziou, môže aktivovať motorické dráhy. V snahe o objasnenie účinku MVF na obnovenie motorickej funkcie u pacientov s hemiparézou vo svetle uvedených troch hypotéz, Deconinck a spol. (2015) urobili systematický prehľad literatúry, so zameraním na potenciálne neurálne koreláty MVF. Urobili prieskum experimentálnych štúdií so zdravými a/alebo motoricky postihnutými participantmi, kde boli využité neurozobrazovacie technológie (fmri, PET, MEG, EEG, NIRS alebo TMS), a kde boli skúmané efekty MVF na kortikálnu aktiváciu (a s tým súvisiace motorické správanie). Spomedzi 33 vybratých článkov vyhovujúcich stanoveným kritériám (z celkového počtu 347 nájdených článkov), iba štyri štúdie využívali meranie signálu EEG. Vzhľadom na rovnakú, nami použitú technológiu spomenieme stručne tieto práce. Touzalin-Chretien a Dufour (2008) skúmali, či pozorovanie pohybu vlastnej ruky v zrkadle vyvolá aktiváciu v kortikálnych motorických oblastiach odpovedajúcich obom rukám. Pomocou merania lateralizovaných pohotovostných potenciálov (LRP), ako elektrofyziologického korelátu premotorickej aktivácie v primárnej motorickej kôre, zaznamenávali evokované odozvy na pohyby subjektu počas sledovania pohybujúcej sa (pravej) ruky v sagitálne umiestnenom zrkadle, čo vyvolávalo dojem, že ľavá ruka vykonáva motorickú úlohu. Boli zaznamenané spoľahlivé LRP súvisiace s pozorovanou rukou, čo indikovalo aktivitu motorickej kôry v kontralaterálnej (t.j. pravej) hemisfére neaktívnej ruky, aj keď pohyb vykonávala opačná ruka. Touzalin-Chretien a spol. (2010) pomocou merania potenciálov vo vzťahu k vykonanej činnosti (event-related potentials; ERP) poukázali na výrazný vplyv vizuálnej spätnej väzby (v porovnaní s proprioceptívnou) pri motorickej úlohe vnímania pozície vlastnej ruky pri sledovaní jej odrazu v zrkadle. Vizuálny vplyv na kortikálnu motorickú oblasť sa prejavil aj keď proprioceptívny vstup týkajúci sa skutočného efektora na opačnej strane nebol konzistentný s vizuálnou spätnou väzbou od ruky v zrkadle. Táto dominantnosť vizuálnej modality sa stratila v prípade výrazne minimálneho osvetlenia scény (v podobe drobného svetielka umiestneného na pohybujúcej sa ruke), keď nebola zaznamenaná žiadna motorická aktivita v kortikálnej oblasti odpovedajúcej neaktívnej ruke. Tieto výsledky poukazujú na to, ako mozog váhuje a integruje vizuálne a proprioceptívne informácie pri motorickom ovládaní končatín. Praamstra a spol. (2011) sa odvolávajú na prácu Touzalin-Chretien a Dufour (2008), pričom pozorovaný efekt interpretujú ako kompletný reverz v kontra- a ipsilaterálnej motorickej kortikálnej aktivácii pri použití zrkadla, ktorý mohol byť spôsobený metodologickým nedostatkom dizajnu. Podľa Praamstra a spol. by toto predstavovalo dosiaľ nepoznaný stupeň neurálnej plasticity, ktorý je podľa nich fyziologicky neprijateľný. Preto navrhli vylepšený experiment, a ten nepotvrdil spomínaný reverz. Naopak, experiment potvrdil jemnejšie prejavy motorickej kortikálnej aktivity indukovanej vlastným pohybom pozorovaným v zrkadle. Bae a spol. (2012) skúmali efekt zrkadlovej terapie v prípade pacientov po CMP, rozdelených náhodne do dvoch skupín. Obe skupiny absolvovali štandardnú rehabilitáciu (prvá fáza), a po nej jedna skupina absolvovala ešte terapiu so zrkadlom a druhá placebo terapiu (druhá fáza). Pred a po druhej fáze merali subjektom µ-rytmus nad senzomotorickou kôrou, pričom ich potlačenie sa ukázalo signifikantné v oboch skupinách na konci druhej fázy, no bolo výraznejšie v skupine so zrkadlom. Záverom štúdie bolo konštatovanie o význame zrkadlovej terapie pre obnovenie motorickej funkcie v rámci rehabilitácie po CMP. V tomto príspevku sa tiež zaoberáme meraním motorického µ-rytmu (označovaného aj ako rolandický alebo centrálny rytmus s dominantnou lokalizáciou nad frontocentrálnymi oblasťami a s dominantnou frekvenciou v rozsahu Hz) prípade zdravých participantov, ako aj v prípade pacienta s paretickou hornou končatinou, avšak s trochu iným zameraním. Naším predpokladom bolo, že tréning s vizuálnou spätnou väzbou môže posilniť µ-rytmus participantov, pričom obzvlášť v prípade pacienta s poškodenými motorickými dráhami by mohol mať veľký význam, pre ďaľšiu progresiu neurorehabilitácie založenej na využití motorických rytmov a plasticity mozgu. V časti 2 uvádzame metodiku experimentu, v časti 3 výsledky experimentov a v časti 4 diskusiu. 2 Materiál a metódy 2.1 Participanti Experimenty sme začali s piatimi zdravými participantmi (štyria muži, jedna žena, vek 18 až 46 rokov). Po úspešnom vykonaní elektrofyziologických tréningov a ich analýze sme do experimentu zapojili pacienta s motorickou poruchou pravej hornej končatiny. Išlo o 57 ročného muža, ktorý 2 roky predtým prekonal mozgový infarkt v ľavej hemisfére s reziduálnou spastickou pravostran- 152

153 Obr. 1: Dizajn experimentu trénovania s využitím zrkadlového boxu. Subjekt pozoruje zrkadlový odraz pohybu končatiny mimo zrkadlového boxu, zatiaľ čo ruka v boxe ostáva nehybná, alebo pri inom bloku trénovania imituje rovnaký pohyb v boxe. nou hemiparézou s predominantným postihnutím hornej končatiny akrálne. 2.2 Procedúra Experimentálny protokol (tréning) pozostávajúci z blokov relaxácie, pozorovania pohybu, samotného vykonávania pohybu a jeho pozorovania v zrkadlovom boxe bol zadefinovaný lekárom, špecialistom v obore neurológie a fyziatrie. Tréning trvá približne 40 minút. Pred a po tréningu boli zaradené dvojminútové bloky relaxácie s otvorenými a zatvorenými očami. Blok otvorených oči bol zaradený hneď pred a po vykonaní tréningu. Obrázok 1 ilustruje fázu tréningu s využitím zrkadlového boxu. Každý zdravý subjekt absolvoval dané meranie počas piatich dní (obyčajne v priebehu toho istého týždňa). V prípade pacienta s hemiparézou sa tréning opakoval pravidelne počas 9 mesiacov, podľa možností dvakrát týždenne. 2.3 Meranie a spracovanie dát Elektroencefalografický (EEG) signál bol kontinuálne snímaný pomocou Ag/AgCl aktívnych elektród umiestnených v elastickej čiapke na 11-ich pozíciách podľa medzinárodného systému Desať elektród pokrývalo symetricky senzomotorickú kôru (FC3, C1, C3, C5, CP3, FC4, C2, C4, C6, CP4), jedna elektróda bola umiestnená nad okcipitálnou kôrou (O1) s cieľom detekcie alfa rytmov (EEG rytmus vo frekvenčnom rozsahu 8 12 Hz, s dominantnou lokalizáciou nad okcipitálnou oblasťou) a jedna elektróda snímala signál z pravej ušnice za účelom následného prepočítania na nelateralizovanú referenciu. Zemniaca elektróda bola umiestnená na pozícii AFz a referenčná na ľavej ušnici. V prípade pacienta s hemiparézou sme zaznamenávali aj elektromyografickú aktivitu (EMG) pomocou dvoch párov bipolárnych elektród umiestnených na dorzálnej strane proximálnej časti predlaktí oboch rúk. Na meranie signálov EEG a EMG sme použili 16-kanálový zosilňovač g.usbamp 3.0 (od firmy g.tec, Rakúsko) so vzorkovacou frekvenciou 512 Hz. Dáta boli počas snímania filtrované pomocou Butterworthovho pásmového filtra Hz, a notch filtra 50 Hz. Pred samotnou analýzou boli EEG dáta predspracované off-line pomocou komerčného softvéru Brain Vision Analyser 2.0, kde boli opäť filtrované v rozsahu 4 30 Hz, prereferencované na priemerný signál z oboch ušníc a poloautomatickou metódou s vizuálnym skríningom očistené od artefaktov. Dáta očistené od artefaktov sme hodnotili zvlášť pre každého participanta, každý deň merania a pre každú z kontrolných podmienok otvorené/zatvorené oči pred tréningom a po tréningu. Kontinuálny EEG signál bol rozdelený na 4-sekundové úseky a prenásobený Hanningovým oknom. Použitím rýchlej Fourierovej transformácie (FFT) sme vypočítali spektrálnu hustotu výkonu a spektrum sme normovali priemernou hodnotou výkonu v pásme (4 30 Hz). Keďže EEG signál vykazuje vo všeobecnosti vysokú interindividuálnu variabilitu, u každého subjektu sme určili jeho frekvenčné pásmo µ-rytmu v šírke Hz. Pri určovaní individuálnych µ-rytmov z pokojových podmienok sme porovnali aj synchronizáciu a desynchronizáciu daného oscilačného rytmu v priebehu tréningu, teda v úsekoch striedania pohybu a relaxácie. Týmto spôsobom sme mohli jednoznačne zistiť individuálne frekvenčné pásmo motorického µ-rytmu, ktorého synchronizácia nastávala počas relaxácie a desynchronizácia počas vykonávania, resp. pozorovania pohybu, u každého participanta. Individuálne pásmo alfa rytmu sme hľadali vo výkonovom spektre počas relaxácie so zatvorenými očami, s cieľom vylúčiť efekt tohto výrazného posteriórneho rytmu v senzomotorickej oblasti. Párovým t-testom na hladine štatistickej významnosti sme porovnali hodnoty spektrálnej hustoty výkonu µ-rytmov pred tréningom a po tréningu v priebehu všetkých dní, pre každého jedinca zvlášť. Porovnávali sme maximálne hodnoty v nájdenom individuálnom pásme µ-rytmu. 3 Výsledky experimentu 3.1 Zdraví participanti U zdravých participantov sme nepozorovali signifikantné zmeny v spektrálnom výkone µ-rytmu počas relaxovaných stavov pred a po trenovaní. Pozorované zmeny synchronizácie a desynchronizácie µ-rytmu počas pohybu sú súčasťou prebiehajúcej analýzy, ktorá nie je témou tohto príspevku. Na obrázku 2 je znázornený priemer normalizovaných výkonových spektier vybraného zdravého subjektu (muž, 28 rokov) počas relaxácie so zatvorenými očami pred (modrá krivka) a po skončení (červená krivka) mo- 153

154 FC3 C1 C µv 2 /Hz 0.05 µv 2 /Hz 0.05 µv 2 /Hz C5 0.1 CP3 0.1 O1 µv 2 /Hz 0.05 µv 2 /Hz 0.05 µv 2 /Hz FC4 C2 C µv 2 /Hz 0.05 µv 2 /Hz 0.05 µv 2 /Hz C CP Hz µv 2 /Hz 0.05 µv 2 /Hz Hz Hz Obr. 2: Porovnanie normalizovaného výkonového spektra pre jednotlivé dni u vybraného zdravého subjektu (muž, 28 rokov) počas relaxácie so zatvorenými očami pred začiatkom (modrá krivka) a po skončení (červená krivka) motorického cvičenia so zrkadlovým boxom. Hodnoty spektrálneho výkonu boli odhadnuté FFT metódou na 4-sekundových segmentoch EEG, normalizované celkovým výkonom v pásme 4 30 Hz a následne spriemernené (pozri text). torického cvičenia so zrkadlovým boxom. Na obrázku je možné pozorovať výrazný posteriórny alfa rytmus (maximum pre Hz) na elektróde O1. Motorický µ-rytmus je u tohto subjektu zo zobrazeného spektrálneho výkonu ťažšie pozorovať, avšak analýza synchronizácie a desynchronizácie počas pohybu indikuje µ-rytmus v oblasti 8.25 Hz. Tento výkon je výraznejšie viditeľný na elektródach C3, C5 a CP3 pre modrú krivku zobrazujúcu spektrálny výkon pred tréningom počas relaxácie so zatvorenými očami. 3.2 Pacient s hemiparézou Pacient počas pravidelných odborných vyšetrení uvádzal subjektívne vnímané zlepšenia motorickej kontroly postihnutej pravej hornej končatiny pri veľmi malej zmene motoriky pri objektívnom neurologickom vyšetrení. Počas všetkých doteraz spracovaných dní sme u tohto pacienta pozorovali frekvenčne veľmi stabilné spektrum EEG signálu. Na obrázku 3 je znázornený priemer týchto spektier cez 31 dní. Je možné pozorovať výrazný nárast µ-rytmu v pásme Hz nad oboma hemisférami počas relaxácie po trénovaní, s prevládajúcim výkonom v pravej hemisfére. Výrazný alfa rytmus ( Hz) je možné pozorovať na elektróde na ocipitálnou oblasťou. Hoci tento rytmus je možné pozorovať aj pri elektródach nad senzomotorickou oblasťou, jeho odlišná spektrálna charakterisitka umožňuje odlíšiť alfa rytmus od µ-rytmu. Obrázok 4 zachytáva pre jednotlivé dni hodnoty výkonu µ-rytmu počas relaxovaného stavu so zatvorenými očami pred a po tréningu. Hodnoty štatistickej významnosi (p-hodnoty) párového t-testu indikujú štatisticky významný rozdiel (p<0.001) medzi spektrálnym výkonom µ-rytmu pred a po trénovaní pre všetky uvažované elektródy okrem C1 (p = 0.002). Zaujímavá je aj vizuálne výrazná zmena spektrálneho výkonu µ-rytmu v kontralaterálnej senzomotorickej oblasti (elektródy CP3 a C5) vzhľadom k paretickej pravej končatine. 4 Záver V práci sme sledovali vplyv zrkadlovej spätnej väzby (MVF) na zmenu špecifického motorického µ-rytmu u piatich zdravých subjektov a u pacienta s parézou pravej hornej končatiny. Našim cieľom bolo sledovť zmenu výkonového spektra µ-rytmu v relaxovanom stave po skončení MVF. Naším predpokladom bol nárast výkonového spektra. Napriek tomu, že sa nám kombináciou analýzy výkonových spektier počas relaxovaného stavu a počas motorického MVF tréningu podarilo identifikovať individuálny µ-rytmus u všetkých zdravých subjektov, na 154

155 µv 2 /Hz µv 2 /Hz µv 2 /Hz µv 2 /Hz FC C FC C Hz C CP C CP Hz C O C Hz Obr. 3: Porovnanie normalizovaného výkonového spektra pre jednotlivé dni u pacienta s hemiparézou (muž, 57 rokov) počas relaxácie so zatvorenými očami pred začiatkom (modrá krivka) a po skončení (červená krivka) motorického cvičenia so zrkadlovým boxom. Hodnoty spektrálneho výkonu boli odhadnuté FFT metódou na 4-sekundových segmentoch EEG, normované celkovým výkonom v pásme 4 30 Hz a následne spriemernené (pozri text). hladine štatistickej významnosti sme nepozorovali významné zmeny vo výkonovom spektre počas relaxovaných stavov pred a po skončení trénovania. Naopak, u pacienta sme pozorovali výrazny nárast výkonu jeho individuálneho µ-rytmu v relaxovanom stave so zatvorenými očami po skončení trénovania. Signifikantnosť tohto nárastu cez celú pozorovanú oblasť nad senzomotorickou kôrou predstavuje silný argument podporujúci pozitívny efekt MVF. Časová dĺžka trvania tohto efektu a jeho podmienenosť faktormi mentálnej a fyzickej povahy je cieľom ďalšieho štúdia. Poďakovanie Tento príspevok bol podporený grantovými úlohami APVV , a VEGA 1/0503/13 a 2/0043/13. Literatúra Bae, S., Jeong, W. a Kim, K. (2012). Effects of mirror therapy on subacute stroke patients brain waves and upper extremity functions. Journal Physical Therapy Science, 24: Buccino, G., Solodkin, A. a Small, S. (2006). Functions of the mirror neuron system: implications for neurorehabilitation. Cognitive and Behavioral Neurology, 19: Deconinck, F., Smorenburg, A., Benham, A., Ledebt, A., Feltham, M. a Savelsbergh, G. (2015). Reflections on mirror therapy: A systematic review of the effect of mirror visual feedback on the brain neurorehabilitation. Neurorehabilitation and Neural Repair, 29(4): Dohle, C., Püllen, J., Nakaten, A., Küst, J., Rietz, C. a Karbe, H. (2009). Mirror therapy promotes recovery from severe hemiparesis: a randomized controlled trial. Neurorehabilitation and Neural Repair, 23: Ezendam, D., Bongers, R. a Jannink, M. (2009). Systematic review of the effectiveness of mirror therapy in upper extremity function. Disability and Rehabilitation, 31: Gregory, R. (1968). Perceptual illusions and brain models. Proceedings of Royal Society of London B: Biological Sciences, 171: Iacoboni, M. (1999). Cortical mechanisms of human imitation. Science, 286: Pomeroy, V., Clark, C., Miller, J., Baron, J., Markus, H. a Tallis, R. (2005). The potential for utilizing the mirror neurone system to enhance recovery of the severely 155

156 Spekt. výkon [Hz] FC3 p=4.9128e 06 *** C1 p= ** C3 p=3.9005e 05 *** Spekt. výkon [Hz] C5 p=4.5058e 10 *** CP3 p=3.6936e 06 *** O1 p=5.35e 11 *** Spekt. výkon [Hz] Spekt. výkon [Hz] FC4 p=5.7134e 07 *** C6 p=9.5016e 08 *** Day C2 p=2.1035e 06 *** CP4 p=7.9389e 05 *** Day C4 p=4.206e 07 *** Day Obr. 4: Porovnanie hodnôt výkonových spektier v definovanom individuálnom pásme µ-rytmu ( Hz) pre hemiparetického pacienta počas 31 experimentálnych dní. Modrá a červená krivka znázorňujú priemerné výkonové spektrum na jednotlivých elektródach počas relaxácie so zatvorenými očami pred a po motorickom cvičením so zrkadlovým boxom. Hodnoty štatistickej významnosti sú uvedené nad grafom (***: p < 0.001, **: p < 0.01). affected upper limb early after stroke: a review and hypothesis. Neurorehabilitation and Neural Repair, 19:4 13. Praamstra, P., Torney, L., Rawle, C. a Miall, C. (2011). Misconceptions about mirror-induced motor cortex activation. Cerebral Cortex, 21: Ramachandran, V., Rogers-Ramachandran, D. a Cobb, S. (1995). Touching the phantom limb. Nature, 377: Rosen, B. a Lundborg, G. (2005). Training with a mirror in rehabilitation of the hand. Scandinavian Journal of Plastic and Reconstructive Surgery and Hand Surgery, 39: Staudt, M., Grodd, W., Gerloff, C., Erb, M., Stitz, J. a Krägeloh-Mann, I. (2002). Two types of ipsilateral reorganization in congenital hemiparesis: a TMS and fmri study. Brain, 125: Taub, E., Crago, J. a Uswatte, G. (1998). Constraintinduced movement therapy: a new approach to treatment in physical rehabilitation. Rehabilitation Psychology, 43: Touzalin-Chretien, P. a Dufour, A. (2008). Motor cortex activation induced by a mirror: evidence from lateralized readiness potentials. Jounral of Neurophysiology, 100: Touzalin-Chretien, P., Ehrler, S. a Dufour, A. (2010). Dominance of vision over proprioception on motor programming: evidence from ERP. Cerebral Cortex, 20: Yavuzer, G., Selles, R., Sezer, H. a spol. (2008). Mirror therapy improves hand function in subacute stroke: a randomized controlled trial. Archives of Physical Medicine and Rehabilitation, 89: Sütbeyaz, S., Yavuzer, G., Sezer, N. a Koseoglu, B. (2007). Mirror therapy enhances lower-extremity motor recovery and motor functioning after stroke: a randomized controlled trial. Archives of Physical Medicine and Rehabilitation, 88:

157 Kognícia a umelý život 2015, Trenčianske Teplice Paradigma ukotvenej kognície nový pohľad na mentálne reprezentácie Ján Rybár Centrum pre kognitívnu vedu, KAI, FMFI UK Bratislava, Mlynská dolina [email protected] Abstrakt Príspevok je venovaný analýze paradigmy ukotvenej kognície a teórii perceptuálnych symbolov. Táto teória reflektuje prevratné zmeny v kognitívnovednom poznaní, či už ide o výsledky behaviorálnych vied alebo výsledky vied o mozgu. Tieto nové poznatky prinášajú nový pohľad na úlohu percepcie pri reprezentovaní poznatkov v našej mysli. 1 Úvod Vývoj v oblasti kognitívnej vedy, od jej zrodu v päťdesiatych rokoch minulého storočia, bol veľmi pestrý na ideové platformy a prešiel niekoľkými významnými etapami. Je zaujímavé, že vznik každej novej etapy bol spojený s formulovaním novej paradigmy (nových fundamentálnych ideí a metód). Prvou štartovacou etapou bola symbolová paradigma. V tomto prístupe sa ľudská inteligencia (myslenie) chápe predovšetkým ako manipulácia so symbolmi. Typickou ukážkou tohto prístupu je klasická komputačná teória mysle. Táto teória, zjednodušene povedané, vychádza z predstavy, že myseľ sa podobá digitálnemu počítaču, ktorý má k dispozícii symbolové reprezentácie a manipuluje s nimi podľa určitých syntaktických pravidiel. Myšlienky sú potom mentálne reprezentácie, teda v istom zmysle symbolové reprezentácie v jazyku myslenia. V osemdesiatych rokoch minulého storočia sa však v oblasti umelej inteligencie a kognitívnej vedy už jasne ukázalo, že symbolový prístup nie je univerzálny a nedajú sa ním uspokojivo vysvetliť také fundamentálne procesy ľudskej kognície, ako sú percepcia a rôzne jazykové funkcie. Množstvo výskumníkov sa začalo zaujímať aj o tzv. subsymbolové prístupy. Mnohí z nich začali modelovať kognitívne funkcie pomocou umelých neurónových sietí. Ukázalo sa, že táto paradigma, pre ktorú sa ujal názov konekcionistická, poskytuje veľké možnosti najmä pre pochopenie nízko úrovňovej kognície, takej ako je vizuálne rozpoznávanie objektov alebo rozpoznávanie reči. Vznikli ostré diskusie medzi klasickým symbolovým a konekcionistickým prístupom. Diskusie vniesli nové svetlo na mnoho tradičných problémov, napríklad na dilemu vrodené verzus získané (pokiaľ ide o problém akvizície jazyka), dilemu toku informácií prístup zdola-nahor verzus prístup zhora-nadol (pokiaľ ide o oblasť percepcie, pozornosti a pod.) V ostatnom desaťročí sa začala výrazne presadzovať ďalšia paradigma paradigma stelesnenej kognície (embodied cognition). Predchádzajúce paradigmy si veľmi nevšímali dôležitosť senzomotorickej inteligencie. Jednota percepcie a motoriky sa postupne stáva kľúčovou témou skúmania a nového pohľadu na rôzne oblasti kognície (jazykovú percepciu, abstraktné myslenie, sociálnu kogníciu, kognitívny vývin atď.). V súčasnosti sa tieto nové tendencie často presadzujú aj pod značkou ukotvenej kognície (grounded cognition). Program týchto dvoch platforiem je v mnohom spoločný. Dá sa povedať, že jednotliví autori, ktorí sa hlásia k týmto platformám, sa odlišujú len rôznym stupňom ostrosti kritiky klasickej symbolovej paradigmy. Vzhľadom na rôzne možné oblasti ukotvenia kognície (telo, myseľ, fyzikálne a kultúrne prostredie) súhlasím s názorom, že termín ukotvená kognícia je výstižnejší, než termín stelesnená kognícia a budem ho preferovať v ďalšom texte. Niektoré poznatky, ktoré sa dosiahli v rámci klasickej symbolovej paradigmy, sú ľahko akceptovateľné aj v novej. V interpretácií iných poznatkov sa platformy diametrálne rozchádzajú. Hlavným predmetom sporu je rôzny pohľad na mentálne reprezentácie, predovšetkým tzv. amodálne reprezentácie. 2 Mentálne a amodálne reprezentácie Je veľa možností ako porozprávať (vysvetliť) príbeh o mentálnych reprezentáciách. Pomôžem si príbehom klasika Jeana Piageta ( ), 1 nie preto, že by som chcel renovovať jeho teóriu (idey). Nové generácie vývinových psychológov odchovaných na jeho teórii nenechali na nej nič celé, dokonca aj jeho experimentálne výsledky boli takmer všetky falzifikované (ale to je v poriadku, takto to chodí 1 V dejinách kognitívnej vedy by sme mohli Piagetovu koncepciu označiť za predklasickú symbolovú paradigmu. 157

158 v experimentálnej vede). K Piagetovi sa vrátim skôr z didaktických dôvodov, je to pre mňa len pomocný rebrík k pochopeniu, čo sú amodálne reprezentácie. Podľa Piagetovej teórie v kognitívnom vývine dieťaťa vo veku okolo jeden a pol roka prebehne niečo, čo môžeme smelo nazvať kopernikovská revolúcia. Dovtedy hlavnými kognitívnými nástrojmi boli zmyslové receptory a motorika (preto sa prvé vývinové štádium nazýva senzomotorické štádium). Táto revolúcia je charakterizovaná rozpadom, oddelením označujúceho (symbol) od označovaného (referent). Piaget je z frankofónneho prostredia, a preto použil terminológiu švajčiarskeho štrukturálneho lingvistu Ferdinanda de Saussure. S označujúcim do hry vstupuje reprezentácia (všetky ďalšie štádia kognitívneho vývinu budú mať prívlastok reprezentačné). 2 Jedna zo základných vlastností označujúceho (reprezentácie) je arbitrárnosť. Označujúce je v arbitrárnom vzťahu k svojmu označovanému (referentu), pretože spôsobom akým je utvorené, nevyjadruje žiadnu analógiu s fyzikálnymi alebo funkčnými vlastnosťami označovaného (referenta). 3 Podľa Piageta neskôr sa udeje ešte ďalšia významná zmena v kognitívnom vývine prechod od štádia konkrétnych operácií k štádiu formálnych operácií. V štádiu konkrétnych operácií už dieťa rozumie napríklad logickej operácií tranzitívnosti, ale len vtedy, keď vidí konkrétne objekty, napríklad bábiky. 4 V štádiu formálnych operácií tomu rozumie už aj bez toho, aby muselo vidieť konkrétne predmety. V pravom slova zmysle za amodálne reprezentácie 5 môžeme u Piageta považovať až operácie (myslenie) v štádiu formálnych operácií. 3 Iniciatíva ukotvenej kognície Po tomto priblížení dôležitých pojmov sa môžem posunúť k tomu s akým novým pohľadom prichádza iniciatíva ukotvenej kognície. Samozrejme, platforma 2 Samozrejme, boli aj iné možnosti, iné riešenia napríklad Fregeho trojuholník (pozri Kamhal, 2003). 3 Aby sme boli presní, podľa Piageta rozpad označujúceho od označovaného, môže mať spočiatku rôzne nenápadné, prechodné formy napríklad formu oddialenej nápodoby (keď dieťa napodobňuje niečo, čo nie je aktuálne prítomné), reč je najvyššou (najčistejšou) formou symbolickej (reprezentačnej) funkcie, ďalšie formy sú detská hra a detská kresba. 4 Ak máme bábiky rôznej veľkosti, dieťa v štádiu konkrétnych operácií vie, že platí, ak bábika A > bábika B a bábika B > bábika C, potom aj bábika A >bábika C, ale len vtedy, keď vidí konkrétne bábiky. 5 Tieto reprezentácie spĺňajú základnú požiadavku symbolovej paradigmy nie sú spojené so žiadnou špecifickou modalitou, sú autonómne od percepčných systémov a činnosti tela. ukotvenej kognície sa tu neobjavila len tak z ničoho. Aj tento príbeh má svoju históriu a mohol vzniknúť, až keď sa pre neho vytvorili určité vhodné podmienky. Ako je známe, v klasickej symbolovej paradigme bola tendencia transformovať alebo považovať za základ reprezentácie poznatkov v našej mysli symbolové, propozičné reprezentácie (Chomského univerzálna gramatika, Fodorov jazyk myslenia a ďalšie sú toho dobrým príkladom). Paiviova teória duálneho kódu reprezentácie poznatkov (v hre sú propozície, ale aj mentálne predstavy) a Shepardove skúmanie mentálnych rotácií určite neboli mainstreamovou témou. Na to však nadväzoval Kosslyn svojou hypotézou funkčnej ekvivalencie medzi percepciou a predstavovaním (medzi reálnou percepciou a mentálnymi predstavami) overovanej masívnym výskumom mentálnych predstáv ako nezastupiteľnej zložky reprezentácie poznatkov. Veľkým posunom, hoci spočiatku sa to tak nezdalo, bol objav zrkadliacich neurónov a intenzívne skúmanie prepojenia percepcie a motoriky (Rizzolati a jeho kolegovia). Myšlienka neoddeliteľnosti percepcie a motoriky nebola celkom nová. Prvý, kto si to uvedomoval a oveľa skôr o tom hovoril, bol J. Gibson. Je tu však jeden podstatný rozdiel úžasné zlepšenie technologických podmienok skúmania mozgu zdokonalenie EEG a vývoj a využívanie nových prístrojových zariadení, takých ako je fmri, PET, TMS a iné. V posledných rokoch môžeme hovoriť o explózii takto zameraných výskumov. Prinieslo to množstvo nových empirických poznatkov, prostredníctvom ktorých sa percepcia znovu vrátila do hry (hoci v iných súvislostiach), nejde len o jej prepojenie na motoriku, ale aj o multimodálne chápanie percepcie v užšom zmysle slova (skúmanie prepojenia rôznych druhov percepcie), a v širšom zmysle ako niečo, čo je zdieľané vo všetkých zložkách (modalitách) kognície, ako sú pamäť, jazyk a dokonca i takých, ako sú emócie a introspekcia. 6 Toto všetko prinieslo aj zmenu pohľadu na chápanie reprezentácie poznatkov a vôbec chápania pojmu mentálnych reprezentácií. Z rôznych prístupov v rámci ukotvenej kognície všeobecnú pozornosť zaujala Barsalouova teória perceptuálne symbolového systému. Ide o veľmi detailne prepracovanú koncepciu (Barsalou 1998, 2008, 2010). 4 Perceptuálne symbolový systém Spor s predchádzajúcimi teóriami je tu predovšetkým pokiaľ ide o reprezentáciu pojmového poznania (resp. abstraktného poznania). 6 Tak trochu akoby tu dochádzalo k opačnému extrému - za takmer všetkým vidieť perceptuálne reprezentácie, k tomu sa však ešte dostanem neskôr. 158

159 V tradičnom symbolovom pohľade pojmové reprezentácie (MR) nie sú spojené so žiadnou špecifickou modalitou, sú autonómne od percepčných systémov (sú amodálne). Poznanie je organizované propozične. Tieto interné reprezentácie sa používajú na inštruovanie motorických programov, ktoré sú nezávisle od percepcie, aj kognície ako takej. Podľa Barsalouovej koncepcie základy ľudskej kognície (resp. vyšších kognitívnych procesov) nespočívajú v amodálnych reprezentáciách. Reprezentácie nemajú arbitrárny charakter. Podľa neho sú to skôr reprezentácie, ktorých aktivačné vzory zahrňujú informácie z rôznych senzorických modalít. V základoch kognície sú modálne simulácie, čo je kľúčový nástroj Barsalouovho prístupu. Uplatňuje sa aj pri pojmových reprezentáciách. Ide o, všeobecne povedané, reaktivovanie percepčných, motorických a introspektívnych stavov získaných v priebehu našej skúsenosti so svetom, telom a mysľou. Vezmime si napríklad sedenie, mozog zachytí tento stav rôznymi modalitami a integruje ich do multimodálnej reprezentácie uloženej v pamäti (ako stolička vyzerá, ako ju dotykovo cítime, prostredníctvom introspekcie zachytí naše pocity komfortu a relaxácie). Pojmová reprezentácia neaktivuje abstraktné črty objektu, ale používa systém vytvorený percepciou (čo má aj dobrú neurálnu evidenciu). Barsalouova teória sa opiera o bohaté behaviorálne, klinické a neurozobrazovacie evidencie. Existuje veľa behaviorálnych potvrdení, že percepčné reprezentácie sú prítomné aj na úrovni abstraktných pojmov. Ani poznanie na úrovní vyšších kognitívnych procesov nemá čistý amodálny charakter. Ako príklad uvediem výsledky z výskumu, v ktorom bola použitá úloha na verifikovanie vlastností (the property verification task). Participantom bol prezentovaný pojem kôň, následne boli prezentované rôzne vlastnosti, niektoré pravdivé ( napr. hriva), iné nepravdivé (napr. rohy). Podľa Barsalouovej teórie participanti simulujú pojem a jeho vlastnosti pomocou perceptuálnych symbolov, a potom hodnotia, či daná vlastnosť patrí do simulovaného pojmu. Informácie o vlastnostiach obsahujú (parciálne) perceptuálne informácie (reprezentácie). 7 Pokiaľ ide o klinickú podporu Barsalouovej teórie, dôležité sú poznatky z pozorovania pacientov s rôznymi léziami. Zistilo sa, že lézie v jednotlivých (percepčných) modalitách mozgu zvyšujú pravdepodobnosť straty spracovania informácií prostredníctvom kategórií (deficity v rozpoznávaní kategórií). Napríklad poškodenie vizuálnych oblastí mozgu zvyšuje pravdepodobnosť straty schopností rozpoznávania kategórií zvierat (vizuálne spracovanie je často dominantná modalita pri spracovaní týchto kategórií). Podobne poškodenie motorickej kôry vedie 7 Tieto perceptuálne komponenty by bolo často veľmi ťažko verbalizovať. Dôležité pri simuláciách je aj ich prepínanie z jednej modality do druhej. k narastaniu pravdepodobnosti straty spracovanie informácií pomocou nástrojových kategórií (pretože pomocou nástrojov sa vykonáva nejaká činnosť a to už má niečo do činenia s motorikou). Veľká podpora tejto teórie vyplýva aj z výsledkov dosiahnutých skúmaním mozgu zobrazovacími metódami. Tieto poznatky korešpondujú s klinickými pozorovaniami. Keď ľudia používajú kategórie zvierat, tak sú aktivované vizuálne oblasti. Keď ľudia spracovávajú artefakty (také napr. ako kladivo apod.) motorické oblasti sa stávajú aktívnymi. Podobne, keď ľudia spracovávajú taký pojem ako je vôňa, olfaktorové oblasti sa stávajú aktívnymi. 5 Záver Na záver by som chcel konštatovať a oceniť, že Barsalouov prístup poskytuje teoretickú strechu na už existujúce empirické výskumy a orientuje a podnecuje ďalší výskum na relevantné témy. Osobitne dôležitou etapou bude, aj podľa jeho vlastných slov, prechod od dokumentačnej fázy, (ktorá potvrdila, že modálne spracovanie informácií je prítomné aj na úrovni vyšších kognitívnych procesov), k výpočtovému modelovaniu týchto procesov (ktoré je stále na začiatku). To, že je to perspektívny a životaschopný model, o tom svedčí aj skutočnosť, že vie reagovať, má odpovede, takmer na všetky aktuálne otázky kognitívnej psychológie s významným presahom aj do iných kognitívne relevantných disciplín, ako je neuroveda, lingvistika, vývinová a sociálna psychológia. Ešte jedna poznámka celkom nakoniec. Podľa môjho názoru v kognitívnych vedách bola vždy snaha (tendencia) pokúsiť sa vytvoriť jednotný model, ktorý by integroval silné stránky a eliminoval nedostatky jednotlivých paradigiem. V roku 2012, keď sme vydali knihu Kognitívne paradigmy, nemal som žiadneho kandidáta na túto úlohu, myslel som si, že vytvorenie takého modelu (paradigmy) je otázka veľmi vzdialenej budúcnosti. Dnes som presvedčený, že najväčšie šance stať sa takou jednotiacou paradigmou má paradigma ukotvenej kognície. Poďakovanie Tento príspevok vznikol v Centre pre kognitívnu vedu, KAI, FMFI UK s podporou VEGA, projekt č. 1/0503/13 a KEGA projekt č. 076UK-4/201. Literatúra Barsalou, L. W. (2008): Grounded Cognition. Annu. Rev. Psychol, 59:

160 Barsalou, L. W. (2010): Grounded Cognition: Past, Present, and Future. Topics in Cognitive Science, 2: Barsalou, L. W. (1999). Perceptual Symbol Systems. Behavioral and Brain Sciences 22: ( ). Kamhal, D.: Význam a jazyková prax, Olomouc: Univerzita Palackého, Piaget, J., Inhelderová B.: Psychológia dieťaťa. Bratislava, vyd. Sofa. Rybár, J. a kol. (2012): Kognitívne paradigmy. Bratislava, vyd. Európa. 160

161 Kognícia a umelý život 2015, Trenčianske Teplice Geometrické membránové systémy a modelování cytoskeletu Petr Sosík, Jaromír Konůpka Výzkumný ústav Centra excelence IT4Innovations Slezská univerzita v Opavě, Bezručovo nám. 13, Opava, Česká republika [email protected], [email protected] Abstrakt Představujeme nový model membránových systémů obohacený o geometrické vlastnosti. Model umožňuje definovat rozměry, tvar a vzájemnou polohu jednotlivých prvků (membrán a jejich organel) ve 2D a 3D a jejich růst řízený mechanismy běžnými v membránových systémech. Jako případovou studii ukážeme model regulovaného růstu buněčného cytoskeletu. Růst je regulován pomocí dynamické homeostázy mezi vnějším a vnitřním prostředím buňky. 1 Úvod Model membránového systému (Păun, 2002) vznikl před 12 lety jako součást boomu v oblasti tzv. biovýpočtů, tedy snah o konstrukci výpočetních mechanismů či automatů na bázi organické hmoty. Jde o diskrétní model výpočtu, svého druhu formální automat, inspirovaný strukturou buněk a tkání, jehož klíčovým prvkem je selektivně propustná membrána, propouštějící pouze určité molekuly, případně pouze určitým směrem, v určitých kombinacích a podobně. Membrány mohou být do sebe zanořené, viz obr. 1, odtud pramení název membránový systém. Molekuly spolu mohou rovněž reagovat na základě priority reakcí (inspirovanou reakční rychlostí). Postupně vznikla řada variant obohacených o další vlastnosti jako možnost dělení membrán nebo naopak jejich perforace a rozpadu, polarizace membrán, spojování membrán do tkání, regulace transportu membránovými proteiny a podobně. Zajímavé jsou tzv. pulsní neuronové P systémy, inspirované pulsním modelem neuronu a jeho chováním, převedeným do diskrétní domény. Jakkoli pokusy sestrojit buněčný počítač či automat na bázi těchto modelů dosud nepřinesly hmatatelné výsledky (rep. jsou v začátcích), existují slibné výsledky naznačující možnost jejich využití k modelování biologických procesů, např. Cheruku a spol. (2007); Jack a spol. (2009); Pérez-Jiménez a Romero-Campero (2005) a řada dalších. Modelováním biologických procesů je motivován i tento příspěvek. V žádném z existujících typů dosud používaných membránových systémů se nepracuje s topologií objektů ve smyslu, zda jsou od sebe blízko nebo daleko, zda se dotýkají a podobně. Vzájemný kontakt je definován pouze u membrán. Přitom se jeví přirozené použít membránové systémy k vytvoření maximálně zjednodušeného modelu řady buněčných funkcí, s cílem zjistit, jaké minimální regulační mechanismy jsou zapotřebí, aby buňky mohly tyto funkce vykonávat. Geometrické membránové systémy (GMS) definované v této práci byly motivovány snahou modelovat funkci pevných organel uvnitř buňky, například cytoskeletu, jenž hraje klíčovou roli v regulaci řady buněčných procesů, např. i buněčného dělení. Na tomto modelu ukážeme, že k vybudování komplexní struktury cytoskeletu postačí sada několika jednoduchých vývojových pravidel. Růst cytoskeletu v GMS do jisté míry připomíná Lindenmayerovy systémy. Na rozdíl od nich však náš model obsahuje i plovoucí objekty a membrány, jež umožňují definovat analogii látkové výměny mezi buňkou a okolním prostředím, a tím regulovat růstové procesy uvnitř buňky. Následně model umožňuje zavést i řadu dalších procesů běžně využívaných v membránových systémech, jako buněčné dělení, vnořené membrány obklopující organely v buňce a další. 1.1 Cytoskeleton Cytoskeleton je důležitou součástí buňky, která zajišťuje tvar, stabilitu, pohyb a transport látek či buněčných komponent. Tvoří trojrozměrnou síť skrz celý cytosol (výplň buněk). Cytoskeleton obsahuje tři typy filamentů (Wikiskripta, 2015): Aktinový filament má hlavní podíl na udržení tvaru a vnitřní organizace buňky. Intermediární filament díky své pevnosti v tahu poskytuje mechanickou pevnost. Mikrotubuly slouží k transportu různých struktur a látek uvnitř buňky. V této práci se zaměříme na modelování mikrotubulů, proto stručně popíšeme jejich složení a vlastnosti. Základní bílkovinou je tubulin dimer, tvořený dvěmi podjednotkami, zvanými alfa-tubulin a beta-tubulin. Dimery tubulinů se mohou navazovat na další dimery, avšak pouze alfa-tubulin na beta-tubulin. Takto může vzniknout řetězec, který nazýváme protofilament (Wikiskripta, 2015). Mikrotubulus je dutý váleček, který se skládá ze 13 protofilamentů. K růstu může dojít pouze na tom konci mikrotubulu, který má beta-tubulin. Na opačné straně, 161

162 Obr. 1: Membránová struktura a jí odpovídající membránový strom. Zdroj: Păun (2001). Obr. 2: Schéma mikrotubulu. Odstínem jsou odlišeny jednotky alfa-tubulinu a beta-tubulinu; v levé dolní části obrázku je schématický příčný řez mikrotubulem. Zdroj: Wikimedia Commons, autor Frank Boumphrey kde je alfa-tubulin, dochází k ukotvení v organizačních centrech mikrotubulů (Wikipedia, 2015). Mikrotubuly jsou organizovány do prostorové sítě pomocí centrozomu. Jde o organelu živočišných buněk a buněk nižších rostlin, která hraje klíčovou roli také během buněčného dělení. Centrozom je tvořen dvěma centriolami, válcovitými útvary složenými převážně z tubulinu. Centrioly v centrozomu jsou vzájemně orientovány v pravém úhlu. 2 Geometrický membránový systém V porovnání s verzí P systémů, které byly publikovány např. v monografii Păun a spol. (2010), je P systém popisovaný v této práci rozšířen o geometrické uspořádání svých komponent. Bereme v úvahu přesnou pozici pevných objektů, jejich vzájemnou vzdálenost pro možnou interakci, růst a evoluci. To vše se řeší ve 2D, nebo 3D Euklidovském prostoru. Využíváme dva typy objektů: Pevné objekty jsou prvky prostorových struktur, které Obr. 3: Struktura centrozomu tvořeného dvěma centriolami. Zdroj: Wikimedia Commons, autor Kelvin Song. během vývoje systému postupně rostou. Pevné objekty se mohou navzájem spojovat. Můžeme je v počáteční konfiguraci určit jako jádro růstu. Příkladem pevných objektů jsou fragmenty cytoskeletu tubuly, nebo části membrán, jimž budeme také říkat dlaždice. Během vývoje P systému mohou dlaždice zformovat uzavřenou strukturu membránu. Dlaždice mohou obsahovat proteinové kanály, které umožňují průchod plovoucích objektů ven nebo dovnitř membrány. Plovoucí objekty mohou být dvou druhů, a to buď běžné objekty imitující molekuly různých druhů, nebo katalyzátory. Manipulace s plovoucími objekty je inspirována tzv. P systémy s proteiny na membránách (Păun a Popa, 2006; Sosík a spol., 2010). 162

163 Všechny pevné objekty mají vlastní specifickou pozici. Lze je umístit buďto uvnitř membrány anebo ve volném prostoru. Pevné objekty obsahují jeden nebo více bodů napojení, tzv. konektorů. Konektor obsahuje spojovací protein a má danou pozici x relativní vzhledem k centru pevného objektu, jehož je součástí. Konektor je dále popsán úhlem ϕ i, jenž určuje jeho napojení na další konektor jiného pevného objektu. Lepící relace G definuje možná spojení proteinů. Jestliže dva proteiny ve vzdálenosti nejvýše r int tvoří pár v lepící relaci, vzniká mezi nimi vazba. Role proteinů na pevných objektech může být dvojí. Buďto se chovají jako výše popsané proteinové kanály, anebo slouží jako konektory pro spojení dvou pevných objektů. Tyto role se navzájem nevylučují a mohou se kombinovat. Definice 2.1 Geometrický P system s proteinovými kanály (dále jen geometrický P systém) v n-rozměrném prostoru je konstrukt kde Π = (O, P, Q, E, r int, G, R, S), O je množina plovoucích objektů; P je množina proteinů; Q = Q 1 Q 2 je množina pevných objektů, kde Q 1, Q 2, O, P jsou navzájem disjunktní množiny: Každý pevný objekt s Q je plně popsán množinou proteinů (konektorů), které určují jeho tvar a napojení na další objekty: s = {(p i, x i, ϕ i )}, kde p i P, x i R n a ϕ i 0, 2π). Souřadnice konektorů jsou udány relativně k bodu 0 (středu objektu) nacházejícímu se uvnitř objektu. Q 1 Q 2 je množina membránových objektů (dlaždic), z nichž každá je konečný objekt v R n 1. Jeho tvar je definován jako konvexní obal množiny konektorů, jež se na něm nacházejí. je množina objektů cytoskeletu (tubulů), každý je geometricky chápán jako množina tyčinek spojující centrum objektu s konektory, není-li řečeno jinak. E O je množina plovoucích objektů nacházejících se v okolním prostředí v libovolně velkém počtu kopií; r int je vzdálenost, na kterou spolu dva proteiny reagují; G (P P ) je lepící relace; pokud (p 1, p 2 ) G, pak se proteiny p 1 a p 2 vážou dohromady, nacházejí-li se ve vzdálenosti nejvýše r int ; každý protein se může účastnit jen jedné vazby; protein nazýváme volný pokud se neúčastní žádné vazby. R je konečná množina vývojových pravidel geometrického P systému; S (Q 1 R n ) je počáteční množina pevných objektů přítomná v prostředí na začátku vývoje: každý její prvek (s, x) S určuje pevný objekt s na pozici x (vzhledem k počátku souřadné soustavy). Konfigurace systému je určena množinou pevných objektů umístěných v systému společně s jejich souřadnicemi a úhly, a dále obsahuje multimnožinu plovoucích objektů umístěných v každé oblasti ohraničené membránou. Pro jednoduchost budeme předpokládat, že každá nově vytvořená membrána obsahuje prázdnou multimnožinu plovoucích objektů. Počáteční konfigurace obsahuje pouze dvojice pevných objektů (s, x) S. Předpokládáme, že úhel počátečních pevných objektů je nula a není vytvořena žádná uzavřená struktura (uzavřené struktury jsou postupně vytvářeny lepením dlaždic). Systém přechází mezi konfiguracemi paralelní aplikací pravidel z množiny R. Rozlišujeme dva typy pravidel: Růstová pravidla pro pevné objekty Pravidlo vytvářející objekt s Q má tvar u s, kde u O +. Pro aplikaci pravidla musí být multimnožina u plovoucích objektů přítomna v oblasti, kde bude s tvořeno. Kromě toho, s musí obsahovat konektor (q, x, ψ) a musí existovat volný konektor (p, y, ϕ) umístěný na již existujícím pevném objektu t s tím, že (p, q) G. Během aplikace pravidla je multimnožina u spotřebována a pevný objekt s je vytvořen a připojen konektorem (q, x, ψ) k (p, y, ϕ) následovně: 1. souřadnice q jsou identické s p, a objekt s je orientován tak, že x a y mají stejný směr; 2. je-li t dlaždice z Q 1 : objekt s vložíme do společné nadroviny s t, pak s natočíme o úhel φ podél osy kolmé k x, ležící v nadrovině dané t a protínající společný konektor; je-li t tubulus z Q 2 : objekt s může být natočen náhodně podél vektoru x, pak je natočen o úhel φ podél libovolné osy kolmé na x a protínající společný konektor. 3. Jestliže jakákoli část s by protínala existující pevný objekt, pak je růst blokován a s nemůže být připojen k t. Po připojení s k t si dále ověříme, zda existují další dvojice volných konektorů s proteiny q na s a p na jiném existujícím pevném objektu, tak že (p, q ) G a jejich vzdálenost je nejvýše r int, pak p and q jsou k sobě připojeny. 163

164 Pravidla pro plovoucí objekty Nechť a, b, c, d jsou plovoucí objekty a p je protein, pak pravidla mohou mít tvar: Typ Pravidlo Efekt 1res [ p a] [ p b] změna objektu a[ p ] b[ p ] bez přesunu 2res [ p a] a[ p ] přesun objektu a[p ] [p a] beze změny 3res [ p a] b[ p ] změna a přesun a[ p ] [ p b] jednoho objektu 4res a[ p b] b[ p a] výměna dvou objektů 5res a[p b] c[p d] výměna a změna dvou objektů Ve všech případech v tabulce se protein p nemění, vždy hraje pouze roli katalyzátoru umožňujícího manipulaci s objekty. Proteiny umístěné na dlaždicích nejsou nijak omezeny ve využití typu pravidla. Proteiny na tubulech se mohou účastnit pouze pravidel typu 1res. Každý protein a každý plovoucí objekt může v každém kroku participovat pouze v jednom pravidle libovolného typu. Pravidla se aplikují nedeterministickým maximálně paralelním způsobem. V každém kroku je využita maximální multimnožina pravidel, což znamená, že neexistuje pravidlo, které by šlo s objekty a proteiny provést a jeho vstupní multimnožina objektů zůstane nepoužita. 2.1 Priorita mezi pravidly Některé modely P systémů využívají prioritní relace mezi pravidly, čímž se snaží napodobit různou propensitu chemických reakcí. Jestliže uspořádání jednotlivých pravidel dle priorit bude úplné, vznikne nám deterministický P systém (Gheorghe a spol., 2010). Obvykle je povoleno částečné uspořádání pravidel, které má za následek rozdělení pravidel do skupin s různou prioritou. Pravidla uvnitř každé skupiny jsou vybírána nedeterministicky. 3 Modelování růstu cytoskeletu v buňce Základní postup modelování cytoskeletu v této kapitole je následující: geometrický P systém začne pracovat s jednou počáteční dlaždicí, postupně se vytvářejí a připojují další dlaždice. Tyto dlaždice obsahují také proteinové kanály, které jsou ihned aktivní. Avšak dokud se nám nevytvoří uzavřená membránová struktura, jakýkoliv objekt, který z prostředí zachytíme, membránou pouze projde a opět zmizí v prostředí. Ve chvíli, kdy se vytvoří kompletní membrána a tím i uzavřený vnitřní prostor, objekty přicházející skrze kanály se začnou uvnitř kumulovat a tím začne docházet k tvorbě odlišného vnitřního prostředí. Uvnitř membrány se tedy začne formovat nová multimnožina, která nám dovolí za využití pravidel řídit růst cytoskeletu. S tím, jak se bude systém vyvíjet, nám nově přidané části cytoskeletu zvětší počet proteinů, což bude mít vliv na metabolizmus. Růst cytoskeletu se zastaví teprve ve chvíli, kdy nebude mít více prostoru pro růst (např. stěna membrány). Druhou možností zastavení růstu je utvoření dynamické homeostázy mezi metabolizmem na jedné straně a přísunem a odsunem plovoucích objektů na straně druhé. V této kapitole dále přiřadíme pravidlům pro plovoucí objekty vyšší prioritu než pravidlům pro růst cytoskeletu, což znamená, že nejdříve je aplikována maximální multimnožina pravidel pro plovoucí objekty. Nevyužité objekty jsou potom předány pravidlům pro růst cytoskeletu. Touto cestou lze růst cytoskeletu regulovat pomocí celkového stavu buňky. 3.1 Příklad Uvažujme geometrický P systém ve 3-rozměrném prostoru: Π = (O, P, Q, E, r int, G, R, S), kde O = {a, b} P = {p 0, p 1, p 2, p 3, p 4, p a, p b } ; Q = Q 1 Q 2 Q 1 = {q 1, q 2 }, kde což jsou dvě dlaždice tvaru pravidelného pětiúhelníka s proteiny p a v jeho vrcholech a p b ve středu každé strany. Pouze středové proteiny jsou zahrnuty v lepící relaci G a mohou se vázat s dalšími proteiny. Dále dlaždice q 1 obsahuje poblíž svého středu protein p 1 (membránový kanál) a dlaždice q 2 obsahuje podobně protein p 0 startovací místo pro růst cytoskeletu. Formálně: q 1 = {(p a, x i, 0) 1 i 5} {(p b, y i, ) 1 i 5} {(p 1, (1, 0), π/2)} kde x i = 5 (cos( 2(i 1) 5 π), sin( 2(i 1) 5 π)), 1 i 5 (vrcholy), y i = (cos( 2i 1 2i 1 5 π), sin( 5 π)), 1 i 5 (středy stran). Všimněte si, že radiánu je úhel, který svírají dvě stěny dvanáctistěnu. Hodnota 5 je zvolená vzdálenost od středu pětiúhelníka k jeho vrcholům, pak je vzdálenost od středu k centru každé strany. Dlaždice q 2 je shodná q 1 s výjimkou, že má protein p 0 namísto p 1. Q 2 = {s 1, s 2, s 3 }, kde s 1 = {(p 2, (0, 1), 0), (p 2, (0, 1), 0)} (přímý segment se dvěma proteiny); s 2 = {(p 2, (0, 1), 0), (p 3, ( 0.5, 1), 0), (p 3, (0.5, 1), 0)} (větvící segment); 164

165 s 3 = {(p 4, (0, 1), 0), (p 4, (0, 1), 0)} (půl-oválný segment). p 2 p 3 p 3 p 4 s 1 : s 2 : s 3 : p 2 p 2 p 4 E = {a}; r = 0.1 je vzdálenost interakce proteinů; G = {(p 0, p, 2), (p 2, p 2 ), (p 3, p 4 ), (p 4, p 3 ), (p 4, p 4 ), (p b, p b )} je lepící relace; R obsahuje pravidla: a[p 1 b] b[p 1 c]; a[p 1 ] [p 1 c]; [p 2 c] [p 2 b]; [p 3 c] [p 3 b]; [p 4 c] [p 4 b]; aaa q 1 ; cc s 1 ; cc s 2 ; cc s 3 ; S = {(q 2, x 0 )} je počáteční dlaždice, kde x 0 = (0, 0, ). 2 Vývoj popsaného P systému je následující: 1. V počáteční konfiguraci je pouze q 2 umístěná středem v bodě x V prvním kroku je použito pravidlo aaa q 1. Pět dlaždic q 1 je připojeno k pěti konektorům p b dlaždice q 2. Jejich další nově vytvořené proteiny p b se také spojí dohromady (zapadnou k sobě se sousedními dlaždicemi, protože jejich vzdálenost je blízká 0). 3. Druhý krok nám přidá pět dalších dlaždic q 1, které se napojí k již existujícím. 4. Ve třetím kroku se vytvoří poslední pětiúhelníková dlaždice q 1, tím dojde k uzavření dvanáctistěnu a je tak vytvarována membrána. Obsah membrány je v tuto chvíli prázdný. 5. Po dokončení konstrukce membrány se 11 proteinových kanálů p 1 umístěných na dlaždicích q 1 postará o přísun 11 objektů c dovnitř buňky. Toto proběhne i v každém dalším kroku paralelně s dalšími pravidly. 6. Předpokládejme, že jsou dva objekty c spotřebovány za použítí pravidla [cc s 1 ], čímž vznikne tubulus s 1 napojený na protein p 0 ve středu dlaždice q 1. (Díky nedeterminismu může být alternativně vytvořen a připojen tubulus s 2 ). Obr. 4: Růst cytoskeletonu v geometrickém P systému z kapitoly V tuto chvíli je pouze jeden volný protein p 2, z toho důvodu lze vytvořit a napojit na něj tubulus s 1 či s 2. Předpokládejme, že tentokrát se vytvoří s 2 a spotřebují se dva objekty c. 8. Vznikly dva volné proteiny p 3, proto lze s použitím čtyř objektů c vytvořit dva objekty s 3, které se napojí na rostoucí cytoskelet. Zároveň protein p 2 využije pravidla [p 2 c] [p 2 b], čímž změní jeden objekt c na objekt b (simulace metabolismu). 9. Nyní máme dva volné proteiny p 4, a růst cytoskeletu pokračuje obdobně jako dosud. Každý z vytvořených proteinů p 2, p 3 nebo p 4 přeměňuje jeden objekt c na b. Dále je použito pravidlo pro antiport a[p 1 b] b[p 1 a], které vyloučí jeden objekt b, zatímco přijme objekt a. Vidíme postupný růst struktury mikrotubulů obsahující stále více proteinů p 2, p 3 a p 4. Každý z nich se bude účastnit pravidel pro metabolismus a měnit objekty c na b. Až se v membráně vytvoří více jak 11 uvedených proteinů, počet objektů c přestane narůstat a naopak postupně začne klesat. Po uplynutí několika kroků se tyto objekty vyčerpají, růst se zastaví, a protože pravidla pro růst mikrotubulů mají nižší prioritu než pravidla pro plovoucí objekty, začne převládat v systému udržování metabolizmu namísto tvorby nových mikrotubulů. Bude dosaženo dynamické homeostázy, která přetvoří v každém kroku 11 objektů c na objekty b. Objekty b se eventuálně vyloučí z buňky. Systém je nedeterministický díky lepící relaci, která umožňuje více variací růstu. Obrázek 4 nám ukazuje příklad růstu cytoskeletu. Vidíme zde růst postupně tubuly s 1 a s 2, dále se růst rozdělí na sekvence s 3 s 3 a s 3 s 2 s 1 s 2. 4 Závěr Membránové systémy jsou dosud využívány zejména jako abstraktní výpočetní automat umožňující studovat 165

166 výpočetní sílu řady buněčných operací a jejich spojení, což poskytuje mj. teoretické pozadí pro výzkumy v oblasti syntetické a systémové biologie. Existují však i práce představující membránové algoritmy in silico pro řešení výpočetně obtížných úloh (často optimalizačních problémů), s lepšími parametry než klasická řešení. Kromě toho řada autorů využívá membránové systémy k modelování reálných biologických procesů. Model geometrického membránového systému (GMS) představený v tomto příspěvku patří do poslední uvedené skupiny. Na rozdíl od dosud existujících membránových modelů zavádí geometrické vztahy mezi pevnými objekty v modelovaném živém systému (buňce nebo jejich společenství). Primární motivací geometrických membránových systémů bylo modelování růstu buněčného cytoskeletu, model je však dostatečně obecný pro pokrytí řady dalších možných buněčných procesů. Na rozdíl od Lindenmayerových systémů, které pouze imitují tvary růstu živých organismů, umožňují GMS prostřednictvím evolučních pravidel pro plovoucí objekty modelovat jednoduché metabolické procesy v buňce, a tím i regulační buněčné mechanismy a kaskády. Motivační příklad v kapitole 3.1 je velmi jednoduchý. Cílem těchto modelů do budoucna je postihnout nejdůležitější (minimální) sadu procesů regulujících růst a formování buněčného cytoskeletu, a případně poskytnout nové hypotézy v tomto směru. Poděkování Tato práce byla podpořena Evropským fondem pro regionální rozvoj v rámci projektu Centrum excelence IT4Innovations (CZ.1.05/1.1.00/ ), a Slezskou univerzitou v Opavě v rámci Studentského grantového systému, projekt č. SGS/6/2014. lovak Pérez-Jiménez, M. a Romero-Campero, F. (2005). A study of the robustness of the EGFR signalling cascade using continuous membrane systems. V First Intern. Work-Conference on the Interplay between Natural and Artificial Computation, IWINAC 2005, Las Palmas de Gran Canaria. Păun, A. a Popa, B. (2006). P systems with proteins on membranes. Fundamenta Informaticae, 72(4): Păun, G. (2002). Membrane Computing An Introduction. Springer, Berlin. Păun, G., Rozenberg, G. a Salomaa, A. (zost.) (2010). The Oxford Handbook of Membrane Computing. Oxford University Press, Oxford. Păun, G. (2001). P systems with active membranes: attacking NP-complete problems. J. Automata, Languages and Combinatorics, 6(1): Sosík, P., Păun, A., Rodríguez-Patón, A. a Pérez, D. (2010). On the power of computing with proteins on membranes. Păun, G., Pérez-Jiménez, M., Riscos- Núnez, A., Rozenberg, G. a Salomaa, A. (zost.), V Membrane Computing, 10th International Workshop, WMC 2009, vol z Lecture Notes in Computer Science, str , Berlin. Springer. Wikipedia (2015). Mikrotubulus. wikipedia.org/wiki/mikrotubulus. Wikiskripta (2015). Cytoskelet z pohledu biofyziky. Cytoskelet_z_pohledu_biofyziky. Literatura Cheruku, S., Păun, A., Romero-Campero, F., Pérez- Jiménez, M. a Ibarra, O. (2007). Simulating FASinduced apoptosis by using P systems. Progress in Natural Science, 17(4): Gheorghe, M., Manca, V. a Romero-Campero, F. J. (2010). Deterministic and stochastic p systems for modelling cellular processes. Natural Computing, 9(2): Jack, J., Păun, A. a Rodríguez-Patón, A. (2009). Effects of HIV-1 proteins on the Fas-mediated apoptotic signaling cascade: A computational study of latent CD4+, T cell activation. Corne, D. W., Frisco, P., Păun, G., Rozenberg, G. a Salomaa, A. (zost.), V Membrane Computing: 9th International Workshop, vol z Lecture Notes in Computer Science, str

167 Kognícia a umelý život 2015, Trenčianske Teplice Interferencia zrakovej a sluchovej pozornosti pri dichotickej stimulácii Marián Špajdel (1, 2), Zdenko Kohút (3), Barbora Cimrová (1, 3), Stanislav Budáč (1), Veronika Roháriková (1), Igor Riečanský (1, 4) (1) Laboratórium kognitívnej neurovedy, Ústav normálnej a patologickej fyziológie SAV, Sienkiewiczova 1, Bratislava (2) Katedra psychológie, Fakulta filozofie a umení, Trnavská univerzita, Hornopotočná 23, Trnava (3) Centrum pre kognitívnu vedu, Katedra aplikovanej informatiky, Fakulta matematiky, fyziky a informatiky, Univerzita Komenského v Bratislave, Mlynská dolina, Bratislava (4) SCAN Unit, Department of Basic Psychological Reserach and Research Methods, Faculty of Psychology, University of Vienna, Liebiggasse 5, 1010 Vienna, Austria [email protected], [email protected], [email protected], [email protected] Abstrakt V našej štúdii sme skúmali doteraz neobjasnenú interferenciu zamerania priestorovej pozornosti v zrakovej a sluchovej modalite. Pomocou reflexných sakadických očných pohybov sme sledovali efekt selektívneho zamerania vizuálnej pozornosti na výsledok testu dichotickej stimulácie. Zrakové podnety boli prezentované synchrónne, resp. asynchrónne s nástupom dichotického podnetu a to vo vzdialenosti 10, resp. 45 stupňov od stredového fixačného bodu. Naše výsledky ukázali, že v prípade synchrónnej prezentácie podnetov sú veľké presuny vizuálnej pozornosti (45 stupňov) sprevádzané selektívnym zameraním sluchovej pozornosti. Pokiaľ bola sluchová pozornosť zameraná výhradne smerom kongruentným so smerom sakády, dochádza k oneskoreniu nástupu sakády a toto oneskorenie je výraznejšie v prípade, ak je (zraková aj sluchová) pozornosť zameraná do pravej strany. Pri asynchrónnej prezentácii podnetov sme nepozorovali žiadnu interakciu. Výsledky interpretujeme s ohľadom na funkčnú asymetriu hemisfér. 1 Úvod Pozornosť je fundamentálnou kognitívnou funkciou, súborom kontrolných a výkonných systémov, ktorý umožňuje adaptovať senzorické systémy na rozličné percepčné úlohy vzhľadom k aktuálnym potrebám (Posner, DiGirolamo, 2000). Pozornosť je selektívna, jedinec pomocou tohto súboru kognitívnych dejov flexibilne vyberá, ktoré podnety budú spracované a ktoré nie. Jedná sa teda o súbor procesov, ktoré zabezpečujú kompromis medzi množstvom potenciálne relevantných informácií v prostredí a obmedzenou kognitívnou a percepčnou kapacitou jedinca, za účelom optimalizácie správania. V tejto štúdii sme sa špecificky zamerali na priestorovú selektívnu pozornosť, a to v dvoch senzorických modalitách - zrakovej a sluchovej. Zraková priestorová pozornosť upriamuje percepčné procesy na spracovávanie podnetov pochádzajúcich z konkrétneho miesta alebo oblasti v priestore a je úzko spojená s rýchlymi pohybmi očí skenujúcimi objekt záujmu (sakádami) (Moore, Armstrong, Fallah, 2003). Predchádzajúce štúdie zrakovej priestorovej pozornosti ukázali, že zameranie priestorovej pozornosti zlepšuje presnosť a rýchlosť reakcií na cieľové podnety, ktoré sa nachádzajú v priestore, zvyšuje teda senzitivitu a taktiež redukuje interferenciu s distraktormi (Mangun, Hillyard, 1995). V našej stúdii sme ako metódu pre zrakovú modalitu použili reflexné (exogénne) sakády. Ide o "skokovité" rýchle simultánne pohyby oboch očí za účelom opakovanej fixácie podnetu vyvolané jeho zdanlivým pohybom (zobrazením podnetu na periférii zorného pola pri súčasnom zmiznutí pôvodne fixovaného). Sluchovú modalitu sme testovali použitím dichotickej stimulácie. Pri dichotickej stimulácii sa od vyšetrovaných osôb vyžaduje, aby počúvali naraz dva odlišné podnety, pričom jeden sa podáva do pravého ucha a druhý do ľavého ucha. Vo všeobecnosti pri použití verbálnych podnetov podáva väčšina osôb viac správnych odpovedí na podnety prezentované do pravého ucha (Kimura, 1961) a naopak, pri neverbálnych podnetoch podáva väčšina osôb viac správnych odpovedí na podnety prezentované do ľavého ucha (Kimura, 1967). Mechanizmy na pozadí dichotickej stimulácie sú komplexné, dôležitú úlohu hrá hemisférická špecializácia pre podnety príslušného charakteru (Špajdel, 2009). Udalosti v prirodzenom prostredí však zvyčajne nie sú obmedzené na jednu modalitu. Mechanizmy multimodálnej pozornosti tak predstavujú významnú otázku v štúdiu pozornosti, čo je aj jedným z dôvodov, prečo sme náš výskum orientovali týmto smerom. Hlavným testovaným problémom pre nás bola otázka, 167

168 či zameranie zrakovej pozornosti facilituje zameranie sluchovej pozornosti, teda či, a akým spôsobom prebieha integrácia informácií z týchto modalít. Zo súčasného stavu poznania jednoznačne nevyplýva, či zameranie priestorovej pozornosti predstavuje jeden univerzálny systém, alebo sa jedná o paralelne fungujúce, ale nezávislé systémy pre jednotlivé senzorické modality. Za účelom objasnenia tohto problému sme použili rozličné časové a priestorové parametre. Predpokladali sme, že pokiaľ sa jedná o jeden univerzálny systém, zameranie priestorovej pozornosti v jednej modalite bude facilitovať zameranie pozornosti v ďalšej modalite na rovnaké (kongruentné) miesto v priestore/rovnakým smerom, čo sa prejaví zvýšeným výskytom správnych odpovedíz tohto smeru pri teste dichotickej stimulácie. V zmysle opakovane pozorovanej preferencie pravého ucha, sme tiež očakávali vyšší výskyt odpovedí na pravej strane, bez ohľadu na zameranie priestorovej pozornosti. Okrem behaviorálneho testovania sme aplikovali aj elektrookulografické meranie, za účelom kontroly správneho zameraniae vizuálnej pozornosti, ale najmä za účelom sledovania špecifického vplyvu rozličných podmienok na okulomotorickú reakciu. 2 Metódy 2.1 Participanti Štúdie sa zúčastnilo 60 participantov, pregraduálnych študentov vysokej školy vo veku rokov (M = 21,8). Všetci participanti uviedli preferenciu pravej ruky. Do výskumného výberu neboli zaradené osoby, ktoré dosiahli v audiometrickom vyšetrení rozdiel v citlivosti ľavého a pravého ucha na frekvencie 250 Hz, 500 Hz, 1 khz a/alebo 2 khz väčší než 10 db. 2.2 Sluchová a zraková stimulácia Horizontálne, vizuálne navádzané sakády boli vykonávané počas testu dichotického počúvania. Zrakové podnety boli prezentované náhodne na pravej alebo ľavej strane od stredového fixačného bodu. Veľkosť kroku, teda vzdialenosť podnetu od fixačného bodu, bola 10 stupňov pre jednu skupinu (n = 34) a 45 stupňov pre druhú skupinu (n = 26). Páry slabík boli prezentované simultánne do pravého a ľavého ucha (použité boli tieto typy slabík: 'BA', 'DA', 'GA', 'TA', 'PA' a 'KA'). V zmysle princípu metódy dichotickej stimulácie, nikdy neboli prezentované rovnaké slabiky do oboch uší. Tri experimentálne podmienky boli testované v oddelených blokoch. V prvej, asynchrónnej podmienke, nástup sluchových podnetov predchádzal zrakovú stimuláciu o 300 ms. V druhej, synchrónnej podmienke boli sluchové a zrakové podnety prezentované simultánne. V tretej, opäť asynchrónnej podmienke, sluchové podnety nasledovali zrakový podnet s oneskorením 300 ms. Schéma priebehu experimentu je vizualizovaná na obrázku Zber dát Obr. 1: Schéma priebehu experimentu Participanti boli usadení do pohodlného kresla v zvukovo izolovanej miestnosti s kontrolovaným osvetlením. Pred nimi sa vo výške očí a v presne určenej vzdialenosti nachádzala obrazovka, na ktorej boli podnety prezentované. Vzdialenosť hlavy od obrazovky bola nastavená tak, aby amplitúda sakád bola presne 10 (resp. 45) stupňov od stredového fixačného bodu. Participanti boli inštruovaní zamerať svoj pohľad na stredový fixačný bod a presunúť ho čo najrýchlejšie a najpresnejšie na periférne prezentovaný zrakový podnet po jeho zobrazení. Ako bolo opísané vyššie, počas zrakovej úlohy boli participantom zároveň prezentované verbálne zvukové podnety - slabiky a to buď synchrónne alebo asynchrónne so zobrazením vizuálneho podnetu. Úlohou participantov bolo po každej vykonanej sakáde určiť, ktoré slabiky im boli prezentované. Verbálne odpovede participantov boli zaznamenávané. Na odpoveď nebol stanovený časový limit (prezentácia ďalších podnetov teda nasledovala až po zaznamenaní ich odpovede). Očné pohyby boli nahrávané pomocou elektrookulografu (EOG). 2.4 Spracovanie elektrookulografických dát Elektrookulografické dáta boli automaticky prekontrolované (modul ILAB v programe Matlab) z hľadiska správneho smeru sakády. Následne boli manuálne odstránené periódy s nesprávnym smerom sakády, s výskytom žmurknutia, a latenciou nástupu sakády dlhšou ako 450 ms. Faktory ako latencia (nástup) sakády boli pre korektné sakády automaticky vyexportované do tabuľkového editora. 168

169 3 Výsledky 3.1 Výkon pri dichotickej stimulácii Porovnávali sme rozdiely vo výkone pri dichotickom počúvaní počas vynútených sakáddo ľava a do prava. Pre každú experimentálnu podmienku bola vypočítaná ANOVA pre opakované merania s vnútrosubjektovými faktormi Ucho (správne odpovede z pravého vs. ľavého ucha) a Smer sakády (sakáda doprava vs. doľava) a medzisubjektovým faktorom Veľkosť kroku (10 stupňov vs. 45 stupňov). Tab. 1: Signifikantné efekty pri dichotickom počúvaní (ANOVA) Faktor Ucho bol signifikantný vo všetkých experimentálnych podmienkach (Tab. 1). Pozorovali sme preferenciu pravého ucha(participanti správne identifikovali slabiky prezentované do pravého uchačastejšie než slabiky prezentovanédo ľavého ucha). podmienke (F(1,59)=9,535; p=0,003). V prípade sakád s veľkou amplitúdou (45 stupňov), množstvo správnych odpovedí z ľavého ucha sa zvýšilo pri ľavostranných sakádach, a podobne- množstvo správnych odpovedí z pravého ucha sa zvýšilo pri pravostranných sakádach. Tento efekt nebol pozorovaný v prípade sakád s malou amplitúdou 10 stupňov (viď Obr. 2). 3.2 Elektrookulografické dáta Na základe výsledkov dichotického počúvania sme sa rozhodli ďalej analyzovať iba sakády v synchrónnej podmienke a pri veľkej amplitúde sakády (45 stupňov). Taktiež sme analyzovali sakády iba v tých prípadoch, kedy participanti uviedli ako odpoveď práve jednu správnu slabiku (buď z ľavého alebo pravého ucha), čo nám umožnilo presnejšie pozorovať interakciu zamerania sluchovej a zrakovej modality. Zamerali sme sa na analýzu latencie nástupu sakády (= času od prezentácie periférneho zrakového podnetu). Použili sme metódu ANOVA pre opakované merania s vnútrosubjektovými faktormi Ucho (správna odpoveď bola z pravého vs. z ľavého ucha) a Smer sakády (sakáda doprava vs. doľava). Ako signifikantná sa ukázala interakcia faktorov Ucho a Smer sakády (F (1,25)=4,45; p=0,05):v prípadoch, kedy smer sakády bol kongruentný so smerom zamerania sluchovej pozornosti, sme pozorovali neskorší nástup sakády (ľavé ucho/sakáda vľavo M = 255 ms; pravé ucho/sakáda vpravo M = 276 ms), ako v prípadoch, kedy smer sakády a smer zamerania sluchovej pozornosti boli nekongruentné (ľavé ucho/sakáda vpravo M = 237 ms; pravé ucho/sakáda vľavo M = 235 ms). Výsledky sú vizualizované na obrázku 3. Obr. 2: Priemerný výkon pri dichotickom počúvaní pri synchrónnej prezentácii zrakového podnetu Ďalej sme pozorovali signifikantnú interakciu troch faktorov Ucho, Smer a Veľkosť kroku v synchrónnej Obr. 3: Priemerná latencia nástupu sakády v synchrónnej podmienke 169

170 4 Diskusia Výsledok testu dichotickej stimulácie (väčší počet odpovedí z pravého ucha) je odrazom funkčnej špecializácie mozgových hemisfér (Hugdahl, 2000). Ľavá hemisféra býva (čo sa týka spracovania zvukových podnetov) opisovaná ako hemisféra s výrazne vyššou vzorkovacoufrekvenciou, v porovnaní s pravou hemisférou a teda ako facilitujúca diskrimináciu zvukov s vyššou temporálnou zmenou, aká je potrebná napríklad aj pre spracovanie reči (Hickock, 2009) a tým pádom samozrejme aj slabík (napr. Blumen, 1970 in Springer, 1986). Špecificky je pre nás zaujímavá asymetria oblasti planum temporale, asociačnej auditórnej oblasti, alokovanej posteriórne ku Heschlovmu závitu. Táto oblasť, ktorá je z anatomického hľadiska jednou z najviac asymetrických v ľudskom mozgu (napr. Chance et al., 2006) je bežne považovaná za oblasť zodpovednú za (nielen) diskrimináciou slabík, čo bolo potvrdené zobrazovacími štúdiami (Sætrevik a Specht, 2012). V súčasnosti už silná báza poznatkov o hemisférickej špecializácii zvukovej kognície tak pomerne priamočiaro vysvetľuje, prečo sme v každej podmienke pozorovali väčšie množstvo odpovedí z pravého ucha ako z ľavého. Naše zistenia sú totožné s predchádzajúcimi výskumami, kde pri dichotických položkách s nevýznamovými slabikami sa ukazovala preferencia pravého ucha (napr. Hugdahl 2000, Hugdahl a Davidson 2004; Špajdel, Jariabková, Riečanský, 2007; Špajdel, Jariabková, 2008). V súlade s očakávaniami sme pozorovali interakciu zrakovej a sluchovej pozornosti, no na rozdiel od našich predpokladov, tento efekt sme pozorovali iba v synchrónnej podmienke a iba pri veľkej amplitúde sakád. Konkrétne sme pozorovali interakciu presunu zrakovej a sluchovej pozornosti: pokiaľ sakáda smerovala jedným smerom, väčšie množstvo odpovedí z dichotického počúvania bolo pozorovaných v smere ipsilaterálnom ku smeru sakády. Na otázku, prečo sme pozorovali interakciu zamerania zrakovej pozornosti (sakády) a sluchovej pozornosti iba v synchrónnej podmienke, môžeme v súčasnosti odpovedať iba špekulatívne. Je možné, že simultánne sa vyskytujúce podnety z roznakého miesta v priestore a viacerých modalít jedincovia priori indikujú, že sa jedná o prejavy jedného javu (toto tvrdenie vychádza z predpokladu, že kvantita podnetov je jedným z určujúcich znakov zamerania pozornosti). Na druhej strane, pokiaľ sa tieto podnety vyskytujú asynchrónne, agent nemá ako rozlíšiť, či sa jedná alebo nejedná o prejav jedného javu, pokiaľ neprebehol proces učenia, ktorý by mu umožnil považovať tieto dva javy za kauzálne spojené (ako napríklad klasické podmieňovanie). V našom experimente ku podmieňovaniu dôjsť nemohlo, nakoľko zraková pozornosť bola presúvaná náhodne na pravú alebo ľavú stranu. Je tiež možné, že pri 300 ms asynchrónii zrakových a sluchových podnetov ide už otak veľký rozdiel, že spracovanie podnetovstihne prebehnúť postupne - najskôr v jednej modalite a potom u druhej (Kawai, 2008). Prekvapivé výsledky sme pozorovali pri interakcii oneskorenia nástupu sakády s jednostranným zameraním sluchovej pozornosti (teda s prípadmi, kedy participanti správne uviedli práve jednu z dvoch prezentovaných slabík). Na základe vyššie prezentovaných výsledkov sme tieto dáta analyzovali iba v synchrónnej podmienke a pri veľkej amplitúde (45 stupňov). Pozorovali sme, že v prípadoch, kedy sú zraková aj sluchová pozornosť zamerané rovnakým smerom, dochádza k oneskorenému nástupu sakády oproti prípadom, kedy je smerovanie zrakovej a sluchovej pozornosti orientované smerom navzájom kontralaterálnym. Pozorovaný jav má teda znaky interferencie. Aby sme túto interferenciu aspoň čiastočne vysvetlili, musíme zohľadniť okrem hemisférickej špecializácie aj primárnu hemisférickú aktiváciu, teda aktiváciu v hemisfére, ktorá na základe lateralizovanej prezentácie podnetu dostáva informáciu z prostredia ako prvá, bez ohľadu na funkčnú špecializáciu. Pri zvukových stimuloch je táto primárna hemisférická aktivácia zjavná - informácia z pravého ucha aktivovala primárne ľavú hemisféru a vice versa (pre ľavé ucho ide primárne o pravú hemisféru). Tento jav je štandardný a popisovali sme ho už vyššie pri vysvetľovaní nameranej preferencie pravého ucha. Funkčne totožný jav môžeme pozorovať aj pri zrakovej stimulácii primárna zraková kôra v konkrétnej hemisfére je primárne inervovaná signálom z ipsilaterálnej polovice sietnic oboch očí (teda napríklad pravá strana sietnice primárne aktivuje primárnu zrakovú kôru v pravej hemisfére) a teda vo vzťahu ku zrakovým podnetom je primárna hemisférická aktivácia kontralaterálna (ľavá polovica zorného poľa sa projikuje na pravú polovicu sietnice oboch očí). Predpokladáme, že efekt kontralaterálneho vzťahu zrakových vstupov a primárnej hemisférickej aktivácie sme v našom experimente pozorovali, a to v podmienke s veľkou amplitúdou posunu zrakového podnetu. Na základe týchto predpokladov môžeme zmysluplne vysvetliť pozorovanú interferenciu. Porovnaním výsledkov z dichotickej stimulácie v synchrónnej podmienke a pri veľkom uhle (obr. 2) a latencie sakád v tej istej podmienke (obr. 3) môžeme tvrdiť, že pokiaľ sme pozorovali totožnú primárnu hemisférickú aktiváciu pri oboch typoch vstupov, dochádzalo k interferencii. Z hľadiska pozornosti a rýchlosti reakcie to znamená, že pokiaľ zrakový podnet facilitoval spracovanie zvukového stimulu na totožnej strane, pozorovali sme oneskorenie sakády. V rámci tejto interferencie, sme pozorovali ďalší kontraintuitívny rozdiel medzi hemisférami - pokiaľ bola pozornosť zameraná na oba pravostranné podnety, oneskorenie nástupu sakády bolo väčšie ako v opačnom prípade. Predpokladáme, že v prípadoch, keď bola pozornosť 170

171 zameraná na ľavostranné podnety a teda príslušné oblasti boli primárne aktivované v pravej hemisfére, auditórna kôra v ľavom posteriórnom superiórnom temporálnom laloku, ktorá je funkčne špecializovaná na zvukové podnety prezentovaného druhu (napríklad spomínané planum temporale), dokázala z časti kompenzovať efekt interferencie. Toto tvrdenie zakladáme nielen na báze funkčnej špecializácie týchto oblastí mozgu, ale aj na fakte, že reakčný čas pri podnetoch prezentovaných do pravého ucha je kratší, ako pri prezentácii do ľavého ucha (Špajdel, 2009). Interferenciu sme nepozorovali v prípadoch, kedy boli primárne aktivované kontralaterálne hemisféry. O tom, aká je presná fyziologická podstata tejto interferencie, môžeme iba hypotetizovať. Na základe získaných dát je možné tvrdiť, že pokiaľ podnety vyvolajú ipsilaterálnu primárnu hemisférickú aktiváciu, dochádza ku kompromisnej alokácii kognitívnych zdrojov. Možnú príčinu pozorovaného javu oneskorenia sakády pri bimodálnej interferencii pozornosti, teda prednostného spracovania sluchového podnetu pred zrakovým, môžeme hľadať aj na subkortikálnej úrovni. Colliculus superioris je známa párová súčasť auditórnej dráhy, ktorá je však aktivovaná aj pri zrakovej stimulácii. Prenos zvukového signálu zo sluchových receptorov do colliculi superiorestrvá približne 13 ms, zatiaľ čo zo zrakových receptorov tento prenos trvá až približne 80 ms (Stein a Meredith, 1993) a teda zvukový signál môže byť na tejto báze preferovaný. Alternatívne tiež môžeme uvažovať o funkčnej príčine tejto alokácie pozornostných zdrojov. Keďže zrakový podnet sa v čase nástupu jeho prezentácie nachádza na mimo žltej škvrny (fovea) - oblasti sietnice s najvyšším množstvom receptorov a teda najvyšším priestorovým rozlíšením, agent môže uprednostniť zvukovú informáciu, ktorá je v situáciách ako je náš experiment prezentovaná bez prítomnosti nejednoznačnosti priestorového rozlíšenia. Dôležitým pozorovaním nášho výskumu je, že pokiaľ sú sluchové a zrakové, simultánne prezentované podnety primárne spracovávané v tej istej mozgovej hemisfére, dochádza ku ich interakcii a teda facilitácii zamerania sluchovej pozornosti vplyvom zrakového podnetu. Ako už môže byť čitateľovi zrejmé z vyššieho uvedeného, dôvodom, prečo sme spomínané efekty pozorovali pri presune zrakovej pozornosti s veľkou amplitúdou, ale nie pri sakádach s malou amplitúdou, je ten, že pri malej amplitúde zrejme nedochádzalo ku primárnej hemisférickej aktivácii. Vizuálny podnet nebol v tomto prípade od stredového fixačného bodu dislokovaný dostatočne na to, aby selektívne aktivoval receptory iba na jednej polovici sietnice. 5 Záver Hlavným zistením našej práce je, že aj keď zameranie priestorovej zrakovej pozornosti dokáže facilitovať zameranie sluchovej pozornosti, tento jav je sprevádzaný oneskorením okulomotorickej reakcie. Na základne našich dát sa tiež zdá, že tieto javy nastávajú v prípade, keď oba druhy stimulov primárne aktivujú tú istú a iba tú istú hemisféru. Tento jav sme vysvetlili s ohľadom na funkčnú hemisférickú asymetriu, predovšetkým s ohľadom na oblasť planum temporale a colliculi superiores. Z behaviorálneho hľadiska sa zdá, že táto interferencia má pre jedinca ekologicky pozitívne dôsledky. Podľa našich vedomostí, toto je prvá štúdia, ktorá skúmala a odhalila vzťah medzi zameraním priestorovej pozornosti v zrakovej a sluchovej modalite. Vymedzenie presných príčin bude predmetom budúcich štúdií. Poďakovanie Štúdia vznikla v rámci riešenia projektu VEGA 1/0083/15, 2/0080/13, 2/0093/14. Literatúra Kawai, N. (2008). Crossmodal spatial attention shift produced by centrally presented gaze cues. Japanese Psychological Research 50(2): 100. Kimura, D. (1961). Cerebral dominance and the perception of verbal stimuli. Canadian Journal of Psychology, 15(3): Kimura, D. (1967). Functional asymmetry of the brain in dichotic listening. Cortex, 3(2): Posner, M. I. a DiGirolamo, G. J. (2000). Attention in cognitive neuroscience: an overview, In: The New Cognitive Neurosciences (Ed: M.S. Gazzaniga), MIT Press, str Hugdal, K. (2000). Lateralization of cognitive processes in the brain. Acta psychologica 105(2-3): Hugdahl, K. a Davidson, R. J. (2004). The asymmetrical brain. London, The MIT Press. Stein, B. E. & Meredith, M. A.(1993). The Merging of the Senses. MIT Press, Cambridge, MA. Chance, S. A., Casanova, M. F., Switala, A. E. a Crow, T. J. (2006). Miniclumnar structure in Heschl's gyrus and planum temporale: asymmetries in relation to sex and callosal fiber number. Neuroscience 143(4): Hickock, G. (2009). The functional neuroanatomy of language. Physic of Life Reviews 6(3):

172 Sætrevik, B. a Specht, K. (2012). Cognitive conflict in a syllable identification task causes transient activation of speech perception area. Brain and Cognition 78(3): Moore, T., Armstrong, K. M. a Fallah, M. (2003). Visuomotor origins of covert spatialattention. Neuron, 40(4): Mangun, G. R. a Hillyard, S. A. (1995). Mechanisms and models of selective attention. In M. D. Rugg and M. G. H. Coles (Eds.), Electrophysiology of Mind: Event-related Potentials and Cognition. Oxford University Press, str Springer, S. P. (1986). Dichotic listening. In H. J. Hannay (Ed.), Experimental techniques in human neuropsychology. New York: Oxford University Press, str Špajdel, M. (2009). Dichotická stimulácia v kontexte neuropsychologického výskumu. Trnava: Filozofická fakulta Trnavskej Univerzity v Trnave. Špajdel, M. a Jariabková, K. (2008). Metodika dichotickej stimulácie: neverbálne a verbálne úlohy. Československá psychologie, 52(2): Špajdel, M., Jariabková, K. a Riečanský, I. (2007). The influence of musical experience on lateralization of auditory processing. Laterality: Asymmetries of Body, Brain and Cognition, 12 (6):

173 Kognícia a umelý život 2015, Trenčianske Teplice Umění umělého života jako cesta k parafrázi umění Aleš Svoboda Univerzita Karlova v Praze, Fakulta humanitních studií U Kříže 8, Praha 5 Jinonice [email protected] Abstrakt Příspěvek se pokusí formulovat jednu z možností, jak využít modelování umělého života v umělecké tvorbě. Jeho dynamika a autonomie, která se může opírat o rekurzi, může při stálém stupňování překračovat původní rámec přehledného kontextu, který se s nárůstem komplexity rozvíjí do mnohoúrovňové složitosti. Návrh se nechává inspirovat bergsonovským přístupem k důsledkům rozdílné složitosti života rostlinného a živočišného pro potřeby reflexe prostředí. Právě rozvinutí strukturované reflexe u dynamického objektu je oproti statickému instinktivnímu chování zásadně novou kvalitou, která pravděpodobně zakládá naše, lidské pojetí vědomí. Podobně Gregory Bateson rozvíjel paralelu důsledků přirozeného výběru při růstu složitosti organismů a rozvoje vědomí. Jeho šest kritérií mentální činnosti (seskupení kooperujících částí, spouštění rozdílem, zajištění průvodní energie, kruhové nebo ještě složitější kauzální řetězce, transformace rozdílů, existence hierarchie logických typů) vede k případné představě emergentních vzorů, které mohou představovat rozpoznatelné vizuální kvality, jejichž existence bude nicméně posilována adekvátním postupem učení. 1 Výtvarné umění projekty autonomie vědomí...ano, umění malíře, toť odívati plastickými formami příběhy rozvíjející se v duši lidské, býti básníkemtvůrcem, obohacovati život novými tvářnostmi. A právě úsilí podniknutá v tomto smyslu postavila umění v opačnou stranu vědy, tím, že se příliš vyvíjela na půdě nekontrolovaných adopcí. (Siblík, 1928: 33) Takto se v první české monografii věnované mimořádné osobnosti moderního umění Františku Kupkovi zamýšlel nad smyslem výtvarného umění a zároveň se letmo dotkl i vztahu umění a vědy její autor, Emanuel Siblík. Sleduje tak, ať už bezděčně či záměrně, Kupkovo přesvědčení uložené do textového úvodu k souboru dřevorytů Quatre histoires de blanc et noir (Čtyři příběhy bílé a černé), který vyšel o dva roky dříve. Nebude jistě příliš smělé dedukovat, že poněkud frustrován neúspěchem s vydáním své knihy Tvoření v umění výtvarném v původní francouzské verzi připravené k vydání již v roce 1920, a malým ohlasem jejího českého překladu, pořízeného Věrou Urbánkovou a vydaného nakladatelstvím SVU Mánes v roce 1923, kondenzoval František Kupka své vrcholné tvůrčí krédo do jediné, typograficky pojednané stránky obsahující text rozsahu necelé rukopisné strany. Pojem příběh je tu použit ve vysoce metaforickém smyslu, což osvětluje již první věta: Viditelně se tyto příběhy nedějí mezi lidskými figurami, uprostřed stromů a pod nebem, mezi takovými, jaké jsme zvyklí vidět namalované a vyryté. (Kupka, 1926) A hned v následující větě osvětluje: Jsou to figury jiné skutečnosti, nahrazující tradiční opis tvarů přírody nebo jejich výklady Kupkovi jako zakladateli abstraktního či nezobrazivého umění je tehdy už zcela jasné, že potenciál výtvarné struktury přesahuje tradiční snahy po napodobení nebo vyvolání účinku navozením jisté distance od očekávaného znakového působení. Jeho argumentace ústí do stručného výroku: Umělecké dílo, jsa samo o sobě abstraktní skutečností, žádá výstavbu z vynalezených prvků. Autonomie výtvarného uměleckého díla je nepochybná. A kde potom hledat jeho smysl? Jediná závěrečná věta kóduje vztah vědomí a tvorby: Jeho konkrétní význam vyplývá ze samotného spojení morfologických typů a architektonických situací, patřících jeho vlastnímu organismu. Kupka používá dvě kategorie: morfologický typ a architektonická situace. Tedy tvar fungující jako odkaz k určité třídě a podobně typový princip vazby. Takové zcela obecné pojetí tvorby (a samozřejmě i vnímání) zapadá do kategorií kombinace a selekce, které pro jazykové schopnosti příznačně osvětlil v rámci dvou typů afatických poruch Roman Jakobson (Jakobson 1995). Myšlení je záležitostí vyhledávání podobností a jejich opětovného opouštění, ustavování spojení a jejich nového rozkládání pro nová spojení, ať už jde o kontext neurofyziologie, informace či o vytváření teorií a učení. Nepochybně v úvodu formulovaná hypotéza o obohacování života novými tvářnostmi, která vlastně nabyla v průběhu moderního a současného umění na zásadním významu, je tohoto rodu. Neustálá připravenost vědomí pro nové jevy a pojetí, trénovaná prostřednictvím vnímání překvapivých, nicméně v předpokládaném smyslu konzistentních vzhledů, je jedním z možných poslání umění. 173

174 Bifurkace na vědu a umění získává v Siblíkově hodnocení na straně umění poněkud negativní zabarvení nekontrolované adopce umění se totiž může osvobodit z jakékoliv závaznosti. Ovšem i František Kupka ve své výše zmiňované knize věří ve spjatost orgánu a jeho funkce, morfologii orgánu podmiňuje fungování a výtvarník musí směřovat právě ke správnému pochopení tvarů ve vazbě na jejich funkce. 1 Umělecká díla lze chápat jako projekty, vizuální hypotézy, jejichž konzistenci a užitečnost odhalí teprve postupné strukturní rozvíjení. 2 Dosavadní umělecké simulace života Na jiných místech (Svoboda, 2010 a Svoboda, 2014) jsem se pokusil připomenout různé dosavadní umělecké projekty sledující vytváření alternativ k přirozenému životu umělými prostředky. Blais a Ippolito (Blais, 2006) v kapitole Udržování umělého života své knihy rekapitulují metody biologické, mechanické a virtuální počítačové. Pomineme-li řadu wetwarových realizací, které se zabývají kultivováním různých tkání pro výlučně umělecké účely (například seskupení SimbioticA, Eduardo Kac, Natalie Jeremijenko, Stelarc a Joe Davis), uskutečnilo se v posledním čtvrtstoletí mnoho vizuálně působivých simulací prostředky softwarovými, které mnohdy mohou působit v hraniční oblasti umění a vědy. Většinou se tyto postupy soustřeďují na využití určitým způsobem programovaného růstu (Yoichiro Kawaguchi, Ed Burton ze Sodaplay), umělého výběru (William Latham a Mutator, Karl Sims v instalaci Galápagy, Christa Sommerer a Laurent Mignonneau v instalaci A-Volve), rozvíjení quasi virových bujení v obrazech (Joseph Nechvatal) nebo přímo šlechtění obrazů při definování jistých estetických strategií (Philip Galanter postihuje specifické umělecká formování jako geny, které se ve výsledném obraze kříží, Penousal Machado provádí křížení obrazů estetickým výběrem). Velmi rozšířený a používaný model života, Hra život, se stal také významnou inspirací i pro výtvarné umělce. Příkladně a důsledně byl zpracován v díle Paula Browna. Princip hry a její možné adaptace pracuje původně se dvěma stavy (živá nebo mrtvá buňka), které se vyskytují v ploše, přičemž z jejich vzájemného působení se vyvozují v následných časových intervalech nové stavy (zánik, vznik, nebo trvání). Protože dochází k vizuálnímu shlukování buněk, lze usuzovat na určité emergentní vlastnosti, které mohou vyvolávat buď dojem periodického chování, a tím setrvalosti, nebo narůstání či vymizení. Z perspektivy umění je příklon k procesuálnosti od poloviny 20. století postupně stále výraznější, což lze odvodit jednak z obecného zájmu o vlastní mechanismy kreativity, jednak z potřeby objevit postup pro kritiku výsledných estetických alternativ a pravděpodobně nejvíce z celkového pocitu rostoucího významu životní dynamiky. Přijetí růstových, nebo dokonce evolučních modelů v umění je možným rozvíjením pojetí díla jako procesu, tedy struktury rozvíjející se v čase i tvorby jako postupu stále složitějšího rozhodování. Ustavuje se tak ovšem protiklad mezi kompozicí, tedy orientací na konkrétní, dílčí a koncentrovaný smyslový zážitek, a strukturou jako autonomní organizací, která pouze odkazuje k možnostem působení a hypotetickému stavu. 2 3 Kritika dosahu simulace založené na Hře života Vyhodnocování životnosti atomárních buněk podle stavu jejich bezprostředního, nebo i vzdálenějšího okolí vidím jako poněkud jednostranný přístup k možnosti využití životních procesů. Pokusil jsem se především ve svém minulém příspěvku pro tento seminář (Svoboda, 2014) naznačit poněkud kritičtější stanovisko k výtvarným důsledkům třeba právě v díle Paula Browna. Budované superstruktury sice vyplývají z okamžitých strukturních poměrů buněk, ale obtížně z nich lze dedukovat dlouhodobější tendence proměn. Také jejich zacyklení vlastně reprezentuje pouze nejúspěšnější dosažení periodického chování, které nahrazuje ztráty stejným počtem nových buněk (jedinců). Zároveň se tak, podle mého názoru, záhy uzavírá možnost dalších strukturovaných úrovní. Vznik několika buněčného organismu by měl disponovat vlastnostmi, které by mohly reprezentovat další úrovně jejich koexistence a tedy existence na úrovni odpovídající biosféry. Takový model by musel být nejen vybaven růstovými vlastnostmi, ale i různými funkčními typovými schopnostmi svého zachování a případného zdokonalování. Možnost vzájemné reakce na úrovni buněk by měla být rozvinuta ve vyšším cyklu organismů. Vznik a udržení organismů by mělo mít rekurzivní povahu, která prostřednictvím jednoduššího definování reakcí může přivodit mnohem komplexnější chování vyšších celků. 1 Snad se nedopustíme nepřijatelného odhadu, pokud připustíme, že filozoficky a přírodovědně založený Kupka usazený v Paříži se alespoň zběžně seznámil s knihou Henri Bergsona Vývoj tvořivý, která vyšla v roce 1907 a rozhodně patřila k vyhledávaným titulům propojujícím problematiku poznání i bytí. 2 Autoři Blais a Ippolito příhodně připomínají, že z pohledu výtvarného umění v daných souvislostech dochází k oslabení významu tradičních forem prezentace uměleckých děl. Pokud je třeba odhalovat fungování procesu, je nutné nahrazovat umělecký zájem o konečná díla zájmem o prostředky, nahrazovat artefakt programem a možnostmi inscenování dějů. 174

175 4 Nároky na model organické koincidence Svým způsobem také poněkud formální, nicméně podobně inspirativní jako Hra života může být opozice rostlinného a živočišného života v bergsonovském pojetí. Henri Berson v knize Vývoj tvořivý (1919, první vydání 1907) věnuje jednu kapitolu hermeneuticky budované hypotéze o tříštění životní intence, elánu, do různých životních praktik, které se vydávají ve směru svých existenčních limitů. Rostlinný a živočišný život, přestože pochází ze společného východiska a první živé organismy mezi oběma říšemi kolísají, obsahují charakteristické tendence, které se postupně upevňují a přestože jsou divergentní, nadále spolu koexistují. Obě tendence se snaží překonat omezenost statického anorganického trvání dynamickým přizpůsobováním. Zpracování energie je tu základním předpokladem (viz dále Bateson), přičemž v rostlinném případě jde o procesy vázání dusíku a uhlíku přímo ze vzduchu, vody a země, v nerostném tvaru, v živočišném případě jde o vyšší stupeň, který musí mít za předpoklad zpracování již předešlých organických struktur. Lze předpokládat, že modelování právě takové elementární opozice odpozorované ze zkušenosti s organismy by mohlo založit vzrůstající a strukturovanou vazbu. Ta je na úrovni vložení šému do dosud netečné hmoty. Rezonance energie a její usměrňování může vést k pojetí struktury jako souvislosti narůstání a diferencování. Druhou okolností, kterou Bergson řeší, je přítomnost zárodečných forem vědomí. Odlišuje (opět v tendenci, nikoliv v absolutních kategoriích) instinkt a intelekt, z nichž první se váže spíše na chování rostlin a druhý na strategie živočichů: dokonalý instinkt jest schopnost zužitkovati a i konstruovati nástroje ústrojné; dokonalý intelekt jest schopnost vyráběti a užívati nástrojů neústrojných. (Bergson 1919: ) Znovu je třeba zdůraznit, že uplatnění instinktu i intelektu prosazuje Bergson jako související póly, které spolu zůstávají v rámci života v trvalé vazbě. Instinkt a intelekt představují tedy dvě odchylná, avšak stejně elegantní řešení jediné a téže úlohy. (Bergson 1919: 198) homogenní, vyrovnané struktury na úrovni jednotlivých buněk. Jde vlastně o vizuální metaforu existence uniformního, jednotného fyzikálního rámce, který takto reprezentuje základní atomární, ještě minimálně diferenciovanou úroveň, u které by vlastně ani nešlo předpokládat možnost složitějších, diferenciovanějších reakcí vůči prostředí. V případě rastru tvořeného samostatnými trojúhelníky dochází nicméně i na této elementární úrovni k prvotnímu protikladu levo-pravé a pravo-levé orientace, což zakládá ve svém důsledku diferenciaci vyšších stavebních jednotek elementů. Komplexnější tvar, složený ze sedmi elementárních prvků-buněk vytváří dva tvarově totožné symetricky zrcadlově převrácené prvky, které se v základní síti uplatňují ve dvou orientacích v otočení 60. Obr. 1: Typy a orientace základních elementů Typy vazeb je možné vizuálně rozlišit podle tří způsobů přisednutí jednotlivých trojúhelníku na vazby A, B a C. Zjevným důsledkem takto zvoleného prvku je vizuálně rozdílné působení tvarů odvozovaných s použitím různých vazeb, respektive z různého jejich množství. 5 Návrh funkčního, vizuálně názorného modelu Zhodnocení dosud formulovaných požadavků mě přivedlo k úvaze adaptovat vlastní růstový model z let 1979 až 1985, který právě obsahoval studium plošného růstu jako větvení různého stupně a různého morfologického typu, který ve svém výsledku tvoří struktury různé hustoty a rozprostranění. Rámcem veškerého růstu byl rastr buněk tvaru rovnostranného trojúhelníku. Je tak dosaženo Obr. 2: Tři druhy vazeb A, B a C. Plán větvení je opět zvolený jako rovnoměrné stereotypní navazování každého prvku se třemi sousedními. Proti tomuto maximálnímu naplnění vazeb je možné uplatnit různou míru ústupků, spočívající 175

176 v realizaci pouze dvou, jedné nebo žádné vazby. Ve smyslu postupného naplňování vazeb představuje přirůstání dvou větví uskutečnění všech tří vazeb, přirůstání jedné buď realizaci dvou vazeb, nebo při napojení konečného prvku realizaci pouze jedné vazby. rostlinný, kdy se jedná o identifikaci nejbližšího prostředí pro růst, účelné vyplňování volného místa, a (b) živočišný, kdy jde o strategii přehledu o celé ploše, schopnost vyhodnocení největší koncentrace, vyvození směru pohybu (překrytí s rostlinným organismem udržuje životnost). Oba organismy jsou nicméně vybaveny v zásadě stejnými růstovými možnostmi, které se ve vnitřní struktuře budou různě vyplácet (může dojít k zániku pohyblivých organismů, pokud budou nemotorné, případně k zániku statických organismů, pokud se překryjí apod.) Obr. 3: Schéma napojování prvků Takto navržený růst může vytvářet v kombinaci míry naplňování vazeb (3, 2, 1) a použitého typu vazby ( A, B nebo C ) struktury buď velmi rozprostraněné nebo naopak kompaktní. Růst byl původně spouštěn vždy z jediného bodu uprostřed obrazové plochy, což v zamýšlených souvislostech s ohledem na přiblížení se k reálnému prostoru musí být nahrazeno volným pohybem po celé ploše. Další vlastností při rozvíjení a zachování organismů by měla být jejich dočasnost, která může být omezena věkem, vhodností vývojové strategie vůči prostředí a dosažením limitu růstu. Zde se nabízí možnost využití různých strategií: (a) poziční obsazování plochy a (b) putování po ploše s určitým odměněným chováním. Výhodou může tedy být co největší rozprostranění ve stejném počtu kroků, což může odpovídat rostlinné strategii získávání živin z prostředí při relativně statické pozici. Naopak nárůstová energie jiných forem může vyplývat z průniku nebo dotyku s organismem statickým. V prvním případě se může jednat pouze o intuitivní, reflexivní řešení situací růstu tj. větvení lze umisťovat pouze do sousedního prázdného prostoru, přičemž nemožnost přirůstání může být interpretována jako větší pravděpodobnost zániku. Naopak druhý případ musí počítat se schopností reflexe prostředí, jeho vnímání s možností vyhodnocení lepšího směru, a tudíž i stále obnovované paměťové mapy prostředí. Model života musí obsahovat alespoň na této elementární úrovni vědomí, jako schopnost získání informací o prostředí a jejich uchování v podobě postupně se proměňujících stavů. Moje hypotéza tu předpokládá vzájemnou interakci dvou modelů života s různou strategií využívání prostředí: (a) rostlinný = projevuje tendenci k rozprostranění, které ale zůstává na místě a (b) živočišný = s tendencí ke kompaktnosti, která těží z možnosti přesouvání se. Důsledkem by pak měly být i dva druhy vnímání a paměti : (a) Obr. 4: Obrazová hypotéza koexistence A Obr. 5: Obrazová hypotéza koexistence B 6 Předpoklad extrapolovaných vlastností jako dynamických podob/vzorů Batesonova kniha Mysl & příroda, nezbytná jednota (Bateson 2006) je prodchnuta vědomím bytostné 176

177 souvislosti vývoje života a vědomí. Obecné stanovisko, že...jak evoluce, tak učení se musí řídit formálně stejnými pravidly čili tzv. zákony, má v Batesonově podání mnoho příkladů, odůvodnění i důsledků. Mocnost poznání musí sledovat výsledky evolučního růstu a organický svět by měl mít určité propojující podoby, které lze postupně osvětlovat pomocí rozdílů a odlišností. Batesonem právě zmiňovaná citlivost k podobám by mohla být doménou estetických, respektive výtvarných oblastí. A právě v tomto kontextu lze případně docenit kinetický obrat výtvarného umění z poloviny minulého století, který tak neobyčejným způsobem podpořila integrace počítačové technologie v umění. Podoby jsme v tradici euklidovské geometrie a dvoustavové logiky zatím v svém chápání uzavíraly především do statičnosti, avšak stále naléhavější, jasnější a operativnější je překonání zdánlivé statičnosti podob. Ve skutečnosti bychom podoby měli chápat především jako tanec interagujících částí, teprve druhotně omezený fyzickými možnostmi a charakterovými požadavky organismu. (Bateson 2006: 23) Jak ale pojmout relativní trvanlivost podob, která je stále otevřená proměnám? Postižení těchto tendencí musí spočívat více ve vazbě struktury a prostředí, pravidel střetávání jevu a kontextu: Podoby zvířat a rostlin jsou vlastně přeměněné informace. [...] Struktura vstupu se musí nějak odrážet ve struktuře výstupu. Anatomie musí obsahovat něco analogického gramatice, protože veškerá anatomie je přeměnou informačního materiálu v kontextuální tvary. A konečně, kontextové tvarování je jen jiný název pro gramatiku. (Bateson 2006: 27) Pokud se bohatá diferencovanost obecně završuje v jednotě, není myšlenka estetičnosti této jednoty nepřijatelná. Na příkladu jevu moaré lze porozumět sčítání podob, které může vytvořit podobu zcela novou, která zahrnuje podoby předchozí. Toto stupňování ponechává smysl předchozím částem, ale tvoří nové, v porovnání vyšší struktury. V součinnosti s pamětí a tedy uchováváním dosažených pravidelností je možné tyto vzory okamžitě znovu vyvolávat. Tím může být ustavena povaha estetické zkušenosti. Ve svém návrhu sestavit soupis kritérií pro existenci mysli jich Bateson definuje šest, přičemž předpokládá jejich součinnost. Jde o (1) vzájemnou působnost částí, (2) spouštění rozdílem, (3) existence průvodní energie, (4) kruhové nebo složitější kauzální řetězce, (5) přeměnu rozdílů v transformace, kódované verze předcházejících událostí a (6) klasifikaci procesů transformace, která vede k hierarchii logických typů. Spouštění rozdílem jednoznačně zdůrazňuje obecné odpoutání se od substanciálních povah a jejich náhradu na všech úrovních porovnáváním. Ať už samotné vnímání nebo i komplexní uvažování založilo svou účinnost na procesech diference místo na absolutních hodnotách. Úspěch přizpůsobování organismů je zajišťován jejich stále důkladnější možností kódování a opětovného opravování všech přivoděných důsledků. Zpětná vazba je zárodkem nových a nových rekurzivních obrátek, a těm lze porozumět zavedením zobecňujících logických typů, které mají bohužel někdy tendenci zamlžovat vzdalování svých rovin. Zapracování rekurze do modelu života se musí stát vysoce účinným prostředkem, který právě využitím jednodušší verze sebe sama (Hofstadter 2012: 147) dokáže vyvolat rychlý rozvoj stále komplexnějších podob, které by ovšem neměly znamenat smazání podob předchozích. V programu vytvořeném s tímto ohledem slábne sice možnost predikovatelnosti, ale zůstává zachován jistý vývojový směr jako obecná tendence. Poděkování Tento příspěvek vznikl za podpory Programu rozvoje vědních oblastí na Univerzitě Karlově v rámci dílčího programu P18 Fenomenologie a sémiotika pod číslem projektu P18/2015/57. Literatura Bateson, G. (2006). Mysl & příroda, nezbytná jednota. Praha: Malvern Bergson, H. (1919). Vývoj tvořivý. Praha: Laichter Blais, J. a Ippolito, J. (2006). At the Edge of Art. London: Thames & Hudson Hofstadter, D. R. (2012). Gödel, Escher, Bach, Praha: Argo/Dokořán Jakobson, R. (1995) Poetická funkce. Jinočany: Nakladatelství H & H, s Kupka, F. (1923). Tvoření v umění výtvarném. Praha: SVU Mánes Kupka, F. (1926). Quatre histoires de blanc et noir. Paris: G. Kádár Siblík, E. (ed.) (1928). František Kupka, Musaion VIII. Praha: Aventinum Svoboda, A. (2010). Umělý život jako nová úroveň umělecké tvorby. Ve sborníku Kognice a umělý život X, s Svoboda, A. (2014). Umělý život a umělé (s)tvoření = věda nebo umění? Ve sborníku Kognitivní věda a umělý život II, s

178 Kognícia a umelý život 2015, Trenčianske Teplice Reprezentácia epizód v pracovnej pamäti, problém viazania a vytváranie očakávaní Martin Takáč Centrum pre kognitívnu vedu KAI FMFI UK Mlynská dolina, Bratislava [email protected] Alistair Knott Department of Computer Science, University of Otago PO Box 56, Dunedin 9054, New Zealand [email protected] Abstrakt V článku predstavíme vylepšenú verziu konekcionistického modelu pracovnej pamäti pre epizódy (Takáč a Knott, 2013). Epizódy, ako aj individuálne objekty v nich participujúce, sú reprezentované ako plány vykonateľných senzomotorických a pozornostných operácií. V modeli riešime tzv. problém viazania (angl. binding problem) priradenie objektov k jednotlivým tématickým rolám epizódy (agens, paciens) originálnym spôsobom: plán prehratia epizódy obsahuje oddelené pozične kódované reprezentácie agensa a paciensa, ktoré postupne aktivujú reprezentácie zúčastnených objektov v inom médiu. Tým sú agens aj paciens reprezentované v tom istom médiu, ale v rôznych časoch. Takýto prístup umožňuje lepšiu schopnosť zovšeobecňovania, ako aj možnosť reprezentovať top-down očakávania o tom, aké epizódy sa môžu vyskytnúť, resp. akú akciu by bolo vhodné v danej situácii vykonať, či očakávané umiestnenia a vlastnosti zúčastnených objektov. 1 Úvod V tomto článku predstavíme konekcionistický model toho, ako mozog kóduje významy viet. Zameriame sa na reprezentáciu významov v pracovnej pamäti (angl. working memory, ďalej WM). Tieto reprezentácie hrajú úlohu pri spracovaní viet: počas generovania/produkcie, ale aj porozumenia/interpretácie viet, sa význam vety udržuje resp. konštruuje v sémantickej WM (Fiebach a spol., 2007). Toto médium sa tiež využíva v mimojazykových úlohách, napr. na reprezentáciu plánovaných akcií (Zwaan a Taylor, 2006) a na dočasné uloženie vnímaných epizód pred prehrávaním do dlhodobej pamäte (Baddeley, 2000). V našom článku sa zameriame na epizódy obsahujúce akcie/udalosti, nie statické fakty. Vo formálnej logike sa propozície štandardne reprezentujú ako predikáty s argumentmi, napr. epizóda Mačka naháňa myš je reprezentovaná predikátom naháňa s dvoma argumentmi, ktoré majú odlišné sémantické roly, konkrétne mačka je v role agensa pôvodcu činnosti a myš v role paciensa zasahovanej entity (Páleš, 1994). Implementácia tohto viazania resp. priradenia argumentov k rolám v konekcionistických modeloch je problematická ak by sme jednoducho naraz aktivovali reprezentácie mačky, myši a naháňania, nebolo by jasné, kto koho naháňa. Mechanizmus viazania musí umožňovať: a) simultánne priradenie argumentov k viacerým rolám, b) hierarchické reprezentácie, pretože argumenty viazané k rolám môžu mat vlastnú vnútornú štruktúru vlastné role a ich argumenty (Jackendoff, 2002). Medzi najznámejšie modely viazania, ktoré spĺňajú tieto podmienky, patria van der Velde a de Kamps (2006); Stewart a Eliasmith (2012); Mayberry a Miikkulainen (2008). V tomto článku predstavíme model WM s novým riešením viazania založeným na myšlienke, že sémantické reprezentácie majú sekvenčnú štruktúru. Výsledný model WM má zaujímavé dôsledky pre pochopenie jazykových aj mimojazykových procesov: v jazyku ho možno využiť na reprezentáciu významov generovaných alebo interpretovaných viet, a z mimojazykových procesov modeluje generovanie očakávaní o nadchádzajúcich epizódach tým, že aktivita v rôznych častiach siete reprezentuje rozdelenia pravdepodobnosti epizód a ich participantov, ktoré sa s prichádzajúcimi novými informáciami priebežne aktualizujú. V ďalšom texte najprv predstavíme a zdôvodníme myšlienku sekvenčnej štruktúry sémantických reprezentácií, potom opíšeme novú schému viazania argumentov k rolám. Ďalej predstavíme samotný model a výsledky experimentov s ním. 2 Sekvenčná štruktúra sémantických reprezentácií Náš model je postavený na základnom predpoklade, že komplexné sémantické reprezentácie nie sú statickými konfiguráciami neurálnej aktivity, ale sekvenciami jednoduchších reprezentácií. Túto myšlienku podrobne rozvíjame v Knott (2012) a Takáč a spol. (2012); tu uvedieme len stručné zhrnutie. Sekvenčná povaha reprezentácií je motivovaná pozorovaním, že priame vnímanie epizód a ich účastníkov zahŕňa sekvenciu sezomotorických operácií v kanonickom poradí (Ballard a spol., 1997), ktorých dôsledkom je sekvenčná aktivácia senzorických a motorických reprezentácií v mozgu. Napríklad pri vnímaní epizódy, ktorá má niekoľko účastníkov, pozorovateľ zameria na nich 178

179 pozornosť postupne a nie paralelne. Ak ide o epizódu s agensom aj paciensom, pozornosť sa zameria najprv na agens, potom na paciens, a nakoniec sa aktivuje reprezentácia vnímanej alebo vykonávanej motorickej akcie (Knott, 2012). Knott argumentuje, že sémantické roly agens a paciens sú definované sériovou pozíciou v postupnosti senzomotorických operácií a nie explicitným označením. Percepcia objektov účastníkov epizód je takisto výsledkom kanonickej postupnosti senzomotorických operácií. Ak chce pozorovateľ klasifikovať objekt, musí najprv zamerať fokálnu pozornosť na pozíciu v priestore, kde sa daný objekt nachádza (Treisman a Gelade, 1980; Zhang a spol., 2011). Podľa Walles a spol. (2014) je medzi zameraním fokálnej pozornosti a klasifikáciou objektu ešte ďalšia operácia zvolenie priestorovej škály klasifikácie, ktorá určí, či sa má klasifikovať globálna alebo lokálna formu podnetu na zvolenej priestorovej pozícii. Táto operácia determinuje, či sa bude klasifikovať jednotlivý objekt alebo homogénna skupina objektov, čo v jazyku zodpovedá číslu (jednotné/singulár, množné/plurál). Proces percepcie objektu je teda kanonickou sekvenciou troch operácií: 1. výberu salientnej priestorovej pozície, 2. zvolenia klasifikačnej škály, 3. samotnej klasifikácie (ktorej výsledkom je aktivácia reprezentácie kategórie objektu). Proces vnímania epizódy, ktorá obsahuje tranzitívnu akciu, je tiež sekvenciou troch operácií: 1. vnímanie agensa, 2. vnímanie paciensa, 3. aktivácia motorického programu. Podľa Knott (2012) sémantické reprezentácie epizód a objektov v pracovnej pamäti odrážajú sekvenčnú štruktúru senzomotorických rutín, ktorými boli zaznamenané: epizódy a objekty sú reprezentované v pracovnej pamäti ako plány pripravené sekvencie senzomotorických operácií, ktoré je možno jednu po druhej vykonať. Náš model sémantických reprezentácií je explicitne simulacionistický: sémantická reprezentácia v pracovnej pamäti je vykonateľný plán, ktorý po spustení zreprodukuje senzomotorickú skúsenosť postupnou aktiváciou senzomotorických reprezentácií. Napr. epizóda vyjadrená vetou Ján naháňal Máriu je uložená v pracovnej pamäti ako plánovaná sekvencia operácií: aktivovania reprezentácie Jána, potom aktivovania reprezentácie Márie a nakoniec aktivácia motorického programu pre naháňanie. Spustením tejto plánovanej sekvencie sa zreprodukuje sekvencia senzomotorických operácií, ktorá viedla k zapamätaniu tejto epizódy. 3 Mechanizmus viazania sekvenčne štruktúrovaných sémantických reprezentácií Ako sme už spomínali, jednou z kľúčových požadovaných vlastností mechanizmu viazania je podpora simultánneho viazania viacerých rôl. Vo väčšine existujúcich modelov (napr. Chang, 2002; van der Velde a de Kamps, 2006; Stewart a Eliasmith, 2012; Mayberry a Miikkulainen, 2008) sú sémantické reprezentácie tvorené statickými konfiguráciami neurálnej aktivity, pričom sú všetky štruktúry viažuce roly aj ich argumenty aktívne naraz. V našom modeli je priradenie rôl implicitne prítomné v plánovanej senzomotorickej sekvencii uloženej v pracovnej pamäti a stáva sa explicitným postupne pri aktívnom prehrávaní plánovanej sekvencie. To umožňuje oveľa jednoduchšiu implementáciu viazania založenú na priamych asociatívnych spojeniach. Plánovaná senzomotorická sekvencia je v našom modeli kódovaná priestorovo, čo znamená, že rôzne neurálne polia aktivujú reprezentácie s nimi asociované postupne po jednom, v preddefinovanom poradí a tým spôsobia sekvenciu vzorcov aktivít v ďalších oblastiach. Tieto neurálne polia tak implementujú ukazovateľ (pointer) do iných oblastí. Pritom je veľmi dôležité, že rôzne polia môžu ukazovať do toho istého média, napr. neurálne pole, ktoré sa aktivuje ako prvé, cez asociatívne spojenia aktivuje reprezentáciu agensa v oblasti pre reprezentáciu objektov, a neurálne pole, ktoré sa aktivuje ako druhé, aktivuje reprezentáciu paciensa v tej istej oblasti, ale v inom čase, takže sa reprezentácie nepomiešajú. Druhou požiadavkou na mechanizmus viazania je, aby umožňoval hierarchické reprezentácie, teda argumenty s vlastnou rolovou štruktúrou. V našom modeli túto požiadavku implementujeme tým, že priestorovo kódované neurálne polia v plánovacej oblasti môžu aktivovať reprezentácie, ktoré sú samy o sebe sekvenčným plánom v inej plánovacej oblasti. Napríklad naše reprezentácie agensa a paciensa, ktoré sa po jednom postupne aktivujú počas vykonávania plánu reprezentujúceho celú epizódu, sú samy o sebe sekvenčnými plánmi, takže jednotlivé kroky prehrávania epizódy majú vlastnú sekvenčnú štruktúru. 4 Model pracovnej pamäti pre epizódy a indivíduá Architektúra nášho modelu je na obr. 1. Médiá tvoriace pracovnú pamäť sú vpravo od zvislej bodkovanej čiary. Jedno reprezentuje indivíduá (jednotlivé objekty alebo homogénne skupiny objektov), druhé epizódy. V médiu WM individual je aktuálne vybraté indivíduum reprezentované ako sekvencia pozostávajúca z umiestnenia (location), čísla (number, klasifikačná škála) a množiny vlastností (properties), ktorá obsahuje distribuovanú reprezentáciu typu indivídua a jeho atribútov. Tieto reprezentácie sú aktívne v plánovacom médiu naraz, avšak keď sa plánovaná sekvencia vykonáva/prehráva, 179

180 CANDIDATE WM INDIVIDUALS CANDIDATE WM EPISODES WM INDIVIDUAL WM EPISODE 1st-order SM representations location person place... number sing plur properties gender type misc status new old agent patient 'cause' action num/props num/props pers/status pers/status... content-addressed pointers content-addressed pointers Obr. 1: Architektúra modelu pracovnej pamäti pre epizódy a indivíduá. každá z nich postupne aktivuje príslušné asociované primárne reprezentácie v pozornostnom/perceptuálnom systéme (1st order SM representations) po jednom. To je v súlade s empirickými poznatkami o reprezentácii plánovaných senzomotorických sekvencií u makakov v prefrontálnych oblastiach (pozri referencie v Takáč a Knott, 2015). Na reprezentáciu umiestnenia, čísla a typu/vlastností môžeme nazerať ako na obsahom adresované ukazovatele do primárnych oblastí, podobne ako je to v modeli konvergenčných zón (Damasio a Damasio, 1994). Vrstva WM individual poskytuje vstup ďalšej vrstve na obrázku nazvanej candidate WM individuals (ďalej cwm-ind), v ktorej sú krátkodobo uložené kombinácie umiestnenia, čísla a typu/vlastností zodpovedajúce indivíduám, ktoré boli nedávno v centre pozornosti. Neúplná reprezentácia vo vrstve WM individual môže slúžiť ako dotaz vrstve cwm-ind: ak napr. špecifikujeme umiestnenie, cwm-ind doplní číslo (jednotné/množné) a typ, a naopak. Ak sa podarí nájsť v cwm-ind indivíduum zodpovedajúce obsahu WM individual, klasifikuje sa ako známe, inak sa do cwm-ind pridá kombinácia zodpovedajúca aktuálnemu obsahu WM individual a označí sa ako nové indivíduum (atribút old/new v poli status, ktoré nie je súčasťou plánovanej sekvencie). Vrstva cwm-ind hrá úlohu v spracovaní jazyka aj pri mimojazykových procesoch. V jazyku reprezentuje významné referenty prebiehajúceho diskurzu, mimojazykovo reprezentuje zapamätané (a teda očakávané) umiestnenia a vlastnosti objektov na aktuálnej scéne. Oblasť WM episode je formálne podobná oblasti WM individual: reprezentuje aktuálnu epizódu ako plánovanú sekvenciu operácií aktivujúcich agens, paciens a akciu, ktorá môže byt kauzatívna alebo nekauzatívna, viď Lee-Hand a Knott (2013). Tieto plánované reprezentácie sú opäť obsahom adresované ukazovatele na operácie v iných médiách: v plánovacom médiu sú aktívne naraz, ale počas prehrávania epizódy aktivujú reprezentácie, na ktoré ukazujú, po jednom. Kľúčovou myšlienkou je, že vrstvy agent aj patient obsahujú ukazovatele do vrstvy WM individual a nie priamo do primárnych senzomotorických oblastí. Počas prehrávania epizódy uloženej vo WM episode sú indivíduá reprezentujúce agens a paciens aktivované postupne, takže každé z nich umožňuje osobitné prehratie príslušnej podpostupnosti. Plánované operácie uložené vo vrstve WM episode slúžia ako vstup vrstve ktorá reprezentuje viacero epizód candidate WM episodes (ďalej cwm-ep). Táto vrstva je implementovaná ako samoorganizujúca sa mapa SOM (Kohonen, 1982). Každý neurón si vo váhach pamätá konkrétnu kombináciu reprezentácií v oblastiach agent, patient a action, takže SOM po natrénovaní reprezentuje epizódy lokalisticky, pričom neuróny reprezentujúce podobné epizódy sú v mape blízko seba. Prirodzene, nie je reálne reprezentovať každú principiálne možnú epizódu lokalisticky, ale to ani nie je účelom média cwm-ep: jeho úlohou je reprezentovať očakávané alebo želané epizódy a spôsobom zhora nadol ovplyvňovať senzomotorické spracovanie počas percepcie alebo vykonávania akcie. Dôležitým dôsledkom lokalistického kódovania je, že cwm-ep dokáže reprezentovať viacero epizód súčasne, takže profil aktivít mapy možno interpretovať ako pravdepodobnostné rozdelenie epizód. V mimojazykovom spracovaní to možno využiť na výber najpravdepodobnejšej alebo najželanejšej epizódy, alebo na priebežné generovanie rozdelenia pravdepodobnosti v oblasti WM individual počas procesu spracovania epizódy. Pri porozumení jazyka sa rozdelenie pravdepodobnosti epizód dá využiť na reprezentáciu alternatívnych interpretácií nejednoznačnej vety. Ďalšou výhodou navrhnutej reprezentačnej schémy je, že cwm-ep sa dokáže naučiť zovšeobecnenia epizód. Jedno zovšeobecnenie je zabudované priamo do štruktúry modelu: SOM reprezentuje agens a paciens iba pomocou ich čísla a vlastností, a informáciu o pozícii a statuse ignoruje, pretože táto nie je dôležitá pre generovanie očakávaní o epizódach. Na generovanie očakávaní o umiestneniach objektov slúži médium cwm-ind, ako ukážeme ďalej. To významne redukuje kombinatorické nároky na reprezentované epizódy. Ďalším zovšeobecnením je to, že pokiaľ je SOM vystavená veľkej a diverzifikovanej množine epizód, podobné epizódy môžu byt reprezentované tým istým neurónom. Keďže sú reprezentácie agensa aj paciensa distribuované, SOM sa môže naučiť abstrahovať od detailov, napr. reprezentovať typy indivíduí namiesto konkrétnych jednotlivcov. Teraz popíšeme technické detaily nášho modelu. Vrstva WM individual pozostáva z niekoľkých sád lokalisticky reprezentovaných čŕt: osoba (1, 2, 3), číslo 180

181 (singulár, plurál), rod (mužský, ženský, stredný) a status (známy, nový). Každá sada môže reprezentovať hodnotu vlastnosti jednoznačne (jeden neurón v sade úplne aktívny, ostatné úplne neaktívne), alebo ako rozdelenie pravdepodobnosti nad hodnotami reprezentovanými neurónmi v rámci jednej sady. Oblasť vlastností obsahuje okrem rodu ešte sadu pre životnosť (životné, neživotné), sadu pre typ objektu (človek, pes, mačka, vták, pohár, lopta, kreslo). Pozícia objektov, ktoré sú v reále situované na mriežke 100x100, je kódovaná populáciou 6x6 neurónov s čiastočne sa prekrývajúcimi gaussovskými receptívnymi poľami rovnomerne pokrývajúcimi mriežku. Oblasť misc reprezentuje farbu objektu, ktorá je nezávislá od typu (viď nižšie). Farba je kódovaná populáciou 11 neurónov s gaussovskými receptívnymi poľami v trojrozmernom RGB priestore maximálne reagujúcimi v oblasti 11 základných farieb (viď obr. 4). Takéto populačné kódovanie je biologicky plauzibilné a poskytuje matematicky korektný spôsob výpočtu vierohodnosti (angl. likelihood) rôznych stimulov pre konkrétny vzorec aktivít neurónov v populácii (Jazayeri a Movshon, 2006). Primárne senzomotorické reprezentácie (na obr. 1 vľavo od zvislej bodkovanej čiary) sú izomorfné s oblasťami vo WM individual a WM episode, s ktorými sú prepojené. Podobne aj oblasti agent a patient vo WM episode sú izomorfné s príslušnými oblasťami vo WM individual: num/props s oblasťou pre číslo a vlastnosti vo WM individual a pers/status s oblasťami pre osobu a status vo WM individual. Cause je jediný neurón, ktorý je aktívny pre kauzatívne akcie a neaktívny pre bežné akcie. Oblasť action pozostáva z 22 neurónov kódujúcich typ akcie lokalisticky (pozri legendu osi x na obr. 2) a z 11 neurónov kódujúcich vlastnosti akcií distribuovanými črtami. Vrstva cwm-ind je konvergenčná zóna variabilnej veľkosti plne prepojená s vrstvou WM individual: keď je na vstupe nové (nerozpoznané) indivíduum, vo vrstve cwm-ind sa regrutuje nový neurón a aktivity neurónov vo vrstve WM individual sa skopírujú do jeho váh (tzv. one-shot learning, čiže okamžité učenie). Vrstva cwm-ep je SOM so 400 neurónmi. Každý neurón v SOM má okrem štandardných vstupných váh ešte jednu skalárnu váhu, ktorá reflektuje počet/frekvenciu zásahov tohto neurónu, teda koľko krát bol tento neurón víťazom (mal najvyššiu aktivitu). Z týchto frekvencií sa odvodia apriórne pravdepodobnosti pre výpočet Bayesovskej pravdepodobnosti, že aktuálny vstup zodpovedá epizóde reprezentovanej daným neurónom (detaily pozri v Takáč a Knott, 2015). 5 Trénovanie a testovanie modelu 5.1 Trénovanie Model je trénovaný na epizódach v simulovanom virtuálnom svete. Svet pozostáva z objektov, ktoré vystupujú v epizódach. Každý objekt je určitého typu a má náhodne generované číslo, 1 pozíciu a farbu. Pozície sú náhodne generované na mriežke 100x100, farby sú stochasticky generované z gaussovských distribúcií centrovaných okolo 11 základných farieb. Následne generujeme množinu epizód, v ktorých vystupujú tieto objekty. Každá epizóda je prezentovaná WM systému ako sekvencia primárnych senzomotorických reprezentácií. Epizódy sú troch typov: tranzitívne (agens paciens tranzitívnaakcia), intranzitívne (agens intranzitívna-akcia) a kauzatívne (agens paciens kauzatívna-akcia). Agens a paciens majú vlastnú vnútornú sekvenčnú štruktúru, konkrétne pozícia číslo typ/vlastnosti. Počas prezentácie epizódy sa komponenty týchto plánovaných podpostupnosti aktivujú postupne, z primárnych senzomotorických oblastí do častí vrstvy WM individual. Keď je reprezentácia vo vrstve WM individual úplná, aktivuje najprv ako dotaz vrstvu cwm-ind, čím sa zistí, či indivíduum, ktorého reprezentácia je momentálne obsahom WM individual, je nové, alebo sa už v momentálne zapamätanom kontexte vyskytuje. Každý neurón v cwm-ind (kandidát) sa aktivuje priamo úmerne priemernej Kullback-Leiblerovej divergencii (Kullback a Leibler, 1951) medzi zodpovedajúcimi si sadami čŕt vo WM individual a vo váhach kandidáta, čo zodpovedá vierohodnosti (likelihood), že aktuálny obsah vrstvy WMind je reprezentáciou indivídua zapamätaného vo váhach kandidáta (Jazayeri a Movshon, 2006). Ak je vierohodnosť víťazného kandidáta dostatočná, jeho váhy sa aktualizujú podľa obsahu WM individual a status WM individual sa nastaví na hodnotu old, v opačnom prípade sa vytvorí a pridá nový kandidát s váhami podľa obsahu WM individual, a status sa nastaví na hodnotu new. Kandidáti, ktorých váhy neboli aktualizované viac ako posledných 20 epizód, sa z cwmind odstránia, čo zodpovedá zabúdaniu. Následne sa obsah WM individual (vrátane statusu) prekopíruje do izomorfnej oblasti v médiu WM episode, buď do časti agent, ak išlo o agens epizódy, alebo patient, ak to bol paciens. Po prezentácii kompletnej epizódy sa prešíri aktivita z vrstvy WM episode do SOM cwm-ep. Táto SOM je trénovaná štandardným spôsobom (Kohonen, 1982), teda učenie v cwm-ep je postupné (zatiaľ čo v cwm-ind je okamžité, one-shot). 5.2 Testovanie mechanizmu viazania Najprv ukážeme, ako náš model dokáže znovuprehrať práve vnímanú epizódu: po prezentovaní celej epizódy slúži obsah média WM episode ako vstup procesu znovuprehrávania, pričom zložky tohto média (agent, patient, action) sú aktivované postupne. Zložka agent (a neskôr patient) aktivuje asociovanú oblasť v médiu WM individual, čo spustí analogickú rutinu v tomto médiu (teda sekvenčné zložky WM individual aktivujú asociované primárne oblasti postupne). Ak na- 1 Ak je číslo plurál, objekt je vlastne skupina rovnakých objektov. 181

182 cwm-ep cwm-ind Activity Activity Human Dog Cat Bird Cup Ball Chair Grab Hit Push Walk Run Lie Sit Sing See Snore Sneeze Sleep Hold Hug Bite Kick Break Stop Hide Go Pat Stroke Obr. 2: Typ akcie predpovedaný médiom cwm-ep pre tri fragmenty epizód. Zhora nadol: človek pes?, človek mačka?, vták?. vrhnutá schéma viazania funguje správne, mali by sme prehrať rovnakú sekvenciu SM signálov ako bola sieti prezentovaná počas vnímania epizódy. Pri testovaní sme dosiahli 99,6% úspešnosť, čo potvrdzuje, že navrhnutý mechanizmus viazania pracuje správne. 5.3 Testovanie predikčných a generalizačných schopností modelu Navrhnutý model dokáže produkovať niekoľko typov predikcií. Po prvé, SOM cwm-ep dokáže predikovať, aké epizódy sa pravdepodobne vyskytnú, pričom predikcia sa s prichádzajúcou informáciou počas vnímania epizódy koriguje. Tieto predikcie je najľahšie demonštrovať, pretože sieť kóduje akcie priamo. Aby sme to mohli verifikovať, zaviedli sme do mechanizmu generovania trénovacích epizód nasledujúce pravidelnosti: Vtáky vždy spievali (t.j. ak je agensom vták, tak akciou je spievať), ďalej pri všetkých interakciách ľudí so psami a mačkami, človek potľapkal psa a poškrabkal mačku (person dog pat, person cat stroke). Natrénovanej SOM cwm-ep sme prezentovali na vstupe (WM episode) čiastočnú reprezentáciu epizódy reprezentáciu vtáka v časti agent, alebo človeka v časti agent a psa resp. mačky v časti patient, a distribúciu očakávaných epizód sme zrekonštruovali ako lineárnu kombináciu váhových vektorov 10 najaktívnejších neurónov (s koeficientami úmernými aktivite). Na obr. 2 vidieť, že sieť predikuje s vyššou pravdepodobnosťou pravidelnosti, ktoré sa vyskytovali v trénovacích epizódach. SOM cwm-ep tiež dokáže generovať predikcie o agense a paciense v epizódach. Mechanizmus týchto predikcií je zložitejší, pretože zahŕňa prehrávanie v systéme WM individual, čím sa predikcia aktualizuje o znalosti reprezentované týmto systémom. Najprv sa zameriame na predikcie o agense. Aby sme ich mohli testovať, zaviedli sme v generovaní trénovacích epizód ďalšiu pravidelnosť všetky epizódy majú životné agensy (teda ľudí a zvieratá, nie však veci). Pri testovaní sme najprv Obr. 3: Apriórne očakávanie typu agensa generované zhora nadol médiami cwm-ep a cwm-ind. vygenerovali aktivitu v SOM cwm-ep na základe apriórneho rozdelenia pravdepodobnosti epizód (podľa frekvencie zásahov každého neurónu v SOM), následne sme prešírili aktivitu zhora nadol do média WM episode ako aktivitami váhovanú kombináciu váhových vektorov 10 najaktívnejších neurónov v SOM. Výslednú aktivitu v časti agent sme prešírili/prekopírovali do média WM individual, kde slúži ako vstup pre sieť cwm-ind. Pretože obsah WM individual teraz reprezentuje očakávania, každý neurón vrstvy cwm-ind (reprezentujúci jedno zapamätané indivíduum) je aktivovaný priamo úmerne Kullback-Leiblerovej divergencii medzi jeho váhovým vektorom a obsahom WM individual. Váhové vektory 10 najaktívnejších neurónov sa skombinujú a prešíria výsledok zhora nadol, čím sa očakávanie v systéme WM individual aktualizuje o vedomosti o nedávno vnímaných/zapamätaných indivíduách. Na obr. 3 vidíme očakávanie/predikciu typu agensa v systéme WM episode aj WM individual. Oba systémy správne predikujú nulovú pravdepodobnosť výskytu neživotného agensa. Pretože však v momentálnom kontexte predikcie bolo v systéme cwm-ind zapamätaných oveľa viac psov a mačiek ako ľudí, predikcia typu v systéme WM individual je vychýlená v ich prospech. Ďalším výsledkom interakcie systémov pre WM epizódy a indivíduá je generovanie predikcií o umiestnení a vlastnostiach jednotlivých objektov. Na testovanie týchto sme zaviedli ďalšiu pravidelnosť vo všetkých epizódach, kde človek (v role agensa) interagoval so psom, bol pes čierny, ak bol agensom muž, a biely, ak žena. Ďalej, ľudia boli v prostredí vždy umiestnení v ľavom hornom a zvieratá v pravom hornom kvadrante mriežky (a veci v dolnej polovici mriežky). Pri testovaní sme najprv aktivovali čiastočnú reprezentáciu epizódy vo WM episode v časti agent sme aktivovali neuróny reprezentujúce typ človek a jeho rod (muž alebo žena), a v časti patient sme aktivovali neurón pre typ pes (všetky ostatné neuróny vrátane farby ostali neaktívne). Túto reprezentáciu sme použili ako vstup generujúci aktivitu v médiu cwm-ind a následne sme prešírili kombináciu váh 10 najaktívnejších neurónov v SOM zhora nadol spätne do média WM episode. Obsah časti patient sme prešírili/prekopírovali do média WM individual, ktoré 182

183 Activity Activity White White Yellow Yellow Orange Orange (Woman) Dog... Red Red Pink Purple cwm-ep cwm-ind Blue Green (Man) Dog... Pink Purple Blue Green Grey Grey Brown Brown Black Black Obr. 4: Predikcie o farbe paciensa generované médiami cwm-ep a cwm-ind pre epizódy žena pes (hore) a muž pes (dolu). sme následne aktualizovali pomocou znalostí v systéme cwm-ind spôsobom opísaným vyššie. Na obr. 4 vidno výslednú aktivitu neurónov kódujúcich farbu v médiu WM individual. Systém správne predikuje najvyššiu aktivitu v RGB oblasti zodpovedajúcej čiernej v prípade interakcií muž pes, a bielej v prípade žena pes. Vrstva cwm-ind dokáže generovať aj očakávanie o umiestnení psa (obr. 5). Vidíme všeobecné očakávanie výskytu v pravom hornom kvadrante, pretože zvieratá sa vždy vyskytujú v tomto kvadrante, ale vidíme aj špecifickú predpoveď na základe umiestnení nedávno zaznamenaných bielych a čiernych psov. Obr. 5: Očakávané umiestnenie paciensa generované pre tieto epizódy systémom cwm-ind (tmavšia farba znamená silnejšie očakávanie). Čierne bodky reprezentujú skutočné umiestnenie aktuálne prítomných bielych (vľavo) a čiernych (vpravo) psov. 6 Diskusia Prezentovaný konekcionistický model predstavuje novú originálnu schému viazania rôl, založenú na predpoklade, že sémantické reprezentácie sú v pracovnej pamäti uložené ako plánované sekvencie vykonateľných operácií. Takéto ponímanie sémantických reprezentácií je prítomné v mnohých simulacionistických teóriách významu. Náš model je však originálny v tom, že umožňuje, aby sémantické reprezentácie, ktoré sú obsahom jednotlivých rôl, mali vlastnú sekvenčnú štruktúru. Ďalšou výhodou modelu je, že obsahom indexované sémantické roly umožňujú reprezentovať celé pravdepodobnostné rozdelenie epizód naraz, nielen jednu epizódu. Prezentovaná verzia modelu je predbežná, a tak zatiaľ ostáva veľa otázok otvorených. Dôležitá je napr. otázka priestorových nárokov modelu, pretože naše priestorové kódovanie indexov agensa a paciensa si vyžaduje udržiavanie niekoľkých oddelených kópií média WM individual. Počet kópií je obmedzený počtom rôl v epizóde, teda malý, aj tak je však dôležité zaoberať sa otázkou kapacitnej efektivity. Teraz sa zameriame na problém, ktorý považujeme za ešte závažnejší: aj keď náš model podporuje hierarchické reprezentácie, tieto nie sú rekurzívne. Náš model dokáže reprezentovať význam menných fráz vo vetných frázach, ale menné frázy môžu obsahovať vnorené vetné frázy, ako je to v podraďovacích súvetiach (napr. Muž, ktorého pohryzol pes, utiekol.). Dá sa náš model rozšíriť tak, aby dokázal reprezentovať rekurzívne štruktúry tohto typu? Tvrdíme, že náš model na to má všetky predpoklady: Vo väčšine konekcionistických modelov sú totiž sémantické reprezentácie statickými vzorcami neurálnej aktivity v týchto modeloch musí byť teda nadradená a podradená vetná fráza aktívna naraz. V našom modeli je prirodzené reprezentovať vnorené frázy v médiu WM episode v rôznych časoch, rovnako ako sú agens a paciens aktívne v tom istom médiu WM individual, ale postupne. Tento spôsob umožňuje napr. odložiť samotný výber podradenej frázy až do momentu, kedy sa príslušné indivíduum stane aktívnym v médiu WM individual. Vezmime si napr. vetu s podradenou referenčnou frázou Pes [ktorý naháňal Máriu] ma pohrýzol. Pri generovaní tejto vety sa najprv vo WM episode prehráva hlavná fráza Pes ma pohrýzol, počínajúc aktiváciou agensa pes v médiu WM individual. Predstavujeme si, že na konci tohto procesu sa vykoná operácia hľadania takých vlastností tohto psa, ktoré by ho jednoznačne referenčne identifikovali, výsledkom čoho môže byť vlastnosť participácie v epizóde, kde naháňal Máriu (táto epizóda sa získa nie z pracovnej pamäti, ale z nejakého dlhodobého pamäťového média). V tomto momente sa prehrávanie hlavnej epizódy dočasne pozastaví, a v médiu WM episode sa prehrá podradená epizóda, a potom sa pokračuje v prehrávaní hlavnej epizódy. Táto schéma je podobná riešeniu navrhnutému v Miikkulainen (1996) s použitím konekcionistickej rekurzívnej autoasociatívnej pamäte RAAM 183

184 na implementáciu zásobníka epizód. V budúcnosti plánujeme rozšíriť náš model takýmto spôsobom. Poďakovanie Tento príspevok bol podporený grantom VEGA 1/0898/14 a grantom 13-UOO-048 grantovej agentúry NZ Marsden Fund. Literatúra Baddeley, A. (2000). The episodic buffer: A new component of working memory? TICS, 4(11): Ballard, D., Hayhoe, M., Pook, P. a Rao, R. (1997). Deictic codes for the embodiment of cognition. Behavioral and Brain Sciences, 20(4): Chang, F. (2002). Symbolically speaking: A connectionist model of sentence production. Cognitive Science, 26: Damasio, A. a Damasio, H. (1994). Cortical systems for retrieval of concrete knowledge: The convergence zone framework. Koch, C. a Davis, J. (zost.), V Largescale Neuronal Theories of the Brain. MIT Press, Cambridge, MA. Fiebach, C., Friederici, A., Smith, E. a Swinney, D. (2007). Lateral inferotemporal cortex maintains conceptual semantic representations in verbal working memory. Journal of Cognitive Neuroscience, 19(12): Jackendoff, R. (2002). Foundations of Language: Brain, Meaning, Grammar, Evolution. Oxford University Press, Oxford. Jazayeri, M. a Movshon, A. (2006). Optimal representation of sensory information by neural populations. Nature Neuroscience, 9(5): Knott, A. (2012). Sensorimotor Cognition and Natural Language Syntax. MIT Press, Cambridge, MA. Kohonen, T. (1982). Self-organized formation of topologically correct feature maps. Biological Cybernetics, 43: Kullback, S. a Leibler, R. A. (1951). On information and sufficiency. Annals of Mathematical Statistics, 22(1): Mayberry, M. a Miikkulainen, R. (2008). Incremental nonmonotonic sentence interpretation through semantic self-organization. Technická správa AI08-12, Department of Computer Sciences, The University of Texas at Austin. Miikkulainen, R. (1996). Subsymbolic case-role analysis of sentences with embedded clauses. Cognitive Science, 20: Páleš, E. (1994). SAPFÓ: Parafrázovač slovenčiny. VEDA, Bratislava. Stewart, T. a Eliasmith, C. (2012). Compositionality and biologically plausible models. Werning, M. a Hinzen, W. (zost.), V The Oxford Handbook of Compositionality. OUP, New York. Takáč, M., Benušková, L. a Knott, A. (2012). Mapping sensorimotor sequences to word sequences: A connectionist model of language acquisition and sentence generation. Cognition, 125: Takáč, M. a Knott, A. (2013). Konekcionistický model epizodickej pracovnej pamäti. Kelemen, J., Rybár, J., Farkaš, I. a Takáč, M. (zost.), V Kognitívní věda a umělý život, str Slezská univerzita, Opava. Takáč, M. a Knott, A. (2015). A neural network model of episode representations in working memory. Cognitive Computation, DOI: /s Treisman, A. a Gelade, G. (1980). A feature integration theory of attention. Cognitive Psychology, 12: van der Velde, F. a de Kamps, M. (2006). Neural blackboard architectures of combinatorial structures in cognition. Behavioral and Brain Sciences, 29: Walles, S., Robins, A. a Knott, A. (2014). A perceptually grounded model of the singular-plural distinction. Language and Cognition, 6:1 43. Zhang, Y., Meyers, E., Bichot, N., Serre, T., Poggio, T. a Desimone, R. (2011). Object decoding with attention in inferior temporal cortex. Proceedings of the National Academy of Sciences of the USA, 108(21): Zwaan, R. a Taylor, L. (2006). Seeing, acting, understanding: Motor resonance in language comprehension. Journal of Experimental Psychology: General, 135(1):1 11. Lee-Hand, J. a Knott, A. (2013). A model of causative actions: from motor learning to syntactic structure. V Proceedings of the 35th Annual Meeting of the Cognitive Science Society, Berlin. 184

185 Kognícia a umelý život 2015, Trenčianske Teplice Robot založený na ukotveném situovaném modelu Michal Vavrečka, Karla Štepánová, Jaroslav Vítků : České Vysoké Učení v Praze, Fakulta Elektrotechnická Katedra kybernetiky Technická 2, , Praha 2 : Jihočeská Univerzita, Pedagogická fakulta Katedra pedagogiky a psychologie Branišovská 31a, České Budějovice [email protected], [email protected], [email protected] Abstrakt V příspěvku prezentujeme návrh robotického systému, který vychází z původního softwaru robota Ripley obsahujícího ukotvený model světa. Originální kód robota je postupně převeden do recentní verze operačního systému a standartizovaného robotického komunikačního protokolu (ROS). Zároveň jsme vytvořili novou verzi hardwaru robotického ramene založeného na modifikovatelné sadě motorů, pro snadnější přizpůsobení robota aktuálním podmínkám. Po úspěšné rekompilaci původního softwaru a jejím zprovoznění na novém rameni plánujeme rozšířit robotické moduly o soustavu neuronových sítí, které zajistí adaptabilitu během učení se novým podnětům. Hlavním cílem projektu je tvorba modulů, které umožní prediktivní schopnosti robota, související s rozšiřením ukotveného modelu světa o simulace možných stavů. 1 Úvod 1.1 Kognitivní robotika Rozvoj robotiky v posledních letech koresponduje s rozvojem v oblasti výpočetní techniky a pokročilých materiálů. Rostoucí výpočetní výkon současných počítačů umožňuje rychlejší zpracování senzorických dat, což je základním požadavkem při tvorbě robotických systémů, a použití nových materiálů při tvorbě robotických těl zlepšuje jejich flexibilitu a funkčnost. Je proto žádoucí, aby také vývoj v oblasti tvorby algoritmů pro ovládání složitých robotických zařízení následoval tento trend a plně využíval výše zmíněných výhod. Automatizované robotické systémy jsou dnes již samozřejmostí v mnoha průmyslových oblastech, kde nahrazují lidi při vykonávání mechanických pracovních činností, popřípadě pomáhají při nebezpečných úkonech. Jelikož se jedná o předem naprogramované systémy, které dokáží pouze deterministicky plnit fixní úlohu, vede každá změna či nepředvídatelný jev v okolním světě k jejich selhání a neschopnosti pokračovat v činnosti. Směrem, který se snaží tyto obtíže překonat, se v poslední době stává kognitivní robotika. Jedná se o odvětví, které klade, oproti průmyslové robotice, důraz na tvorbu řídících mechanismů, které z velké části napodobují způsob zpracování a ukládání senzorických informací u člověka. Z tohoto důvodu se také tvar robota většinou podobá lidskému tělu. Hovoříme pak o humanoidních robotech, vybavených patřičnou kognitivní architekturou. Oblast kognitivní robotiky se těší v posledních letech zvýšenému zájmu a roste počet humanoidních robotů, kteří jsou vhodní pro výzkumné účely i nasazení v běžném životě. Detailním rozoborem cen a funkčností humanoidních robotů se zabýváme v loňském příspěvku (Plaček a spol., 2014). Mezi špičkové humanoidy patří v Americe robot PR-2 a v Evropě je to robotické dítě icub. Obě zařízení jsou ale natolik drahá (asi Eur), že si jej mohou dovolit pouze vybrané robotické laboratoře. V letošním roce se objevilo několik projektů, které nabízejí humanoidní roboty v cenové hladině okolo Eur (např. Pepper), které umožňují výzkum v této oblasti také ostatním laboratořím. Přestože existuje snaha vytvořit standardizovaného humanoidního robota pro výzkumné účely, díky cenovým omezením převládá v této komunitě spíše přístup založený na tvorbě vlastních robotických systémů, dle požadavku výzkumníků. V tomto duchu je vytvořeno i robotické rameno prezentované v našem příspěvku. 1.2 Ukotvení symbolů Jak již bylo zmíněno výše, cílem aktuálně vytvářených kognitivních architektur je snaha o napodobení lidských kognitivních schopností. Mezi nejobtížnější úlohy v této oblasti patří způsob tvorby reprezentace znalostí ze senzorických dat, jejich použití pří predikci budoucích stavů, popřípadě logických inferencí nových znalostí ze starých. V případě reprezentace znalostí převládají v současné době přístupy, které oproti tradičním přístupům založeným na symbolické reprezentaci spojované s GOFAI, využívájí více úrovní (např. symbolickou a subsymbolickou) pro zachycení významu těchto znalostí na hlubší sémantické úrovni. Tento přístup vychází z článku z roku 185

186 1990 (Harnad, 1990), ve kterém je otázka sémantické reprezentace znalostí prezentována jako problém ukotvení symbolů. Základní otázkou ukotvení je, jak vytvořit funkci a interní mechanismus artefaktu (např. jako interní reprezentaci odkazující na externí objekt) tak, aby byla vlastní vzhledem k samotnému artefaktu, místo toho, aby byla závislá na interpretaci externím pozorovatelem (Ziemke, 1999). Proto je nutné, aby znalost vstupovala do systému z jeho prostředí v ukotvené formě. Na základě těchto požadavků byly vytovřeny základní architektury schopné pomocí zmíněného principu reprezentovat prostorové vztahy (Regier, 1995), vlastnosti objektů (Cangelosi a spol., 2002) popřípadě celé věty (Vavrečka a Farkaš, 2014). 1.3 Model světa Při splnění požadavku ukotvených reprezentací je dalším požadavkem na kognitivní architekturu schopnost operovat s těmito reprezentacemi a vytvářet závěry a predikovat možné stavy světa. V oblasti umělé inteligence se pro tento typ architektur vžil pojem agenti (roboti) obsahující model světa. Oproti čistě symbolickému přístupu k reprezentaci znalostí, ve kterém se pravidla pro manipulaci s reprezentacemi a tvorby modelu světa řídí na apriorně definovanými pravidly, v případě ukotvených reprezentací již potřebujeme složitější modely, které dokáží zohlednit sémantickou úroveň reprezentací. S teoretickým přístupem k řešení tohoto problému přišel (Barsalou, 1999), který navrhuje mentální simulátory, což jsou interní mechanismy pro práci s ukotvenými reprezentacemi, které umožňují predikovat možné stavy světa. Obtížná formalizace této teorie a nevyjasněnost některých teoretických pojmů se odráží v malém množství robotických systémů, které by dokázaly implementovat ukotvený model světa. Jedním z mála řešení v této oblasti je robotické rameno Ripley (Mavridis, 2007), které obsahuje ukotvený situovaný model světa. sloužící k vyvozování stavů okolního světa mimo robotův senzorický horizont. Právě tento model posloužil jako základ pro rozvoj naší architektury, kterou detailně popisujeme v následujícím textu. 2 Architektura Ripley Robot Ripley byl postupně vyvinut na MIT jako systém schopný rozpoznat scénu a hovořit o ni v přirozeném jazyce. Robot zde sloužil především pro výzkum v oblastech: rozpoznání a interpretace scény vnitřní reprezentace světa problému ukotvení symbolů zpracování přirozeného jazyka V neposlední řadě sloužil i pro prezentační účely. Robot byl schopen výše popsané schopnosti integrovat do jednoho funkčního celku. Dokázal rozpoznat scénu a udržovat si její reprezentaci v paměti (Mavridis, 2007). Dále pak konverzovat o scéně v mluvené řeči s člověkem, tj. odpovídat na otázky a plnit jednodušší příkazy typu: "bring me the red ball". Ilustrační videa jsou k dispozici například online 1. V následujících odstavcích zevrubně popíšeme hardware, celkovou architekturu Ripley robota a vybrané části architektury. 2.1 Popis hardware Původní robot měl formu 6-DOF manipulátoru s gripperem, viz Obr.1. Kamera byla umístěna přímo na gripperu, což umožňovalo změnu perspektivy pohledu na scénu. Motory robota a byly schopny měřit sílu aplikovanou na táhla ovládající robotovo tělo. Ripley měl schopnost rozlišovat předměty podle hmotnosti. Navíc byl vybaven tzv. "compliant módem", ve kterém motory pouze kompenzovaly gravitaci a robot se učil motorická primitiva od učitele. Obr. 1: Původní hardware robota Ripley. Klouby v základně, lokti a na hlavě dovolují robotu pohybovat se nad scénou. Kamera je umístěna na gripperu (chapadle), které umožňuje učení s učitelem v podobě přímé manipulace s robotem. Robot má celkem 6 stupňů volnosti. Motory umístěné v základně ovládají rameno pomocí táhel a jsou schopny měřit aktuálně aplikovanou sílu (převzato z (Hsiao a spol., 2003)). Mezi základní schopností robota patří: vidění: předzpracování obrazu, segmentace obrazu na objekty dle tvaru, barvy a pozice; perzistence objektů apod. ostatní senzory: schopnost vnímat svoji konfiguraci (polohu), hmotnost objektů a taktilní informaci (např. zda robot drží objekt) komunikace v přirozeném jazyce: robot dále obsahuje moduly pro zpracování a syntézu řeči 1 Ripley the Robot online: 186

187 motorika: robot je ručně naučen set základních motorických primitiv ("jak se dostat na pozici X,Y,Z") pomocí učitele. Robot je v "compliant módu"přímo naváděn za rukojeť na danou pozici. Dopředná kinematika robota je pak řešena pomocí interpolace mezi vhodnými, takto naučenými konfiguracemi kloubů. Více například v (Roy a spol., 2003). Získaná senzorická data, která jsou takto předzpracovaná, se dále ukládají v ukotveném situovaném modelu, který je popsán níže. Modulární software architektura robota byla implementována především v jazyce C++ (některé moduly v Javě). Kvůli velké výpočetní náročnosti (především zpracování obrazu) bylo pro spuštění celé architektury potřeba několik počítačů, včetně dvou rack serverů s procesory Intel Xeon. Potřebná komunikace je v architektuře realizována pomocí Parallel Virtual Machine (PVM) 2, umožňující přenos serializovaných dat mezi moduly a počítači po síti. zaslán do Action routeru, kde je převed na motorický výstup (Motor Control), sloužící k ovládání robotického ramene, nebo jazykový výstup (Speech synth). Pro uchováváni minulých stavů a akcí slouží modul Rememberer, který zastupuje robotickou paměť. Jsou v ní uchováný předchozí dotazy a konverzace a také minulé stavy ukotveného modelu, takže je robot schopen odpovídat také na otázky týkajících se jeho předchozích akcí, popřípadě popsat situace v minulosti. Modul Remember je navíc vybaven elementární formou epizodické paměti, takže je schopný oddělovat jednotlivé posloupnosti akcí do samostatných celků. 2.2 Popis modulů a princip funkce Kognitivní architektura robota Ripley se skládá ze specializovaných modulů, které zpracovávají data ze senzorických modalit a integrují je do ukotveného kognitivního modelu. Detailní schéma propojení je zobrazeno na Obr. 2. Vstupy z kamerových senzorů jsou zpracovány v samostatném systému pro vidění (Vison System). Ten se skládá z modulů pro zachycení aktuálního snímku (Capture), následuje detekce tváře (Face Detector) v případě interakce s člověkem, nebo ohraničení objektu ve scéně (Segmenter). Tyto moduly předzpracovávají vstupní data do ukotveného modelu světa, resp. jeho stochastické vrstvy Visor. Auditivní vstupy jsou zpracovávány v modulu Speech recognition, kde dochází k jeho převodu na text a odeslání do Utterance routeru. Odtud je jazykový vstup (text) posílán do kategorické vrstvy Imaginer, která je, podobně jako stochastická vrstva, součástí ukotveného situovaného modelu. Poslední modalitou je motorický vstup a výstup, sloužící k ovládání jednotlivých kloubů robota. Propriocepční a taktilní systémy nemají specializované moduly pro předzpracování a jsou napojeny přímo na situovaný ukotvený model. Ten přijímá informace ze senzorů, což slouží k vytvoření představy o aktuální poloze robota v prostoru a uchopeném předmětu. Konkrétně se jedná o informaci z tlakových senzorů, umístěných na robotickém chapadle, a senzorů polohy umístěných v kloubech. V ukotveném modelu je za senzorické vstupy z těla zodpovědný modul Proprioceptor, který odpovídá spojité reprezentační vrstvě. Za vykonávání akcí je zodpovědný modul Inquirer, které je přímo napojený na jazykový vstup a situovaný model. Poté, co zpracuje požadavek (příkaz nebo dotaz), provede ve spolupráci s ukotveným kognitivním modelem jeho zpracování. Následně je výstup ve formě odpovědí 2 PVM online: Obr. 2: Celkové schéma původní SW architektury. Základem je situační model uchovávající představu o stavu světa. Model je ukotven pomocí senzorických dat z kamery, dotykových senzorů a zpracování řeči. Robot je (pomocí ramene a syntetizéru řeči) schopen sám aktualizovat nejisté/staré informace o světě. Modul pro zpracování řeči je použit buď pro aktualizaci dat v situačním modelu, nebo pro zpracování příkazů (převzato z (Mavridis, 2007)). 2.3 Ukotvený situovaný model Srdcem celé architektury je ukotvený situovaný model, které slouží k sémantické reprezentaci okolního prostředí a umožňuje robotovi komunikaci v přírozeném jazyce, která je založena na ukotvených reprezentacích. Jak již bylo zmíněno v úvodu, pouze symbolická vrstva reprezentace znalostí je nedostačující pro dostatečné sémantické zpracování informací z okolního prostředí a proto je potřeba vytvářet systémy, které obsahují více vrstev, ve kterých je znalost o okolním světě reprezentována v různých úrovních. Právě tyto požadavky splňuje situovaný ukotvený model. Jak vyplývá z předchozího sekce, 187

188 jsou jednotlivé senzorické systémy napojeny do specifických vrstev ukotveného modelu, konkrétně se jedná o stochastickou, spojitou a kategorickou reprezentační vrstvu. Jejich vlastnosti korespondují se symbolickou a subsymbolickou reprezentační vrstvou tak, jak byla navržena Harnadem v (Harnad, 1990), a nasledně použita v podobných akrchitekturách pro ukotvení symbolů (Cangelosi a Riga, 2006; Vavrečka a Farkaš, 2014). Hlavní výhodou takových architektur je možnost reprezentovat senzorické vlastnosti v jejich přirozeném formátu, neztrácíme tedy informaci o podobnosti mezi objekty či situacemi, což je typické pro symbolické reprezentace. Ukotvený model světa tedy slouží k reprezentaci objektů, jejich vlastností a vzájemných vztahů ve třech vzájemně propojených vrstvách, přičemž popisují model světa v různých úrovních detailů. Kategorická vrstva operuje v jazykovém symbolickém kódu a slouží jednoznačné identifikaci stavů světa. Na její tvorbě se podílí stochastická vrstva, která se snaží ze senzorických dat odvodit, na základě pravděpodobnosti, aktuální stavy okolního světa. Podobně funguje spojitá reprezentační vrstva. Komunikace mezi jednotlivými vrstvami zajišťuje jejich vzájemnou konzistenci. To znamená, že nové vizuální vstupy, vedou k modifikaci nejen stochastické vrstvy, ale také obou ostatních vrstev. Podobně jazykový vstup obsahující informaci o aktuálním stavu světa modifikuje subsymbolické vrstvy. Vzájemná kooperace jednotlivých vrstev vytváří ukotvený reprezentační systém, ze kterého je možné vytvářet aktuální model světa a ve spolupráci s modulem Rememberer také rekonstruovat předchozí stavy světa (Mavridis a Roy, 2006). 3 Náš model Námi navržený model kognitivní architektury je nazvaný Predicon a staví na výše popsané architektuře a SW robota Ripley. Predicon přejme stávající schopnosti robota Ripley, stávající architekturu budeme dále vylepšovat a rozšiřovat o nové schopnosti/moduly. Jednotlivé fáze projektu lze popsat následovně: stavba robotického ramene, kompilace SW originální architektury pod novým operačním systémem, adaptace architektury na nové robotické rameno, postupná integrace architektury s Robotickým Operačním Systémem (ROS), úprava stávajících/přidávání nových modulů do architektury podle aktuálních cílů výzkumu. Predicon se v první fázi bude zaměřovat na vyšší adaptivitu jednotlivých částí, například sub-systémy pro vidění schopné adaptivního rozpoznání barev apod. Nová rozšíření pak budou realizována dle aktuálního směru výzkumu, jeden z možných cílů je schopnost autonomně se učit dynamiku prostředí. 3.1 Popis rekompilace Od Dr. Mavridise jsme získali originální zdrojové kódy Ripley architektury na jednom z původních počítačů. Originální robot je již bohužel umístěn v MIT muzeu, takže jej nelze využít. V první fázi je tedy naším cílem adaptovat původní architekturu tak, aby byla použitelná na současný OS (Linux Ubuntu) a na nový robotický HW (viz další kapitola). SW implementace Ripleye kopíruje architektury z Obr.2. Často tedy platí, že jeden blok odpovídá jedné spustitelné aplikaci. Aplikace mezi sebou komunikují pomocí PVM protokolu po síti. Celá architektura byla původně spouštěna na různém počítačovém HW (PC, notebook, rack) s různými operačními systémy (Linux, RT Linux, Windows). Ke konci vývoje Ripley architektury se posledním výzkumníkům již nedařilo bez problému zkompilovat celou architekturu. Proto byly problematické části spouštěny na původních počítačích a upravovány byly jen určité části (například Situation Model). Výsledný zdrojový kód (obsahující množství různých verzí různých podsystémů, naměřených a/nebo testovacích dat apod.) čítal úctyhodných 14.5GB dat. Původní velikost se nám postupně povedlo redukovat na 5GB dat. Zdrojové kódy jsou postupně rekompilovány pro Linux Ubuntu Dalším hlavním problémem byla různorodost verzí jednotlivých pod-systémů a jejich vzájemná nekompatibilita (například různá struktura PVM zpráv). V době psaní příspěvku se již podařilo zkompikovat většinu SW. Zbývají pravděpodobně již jen některé části vidění (viz Obr.2 nahoře), využívající OpenCV. Po úspěšné kompilaci všech pod-systémů otestujeme schopnost jejich vzájemné interakce a začneme SW integrovat s modernějším Robotickým Operačním Systémem (ROS) 3. Jednotlivé PVM uzly (části Ripley architektury - aplikace) odpovídají ROS uzlům. Proto budeme potřebné části SW postupně převádět pod ROS, čímž docílíme kompatibility se současným robotickým HW a zefektivníme komunikaci mezi sub-systémy. V další fázi budou do ROSu převedeny především senzorické a motorické sub-systémy. Námi použitý robotický HW je popsán v následující kapitole. 3.2 Popis hardware Pro sestavení robotického ramene jsme využili díly z robotické stavebnice Bioloid Premium Kit od firmy Robotis. Jedná se o stavebnici ze servo motorů, plastových dílů, senzorů a řídící elektroniky. Základní balení obsahuje vše potřebné pro postavení humanoida se 16 stupni volnosti. Díky konstrukci z univerzálních dílů je ale možné robota 3 ROS: 188

189 bez větších obtíží modifikovat a přizpůsobit konkrétní situaci. Vzhledem k tomu, že servomotory obsažené v základní verzi stavebnice nebyly schopné udržet námi navržené rameno, museli jsme je vyměnit za silnější motory, pro které jsme museli následně vyrobit i odpovídající propojující díly. Výsledné rameno (viz. Obr.3) má 6-DOF a je sestaveno z následujících modulárních servomotorů: 1x MX64, 2x MX-28 a 3x MX-12A. Tyto servomotory sestávají z DC motoru, převodů z ozubených kol, obvodů pro řízení a obvodů pro digitální komunikaci po sběrnici Dynamixel. Všechna serva a také další periferie jsou připojena k řídící jednotce CM530, která funguje jako digitální centrum robota. Řídící jednotka v sobě obsahuje vlastní mikrokontrolér a pomocné obvody pro komunikaci s periferiemi a počítačem. Jednotlivé Dynamixel motory, ze kterých je robotické rameno postaveno, jsou propojeny pod ROS za pomoci dynamixel_motor package, tudíž lze přímo v ROS ovládat jejich nastavení a sledovat jejich otočení, teplotu, napětí a zátěž. USB web-kamera Creative s rozlišením 720p je propojena s ROS pomocí usb_cam package (při rozlišení 640x480 px je frekvence přenosu cca 25 Hz a při rozlišeni 1280x720 je frekvence cca 20 Hz). modulech. Ze začátku budou tyto vlastnosti sjednoceny s proprioceptivní informací, aby bylo možné jednoduše vytvořit kanonickou scénu, která zahrnuje pozici objektů a aktuátorů ve světě. Všechny tyto vlastnosti jsou následně projektovány do dynamického modelu, který se bude učit, jak jednotlivé vlastnosti (příznaky přispívají k jednotlivým typům kolizí (typ kolize je definovaný z jazykového modulu). Cílem dynamických modulů bude naučit se rozpoznat ze senzorických příznaků o jaký typ kolize se jedná. Testovací fáze: Po trénovací fázi následuje fáze, kdy budeme robotovi prezentovat pouze část kolize (např. do chvíle kontaktu objektů). Následně je měřena odpověď systému na jednotlivých úrovních. Z jazykového výstupu můžeme vyčíst jaký typ kolize systém rozpoznal. Motorický výstup zajistí posun ramene do takové pozice, která bude odpovídat budoucí trajektorii interagujících objektů tak, aby je bylo schopno zachytit. Je možné také pomocí vizualičních nástrojů analyzovat vnitřní svět agenta (mentální model), který reprezentuje pozorovanou kolizi. Fáze 2: Více interakcí, řetězení a kompozicionalita V následující fázi budeme prezentovat jiný typ interakcí. Naší snahou bude ukotvit jednotlivá akční slovesa pomocí sady základních primitiv - např. chodit (bez kolize, bez interakce), padat (pohyb dolů, zastavení). Může se jednat i o reprezentaci více komplexních akcí - např. popis odpalu při tenisu jako sady základních pohybů. 3.4 Adaptivita Naším prvotním cílem je, aby byl celý systém adaptivní, tudíž budeme postupně předělávat jednotlivé moduly tak, aby nebyly hodnoty pevně zadané, ale aby reagovaly na okolní prostředí a přizpůsobovaly se aktuálnímu stavu učení. Budeme postupovat od jednodušších modulů až po moduly komplexnější, například od adaptivního modulu pro rozpoznávání barev a tvarů až po adaptivní moduly pro pozornost, paměť či řeč. Obr. 3: Nový hardware pro výzkum a vývoj architektury predikon. Robot je složen z dvou typů motorů Dynamixel a USB web-kamery Creative s rozlišením 720p. Komunikace s počítačem (Linux Ubuntu) je realizována pomocí ROS infrastruktury (Quigley a spol., 2009). 3.3 Návrh prvotních vylepšení Jazyk Dalším naším cílem je výzkum akvizice jazyka. Z toho důvodu provedem postupně následující kroky: 1. pro propagační i výzkumné účely převedeme současný slovník robota do ČJ (budeme dále pracovat jak s ČJ, tak s AJ verzí) Popis úlohy Fáze 1: Základní interakce - kolize Trénovací fáze: Robot pozoruje scénu se 4 typy základních kolizí. Na scéně se nachází jeden objekt uprostřed scény a jeden objekt, který se pohybuje směrem k němu. Robot pozoruje tuto kolizi a detekuje objekty (pozornostní modul) a jejich vlastnosti (barvu, tvar, velikost, prostorovou polohu, rychlost a směr). Tyto vlastnosti jsou reprezentovány v samostatných 2. Rozšíření slovní zásoby a gramatických struktur robota 3. Schopnost rozlišit druh věty (oznamovací, tázací...) a její konkrétní typ (otázka na pozici, vlastnost, dotaz na minulý stav) nejen dle prvního slova (jak je to ve stávající architektuře) 189

190 4. Schopnost komunikace pomocí variabilní délky věty 5. Učení se nových slov přímo z jazykového vstupu nezávisle na senzorických datech 6. Učení se slovům popisujícím nejen statické objekty (podstatná jména, přídavná jména), ale i akce (slovesa - např. dotknout se, narazit, odrazit se, posunout atp.) a vztahy objektů (předložky a příslovce - např. před, nad, skrz, více atp.) Změna reprezentace scény V aktuální verzi je si sice robot schopný vytvořit mentální model člověka a správně převést danou informaci (např. o pozici objektu - vlevo/vpravo) do své reprezentace, ale není schopný si například uvědomit, že některý z objektů může být pro člověka zakrytý. Jednou ze schopností Prediconu by mělo být takovéto situace pochopit a popsat. Dynamické scény Postupně se chceme přesunout od statických objektů a scén k dynamickým scénám a k objektům, které spolu budou interagovat. Predicon by měl být schopný odvodit budoucí stav věcí z minulých pozorování. Například z pozorování pohybů těles bude schopný odvodit jejich budoucí pohyb a to, zda dojde ke kolizi a jaký bude výsledek jejich interakce (v závislosti na vlastnostech sledovaných objektů). 4 Závěr Cílem našeho projektu je rozvoj kognitivní architektury založené na ukotveném situovaném modelu. Oproti přístupu, založeném na postupné vývoji systému, jsme zvolili variantu, která staví na ověřeném robotickém systému Ripley, který má podobné vlastnosti, jako navržený systém Predicon. Tento postup nám umožní zrychlit vývoj systému, jelikož jsou základní moduly již vytvořeny. Nově vytvářený systém by měl v praxi prověřit současné teorie ukotvených reprezentací, umožnující rozvoj umělé inteligence, která je schopná plnohodnotně pracovat z informacemi z okolního světa. Poděkování Tento projekt byl financován z grantu SGS New approaches to collection, evaluation and utilization of biological data II, No. SGS13/203/OHK3/3T/13 a grantu RPPJU No. CZ.1.07/2.3.00/ Cangelosi, A., Greco, A. a Harnad, S. (2002). Symbol grounding and the symbolic theft hypothesis. V Simulating the evolution of language, str Springer London. Cangelosi, A. a Riga, T. (2006). An embodied model for sensorimotor grounding and grounding transfer: Experiments with epigenetic robots. Cognitive Science, 30(4): Harnad, S. (1990). The symbol grounding problem. Physica D, 42: Hsiao, K., Mavridis, N. a Roy, D. (2003). Coupling perception and simulation: steps towards conversational robotics. V Intelligent Robots and Systems, (IROS 2003). Proceedings IEEE/RSJ International Conference on, vol. 1, str vol.1. Mavridis, N. (2007). Grounded Situation Models for Situated Conversational Assistants. Dizertačná práca, Massachusetts Institute of Technology. Dept. of Architecture. Program In Media Arts and Sciences. Mavridis, N. a Roy, D. (2006). Grounded situation models for robots: Where words and percepts meet. V Intelligent Robots and Systems, 2006 IEEE/RSJ International Conference on, str IEEE. Plaček, M., Vavrečka, M. a Lhotská, L. (2014). Matlabab toolbox pro ovládání robota bioloid. V In Kognitivní Věda a Umělý Život II, str , Zaječí u Břeclavi: Slezská univerzita v Opavě. Quigley, M., Conley, K., Gerkey, B., Faust, J., Foote, T., Leibs, J., Wheeler, R. a Ng, A. (2009). Ros: an opensource robot operating system. V ICRA Workshop on Open Source Software. Regier, T. (1995). A model of the human capacity for categorizing spatial relations. Roy, D., Hsiao, K.-Y., Mavridis, N. a Gorniak, P. (2003). Ripley, hand me the cup! (sensoriotor representations for grounding word meaning). V IEEE Workshop on Automatic Speech Recognition and Understanding. Vavrečka, M. a Farkaš, I. (2014). A multimodal connectionist architecture for unsupervised grounding of spatial language. Cognitive Computation, 6(1): Ziemke, T. (1999). Rethinking grounding. V Understanding representation in the cognitive sciences, str Springer US. Literatura Barsalou, L. W. (1999). Perceptual symbol systems. Behavioral and Brain Sciences, 22(04):

191 Kognícia a umelý život 2015, Trenčianske Teplice Prostředí eko-kolonií a P-kolonií Šárka Vavrečková Ústav informatiky, Slezská univerzita v Opavě Bezručovo nám. 13, Opava [email protected] Abstrakt Existuje řada různých matematických modelů, ve kterých více či méně nezávislí agenti zasahují do sdíleného prostředí či s ním přímo interagují. V článku srovnáváme působení agentů na prostředí ve dvou matematických modelech eko-koloniích a P koloniích. Eko-P kolonie jsou variací P kolonií povolující vývoj prostředí, proto byly do srovnání také zařazeny. Vzhledem k výrazně jednodušší struktuře agentů eko-kolonií byl zvolen postup napodobení činnosti agentů eko-kolonie v P kolonii, resp. v eko-p kolonii. 1 Úvod Eko-kolonie byly představeny v Vavrečková (2005) jako rozšíření kolonií (Kelemen a Kelemenová, 1992) gramatických systémů s velmi jednoduchými gramatikami (komponentami, agenty) spolupracujícími na sdíleném prostředí. Eko-kolonie obohacují tento koncept o možnost vývoje prostředí. V eko-koloniích je prostředí určeno 0L nebo E0L schématem, podle toho hovoříme o 0L ekokoloniích nebo E0L eko-koloniích. Agenti dle svých pravidel zpracovávají prvky prostředí, zbývající prvky podléhají vývoji prostředí. Agent dokáže zpracovávat jen jeden konkrétní prvek (který v každém kroku vyhledává v prostředí, tento prvek nazýváme startovacím symbolem agenta), jeho pravidla stanovují řetězce, na které agent přepíše nalezený výskyt svého prvku v prostředí. Důležitým omezením je, že agent nedokáže vygenerovat svůj startovací symbol (tento prvek se nesmí nacházet na pravé straně žádného pravidla tohoto agenta). Ve zdroji Vavrečková (2005) jsou pro eko-kolonie definovány dva módy odvození slabě paralelní wp a plně paralelní ap. V obou případech pracují agenti paralelně, ale zatímco u slabého paralelismu pracují právě ti agenti, kterým to stav prostředí dovolí (ti, kteří v prostředí najdou svůj volný symbol), u plného paralelismu pracují v každém kroku všichni agenti (pokud to není možné, výpočet končí). Slabý paralelismus byl postupně definován několika různými způsoby (třebaže v důsledku jsou tyto způsoby navzájem ekvivalentní, měnil se spíše způsob zápisu definice), zde se přidržíme definice publikované ve zdroji Kelemenová a Vavrečková (2011). V tomto článku se z důvodu srovnatelnosti (podobnosti) budeme zabývat pouze 0L eko-koloniemi pracujícími formou slabého paralelismu. Co se P kolonií týče, jejich základním kamenem je membránový systém (struktura vzájemně vnořených membrán s procházejícími a transformovanými multimnožinami objektů), či lépe P systém (membránový systém s jedinou membránou) představený ve zdroji Păun (2000). Přímo s konceptem P kolonií se poprvé setkáváme v Kelemen a Kelemenová (2005), kde jsou představeny jako formální model inspirovaný membránovými systémy a výše zmíněnými koloniemi. P systémy zde hrají roli agentů koexistujících ve sdíleném prostředí. Každý agent je vybaven množinou objektů určujících jeho stav a sadou programů. V každém programu z této sady je stanovený počet pravidel, pravidla mohou být několika různých typů. Pravidla buď mění stav agenta nebo umožňují agentovi ovlivňovat stav prostředí. Dostačující informace o variantách a také o možnostech využití membránových systémů, P systémů, P kolonií a dalších modelů najdeme zejména na webové stránce Eko-P kolonie jsou rozšířením P kolonií, kde je umožněn vývoj prostředí (prostředí je určeno 0L schématem) a agenti používají pouze dva typy programů: generující a konzumující. Oba typy programů mění stav agenta, generující programy navíc distribuují jeden symbol ze stavu agenta do prostředí, naopak konzumující programy přenášejí jeden symbol z prostředí do stavu agenta. Informace o eko-p koloniích jsou ze zdrojů Cienciala a Ciencialová (2011) a Cienciala (2015). Upozorňujeme, že v tomto článku není v žádném případě řešena výpočetní síla uvedených matematických modelů či její srovnání, zabýváme se pouze a jen srovnáním vlivu agentů na prostředí. Protože o tomto tématu by bylo možno psát velmi obsáhle, omezíme se pouze na dva algoritmy ukazující, jak lze podle dané eko-kolonie (v prvním případě splňující určité omezující podmínky, v druhém případě obecné) sestrojit P kolonii respektive eko-p kolonii takovou, že agenti se ve výsledném systému budou ke sdílenému prostředí chovat s podobným výsledkem jako v původní eko-kolonii. Určitým handicapem je odlišné pojetí prostředí v těchto systémech, tedy o skutečné ekvivalenci mezi vstupy a výstupy uvedených algoritmů samozřejmě nelze uvažovat. 191

192 2 Prerekvizity Budeme předpokládat, že čtenář již ovládá alespoň základy teoretické informatiky. Zde je stanoveno značení, které bude používáno v následujícím textu, dále v podkapitolách jsou definice všech srovnávaných modelů: ekokolonií, P kolonií a eko-p kolonií. Multimnožina je uspořádaná dvojice M = (V, f), kde V je základní množinou multimnožiny obsahující objekty vyskytující se v M, f je zobrazení f : V N, které každému prvku množiny V přiřazuje jeho četnost v multimnožině M. Množinu všech multimnožin nad množinou V označíme V o. 2.1 Eko-kolonie Eko-kolonie jsou matematický model vycházející z ekogramatických systémů. Existují ve variantách s 0L nebo E0L prostředím (vývoj prostředí je určen 0L nebo E0L schématem), zde se přidržíme varianty s prostředím 0L. Agent v eko-kolonii je jednoduchý systém generující defacto konečný jazyk, interakce s prostředím je pouze jednosměrná (agent ovlivňuje prostředí). Následuje formální definice 0L eko-kolonie. Definice 1 (0L Eko-kolonie) 0L eko-kolonie stupně n je uspořádaná struktura Σ = (E, w 0, A 1, A 2,..., A n ), kde E = (V, P ) je 0L schéma, přičemž V je neprázdná konečná abeceda prostředí, P V V je konečná úplná množina vývojových pravidel prostředí typu 0L, w 0 V je počáteční stav eko-kolonie, axiom, A i = (S i, F i ) je i-tý agent, 1 i n, kde S i V je startovací symbol agenta, F i (V {S i }) je neprázdná konečná množina akčních pravidel agenta. Vlastnost Eko-kolonie prostředí dynamické, typu 0L, stav je řetězec E = (V, P ) agenti jsou bezstavoví, zpracovávají jeden konkrétní symbol v prostředí, A = (S, F ) přepisují na řetězec pravidla agentů S f 1 f 2... f k, f j F, F (V S) přednost agenti mají přednost před vývojem prostředí činnost agentů paralelní výstup řetězec stav prostředí Tab. 1: Souhrn vlastností eko-kolonií V eko-koloniích můžeme použít několik různých módů odvození, v tomto článku se omezíme jen na slabý paralelismus (wp weakly parallel), kdy pracují paralelně všichni agenti, kterým to stav prostředí umožňuje. i- tý agent v jednom kroku najde v prostředí svůj startovací symbol S i a přepíše ho na některé ze slov z množiny F i. Symboly prostředí, které v daném kroku nejsou zpracovány žádným agentem, podléhají vývojovým pravidlům prostředí. Definice kroku odvození wp je následující: Definice 2 Nechť Σ = (E, w 0, A 1, A 2,..., A n ) je 0L eko-kolonie. Definujeme slabě paralelní krok odvození v Σ jako relaci wp takovou, že α wp β, jestliže α = v 0 S i1 v 1 S i2 v 2... v r 1 S ir v r, r > 0, β = v 0f i1 v 1f i2 v 2... v r 1f ir v r pro A ik = (S ik, F ik ), f ik F ik, 1 k r, {i 1,..., i r } {1,..., n}, i k i m pro všechna k m, 1 k, m r, pro všechny symboly S V označme t S počet agentů přepisujících symbol S; potom r Eval(S ij = S) = min ( α S, t S ) (1) j=1 kde funkce Eval() vrací 1 právě tehdy, když platí S ij = S; součet na levé straně rovnice představuje počet výskytů symbolu S zpracovaných agenty v daném kroku odvození (pracují všichni agenti, kteří mohou pracovat), v k v k, v k V, 0 k r je krok odvození v 0L schématu E. Výpočet v eko-kolonii končí tehdy, když žádný agent nemůže pracovat, výstupem (výsledkem činnosti ekokolonie) je stav prostředí. 2.2 P kolonie P kolonie jsou biologicky motivovaný matematický model vycházející z membránových systémů (P systémů) používajících pouze jednu membránu s prvky gramatických systémů. V prostředí, které je statické (bez vlastního vývoje), se nacházejí agenti jednoduché membránové systémy s vlastním stavem a několika sadami pravidel, kterým říkáme programy. Stav prostředí není řetězec, ale multimnožina, totéž platí o stavech agentů. Stavy agentů obsahují vždy přesně daný počet prvků, tento počet se během výpočtu nemění. Interakce s prostředím je obousměrná existují komunikační pravidla sloužící k výměně objektů mezi stavem daného agenta a stavem prostředí, nicméně aktivita je pouze na straně agenta. 192

193 Definice 3 (P kolonie) P kolonie s kapacitou k je struktura Π = (A, e, f, V E, B 1,..., B n ), kde A je neprázdná konečná abeceda, e A je základní (environmentální) objekt, f A je finální objekt, V E (A e) o je počáteční stav prostředí, B i = (O i, P i ) je i-tý agent, 1 i n, kde O i je multimnožina nad A, představuje stav agenta, platí O i = k, P i = {p i,1, p i,2,..., pi, r i } je konečná sada programů agenta, každý program obsahuje právě k pravidel v této formě: a b evoluční pravidla, c d komunikační pravidla, p 1 /p 2, kde p 1, p 2 jsou evoluční nebo komunikační pravidla kontrolní pravidla. Počáteční konfigurace se skládá z počátečního stavu prostředí a počátečních stavů jednotlivých agentů. Agenti v P kolonii mohou pracovat sekvenčně nebo paralelně, my se přidržíme paralelního způsobu práce (v jednom kroku pracují všichni agenti, kteří mohou pracovat, v podobném smyslu jako v módu wp popsaném výše pro eko-kolonii). Vlastnost prostředí V E agenti B = (O, P ) pravidla agentů přednost činnost agentů výstup P kolonie statické, stav je multimnožina mají stav, několik typů pravidel vč. komunikace s prostředím, ovlivňují prostředí v závislosti na svém stavu a b, a O (evoluční) c d, c O, d V E (komunikační) p 1 /p 2, kde p 1, p 2 jsou evoluční nebo komunikační pravidla (kontrolní) agenti mají přednost, prostředí se nevyvíjí sekvenční i paralelní číslo četnost prvků f v prostředí Tab. 2: Souhrn vlastností P kolonií Agent může ovlivňovat stav prostředí svými komunikačními pravidly (pravidlo ve tvaru c d se aplikuje tak, že prvek c ve stavu agenta vyměníme s prvkem d ve stavu prostředí). Evoluční pravidla slouží pouze k vývoji samotného agenta. Kontrolní pravidla vnášejí do systému podmíněnost pokud nelze uplatnit první uvedené pravidlo, je použito druhé uvedené pravidlo. Každý agent má sadu programů (každý agent může mít jiný počet programů), v jednom kroku odvození lze použít jen jeden program. V každém programu je právě k pravidel (kde číslo k nazýváme kapacitou P kolonie, určuje i počet prvků ve stavu agenta) a program je proveden tehdy, pokud jsou všechna jeho pravidla aplikovatelná (a všechna pravidla programu jsou aplikována paralelně). Výpočet končí tehdy, když žádný agent nemůže pracovat, výstupem je počet prvků f v prostředí. 2.3 Eko-P kolonie Eko-P kolonie byly inspirovány P koloniemi s těmito změnami: prostředí se vyvíjí, je to 0L schéma, kapacita k je vždy 2, je definován jiný typ pravidel generující (insertion) a konzumující (delation). Počítá se pouze s paralelní činností agentů. Definice 4 (Eko-P kolonie) Eko-P kolonie je struktura Π = (A, e, f, V E, D E, B 1,..., B n ), kde A je neprázdná konečná abeceda, e A je základní (environmentální) objekt, f A je finální objekt, V E (A e) o je počáteční stav prostředí, D E je 0L schéma (A, P E ), kde P E je množina bezkontextových pravidel, B i = (O i, P i ) je i-tý agent, 1 i n, kde O i je multimnožina nad A, představuje stav agenta, platí O i = 2, P i = {p i,1, p i,2,..., pi, r i } je konečná sada programů agenta, každý program je jednoho z těchto typů: a bc, d out generující (insertion) pravidla, ab c, d in konzumující (delation) pravidla. Počáteční konfigurace se skládá z počátečního stavu prostředí a počátečních stavů jednotlivých agentů. V původním pojetí existují v eko-p kolonii dva typy agentů agenti generující (obsahující pouze první typ programů) a agenti konzumující (obsahující pouze druhý typ programů). V tomto článku se přidržíme volnější definice, kdy agent může mít oba typy programů, nebudeme trvat na separaci agentů podle kompetencí. Eko-P kolonie nás zde zajímají mnohem více než klasické P kolonie, a to nejen vzhledem k možnosti vývoje prostředí. 193

194 Vlastnost prostředí agenti B = (O, P ) pravidla agentů přednost činnost agentů výstup Eko-P kolonie dynamické, stav je multimnožina, ale chová se jako 0L systém mají stav, dva typy pravidel, ovlivňují prostředí v závislosti na svém stavu a bc, d out, a, d O (generující) ab c, d in, a, b O, d V E (konzumující) agenti mají přednost před vývojem prostředí paralelní číslo četnost prvků f v prostředí Tab. 3: Souhrn vlastností eko-p kolonií 3 Eko-kolonie vs. P kolonie Eko-kolonie a P kolonie pojímají prostředí každá jinak. V obou případech do prostředí zasahují agenti, ale v ekokoloniích se prostředí dynamicky vyvíjí, kdežto v P koloniích je statické. Navíc celkové pojetí prostředí je odlišné v eko-koloniích se jedná o řetězec s přiřazeným 0L schématem určujícím jeho vývoj, v P koloniích je prostředí multimnožinou, ve které nebereme v úvahu pořadí prvků. Z toho důvodu jsou pravidla agentů P kolonie velmi jednoduchá, zpracovávají vždy jen jeden objekt (ať už svůj nebo v prostředí), a pokud generují, pak opět jen jeden objekt. Naproti tomu pravidla agentů eko-kolonie generují obecně řetězec, jehož prvky jsou vázány svým pořadím, v prostředí je tento řetězec zařazen na konkrétní místo v prostředí, které je taktéž striktně určeno. Do jaké míry lze srovnat, připodobnit a případně simulovat činnost agentů v prostředí eko-kolonií a P kolonií? Pokud odhlédneme od odlišnosti v chápání prostředí a výsledku výpočtu (řetězec vs. číslo), najdeme podobnost a základ pro simulaci v následujícím: vezměme ekokolonii Σ = (E, w 0, A 1,..., A n ), kde prostředí E = (V, P ) je statické, P obsahuje pouze pravidla typu a a, a V, agenti A i = (S i, F i ), 1 i n mají omezené vlastnosti, generují pouze slova o délce 1: F i = {f i,1,..., f i,ri }, f i,j (V S i ), 1 j r i. Sestrojíme P kolonii Π(Σ): agenti B i budou vytvořeni podle agentů A i tak, aby jejich činnost v prostředí byla obdobná, kapacita P kolonie bude 1, jednomu kroku činnosti původní eko-kolonie bude odpovídat dvojice kroků činnosti P kolonie, každý agent B i bude mít r i dvojic sad programů, pro každý dvojkrok bude vybrána jedna z těchto dvojic, jeden program z dvojice použije v lichém kroku činnosti P kolonie, druhý (k němu párový) v sudém kroku, počáteční stav prostředí přejmeme od eko-kolonie, počáteční stav agenta B i vytvořeného podle agenta A i = (S i, F i ) bude S i V. Celý postup převodu je popsán v algoritmu 1. Algoritmus 1: Eko-kolonie P kolonie Vstup: Σ = (E, w 0, A 1,..., A n ) prostředí E = (V, P ), statické, agenti A i = (S i, F i ), F i = {f i,1,..., f i,ri }, f i,j (V S i ), 1 j r i, počáteční konfigurace je w 0 V, označme w 0 = d Výstup: Π(Σ) = (A, e, f, V E, B 1,..., B n ) agenti B i = (O i, P i ), počáteční konfigurace je (V E, O 1,..., O n ), kapacita P kolonie je k = 1 Prostředí: Abeceda: A = V {e, f} V E = 1 j d a j, kde w 0 = a 1,..., a d end Agenti: B i = (O i, P i ), 1 i n O i = S i (kapacita je 1) P i sestrojíme podle F i = {f i,1,..., f i,ri }: P i = 1 j r i {p i,ja, p i,jb }, kde for j pro 1 j r i do p i,ja = S i f i,j p i,jb = f i,j S i /f i,j S i end end Nastiňme si, jakým způsobem bude simulováno použití pravidla S i f i,j agenta A i z eko-kolonie prostřednictvím agenta B i v P kolonii. Podle algoritmu 1 je pravidlo agenta B i pro lichý krok S i f i,j, to znamená, že agent změní svůj vlastní stav z S i na některý z objektů, které sám může generovat (z množiny F i ), čímž nedeterministicky vybere některé z pravidel původního agenta A i z eko-kolonie. V dalším kroku nastane jedna ze dvou situací v prostředí se buď vyskytuje nebo nevyskytuje symbol S i. Pokud se vyskytuje, použijeme komunikační pravidlo f i,j S i (konkrétní pravidlo původního agenta A i z ekokolonie bylo zvoleno v předchozím kroku), pokud ne, použijeme evoluční pravidlo f i,j S i. V prvním případě jsme zajistili přepis symbolu S i v prostředí na symbol f i,j, přičemž stav agenta B i je nyní S i stejně jako před lichým krokem, v druhém případě jde u agenta jednoduše o návrat do původního stavu s tím, že k přepisu v prostředí nedošlo. 194

195 Kroky: lichý sudý Symbol S i je v prostředí: prostředí αs i β αs i β α f i,j β agent B i S i f i,j S i Symbol S i není v prostředí: prostředí α α α agent B i S i f i,j S i Tab. 4: Stav prostředí a agentů v P kolonii Nyní je třeba ukázat, že 1. agent B i v P kolonii pracuje právě tehdy, kdy pracuje agent A i v eko-kolonii, 2. v sudém kroku výpočtu volí právě takový program, který patří do páru k programu zvolenému v předchozím (lichém) kroku výpočtu. Počáteční stav agenta B i (pro některé i {1,..., n}) je S i. Pouze program s pravidlem S i f i,j pro některé i {1,..., r i } je možné v tomto stavu provést, tedy každý agent (bez ohledu na to, zda se symbol S i v prostředí vyskytuje) v prvním kroku provede takové pravidlo. Po prvním kroku je stav agenta f i,j. V druhém kroku výpočtu je tento agent nucen zvolit pravidlo podle svého stavu, což je právě jedno z pravidel v programu f i,j S i /f i,j S i. První (komunikační) má přednost, a tedy pokud se v prostředí vyskytuje symbol S i, bude provedeno (čímž je simulována činnost agenta A i z eko-kolonie). Druhé se provede tehdy, když první není možno aplikovat, což také odpovídá činnosti (resp. ve finále nečinnosti) agenta eko-kolonie v dané situaci při použití paralelního módu přepisování. V druhém kroku výpočtu nemůže být zvolen jiný program než párový k programu z předchozího kroku, protože zpracovává symbol f i,j v prostředí agenta, žádné jiné pravidlo tento symbol nezpracovává. Z toho také vyplývá, že liché a sudé kroky se nemohou míchat. Průběh výpočtu ve vytvořené P kolonii odpovídá průběhu výpočtu v (poněkud osekané) původní eko-kolonii se statickým prostředím a s agenty generujícími řetězce o délce 1, přičemž každému kroku v eko-kolonii odpovídají dva kroky v P kolonii. Nyní se zaměřme na ukončení výpočtu. V eko-kolonii výpočet končí tehdy, když žádný agent nemůže pracovat, v P kolonii by mělo platit totéž. Zde nastává problém každý agent B i ve skutečnosti může pracovat kdykoliv, a pokud v prostředí nenajde svůj symbol S i, bude v nekonečné smyčce jednoduše používat programy S i f i,j,... /f i,j S i pro některá j {1,..., r i }. V důsledku jsme tedy schopni simulovat alespoň činnost zjednodušené eko-kolonie P kolonií, což nám vzhledem k zaměření na prostředí systému stačí. 4 Eko-kolonie vs. eko-p kolonie Už podle definice se mezi eko-koloniemi a eko-p koloniemi dal očekávat bližší vztah než v předchozím srovnání, což se potvrdilo, třebaže oba modely vznikly na sobě zcela nezávisle a jsou jinak poměrně rozdílné. V obou případech máme dynamické prostředí, tedy prostředí není ovlivňováno pouze agenty. Nicméně odlišností je zde také dostatek, víceméně všechny odlišnosti (kromě role prostředí) můžeme přejmout z předchozí kapitoly. Pravidla agentů eko-p kolonie jsou sice jiná než u P kolonií, ovšem pravidlům eko-kolonií se neblíží. Přesto už možnost vývoje prostředí nám pomůže k tomu, abychom mohli při přechodu z eko-kolonie k eko- P kolonii implementovat plně definované agenty (jejich množiny F i již mohou obsahovat různě dlouhé řetězce, nikoliv pouze symboly). Vezměme eko-kolonii Σ = (E, w 0, A 1,..., A n ) s n agenty, kde prostředí E = (V, P ) je dynamické, jedná se o 0L schéma, agenti A i = (S i, F i ), 1 i n generují slova svých jazyků pravidly F i = {f i,1,..., f i,ri }, f i,j (V S i ), 1 j r i. Sestrojíme eko-p kolonii Π(Σ): agenti B i budou vytvořeni podle agentů A i tak, aby jejich činnost v prostředí byla obdobná, jednomu kroku činnosti původní eko-kolonie bude odpovídat trojice kroků činnosti eko-p kolonie, každý agent B i bude mít r i trojic sad programů, pro každý trojkrok bude vybrána jedna z těchto trojic (ve skutečnosti třetí program v každé sadě bude vždy stejný, jeho úkolem bude vrátit agenta do startovacího stavu, takže celkový počet programů agenta B i je 2 r i + 1), činnost agentů A i eko-kolonie bude částečně suplovat prostředí agent pouze pošle prostředí informaci, které pravidlo původního agenta A i (resp. jeho provedení) má být simulováno, a to symbolem [i, j] (i-tý agent, jeho j-té pravidlo), prostředí zajistí přepis tohoto symbolu na řetězec f i,j (tím obejdeme omezení, dle kterého agent může generovat vždy jen jeden symbol), počáteční stav prostředí přejmeme od eko-kolonie, počáteční stav agenta B i vytvořeného podle agenta A i = (S i, F i ) bude S i X. Celý postup převodu je popsán v algoritmu 2. Krok výpočtu eko-kolonie je v eko-p kolonii simulován posloupností tří kroků. Ukážeme, že v prvním z této trojice kroků pracují právě ti agenti B i, jejichž symbol S i se nachází v prostředí, přičemž tento symbol již nebyl zabrán jiným agentem, 195

196 Kroky: první druhý třetí Symbol S i je v prostředí: prostředí αs i β α S i β α [i, j]β γf i,j δ agent B i S i X S i [i, j] S i f S i X Symbol S i není v prostředí: prostředí αβ α β α β γδ agent B i S i X S i X S i X S i X Tab. 5: Stav prostředí a agentů v eko-p kolonii v druhém a třetím kroku pracují právě ti agenti, kteří pracovali v prvním kroku, Algoritmus 2: Eko-kolonie eko-p kolonie Vstup: Σ = (E, w 0, A 1,..., A n ) prostředí E = (V, P ) je 0L schéma, agenti A i = (S i, F i ), F i = {f i,1,..., f i,ri }, f i,j (V S i ), 1 j r i, počáteční konfigurace je w 0 V, označme w 0 = d Výstup: Π(Σ) = (A, e, f, V E, D E, B 1,..., B n ) agenti B i = (O i, P i ), počáteční konfigurace je (V E, O 1,..., O n ) Prostředí: A = V {e, f, X} {a, a ; a V } {[i, j] ; 1 i n, 1 j r i } V E = 1 j d a j, kde w 0 = a 1,..., a d, D E = (A {X}, P E ), kde P E = {a a, a a, a β ; kde (a β) P E } {f f} {e e} {[i, j] f i,j ; 1 i n, f i,j F i } end Agenti: B i = (O i, P i ), 1 i n O i = S i X P i sestrojíme podle ( F i = {f i,1,..., f i,ri }: ) P i = {p i,c } 1 j r {p i i,ja, p i,jb }, kde for j pro 1 j r i do p i,ja = S i X [i, j], S i in p i,jb = S i S i f, [i, j] out end p i,c = S i S i X, f out end jeden krok vývoje prostředí eko-kolonie odpovídá třem krokům vývoje prostředí v eko-p kolonii, přičemž je zachován koncept přednosti agentů před vývojem prostředí. Popíšeme, jak se chovají jednotliví agenti, a jak reaguje prostředí. Vezměme některého agenta B i, 1 i n: Krok 1. Mohou pracovat jen ti agenti, kteří v prostředí najdou volný ten prvek, který dokážou zpracovat, tedy S i. Agent B i nedeterministicky vybere některý z prvků původní množiny F i a zároveň si z prostředí vyzvedne jeden symbol S i, a to použitím programu S i X [i, j], S i in. Důsledkem je změna stavu agenta z S i X na S i [i, j]. Agent, který v prostředí nenajde symbol S i, v tomto kroku nepracuje, protože programy typu p i,ja (podle algoritmu 2) nejsou aplikovatelné v prostředí není žádný výskyt symbolu S i, programy typu p i,jb nejsou aplikovatelné ve stavu agenta není symbol [i, j], který by měl být takovým programem distribuován do prostředí, program p i,c nené aplikovatelný ve stavu agenta není symbol f, který by měl být distribuován do prostředí. Prostředí samotné se v tomto kroku vyvíjí podle pravidel typu a a, poněvadž se v jeho stavu nacházejí jen symboly původní abecedy a V. Po provedení tohoto kroku najdeme v prostředí pouze symboly a, a V. Krok 2. Agent B i, který pracoval v předchozím kroku, je nyní ve stavu S i [i, j]. Jediný aplikovatelný program je S i S i f, [i, j] out pro konkrétní hodnotu indexu j {1,..., r i } (p i,ja nejsou aplikovatelné, protože v prostředí není S i, p i,c není aplikovatelný, protože ve stavu agenta není f). Stav agenta se změní na S i f, do prostředí je distribuován symbol [i, j]. Pokud agent B i v předchozím kroku nepracoval, nebude pracovat ani v tomto kroku, protože jeho stav zůstává S i X a zároveň (pro jednotlivé typy programů): 196

197 p i,ja nejsou aplikovatelné v prostředí není žádný výskyt symbolu S i (jsou tam pouze symboly a pro a V, případně symboly f a e), p i,jb nejsou aplikovatelné ve stavu agenta není symbol [i, j] pro žádné j {1,..., r i }, přičemž pravidla p i,jb takový symbol transportují do prostředí, p i,c není aplikovatelný ve stavu agenta není symbol f, který toto pravidlo transportuje do prostředí. V prostředí jsou nyní pouze čárkované symboly (a případně symboly e a f), tedy provádí přepisy podle pravidel a a. Po provedení tohoto kroku jsou v prostředí symboly a, a V a dále symboly typu [i, j] distribuované do prostředí aktivními agenty. Krok 3. Agent B i, který pracoval v předchozím kroku, je nyní ve stavu S i f. Jediný aplikovatelný program je S i S i X, f out (protože v prostředí není S i, ve stavu agenta není [i, j]). Stav agenta se změní na S i X, do prostředí je distribuován symbol f. Pokud agent B i v předchozím kroku nepracoval, nebude pracovat ani v tomto kroku, protože jeho stav zůstává S i X a zároveň (pro jednotlivé typy programů): p i,ja nejsou aplikovatelné v prostředí není žádný výskyt symbolu S i, p i,jb nejsou aplikovatelné ve stavu agenta není žádný symbol [i, j], p i,c není aplikovatelný ve stavu agenta není symbol f. Prostředí reaguje takto: symboly a jsou zpracovány pravidly a β (simulují činnost prostředí eko-kolonie), symboly typu [i, j] jsou zpracovány příslušnými pravidly [i, j] f i,j, čímž prostředí spolupracuje na simulaci činnosti agentů A i z eko-kolonie. Prostředí je teď ve stavu odpovídajícím stavu prostředí eko-kolonie po provedení jednoho kroku, až na pořadí prvků. Navíc se zde za každého pracujícího agenta objevil symbol f. Je zřejmé, že průběh výpočtu ve vytvořené eko-p kolonii odpovídá průběhu výpočtu v původní eko-kolonii, s trojnásobným počtem kroků, čemuž je přizpůsoben i vývoj prostředí. Dále se zaměříme na ukončení činnosti eko-p kolonie. Sledujme nyní výpočet v původní eko-kolonii. Pokud žádný agent A i nemůže pracovat (v prostředí neexistují symboly, které mají zpracovat), pak v ekvivalentním výpočtu v eko-p kolonii se po daném počtu trojic kroků dostáváme do stejné situace žádný agent B i nemůže pracovat, protože v prostředí nejsou žádné symboly S i (programy p i,ja ), ve stavech agentů nejsou symboly [i, j] (programy p i,jb ) a ve stavech agentů není ani symbol f (program p i,c ). Proto se také činnost eko-p kolonie zastaví. Výsledkem výpočtu v eko-p kolonii je počet symbolů f v prostředí po provedení posledního kroku výpočtu. V našem případě každý pracující agent transportoval jeden symbol f do prostředí vždy v posledním z trojice kroků simulujících krok činnosti agenta eko-kolonie. V každé trojici kroků do prostředí přibylo tolik symbolů f, kolik agentů v této trojici pracovalo. Po posledním kroku je tedy v prostředí maximálně tolik symbolů f, kolik bylo provedeno trojic kroků vynásobeno počtem agentů eko-p kolonie (v algoritmu číslo n). 5 Závěr Jak bylo zdůrazněno v Úvodu, cílem tohoto příspěvku není srovnávat výpočetní sílu diskutovaných modelů, zabývali jsme se pouze srovnáním činnosti agentů v jejich prostředí. Zatímco agenti v eko-kolonii jsou (záměrně) velmi jednoduše konstruováni, nemají žádný vnitřní stav, pouze ovlivňují prostředí (s tím, že nedokážou vygenerovat svůj vlastní startovací symbol) a působení je tedy pouze jednosměrné, v P koloniích a eko-p koloniích jsou agenti poněkud sofistikovanější mají svůj vnitřní stav a s prostředím se vzájemně ovlivňují působením pravidel několika typů. Eko-kolonie mají kromě toho s eko-p koloniemi společnou další vlastnost prostředí s vlastním vývojem. V článku jsou uvedeny dva algoritmy jeden nastiňující rozdíl ve vztahu agentů a prostředí u eko-kolonií a P kolonií, druhý pro totéž u eko-kolonií a eko-p kolonií. První uvedený algoritmus produkuje P kolonii, jejíž výpočet nikdy nekončí (protože v každém kroku pracují vždy všichni agenti po ukončení simulace činnosti agentů původní eko-kolonie agenti provádějí pouze udržovací kroky, nicméně je provádějí a výpočet tudíž nemůže být ukončen. Navíc je na vstupu algoritmu pouze silně zjednodušená eko-kolonie se statickým prostředím a agenty, kteří generují pouze jednoznakové řetězce. Tento algoritmus lze proto brát pouze jako studii srovnání vlivu agentů na prostředí. Druhý algoritmus je již funkční i ve smyslu ukončení výpočtu. Na vstupu algoritmu může být jakákoliv ekokolonie, výstupem je eko-p kolonie simulující činnost agentů v prostředí podle eko-kolonie na vstupu. Délka výpočtu je trojnásobná oproti původní eko-kolonii, aktivní (pracující) agenti navíc v prostředí generují symboly f. Prostředí výsledné eko-p kolonie se vyvíjí stejně jako v eko-kolonii, navíc vyrovnává určitý handicap agentů agenti eko-p kolonie pracují pouze s jednotlivými symboly, nikoliv s řetězci, tedy oni sami do prostředí netransportují řetězce, pouze prostředí sdělí pomocí symbolů typu [i, j], jaký řetězec má vytvořit. Z tohoto pohledu můžeme říci, že eko-p kolonie jsou (co se týče činnosti agentů v prostředí a samotného pro- 197

198 středí) eko-koloniím blíže, a to nejen díky možnosti vývoje prostředí. Za úvahu by stálo, jak by srovnání dopadlo, pokud bychom v P kolonii přidali prostředí možnost vlastního vývoje a zároveň bychom nechali původní typy pravidel (evoluční, komunikační, kontrolní) a neomezovali kapacitu na hodnotu 2. Poděkování Tento příspěvek vznikl ve spojitosti s projektem IT4Innovations Centre of Excellence, reg. no. CZ.1.05/1.1.00/ Literatura Cienciala, L. (2015). Membránové agenty: O variantách P kolonií. Slezská univerzita v Opavě. Cienciala, L. a Ciencialová, L. (2011). P colonies and their extensions. V Computation, Cooperation, and Life Essays Dedicated to Gheorghe Paun on the Occasion of His 60th Birthday, str , Berlin Heidelberg. Springer-Verlag. Kelemen, J. a Kelemenová, A. (1992). A grammartheoretic treatment of multiagent systems. Cybern. Syst., 23(6): Kelemen, J. a Kelemenová, A. (2005). On P colonies, a biochemically inspired model of computation. Proc. of the 6th International Symposium of Hungarian Researchers on Computational Intelligence, str Kelemenová, A. a Vavrečková, S. (2011). Generative power of eco-colonies. V Computation, Cooperation, and Life Essays Dedicated to Gheorghe Paun on the Occasion of His 60th Birthday, str , Berlin Heidelberg. Springer-Verlag. Păun, G. (2000). Computing with membranes. Journal of Computer and System Sciences, 61(1): Vavrečková, Š. (2005). Eko-kolonie. Kognice a umělý život sborník konference, str

199 .

200 Register autorov A Andrejková, Gabriela B Ballová Mikušková, Eva Bečev, Ondřej Budáč, Stanislav Budinská, Ivana C Chmelík, Jiří Cimrová, Barbora , 167 Č Čavojová, Vladimíra Čeněk, Jiří D Dillinger, Viliam Dudeková, Katarína , 85 F Farkaš, Igor , 151 H Herman, Lukáš Hoffmann, Matěj J Jurkovič, Marek Juřík, Vojtěch K Kamhal, Dezider Knott, Alistair Kohút, Zdenko , 167 Konůpka, Jaromír Konečný, Matúš Kostovičová, Lenka , 85 Kozlíková, Barbora Kundlová, Veronika Kuzma, Tomáš Kůrková, Věra Kvasnička, Vladimír L Langer, Miroslav Lúčny, Andrej M Majerník, Martin Malinovský, Ľudovít Mamula, Lukáš N Nahodil, Pavel O Oravec, Jozef Otáhal, Marek P Petrovič, Pavel Porubcová, Natália R Rebrová, Kristína Riečanský, Igor Roháriková, Veronika Rosipal, Roman Rückschloss, Lukáš Rybár, Ján S Sedláček, Matej Sosík, Petr Stachoň, Zdeněk Svoboda, Aleš

201 Š Šašinka, Čeněk , 61 Špajdel, Marián Špriňarová, Kateřina Štepánová, Karla Štěrba, Zbyněk T Takáč, Martin U Urbánek, Tomáš V Vavrečka, Michal Vavrečková, Šárka Vítků, Jaroslav , 185