FORUM STATISTICUM SLOVACUM

Size: px
Start display at page:

Download "FORUM STATISTICUM SLOVACUM"

Transcription

1 7/2011 FORUM STATISTICUM SLOVACUM ISSN

2 Slovenská štatistická a demografická spoločnosť Miletičova Bratislava Naše najbližšie akcie: (pozri tiež blok Organizované akcie) 3. MedStat Ružomberok Pohľady na ekonomiku Slovenska Aula Ekonomickej univerzity v Bratislave 5. Nitrianske štatistické dni UKF Nitra 26. škola štatistiky Ekomstat Trenčianske Teplice 16. Slovenská štatistická konferencia jún 2012 Šachtičky Banskobystrický kraj Aplikácie metód na podporu rozhodovania vo vedeckej technickej a spoločenskej praxi INOVÁCIE STU Bratislava 21. Medzinárodný seminár Výpočtová štatistika Infostat Bratislava Prehliadka prác mladých štatistikov a demografov Infostat Bratislava Slávnostná konferencia ku 45. výročiu založenia SŠDS 21. marec 2013 Sládkovičovo 14. Slovenská demografická konferencia marec 2013 Sládkovičovo Regionálne akcie priebežne

3 ÚVOD FORUM STATISTICUM SLOVACUM 7/ Vážené kolegyne vážení kolegovia siedme číslo siedmeho ročníka vedeckého recenzovaného časopisu Slovenskej štatistickej a demografickej spoločnosti (SŠDS) je zostavené z príspevkov ktoré sú obsahovo orientované v súlade s tematikou 20. ročníka medzinárodného seminára Výpočtová štatistika 2011 a Prehliadkou prác mladých štatistikov a demografov. Tieto akcie sa uskutočnili v dňoch 1. a 2. decembra 2011 na Infostate v Bratislave. Organizátorom seminára a prehliadky bola SŠDS v spolupráci s Fakultou managementu UK v Bratislave Infostatom SAS Slovakia s.r.o. a klubom Dispersus. Akcie z poverenia výboru SŠDS zorganizoval organizačný a programový výbor v zložení: Ing. Iveta Stankovičová PhD. - predseda RNDr. Ján Luha CSc. podpredseda doc. Ing. Jozef Chajdiak CSc. prof. RNDr. Beáta Stehlíková CSc. doc. RNDr. Bohdan Linda CSc. doc. Dr. Jana Kubanová CSc. Ing. Mária Kanderová PhD. doc. Ing. Vladimír Úradníček PhD. RNDr. Samuel Koróny PhD. Ing. Tomáš Želinský PhD. Mgr. Lukáš Pastorek. V spolupráci s klubom Dispersus pri Prehliadke prác mladých štatistikov a demografov bolo zorganizované 2. decembra 2011 aj interdisciplinárne pásmo prednášok prezentátorov zo súkromnej štátnej i akademickej sféry pod názvom: Pohľady do analytiky - Analytika očami profesionálov. Na príprave a zostavení tohto čísla participovali: RNDr. Ján Luha CSc. Ing. Iveta Stankovičová PhD. a doc. Ing. Jozef Chajdiak CSc.. Recenziu príspevkov zabezpečili: RNDr. Ján Luha CSc. Ing. Iveta Stankovičová PhD. doc. Ing. Jozef Chajdiak CSc. RNDr. Samuel Koróny PhD. Ing. Tomáš Želinský PhD. a doc. RNDr. Michal Greguš PhD.. Veľmi nás teší neustály záujem o seminár Výpočtová štatistika. Výbor SŠDS oceňuje aktivitu mladých v rámci Prehliadky prác mladých štatistikov a demografov čo svedčí tiež o dobrej práci pedagógov a ich študentov. Dúfame že možnosť prezentácie príspevkov na tomto podujatí sa podieľa na zvyšovaní odbornej úrovne mladých štatistikov a demografov. Výbor SŠDS

4 2 FORUM STATISTICUM SLOVACUM 7/2011 Konkurencieschopnosť neinovujúcich a inovujúcich firiem v marketingových inováciách Competitiveness non-innovating and innovating firms in marketing innovations Tatiana Arbe Abstract: Article is focused on the analysis of the marketing innovations effectiveness and comparison competitiveness non-innovating and innovating firms in marketing innovations Key words: marketing innovation productivity sales. Kľúčové slová: marketingové inovácie produktivita práce tržby. JEL classification: C1 O31 O Úvod Príspevok sa venuje analýze vplyvu realizácie resp. nerealizácie marketingových inovácií na konkurencieschopnosť podnikov. Zdrojom východiskových údajov bolo štatistické zisťovanie o inováciách za rok 2008 (CIS 2008) ktoré realizoval Štatistický úrad SR. ŠÚ SR vykonáva štatistické zisťovania za účelom posúdenia stavu a vývoja ekonomiky a spoločnosti Slovenskej republiky. Výsledky sa využívajú i pre medzinárodné porovnávania. Toto zisťovanie bolo súčasťou Programu štátnych štatistických zisťovaní schváleného na roky vydaného v Zbierke zákonov SR. Výkaz Inov 1-99 Štatistické zisťovanie o inováciách za rok 2008 obsahuje modul 657 marketingové inovácie. 2. Analýza firiem využívajúcich a nevyužívajúcich marketingové inovácie Za marketingovú inováciu sa považujú i nové metódy rozmiestnenia produktov či predajných kanálov napr. prvé použitie koncesií a distribučných licencií priameho predaja zavedenie výhradne maloobchodného podnikania nových koncepcií na prezentáciu produktov atď. Patria sem i nové metódy ocenenia produktov a služieb prvé použitie variabilnej cenotvorby podľa dopytu rôzne diskontné systémy atď. Podniky zároveň v danom štatistickom zisťovaní ohodnocovali aký významný bol vplyv ich marketingových inovácií na rast či udržanie si ich trhového podielu pre uvedenie svojich produktov k novým skupinám zákazníkov či na uvedenie svojich produktov na nové zemepisné trhy. Pri vyplňovaní výkazu Inov 99 spravodajské jednotky odpovedali na otázky či v rokoch realizovali významné zmeny dizajnu či obalu výrobkov a služieb či použili nové médiá alebo techniky pre propagáciu produktov prvý krát použili nové reklamné médium nový štýl značky zaviedli vernostné karty. Všimnime si minimum a maximum tržieb i minimum a maximum zamestnancov vo firmách. Porovnáme percentuálne podiely inovujúcich a neinovujúcich podnikov s ich podielmi na počte zamestnancov a podielmi na tržbách. Budeme analyzovať vzťah inovácií k priemernému počtu zamestnancov na firmu schopnosť vytvárať pracovné miesta k priemerným tržbám a k produktivite práce firiem vyjadrenej ako pomer tržieb a počtu zamestnancov firmy. Z firiem sa k realizácii akejkoľvek marketingovej inovácie v rokoch priznalo firiem (2091%) podnikov (7909%) žiadnu marketingovú inováciu nezaviedlo vo svojej činnosti.

5 FORUM STATISTICUM SLOVACUM 7/ Porovnajme najprv tieto percentá inovujúcich a neinovujúcich svoje marketingové činnosti s percentuálnym podielom ich tržieb a potom i zamestnancov. 2091% firiem s marketingovými inováciami dosahuje 3876% všetkých tržieb a zamestnáva 31% zamestnancov. V podnikoch neinovujúcich svoje marketingové metódy tieto čísla vyzerajú nasledovne: predstavujú 791% firiem dosahujú len 6124% podiel na tržbách zamestnávajú 69% zamestnancov. Ak porovnáme priemerné tržby na firmu vidíme že u inovujúcich podnikov dosahujú tieto úroveň a u neinovujúcich Pričom absolútny rozdiel medzi nimi je v prospech inovujúcich firiem. Zaujímavé je porovnať aj minimum tržieb v inovujúcich a 10 v neinovujúcich podnikoch. Ale maximum tržieb dosiahla vyššie neinovujúca firma ( ). Minimálny počet zamestnancov je v oboch skupinách rovnaký maximálny počet zamestnancov sa dosiahol v neinovujúcich firmách. Tab.1 Marketingové inovácie Údaje Firmy inovujúce neinovujúce Počet firiem % firiem 209% 791% Úhrn tržieb % tržieb Tržby na firmu Minimum tržieb Maximum tržieb Počet zamestnancov spolu % zamestnancov 310% 690% Počet zamestnancov na firmu Minimálny počet zamestnancov Maximálny počet zamestnancov Produktivita práce - Q/Z Napokon porovnajme údaje o produktivite práce v oboch skupinách podnikov. Produktivitu práce sme vyjadrili ako podiel vážených tržieb a váženého počtu zamestnancov a dosiahli sme hodnoty 5020 na 1 zamestnanca v inovujúcich a 3570 na 1 zamestnanca v neinovujúcich firmách čo predstavuje rozdiel na zamestnanca v prospech inovujúcich firiem a teda aj ich lepšiu pozíciu v konkurenčnom boji. 3. Marketingové inovácie tržby a počet zamestnancov Obr.1 graficky vyjadruje vzťah tržieb a počtu zamestnancov kosoštvorce označujú podniky ktoré realizovali marketingové inovácie štvorce podniky bez organizačných inovácií v rokoch Závislosť tržieb od počtu zamestnancov aj vzhľadom na veľký diapazón oboch veličín bude potrebné ešte ďalej analyzovať napriek slabej závislosti čo ukazujú aj hodnoty koeficientu determínácie R 2 inovujúce podniky vykazujú vyšší nárast tržieb s rastom počtu zamestnancov.

6 4 FORUM STATISTICUM SLOVACUM 7/2011 obr.1 Marketingové inovácie závislosť tržieb od počtu zamestnancov 4. Marketingové inovácie - produktivita práce a počet zamestnancov Výsledky obr. 2 zachytávajú odpovede 2296 firiem na otázku: Realizovala Vaša firma v rokoch marketingové inovácie? Sledovali sme a ako sa ich ne/realizovanie prejavilo na vývoji produktivity práce. Kladne na danú otázku odpovedalo 209% firiem záporne 791% organizácií. V celom diapazóne skúmaných veličín produktivita práce a počet zamestnancov sa závislosť týchto veličín a aj prípadná rozdielnosť nepreukázala. Obr. 2 Marketingové inovácie - závislosť produktivity práce od počtu zamestnancov

7 FORUM STATISTICUM SLOVACUM 7/ Záver Základné parametre konkurencieschopnosti firiem ktoré aplikujú marketingové inovácié vyjadruje tabuľka 1. Produktivita práce je priemerne vyššia v inovujúcich firmách ako v neinovujúcich firmách. Skúmanie vzťahov rozličných veličín inovujúcich a neinovujúcich firiem si vyžaduje ďalšie skúnanie ako je naznačené v kapitolách 3 a 4. Z hľadiska inovačných cieľov marketingových inovácií za najdôležitejšie respondenti považujú zvýšenie alebo udržanie podielu na trhu. 6. Literatúra [1] CHAJDIAK JOZEF 2009: Štatistika v Exceli Bratislava: Statis 304 s. ISBN [2] NOVOTNÁ EDITA 2010: Meranie inovačných činností v Slovenskej: Republike In. Forum Statisticum Slovacum 2010/6 [3] ŠIMANOVSKÁ TATJANA 2010.: Vybrané metodologické problémy v oblasti inovácií. In. Forum Statisticum Slovacum 2010/3 [4] TRETIAK ONDREJ 2010: Ciele inovačných aktivít v Slovenskej Republike vo firmách v elektrotechnickom priemysle podľa výkazu Inov 1-99 za rok 2008 In. Forum Statisticum Slovacum 2010/6 [5] Výkaz Inov 1-99 ŠTATISTICKÉ ZISŤOVANIE O INOVÁCIÁCH za rok 2008 Adresa autora: Tatiana Arbe PhDr. ÚM STU - OEMP Bratislava tatiana.arbe@stuba.sk

8 6 FORUM STATISTICUM SLOVACUM 7/2011 Softvérová podpora na prognózovanie migrácie pracovných síl The software support for prediction of the labour migration Jana Bednáriková Abstract: The aim of this article is to present the survey of the available software programs which are suitable for prediction of the labour migration. Key words: prediction labour migration software programs Kľúčové slová: prognózovanie migrácia migrácia pracovných síl softvérové programy JEL classification: C88 D85 J61 1 Úvod Tento článok je venovaný prehľadu vybraných softvérových programov ktoré sú vhodné pre prognózovanie migrácie pracovných síl. V súčasnosti majú výskumníci k dispozícií viacero komerčných ale aj nekomerčných softvérových programov ktoré by mohli pri analýze súčasného a predikovaní budúceho stavu migrácie pracovných síl použiť. Pri ich výbere je však potrebné zvážiť niekoľko významných faktorov ktoré by mohli ovplyvniť výsledok prieskumu. Medzi tieto faktory patria okrem iných aj napr. dostupnosť finančných zdrojov technické vybavenie pracoviska rozsah údajovej základne zvolené metódy skúmania a analýzy. 2 Prehľad softvérových programov na predikciu migrácie pracovných síl Ponuka štatistických a matematických softvérových programov je v súčasnej dobe vo všeobecnosti bohatá. Tieto programy vznikli ako výsledok práce akademikov vysokých škôl alebo univerzít predovšetkým v zahraničí alebo ako výsledok práce podnikateľských subjektov pričom niektoré z nich vystupujú aj v úlohe sprostredkovateľa keď programy vytvorené na akademickej pôde ponúkajú ako konečným spotrebiteľom tak ostatným podnikateľským subjektom. V tomto prípade sa však zameriame na tie štatistické a matematické softvérové programy ktoré sú vhodné na predikciu migrácie pracovných síl. 2.1 Kritériá pre výber softvérových programov na prognózovanie migrácie pracovných síl Analýzu súčasného stavu migrácie a prognózu jej vývoja v nasledujúcich rokoch môžeme uskutočniť viacerými metódami akými sú regresná analýza analýza časových radov diferenčné rovnice alebo neurónové siete. Uvedené metódy sme si zvolili aj ako kritériá pre overenie vhodnosti použitia jednotlivých programov pre prognózovanie migrácie. Viacnásobnú lineárnu regresnú analýzu využila napríklad na modelovanie úrovne migrácie v krajoch Slovenska Kačšáková ktorá na jej výpočet použila programový balík SPSS a zvolením dvoch vysvetľujúcich premenných miery nezamestnanosti v kraji a jej celoslovenského priemeru a rozdielu HDP na obyvateľa v kraji a na Slovensku. Z výsledku jej práce vyplýva že obidve vysvetľujúce premenné mali v sledovanom období významný takmer až 90 %-tný vplyv na zmenu v úrovni migrácie. [1] Vhodnosť využitia diferenčných rovníc na modelovanie migrácie prezentoval vo svojej práci napr. Huťa ktorý na ich výpočet využil program Mathematica a pomocou sústavy lineárnych diferenčných rovníc prvého rádu vypočítal úroveň migrácie medzi mestami a dedinami Slovenska. [2] Modelovanie medzinárodnej migrácie pracovných síl na základe perceptronovej neurónovej siete s dvomi vstupnými neurónmi a jedným výstupným neurónom vysvetlil vo svojej štúdií Švarc na ktorej ukázal súvislosti medzi výberom cieľových miest migrácie. Výpočet bol uskutočnený

9 FORUM STATISTICUM SLOVACUM 7/ v prostredníctvom objektovo orientovaného programu využitím programovacieho jazyka C++. [3] Či už migrácia vo všeobecnosti alebo migrácia pracovných síl na národnej resp. medzinárodnej úrovni sa dá modelovať samozrejme aj inými metódami ako napr. Stehlíková a Stašková vo svojom príspevku modelovali migráciu v štátoch Európskej únie na úrovni NUTS 2 využitím analýzy priestorovej autokorelácie na základe ktorej dokázali že zahraniční imigranti sa majú tendenciu sa sťahovať aj do lokalít uvoľnených domácimi emigrantmi z čoho môžeme usudzovať že v takomto prípade nemusia zahraniční imigranti predstavovať konkurenciu pre domácu pracovnú silu. [4] 3 Prehľad vybraných softvérových programov pre prognózovanie migrácie pracovných síl Typov softvérových programov je veľa v závislosti od toho v akej oblasti majú byť použité. Pre predikciu migrácie sú relevantné štatistické a matematické softvérové programy. Porovnanie ich vlastností bolo limitované dostupnými údajmi ktoré výrobcovia resp. distribútori softvérov o jednotlivých programoch sprístupnili. Ťažiskom porovnávanie boli typy regresných analýz časových radov a neurónových sietí. 3.1 Matematické softvérové programy pre prognózovanie migrácie pracovných síl Tabuľka č. 2 predstavuje prehľad troch matematických programov ktoré sú vhodné na prognózovanie migrácie pracovných síl. Tabuľka 1 Prehľad matematických softvérových programov Názov programu AUTOGRAPH MATHEMATICA MAPLE Cena v EUR: akademik/trvalá licencia akademik/rok 3084 akademik/mesiac Free 2056* Distribútor EASTMOND Publishing Ltd. Wolfram Research Europe Ltd. Maplesoft Kompatibilita s OS Windows XP Vista alebo W. 7: áno áno áno Vlastnosti: 1D štatistika a pravdepodobnosti X X X Pravdepodobnostné rozdelenie X X X 2D Grafy X X X Diferenčné rovnice: Štandardné diferenčné rovnice Diferenčné rovnice prvého rádu X X X Lineárne diferenčné rovnice druhého rádu X X X Nelineárne diferenčné rovnice druhého rádu X X X Diferenčné rovnice vyššieho rádu X X Parciálne diferenčné rovnice Diferenčné rovnice prvého rádu X X Diferenčné rovnice druhého rádu X X Diferenčné-algebraické rovnice X X 3D Grafy X X X * poplatok za semester 1 študentský poplatok Zdroj: vlastné spracovanie.

10 8 FORUM STATISTICUM SLOVACUM 7/ Štatistické softvérové programy pre prognózovanie migrácie pracovných síl Tabuľka 2 predstavuje prehľad štatistických programových balíčkov ktoré je možné použiť na predikciu migrácie pracovných síl. Tabuľka 2 Prehľad štatistických softvérových programov 1 Zdroj: vlastné spracovanie na základe zdrojov [5] - [8].

11 FORUM STATISTICUM SLOVACUM 7/ V tabuľke 3 sú predstavené ďalšie štatistické programové balíčky ktoré sú vhodné na predikciu migrácie. Tabuľka 3 Prehľad štatistických softvérových programov 2 Zdroj: vlastné spracovanie na základe zdrojov [9] - [18] 3.3 Výsledok porovnania matematických a štatistických softvérových programov na predikciu migrácie pracovných síl Na základe porovnania matematických softvérových balíčkov nám môžeme usúdiť že všetky tri programy spĺňajú požiadavky na uskutočnenie prognózy migrácie pracovných síl prostredníctvom diferenčných rovníc. Ako z hľadiska ceny tak aj z hľadiska širokej ponuky typov diferenčných rovníc je podľa nášho názoru najprijateľnejší program Mathematica. Ponuka štatistických programov je v porovnaní s matematickými širšia. Programy sa líšili ako v šírke tak aj v hĺbke ponúkaných modelov a analýz. Po porovnaní všetkých

12 10 FORUM STATISTICUM SLOVACUM 7/2011 programov z hľadiska ich ceny a využiteľnosti jednotlivých vlastností pre našu problematiku sme usúdili že medzi najprijateľnejšie programy môžeme zaradiť programy: BMDP Eview RATS SAS a UNISTAT. Ak by sme chceli pokryť všetky nami zvolené metódy na predikciu migrácie pracovných síl t.j. regresnú analýzu diferenčné rovnice a neurónové siete prípadne časové rady potom za najvhodnejšiu kombináciu považujeme kombináciu programov Mathematica RATS a SAS. 4 Záver V súčasnosti existuje pomerne veľké množstvo softvérových riešení pre skúmanie analyzovanie a predikovanie migrácie resp. migrácie pracovných síl. Ich voľba závisí predovšetkým od metódy ktorou chceme migráciu analyzovať. V závislosti od náročnosti výskumného projektu si môže výskumník vybrať z dvoch základných typov softvérov a to komerčných spoplatnených a nekomerčných tzv. free softvérov. Hlavnou prednosťou komerčných programov je ich široký záber pretože výskumníkom ponúkajú výber z veľkého množstva analýz a modelov a ich hlavnou limitáciou sa stávajú dve oblasti. Prvou je technologická vybavenosť pracoviska tzn. kvalita výpočtovej techniky a druhou je oblasť finančných zdrojov nakoľko finančná čiastka potrebná na zakúpenie vo väčšine prípadov ročnej licencie na využívanie softvéru je značná. Čo sa týka nekomerčných substitútov ku komerčným programom tieto sa vyznačujú limitovaným výberom analýz a modelov s výrazne obmedzeným rozsahom skúmaných premenných jednoduchou grafikou a teda nižšou relevantnosťou výsledkov. Možnosť ich využitia sa preto znižuje so zvyšujúcou sa náročnosťou projektu na rozsah údajovej základne na počet skúmaných premenných atď. Literatúra [1] Kaščáková A Modelovanie úrovne migrácie v krajoch Slovenska v roku In: Forum Statisticum Slovakum. ISSN č. 3 s [2] Huťa A Modelovanie migrácie pomocou diferenčných rovníc. In: 10. Slovenská demografická konferencia. Naša demografia súčasnosť a perspektívy. Smolenice s [3] Švarc P Modeling migration using neural networks. IES Charles University in Prague. Praha: 2005 s. 14 [4] Stehlíková B. Stašáková S Migrácia v štátoch Európskej únie na úrovni NUTS 2. [online]. August [cit ]. Dostupné na internete: < [5] Scienceplus.nl.2011.Catalog.[online] [cit ]. Dostupné na internete: < [6] Statistical-solutions-software.com. Detailed-statistical-features-list.[onine]. November [cit ]. Dostupné na internete: < solutionssoftware.com/bmdp-statistical-software/detailed-statistical-features-list/> [7] vni.co.uk. 14th edition new features.[online] [cit ]. Dostupné na internete: < [8] ncss.com. NCSS procedures. [online] [cit ]. Dostupné na internete: < [9] Minitab.com. Minitab statistical software features. [online] [cit ]. Dostupné na internete: < SK/products/minitab/features/default.aspx>

13 FORUM STATISTICUM SLOVACUM 7/ [10] Estima.com. List of Rats features. [online] [cit ]. Dostupné na internete: < [11] Sas.com. Statistical analysis with SAS/STAT Software. Features. [online] [cit ]. Dostupné na internete: < [12] Econometric.com. SHASAM analytical features. [online] [cit ]. Dostupné na internete: < [14] Ibm.com. Neural networks features. [online] [cit ]. Dostupné na internete: < [15] Ibm.com. Statistic base features. [online] [cit ]. Dostupné na internete: < [16] Systat.com. Feature list. [online] [cit ]. Dostupné na internete: < [17] Unistat.com. Unistat products comparison table. [online] [cit ]. Dostupné na internete: < Adresa autora Jana Bednáriková Ing. Majerníková Bratislava

14 12 FORUM STATISTICUM SLOVACUM 7/2011 Komparácia časových radov zamestnanosti vo verejnom a súkromnom sektore štátov Vyšehradskej skupiny z hľadiska stupňa periodicity A comparison of time series of public sector and private sector employment in the states of the Visegrád Group as to their degree of periodicity Peter Bilka Martin Boďa Abstract: The article presented is an application of the method of measuring cyclicality (seasonality) of time series as proposed in a previous article of ours published in Forum Statisticum Slovacum No. 5/2011. The degrees of periodicity (cyclicality/seasonality) of the two time series that of public sector employment and that of private sector employment are compared for each member state of the Visegrád Group and it is found surprisingly as it seems that public sector employment manifests a noticeably higher degree of periodicity than private sector employment. Key words: degree of periodicity (cyclicality/seasonality) measure of periodicity public sector employment private sector employment Visegrád Group. Kľúčové slová: stupeň periodicity (cyklickosti/sezónnosti) miera periodicity zamestnanosť vo verejnom sektore zamestnanosť v súkromnom sektore Vyšehradská skupina. JEL classification: C19 E39 H Úvod V nedávnom článku K meraniu cyklickosti (sezónnosti) časových radov a jej regularity opublikovanom vo Forum Statisticum Slovacum č. 5/2011 sme navrhli intuitívny a ideovo jednoduchý postup na vyhodnocovanie stupňa periodicity časových radov a ich regularity (pozri Bilka a Boďa 2011). Navrhnutým postupom možno porovnávať rôzne časové rady z hľadiska prevahy prítomnosti periodického komponentu a jeho pravidelného správania. Súčasťou našej predchádzajúcej práce bola empirická demonštrácia navrhnutých ukazovateľov na časových radoch počtu zamestnancov verejného sektora a počtu zamestnancov súkromného sektora v Slovenskej republike za obdobie od 1998Q1 až po 2010Q4. Predložený príspevok je pokračovaním empirického skúmania prejavov periodicity v časových radoch počtu zamestnancov verejného sektora a počtu zamestnancov súkromného sektora v jednotlivých štátoch Vyšehradskej štvorky. V prvej časti príspevku sa stručne pripomenú základné východiská metodológie a v druhej aplikačnej časti budú vyhodnotené oba sledované časové rady za dostupné časové obdobie pre každý štát Vyšehradskej skupiny. 2. Expozícia do metodológie Máme k dispozícii nejakú konečnú diskretizovanú ekvidištančnú realizáciu x1 K xn stochastického procesu { X t t T } na indexnej množine T [0 ). Predpokladá sa že dáta generujúci stochastický proces X t je určovaný trendovým deterministickým komponentom T t periodickým (cyklickým/sezónnym) deterministickým komponentom C t a iregulárnym stochastickým komponentom ε t s aditívnym funkčným vzťahom tzn. platí X t = Tt + Ct + εt. Model s multiplikatívnou funkčnou väzbou X t = Tt Ct εt možno logaritmovaním previesť na aditívny model. V praxi zrejme nie je známy rozklad X t = Tt + Ct + εt ale je možné vhodnou dekompozičnou technikou (napr. použitím filtrov) získať odhad trendového komponentu T1ˆ K T ˆ n

15 FORUM STATISTICUM SLOVACUM 7/ a odhad periodického (cyklického/sezónneho) komponentu C ˆ ˆ 1 K Cn zodpovedajúceho konkrétnemu observovanému časovému radu x1 K xn. Ďalej je možné postupovať trojako. Je možné definovať miery periodicity (cyklickosti/sezónnosti) a miery regularity periodicity (cyklickosti/sezónnosti) na báze pôvodných odhadov C ˆ ˆ 1 K Cn (aditívne merania) keď porovnávané časové rady majú rovnaké merné jednotky a rovnakú rádovú veľkosť resp. keď merné jednotky a rád meraní nebude deformovať výsledky. Inak je vhodné eliminovať vplyv merných jednotiek a variability časových radov preškálovaním napozorovanými observáciami časového radu x1 K xn alebo odhadnutými hodnotami trendového komponentu T1ˆ K T ˆ n. V prvom prípade sa použijú hodnoty Cˆ ˆ 1 / x1 K Cn / xn (relativizované aditívne merania) a v druhom prípade sa použijú periodické (cyklické/sezónne) indexy x1 / T1ˆ K x / ˆ n Tn (multiplikatívne merania). Nasledujúca tabuľka č. 1 dáva prehľad o mierach na meranie periodicity (cyklickosti/sezónnosti) časových radov navrhnutých v našej predchádzajúcej práci (Bilka a Boďa 2011). Tabuľka č. 1: Prehľad mier na meranie periodicity (cyklickosti/sezónnosti) Miera periodicity Aditívne merania Relativizované aditívne merania Multiplikatívne merania Masa cyklu pripadajúca na pozorovanie Priemerná absolútna cyklickosť na pozorovanie Zdroj: vlastné spracovanie. 1 t = n ˆ ( ˆ ˆ 1 ˆ ˆ t = n Θ = P C C ) 1 t = 2 t t 1 t n ˆ C C 1 t = n t t Θ = P ( ) ˆ xt 1 xt 1 t = 2 t n Θ = P ( ) t 2 t 1 x x n = 1 Tˆ Tˆ ˆ 1 Θ = n t = n ˆ t = 1 Cˆ t t 1 t 1 ˆ t = n ˆ C 1 t = n t Θ = Θ ˆ = t = 1 t = 1 n x n Pre meranie regularity periodicity (cyklickosti/sezónnosti) je potrebné predpokldať že periodickému (cyklickému/sezónnemu) komponentu C t je možné priradiť jeho regulárne periodický pendant Γ t resp. v prípade odhadov periodického (cyklického/sezónneho) komponentu C ˆ ˆ 1 K Cn odhad zodpovedajúceho regulárne periodického komponentu Γ ˆ ˆ 1 K Γn. Najjednoduchším prístupom je pre každú periódu (cyklus/sezónu) stanoviť odhad regulárne periodického komponentu ako priemer odhadov periodických (cyklických/sezónnych) komponentov v predmetnom období periódy (cyklu/sezónnosti) a korigovať o celkový priemer odhadov periodických (cyklických/sezónnych) komponentov resp. použiť pre každé obdobie cyklickosti (sezónnosti) j {1... k} výpočtovú formulu 1 ˆ 1 t = n Γ ˆ = C Cˆ j ϕ ( j ) t t = 1 t # ϕ( j) n t (1) kde ϕ ( j) reprezentuje všetky výskyty obdobia j v časovom rade a # ϕ ( j) zastupuje počet týchto výskytov. Na základe toho možno na účely merania regularity periodicity (cyklickosti/sezónnosti) definovať analogické miery ako sú uvedené v tabuľke č. 1 s tým že sa tieto miery odvodzujú od aditívnych meraní v podobe Cˆ ˆ ˆ ˆ 1 Γ1 K Cn Γn relativizovaných aditívnych meraní v podobe ( Cˆ ˆ ˆ ˆ 1 Γ1) / x1 K ( C n Γ n ) / x n či od multiplikatívnych meraní x1 / Tˆ ˆ ˆ ˆ 1 Γ1 K xn / Tn Γn pričom konkrétne v poslednom prípade je regulárne periodický komponent Γ ˆ ˆ 1 K Γn stanovený z hodnôt cyklických (sezónnych) indexov x1 / T1ˆ K x / ˆ n Tn. Ak zavedieme označenie ˆ ˆ ˆ 1 = C ˆ ˆ ˆ 1 Γ1 K n = Cn Γn a ˆ δ1 = x ˆ ˆ ˆ ˆ ˆ 1 / T1 Γ1 K δn = xn / Tn Γn výsledný prehľad mier regularity periodicity (cyklickosti/sezónnosti) je uvedený v tabuľke č. 2. t 1 xt Tˆ t t

16 14 FORUM STATISTICUM SLOVACUM 7/2011 S metodologickými poznámkami k spôsobu získania odhadu trendového komponentu Tˆ ˆ 1 K Tn a odhadu periodického (cyklického/sezónneho) komponentu C ˆ ˆ 1 K Cn a so systemizáciou základných problémov a ťažkostí spojených s odhadovaním sa môže čitateľ oboznámiť v našom predošlom článku (Bilka a Boďa 2011). Tabuľka č. 2: Prehľad mier na meranie regularity periodicity (cyklickosti/sezónnosti) Miera regularity periodicity Aditívne merania Relativizované aditívne merania Multiplikatívne merania Masa cyklu pripadajúca na pozorovanie Priemerná absolútna cyklickosť na pozorovanie Zdroj: vlastné spracovanie. 1 t = n ˆ ( ˆ ˆ 1 ˆ ˆ t = n ϒ = P ) ˆ t 1 t t = 2 t t 1 t ϒ = P ( ) n 1 t = 2 t n 1 t = n ϒˆ = P ( ˆ δ ˆ 2 1 ) t t t δ = t 1 x x n 1 1 t = n ϒˆ = ˆ t = 1 n t t 1 t = n ˆ t = t = 1 n x t t 1 ˆ 1 t = n ϒ ˆ ˆ ϒ = δ t = 1 t n 3. Empirická aplikácia Z Eurostatu boli získané časové rady počtu zamestnancov verejného sektora a počtu zamestnancov súkromného sektora pre každý štát Vyšehradskej skupiny (Slovenskú republiku Českú republiku Maďarsko a Poľskú republiku) za obdobie od 1998Q1 až po 2010Q4. Údaje zahŕňajú celkovo 52 kvartálnych pozorovaní a so zreteľom na väzbu sledovaných časových radov na silne sezónne ekonomické ukazovatele sa predpokladá že je v nich obsiahnutá sezónnosť kvartálnej frekvencie. Cieľom je zistiť ktorý z uvedených časových radov je komparatívne sezónnejší a ktorý z nich vykazuje vyššiu regularitu sezónnosti. Pre dekompozíciu časových radov bol použitý trigonometrický regresný filter (cf. Balcilar 2007) a dosiahli sa (z hľadiska získaných záverov) rovnaké výsledky ako pri použití Hodrickovho-Prescottovho filtra (ibid.). Všetky výpočty a grafické znázornenia boli vypracované v programe R pri filtrovaní a odhadovaní komponentného modelu boli použité príslušné funkcie v balíku mfilter (pozri Balcilar 2007). Pôvodné časové rady odhady trendového komponentu a sezónneho komponentu a všetky výsledky sú reportované v prílohe na konci príspevku. Sú tu pre prehľadnosť zahrnuté aj výsledky pre Slovenskú republiku napriek tomu že už boli súčasťou predošlého príspevku. Hoci merné jednotky oboch časových radov sú zhodné časové rady pre každý štát Vyšehradskej skupiny má rôznu úroveň hodnôt a preto je potrebné sa pri interpretácii opierať o aditívne relativizované merania alebo o multiplikatívne merania. Napriek tomu boli spočítané miery pri aditívnych meraniach a na zabezpečenie porovnateľnosti relativizované predelením priemernou úrovňou hodnôt časového radu. Nakoľko v prípade oboch filtrov sú pri aditívnych meraniach a relativizovaných aditívnych meraniach v oboch prípadoch nižšie hodnoty všetkých štyroch sledovaných mier ˆΘ ˆΘ ˆϒ a ˆϒ pri časovom rade počtu zamestnancov v súkromnom sektore možno sa domnievať že počet zamestnancov v súkromnom sektore je menej cyklický než počet zamestnancov vo verejnom sektore a taktiež že jeho cyklickosť počtu zamestnancov v súkromnom sektore je komparatívne regulárnejšia než cyklickosť počtu zamestnancov vo verejnom sektore. Podobné konštatovanie by sa dosiahlo ak by sa postuloval (napr. na základe ekonomických súvislostí alebo predchádzajúcej analýzy) aj multiplikatívny model sezónnosti a a fortiori použili multiplikatívne merania. I keď v príspevku sme prišli k silnému a relevantnému záveru pre hodnotenie tendencií vývoja zamestnanosti vo verejnom sektore pokiaľ ide o stupeň jeho sezónnosti tomuto zisteniu

17 FORUM STATISTICUM SLOVACUM 7/ chýba ešte solídna podkladová ekonomická teória. Zatiaľ sa nám nepodarilo rozumne zdôvodniť prečo napriek jasnému empirickému správaniu zamestnanosť vo verejnom sektore sa prejavuje sezónnejšie ako zamestnanosť v súkromnom sektore. 6. Záver V príspevku sme použili navrhnutú metodiku na zistenie stupňa sezónnosti v časových radoch počtu zamestnanosti vo verejnom sektore a počtu zamestnanosti v súkromnom sektore v štátoch Vyšehradskej skupiny. V každej zo štyroch sledovaných štátov sa ukazuje vyššia miera sezónnosti pri zamestnanosti verejného sektora než pri zamestnanosti súkromného sektora a tiež že súkromný sektor je z hľadiska sezónnosti regulárnejší než verejný sektor. Tieto zistenia sú prekvapujúce dalo by sa totiž očakávať že vo verejnom sektore je vyšší stupeň sezónnej stability úrovne zamestnanosti než v súkromnom sektore čo súvisí s charakterom značnej časti ekonomických aktivít spadajúcich do sféry súkromného sektora. Je možné že správanie sa zamestnanosti vo verejnom sektore je do značnej miery ovplyvnené politickými rozhodnutiami a ďalšími faktormi ale doteraz sa nám nepodarilo stanoviť rámcové okolnosti pre toto správanie a nájsť relevantné a transparentné ekonomické opodstatnenie. Tento príspevok bol vypracovaný v rámci v rámci projektu VEGA č. 1/1141/11 Trh práce v kontexte špecifík neplatenej práce meranie jej rozsahu a dopadu na domácnosti podnikateľskú sféru a ekonomiku. Použitá literatúra [1.] BALCILAR M mfilter: Miscellaneous time series filters. [online]. Dokumenácia k balíku mfilter v programe R. Verzia z s. [cit ]. Dotupné na internete: < [2.] BILKA P. BOĎA M K meraniu cyklickosti (sezónnosti) časových radov a jej regularity. In Forum Statisticum Slovacum. Roč. 7. Č. 5. S ISSN [3.] KANDEROVÁ M. ÚRADNÍČEK V Štatistika a pravdepodobnosť pre ekonómov: 2. časť. Banská Bystrica: OZ Financ s. ISBN [4.] MURA L Štatistika zamestnanosti v samosprávnych krajoch vo vybraných odvetviach hos-podárstva Slovenska. In Forum Statisticum Slovacum. Roč. 6. Č. 4. S ISSN [5.] R Development Core Team R: A language and environment for statistical computing. Viedeň: R Foundation for Statistical Computing ISBN [6.] URAMOVÁ M Faktory rozhodovania ekonomických subjektov na trhu práce. In Acta Oeconomica Cassoviensia. Č S ISBN Adresa autorov Peter Bilka Ing. Univerzita Mateja Bela v Banskej Bystrici Ekonomická fakulta Katedra ekonómie Tajovského Banská Bystrica peter.bilka@umb.sk Martin Boďa Ing. et Bc. PhD. Univerzita Mateja Bela v Banskej Bystrici Ekonomická fakulta Katedra kvantitatívnych metód a IS Tajovského Banská Bystrica martin.boda@umb.sk

18 16 FORUM STATISTICUM SLOVACUM 7/2011 Príloha (výsledky pre jednotlivé štáty Vyšehradskej skupiny) Trigonometric Regression Filter of # zam. v súkromnom sektore # zam. v súkromnom sektore trend Č E S K Á R E P U B L I K A Trigonometric Regression Filter of # zam. vo verejnom sektore # zam. vo verejnom sektore trend Cyclical component (deviations from trend) Cyclical component (deviations from trend) Č E S K Á R E P U B L I K A POČET ZAMESTNANCOV V SÚKROMNOM SEKTORE Aditívne relativizované merania merania Multiplikatívne Aditívne merania (indexy) VÝSLE DKY PRE T RIGONOMETRICKÝ RE GRES NÝ FILTE R POČET ZAMESTNANCOV VO VEREJNOM SEKTORE Aditívne relativizované merania merania Multiplikatívne Aditívne merania (indexy) Stupeň ˆΘ ( ) ( ) sezónnosti ˆΘ ( ) ( ) Stupeň ˆϒ ( ) ( ) regularity sezónnosti ( ˆϒ ) ( ) ) Relativizované predelením priemerom hodnôt časového radu. Zdroj: vlastné spracovanie podľa výstupov z programu R. Trigonometric Regression Filter of # zam. v súkromnom sektore M A Ď A R S K O Trigonometric Regression Filter of # zam. vo verejnom sektore # zam. v súkromnom sektore trend # zam. vo verejnom sektore trend Cyclical component (deviations from trend) Cyclical component (deviations from trend) M A Ď A R S K O POČET ZAMESTNANCOV V SÚKROMNOM SEKTORE POČET ZAMESTNANCOV VO VEREJNOM SEKTORE Aditívne relativizované Aditívne merania vizované Aditívne relati- Multiplikatívne Multiplikatívne Aditívne merania merania (indexy) merania (indexy) merania merania VÝSLE DKY P RE T RIGONOMETRICKÝ RE GRES NÝ FILTE R Stupeň ˆΘ ( ) ( ) sezónnosti ˆΘ ( ) ( ) Stupeň ˆϒ ( ) ( ) regularity sezónnosti ( ˆϒ ) ( ) ) Relativizované predelením priemerom hodnôt časového radu. Zdroj: vlastné spracovanie podľa výstupov z programu R.

19 FORUM STATISTICUM SLOVACUM 7/ Trigonometric Regression Filter of # zam. v súkromnom sektore # zam. v súkromnom sektore trend P O Ľ S K O Trigonometric Regression Filter of # zam. vo verejnom sektore # zam. vo verejnom sektore trend Cyclical component (deviations from trend) Cyclical component (deviations from trend) P O Ľ S K O POČET ZAMESTNANCOV V SÚKROMNOM SEKTORE Aditívne relativizované merania merania Multiplikatívne Aditívne merania (indexy) VÝSLE DKY PRE T RIGONOMETRICKÝ RE GRES NÝ FILTE R POČET ZAMESTNANCOV VO VEREJNOM SEKTORE Aditívne relativizované merania merania Multiplikatívne Aditívne merania (indexy) Stupeň ˆΘ ( ) ( ) sezónnosti ˆΘ ( ) ( ) Stupeň ˆϒ ( ) ( ) regularity sezónnosti ( ˆϒ ) ( ) ) Relativizované predelením priemerom hodnôt časového radu. Zdroj: vlastné spracovanie podľa výstupov z programu R. Trigonometric Regression Filter of # zam. v súkromnom sektore S L O V E N S K Á R E P U B L I K A Trigonometric Regression Filter of # zam. vo verejnom sektore # zam. v súkromnom sektore trend # zam. vo verejnom sektore trend Cyclical component (deviations from trend) Cyclical component (deviations from trend) S L O V E N S K Á R E P U B L I K A POČET ZAMESTNANCOV V SÚKROMNOM SEKTORE POČET ZAMESTNANCOV VO VEREJNOM SEKTORE Aditívne relativizované Aditívne merania vizované Aditívne relati- Multiplikatívne Multiplikatívne Aditívne merania merania (indexy) merania (indexy) merania merania VÝSLE DKY PRE T RIGONOMETRICKÝ RE GRES NÝ FILTE R Stupeň ˆΘ ( ) ( ) sezónnosti ˆΘ ( ) ( ) Stupeň ˆϒ ( ) ( ) regularity sezónnosti ( ˆϒ ) ( ) ) Relativizované predelením priemerom hodnôt časového radu. Zdroj: vlastné spracovanie podľa výstupov z programu R.

20 18 FORUM STATISTICUM SLOVACUM 7/2011 Porovnanie prístupov na oceňovanie opcií európskeho typu A comparison of approaches to European style options pricing Martin Boďa Abstract: In the article a comparison of three methods viz. (i.) the binomial tree option pricing (ii.) the method based on the Black-Scholes-Merton option pricing formula and (iii.) the method based on Monte Carlo simulations is given in the case of European style options. Key words: European style option Cox-Ross-Rubinstein binomial tree Black-Scholes-Merton option pricing model Monte Carlo valuation. Kľúčové slová: európska opcia Coxov-Rossov-Rubinsteinov binomický strom Blackov- Scholesov-Mertonov opčný oceňovací model oceňovanie (simuláciami) Monte Carlo. JEL classification: C63 G Úvod Uvažujme európsku opciu na akcie nevyplácajúce dividendy. Je všeobecne známe že jej spravodlivá cena v súčasnosti je určená diskontovanou strednou hodnotou budúcej hodnoty opcie rt v čase exspirácie resp. formálne je určená v čase t = 0 vzťahom f0 = e EQ ( f T ) kde f t je hodnota opcie v čase t = 0 T čas t = T denotuje moment exspiráciu opcie r je bezriziková úroková miera a EQ ( ) je štandardný operátor strednej hodnoty pod pravdepodobnostnou mierou Q. Pri oceňovaní európskych opcií na akcie nevyplácajúce dividendy dominuje nesporne spojitý Blackov-Scholesov-Mertonov (BSM) prístup v menšej miere sa používajú na tento účel (pri európskych opciách) diskrétny Coxov-Rossov-Rubinsteinov (CRR) prístup či simulačný Monte Carlo (MC) prístup. V článku sú priblížené základné črty aplikácie týchto prístupov pre ocenenie európskych opcií na akcie nevyplácajúce dividendy a ich použitie je demonštrované na príklade reálneho ocenenia zvolenej opcie európskeho typu. 2. Prístupy k oceňovaniu opcií európskeho typu Oceňovanie opcií sa počiatočne uskutočňuje pri pravdepodobnostnej miere P a spojuje sa s určitými simplifikujúcimi predpokladmi ktoré sú v prípade opcií európskeho typu na akcie nevyplácajúce dividendy zhrnuté v slovenských podmienkach v dostupnej literatúre napr. v knihe Melicherčíka et al. (2005 s ). Tieto predpoklady umožňujú pomerne jednoduchým spôsobom stanoviť cenu opcie. Jedným z kľúčových a podmieňujúcich predpokladov ako sa ukáže je predpoklad geometrického Brownovho pohybu pre vývoj ceny akcie. Podľa tohto predpokladu je dáta generujúci mechanizmus cien akcie ( S t ) t 0 pri pravdepodobnostnej miere P určený vzťahom St = S0 exp( µ t + σwt ) pre t 0 kde S 0 > 0 je cena akcie v čase t = 0 + ( µ σ ) R R sú parametre procesu: drift a volatilita symbol W t zaznačuje potom hodnotu štandardného Wienerovho procesu v čase t 0 (teda stochastického procesu s počiatkom v hodnote 0 s N(0 t ) rozdelením so stacionárnymi a nezávislými prírastkami a so spojitou trajektóriou s pravdepodobnosťou 1). Pri zmene pravdepodobnostnej miery P na rizikovo neutrálnu pravdepodobnostnú mieru Q prechádza geometrický Brownov pohyb do svojej 2 rizikovo neutrálnej verzie St = S0 exp(( r 0.5 σ ) t + σwt ). Dôvody vedúce k prechodu na rizikovo neutrálnu pravdepodobnostnú mieru možno nájsť napr. u Baxtera a Rennieho (1997 s ) alebo u Melicherčíka et al. (2005 s ). Všetky prístupy sa zakladajú na stanovení spravodlivej ceny opcie pomocou už rt spomenutého bazálneho vzťahu f0 = e EQ ( f T ) pričom cena opcie f T v čase exspirácie t = T

21 FORUM STATISTICUM SLOVACUM 7/ sa určuje vnútornou hodnotou opcie ako rozdiel medzi cenou akcie v čase exspirácie S T a realizačnou cenou K v prípade kúpnej (call) opcie vzorcom ft = ( ST K ) + a pri predajnej (put) opcii zase vzorcom ft = ( K S T ) +. V oboch vzťahoch je symbolom ( ) + zaznačená orezávacia funkcia ( x) + = max{0 x} a S T je reprezentovaná rizikovo neutrálnou verziou geometrického Brownovho pohybu. Summa summarum (spravodlivá) cena opcie je (samozrejme pri rizikovo neutrálnej pravdepodobnostnej miere Q ) funkcia piatich parametrov: aktuálnej spotovej ceny akcie S 0 volatility ceny akcie σ bezrizikovej úrokovej miery r času do exspirácie T a realizačnej ceny opcie K. V diskrétnom CRR prístupe sa čas do exspirácie T rozdelí na určitý počet povedzme n zhodne dlhých úsekov δ t > 0 takže platí T = n δt. Na začiatku každého časového úseku je cena akcie S now a počas sledovaného časového úseku t. j. za obdobie δ t môže vzrásť buď na hodnotu S up alebo klesnúť na hodnotu S down. Miera nárastu je určená koeficientom u a platí Sup = Snow u a miera poklesu je daná koeficientom d že platí Sdown = Snow d ; na koeficienty rδ t nárastu a poklesu sú stanovené podmienky 0 < d < e < u. Autori tohto prístupu odporučili voliť u = exp( σ δt ) a d = 1/ u. Východzia cena akcie je v čase t = 0 prirodzene Snow = S0. Tieto zmeny v hodnote ceny akcie sa uskutočňujú pod pravdepodobnostnou mierou Q : pravdepodobnosť nárastu je určená číslom 0 < q = ( e d) /( u d) < 1 a pravdepodobnosť poklesu je potom rδt 0 < 1 q < 1. Tieto skutočnosti približuje obrázok č. 1. Sú známe vnútorné hodnoty opcie pri jednotlivých scenároch vývoja ceny akcie v čase exspirácie T (pri kúpnej opcii je to ft up / down = ( ST up / down K ) + + a pri predajnej opcii ft up / down = ( K ST up / down) ). Na základe znalosti vnútorných hodnôt opcie v čase T možno určiť hodnotu opcie v jednotlivých uzloch predchádzajúceho časového úseku T δ t pomocou vzťahu r δ fnow = e t ( f upq + fdown (1 q)) pre diskontovanú strednú hodnotu hodnôt opcie v jednotlivých uzloch a takto krokovo pokračovať až sa učí ako výsledné ocenenie hodnota opcie (spravodlivá cena) f0 = fnow. Je zrejmé že pre n (čo je však ekvivalentné δt 0 ) možno dosiahnuť v čase T husté pokrytie možných finálnych cien akcie na intervale (0 ) totiž ľubovoľnú hodnotu pre cenu akcie S T z tohto intervalu. Dá sa navyše ukázať že v tomto prípade keď n (resp. δt 0 ) prechádza diskrétny prístup do spojitého BSM prístupu. Obrázok č. 1: Uzol binomického stromového modelu pri CRR prístupe δt q S up f up f now S now 1 q Zdroj: vlastné spracovanie. S down f down Spojitý BSM prístup sa redukuje na určenie spravodlivej ceny opcie pri kúpnej opcii podľa rt vzťahu f0 = S0Φ( d1) Ke Φ ( d2) a pri predajnej opcii podľa analogickej formuly f 0 = rt = Ke Φ( d2) S0Φ( d1) kde Φ ( x) je hodnota distribučnej funkcie normovaného gaussovského rozdelenia v bode x a konštanty d 1 a d 2 sú spočítané zo vstupných parametrov 2 vzťahmi d1 = (ln( S0 / K) + rt σ T ) /( σ T ) a d2 = d1 σ T. V prípade simulačného MC prístupu sa simuluje vývoj ceny akcie v čase exspirácie T podľa rizikovo neutrálnej verzie geometrického Brownovho pohybu (alt. podľa nejakého iného vhodného procesu generujúceho ceny akcie) a pre každý scenár ceny akcie sim. S T i sa určí zodpovedajúca vnútorná hodnota kúpnej opcie ft i = ( sim. ST i K ) + či predajnej opcie f T i = + = ( K sim. S ) a diskontovaná stredná hodnota budúcich hodnôt opcie sa nahradzuje T i

22 20 FORUM STATISTICUM SLOVACUM 7/2011 diskontovaným priemerom simulovaných vnútorných hodnôt teda spravodlivá cena opcie sa rt určuje vzťahom f0 = e avg( f T i ) pričom avg( ) denotuje priemer cez všetky vykonané scenáre. Ide o koncepčne jednoduchú hoci výpočtovo azda ťažšie zrealizovateľnejšiu metódu zaťaženú vysokou variabilitou produkovaných výsledkov pre spravodlivé ocenenie opčných kontraktov. Okrem koncepčnej zrozumiteľnosti tento prístup umožňuje tento prístup nahradiť potenciálne reštriktívny predpoklad geometrického Brownovho pohybu pre vývoj ceny akcie iným empiricky priliehavejším dáta generujúcim procesom. Na redukciu nadmernej variability vo výsledných cenách opcií boli navrhnuté rôzne techniky na redukciu variability (pozri napr. článok Boyla et al. 1997) napr. metóda antitetických premenných. Východiskom je zadanie vzťahu pre simulácie 2 v podobe sim. ST i ( Ui ) = S0 exp(( r 0.5 σ ) T + σ TUi ) s normovanou gaussovskom premennou U i pričom túto formuláciu dovoľuje explicitne vlastná definícia Wienerovho procesu. Každej simulovanej hodnote ceny akcie sim. ST i ( U i ) s rezultujúcou vnútornou hodnotou ft i ( U i ) korešponduje antitetický variant sim. ST i ( Ui ) s rezultujúcou vnútornou hodnotou ft i ( Ui ). S ohľadom na symetriu gaussovského rozdelenia sa Ui v distribúcii zhoduje s U i. Cena opcie rt sa potom určí ako aritmetický priemer f0 = 0.5 e (avg( ft i ( Ui )) + avg( ft i ( Ui ))) a dá sa ukázať že štandardná chyba výsledku je nižšia ako keď sa použije iba jednoduchší postup. 3. Empirická demonštrácia Na praktickú demonštráciu praktickej aplikácie boli zvolené európske opcie na akciu spoločnosti Google Inc. obchodovanej na burze NASDAQ. Táto akcia nevypláca dividendy. Údaje o cene akcie a bezrizikovej úrokovej miere boli získané z internetovej stránky < a všetky výpočty boli realizované v programe R (pozri R Development Core Team 2010) najmä za použitia balíkov foptions fgarch (pozri Wuertz et al ). V čase získavania dátových podkladov boli k dispozícii údaje ku koncu obchodného dňa Záverečná cena akcie bola S 0 = USD. Volatilita akcie bola odhadnutá z 695 logaritmických výnosov akcie za obdobie od po pomocou GARCH(11) modelu so špecifikáciou zošikmeného Studentovho-T rozdelenia pre náhodnú zložku v hodnote σ = p. a. Boli uvažované dve realizačné ceny a to K = 530 USD a K = 760 USD a kúpne a predajné opcie s exspiráciou tzn. o T = roka a s exspiráciou tzn. o T = roka. Bezriziková úroková miera bola odhadnutá lineárnou interpoláciou z výnosnosti federálnych štátnych pokladničných poukážok Spojených štátov amerických pre opcie exspirujúce vo výške r = p. a. a pre opcie s exspiráciou vo výške r = p. a. V oboch prípadoch je bezriziková úroková miera zanedbateľná. Pri CRR prístupe bol použitý 1000-krokový binomický strom (teda n = 1000 ) a pri MC prístupe metóda antitetických premenných so 120 cyklami a simuláciami v cykle. Výsledky sú prezentované v tabuľke č. 1. Výsledky v tejto podobe sotva umožňujú vyhodnotiť globálnu primeranosť čo len jednej z uvedených metód avšak je zrejmé že je malý rozdiel vo výsledkoch pre diskrétny CCR prístup a spojitý BSM prístup. Je zjavné že 1000-krokový binomický strom je už z praktického hľadiska dobrou spojitou aproximáciou ale rovnako je badateľná hrubá nepresnosť jednotlivých oceňovacích modelov. Príčiny odchodnosti spravodlivých cien od trhových cien môžu spočívať vo viacerých faktoroch menovite ide o najmä o tieto príčiny: Všetky uvedené prístupy sú abstrakciou reality a nedokážu postihnúť psychologické a trhové okolnosti mimo modelu. Takisto vychádzajú z niektorých zľahčujúcich predpokladov

23 FORUM STATISTICUM SLOVACUM 7/ požadujúcich symetrické postavenie investorov na trhu absenciu trhových frikcií a spojitosť obchodovania. Geometrický Brownov pohyb pravdepodobne nie je primeraným dáta generujúcim mechanizmom cien akcie spoločnosti Google Inc. Platnosť geometrického Brownovho pohybu pre cenu akcie implikuje že výnosy sú nezávislé a rovnako rozdelené gaussovské realizácie. Kumulatívny periodogram (nereportované v článku) autokorelačné správanie sa výnosov akcie spoločnosti Google Inc. (obrázok č. 2) a rovnako ich štvorcov (nereportované v článku) indikujú že výnosy akcie spoločnosti Google Inc. možno zhruba považovať za neautokorelované. BDS test ani znamienkový test poukazujú na nezávislosť. Naproti tomu zjavne výnosy Google Inc. nie sú gaussovsky rozdelené (obrázok č. 2). Odhad volatility σ = p. a. získaný GARCH(1 1) modelom môže byť považovaný za prísny. Primitívnejšie a jednoduchšie metódy (lež pri predpoklade geometrického Brownovho pohybu) odhadujú volatilitu na úrovni ca. σ = 0.30 p. a. Súčasné ekonomické prostredie sa zjavne správa anomálne v porovnaní s čiste teoretickými predstavami. Súčasná bezriziková úroková miera na prakticky nulovej úrovni zrejme nie je dobrá proxy premenná nákladov držby kapitálu a už vôbec nie je bezriziková. Tabuľka č. 1: Výsledky oceňovania opcií Exspirácia (T = r = ) Realizačná cena K = 530 USD Realizačná cena K = 760 USD Typ Cena opcie (USD) Cena opcie (USD) opcie CCR BSM MC Skutočná CCR BSM MC Skutočná Kúpna Predajná Exspirácia (T = r = ) Realizačná cena K = 530 USD Realizačná cena K = 760 USD Typ Cena opcie (USD) Cena opcie (USD) opcie CCR BSM MC Skutočná CCR BSM MC Skutočná Kúpna Predajná Zdroj: vlastné spracovanie. Obrázok č. 2: Autokorelačné správanie sa výnosov akcie Google Inc. a normálny QQ plot Výnosy akcie Google Inc. ( ) QQ plot výnosov akcie Google Inc. ( ) ACF PACF Empirické kvantily Lag Lag Zdroj: vlastné spracovanie (v programe R) Teoretické kvantily

24 22 FORUM STATISTICUM SLOVACUM 7/ Záver V článku boli priblížené tri metódy pre oceňovanie opcií európskeho typu načrtnutá ich použiteľnosť a zdôraznené kruciálne obmedzenie plynúce z prísneho predpokladu geometrického Brownovho pohybu pre cenový vývoj akcie. Súčasťou článku bola demonštrácia použitia prezentovaných prístupov pri oceňovaní opcií v prípade opcií na akciu spoločnosti Google Inc. Článok je akýmsi prehĺbením odborného a vedeckého záujmu o problematiku oceňovania derivátov v slovenskej štatistickej obci. Použitá literatúra [1.] BAXTER M. RENNIE A Financial calculus: an introduction to derivative pricing. 1. opr. vyd. Cambridge (UK): Cambridge University Press s. ISBN [2.] BOYLE P. BROADIE M. GLASSERMAN P Monte Carlo methods for security pricing. In Journal of Economic Dynamics and Control. Roč. 21. Č S ISSN [3.] CISKO Š. BIRTUS M Vlastnosti základných štatistických veličín používaných v teórii portfólia. In POKORNÁ D. SOJKOVÁ J. (eds.) Spoločenská odpovědnost firem transfer vědeckých poznatků do praxe. Olomouc: Moravská vysoká škola Olomouc S. 23. ISBN [4.] KANDEROVÁ M Optimalizácia portfólia investičných nástrojov v prostredí MS Excel. In Forum Statisticum Slovacum. Roč. 3. Č S ISSN [5.] KANDEROVÁ M Stratégia imunizácie portfólia komunálnych dlhopisov. In Forum Statisticum Slovacum. Roč. 7. Č S ISSN [6.] KLIEŠTIK T Metamorfózy finančných výnosov. In POKORNÁ D. SOJKOVÁ J. (eds.) Spoločenská odpovědnost firem transfer vědeckých poznatků do praxe. Olomouc: Moravská vysoká škola Olomouc S. 23. ISBN [7.] MELICHERĆÍK I. OLŠAROVÁ L. ÚRADNÍČEK V Kapitoly z finančnej matematiky. Bratislava: Epos s. ISBN [8.] R Development Core Team R: A language and environment for statistical computing. Viedeň: R Foundation for Statistical Computing ISBN [9.] ROSS M. S An introduction to mathematical finance: options and other topics. Cambridge (UK): Cambridge University Press s. ISBN [10.] ÚRADNÍČEK V Využitie predajno-kúpnej parity pri stanovení spravodlivej ceny opcie na akciu. In Forum Statisticum Slovacum. Roč. 1. Č S ISSN [11.] WUERTZ D. et al fgarch: Rmetrics autoregressive conditional heteroskedastic modelling. R package version Dostupné na internete: < package= fgarch>. [12.] WUERTZ D. et al foptions: basics of option valuation. R package version Dostupné na internete: < Adresa autora Martin Boďa Ing. et Bc. PhD. Univerzita Mateja Bela v B. Bystrici Ekonomická fakulta Katedra kvantitatívnych metód a informačných systémov Tajovského Banská Bystrica martin.boda@umb.sk

25 FORUM STATISTICUM SLOVACUM 7/ Teória pravdepodobnosti na časových škálach - delta derivácia Probability theory applications on time scales - delta derivation Eva Brestovanská Abstract: In this article I introduce probability theory adapted on time scales. I have modified some concepts of probability theory on time scales. I pay a special attention to the general formulae for delta derivation some elementary functions. Key words: delta derivation time scale. Kľúčové slová: delta derivácia časová škála. JEL classification: C02 1. Úvod Matematická teória na časových škálach (neprázdnych uzavretých podmnožinách množiny reálnych čísel) je pomerne novou disciplínou zjednocuje a zovšeobecňuje výsledky získané pre spojitý a diskrétny kalkulus. Jej počiatky sa datujú do konca osemdesiatich rokov minulého storočia. Základy kalkulu na time scales (časových škálach) sa objavili v dizertačnej práci a následne v článku S. Hilgera. Práca sa postupne zaoberá derivovaním elementárnych funkcií na time scales a jej aplikáciou v teórii pravdepodobnosti. Konkrétne výpočtom funkcie pravdepodobnosti a hustoty ak poznáme distribučnú funkciu. Pre voľbu časovej škály T = R (prechádza delta derivácia na klasickú obyčajnú deriváciu) a pri voľbe T = Z na dopredný diferenčný operátor. Teória základného kalkulu na time scales bola prevzatá z literatúry [1] a [2]. 2. Funkcia zrnitosti. Pre t T dopredný operátor skoku σ: T T definujeme nasledovne: σ(t) := inf{s T : s > t} a spätný operátor skoku ρ: T T ako ρ(t) := sup{s T : s < t}. Ak ρ(t) = t = σ(t) t je hustý bod ak σ(t) > t t je sprava riedky bod ρ(t) < t t je zľava riedky bod ak σ(t) = t t je sprava hustý bod ak ρ(t) = t t je zľava hustý bod ak ρ(t) < t < σ(t) t je izolovaný bod. Zobrazenie µ : T [0 ) nazveme funkciou zrnitosti ktorá je definovaná vzťahom µ(t) := σ(t) t t T. t 1 t 2 t 3 t 4 Obrázok 1: t 1 je hustý bod (sprava aj zľava hustý) t 2 je zľava hustý a sprava riedky bod t 3 je zľava riedky a sprava hustý bod t 4 je izolovaný bod (zľava i sprava riedky).

26 24 FORUM STATISTICUM SLOVACUM 7/2011 Príklad 1. : Ak T = R σ(t) = inf{s R : s > t} = inf(t ) = t ρ(t) = sup{s R : s < t} = sup( t) = t. Každý bod t R je hustý. Funkcia zrnitosti µ je rovná nule tj. µ(t) 0 Ak T = Z σ(t) = inf{s Z : s > t} = inf{t + 1 t + 2 t } = t + 1 ρ(t) = sup{s Z : s < t} = sup{... t 3 t 2 t 1} = t 1. Každý bod t Z je izolovaný. Funkcia zrnitosti µ je rovná jednej tj. µ(t) 1. Ak T = h*z = {h*k : k Z} σ(t) = inf{s h*z : s > t} = inf{t + h t + 2h t + 3h... } = t + h σ(t) = sup{s h*z : s < t} = sup{... t 3h t 2h t h} = t h. Každý bod t h*z je izolovaný. Funkcia zrnitosti µ je rovná kroku h tj. µ(t) h Tabuľka 1: Miera zrnitosti na vybraných škálach Time scales Miera zrnitosti µ(t) Dopredný operátor σ(t) Spätný operátor ρ(t) R 0 t t Z 1 t+1 t-1 h*z h t+h t-h 3. Delta derivácia a jej základné vlastnosti. Nech T je časová škála funkcia f: T R a t T. Ak existuje lim s t s T [f(σ(s)) f(t)] / [σ(s) t] t.j. lim s t s T [f(σ(s)) f(t)] / µ(t) nazývame túto limitu delta deriváciou funkcie f v bode t a označujeme ju f (t). Základné vlastnosti delta derivácie: Predpokladajme fg : T R sú diferencovateľné v bode t. Potom: (1) súčet f + g je diferencovateľný na t a (f + g) (t) = f (t) + g (t). (2) Pre ľubovoľnú konštantu α α* f: T R diferencovateľnú na t platí: (α*f) (t) = α*f (t). (3) Súčin f*g : T R je diferencovateľný na t a (f*g) (t) = f (t)*g(t) + f(σ(t))*g (t) = f(t)*g (t) + f (t)*g(σ(t)): V prípade že T = R platí σ(t) = t delta derivácia prejde na klasickú deriváciu (f = f ). Ak T = Z platí σ(t) = t + 1 delta derivácia prejde na diferenciu (f = f kde je obvyklý dopredný operátor diferencie). Príklad 2. : Distribučná funkcia má tvar F(t) = a*t + b pre t a ab ktoré spĺňajú podmienku 0 F(t) 1 kde a b R sú konštanty t T. Potom funkcia hustoty sa vypočíta nasledovne: F (t) = lim s t s T [F(σ(s)) F(t)] / [σ(s) t] = lim s t s T [(a*σ(s)) + b (a*t +b)] / [σ(s) t] = lim s t s T [a*((σ(s) t )] / [σ(s) t] = a*lim s t s T [σ(s) t )] / [σ(s) t] = a. Pre všetky t T ktoré spĺňajú podmienku 0 F(t) 1 je delta derivácia lineárnou funkciou rovnou konštante a a nezávisí od miery zrnitosti µ(t). Príklad 3. : Lineárna funkcia. a) Nech náhodná premenná T 1 je daná distribučnou funkciou F 1 (t): R <01> na time scales T = R. 0 t -167 F 1 (t) = 03t < t t > 167

27 FORUM STATISTICUM SLOVACUM 7/ potom výsledný tvar funkcie hustoty f 1 (t) je: f 1 (t)=03 t <-167;167> 0 inak b) Nech náhodná premenná T 2 je daná distribučnou funkciou F 2 (t): R <01> na time scales T = 04 * Z. 0 (t = 04 * Z) -167 F 2 (t) = 03 * t + 05 ( t = 04 * Z) (-167; 167> 1 (t = 04 * Z) >167 potom výsledný tvar pravdepodobnosti p t je: p t = 03 * 04 t = 04 * Z <-167; 167> inak Poznámka k príkladu 2. úlohe b). Ak T = h*z platí σ(t) = t + h potom distribučná funkcia je schodovitá na intervale (t σ(t)) je konštantná a skok v bode σ(t) má veľkosť p σ(t) = F 2 (σ(t)) - F 2 (t). Ak použijeme delta deriváciu F (t) = a pre všetky t T ktoré spĺňajú podmienku 0 F(t) 1 pravdepodobnosť p σ(t) v bode σ(t) vypočítame p σ(t) = tg (α) * [(σ(t) t)] = tg (α) * h = p σ(t) = F (t) * h = a * h. pre (t = h * Z) < b/a; -b/a>; p σ(t) = 0 inak. F 2 (σ(t)) p σ(t) α F 2 (t) t σ(t) h Obrázok 2: Výpočet pravdepodobnosti p σ(t). c) Nech náhodná premenná T 3 je daná distribučnou funkciou F 3 (t): R <01> na time scales T = 01 * Z. 0 (t = 01 * Z) < -167 F 3 (t) = 03*t + 05 (t = 01 * Z) <-167; -167> 1 (t = 01 * Z ) >167 potom výsledný tvar pravdepodobnosti p t je: p t = 03 * 01 (t = 01 * Z) <-167; -167> 0 inak

28 26 FORUM STATISTICUM SLOVACUM 7/ Distribčná funkcia F 1 (t) pre T=R Funkcia hustoty f 1 (t) pre T=R Pravdepodobnosť p t pre T=04*Z Obrázok 3: Delta derivácia lineárnej funkcie. Pravdepodobnosť p t pre T=01*Z Príklad 4. : Kvadratická funkcia. Je daná distribučná funkcia F(t) = a*t 2 pre t a a ktoré spĺňajú podmienku 0 F(t) 1 kde a R je konštanta. Potom funkcia hustoty sa vypočíta nasledovne: lim s t s T [F(σ(s)) F(t)] / [σ(s) t] = lim s t s T [a*(σ(s) 2 a*t 2 ] / [σ(s) t] = a * lim s t s T [(σ(s) t ) (σ(s) + t )] / [σ(s) t] = a * lim s t s T (σ(s) + t ) = a* [(σ(t)+ t)] Z výsledku delta derivácie funkcie a*t 2 vidíme že závisí na doprednom operátore σ(t). V nasledujúcej tabuľke sú uvedené hodnoty delta derivácie F funkcie F(t) = a*t 2 pre zvolené time scales T. Tabuľka 2: Delta derivácia F (t) funkcie F(t) =a*t 2 T µ(t) F (t) T µ(t) F (t) R 0 a* 2t h*z h a * (2t + h) Z 1 a * (2t + 1) Distribčná funkcia F 2 pre T=R Funkcia hustoty f 2 (t) = a* 2t pre T=R

29 FORUM STATISTICUM SLOVACUM 7/ Pravdepodobnosť p t pre T=01*Z Obrázok 4: Delta derivácia kvadratickej funkcie. Príklad 5. : Exponenciálna funkcia. Je daná distribučná funkcia F(t) = k*a t Pravdepodobnosť p t pre T=05*Z kde a > 0 R je konštanta a k R je konštanta t T pre t a k ktoré spĺňajú podmienku 0 F(t) 1. Potom funkcia hustoty sa vypočíta nasledovne: lim s t s T [F(σ(s)) F(t)] / [σ(s) t] = lim s t s T [k* a σ(s) k* a t )] / [σ(s) t] = lim s t s T [k * a t (a σ(s) - t 1) ] / [σ(s) t] = k * a t * lim s t s T [a σ(s)-t 1)] / [σ(s) t] F (t) = k * a t * [a µ(t) 1)] / µ(t) k * a t *ln a µ(t) 0 µ(t) 0 Špeciálne pre a = e je delta deriváce funkcie f(t) = e t F (t) = k * e t [e µ(t) 1)] / µ(t) µ(t) 0 k * e t µ(t)=0 Tabuľka 3: Delta derivácia F (t) funkcie F(t) = k*a t na rôynych time scales T. T µ(t) F (t) R 0 k.*a t ln a Z 1 k *a. t (a-1) h*z h k *a t [(a h -1)/h] Distribčná funkcia F 3 (t)= 01 * e t pre T=R Funkcia hustoty f 3 (t) = 01 * e t pre T = R

30 28 FORUM STATISTICUM SLOVACUM 7/ Pravdepodobnosť pre T= 01 * Z Obrázok 5: Delta derivácia expnenciálnej funkcie. Pravdepodobnosť p t pre T= 05 * Z 4. Záver V práci sú odvodené všeobecné vzťahy pre delta deriváciu lineárnej kvadratickej a exponenciálnej funkcie a jej aplikácia pri výpočte pravdepodobnostnej funkcie a funkcie hustoty z distribučnej funkcie na rôznych časových škálach. Ukázala som rôzne techniky delta derivácie na niekoľkých konkrétnych príkladoch. Pre ostatné elementárne funkcie sa delta derivácia počíta rovnakým postupom treba však podotknúť že pre niektoré funkcie sa výpočet ukazuje komplikovaný. Aplikáciu teórie time scales možno využiť v úlohách čiastočne spojitého a čiastočne diskrétneho charakteru práve takéto typy úloh by sa značne zdĺhavo riešili samostatne v diskrétnom a spojitom kalkulu. Význam práce spočíva v zjednotení teórie pravdepodobnosti konkrétne výpočtu rozdelenia pravdepodobnosti pre spojitú aj diskrétnu náhodnú premennú. 5. Literatúra [1] Bohner M. Peterson A.: Dynamic Equations on Time Scales: An Introduction with Applications. Birkhauser Boston [2] Bohner M. Peterson A.: Advances in Dynamic Equations on Time Scales. Birkhauser Boston Adresa autora : Eva Brestovanská Mgr. PhD FM UK KEF Odbojárov Bratislava 25 Eva.Brestovanska@fm.uniba.sk

31 FORUM STATISTICUM SLOVACUM 7/ Teória portfólia aplikovaná v praxi Portfolio theory applied in practice Tomáš Cár Abstract: The purpose of this article is to introduce the mean-variance approach of the Markowitz portfolio theory and its practical application in a form of creating an optimal portfolio. The article starts with a discussion about the Markowitz portfolio theory and its contribution to the quantitative finance and investment management. It continues with a description of the theoretical model its usage in investment practice and practical problems caused by its implementation in portfolio management. It is followed by a practical application on real financial instruments from which an optimal portfolio is created and monitored. Finally this article presents results and their practical implications and concludes with suggestions for further research. Key words: portfolio theory Markowitz optimal portfolio efficient frontier mean-variance approach Kľúčové slová: teória portfólia Markowitz optimálne portfólio efektívna krivka meanvariance prístup JEL classification: G1 General Financial Markets; Portfolio Choice Investment Decisions 1. Úvod Proces alokácie aktív prešiel v modernej dobe niekoľkými zásadnými zmenami v podobe nových náhľadov na investičné príležitosti modelov a prístupov k oceňovaniu jednotlivých tried aktív alebo teóriami snažiacimi sa definovať vhodný výber inštrumentov. Jednou z najväčších zmien ktorá zásadne ovplyvnila aj všetky ďalšie teórie bola Markowitzova teória Moderného portfólia 1 s ktorou v roku 1952 odštartoval novú éru vo svete investovania a portfólio manažmentu a za ktorú mu bola aj v roku 1990 udelená Nobelova cena za ekonómiu. Cieľom tohto článku je predstaviť teoretické základy Markowitzovho prístupu ktoré sa sčasti využívajú ešte aj dnes. Ďalej poukážem aj na nedokonalosti Markowitzovho prístupu ktoré síce môžu limitovať jeho využitie v praxi ale nemusia predstavovať zásadný problém ktorý by sa nedal pomocou iných prístupov a teórií obísť. Na záver sa pokúsim aplikovať klasickú Markowitzovu teóriu na praktickom príklade na ktorom sa pokúsim zdokumentovať výhody a nevýhody tejto teórie ako aj porovnať a zhodnotiť výkonnosť portfólia zloženého z inštrumentov ktoré boli vybrané pomocou Markowitzovho prístupu. 2. Markowitzova teória portfólia Každá teória portfólia sa pokúša hľadať odpovede na otázky typu Ktoré vlastnosti investičných inštrumentov sú pri ich výbere najdôležitejšie a ako je ich možné najlepšie kvantifikovať? či Ako nájsť to správne optimálne portfólio? alebo V akom pomere skombinovať rizikové aktíva s bezrizikovými?. H. Markowitz prišiel vo svojej teórii moderného portfólia na odpovede na niektoré z uvedených otázok resp. prišiel na svet s metódou vďaka ktorej si investor vie na základe konkrétnych (historických) parametrov napríklad zrátať aké portfólio je pre neho optimálne. Touto metódou vrámci teórie portfólia je tzv. mean-variance analýza alebo analýza historického výnosu a rozptylu inštrumentov. Teória je postavená na tom že každý jeden inštrument sa dá zmysluplne zhodnotiť dvomi 1 Markowitz H Portfolio selection. In: Journal of Finance Vol. 7 pp

32 30 FORUM STATISTICUM SLOVACUM 7/2011 parametrami výnosom a jeho rozptylom (= rizikom). Hlavným prínosom tejto teórie je to že pod diverzifikáciou nerozumie len náhodné investovanie do rôznych inštrumentov ale aj analýzu vzťahov medzi jednotlivými ištrumentmi a teda aj analýzu príspevkov jednotlivých inštrumentov k celkovému riziku portfólia (=kovariancia tretí dôležitý parameter inštrumentov). Najdôležitejšími predpokladmi teórie sú: 1. Všetci investori sú averzní k riziku 2. Očakávané výnosy ich rozptyly a kovariancie všetkých aktív sú známe 3. Investori sa len na základe 3 kľúčových parametrov (z bodu 2) vedia rozhodnúť pre optimálne portfólio (= kľúčový predpoklad teórie) 4. Abstrahujeme od transakčných nákladov a daní Averzia k riziku u všetkých investorov neznamená že všetci investori preferujú rovnaké portfóliá. Znamená to že každý investor si vyberie pri výbere spomedzi dvoch aktív s rovnakým očakávaným výnosom ten inštrument ktorý má menšie riziko. Na Obrázku 1 je zobrazená prípustná množina investičných príležitostí pre investorov ktorá je reprezentovaná plochou medzi parabolou a predstavuje súbor všetkých možných kombinácií jednotlivých inštrumentov. Nakoľko sú však všetci investori racionálni a averzní k riziku (Predpoklad 1) množina investičných príležitostí sa zredukuje z plochy na krivku krivka minimálneho rozptylu ( parabola ). Riziková averzia nám zabezpečí to že investori budú pri rovnakom výnose požadovať čo najnižší výnos preto akýkoľvek bod na ploche (individual assets na Obrázku 1) bude dominovaný bodom z krivky minimálneho rozptylu. To však nie je ešte všetko dokonca aj niektoré body na krivke minimálneho rozptylu nie sú optimálne nakoľko body z hornej časti paraboly dominujú body z dolnej časti paraboly t.j. body v hornej časti ponúkajú pri rovnakom riziku (štandardnej odchýlke) vyšší výnos. A tak sa dostávame k efektívnej krivke ktorá reprezentuje len hornú časť krivky minimálneho rozptylu. Na tejto efektívnej krivke sa nedá jednoznačne určiť ktoré portfólio je lepšie pokiaľ nemáme údaj o bezrizikovej úrokovej miere (risk free rate). Ak ho máme tak vieme viesť dotyčnicu z bodu bezrizikovej úrokovej miery ku efektívnej krivke a dostaneme sa na tzv. optimálne rizikové portfólio (na Obrázku 1 Tangency portfolio). Dotyčnicové portfólio reprezentuje také váhy jednotlivých inštrumentov ktoré spoločne prinášajú najväčší očakávaný výnos na jednotku rizika inými slovami portfólio má najvyšší Sharpe-ho koeficient veličina ktorá predstavuje jednu z najrozšírenejších ukazovateľov výkonnosti. Obrázok 1: Krivka minimálneho rozptylu Efektívna krivka (zdroj: wikipedia.org) Krivka minimálneho rozptylu sa dá vyjadriť aj matematicky ako súbor niekoľkých rovníc ktorými definujeme hľadanie minimálneho rozptylu a očakávaného výnosu jednotlivých portfólií. Popri tom nesmieme zabudnúť na definovanie ohraničení najtypickejším býva zamedzenie predaja inštrumentov v portfóliu nakrátko t.j. váhy jednotlivých inštrumentov

33 FORUM STATISTICUM SLOVACUM 7/ musia byť kladné. V prvej rovnici definujeme minimálny rozptyl (Min σ 2 p) portfólia pomocou váh jednotlivých inštrumentov (w) a ich kovariančnej matice pri danom očakávanom výnose portfólia ktorý je definovaný v druhej rovnici. Výnos celého portfólia (E(R p )) je daný váženým priemerom výnosov jednotlivých inštrumentov (E(R i )) pričom súčet váh jednotlivých inštrumentov (iba nezáporné hodnoty) sa musí rovnať 100% - Rovnica 3. N N 2 Minσ = w w Cov( R R ) (1) p i= 1 j= 1 N i= 1 i j i j E( R ) = w E( r ) (2) p i i N w i i= 1 = 1 kde w 0 ; i=12...n (3) i Výber optimálneho portfólia môže byť ešte doplnený o voľbu investora v akom pomere bude alokovať jeho investície do rizikového (optimálneho dotyčnicového) portfólia a bezrizikového aktíva. Na Obrázku 1 si toto rozhodovanie môžeme predstaviť ako výber ktoréhokoľvek bodu na dotyčnici (CAL t.j. capital allocation line). To už závisí od rizikovej preferencie investora (vyjadrená tzv. indiferečnou krivkou). Všetky body na dotyčnici majú rovnaký sklon dotyčnice t.j. rovnaký Sharpe-ho koeficient Rovnica 4. S = E( R p ) r f σ p (4) Klasický mean-variance prístup sa dá napríklad využiť na rýchly odhad toho či zvažované aktívum sa hodí do súčasého portfólia investora alebo nie. Kľúčovou je v tomto prípade korelácia zvažovaného aktíva s celkovým už existujúcim portfóliom. Jednoducho povedané ide o vyjadrenie toho do akej miery predstavuje zvažované aktívum diverzifikáciu. Ak vynásobíme touto koreláciou Sharpe-ho koeficient portfólia a porovnáme výsledok s očakávaným Sharpe-ho koeficientom zvažovaného aktíva vieme posúdiť či zvažované aktívum predstavuje vhodný doplnok do portfólia alebo nie. Korelácia zohráva dôležitú úlohu aj v ďalšom praktickom využití kde vieme pomerne rýchlo odhadnúť celkové riziko portfólia ak poznáme priemerné riziko jednotlivých inštrumentov a ich priemernú koreláciu Rovnica ρ σ p = σ + ρ n Klasický mean-variance prístup však čelí aj rôznym nástraham ako napríklad potrebe poznať príliš veľké množstvo parametrov a historických údajov ktoré sú častokrát nedostupné. Ešte väčšiu limitáciu tohto prístupu predstavuje nestabilita krivky minimálneho rozptylu resp. jej príliš veľká citlivosť na zmenu vstupných údajov na ktorú poukážem aj v praktickej časti tohto príspevku. Uvedené nedostatky modelu primäli mnohých akademikov i portfólio manažérov z praxe k tomu aby prišli s novšími a lepšími prístupmi čo sa im aj sčasti (5)

34 32 FORUM STATISTICUM SLOVACUM 7/2011 podarilo. Je treba podotknúť že aj napriek zastaralosti Markowitzovho prístupu je tento prístup (modifikovanou) súčasťou mnohých súčasných modelov v portfólio manažmente. 3. Praktická aplikácia Markowitzovho modelu Použité dáta filtrovanie dát Na vytvorenenie portfólia podľa Markowitzovho prístupu je potrebný zoznam jednotlivých inštrumentov z ktorých potom vyskladáme optimálne portfólio. Ako však získať zoznam inštrumentov? Pri prehľadávaní databáz inštrumentov v informačnom portáli Bloomberg som zistil že ponúka až niečo vyše 600 tisíc inštrumentov (pre zjednodušenie hovoríme len o investíciách do akcií) do ktorých by sa dalo teoreticky investovať preto nastavenie vhodných filtračných kritérií sa javí ako nevyhnutné. V mojom prípade išlo o súbor najmä týchto kritérií: - Inštrument/Akcia sa aktívne obchoduje na trhoch vyspelých alebo rozvojových krajín s výnimkou Afriky - Akcia je vydaná spoločnosťou ktorá má trhovú kapitalizáciu aspoň 3 mld. USD - Akcia je vydaná spoločnosťou ktorá má tzv. quick ratio aspoň 2 (ukazovateľ okamžitej likvidity) - Akcia mala dividendový výnos aspoň 15% - Priemerná obchodovanosť s akciou za posledných 30 dní bola minimálne 1 mil. ks za deň (odstraňujem nelikvidné inštrumenty) Vďaka týmto a ďalším kritériam som sa dostal zo 600 tisíc inštrumentov na 75. To už predstavuje racionálny vstup pre optimalizačný model využívajúci Markowitzov prístup. V ďalšom kroku som zozbieral historické dáta cien jednotlivých inštrumentov za obdobie od roku 2009 na základe ktorých budú vypočítané kľúčové parametre jednotlivých inštrumentov a to historický výnos ich rozptyl a kovariancia. Štatistický softvér kvantitatívne metódy Pre výpočty jednotlivých parametrov som použil matematický a štatistický softvér Matlab so špeciálnym vybavením Financial Toolbox pre finančnú matematiku ako aj Microsof Excel s Visual Basicom. Komunikáciu medzi programami zabezpčuje tzv. Spreadsheet link čo som využil na spracovávanie a manipuláciu dát v Exceli následný export informácií do Matlabu a na záver spätný import výsledkov z matlabu do Excelu. Pomocou špeciálnych funkcií v Matlabe (ewstats portcons portopt portalloc...) som využil mean-variance Markowitzov prístup ktorý som podrobne opísal v predošlej teoretickej kapitole. Pri optimalizácii portfólia som ešte navyše aplikoval tzv. Asset constraints a Group constraints čo znamená že na váhu každého inštrumentu som uvalil podmienku že sa môže nachádzať len v rozmedzí 0 až 1 (pri uvoľnení tejto podmienky sa naplno prejavila limitácia tohto modelu v podobe poskytovania extrémnych hodnôt ako tých ktoré sú optimálne čo sa ale v praxi nedá aplikovať). Pri group constraints som každý jeden z inštrumentov zaklasifikoval do jednej z 10 kategórií investičných sektorov (energy utilities financial technology...) na ktoré som potom uvalil ďalšie obmedzenia typu investuj do všetkých akcií vo finančnom sektore nie viac ako 10%... Je treba podotknúť že tieto obmedzenia sa dajú veľmi flexibilne meniť a upravovať podľa potrieb alebo momentálnej situácie na trhu. Pri Markowitzovom prístupe sa častokrát práve tieto obmedzenia stávajú kľúčovým a určujúcim prvkom pri alokácií aktív. Výsledky praktickej aplikácie modelu Na základe Markowitzovho modelu použitých niektorých predpokladov (napr. že rok má 250 pracovných dní bezriziková úroková miera je 1%...) a obmedzení jednotlivých inštrumentov som sa dostal k výsledku optimálneho portfólia ktoré pozostáva len z 24 inštrumentov.

35 FORUM STATISTICUM SLOVACUM 7/ Môžeme si výsledok teda inerpretovať tak že zvyšné akcie spomedzi 75 možných inštrumentov boli dominované práve týmito 24 inštrumentmi vrámci daných podmienok a obmedzení. Na Obrázku 2 je vidno rozloženie váh medzi jednotlivými inštrumentmi v portfóliu. Nakoľko konkrétne mená inštrumentov nie sú dôležité v grafe sú znázornené ako čísla od 1 po 24. Obrázok 2: Váhy jednotlivých inštrumentov v Optimálnom portfóliu Vypočítanie váh optimálneho portfólia ma však neuspokojilo chcel som vidieť akú malo dané optimálne portfólio výkonnosť od doby kedy som ho vypočítal (t.j. 27. Septembra 2011). Na Obrázku 3 môžeme vidieť porovnanie výkonnosti optimálneho portfólia (TOMEQ1_OPT2) vs. výkonnosť používaného benchmarkového indexu MSCI World (MXWO) počas doby od do Vidíme že počas sledovaného obdobia sa optimálnemu portfóliu darilo o niečo lepšie ako benchmarku avšak v závere sledovaného obdobia sa dostala výkonnosť optimálneho portfólia tesne pod benchmark. Obrázok 3: Zhodnotenie výkonnosti optimálneho portfólia (zdroj: Bloomberg) 4. Záver Cieľom tohto článku bolo prezentovať klasický mean-variance prístup Markowitzovho modelu ako aj jeho praktickú aplikáciu na reálne dáta. V príspevku som poukázal na základné predpoklady Markowitzovho modelu na jeho možné využitie ako aj jeho nedostatky. Práve jeho nedostatky a obmedzenia nás nútia hľadať lepšie spôsoby a metódy na optimalizovanie portfólií. Jeho prelomový prínos do sveta financií je však nespochybniteľný. Po vysvetlení teórie modelu nasledovala jeho praktická aplikácia na reálne dáta. Tu sme sa vďaka

36 34 FORUM STATISTICUM SLOVACUM 7/2011 filtrovaniu veľkého množstva dát (tzv. equity screening procesom) dostali k reálne použiteľnej a aplikovateľnej vzorke dát ktorú sme ďalej optimalizovali vo vyššie spomenutom modeli. Z historických údajov boli vypočítané kľúčové parametre pre Markowitzov model ktorý bol doplnený ešte o ďalšie predpoklady a obmedzenia. Výsledkom aplikácie bol výber konkrétnych akciových titulov a ich váh v optimálnom portfóliu. Výkonnosť takto vytvoreného portfólia bola sledovaná za posledné obdobie a porovnaná s relevantným benchmarkom. Skladba takéhoto portfólia nepredpokladá časté úpravy váh ako aj transakčné náklady. Na zhodnotenie výkonnosti portfólia by bolo vhodné ho sledovať počas dlhšieho obdobia kde by sa možno mohli prejaviť aj nedostatky tohto modelu vo väčšej miere. Na záver je treba ale skonštatovať že mean-variance prístup predstavuje aspoň vhodný prvotný návrh skladby portfólia ktorý sa ďalej dá modifikovať podľa potrieb investora. 5. Literatúra [1] DeFusco R.A. McLeavy D.W. Pinto J.E. Runkle D.E Quantitative Methods for Investment Analysis CFA Institute. [2] Markowitz H Portfolio selection. In: Journal of Finance Vol. 7 pp [3] Mlynarovič V Finančné investovanie. Teórie a aplikácie. Edícia Ekonómia Bratislava. Adresa autora: Tomáš Cár Mgr. MSc. MBA VÚB Asset Management Mlynské Nivy Bratislava tcar@vubam.sk

37 FORUM STATISTICUM SLOVACUM 7/ Výpočet demografické prognózy s rozlišením úrovně vzdělání metodou vícestavové demografie Computation of Demographic Projection Distinguishing the Education Level by the Multistate Demography Method Tomáš Fiala Jitka Langhamrová Martina Miskolczi Abstract: The output of "classical" population projections is usually the sex and age structure of the population in each year of the projected period. This provides no information about the "quality" of the population e.g. about the present situation and expected development of the professional qualification of the people. As a very simple (and of course very rough) measure of the professional qualification of a person can be regarded its education level. This paper describes very briefly the methodology of a population projection not only by sex and age but also by education level. Key words: population projection education level multistate demography Klíčová slova: populační projekce úroveň vzdělání vícestavová demografie JEL classification: AO 1. Úvod Výstupem klasických demografických projekcí je složení obyvatelstva podle pohlaví a věku. Neposkytuje žádnou informaci o kvalitativní stránce populace. Článek popisuje metodiku výpočtu populační projekce s rozlišením úrovně vzdělání obyvatelstva. 2. Metodologie Výpočet populační prognózy s rozlišením úrovně vzdělání jednotlivých členů populace lze provést metodou vícestavové projekce kde kromě pohlaví a věku rozlišujeme u každého jedince též další znak stav v tomto případě úroveň nejvyššího dokončeného vzdělání. Celá populace je tak rozdělena na několik subpopulací odpovídajících jednotlivým úrovním vzdělání. Pro jednoduchost uvažujme pouze čtyři základní úrovně vzdělání. A základní vzdělání (včetně žádného nebo nedokončeného vzdělání) ISCED 0 2 B střední vzdělání bez maturity ISCED 3C 4C C střední vzdělání s maturitou ISCED 3A 3B 4A D terciární vzdělání (konzervatoř vyšší odborná škola vysokoškolské vzdělání) ISCED 5 6. V dalším textu budeme jednotlivé úrovně vzdělání často označovat pouze výše uvedenými písmeny A B C resp. D. Osoba se základním vzděláním může v ČR dosáhnout buď středního vzdělání bez maturity ale i (což je poměrně časté) přímo středního vzděláni s maturitou. Protože maturitní zkouška je podmínkou přijetí na vysokou školu musí osoba se středním vzděláním bez maturity dosáhnout nejprve středního vzdělání s maturitou teprve poté může eventuálně dosáhnout terciárního vzdělání. Z tohoto schématu se poněkud vymyká vzdělávání v konzervatoři. Jejími žáky jsou absolventi základních škol (tj. osoby s pouze základním vzděláním) absolvování konzervatoře je však považováno za dosažení terciárního stupeň vzdělání. Absolventi konzervatoří tedy jako jediní přeskočí úroveň středního vzdělání a z úrovně A (základní

38 FORUM STATISTICUM SLOVACUM 7/ vzdělání) mohou dosáhnout přímo úrovně D (terciární vzdělání). Jedná se však o poměrně malé počty osob. Jsou tedy možné pouze následující změny úrovně vzdělání: A B A C A D B C C D. Schématicky jsou možní způsoby zvyšování vzdělání znázorněny na Obr. 1. Případy zpětné ztráty dosaženého vzdělání (například odebrání titulu v důsledku zjištění podvodného jednání při studiu) jsou velmi řídké neuvažujeme je. Obr. 1. Možné způsoby zvyšování úrovně vzdělání Protože skupina A zahrnuje též osoby bez vzdělání je každé narozené dítě automaticky zařazeno do této skupiny bez ohledu na úroveň vzdělání své matky. U projekce s imigrací musíme každého imigranta podle nějakého kritéria zařadit do určité subpopulace. Změnu úrovně vzdělání je možno z metodologického hlediska považovat za migraci z populace s nižší úrovní vzdělání do populace s vyšší úrovní vzdělání. Na rozdíl od běžné migrace k níž dochází během celého roku a kde jsme tedy předpokládali její rovnoměrné rozložení během roku by v tomto případě uvedený předpoklad nebyl příliš vhodný. Ke zvýšení úrovně vzdělání dochází formálně ukončením studia na příslušné škole což je obvykle v polovině kalendářního roku. Současně předpokládáme rovnoměrné rozdělení data narození během roku. Předpokládáme tedy že ke zvýšení úrovně vzdělání dochází vždy přesně v polovině roku přičemž polovina absolventů je v tomto okamžiku již po narozeninách druhá polovina teprve před narozeninami. Vzorce pro výpočet populační prognózy s rozlišením úrovně vzdělání mají tedy tvar 1/ / 1 2 1/ 1 1/3 1 2/ x A t x D t A x D t A x A t x C t A x C t A x A t x t B A x B t A x A t x A t x A t x A t x A t x A t x t A P G G P G G P G G P I P I P S S = (1) 2 1/ 1 2 1/ 1 1/ / x t B x t C B x t C B x t B x t B A x t B A x t B x t B x t B x t B x t B x t B x t B P G G P G G P I P I P S S = (2) 2 1/ 1 2 1/ 1 2 1/ 1 3 1/ 1 2 / x t C x D t C x D t C x t C x t C B x t C B x t C x t C A x t C A x t C x t C x t C x t C x t C x t C x t C P G G P G G P G G P I P I P S S = (3) 2 1/ 1 2 1/ 1 1/3 1 2/ x D t x D t C x D t C x D t x D t A x D t A x D t x D t x D t x D t x D t x D t x t D P G G P G G P I P I P S S = (4)

39 FORUM STATISTICUM SLOVACUM 7/ kde S Etx je počet osob s úrovní vzdělání E v dokončeném věku x na začátku roku t P Etx je tzv. projekční koeficient pravděpodobnost že osoba s úrovní vzdělání E jejíž věk na začátku roku t je x let přežije do konce roku t. I Etx je přistěhovalých s úrovní vzdělání E v dokončeném věku x během roku t. AG B t je počet osob které zvýšily své vzdělání ze základního na střední vzdělání bez x maturity ve věku x v roce t AG C t je počet osob které zvýšily své vzdělání ze základního na střední vzdělání x s maturitou ve věku x v roce t AG D t je počet osob které zvýšily své vzdělání ze základního na terciární (absolventi x konzervatoří) ve věku x v roce t B G C t x je počet osob které zvýšily své vzdělání ze středního vzdělání bez maturity na střední vzdělání s maturitou ve věku x v roce t C G D t je počet osob které zvýšily své vzdělání ze středního vzdělání s maturitou na x terciární vzdělání ve věku x v roce t. Protože všechny živě narozené děti (bez ohledu na vzdělání jejich matky) patří do skupiny A (žádné nebo nejvýše základní vzdělání) je prognóza počtu nulaletých osob v jednotlivých subpopulacích jednoduchá a samozřejmě kde N t P t* S A t 1/ 3 I t0 Pt * + 10 = St + 10 = Nt Pt * + 2 (5) S Bt+10 = S Ct+10 = S Dt+10 = 0 (6) je počet živě narozených chlapců (resp. děvčat) v celé populaci (bez ohledu na vzdělání žen) je stejně jako v případě projekce bez rozlišení vzdělání projekční koeficient pro novorozence pravděpodobnost že dítě narozené v roce t přežije do konce roku t. Je známou skutečností že úmrtnost závisí nejen na pohlaví a věku ale i na úrovni vzdělání. Osoby s vyšším vzděláním mají úmrtnost nižší. Při výpočtu projekce proto pro každý stupeň vzdělání uvažujeme obecně jiné projekční koeficienty pravděpodobnosti přežití dalšího kalendářního roku. Rovněž plodnost žen závisí na úrovni jejich vzdělání ženy s vyšším vzděláním mají plodnost nižší. Protože však nemusíme rozlišovat živě narozené děti podle vzdělání jejich matek převezmeme prognózu počtu živě narozených pro každý rok z prognózy celé populace bez rozlišení úrovně vzdělání. Plodnost žen podle vzdělání proto není nutno rozlišovat. Rozlišení úmrtnosti podle dosaženého vzdělání je možno provést na základě úmrtnostních tabulekách podle vzdělání (viz [2]). Pro každou úroveň vzdělání E a pro každý region vypočteme podíly pravděpodobnosti úmrtí osob s danou úrovní vzdělání ku pravděpodobnosti úmrtí osob bez rozlišení vzdělání I q E x E x = qx kde q Ex je pravděpodobnost úmrtí osoby daného pohlaví v přesném věku x s úrovní vzdělání E

40 38 FORUM STATISTICUM SLOVACUM 7/2011 q x je pravděpodobnost úmrtí osoby daného pohlaví v přesném věku x s bez rozlišení úrovně vzdělání. Pravděpodobnosti úmrtí v jednotlivých letech prognózy pro jednotlivé úrovně vzdělání pak byly vypočteny jako násobky obecných pravděpodobností úmrtí pro daný rok (bez rozlišení úrovně vzdělání) a výše zmíněných podílů pro jednotlivé úrovně vzdělání q E t x I E x qt x =. (7) Jako výchozí demografickou strukturu pro výpočet prognózy obyvatelstva podle pohlaví věku a úrovně dosaženého vzdělání použijeme strukturu ze posledního sčítání lidu. Podkladem pro odhad počtů osob které si během jednotlivých let zvyšují úroveň vzdělání jsou počty absolventů jednotlivých typů škol (v ČR publikované ve Výkonové ročence ÚIV). Počty absolventů středních škol konzervatoří ani VOŠ uváděné v této ročence však nejsou tříděny podle věku. Předpokládá se proto obvyklý průběh školní docházky s tím že část žáků má školní docházku o rok odloženou. Protože podíl žáků s odloženou školní docházkou činí zhruba necelých 20 % předpokládali jsme pro zjednodušení výpočtů že do 1. třídy základní školy nastupují pouze žáci kteří dovršili 6 let do 30. června zatímco žáci narození v červenci a v srpnu kterých je zhruba 167 % mají školní docházku odloženou. Jinak řečeno předpokládáme že z žáků kteří zahajují základní školní docházku v roce t je zhruba polovina ročníku narození t-6 a druhá polovina ročníku narození t-7. Za tohoto předpokladu a za předpokladu že nikdo neopakuje ročník je věk absolventů při obvyklém průběhu školní docházky následující: absolvent základní devítileté školy je 15letý absolvent 3leté střední školy (bez maturity) je 18letý zvyšuje si vzdělání z A na B absolvent 4leté střední školy (s maturitou) je 19letý zvyšuje si vzdělání z A na C absolvent 2letého nástavbového studia je 20letý zvyšuje si vzdělání z B na C absolvent konzervatoře je 21letý zvyšuje si vzdělání z A na D. Věkem rozumíme vždy dokončený věk absolventa ke středu roku (k 1.7.) polovina absolventů je tedy vyššího a polovina nižšího ročníku narození. Počty absolventů vysokých škol (zvýšení vzdělání z C na D) jsou tříděny podle věku resp. podle ročníku narození. Pro výpočet projekce byly tedy uvažovány následující hodnoty počtů osob které si zvýšily vzdělání v roce t AG B t18 GB t = A G B t x = 0 pro x 18 (8) AG C t19 GC1 t = A G C t x = 0 pro x 19 (9) BG C t20 GC 2 t = B G C t x = 0 pro x 20 (10) BG C t20 GC 2 t = B G C t x = 0 pro x 20 (11) AG D t21= GDk t A G D t x = 0 pro x 21 (12) kde G Bt je počet absolventů středních škol bez maturity v roce t G C1t je počet absolventů středních škol bez maturity (kromě nástavbového studia) v roce t G C2t je počet absolventů nástavbového studia v roce t G Dkt je počet absolventů konzervatoří v roce t.

41 FORUM STATISTICUM SLOVACUM 7/ Analogicky předpokládáme že všichni absolventi VOŠ jsou 22letítj. C G G D VOŠ) t22 VOŠ t = G = 0 pro x 22 ( C D( VOŠ) t x (13) kde G VOŠt je počet absolventů vyšších odborných škol v roce t. Počty absolventů vysokých škol jsou tříděny podle věku přesněji řečeno podle ročníku narození (tj. věku nikoli ke středu ale ke konci roku). Za předpokladu rovnoměrného rozdělení data narození tedy platí C G D( VŠ ) t x + C G D( VŠ ) t x+ 1 = G VŠ t x+ 1* 2 (14) kde G VŠtx+1* je počet absolventů vysokých škol v roce t ve věku x+1 let. Uvažujeme pochopitelně pouze absolventy bakalářského resp. pětiletého magisterského studijního programu nikoli absolventy navazujícího magisterského studia ani doktorského studia kteří získali terciární vzdělání již v předchozím stupni studia. Symbol * u indexu věku znamená že na rozdíl od absolventů předchozích typů škol uvažujeme u absolventů VŠ věk nikoli k 1.7. ale až na konci roku t. Počet osob jejichž úroveň vzdělání se zvýšila z C na D je součtem počtu absolventů VOŠ a VŠ. Platí tedy + + D t x+ CG + 1 C G ( ) CG ( ) + 1 C G D VOŠ t x D VOŠ t x D( VŠ ) t x CG D t x D( VŠ ) t x+ 1 C G = (15) Protože předpokládáme že všichni absolventi VOŠ jsou 22letí dostáváme C G D t x+ CG G D t x+ 1 VOŠ t = + GVŠ t x+ 1* 2 2 pro x=21 a x=22 (16) C G D t x+ CG D t x + 1 = GVŠ t x+ 1* 2 pro x ostatní. (17) Součástí scénáře této prognózy musí být pochopitelně nejen odhad předpokládaného vývoje plodnosti úmrtnosti a migrace ale i odhad budoucího počtu absolventů jednotlivých typů škol. Pro nejbližší roky lze vycházet z počtu přijatých studentů v předchozích letech a očekávaného podílu úspěšných absolventů. Odhad počtu absolventů v dalších letech je možné založit například na předpokladu že podíl absolventů jednotlivých typů škol vzhledem k počtu všech osob příslušného věku v populaci bude v dalších letech konstantní nebo jen velmi zvolna poroste. Předpoklad že absolutní počty absolventů zůstanou konstantní nebo porostou se nezdá být v ČR realistický neboť v důsledku prudkého poklesu počtu živě narozených v 90. letech dochází k prudkému poklesu počtu potenciálních studentů středních a později i vysokých škol. Po každém kroku výpočtu projekce (za rok t) je vhodné provést korekci počtů osob podle jednotlivých stupňů vzdělání vzhledem k celkovému počtu osob (na základě skutečných počtů nebo na základě klasické projekce bez rozlišení úrovně vzdělání) podle vzorce S ( kor) E t x St x = SE t x (18) S + S + S + S A t x B t x pro každou úroveň vzdělání E=A B C resp. D. Pro další krok výpočtu (pro rok t+1) se vždy použijí korigované hodnoty. C t x D t x

42 40 FORUM STATISTICUM SLOVACUM 7/ Závěr Předností popsané metody je že může poskytnout velmi přesný obraz nejen o celkovém počtu osob příslušné úrovně vzdělání ale i o jejich složení podle pohlaví a věku. Navíc je možno zohlednit úmrtnost populace podle dosaženého vzdělání. Podmínkou dosažení co nejpřesnějších výsledků je však dostupnost kvalitních vstupních dat. Pro přesné výpočty by bylo třeba aby byla k dispozici podrobná data o absolventech jednotlivých typů škol v jednotlivých letech tříděná podle pohlaví jednotek věku a předchozí úrovně vzdělání. Pro účely regionálních analýz by bylo třeba mít navíc k dispozici třídění absolventů ještě podle bydliště alespoň na úrovni sledovaných regionů. Pro výpočet odhadů budoucího vývoje počtu absolventů by samozřejmě bylo potřebná mít výše uvedená data v delší časové řadě aby bylo možné odhadnout předpokládaný vývoj budoucích trendů v čase a rovněž eliminovat vliv eventuálních náhodných odchylek. Při výpočtu prognózy pro ČR byly počty absolventů tříděné podle věku k dispozici pouze pro absolventy vysokých škol. Navíc nejsou tyto údaje tříděny ještě podle kraje bydliště absolventů. U prognózy s migrací by navíc byly třeba věrohodné údaje o vzdělání nejen imigrantů ale i emigrantů a na regionální úrovni rovněž údaje o vzdělání vnitřních migrantů (osob stěhujících se v rámci ČR za hranice kraje). Při výpočtu prognózy proto musela být přijata řada zjednodušujících předpokladů které pochopitelně mohly mít za následek menší přesnost výsledků. 4. Literatura [1] LANGHAMROVÁ Jitka FIALA Tomáš FISCHER Jakub HULÍK Vladimír KAČEROVÁ Eva KONRÁDOVÁ Jitka MAZOUCH Petr MISKOLCZI Martina ŠŤASTNOVÁ Pavlína. Prognóza lidského kapitálu obyvatelstva České republiky do roku Praha : Oeconomica s. [2] ZEMAN K Úmrtnostní tabulky podle nejvyššího ukončeného vzdělání Česká republika Demografie 48 (2006) č. 3 s Adresa autorů: Tomáš Fiala RNDr. CSc. katedra demografie fakulta informatiky a statistiky VŠE Praha nám. W. Churchilla Praha 3 fiala@vse.cz Jitka Langhamrová doc. Ing. CSc. katedra demografie fakulta informatiky a statistiky VŠE Praha nám. W. Churchilla Praha 3 langhamj@vse.cz Mgr. Ing. Martina Miskolczi MBA katedra demografie fakulta informatiky a statistiky nám. W. Churchilla Praha 3 martina.miskolczi@vse.cz Tento článek byl zpracován za podpory prostředků institucionální podpory VŠE IP na dlouhodobý koncepční rozvoj vědy a výzkumu na Fakultě informatiky a statistiky VŠE v Praze na rok 2011.

43 FORUM STATISTICUM SLOVACUM 7/ Předpokládaný vývoj úrovně vzdělání populace České republiky v letech Expected Development of the Education Level of the Population of the Czech Republic in the Period Tomáš Fiala Jitka Langhamrová Martina Miskolczi Abstract: The classical population projection gives no information about the qualitative side of the population. Possible information about the skills and working qualification of a person provides the education level. This article contains the population projection of the Czech Republic and its regions according to sex age and education level until 2050 arising from the latest demographic projection. Differences in mortality according to education level are taken into account in computations. According to the projection the proportion of tertiary educated people will grow very rapidly and the differences in education level between males and females will diminish. Key words: population ageing population projection human capital education level the Czech Republic Klíčová slova: stárnutí populace populační projekce lidský kapitál úroveň vzdělání Česká republika JEL classification: AO BB 1. Úvod Jedním z často diskutovaných témat dnešní doby je stárnutí populace spojovaný s hledáním odpovědi na otázky zda a jak bude možné zajistit financování důchodů či poskytování sociální a zdravotní péče. V důsledku pokračujícího růstu délky života se bude i nadále zvyšovat podíl starších lidí v populaci a naopak mladších osob i osob v produktivním věku bude vzhledem k nízké plodnosti dále ubývat. Tyto úvahy jsou však pouze úvahami o vývoji počtů osob a neberou v úvahu produktivní schopnosti člověka kvalitativní stránku lidského kapitálu. Otázkou je jakým způsobem lidský kapitál měřit. Podstatným nedostatkem většiny navrhovaných metod jsou chybějící údaje nutné pro kvantifikaci. Za jednoduchou i když velmi nedokonalou měřitelnou charakteristiku lidského kapitálu která se velmi často používá lze považovat dosažený stupeň vzdělání. Článek obsahuje hlavní výsledky prognózy vývoje úrovně vzdělání populace České republiky vycházející z nejnovější demografické projekce. Protože při obvyklém průběhu školní docházky předpokládáme dosažení terciárního stupně vzdělání ve věku dokončených let jsou souhrnné výsledky uváděny pouze pro osoby 25leté a starší. 2. Metodologie výpočtu a scénáře demografické prognózy Základem výpočtu prognózy vzdělanostní struktury byla klasická demografická prognóza obyvatelstva ČR vypočtená komponentní metodou bez rozlišení úrovně vzdělání zpracovaná ve dvou variantách. Prahovou demografickou strukturou bylo složení obyvatelstva České republiky podle pohlaví a jednotek věku k První varianta (tzv. varianta ČSÚ) byla kombinací nízké a střední varianty prognózy Českého statistického úřadu z roku 2009 korigovaná podle nejnovějších dostupných dat. Pro druhou variantu (varianta NL) se předpokládalo že plodnost českých žen bude s jistým časovým zpožděním kopírovat plodnost žen Nizozemska. Nizozemsko bylo vybráno z toho důvodu že se jedná o populaci kde již proběhla transformace plodnosti do vyššího věku a

44 42 FORUM STATISTICUM SLOVACUM 7/2011 úroveň i struktura plodnosti je zde poměrně stabilní. Navíc se jedná o populaci geograficky nepříliš vzdálenou a co do velikosti v jistém smyslu srovnatelnou s Českou republikou. Trendy populačního vývoje jsou v obou variantách prognózy totožné předpokládané tempo vývoje se však liší. Nizozemská varianta předpokládá vyšší růst plodnosti rychlejší růst střední délky života i vyšší migrační přírůstek než varianta ČSÚ. Variantu ČSÚ tedy můžeme označit jako nízkou variantu NL pak jako vysokou. Obě varianty předpokládají další růst plodnosti i když mírnějším tempem než v posledních letech. V obou variantách se rovněž uvažuje pokračování růstu střední délky života. I nadále se předpokládalo že Česká republika zůstane zemí imigrační avšak že migrační přírůstky budou výrazně nižší než v letech 2007 a 2008 (kdy se pohybovaly okolo tisíc osob ročně). Správnost tohoto předpokladu potvrdil rok 2010 kdy hodnota migračního přírůstku byla zhruba pouze 15 tisíc osob. Předpokládaný vývoj plodnosti úmrtnosti a migrace v obou variantách zachycuje následující tabulka. Tab. 1: Scénáře demografické prognózy Characteristika Varianta Úhrnná plodnost ČSÚ NL Střední délka života ČSÚ novorozence muži NL Střední délka života ČSÚ novorozence ženy NL Saldo migrace ČSÚ NL Zdroj: vlastní předpoklady Získaná populační projekce byla základem pro prognózu výkonů vzdělávací soustavy. Výpočet populační prognózy s rozlišením úrovně vzdělání jednotlivých členů populace lze provést metodou vícestavové projekce kde kromě pohlaví a věku rozlišujeme u každého jedince též další znak stav v tomto případě úroveň nejvyššího dokončeného vzdělání. Celá populace je tak rozdělena na několik subpopulací odpovídajících jednotlivým úrovním vzdělání. Každé narozené dítě je automaticky zařazeno do skupiny s nejnižší úrovní vzdělání Změnu úrovně vzdělání je možno z metodologického hlediska považovat za migraci z populace s nižší úrovní vzdělání do populace s vyšší úrovní vzdělání. Pro jednoduchost jsme uvažovali pouze čtyři základní úrovně vzdělání. A základní vzdělání (včetně žádného nebo nedokončeného vzdělání) ISCED 0 2 B střední vzdělání bez maturity ISCED 3C 4C C střední vzdělání s maturitou ISCED 3A 3B 4A D terciární vzdělání (konzervatoř vyšší odborná škola vysokoškolské vzdělání) ISCED 5 6. Ve vzdělávacím systému ČR jsou možné pouze následující změny úrovně vzdělání: A B A C A D B C C D. Podrobnější popis metodologie výpočtu je v samostatném příspěvku. Výchozími daty bylo složení obyvatelstva podle pohlaví věku a nejvyššího dokončeného vzdělání převzaté ze Sčítání lidu domů a bytů Prognóza byla vypočtena standardní vícestavovou komponentní metodou pro čtyři výše uvedené skupiny. Úmrtnost byla rozlišována podle dosaženého stupně vzdělání. Při zařazení imigrantů do jednotlivých vzdělanostních skupin se předpokládalo že struktura imigrantů podle vzdělání je stejná jako struktura obyvatelstva ČR. Odhad budoucího počtu absolvenů

45 FORUM STATISTICUM SLOVACUM 7/ škol vycházel z počtu přijatých v posledních letech a z předpokladu že podíl studentů v populaci se již v dalších letech nebude zvyšovat. 3. Hlavní výsledky demografické prognózy Obě varianty projekce dávají na první pohled diametrálně odlišné výsledky. Podle varianty ČSÚ se počet obyvatel ČR (Obrázek 1) během následujících 15 let přiblíží k 108 milionům ale poté začne po krátké stagnaci klesat. V roce 2050 bude podle této varianty počet obyvatel ČR zhruba stejný jako v roce 2010 tj. o málo vyšší než 105 milionu. Naproti tomu podle varianty NL předpokládající vyšší plodnost rychlejší růst střední délky života i vyšší migrační přírůstek počet obyvatel ČR trvale poroste a v roce 2050 bude téměř o 12 milionu vyšší než v roce Zcela rozdílný charakter má i vývoj počtu živě narozených a zemřelých (Obrázek 2). Podle varianty ČSÚ nastane ještě před rokem 2020 okamžik kdy počet živě narozených bude (podobně jako v období ) opět nižší než počet zemřelých. Tento stav zůstane zachován trvale přičemž přirozený úbytek obyvatelstva ČR se bude stále zvyšovat. Kolem roku 2050 by již mohl být roční počet narozených o zhruba 35 tisíc nižší než počet zemřelých. Podle varianty NL nastane přirozený úbytek obyvatelstva v ČR o několik let později pravděpodobně až po roce Rozdíly mezi počtem narozených a zemřelých nebudou příliš výrazné navíc se vzhledem k vyšší plodnosti a migraci začnou po roce 2030 snižovat. Koncem první poloviny tohoto století lze podle této varianty očekávat že roční počet živě narozených bude opět téměř na úrovni počtu zemřelých. Obrázek 1: Očekávaný vývoj počtu obyvatel ČR varianta NL l te a v y b t o e č o p varianta ČSÚ year Zdroj: Langhamrová aj. (2011)

46 44 FORUM STATISTICUM SLOVACUM 7/2011 Obrázek 2: Očekávaný vývoj počtu živě narozených a zemřelých v ČR varianta ČSÚ zemřelí varianta NL zemřelí varianta NL živě narození varianta ČSÚ živě narození Zdroj: Langhamrová aj. (2011) Je těžké říci která z uvedených variant vývoje je pravděpodobnější. Poslední demografická data svědčí o poklesu úhrnné plodnosti v ČR. Je často diskutovanou otázkou zda jde pouze o krátkodobý fenomén či zda se jedná o dlouhodobou (nebo dokonce trvalou) změnu předchozího trendu růstu plodnosti. Ještě větší výkyvy zaznamenává vývoj migračního přírůstku. Další vývoj migrace asi do značné míry závisí především na vývoji ekonomické situace v ČR i ve světě. Pouze vývoj střední délky života je poměrně stabilní její hodnoty pro muže i ženy trvale rostou. V každém případě je zřejmé že za předpokladu dalšího růstu plodnosti růstu střední délky života a trvale kladného migračního salda nebude v České republice v nejbližších desetiletích docházet k výraznému úbytku obyvatelstva. I přes poměrně velkou odlišnost výsledků prognózy počtu obyvatel (podle jednotlivých variant se v roce 2050 liší o téměř 13 %) jsou rozdíly ve struktuře obyvatelstva podle dosažené úrovně vzdělání zanedbatelné a v následujících grafech by nebyly vůbec patrné. Proto jsou tyto grafy i doprovodné texty uváděny pouze variantu NL. Prognóza budoucího vývoje do roku 2050 vycházející ze současné situace předpokládá že nejvýrazněji poroste podíl osob s dokončeným terciárním vzděláním. V případě mužů by tento podíl měl vzrůst až k hodnotě 38 % u žen dokonce na úroveň ještě o něco málo vyšší. U mužů bude tento růst kompenzován poklesem podílu dnes nejsilnější skupiny osob se středním vzděláním bez maturity který se v průběhu doby bude snižovat z dnešních 45 % na přibližně 27 %. U žen je pak nárůst podílu nejvzdělanější skupiny kompenzován silným poklesem podílu skupiny s nejnižším vzděláním tedy pouze základním. Očekáváme pokles z dnešních téměř 22 % na budoucí hodnotu kolem 7 %. Viz Obrázek 3.

47 FORUM STATISTICUM SLOVACUM 7/ Obrázek 3: Očekávaný vývoj počtu živě narozených a zemřelých v ČR 100% 90% Muži terciární vzdělání 100% 90% 80% 80% 70% 70% 60% 50% střední vzdělání s maturitou 60% 50% 40% 40% 30% 20% střední vzdělání bez maturity 30% 20% 10% 10% základní vzdělání 0% 0% % 90% Ženy terciární vzdělání 100% 90% 80% 80% 70% 70% 60% 50% střední vzdělání s maturitou 60% 50% 40% 40% 30% 20% střední vzdělání bez maturity 30% 20% 10% základní vzdělání 10% 0% 0% Zdroj: Langhamrová aj. (2011)

48 46 FORUM STATISTICUM SLOVACUM 7/ Závěr V ČR lze však očekávat další nárůst úrovně vzdělanosti populace. O něco se ještě sníží podíl osob pouze se základním vzděláním podíl osob s terciárním vzděláním naopak několikanásobně vzroste. Úroveň vzdělání žen se vyrovná úrovni vzdělání mužů. Prognóza jasně ukazuje že populace ČR bude v roce 2050 vzdělanější než v současné době její lidský kapitál se zvýší. Celková délka školní docházky a dosažená úroveň vzdělání je pochopitelně velmi hrubou charakteristikou kvality člověka a jeho potenciálního přínosu pro společnost. Navíc je důležitá nejen kvantita ale i kvalita vzdělání. Často se diskutuje například o tom zda zvyšování podílu osob dosahujících vysokoškolského vzdělání nebude spojeno s určitým poklesem kvality tohoto vzdělání. Navíc lze stále více očekávat že vzdělávání osob neskončí absolvováním formálního vzdělávání ve škole ale bude pokračovat různými formami celoživotního vzdělávání. 5. Literatura [1] LANGHAMROVÁ Jitka FIALA Tomáš FISCHER Jakub HULÍK Vladimír KAČEROVÁ Eva KONRÁDOVÁ Jitka MAZOUCH Petr MISKOLCZI Martina ŠŤASTNOVÁ Pavlína. Prognóza lidského kapitálu obyvatelstva České republiky do roku Praha : Oeconomica s. [2] ZEMAN K Úmrtnostní tabulky podle nejvyššího ukončeného vzdělání Česká republika Demografie 48 (2006) č. 3 s Adresa autorů: Tomáš Fiala RNDr. CSc. katedra demografie fakulta informatiky a statistiky nám. W. Churchilla Praha 3 fiala@vse.cz Jitka Langhamrová doc. Ing. Csc. katedra demografie fakulta informatiky a statistiky nám. W. Churchilla Praha 3 langhamj@vse.cz Mgr. Ing. Martina Miskolczi MBA katedra demografie fakulta informatiky a statistiky nám. W. Churchilla Praha 3 martina.miskolczi@vse.cz Tento článek byl zpracován za podpory prostředků institucionální podpory VŠE IP na dlouhodobý koncepční rozvoj vědy a výzkumu na Fakultě informatiky a statistiky VŠE v Praze na rok 2011.

49 FORUM STATISTICUM SLOVACUM 7/ Výpočet ceny neproporčního zajištění pomocí Paretova modelu Rating of non-proportional reinsurance using the Pareto model Jan Hrevuš Abstrakt: Zajištění které bývá definováno jako pojištění pojišťoven hraje velmi významnou roli v dnešním světě pojišťovnictví. Pojišťovna pomocí zajištění přesouvá část rizika na zajistitele a pomocí parametrů zajistných smluv vyjadřuje svůj postoj k riziku. Zajistitel přijímá obchod z mnoha geografických oblastí a upisuje různé druhy zajištění čímž diversifikuje své riziko a díky velkým objemům obchodů se může spolehnout na platnost zákona velkých čísel. V článku bude popsáno stanovení ceny obligatorního neproporčního zajištění pomocí Paretova modelu. Abstract: Reinsurance is defined as insurance for insurance companies and plays very significant role in reinsurance industry. Insurance company transfers part of the risk to reinsurers and express its risk appetite by the parameters of its reinsurance programme. Any reinsurer diversifies the assumed business geographically and also per line of business. Due to the diversification and also high volume of business the reinsurer can rely on the law of large numbers. The article deals with rating of non-proportional obligatory reinsurance treaty using Pareto model. Klíčová slova: Neproporční zajištění Pareto XL stanovení ceny zajištění. Key words: Non-proportional reinsurance Pareto XL reinsurance rating. JEL classification: C15 C18 C63 G22 1. Introduction The first known contract with reinsurance characteristics was concluded in 1370 in Genoa. Since that time reinsurance has made significant progress and nowadays creates an integral part of actuarial theory. According to [6] the reinsurance is defined as the transfer of part of the hazards or risks that a direct insurer assumes by way of insurance contract or legal provision on behalf of an insured to a second insurance carrier the reinsurer who has no direct contractual relationship with the insured. The risk reinsurance premium (i.e. net of any profit margin costs etc.) which will be discussed in the article corresponds to the predicted future losses which is the crucial point to estimate. There are three different approaches how to price reinsurance treaties burning cost quotation using the old know losses to calculate sort of as-if price followed by exposure rating using exposure curves and knowledge about the current portfolio and finally probabilistic rating using probabilistic distributions for loss severity and loss frequency. The latest case will be discussed in the article. 2. How the non-proportional reinsurance works There are two different bases of non-proportional (excess-of-loss) treaties. The first is per risk basis when the treaty covers each risk (each single loss) separately. On the other hand in case of per event basis the reinsurance cover is applied on the sum of all losses arising from the same event which is usually the case either of property natural catastrophe or personal accident covers. The per event covers reinsure losses arising out of e.g. floods windstorms earthquakes and it uses theories from meteorology hydrology seismology which are basis for further simulations the rating of per event cover shall not be the topic of this article.

50 48 FORUM STATISTICUM SLOVACUM 7/2011 The treaty risk premium is set as percentage of subject premium base GNPI (gross net premium income) therefore it is defined as (1) where denotes the reinsurance rate. Further each reinsurance treaty contains given deductible (retention of the reinsured) limit (maximum cover granted by reinsurer) and number of reinstatements which shows how many times for given period the cover can be used (refilled). In praxis any XL reinsurance treaty contains more layers and for each of those different parameters apply. The simplified structure of XL reinsurance treaty (only one layer) is shown on figure 1. Fig. 1. Structure of reinsurance excess-of-loss treaty Assuming individual gross loss X the reinsured part of X equals to 3. Pareto model Let N denote the number of claims for a portfolio covered by the scope of reinsurance treaty then the aggregate claim amount Z for given time period is where denotes the individual gross losses and further both X and N are random variables. The claims severity is usually modeled in praxis by Pareto distribution with two parameters a > 0 and b > 0 where the random variable X has a density function and

51 FORUM STATISTICUM SLOVACUM 7/ Further assuming independent random variables with the same probabilistic distribution and random variable and further assuming limited and than has a compound distribution and and One of the most used probabilistic distributions for number of claims distribution with one parameter and probability mass function is the Poisson and The other frequently used distribution for number of claims is Negative Binomial distribution. In many cases there are not enough historical losses exceeding the retention to base the rating only on the burning costs quotation therefore the crucial point when estimating the parameter of the Pareto distribution is choice of appropriate observation point. Such observation point should not be far below the retention (usually is taken 50%-75% of retention) and at the same time there should be enough historical claims to get reliable estimation of parameter. The liability of reinsurer is limited to the limit of layer and the mean individual loss into layer is according to [2] defined as As already discussed there are usually not enough historical losses above the retention therefore the mean number of losses above retention is defined as where denotes the mean number of losses exceeding observation point and denotes the distribution function of Pareto for. Assuming unlimited number of free reinstatements the risk reinsurance premium is defined (from formulas 6 10 and 11) as

52 50 FORUM STATISTICUM SLOVACUM 7/2011 Very important issue is the reliable estimation of the Pareto parameter as usually there are not always enough data for proper use of maximum likelihood estimation and the Rule-ofthumb values has to be further applied. According to [7] the parameter should be in range of 10 to 25 for fire (per risk) business where lower values from this range relate to industrial business whilst the higher values from this range concern to private lines. In respect of Cat perils the range is between 08 and 13 where the values close to 08 characterise Earthquake and the values close to 13 characterise European windstorm. The values of for motor third party liability business are typically in the band between 16 and Alternative distributions for claim severity Use of Pareto distribution in probabilistic rating has many advantages and disadvantages. One of the advantages is that it can be used in many situations (per-risk and per-event programmes) and the underwriter or actuary has certain opinion which values of for which line of business are suitable. The disadvantages are that it is suitable only for nonproportional treaties as due to the choice of any frequency losses cannot be taken into account. Also as Pareto has in this case only one parameter it is not always very flexible to use and another distribution has to be chosen. There are other distributions which are frequently used in praxis they are more flexible as they contain more parameters however they are mathematically difficult to handle as the distribution functions and prices for XL layers can not be expressed by formulas. For this purposes usually Monte Carlo simulation is used. Some further used distributions for claim severity according to [7] are: Generalized Pareto distribution o Suitable for single risk fire losses o Very flexible o Only losses above observation point can be modelled Gamma distribution o Probability of large losses is very small i.e. based on small losses the extrapolated price for the layer might be too cheap o Losses can be modelled from 0 o Suitable for modelling of the whole portfolio Log-gamma distribution o More flexible than Pareto in the lower loss range but similar to Pareto in the upper loss range o Only losses above observation point can be modelled Log-normal distribution o Suitable for modelling of the whole portfolio o Losses can be modelled from 0 o Returns higher probability for large losses than gamma distribution but lower than log-gamma distribution

53 FORUM STATISTICUM SLOVACUM 7/ Example Let s assume 25 incurred already indexed and fully developed losses between 2008 and 2011 where the losses were in the range of EUR to EUR Further the reinsurance structure is as follows: fire per-risk non-proportional reinsurance programme with unlimited free reinstatements where retention of the reinsured limit of the reinsurer observation point and (all figures in EUR) and no further loss is expected to happen (i.e. no influence of IBNR is taken into account). The task is to quote the reinsurance programme for the year It is clear from the range of the incurred losses that the burning costs calculation is not appropriate as the whole limit has never been exhausted historically. The maximum likelihood estimator for Pareto parameter is where According to the formula (13) we get what is in line with thumb values in section 3 of this article. The losses and fitted Pareto CDF are shown on Figure 2. Fig. 2. Empirical cumulative distribution function and Pareto distribution fit for and. The mean number of losses exceeding observation point for the year 2012 can be calculated as historical average number of losses (again assuming stable size of portfolio during time). It is expected 625 losses for From formula (12) we further get the value of risk reinsurance premium of

54 52 FORUM STATISTICUM SLOVACUM 7/2011 From formula (1) the reinsurance rate then equals to. 6. Conclusion The article dealt with the use of Pareto model in rating of non-proportional reinsurance treaties. It was shown how the XL reinsurance works and also it was introduced the theoretical background for practical use of Pareto model. Also some benchmarks for Pareto parameter for different lines of business for applying rule-of-thumb are needed and were introduced in the article. In addition advantages and disadvantages of Pareto and some other probabilistic distributions were discussed and also practical example shown. Literature [1] An Introduction to reinsurance. Swiss Re Zurich (2002) [2] Cipra T.: Zajištění a přenos rizik v pojišťovnictví. Grada Publishing Praha (2004) [3] Cipra T.: Zajištění v pojišťovnictví a jeho matematické aspekty. JČMF Robust (2004) [4] Clark D.R.: Basics of Reinsurance Pricing (1996) [5] Daykin C.D. Pentikäinen T. Pesonen M.: Practical Risk Theory for Actuaries. Chapman & Hall Suffolk (1995) [6] Grossmann M.: Rőckversicherung eine Einfőhrung 3 rd edition. Institut főr Versicherungswirtschaft University of St. Gallen St. Gallen (1990) [7] Schmutz M. Doerr R. R.: The Pareto model in property reinsurance Formulas and applications. Swiss Re Zurich (1998) Adresa autora: Ing. Jan Hrevuš Vysoká škola ekonomická v Praze VIG Re zajišťovna a.s. Fakulta informatiky a statistiky Klimentská 46 Nám W. Churchilla Praha Praha 3 j.hrevus@vig-re.com The research was supported by the internal grant IG

55 FORUM STATISTICUM SLOVACUM 7/ Štruktúry súboru respondentov podľa výkazu Inov 1-99 za rok 2008 za kraje SR podľa počtu zamestnancov File structure of the respondents according to the statement Inov 1-99 in 2008 for region SR by employees Jozef Chajdiak 1 Abstract: In this paper is to analyze the file structure of the survey respondents report Inov 1-99 for region SR based on the number of respondents and the weighted and nominal number of employees. Abstrakt: V príspevku je analýza štruktúry súboru respondentov podľa krajov SR zo štatistického zisťovania výkazu Inov 1-99 vychádzajúca z počtu respondentov a nominálneho a váženého počtu zamestnancov. Key words: Report Inov 1-99 distribution frequency number of employees. Kľúčové slová: Výkaz Inov 1-99 frekvenčná tabuľka počet zamestnancov. JEL classification: C13 O Úvod - Štatistický výkaz Inov 1-99 Štatistické zisťovanie o inováciách Štatistický úrad SR láskavo poskytol riešiteľom úlohy VEGA č. 1/0536/10: Inovácie ako strategický základ zvyšovania konkurenčnej schopnosti SR. Smerovanie meranie a podpora inovačných procesov. špecializované pracovisko na ktorom bol prístupný súbor prvotných údajov získaných z výkazu Inov 1-99 za rok Súbor obsahoval údaje za 2296 vybraných vykazujúcich respondentov zo základného súboru. 2. Metóda analýzy K triedeniu bol použitý systém EXCEL verzie 2007 konkrétne podsystém PivotTable. Tabuľka 1 Kraj ni %n ZAM %ZAM ZAMV %ZAMV % % % % % % % % % % % % % % % % % % % % % % % % Spolu % % % Zisťovali sme (tabuľka 1) počet vykazujúcich respondentov (ni) nominálny úhrn zamestnancov (ZAM) a ich podiel na celkovom vybranom počte zamestancov (%ZAM) vážený úhrn zamestnancov (ZAMV) a ich podiel na celkovom počte zamestancov v základnom súbore (%ZAMV) za súbor spolu a za jednotlivé kraje. 1 Vypracované v rámci riešenia úlohy VEGA č.1/0536/10 Inovácia ako strategický základ zvyšovania konkurenčnej schopnosti SR

56 54 FORUM STATISTICUM SLOVACUM 7/2011 Obrázok 1 Záver Výraznejšie sa odlišuje Bratislavský kraj (1) od ostatných krajov. Prirodzené sú rozdiely v štruktúre podľa počtov respondentov a podľa počtu zamestancov. Vcelku nie príliš veľké rozdiely v štruktúrach podľa vybraných úhrnných počtov zamestnacov a ich váženou verziou svedčia o kvalite výberového súboru. Literatúra [1] CHAJDIAK J ŠTATISTIKA V EXCELI Bratislava: Statis s. ISBN [2] CHAJDIAK J. 2010: Štatistika jednoducho ( 3. vydanie). Bratislava: Statis strán. ISBN [3] TRETIAK O. 2010: Ciele inovačných aktivít v Slovenskej Republike vo firmách v elektrotechnickom priemysle podľa výkazu Inov 1-99 za rok 2008 In. Forum Statisticum Slovacum 2010/6 [4] [5] Výkaz Inov 1-99 [6] Súbor anonymizovaných údajov CIS2008SK. Prameň ŠÚ SR [7] Chajdiak J. Arbe T. Novotná E.: Konkurencieschopnosť inovácvií v SR. Bratislava: Statis s. ISBN [8] Zajko M. A kol.: Inovácie: riadenie hodnotenie podpora financovanie a transfer. Bratislava: Statis s. ISBN [9] Zajko M. A kol.: Inovácie: podniková prax vzdelávanie a teória. Bratislava: Statis s. ISBN Adresa autora: Jozef Chajdiak Doc. Ing. CSc. Ústav manažmentu STU Bratislava Jozef.Chajdiak@stuba.sk

57 FORUM STATISTICUM SLOVACUM 7/ Normalizácia štatistických metód v stratégii šesť sigma Standardization of statistical methods in the six sigma strategy Ivan Janiga Abstract: This article provides information on the standardization of statistical methods in the six sigma strategy. Recent scientific results of the statistical methods are implemented in practice by technical standards which help in the application of statistics in the companies. Key words: ISO standard standardization statistical methods six sigma strategy. Kľúčové slová: ISO norma normalizácia štatistické metódy stratégia šesť sigma. JEL Classification: C1 C Úvod Štatistické metódy sú silným nástrojom riadenia kvality a ich použitie v praxi sa neustále rozširuje. Najnovšie vedecké výsledky z oblasti štatistických metód sa implementujú do praxe pomocou technických noriem ktoré sú nápomocné štatistikom vo firmách. Tvorba noriem v prierezovej oblasti ako sú štatistické metódy je dnes záležitosťou medzinárodnou. Publikované normy sa využívajú v jednotlivých fázach stratégie šesť sigma DIMAIC (definuj meraj analyzuj zlepšuj kontroluj). 2. ISO/TC 69 a jeho úloha Technická normalizačná činnosť z oblasti štatistických metód sa na medzinárodnej úrovni vykonáva v rámci technickej komisie ISO/TC 69 Aplikácia štatistických metód ktorá bola založená v roku 1948 a má sekretariát v sídle Francúzskeho úradu pre normalizáciu (AFNOR) v Paríži. V ISO/TC 69 pracuje šesť subkomisií: ISO TC 69/SC 1 Názvoslovie a značky ISO TC 69/SC 4 Aplikácia štatistických metód v procese riadenia ISO TC 69/SC 5 Výberová prebierka (štatistická prebierka) ISO TC 69/SC 6 Metódy a výsledky merania ISO TC 69/SC 7 Aplikácia štatistických a príbuzných techník v implementácii metódy šesť sigma ISO TC 69/SC 8 Aplikácia štatistickej a súvisiacej metodológie pri vývoji novej technológie a produktu V každej subkomisii pracuje niekoľko pracovných skupín (WG) v ktorých sa tvoria návrhy noriem. Na tvorbe noriem pracujú experti ktorí majú skúsenosti nielen zo štatistiky ale aj zo špeciálnych oblastí jej aplikácie. ISO/TC 69 je zodpovedná za normalizáciu terminológiu prezentáciu a interpretáciu výsledkov skúšok a kontrol. Dozerá tiež na normalizáciu podmienok aplikácie štatistických metód používaných v štatistickom riadení kvality výrobkov a procesov a zabezpečuje funkciu poradného orgánu pre všetky ISO technické komisie pokiaľ ide o aplikáciu štatistických metód. ISO/TC 69 pravidelne spolupracuje s ISO/TC 176 Riadenie a zabezpečovanie kvality ktorá vypracovala normy radu ISO 9000 a s IEC/TC 56 Spoľahlivosť ktorá sa zaoberá

58 56 FORUM STATISTICUM SLOVACUM 7/2011 spoľahlivosťou. Okrem uvedených technických komisií (TC) ISO/TC 69 spolupracuje aj s ďalšími technickými komisiami. 3. TK 71 a jeho úloha Zrkadlovou technickou komisiou k ISO/TC 69 na národnej úrovni na Slovensku je TK 71 Aplikácia štatistických metód v riadení kvality ktorá bola založená na Slovenskom ústave technickej normalizácie (SÚTN) v roku TK 71 zabezpečuje spracovanie národného stanoviska v zmysle Štatútu a rokovacieho poriadku technickej komisie. Vzhľadom na široký rozsah používania noriem z tejto oblasti odbornou verejnosťou ako je priemyselná výroba (hlavne automobilky a ich subdodávatelia) výskumné ústavy zo všetkých oblastí služby vysoké školy atď. TK 71 sa snaží presadiť aby boli tieto normy prístupné odbornej verejnosti v slovenskom jazyku. Od začiatku vykonávam v TK 71 funkciu predsedu a spracovateľa medzinárodnej spolupráce s ISO/TC 69 a jej subkomisiami kde je Slovensko zastúpené ako P-člen (t. j. povinnosť aktívne hlasovať a vyjadrovať sa k rozpracovaným/vydaným normám z tejto oblasti). Do roku 2011 som pracoval ako jediný expert v pracovnej skupine TC 69/WG 3 Statistical interpretation of data (Štatistická interpretácia dát) a v pracovných skupinách patriacich subkomisiám SC 4 a SC 7 kde sa priamo podieľam na tvorbe noriem ISO. Od roku 2011 pracujú ďalší experti v jednotlivých WG: Doc. RNDr. Viktor Witkowský PhD. z Ústavu merania SAV pracuje ako expert v pracovných skupinách (WG) patriacich do subkomisie SC 6 Metódy a výsledky merania. Prof. RNDr. Jozef Komorník DrSc. z Fakulty manažmentu UK je expertom v pracovných skupinách (WG) patriacich do subkomisie SC 5 Výberová (štatistická) prebierka. Dr. h. c. prof. RNDr. Michal Tkáč CSc. z Ekonomickej univerzity reprezentujúci Slovenskú štatistickú a demografickú spoločnosť pracuje v pracovných skupinách (WG) patriacich do subkomisie SC 7 Aplikácia štatistických a príbuzných techník v implementácii metódy šesť sigma. 4. Významný príspevok Slovenska k medzinárodnej normalizácii ISO/TC 69 usporadúva každoročne sedemdňové zasadanie v priebehu ktorého sa konajú plenárne zasadania a zasadania jednotlivých subkomisie SC a pracovné skupiny WG kde sa prerokúvajú konkrétne návrhy noriem. Od roku 2008 keď bolo zasadanie v Pekingu (Čína) sa pravidelne zúčastňujem ročných zasadaní ISO/TC 69 ktoré boli postupne v Kuala Lumpur (Malajzia) v Paríži (Francúzsko) a toho roku v Berlíne (Nemecko). V roku 2008 som sa zúčastnil v Pekingu na zasadaní pracovnej skupiny TC 69/WG 3 ktorá pracuje na sérii noriem s názvom Statistical interpretation of data (Štatistická interpretácia dát). Predniesol som tam návrh v ktorom žiadame aby sa výsledky monografie Garaj I. Janiga I. (2004) Dvojstranné tolerančné medze normálnych rozdelení s neznámymi strednými hodnotami a s neznámym spoločným rozptylom dostali vzhľadom na dôležitosť a potrebu už spomenutej odbornej verejnosti do normy ISO. V diskusii boli námietky týkajúce sa rozsahu výsledkov monografie a niektorých výsledkov ktoré sú zhodné s vydanou normou. Celkove však väčšina expertov zo zúčastnených krajín nebola priaznivo naklonená. Tento problém zostal otvorený s tým že sa musí rozsah výsledkov zredukovať zhodné výsledky s vydanou normou odstrániť a až potom možno diskutovať o forme normalizácie výsledkov. Išlo o to či sa vydá nová norma alebo či sa bude revidovať aktuálna norma ISO (2005) Statistical interpretation of data Part 6: Determination of statistical tolerance intervals v ktorej je citovaná monografia

59 FORUM STATISTICUM SLOVACUM 7/ Garaj I. Janiga I. (2002) Dvojstranné tolerančné medze pre neznámu strednú hodnotu a rozptyl normálneho rozdelenia. V roku 2009 na zasadaní v Kuala Lumpure sa opäť presadzoval uvedený návrh. Z viacerých návrhov sa vybral jeden ktorý obsahoval deväť tabuliek. Boli to tri úrovne spoľahlivosti 1 α = 090; 095; 099 v kombinácii s tromi hodnotami minimálneho podielu hodnôt ρ = 090; 095; 099 ktoré sa nachádzajú vo vypočítanom intervale s danou spoľahlivosťou. Pred zasadaním ISO/TC 69 v Paríži a po odobrení deviatich tabuliek bol pripravený text návrhu normy ISO s názvom Revision ISO (E)-Word document.doc. Na zasadaní TC 69/WG 3 sa tento návrh prediskutoval a v niekoľkých vetách sa vylepšila angličtina. Nakoniec návrh odsúhlasený vo WG 3 následne TC 69 pripravila ako návrh ISO/NWIP Statistical interpretation of data Part 6: Determination of statistical tolerance intervals (Štatistická interpretácia dát. Časť 6: Stanovenie štatistických tolerančných intervalov) ktorý bol odhlasovaný všetkými riadnymi členskými krajinami. Proti bolo iba Japonsko ktoré tvrdilo že výsledky monografie (2004) nemajú praktický význam. Návrh postúpil do štádia CD. Toho roku na zasadaní ISO/TC 69 v Berlíne sa diskutovali pripomienky hlasovania jednotlivých členských krajín (P členov). Hlasovalo 21 členov väčšinou bez pripomienok z ktorých jedine Japonsko bolo proti z rovnakým odôvodnením ako v štádiu NWIP. Stanovisko Slovenska že vo firme Volkswagen ideme použiť (doktorand v DP) výsledky monografie (2004) stačilo na to aby sa pripomienka Japonska neakceptovala. Pracovné stretnutie WG 3 v Bratislave V januári 2012 bude pracovné stretnutie WG 3 na Strojníckej fakulte STU v Bratislave na ktorom pripravíme návrh normy tak aby po ročnom zasadaní v Tokiu (Japonsko) prešiel do štádia DIS. 5. Záver V príspevku sa prezentuje dôležitosť normalizácie štatistických metód a to na medzinárodnej úrovni. Opísala sa činnosť medzinárodnej komisie ISO/TC 69 v oblasti štatistických noriem ISO jej štruktúra a spolupráca s inými TC. Taktiež sa opisuje štruktúra a činnosť TK 71. Nakoniec sa uvádza úspech Slovenska v štatistickej normalizácii na medzinárodnej úrovni. 6. Literatúra [1] GARAJ I. JANIGA I Dvojstranné tolerančné medze pre neznámu strednú hodnotu a rozptyl normálneho rozdelenia. Bratislava: STU s. ISBN [2] GARAJ I. JANIGA I Dvojstranné tolerančné medze normálnych rozdelení s neznámymi strednými hodnotami a s neznámym spoločným rozptylom. Bratislava: STU s. ISBN [3] STRATEGICKÉ VYHLÁSENIE TK na rok Slovenský ústav technickej normalizácie TK 71. [4] TEREK M Kvantitatívne metódy v Navrhovaní pre šesť sigma. In: Forum Statisticum Slovacum 3/2010. ISSN s [5] TEREK M Kvantitatívne metódy v metodológii Šesť sigma. In: Zborník príspevkov z Medzinárodnej vedeckej konferencie Nové trendy Nové nápady konanej na SVŠE v Znojme. Znojmo: SVŠE CD ROM ISBN s

60 58 FORUM STATISTICUM SLOVACUM 7/2011 [6] TEREK M. HRNĆIAROVÁ Ľ Štatistické riadenie kvality. Bratislava: Vyd. IURA Edition s. ISBN [7] PALENČÁR R. RUIZ J. M. JANIGA I. HORNÍKOVÁ A Štatistické metódy v skúšobných a kalibračných laboratóriách. Bratislava: Grafické štúdio Ing. Peter Juriga s. ISBN [8] ISO všetky vydané normy. [9] STN ISO všetky normy dosiaľ prebrané prekladom do sústavy STN. Poďakovanie Tento príspevok vznikol s podporou grantového projektu VEGA č. 1/0543/10: Nové prístupy pri uplatnení metódy šesť sigma pri zlepšovaní kvality produkcie strojárskych. Adresa autora: Ivan Janiga doc. RNDr. PhD. Slovenská technická univerzita Strojnícka fakulta Námestie slobody Bratislava ivan.janiga@stuba.sk

61 FORUM STATISTICUM SLOVACUM 7/ Štúdie variability meradla v stratégii šesť sigma metódou priemerov a rozpätí Gage studies for variables in strategy six sigma by Average and Range Method Ivan Janiga Jozef Kulifaj Abstract: Measurement system plays an important role at the six sigma strategy. The system is satisfactory when the variability due to the measurement process is less than 10 percent of the total variability. That is the reason to do gage studies. There are three most use methods of the gage studies from which we are discussing the average and range method. Key words: repeatability reproducibility. Kľúčové slová: opakovateľnosť reprodukovateľnosť. JEL Classification: C1 C Úvod Existuje niekoľko metód štúdie variability meradla. Najviac používané metódy sú metóda rozpätí metóda priemerov a rozpätí a metóda ANOVA. Všetky tri metódy ignorujú vo svojich analýzach variabilitu v rámci dielca. Metóda rozpätia je štúdia variability meradla ktorá poskytuje rýchle priblíženie hodnoty variability merania. Nerozkladá variabilitu na opakovateľnosť a reprodukovateľnosť. Pri štúdii používa dvoch hodnotiteľov a päť dielcov. Metóda priemeru a rozpätia ( X & R ) je štatistická metóda ktorá poskytuje odhad opakovateľnosti a reprodukovateľnosti systému merania. Na rozdiel od metódy rozpätia umožňuje táto metóda dekomponovať systém merania na dve oddelené zložky variability opakovateľnosť a reprodukovateľnosť. Neuvažuje však s interakciami. Metóda analýzy rozptylu (ANOVA) je štandardná štatistická technika ktorá sa dá použiť na analýzu chýb meraní a ďalších zdrojov variability v dátach zo štúdie systémov meraní. V analýze rozptylu možno variabilitu dekomponovať na štyri kategórie: dielce operátory interakcie medzi dielcami a operátormi a nepresnosť pri opakovaní spôsobená meradlom. 2. Metóda priemeru a rozpätia Metóda priemeru a rozpätia ( X & R ) je štatistická metóda ktorá poskytuje odhad opakovateľnosti a reprodukovateľnosti systému merania. Opakovateľnosť alebo variabilita meracieho zariadenia (EV alebo σ e ) sa určí násobením celkového priemeru rozpätí ( R ) konštantou (K 1 ). Konštanta K 1 závisí od počtu pokusov ktoré sme použili pri štúdii meracieho zariadenia. Teda variabilita meracieho zariadenia sa vypočíta podľa vzorca EV = R K 1 (1) Reprodukovateľnosť alebo variabilita operátora (AV alebo σ o ) sa určí násobením maximálneho rozdielu medzi operátormi ( X DIFF ) konštantou (K 2 ). Hodnota K 2 závisí od počtu operátorov ktorí sa zúčastnili na štúdii meracieho zariadenia. Pretože variabilita operátora je znečistená variabilitou meracieho zariadenia treba ju upraviť odpočítaním

62 60 FORUM STATISTICUM SLOVACUM 7/2011 podielu zodpovedajúceho variabilite meracieho zariadenia. Teda variabilita operátora sa vypočíta podľa vzorca AV = X K EV nr (2) 2 2 ( DIFF 2) ( ) / kde n je počet dielcov a r počet opakovaní. Ak je hodnota vypočítaná pod odmocninou záporná variabilita operátora je rovná nule (AV = 0). Variabilita systému merania na základe opakovateľnosti a reprodukovateľnosti ( R & R alebo σ m ) sa vypočíta tak že štvorec variability meracieho zariadenia sa spočíta so štvorcom variability operátora a tento súčet sa odmocní: R & R ( EV ) ( AV ) 2 2 = + (3) Variabilita medzi dielcami (PV alebo σ ) sa určí násobením priemeru ( R ) konštantou (K 3 ). Hodnota K 3 závisí od počtu dielcov použitých pri štúdii meracieho zariadenia. p 3 p PV = R K (4) Celková variabilita (TV alebo σ t ) sa vypočíta tak že štvorec variability opakovateľnosti a reprodukovateľnosti ( R & R ) sa spočíta so štvorcom variability medzi dielcami (PV) a tento súčet sa odmocní: TV R R PV 2 2 = ( & ) + ( ) (5) Rozlíšenie meracieho prístroja (N) sa vypočíta podľa vzťahu: N = ( PV / R & R) 141 (6) Keď sa vypočítali variability pre každý faktor v štúdii meracieho zariadenia môžu sa porovnať s celkovou variabilitou (TV) podľa vzťahov: % EV = 100 EV / TV (7) % AV = 100 AV / TV (8) % R & R = 100( R & R) / TV (9) % PV = 100 PV / TV (10) Smerodajné úrovne pre prijatie opakovateľnosti a reprodukovateľnosti meracieho zariadenia ( R & R ) sú tieto. Ak je chyba menšia ako 10 % systém merania je prijateľný v intervale 10 % 30 % systém merania môže byť prijateľný na základe dôležitosti aplikácie nákladov na meradlo nákladov na opravy atď. väčšia ako 30 % systém merania vyžaduje zlepšenie; potom treba venovať maximálne úsilie na identifikáciu problémov a urobiť nápravu. 3. Realizácia metódy priemeru a rozpätia v automobilovej firme Metódou priemeru a rozpätia sa analyzoval systém merania hrúbok zinkovej vrstvy na 10 dielcoch z karosérie automobilu. Meranie robili 3 rôzni operátori za rovnakých podmienok a v rovnakom čase. Každý operátor meral každý dielec 3 krát. Čísla dielcov predstavujú: 1 predná kapota; 2 ľavý predný blatník; 3 strecha; 4 ľavé dvere; 5 pravý predný blatník; 6 zadná kapota - horný diel; 7 zadná kapota dolný diel; 8 ľavý bočný diel; 9 pravý bočný diel; 10 pravé dvere. p

63 FORUM STATISTICUM SLOVACUM 7/ Tabuľka 1: Namerané hodnoty s prípravnými výpočtami Namerané hodnoty hrúbok zinkovej vrstvy na jednotlivých dielcoch sú uvedené v tabuľke 1. Táto tabuľka je konštruovaná v softvéry Excel ako výpočtová tabuľka. Z nameraných hodnôt sa automaticky vypočítajú hodnoty premenných potrebných pri výpočtoch vo výpočtovej tabuľke 2: X R p R a X DIFF (pozri tabuľku 1). Výpočty v obidvoch tabuľkách vzájomne súvisia. V tabuľke 1 sú vypočítané aj regulačné medze pre regulačné diagramy priemerov UCL X LCL X a rozpätí UCL R LCL R. Výsledky výpočtov z tabuľky 2 Opakovateľnosť (EV): EV = % EV = 166% Reprodukovateľnosť (AV): AV = % AV = 000% Rozptyl dielcov(pv): Celkový rozptyl (TV): PV = % PV = 99 99% TV = Rozlíšenia meracieho prístroja (N): N = 85 kategórií Zo štúdie variability meradla vieme že odhad celkovej chyby merania je daný hodnotou odhadu smerodajnej odchýlky meracieho procesu ktorá predstavuje variabilitu systému merania. Jej hodnota je R & R =

64 62 FORUM STATISTICUM SLOVACUM 7/2011 Tabuľka 2: Výsledné hodnoty odhadov dôležitých štatistík Tiež je známe z výsledkov štúdie že odhad celkovej variability je daný odhadnutou hodnotou smerodajnej odchýlky čo je TV = Vzhľadom na celkovú variabilitu predstavuje variabilita meracieho systému 166% teda systém merania vzhľadom k procesu vyhovuje. Následne sa overila variabilita meracieho systému k tolerančnému rozpätiu (± 05 µm). Výsledok tolerančnej analýzy je v tabuľke 3. Pri zadanej tolerancii je percento R&R rovné 2068% čo je podmienečne vyhovujúce. 4. Záver Variabilita systému merania je vzhľadom k procesu vyhovujúca vzhľadom k tolerančnému rozpätiu je podmienečne vyhovujúca. Na variabilite meracieho systému sa podieľa iba opakovateľnosť.

65 FORUM STATISTICUM SLOVACUM 7/ Tabuľka 3: Výsledné hodnoty odhadov dôležitých štatistík 5. Literatúra [1] COHRS A.: Der Anti-Rost-Tempel. Auto Bild 5/ [online] Dostupné z < [2] GOLDSCHMIDT A BASF Handbuch Lackiertechnik. Hannover : Vincentz Network GmbH&C s. ISBN [3] Terek M Kvantitatívne metódy v Navrhovaní pre šesť sigma. In: Forum Statisticum Slovacum 3/2010. ISSN s [4] Terek M Kvantitatívne metódy v metodológii Šesť sigma. In: Zborník príspevkov z Medzinárodnej vedeckej konferencie Nové trendy Nové nápady konanej na SVŠE v Znojme. Znojmo: SVŠE CD ROM ISBN s

66 64 FORUM STATISTICUM SLOVACUM 7/2011 [5] Analýza systémů měření Česká společnost pro jakost 4/1999. [6] Dietrich E. Schulze A Statistical procedures for machine and process qualification. ASQ Quality Press s. ISBN [7] Breyfogle III F. W Implementing Six Sigma. Smarter solution using statistical methods. John Wiley & Sons Inc s. ISBN [8] Janiga I. Kulifaj J Overovanie kalibrácie prístroja Phascope. In: Forum statisticum slovacum roč. VII č. 3/2011 s [9] Montgomery D. C. Runger G. C Applied statistics and probability for engineers. John Wiley & Sons Inc s. ISBN [10] Janiga I. Stareková A Základy pravdepodobnosti a štatistiky. Bratislava: Vyd. STU s. ISBN [11] Terek M. Hrnčiarová Ľ Štatistické riadenie kvality. Bratislava: Vyd. IURA Edition s. ISBN [12] Palenčár R. Ruiz J. M. Janiga I. Horníková A Štatistické metódy v skúšobných a kalibračných laboratóriach. Bratislava: Grafické štúdio Ing. Peter Juriga s. ISBN Poďakovanie Tento príspevok vznikol s podporou grantového projektu VEGA č. 1/0543/10: Nové prístupy pri uplatnení metódy šesť sigma pri zlepšovaní kvality produkcie strojárskych. Adresa autorov: Ivan Janiga doc. RNDr. PhD. Slovenská technická univerzita Strojnícka fakulta Námestie slobody Bratislava ivan.janiga@stuba.sk Jozef Kulifaj Ing. Slovenská technická univerzita Strojnícka fakulta Námestie slobody Bratislava

67 FORUM STATISTICUM SLOVACUM 7/ Štúdie variability meradla v stratégii šesť sigma metódou ANOVA Gage studies for variables in strategy six sigma by ANOVA method Ivan Janiga Jozef Kulifaj Abstract: Measurement system plays an important role at the six sigma strategy. The system is satisfactory when the variability due to the measurement process is less than 10 percent of the total variability. That is the reason to do gage studies. There are three most use methods of the gage studies from which we are discussing the ANOVA method. Key words: repeatability reproducibility. Kľúčové slová: opakovateľnosť reprodukovateľnosť. JEL Classification: C1 C Úvod V predchádzajúcom článku sa spomínajú tri najviac používané metódy ktorými sú metóda rozpätí metóda priemerov a rozpätí a metóda ANOVA. Všetky tri metódy ignorujú vo svojich analýzach variabilitu v rámci dielca. V tomto článku sa budeme zaoberať metódou ANOVA. Metóda analýzy rozptylu (ANOVA) je štandardná štatistická technika ktorá sa dá použiť na analýzu chýb meraní a ďalších zdrojov variability v dátach zo štúdie systémov meraní. V analýze rozptylu možno variabilitu rozložiť na štyri kategórie: dielce operátory interakcie medzi dielcami a operátormi a nepresnosť pri opakovaní spôsobená meradlom. 2. Štatistický model štúdie meradla s použitím ANOVA Nech y ijm je m-té meranie vykonané j-tým operátorom na i-tom dielci. Každý dielec má referenčnú hodnotu značkou ε ijm. Meranie ijm x i ktorú nie je možné v praxi stanoviť. Označme odchýlku od y možno teda vyjadriť v tvare Yijm = xi + εijm (1) pričom predpokladajme že jednotlivé x i sú nezávislé a majú normálne rozdelenie zo 2 2 strednou hodnotou µ a rozptylom σ t. j. xi N ( µ σ ). Parameter µ je stredná hodnota dielca. Rovnicu 1 možno ekvivalentne napísať v tvare Y ijm = µ + αi + ε ijm (2) 2 kde α i = xi µ je vplyv dielca s nulovou strednou hodnotou a rozptylom σ. Odchýlku môžeme modelovať ako celok skladajúci sa zo systematickej chyby správnosti spôsobenej meradlom a operátorom dodatočnej chyby správnosti spôsobenej konkrétnym operátorom a chyby spojenej s opakovaním merania. To znamená ε = b + β + e (3) ijm j ijm Predpokladajme že chyby opakovania sú nezávislé normálne rozdelené s nulovou 2 strednou hodnotou a spoločným rozptylom γ pre všetky kombinácie dielcov operátorov 2 a opakovaní. Rozptyl γ predstavuje opakovateľnosť meradla. Keď sú operátory vyberaný náhodne z rozsiahleho súboru jeden z nich môže modelovať vplyv operátora x i β j

68 66 FORUM STATISTICUM SLOVACUM 7/2011 s normálnym rozdelením so strednou hodnotou nula a rozptylom variability spôsobenej operátorom t. j. reprodukovateľnosť. Z rovníc (2) a (3) dostaneme nasledovný model 2 ω. Rozptyl 2 ω je mierou Y = ( µ + b) + α + β + e (4) ijm i j ijm kde α β e sú nezávislé normálne rozdelené s nulovou strednou hodnotou i j ijm a rozptylom σ ω γ. Teda rozptyl celého procesu merania je D( Yijm ) σ ω γ = + + (5) V modely (4) sa predpokladá vplyv dielca a operátora je aditívny. To znamená že vplyv j-teho operátora je rovnaký na všetkých dielcoch. Takýto model nazývame aditívny model. Predpoklad aditívneho modelu nie je v praxi vždy splnený. Tento predpoklad sa kontroluje použitím všeobecnejšieho modelu. Predpokladajme že odchýlka (3) je daná vzťahom: ε = b + β + λ + e (6) ijm j ij ijm kde λ ij reprezentuje interakciu medzi j-tym operátorom a i-tym dielcom. Kombináciou (6) a (2) dostaneme neaditívny model: Y = ( µ + b) + α + β + λ + e (7) ijm i j ij ijm 2 Keď λ ij sú normálne rozdelené s nulovou strednou hodnotou a rozptylom α celkový rozptyl pre (7) je daný výrazom: D( Y ) σ ( ω α ) γ ijm = (8) Riešenie modelu Model (7) riešime metódou ANOVA ktorá spočíva v rozklade celkovej variability nameraných dát na jednotlivé zložky a následne ich porovnanie. Celková variabilita sa meria pomocou celkového súčtu štvorcov meraných dát Označme y i.. k r = yijm ; y. j. j= 1 m= 1 n r = yijm ; yij. i= 1 m= 1 n k r 2 ( yijm y...). i= 1 j= 1 m= 1 r = yijm ; y... m= 1 n k r = yijm. i= 1 j= 1 m= 1 Potom jednotlivé zložky rozkladu celkového súčtu štvorcov sú: 2 yl SST = y yl = y (9) nkr d n k r n k r 2 2 ( ijm ) ijm i= 1 j= 1 m= 1 i= 1 j= 1 m= 1 y y SS = kr y y = n n i.. ( i.....) i= 1 i= 1 kr nkr L (10) y SS nr y yl (11) k k j. yl o = (. j. ) = j= 1 j= 1 nr nkr y y SS = r y yl = + (12) do k n k 2 n 2 k ij. yi... j. yl (. j. ) j= 1 i= 1 j= 1 r i= 1 kr j= 1 nr nkr SSe = SST SSd SSo SSdo (13)

69 FORUM STATISTICUM SLOVACUM 7/ Výsledky výpočtu sa zvyčajne uvádzajú v nasledovnej tabuľke ANOVA. Tabuľka 1: Názov tabuľky (Times new roman 12 bold Italic) Zdroj variability Súčet štvorcov Stupne voľnosti Priemerný štvorec Dielec Operátor Interakcia Chyba meradla Celková chyba SS n 1 d SS k 1 o SS ( n 1)( k 1) do SS nk( r 1) e SS nkr 1 T MS MS MS MS d o do e SSd = n 1 SSo = k 1 SSdo = ( n 1)( k 1) SSe = nk( r 1) F 3. Realizácia metódy ANOVA v automobilovej firme Metódou ANOVA sa analyzoval systém merania hrúbok zinkovej vrstvy na 10 dielcoch z karosérie automobilu. Meranie robili 3 rôzni operátori za rovnakých podmienok a v rovnakom čase. Každý operátor meral každý dielec 3 krát. Neaditívny model Najprv spracujeme namerané hodnoty z článku [1] podľa neaditívneho modelu (7) teda použijeme tabuľku ANOVA aj z interakciami. Výsledky výpočtu sú uvedené v tabuľke 1. Tabuľka 1: ANOVA s interakciami Zdroj variability Súčet štvorcov S.V. Priem. štvorec F P-hodnota Operátor Dielec Interakcia Chyba meradla Celková variabilita Z tabuľky vidieť že variabilita medzi operátormi je nevýznamná pretože P-hodnota je väčšia ako 005 ( P = ). Taktiež interakcia medzi operátormi a dielcami je nevýznamná ( P = ). Hodnota priemerného štvorca po vynásobení konštantou 515 predstavuje opakovateľnosť. Aditívny model Pretože interakcia je štatisticky nevýznamná urobí sa nový výpočet podľa aditívneho modelu (4) čo znamená že použijeme tabuľku ANOVA bez interakcií. Výsledky sú uvedené v tabuľka 2. Z tabuľky vidieť že variabilita medzi operátormi je nevýznamná pretože P-hodnota je rovná Hodnota priemerného štvorca po vynásobení konštantou 515 predstavuje opakovateľnosť.

70 68 FORUM STATISTICUM SLOVACUM 7/2011 Tabuľka 2: ANOVA bez interakcií Zdroj variability Súčet štvorcov S.V. Priem. štvorec F P-hodnota Operátor Dielec Chyba meradla Celková variabilita Tabuľka 2: Správa o opakovateľnosti a reprodukovateľnosti meradla bez interakcií Meracia jednotka Odhad smerodajnej odchýly Percento z celkovej smer. odchýlky Odhad rozptylu Percento z celkového rozptylu Percento z R&R Opakovateľnosť Reprodukova teľnosť R & R Dielce Celková variabilita Na základe štúdie týkajúcej sa 3 operátorov z ktorých každý meral 10 dielcov 3 krát sa odhadla smerodajná odchýlka meracieho procesu (R&R) ktorá sa rovná Celková smerodajná odchýlka (TV) sa rovná Táto sa porovná z celkovou smerodajnou odchýlkou meracieho procesu aby bola istota že percento celkovej variability spôsobenej meracím procesom (R&R) je relatívne malé. V tomto prípade sa jeho hodnota rovná %. Všeobecné pravidlo pre klasifikáciu meracieho systému ako akceptovateľného je aby percento celkovej variability meracieho procesu (R&R) bolo menšie ako 10%. V niektorých situáciách môže byť percento akceptovateľnosti až do hodnoty menšej ako 30%. Z celkovej variability meracieho systému je 00% variability spôsobenej rozdielmi medzi operátormi (reprodukovateľnosť) kým 10000% spôsobuje meracie zariadenie (opakovateľnosť). Toto rozdelenie celkovej variability môže pomôcť určiť či merací systém potrebuje zlepšenie. Tabuľka 3: 95%-né intervaly spoľahlivosti Dolná hranica 515 násobok Horná hranica smerod. odchýlky Opakovateľnosť Reprodukovateľnosť R & R Dielce V tejto tabuľke sa nachádzajú intervaly spoľahlivosti pre 515 násobok smerodajnej odchýlky opakovateľnosti reprodukovateľnosti kombinácie R&R a medzi dielcami. Tieto intervaly obsahujú % chýb priradených ku každému zdroju variability. Pretože tieto

71 FORUM STATISTICUM SLOVACUM 7/ hodnoty odhadov variability sú predmetom výberovej chyby intervaly spoľahlivosti ukazujú aké sú presné tieto odhady. Tabuľka 4: Tolerančná analýza s toleranciou 10 Meracia jednotka 515 smerodajná. odchýlka Percento z tolerancie Opakovateľnosť Reprodukovateľnosť R&R Dielec Keď je známa tolerancia alebo špecifikácia 10 (+/-05) možno očakávať že variabilita meracieho procesu pokryje % z daného rozpätia. Všeobecné pravidlo pre klasifikáciu meracieho systému ako prijateľného je takéto: ak uvedené percento je menšie ako 10% alebo sa rovná 10% merací systém je prijateľný; ak však toto percento je menšie ako 30% merací systém môže byť prijateľný v niektorých situáciách. 4. Záver Variabilita systému merania je vzhľadom k procesu vyhovujúca vzhľadom k tolerančnému rozpätiu je podmienečne vyhovujúca. Na variabilite meracieho systému sa podieľa iba opakovateľnosť. 5. Literatúra [1] COHRS A Der Anti-Rost-Tempel. Auto Bild 5/ [online] Dostupné z < [2] GOLDSCHMIDT A BASF Handbuch Lackiertechnik. Hannover : Vincentz Network GmbH&C s. ISBN [3] Terek M Kvantitatívne metódy v Navrhovaní pre šesť sigma. In: Forum Statisticum Slovacum 3/2010. ISSN s [4] Terek M Kvantitatívne metódy v metodológii Šesť sigma. In: Zborník príspevkov z Medzinárodnej vedeckej konferencie Nové trendy Nové nápady konanej na SVŠE v Znojme. Znojmo: SVŠE CD ROM ISBN s [5] Analýza systémů měření Česká společnost pro jakost 4/1999. [6] Dietrich E. Schulze A Statistical procedures for machine and process qualification. ASQ Quality Press s. ISBN [7] Breyfogle III F. W Implementing Six Sigma. Smarter solution using statistical methods. John Wiley & Sons Inc s. ISBN [8] Janiga I. Kulifaj J Overovanie kalibrácie prístroja Phascope. In: Forum statisticum slovacum roč. VII č. 3/2011 s [9] Montgomery D. C. Runger G. C Applied statistics and probability for engineers. John Wiley & Sons Inc s. ISBN [10] Janiga I. Stareková A Základy pravdepodobnosti a štatistiky. Bratislava: Vyd. STU s. ISBN [11] Terek M. Hrnčiarová Ľ Štatistické riadenie kvality. Bratislava: Vyd. IURA Edition s. ISBN

72 70 FORUM STATISTICUM SLOVACUM 7/2011 [12] Palenčár R. Ruiz J. M. Janiga I. Horníková A Štatistické metódy v skúšobných a kalibračných laboratóriach. Bratislava: Grafické štúdio Ing. Peter Juriga s. ISBN Poďakovanie Tento príspevok vznikol s podporou grantového projektu VEGA č. 1/0543/10: Nové prístupy pri uplatnení metódy šesť sigma pri zlepšovaní kvality produkcie strojárskych. Adresa autorov: Ivan Jniga doc. RNDr. PhD. Slovenská technická univerzita Strojnícka fakulta Námestie slobody Bratislava ivan.janiga@stuba.sk Jozef Kulifaj Ing. Slovenská technická univerzita Strojnícka fakulta Námestie slobody Bratislava

73 FORUM STATISTICUM SLOVACUM 7/ Príprava regulácie procesu v stratégii šesť sigma v danej spoločnosti Process of preparing regulation in the Six Sigma strategy in the company Ivan Janiga Romana Štefanišinová Milada Omachelová Abstract: The aim of this work is the preparation of the powdering process for monitoring using statistical control. Key words: powdering process six sigma. Kľúčové slová: proces práškovania šesť sigma. JEL Classification: C1 C Úvod Cieľom tejto práce je pripraviť proces práškovania v nemenovanej spoločnosti na monitorovanie pomocou štatistickej regulácie. Spoločnosť vyrába plechy (kryty jednotlivých kotlov) a zabezpečuje aj ich povrchovú úpravu práškovaním. Predmetom skúmania je predný kryt typu Semia. Monitorovala sa hrúbka nanesenej vrstvy pri povrchovej úprave elektrostatickým práškovaním pričom sa postupovalo prísne podľa plánu stratégie Six Sigma DIMAIC. V prvej fáze definuj sa definoval problém zistili sa potreby a požiadavky zákazníka bol opísaný proces práškovania a nasledovala voľba metód pre ďalší postup. Hlavným cieľom druhej fáze meraj bol zber a spracovanie nameraných dát. Bola vybraná reprezentatívna vzorka krytov Semia v počte 60 kusov a pomocou hrúbkomera Elcometer 456 sa zisťovala hrúbka farby na plechu. Obrázok 1: Ishikawov diagram možných príčin ovplyvňujúcich výsledok merania V tretej fáze analyzuj sa namerané hodnoty spracovali pomocou štatistického softvéru Statgraphics centurion. Pre zistenie príčin problému sa zostrojil Ishikawa diagram. Ďalej sa analyzovali vstupy a výstupy do procesu práškovania. Vstup tvorí farba (x) a výstup

74 72 FORUM STATISTICUM SLOVACUM 7/2011 tvorí minimálna hrúbka farby nanesená v dostatočnej vrstve (y). Výrobcom určené špecifikácie sú minimálne 40 µm a maximálne 140 µm (pozri [8]). Vo štvrtej fáze zlepšuj sa navrhli zlepšenia nasledovalo zhodnotenie návrhov s konzultantom a prednesenie kompetentným osobám. Návrhy na zlepšenie sa budú zavádzať v čase výluky výroby a prechode na jednozmennú prevádzku. V piatej fáze kontroluj sa robí kontrola aby bolo možné zistiť spätnú väzbu. Článok sa zaoberá prípravou na štatistickú reguláciou procesu práškovania v nemenovanej firme. 2. Stanovenie podmienok experimentu a zber dát Cieľom experimentu bola minimalizáciu nákladov čo bolo možné dosiahnuť znížením množstva nanášanej vrstvy farby. Výrobcom odporúčaná špecifikácia pre hrúbku nanášanej vrstvy je min. 40 µm a max. 140 µm aby bola dodržaná požadovaná kvalita a požadované vlastnosti. Obrázok 2: Dielec s vyznačenými meracími bodmi

75 FORUM STATISTICUM SLOVACUM 7/ Zvolila sa reprezentatívna vzorka 60 kusov plechov. Hrúbka farby bola meraná pomocou Elcometra 456. Na každej vzorke bolo zmeraných 8 bodov vopred definovaných (pozri obrázok 2). Meralo sa dvomi smermi a to v poradí meracích bodov tak ako boli označené a v náhodnom poradí. Každá meraná hodnota sa odčítala z digitálneho displeja s presnosťou na jedno desatinné miesto. Označme jednotlivé merania takto: V i = 12 K 8; j = 1 2 K 60 (1) ij sú merania v jednotlivých bodoch podľa poradia S i = 12 K 8; j = 1 2 K 60 (2) ij sú merania v jednotlivých bodoch v náhodnom poradí. 3. Štatistická analýza nameraných dát Najprv treba overiť či namerané hodnoty v príslušných meracích bodoch podľa oboch poradí pochádzajú z normálnych rozdelení. Teda testujeme hypotézy: H : 0 V i má normálne rozdelenie (3) kde i = 12 K 8; H : 0 S i má normálne rozdelenie (4) kde i = 12 K 8. Výsledky testu normality sú uvedené v tabuľke 1 z ktorej vidieť že všetky merané veličiny Si a V i i = 12 K 8 majú normálne rozdelenie. [1] Tabuľka 1: P hodnoty testov normality náhodných premenných Si a V i i S i V i Porovnávanie podľa poradia Porovnali sa merania v meracích bodov podľa poradia t. j. náhodné premenné i = 12 K 8. Porovnanie sa robí pomocou analýzy rozptylu (ANOVA). Testuje sa hypotéza H 0 : E( V1 ) = E( V2 ) = K = E( V8 ) vs. H 1 : aspoň jedno E ( V i ) je rôzne (5) Podmienkou použitia analýzy rozptylu je normalita dát a rovnosť rozptylov. Normalita sa už overila (pozri tabuľku 1) ešte treba overiť rovnosť rozptylov. Testuje sa hypotéza 2 2 H0 : σ ( V1 ) = K = σ ( V8 ) vs. H 1 : aspoň jedno σ 2 ( V i ) je rôzne (6) Na základe Leveneovho testu sa zistila hodnota P = čo je väčšia hodnota ako 005. Rozptyly teda možno považovať za rovnaké. Teraz možno korektne použiť metódu ANOVA. V tabuľke ANOVA sú súčty štvorcov ktoré predstavujú: súčet štvorcov medzi skupinami 8 2 yi. 1 2 SSA = y.. (7) i= 1 60 n súčet štvorcov vnútri skupín (reziduálny) yi. SS = y R (8) ij i= 1 j= 1 i= 1 60 V i

76 74 FORUM STATISTICUM SLOVACUM 7/2011 celkový súčet štvorcov SST = yij y.. (9) 540 kde y 60 i. = yij a j= 1 i= 1 j= 1 y = i= 1 j= 1 y ij Pre celkový súčet teda platí: SST = SSA + SSR (10) Súhrn výsledkov potrebných na testovanie nulovej hypotézy (5) je uvedený v tabuľke analýzy rozptylu (pozri tabuľku 2). Tabuľka 2:ANOVA pre merania podľa poradia ( V i ) Zdroj variability Súčet štvorcov Stupne voľnosti Priemerný štvorec Medzi výbermi Vnútri výberov Podiel F Celkový súčet P hodnota Z tabuľky 2 vidieť že medzi výbermi čo sú meracie body nie je štatisticky významný rozdiel pretože P = čo je väčšie ako 005. Obrázok3: 95% LSD interval pre strednú hodnotu (podľa poradia) Napriek tomu že ANOVA ukazuje že rozdiel medzi meracími bodmi je nevýznamný obrázok 3 ukazuje že LSD interval v bode 7 (pozri obrázok 2) sa nezvyčajne veľa odlišuje od intervalov v ostatných bodoch. Porovnávanie podľa náhodného poradia Teraz sa porovnávajú merania v meracích bodov v náhodnom poradí t. j. náhodné premenné S i i = 12 K 8. Porovnanie sa robí taktiež pomocou analýzy rozptylu (ANOVA). Najprv testujeme hypotézu o rovnosti rozptylov. Testuje sa hypotéza 2 2 H0 : σ ( S1) = K = σ ( S8) vs. H 1 : aspoň jedno σ 2 ( S i ) je rôzne (6) Na základe Leveneovho testu sa zistila hodnota P = čo je väčšia hodnota ako 005. Rozptyly teda možno považovať za rovnaké. Teraz možno korektne použiť metódu ANOVA. Testuje sa hypotéza H0 : E( S1) = E( S2) = K = E( S8) vs. H 1 : aspoň jedno E( S i ) je rôzne (5) Výsledky testu sú v tabuľke 3.

77 FORUM STATISTICUM SLOVACUM 7/ Tabuľka 3:ANOVA pre merania podľa poradia ( S i ) Zdroj variability Súčet štvorcov Stupne voľnosti Priemerný štvorec Podiel F P hodnota Medzi výbermi Vnútri výberov Celkový súčet Z tabuľky 3 vidieť že medzi výbermi čo sú meracie body nie je štatisticky významný rozdiel pretože P = čo je väčšie ako 005. Obrázok4: 95% LSD interval pre strednú hodnotu (náhodné poradie) Napriek tomu že ANOVA ukazuje že rozdiel medzi meracími bodmi je nevýznamný z obrázka 4 vidieť že LSD interval v bode 7 (pozri obrázok 2) sa nezvyčajne veľa odlišuje od intervalov v ostatných bodoch. Obrázky 3 a 4 ukazujú že v obidvoch prípadoch LSD interval v bode 7 (obrázok 2) sa odlišuje od ostatných neobvykle veľa. Merania v meracom bode by sa mali analyzovať a zistiť príčinu veľkej odchýlky. 4. Záver Štatistická analýza meraní ukazuje na problém meraní v bode 7. V obidvoch prípadoch merania podľa poradia a merania v náhodnom poradí sa LSD interval v bode 7 odlišuje od ostatných neobvykle veľa. Potrebné je urobiť analýzu meracieho bodu 7 zistiť príčinu a následne ju odstrániť. Až po odstránení chyby merania v bode 7 sa môže pristúpiť k štatistickej regulácii práškovacieho procesu. 5. Literatúra [1] Janiga I. Stareková A Základy pravdepodobnosti a štatistiky. Bratislava: Vyd. STU s. ISBN [2] Hekelová E. TQM Komplexné manažérstvo kvality. Bratislava: STU s. ISBN [3] Paulová I. Hekelová E. Šatanová A. Šalgovičová J Metódy zlepšovania efektívnosti a účinnosti TQM. Bratislava: STU s. ISBN [4] Breyfogle III F. W Implementing Six Sigma. Smarter solution using statistical methods. John Wiley & Sons Inc s. ISBN [5] Terek M Kvantitatívne metódy v Navrhovaní pre šesť sigma. In: Forum Statisticum Slovacum 3/2010. ISSN s

78 76 FORUM STATISTICUM SLOVACUM 7/2011 [6] Terek M Kvantitatívne metódy v metodológii Šesť sigma. In: Zborník príspevkov z Medzinárodnej vedeckej konferencie Nové trendy Nové nápady konanej na SVŠE v Znojme. Znojmo: SVŠE CD ROM ISBN s [7] Terek M. Hrnčiarová Ľ Štatistické riadenie kvality. Bratislava: Vyd. IURA Edition s. ISBN [8] Montgomery D. C. Runger G. C Applied statistics and probability for engineers. John Wiley & Sons Inc s. ISBN [9] Palenčár R. Ruiz J. M. Janiga I. Horníková A Štatistické metódy v skúšobných a kalibračných laboratóriách. Bratislava: Grafické štúdio Ing. Peter Juriga s. ISBN [10] STN EN ISO 9001:2008. Systémy manažérstva kvality. Požiadavky. Bratislava: SÚTN s. Poďakovanie Tento príspevok vznikol s podporou grantového projektu VEGA č. 1/0543/10: Nové prístupy pri uplatnení metódy šesť sigma pri zlepšovaní kvality produkcie strojárskych. Adresa autorov: Ivan Janiga doc. RNDr. PhD. Slovenská technická univerzita Strojnícka fakulta Námestie slobody Bratislava ivan.janiga@stuba.sk Romana Štefanišinová Ing. Slovenská technická univerzita Strojnícka fakulta Námestie slobody Bratislava Milada Omachelová Mgr. PhD. Slovenská technická univerzita Strojnícka fakulta Námestie slobody Bratislava

79 FORUM STATISTICUM SLOVACUM 7/ Odhady parametrov v modeli extrémnych hodnôt a ich výpočet Parameter estimations in extreme value model and their realization Matej Juhás Valéria Skřivánková Abstract: This paper deals with parameter estimation in extreme value model. We present some suitable methods for estimation of the parameters of generalized Pareto distribution. We apply these estimations to non-life insurance data. Kľúčové slová: Index extrémnych hodnôt zovšeobecnené Paretovo rozdelenie Pickandsov odhad Hillov odhad metóda minimálnej vzdialenosti momentová metóda. Key words: Extreme value index generalized Pareto distribution Pickand s estimate Hill s estimate minimum distance estimate methods of moments. JEL classification: C13 C16 G22 1. Úvod Extrémne udalosti sú súčasťou bežného života. Ich výskyt nemusí byť vždy priaznivý a preto je nutné tieto extrémne udalosti aspoň do určitej miery vedieť predpovedať. Typickým príkladom sú vysoké poistné plnenia ktoré môžu spôsobiť insolventnosť poisťovne. Preto pre poisťovňu je nevyhnutné poznať prognózy extrémnych poistných plnení. Modelovaniu poistných plnení sme sa venovali už v [3] kde sme hľadali vhodné rozdelenie pre poistné plnenia presahujúce určitú úroveň metódou POT. Ukázalo sa že vhodným rozdelením pre uvažované dáta je zovšeobecnené Paretovo rozdelenie. V [3] sme parametre odhadovali iba metódou maximálnej vierohodnosti preto by sme chceli v tomto príspevku prezentovať ďalšie užitočné spôsoby odhadov parametrov. Získané odhady budú aplikované na reálne poistné dáta z oblasti neživotného poistenia zo slovenského poistného trhu. 2. Metódy odhadov parametrov Tvar rozdelenia extrémnych hodnôt je významne ovplyvnený parametrom ξ (indexom extrémnych hodnôt) preto je potrebné čo najlepšie odhadnúť tento parameter. Existuje niekoľko špeciálnych metód na odhadnutie indexu ξ zovšeobecneného Paretovho rozdelenia G ξβ ktoré je definované nasledujúcim spôsobom. Definícia1. Hovoríme že náhodná veličina X má zovšeobecnené Paretovo rozdelenie ak jej distribučná funkcia je tvaru 1/ ξ x ξ ak ξ 0 G ξ β ( x) = β (1) 1 exp( x / β ) ak ξ = 0 pričom x 0 ) ak ξ 0 a x 0-β /ξ pre ξ < 0. Parameter ξ je index extrémnych hodnôt β je parameter mierky. Rozdelenie G ξβ je veľmi vhodné na modelovanie vysokých poistných plnení ktoré prevyšujú vopred danú hranicu (prah) tak ako je popísané v Balkema de Haan Pickandsovej vete o limitnom rozdelení excedentov ponad prah (pozri napríklad [2] alebo [4]). Pri modelovaní dát pomocou distribučnej funkcie (1) je veľmi dôležité správne odhadnúť neznáme parametre. V praxi je najbežnejšou metódou používanou na odhad parametrov metóda maximálnej vierohodnosti ktorú sme využili v článku [3] a preto sa jej

80 78 FORUM STATISTICUM SLOVACUM 7/2011 nebudeme bližšie venovať. V ďalšom popíšeme niektoré známe špeciálne typy odhadov vyššie uvažovaných parametrov. Pickandsov odhad Pickandsov odhad slúži na odhad parametra ξ R rozdelenia daného distribučnou funkciou (1). Odvodiť ho môžeme nasledovným spôsobom. Uvažujme LRSE (linear combinations of ratios of spacings) odhad ktorý je tvaru (pozri [4]) x[ nq ] [ ] ˆ 2 :n x nq 1 :n r = (2) x x [ nq 1 ]:n [ nq 0 ]:n kde 0 < q 0 < q 1 < q 2 1 a x 1:n x 2:n... x n:n sú dáta zoradené podľa veľkosti. Treba povedať že takýto odhad nezávisí na parametri mierky β teda x [nq]:n 1 ( q ) a tak môžeme písať G r ˆ G 1 ξ 1 ξ ( q2) G ( q ) G 1 1 ξ 1 ξ ( q1) (1 q2) = ( q ) (1 q ) 0 1 ξ ξ (1 q1 ) (1 q ) za predpokladu že q 0 = 1 q q 1 = 1 aq q 2 = 1 a 2 q pre 0 < q a a < 1. Pre odhad parametra ξ dostávame teda vzťah ˆ ln rˆ ξ =. 1 ln a Ak položíme q=4k/n a a=1/2 pričom k [n/4] tak dostávame Pickandsov odhad ktorý má tvar 1 ˆ x ln : 2 :. (3) ln 2 2 : 4 : = n k n x P ξ n k n k n xn k n xn k n Poznámka P Pri praktickej analýze dát k určeniu vhodného odhadu ˆξ k n využívame Pickandsov graf ktorý P je daný bodmi (k ˆξ k n ) k [n/4]. Ako optimálne zvolíme také k pre ktoré je Pickandsov graf približne konštantný. Hillov odhad Hillov odhad slúži na odhad parametra ξ = 1/α > 0 preto uvažujme Paretovo rozdelenie s distribučnou funkciou G(xα) = 1- Cx -α x u > 0 pričom u=x n-k:n je známy vopred zvolený prah. Z vlastnosti distribučnej funkcie dostávame že C = u α. Na odvodenie odhadu použijeme metódu maximálnej vierohodnosti. Keďže hustota uvažovaného Paretovho rozdelenia je g(x α) = αu α x -(1+ α) pre logaritmus vierohodnostnej funkcie platí ln L( x α) = k lnα + k lnu k 0 ξ ξ = a ξ G ξ n i+ 1: n ( 1+ α ) ln. (4) i= 1 x u Odpovedajúca vierohodnostná rovnica ktorú dostaneme deriváciou funkcie (4) podľa parametra α je tvaru k k xn i+ 1: n 0 = ln. α i= 1 u

81 FORUM STATISTICUM SLOVACUM 7/ Odtiaľ už bezprostredne dostávame maximálne vierohodný odhad parametra α 1 ˆ = k α k n ln ( xn i+ 1: n ) ln xn k: n k i= 1 (6) a teda pre Hillov odhad parametra ξ platí k H 1 ˆξ k n = ln ( xn i+ 1:n ) ln xn k:n k i= 1. (7) Poznámka H Hillov graf je daný bodmi [k ˆξ k n ] k =12...n-1 a vykazuje stabilitu v takej oblasti kde s H rastúcim k ostáva odhad ˆξ k n relatívne nezmenený. Môžeme ho využiť k optimálnej voľbe prahu respektíve počtu extrémov. Vhodné je zvoliť prah u práve z takej stabilnej oblasti. Deckers-Einmahl-de Haanov odhad Tento odhad je zovšeobecnením Hillovho odhadu. Zvykne sa nazývať aj momentovým odhadom parametra ξ R a je daný vzťahom (pozri [2]) kde H n (1) = 1 k ˆ ξ D = 1+ H (1) n H (2) ˆξ k n a H n = ( ln ( x i+ 1:n ) ln xn k:n ) k i= 1 2 n. 1 ( ) 2 1 (1) H n 1 (8) Metóda minimálnej vzdialenosti Definícia 2. Nech X 1 X 2... X n je postupnosť iid náhodných veličín s distribučnou funkciou F(x θ) kde θ = (θ 1 θ 2... θ m ) je neznámy parameter a nech F n (x) je empirická distribučná funkcia. Ak existuje θˆ také že d[f(xθˆ ) F n (x)] = inf{d[f(xθ) F n (x)]; θ } kde d[.] je ľubovoľná metrická vzdialenosť potom θˆ sa nazýva odhad založený na minimálnej vzdialenosti (MDE). V definícii 2 môžeme namiesto distribučných funkcií uvažovať aj hustoty pravdepodobnosti. V praxi sa používajú viaceré kritéria na určenie minimálnej vzdialenosti. Niektoré z nich uvedieme v nasledujúcej tabuľke. H (2) n Tabuľka 1. Niektoré metrické vzdialenosti Kritérium d(f(x ) F n (x)) Kolmogorov Smirnov sup{ F(x θ) - F n (x) ; x} Cramér von Mises ( F(x θ) - F n (x) 2 df(x) Helingerovo pre normálne rozdelenie ( ( φ µ σ (x) - f n (x)) 2 d(x)) 1/2 Ak uvažujeme distribučnú funkciu (1) tak odhad založený na minimálnej vzdialenosti je tvaru d( (x) F n (x)) = inf{d(g ξβ (x) F n (x) ); ξ β}. G ˆ ξ ˆ β Vyššie uvedené metódy odhadu aplikujeme v ďalšej časti pri spracovaní reálnych dát. 3. Odhady parametrov pre reálne dáta V tejto časti sa budeme zaoberať analýzou dát havarijného poistenia motorových vozidiel zo slovenského poistného a nadväzujeme na spracovanie dát popísané v [3]. K dispozícii máme súbor dát pozostávajúci z 9748 poistných plnení v eurách v rokoch 1998 až 2008.

82 80 FORUM STATISTICUM SLOVACUM 7/2011 Tabuľka 2: Základné charakteristiky dát Počet Min Max Priemer Medián Rozptyl Šikmosť Špicatosť Uvažované dáta sme modelovali trojparametrickým lognormálnym rozdelením s hustotou pravdepodobnosti 1 2 (ln( x γ ) µ ) f ( x) = exp x > γ ( ) x γ πσ 2σ kde neznáme parametre boli odhadnuté metódou maximálnej vierohodnosti na µ = σ = γ = Ukázalo sa že chvost rozdelenia týchto dát je vhodné modelovať zovšeobecneným Paretovým rozdelením s parametrami ξ = β = ktoré boli opäť odhadnuté metódou maximálnej vierohodnosti. Neparametrické metódy odhadu hustoty možno nájsť v [5]. V ďalšom sa pokúsime aplikovať vyššie uvedené metódy odhadov na parameter ξ. Vhodným grafickým nástrojom na vizualizáciu vývoja parametrov je ich znázornenie v závislosti od výšky prahu (obrázok 1.) ktoré nám umožňuje napríklad program R a jeho balík extremes (tento graf si vieme vykresliť ak si v ponuke Plot zvolíme položku Fit treshold ranges GPD). Obrázok 1. Vývoj neznámych parametrov v závislosti od výšky prahu Z obrázka 1 je možné vyčítať hodnoty neznámych parametrov na základe ich stability. Dostávame tak približné hodnoty ξˆ = 0.35 βˆ = Na výpočet Pickandsovho odhadu parametra ξ sme využili program Maple v ktorom sme si vytvorili jednoduchú procedúru a pomocou nej sme určili parameter.

83 FORUM STATISTICUM SLOVACUM 7/ Na obrázku 2 a obrázku 3 môžeme vidieť priebeh Pickandsovho grafu v závislosti od počtu extrémov. Obrázok 2: Pickandsov graf Obrázok 3: Výrez Pickandsovho grafu Na základe detailu Pickandsovho grafu sme zvolili počet extrémov k = 1300 čomu zodpovedá hodnota ˆξ = P k n Ďalším uvažovaným typom odhadu je Hillov odhad. Jeho priebeh v závislosti od počtu extrémov je znázornený na nasledovnom obrázku kde kvôli lepšej ilustrácii uvádzame aj jeho detail.

84 82 FORUM STATISTICUM SLOVACUM 7/2011 Obrázok 4: Graf Hillovho odhadu (vľavo) výrez z grafu Hillovho odhadu H Na základe grafu sme určili hodnotu Hillovho odhadu ktorá je ˆξ k n = Využitím Hillovho odhadu sme získali Deckers-Einmahl-de Haanov odhad pre naše D dáta ktorý sme stanovili na ξˆ = Výpočet neznámych parametrov pomocou odhadu založeného na minimálnej vzdialenosti sme uskutočnili pomocou programu excel a jeho balíka EasyFitXl kde sme na voľbu metrickej vzdialenosti použili Kolmogorovovo-Smirnovovo kritérium a dostali sme hodnotu d[ G ˆ (x) F ˆ ξ β n (x)] = Hodnoty odhadnutých parametrov sú ξˆ = βˆ = Záver V tomto príspevku sme prezentovali viacero metód na odhad neznámych parametrov zovšeobecneného Paretovho rozdelenia. Na sumarizáciu výsledkov uvádzame nasledujúcu tabuľku P ˆξ k n H ˆξ k n D ξˆ MDE MLE ξˆ βˆ Z tabuľky a z grafického znázornenie parametrov (obrázok 1) je možné usudzovať že Hillov a Pickandsov odhad nie sú veľmi vhodné pre naše dáta. Pri Hillovom odhade je nevýhodou aj to že ho môžeme použiť iba za predpokladu ξ > 0 a že je veľmi citlivý na prípadnú závislosť v dátach. Čo sa týka stability odhadov dá sa ukázať že majú asymptoticky normálne rozdelenie. Pickandsov a Hillov odhad majú pre malý počet extrémov dosť vysokú osciláciu. Výpočet odhadu parametra β pre prvé tri metódy je predmetom ďalšieho skúmania. 5. Literatúra [1] BEIRLANT J. at al. (2004). Statistics of Extremes: Theory and applications. Wiley New York. [2] EMRECHTS P. at al. (1997). Modelling extremal events for insurance and finance. Springer New York. [3] JUHÁS M. SKŘIVÁNKOVÁ V. : Analýza extrémnych hodnôt v poistení motorových

85 FORUM STATISTICUM SLOVACUM 7/ vozidiel metódou POT Forum Statisticum Slovacum 5/2010 str ISSN [4] REISS D.-R. THOMAS M. (2007). Statistical analysis of extreme values with applications to insurance finance hydrology and other fields. Birkhäuser Verlag Basel. [5] Tartaľová A.: Neparametrické metódy odhadu pravdepodobnosti hustoty rozdelenia Forum Statisticum Slovacum 5/2010 str ISSN Adresa autorov: Matej Juhás RNDr. Valéria Skřivánková Doc. RNDr. CSc Ústav matematických vied PF UPJŠ Ústav matematických vied PF UPJŠ Jesenná 5 Jesenná Košice Košice matej.juhas@student.upjs.sk valeria.skrivankova@upjs.sk Tento príspevok vznikol s podporou grantu VEGA 1/0410/11 VEGA 1/0325/10 a VVGS PF 42/2011/M.

86 84 FORUM STATISTICUM SLOVACUM 7/2011 Alternatívne kritéria výberu portfólia investičných nástrojov Alternative criteria of investment instruments portfolio selection Mária Kanderová Abstract: The article is focused upon the process of portfolio selection from the viewpoint of modern portfolio theory. In the article a classic formulation of mean-variance optimization problem subject to a targeted expected portfolio return is given and via the VBA tools the efficient portfolio frontier is generated. One of the generalizations of the mean-variance framework rests in the maximization of expected utility of the investor given which just expresses the risk-averse formulation of the classic mean-variance optimization problem. The other approach utilizes down-side risk criteria such as value at risk and orientates on its minimization. Key words: expected portfolio return portfolio risk mean-variance approach utility function value at risk. Kľúčové slová: očakávaný výnos portfólia riziko portfólia mean- variance prístup funkcia užitočnosti value at risk JEL classification: C61 D53 G11 1. Úvod Všeobecný rámec optimalizácie portfólia je založený na myšlienke že racionálny investor s užitočnosťou U a počiatočným bohatstvom V 0 vyberá svoje portfólio P ktoré maximalizuje jeho užitočnosť na jedno obdobie dopredu. Klasický Markowitzov prístup predpokladá že investor sa rozhoduje na základe kompromisu medzi rizikom a očakávaným výnosom. Očakávaný výnos investičného nástroja je definovaný ako očakávaná (stredná) hodnota zmeny ceny investičného nástroja plus dodatočné príjmy počas stanoveného časového obdobia. Riziková pozícia je meraná smerodajnou odchýlkou zmeny ceny investičného nástroja. Investor je rizikovo averzný to znamená že z množiny portfólií vyberá portfólio ktoré má pre daný očakávaný výnos najnižšie riziko. Proces výberu portfólia podľa Markowitzovej teórie je optimalizácia na základe pravidla mean-variance alebo sa taktiež nazýva teória výberu portfólia. Vstupnými parametrami procesu optimalizácie sú očakávané výnosy aktív volatilita aktív meraná smerodajnou odchýlkou a korelácie medzi výnosmi jednotlivých aktív ktoré sú vyjadrené cez kovariančnú maticu. Do procesu optimalizácie je možné zahrnúť dodatočné ohraničenia napríklad reštrikcia na krátky predaj niektorých aktív a/alebo stanovenie limitu pre minimálny a maximálny podiel aktív v portfóliu a pod. 2. Minimalizácia rizika pri požadovanom výnose Pri odhade vstupných parametrov sa predpokladá že výnosy sú normálne rozdelené. V skutočnosti je rozdelenie výnosov špicatejšie ako normálne rozdelenie takže nízke kladné a záporné výnosy sa objavujú častejšie ako predpokladá normálne rozdelenie. Okrem toho rozdelenie výnosov má tučnejšie konce ako normálne rozdelenie to znamená že pravdepodobnosť výskytu extrémnych výnosov (kladných alebo záporných) je vyššia ako pri

87 FORUM STATISTICUM SLOVACUM 7/ normálnom rozdelení. Empirické štúdie dokazujú že v praktických situáciách s rastúcim počtom pozorovaní sa rozdelenie logaritmov výnosov blíži k normálnemu rozdeleniu. Nech portfólio investora pozostáva z k aktív ktoré sú v portfóliu zastúpené váhami w = (w 1 w 2... w k ) kde w i reprezentuje percentuálny podiel zastúpenia i-tého aktíva v portfóliu a teda platí: k w = 1. i=1 i Výnosy aktív R = (R 1 R 2...R k ) majú očakávaný výnos E = (E R1 E R2...E Rk ) a k x k kovariančnú maticu Σ. Potom výnos portfólia s váhami w je náhodná premenná R p =w T R so stredným výnosom E p = w T E a rozptylom σ p 2 = w T Σw. Očakávané výnosy a kovariančná matica sa odhadujú z historických dát. Pri odhade je možné použiť buď klasický prístup alebo exponenciálne vážený prístup. Pre daný výnos (výnos požadovaný investorom) E p0 je úloha výberu portfólia založená na riešení úlohy matematického programovania v tvare: za podmienok: min σ 2 p =w T Σ w w w T E = E p0 ; (1.1) w T e = 1; w i 0 pre i=1 2...k. Riešením úlohy (1.1) sú váhy aktív v portfóliu. Zloženie portfólia s danými váhami a danými vstupnými parametrami zabezpečí požadovaný výnos s minimálnym rizikom. 3. Optimalizácia na báze funkcie užitočnosti Alternatívnym kritériom pre výber portfólia je kritérium maximalizácie očakávanej užitočnosti. Mean variance prístup výberu portfólia implicitne predpokladá že užitočnosť investora je definovná nad budúcim dosiahnutým výnosom R p ako funkcia V(R p ) ktorá závisí len na strednej hodnote a rozptyle: V(R p ) = f(e(r p ) σ 2 (R p )) (1.2) pričom sa predpokladá že daná funkcia je rastúca vzhľadom na strednú hodnotu ( f/ E) a je klesajúca vzhľadom na rozptyl ( f/ σ 2 ). Funkcia užitočnosti ktorá spĺňa túto požiadavku je tzv. mean variance funkcia užitočnosti. Nech počiatočné bohatstvo investora je V 0 a časový horizonzt je T. Ak maximalizácia očakávanej užitočnosti je ekvivalentná hľadaniu vektora váh k aktív riešením je max E p(u(v T )). (1.3) w V optimalizácií portfólia našla uplatnenie kvadratická funkcia užitočnosti ktorá je dobrou aproximáciou exponenciálnej funkcie užitočnosti. a 2 Kvadratická funkcia užitočnosti je určená vzťahom : U(x)= x - x pre a >0 a je rastúca pre 2 x (- 1/a). Potom platí: a E p(u(v T ))= E(V0 R p )- E(V0 R p )= f(e(r p )σ (R p )) (1.4) 2 kde

88 86 FORUM STATISTICUM SLOVACUM 7/2011 a f(e(r )σ (R ))=U(V E(R ))- V σ (R p p 0 p 0 p ). (1.5) Keďže hodnota portfólia je definovaná na intervale (- 1/a) potom funkcia U(V 0 E(R p )) je rastúcou funkciou E(R p ). Kvadratická funkcia užitočnosti vedie k optimalizačnej úlohe: a 2 max E(R p )- σ (R p ) w 2 za podmienok: w T e = 1; kde w k 0 pre k=1 2...n (1.6) E(R p ) = E p = w T E σ 2 (R p ) = σ p 2 = w T Σw. Parameter a je parameter averzie k riziku. Podľa Liu Xu (2010s.5) sa parameter a volí ako podiel strednej hodnoty dodatočného výnosu benchmarku µ B nad bezrizikovou úrokovou sadzbou k disperzii benchmarku σ 2 B na základe vzťahu µ B a =. (1.7) σ 2 B Portfólio získané na základe kritéria funkcie užitočnosti je efektívne portfólio v zmysle meanvariance. 4. Optimalizácia na báze kritéria VaR Inou skupinou kritérií sú kritéria kde je pozornosť zameraná na ohraničenie rizika zlých výsledkov. Cieľom týchto kritérií je vytvoriť portfólio ktoré eliminuje extrémne straty na určitej hladine významnosti α. Do tejto skupiny patria kritéria value at risk (VaR α ) alebo kritérium ktoré minimalizuje strednú hodnotu α% najhorších strát- expected shortfall. Value at Risk a expected shortfall predstavujú takzvané miery typu at risk resp. downside risk a vyjadrujú najhoršiu možnú hodnotu kritéria v danom časovom horizonte na určitej hladine významnosti. Ak je známe pravdepodobnostné rozdelenie daného kritéria hodnota at risk je vyjadrená ako dolný kvantil daného rozdelenia r% VaR % % % α = - r R : F(r)= f(r)dr =α -. (1.8) Technická aplikácia týchto mier sa viaže na distribučný predpoklad rozdelení finančných strát. Za predpokladu že výnosy portfólia majú normálne rozdelenie VaR α je kvantil normálného rozdelenia so strednou hodnotu E p a disperziou σ p 2. Úloha výberu portfólia na základe kritéria minimalizácie VaR α vedie k optimalizačnej úlohe matematického programovania: min VaR = -(E +uσ ) w α p α p

89 FORUM STATISTICUM SLOVACUM 7/ za podmienok: kde w T e = 1; w k 0 pre k=1 2...n (1.9) E p = w T E σ p 2 = w T Σw u α je kvantil N(01). Riešením sú váhy portfólia ktoré zabezpečia že s pravdepodobnosťou (1-α) straty portfólia neklesnú pod hodnotu VaR α. 5. Výsledky modelu Uvedené tri kritéria pre výber modelu portfólia sme aplikovali na vybraných akciách spoločnosti z rôznych sektorov ktoré sú zastúpene v indexe S&P 500. Pre analýzu boli požité denné výnosy od 10. novembra 2010 do 9. novembra 2011 teda 251 údajov. Na základe historických údajov boli vypočítané základné vstupné charakteristiky kovariančná matica smerodajné odchýlky a stredné hodnoty. Výsledky sú v tabuľke 1. Tabuľka 1: Vstupné parametre modelu Akcia Výnos (%) Smerodajná odchýlka (%) Smerod.oddch./ výnos ATLANTIC TELE NETWORK (ATNI) ORBCOMM (ORBC) CASH AMERICA INTERNATIONAL (CSI) ENCORE CAPITAL GROUP (ECPG) LIFEPOINT HOSPITAL (LPNT) FIRE SWIRL TECH COM (FRWD) CANADIAN NATIONAL RAILWAY (CNI) TESLA MOTORS (TSLA) PHARMACETICAL PRODUCT DEVELOPMENT (PPDI) NATIONAL BEVERAGE (FIZZ) Pri riešení úlohy optimalizácie portfólia na báze kritéria minimalizácie rizika pri danom výnose bol zvolený požadovaný výnos 008%. Za účelom rozloženia rizika bol obmedzený maximálny podiel jednej akcie v portfóliu na 20%. Pomocou VBA bola vygenerovaná množina portfólií s minimálnym rozptylom pre rôzne hodnoty požadovaného výnosu. Pri optimalizácií na báze kritéria maximalizácie užitočnosti bol v prvom kroku zvolený parameter a podľa vzťahu (1.7) ako benchmark bol zvolený akciový index S&P 500. Pre rôzne hodnoty parametra sme získali portfólia ktoré ležia na kladnej časti efektívnej hranice množiny portfólií s minimálny rozptylom (obrázok 1). Pri minimalizácií hodnoty value at risk sme zvolili hladinu spoľahlivosti α = 005. Riešením úlohy (1.9) sme získali efektívne portfólio s minimálnym rizikom. Výsledky optimalizácie na báze alternatívnych kritérií sú uvedené v tabuľke 2. Všetky úlohy boli riešené v MS Excel pomocu nástroja Solver pričom pri generovaní hranice portfólií s minimálnym rozptylom sme použili nástroje VBA.

90 88 FORUM STATISTICUM SLOVACUM 7/2011 Pri všetkých troch modeloch bola maximálna váha priradená akciám CSH CNI PPDI FIZZ čo bolo možné očakávať už pri pohľade na vstupné parametre kde pri uvedených akciách bol podiel rizika vzhľadom k výnosu výrazne nižší ako pri ostaných akciách. Naopak akcie ATNI neboli do portfólia zaradené vôbec resp. veľmi malým podielom čo sa dalo očakávať vzhľadom na veľmi nepriaznivý pomer rizika k výnosu. Na základe výsledkov riešenia úlohy na báze kritéria minimalizácie value at risk môžeme očakávať že s pravdepodobnosťou 095 strata portfólia nebude nižšia ako 229% pri očakávanom výnose 768% a riziku 144%. Tabuľka 2. Výsledky optimalizácie kritérium min σ p max E(U) min VaR 005 Akcia váhy (%) váhy (%) váhy (%) ATNI ORBC CSH ECPG LPNT FRWD CNI TSLA PPDI FIZZ E p 800% 853% 768% σ p 146% 152% 144% VaR % 6. Záver Obrázok 1: Hranica efektívnych portfólií Výber portfólia na základe prístupu mean-variance má niekoľko alternatívnych formulácií. Tieto formulácie sú ekvivalentné v tom zmysle že všetky generujú tú istú efektívnu hranicu portfólií ktorá je vyjadrením vzťahu očakávaného výnosu portfólia a jeho rizika. Pri kritériu minimalizácie rizika potom voľba konkrétneho portfólia závisí na úrovni požadovaného výnosu portfólia. Výber portfólia na základe kritéria maximalizácie užitočnosti závisí od stupňa averzie investora k riziku. Nízko hodnota parametra averzie

91 FORUM STATISTICUM SLOVACUM 7/ k riziku vedie k vysokým výnosom ale aj k vysoko rizikovému portfóliu. Ak pre každú optimalizáciu postupne meníme parameter averzie k riziku získame portfólia ktoré ležia na efektívnej hranici získanej pri optimalizácií na báze kritéria minimalizácie rizika pre rôzne požadované výnosy. Najznámejšou a najviac používanou mierou typu down-side risk je value at risk. Prístup uvedený v tomto článku je založený na predpoklade že výnosy a straty portfólia sú normálne rozdelené. V skutočnosti rozdelenia výnosov a strát sú mierne zošikmené do vľavo a leptokurtické. V takomto prípade je vhodné nájsť iné rozdelenie ktoré lepšie kopíruje skutočné rozdelenie výnosov 7. Literatúra [1] BOĎA M Value at risk II. Základné prístupy k modelovaniu. In: Forum Statisticum Slovacum č. 5 roč. 2. ISSN S [2] BOĎA M Stručné poznámky k finančnej riskmetrike. In: Forum Statisticum Slovacum č. 2 roč. 3. ISSN S [3] ELTON E. J. GRUBER M.J Modern portfolio theory and investment analysis. Willey ISBN [4] FABOZZI F.J. KOLM P. N. PACHMANOVA D.A. FOCARDI S.M Robust Portfolio Optimization and Managemet. New York : John Wiley &Sons ISBN [5] LIU S. XU R The Effect of Risk Aversion on Optimization. [on line] Prístupné na: [6] MLYNAROVIČ V Finančné investovanie. Bratislava: Iura Edition ISBN [7] ZMEŠKAL Z. A KOL Finanční modely. Praha: Ekopress ISBN Adresa autora: Mária Kanderová Ing. PhD. Ekonomická fakulta UMB Tajovského Banská Bystrica maria.kanderova@umb.sk Tento príspevok vznikol s podporou grantu VEGA 1/0967/11.

92 90 FORUM STATISTICUM SLOVACUM 7/2011 Deterministické produkčné hranice verejných vysokých škôl na Slovensku Deterministic production frontiers of public universities in Slovakia Samuel Koróny Štefan Hronec Abstract: The paper deals with deterministic frontier analysis applications to available indicators of twenty Slovak public universities from the year 2010 in the field of science and research (total financial grant amounts number of scientific works and number of non-scientific works). The oldest Slovak Comenius University is surprisingly among the worst from the viewpoint of deterministic frontier analysis applications to used indicators in the field of science and research level. On the opposite Slovak University of Technology in Bratislava is the best one. Keywords: Public universities Deterministic Frontier Analysis Kľúčové slová: verejné vysoké školy deterministická analýza produkčnej hranice JEL classification: I21 C38 C81 1. Úvod Efektívny systém alokácie verejných finančných prostriedkov do vzdelávania je jedným zo základných atribútov jeho úspešného fungovania. Napriek tomu že väčšia časť vzdelávania spadá do verejného sektora je rozhodovanie o alokácií finančných prostriedkov výsledkom subjektívnych rozhodnutí. Rozhoduje sa o ňom v politickom procese čo má za následok nedostatok alebo prebytok finančných prostriedkov alebo ich nevhodnú alokáciu ktorá sa neviaže na dosahované výkony. To vplýva negatívne nielen na kvalitu vzdelávania ale aj na ekonomický rast našej krajiny. Prejavuje sa dlhodobo poddimenzované financovanie vzdelávania a v dôsledku nerešpektovania požiadaviek trhu práce aj neúčelné vynakladanie prostriedkov. Výsledkom vzdelávacieho procesu tak nie je napĺňanie cieľov vzdelávacej politiky vychádzajúcich zo spoločenských potrieb. Preto je nevyhnutné hľadať nové metódy hodnotenia efektívnosti verejných vysokých škôl ktoré by dokázali objektívne prerozdeliť v relatívnom vyjadrení stále sa zmenšujúci balík verejných finančných prostriedkov. Tento príspevok bol podporovaný MŠ SR prostredníctvom projektu VEGA č. 1/0969/11 Matematicko-ekonomické metódy hodnotenia efektívnosti verejných vysokých škôl na Slovensku. Prezentuje predbežné výsledky výskumu v súlade s druhým cieľom projektu Matematicko-ekonomické metódy hodnotenia efektívnosti verejných vysokých škôl na Slovensku ktorým je na základe (štatistickej) produkčnej analýzy vnútornej efektívnosti vysokých škôl zostaviť ich poradie. V príspevku použijeme lineárny produkčný model. Metóda produkčných hraníc je výstupovo orientovaná a preto sa budeme zaoberať problémom vyjadrenia skutočnej a optimálnej úrovne vedy a techniky na verejných vysokých školách v zmysle maximalizácie jej výstupov. Pri posudzovaní efektívnosti vzdelávania nie je vhodné maximalizovať všetky výstupy (napr. počty absolventov) hlavne pre rôznu personálnu náročnosť študijných odborov a udržanie štandardu kvality vzdelávacieho procesu. V druhej časti príspevku je prezentovaný zdroj dát ich vymedzenie a dostupné analyzované ukazovatele. 2. Vymedzenie materiálu skúmania Podkladom pre spracovanie analýzy ukazovateľov verejných vysokých škôl boli údaje Výročnej správy o stave vysokého školstva za rok 2010 (vypracovaného v súlade s 102 ods. 2 písm. c) zákona č. 131/2002 Z. z.) a Centrálneho registra evidencie publikačnej činnosti.

93 FORUM STATISTICUM SLOVACUM 7/ Objektom skúmania sú verejné vysoké školy (ďalej školy ) v pôsobnosti rezortu Ministerstva školstva. Analyzované boli dostupné výkonové ukazovatele za rok Špecifickým prípadom výberového súboru je Univerzita J. Selyeho v Komárne ktorá bola založená v roku Napriek pomerne krátkemu obdobiu činnosti bola zaradená do súboru skúmaných vysokých škôl. Štátne vysoké školy zriaďované za účelom plnenia špecifických vzdelávacích úloh v rezorte obrany vnútra a zdravotníctva ako aj skupina súkromných vysokých škôl neboli súčasťou výberového súboru. Z dostupných výkonových ukazovateľov v oblasti vedy a výskumu boli pre potreby analýzy využité údaje o celkových objemoch finančnej podpory na projekty VEGA KEGA APVV a zahraničné projekty a tiež údaje o počte vedeckých a odborných publikácií. V personálnej oblasti boli použité údaje o absolútnom počte všetkých pedagogických (profesorov docentov odborných asistentov asistentov lektorov) a vedecko-výskumných zamestnancov. V ďalšej časti príspevku sú prezentované analytické postupy. 3. Metódy skúmania Okrem opisnej štatistiky sme pri štatistickej analýze efektívnosti škôl (z hľadiska výstupov) použili deterministickú analýzu produkčnej hranice ktorá je parametrickou alternatívou k metóde DEA (Jablonský 2004). Klasické regresné metódy (napr. metóda najmenších štvorcov) poskytujú informáciu o priemernej a nie relatívne maximálnej produkcii a preto je potrebné ich modifikovať. V súčasnosti sa používa niekoľko prístupov k riešeniu daného problému. V príspevku sme využili upravenú metódu najmenších štvorcov. Vychádzame z aditívneho modelu produkčnej hranice v tvare: y = f ( x β ) u (1) i i i kde y i je produkcia i-tej produkčnej jednotky x i je jej vektor vstupov f(x i β) je produkčná hranica. Ukazovateľ β je vektor technologických parametrov ktoré treba odhadnúť a u i reprezentuje úroveň výstupovo orientovanej technickej efektívnosti pomocou rozdielu skutočného výstupu (produkcie) a maximálne možného výstupu. V prípade efektívnej jednotky je u i = 0 pre neefektívne jednotky je u i > 0. Odchýlka od modelu produkčnej hranice je potom absolútna miera technickej efektívnosti. Neuvažuje sa pritom vplyv náhodných faktorov. Pri logaritmickej transformácii (napr. pri Cobbovej-Douglasovej produkčnej funkcii) je miera technickej efektívnosti vyjadrená v percentách. V príspevku vyjadrujeme deficit vo výstupe v pôvodných jednotkách preto používame lineárnu produkčnú hranicu. Pri danej metóde nie je cieľom hodnota parametrov β ale veľkosť odchýlok. V prvom kroku sa použije metóda najmenších štvorcov na získanie konzistentných a nestranných odhadov regresných parametrov β j a konzistentnej ale vychýlenej hodnoty konštanty β 0. V druhom kroku sa hodnota konštanty β 0 upraví pripočítaním maximálnej hodnoty odchýlky modelu (rezídua). Tak dôjde k posunu produkčnej hranice smerom nahor a všetky produkčné jednotky sú pod ňou. Maximálne efektívna jednotka má najväčšiu odchýlku a leží na produkčnej hranici. V nasledujúcej časti sú stručne prezentované štatistické parametre skúmaných ukazovateľov. 4. Výsledky opisnej štatistiky vybraných ukazovateľov Tabuľka 1 prezentuje základné štatistické parametre skúmaných ukazovateľov úrovne vedy a techniky na školách v roku 2010 (Priemer = aritmetický priemer Smer. od. = smerodajná odchýlka COV = variačný koeficient). Celkové finančné objemy na podporené projekty (ukazovatele VEGAOBJEM KEGAOBJEM APVVOBJEM

94 92 FORUM STATISTICUM SLOVACUM 7/2011 ZAHROBJEM GRANTYOBJEM) sú v tisíckach Eur. Ostatné ukazovatele sú absolútne počty. Priemerný počet všetkých pedagogických a vedecko-výskumných zamestnancov (PEDZAM) je 579. Minimálny je 79 (UJS Komárno) maximálny (UK Bratislava). Ostatných zamestnancov (OSTZAM) je v priemere 505 (od 63 na AU B. Bystrica po na UK Bratislava). Celkový priemerný počet zamestnancov je v rozpätí od 154 (UJS Komárno) do (UK Bratislava). Objem finančnej podpory projektov VEGA (VEGAOBJEM) je nulový v prípade VŠVU a AU. Najväčší je pri STU Bratislava - cca 24 mil. Eur. Zhruba štyrikrát menší je priemerný objem na projekty KEGA (KEGAOBJEM) s minimom na UJS Komárno a maximom na TUKE Košice. Pri zahraničných projektoch (ZAHROBJEM) majú nulový objem všetky tri umelecky orientované školy (AU VŠMU a VŠVU) pričom maximum je pri STU Bratislava. Domáce APVV projekty nezískali VŠMU TUAD Trenčín a AU B. Bystrica maximálny objem je opäť pri STU Bratislava. Celkovo na projektoch (GRANTOBJEM) získali školy v priemere 146 mil. Eur s minimom na AU B. Bystrica a maximom na STU Bratislava. V oblasti publikačnej činnosti (VEDMON = vedecké monografie - kategória AAA až ACD VEDCLA = vedecké články - kategória ADC až AFL VEDPUB = vedecké publikácie = vedecké monografie a články + AGI + AGJ ODBMON = odborné monografie - kategória BAA až BCK ODBCLA = odborné články - kategória BDA až BFB ODBPUB = odborné monografie a články + BGG + BGH SUMPUB = súčet všetkých publikácií - kategória A-G) je minimálny počet pri niektorej z troch umelecky orientovaných školách. Najväčší počet vo všetkých uvedených publikačných ukazovateľoch je na UK Bratislava. Veľké hodnoty variačného koeficienta a menšie hodnoty mediánu v porovnaní s aritmetickým priemerom svedčia o nesymetrickom silne sprava zošikmenom rozdelení s veľkými odľahlými hodnotami za školy UK Bratislava STU Bratislava a TUKE Košice. Uvedené vyplýva z veľkosti a zamerania škôl podľa vedných odborov. Tabuľka 1: Štatistické parametre ukazovateľov úrovne vedy a techniky Ukazovateľ Priemer Medián Smer. odch. COV Minimum Maximum PEDZAM OSTZAM ZAM VEGAOBJEM KEGAOBJEM ZAHROBJEM APVVOBJEM GRANTOBJEM VEDMON VEDCLA VEDPUB ODBMON ODBCLA ODBPUB SUMPUB V piatej časti si ukážeme výsledky za vybrané deterministické produkčné hranice.

95 FORUM STATISTICUM SLOVACUM 7/ Výsledky produkčných hraníc vybraných ukazovateľov Pre zistenie produkčných hraníc musíme vybrať najprv vstupy a výstupy produkčného vzťahu. Pre vstup ľudskej práce máme k dispozícii počet všetkých pedagogických zamestnancov ktorý zahŕňa aj vedecko-výskumných zamestnancov a tiež počet ostatných zamestnancov. Na produkcii výstupov vedy a techniky sa primárne podieľajú pedagogickí zamestnanci v menšej miere aj ostatní zamestnanci. Za výstup úrovne vedy a techniky sme vybrali dostupné ukazovatele projektovej a publikačnej aktivity na školách. Pre malé minimálne hodnoty finančných objemov jednotlivých typov projektov a publikácií sme vybrali agregovaný ukazovateľ celkového objemu za všetky projekty celkový počet vedeckých a odborných publikácií. Na grafe 1 je zobrazený výsledok aplikovania lineárnej deterministickej produkčnej hranice na celkový finančný objem podporených projektov. Dolná priamka je odhad strednej produkcie metódou najmenších štvorcov horná je odhad jej deterministickej hranice. Efektívna škola z hľadiska daného modelu je STU Bratislava. Ak by ostatné školy mali byť tiež efektívne tak by sa museli posunúť vo vertikálnom smere nahor na produkčnú hranicu. Lineárny regresný parameter účinnosti pedagogických zamestnancov je 34 (p < 0001; R 2 = 073). Ak sa zvýši počet pedagogických zamestnancov o jedného potom sa celkový objem podporených projektov zvýši v priemere o Eur za rok. Na grafoch 1-3 prezentujeme polohu škôl v priestore zvolených vstupov a výstupov. Graf 1: Deterministická produkčná hranica finančného objemu projektov (v tis. Eur) ako lineárna závislosť počtu pedagogických zamestnancov Na grafe 2 je zobrazená situácia pre celkový počet vedeckých publikácií efektívnou školou je TUKE Košice. Lineárny regresný parameter účinnosti pedagogických zamestnancov je 4 (p < 0001; R 2 = 096). Ak sa zvýši počet pedagogických zamestnancov o jedného potom sa celkový počet vedeckých publikácií zvýši v priemere o 4 za rok. Pre ukazovateľ celkového počtu odborných publikácií je efektívna TvU Trnava (graf 3). Parameter účinnosti pedagogických zamestnancov je 06 (p < 0001; R 2 = 087). Ak sa zvýši

96 94 FORUM STATISTICUM SLOVACUM 7/2011 ich počet o jedného potom sa celkový počet vedeckých publikácií zvýši v priemere o 06 za rok. Graf 2: Deterministická produkčná hranica počtu vedeckých publikácií ako lineárna závislosť počtu pedagogických zamestnancov Graf 3: Deterministická produkčná hranica počtu odborných publikácií ako lineárna závislosť počtu pedagogických zamestnancov

97 FORUM STATISTICUM SLOVACUM 7/ Konkrétne hodnoty absolútnych odchýlok ( deficitov ) škôl v troch uvedených výstupovo orientovaných deterministických produkčných hraníc a im odpovedajúce ratingy sú uvedené v tabuľke 2. V druhom stĺpci (GRANT) sú odchýlky celkového finančného objemu podporených projektov v tis. Eur. Ak by sa posledná UK Bratislava chcela dostať na úroveň optimálnej STU Bratislava tak by musela zvýšiť finančný objem projektov takmer o 48 mil. Eur. Za vedecké publikácie (VEDPUB) je v podobnej situácii VŠMU kde je odchýlka vedeckých publikácií od optimálnej hranice danej TUKE Košice. Je pravda že umelecky orientované školy by však mali byť posudzované osobitne. Naopak pri odborných publikáciách (ODBPUB) má TUKE Košice maximálny deficit rovný 522 publikácií voči efektívnej TvU Trnava. V troch ďalších stĺpcoch sú poradia odchýlok odpovedajúcich výstupov. Stĺpec PRIEMP obsahuje ich priemerné poradie a CELP je celkové poradie pri zohľadnení celkového počtu škôl. Z tabuľky vyplýva niekoľko špecifík v úrovni vedy a techniky na školách: relatívne najlepšou školou je STU Bratislava (prvá v celkovom finančnom objeme projektov ôsma v počte vedeckých publikácií a druhá v počte odborných publikácií) relatívne najhoršou školou je UK Bratislava (posledná v celkovom finančnom objeme projektov predposledná v počte vedeckých publikácií a pätnásta v počte odborných publikácií) pri niektorých školách sú veľké rozdiely v poradí uvažovaných ukazovateľov (napr. EU Bratislava je predposledná v celkovom finančnom objeme projektov ale druhá vo vedeckých a piata v odborných publikáciách; podobne aj PU Prešov) najväčší kontrast v počte vedeckých a odborných publikácií je v prípade TUKE Košice ktorá je prvá vo vedeckých a posledná v odborných publikáciách. Tabuľka 2:Absolútne odchýlky od deterministickej produkčnej hranice a ich rating VS GRANT VEDPUB ODBPUB PGRANT PVEDPUB PODBPUB PRIEMP CELP STU TvU PU UVL UKF EU TUZV UPJS ZU SPU TUKE KU UJS UMB UCM VSVU AU TUAD VSMU UK

98 96 FORUM STATISTICUM SLOVACUM 7/ Záver Na základe voľne dostupných údajov Ministerstva školstva SR bola uskutočnená deterministická produkčná hraničná analýza vybraných ukazovateľov verejných vysokých škôl na Slovensku za rok 2010 s cieľom posúdiť ich úroveň vedy a techniky. Z dostupných vhodných ukazovateľov sme použili: počty pedagogických zamestnancov (profesorov docentov odborných asistentov asistentov) a vedecko-výskumných zamestnancov; celkové objemy finančnej podpory na projekty VEGA KEGA APVV a zahraničné projekty; počty vedeckých a odborných publikácií. Z výsledkov analýzy vyplýva že UK Bratislava sa umiestnila v oblasti úrovne vedy a techniky v analyzovaných ukazovateľoch relatívne najhoršie pri použití prístupu pomocou deterministickej lineárnej produkčnej hranice. Rozdiely medzi školami nie sú len v rôznej veľkosti (charakterizovanej absolútnymi objemovými ukazovateľmi) ale aj v miere ich angažovanosti v troch základných oblastiach vedy a výskumu projekty vedecké publikácie odborné publikácie. 6. Literatúra JABLONSKÝ J. DLOUHÝ M Modely hodnocení efektivnosti produkčních jednotek. Praha : Professional publishing ISBN: Adresa autora: RNDr. Samuel Koróny PhD. Doc. Ing. Štefan Hronec PhD Centrum vedy a výskumu UMB Ekonomická fakulta UMB Cesta na amfiteáter 1 Tajovského Banská Bystrica Banská Bystrica samuel.korony@umb.sk stefan.hronec@umb.sk

99 FORUM STATISTICUM SLOVACUM 7/ Analýza agrárnej zamestnanosti a produktivity práce s akcentom na rozvoj agroturistiky The analysis of agrarian employment and labour productivity with the focus on agritourism Dagmar Kozelová Ladislav Mura Ivana Gecíková Miriam Pietriková Abstract: This paper analyzed data of employment and labor productivity in a selected group of 21 agricultural firms during period We have identified the continuously decreasing number of employees in primary production and increasing in tourism while the total number of employees rose slightly. The values of labor productivity in enterprises of legal entities between primary production and agritourism alternately fluctuate. Labor productivity in enterprises of natural persons is higher in primary than in agritourism. Key words: employment labour productivity agricultural firms agritourism Kľúčové slová: zamestnanosť produktivita práce poľnohospodárske podniky agroturistika JEL classification: C22 J01 1. Úvod Poľnohospodárstvo ako odvetvie národného hospodárstva zabezpečujúce výrobu rastlinných a živočíšnych produktov zohrávajúce významnú úlohu pri zabezpečovaní výživy obyvateľstva a zvierat vplývajúce na kvalitu životného prostredia a prispievajúce k ochrane a tvorbe krajiny za posledné roky prešlo v turbulentnom podnikateľskom prostredí výraznými zmenami. Jeho podiel na zamestnanosti vo vyspelých krajinách postupne klesá. Ekonomiku poľnohospodárskych podnikov ovplyvňujú viaceré faktory medzi najdôležitejšie však patria prírodné podmienky. Podniky alokované v jednotlivých výrobných oblastiach rozkladajú svoje podnikateľské riziko aj diverzifikovaním svojej činnosti a hľadaním nových príležitostí. Ekonomike poľnohospodárskych podnikov a diverzifikácii činností na farmách sa venujú viacerí autori vo svete napríklad [5] [1] [3] na Slovensku okrem iných aj [2] [4] [7] a ďalší. 2. Cieľ materiál a metódy Cieľom vedeckého článku je analyzovať vývoj zamestnanosti a produktivity práce vo vybranom súbore poľnohospodárskych podnikov prevádzkujúcich agroturistické zariadenia. Predmetom vedeckého príspevku je problematika malých a stredných poľnohospodárskych podnikov vo vidieckom cestovnom ruchu a agroturistike. K naplneniu stanoveného cieľa práce bolo potrebné získať spracovať a vyhodnotiť informácie o zamestnanosti štruktúre poľnohospodárskej výroby a o poskytovaných službách v podnikových agroturistických zariadeniach ekonomické informácie o podnikateľských subjektoch a tie navzájom komparovať. Príspevok vznikol spracovaním primárnych a sekundárnych zdrojov. Primárne zdroje informácií tvorili údaje získané technikou dotazníka. Tie boli využité na skúmanie vybraných ukazovateľov v agropodnikateľských subjektov. Výberový štatistický súbor po kontrole správnosti vyplnenia dotazníkov predstavovalo 21 podnikov malého a stredného agropodnikania. Diapazón skúmania boli roky Vzhľadom na skutočnosť že v skúmanom období bola na Slovensku až na rok 2009 mena slovenská koruna zachovávame

100 98 FORUM STATISTICUM SLOVACUM 7/2011 ju vo výpočtoch pre ľahšiu realizáciu komparácie údajov. Poznamenávame že finančné údaje za rok 2009 sú prepočítané fixným konverzným kurzom 1 = Sk. Údaje sú uvedené v mene Sk. Sekundárne informácie boli získané zo Štatistického úradu SR VÚEPP a odborných vedeckých publikácií. Pri výbere subjektov podnikajúcich v agroturistike sme uplatnili stratifikovaný výber zo základného štatistického súboru jednotiek evidovaných Štatistickým úradom SR. Za hlavné kritériá výberu podnikov sme zvolili: podnik musia spĺňať kritériá Smernice Európskej komisie č. 2003/361/EC o kategorizácii podnikov malého a stredného podnikania podnik s existenciou podnikania vo vidieckom turizme a agroturistike ochota zúčastniť sa na výskume a poskytnúť požadované informácie. Pri spracovaní údajov boli použité vybrané vedecké metódy.zo štatistických metód bola využitá regresná analýza doplnená o logicko-poznávacie metódy s postupmi indukcie dedukcie analýzy syntézy komparácie. 3. Výsledky a diskusia V rámci realizovaného výskumu bolo oslovených 30 podnikov. Nami stanovené výberové kritériá naplnilo 21 poľnohospodárskych podnikov. Z hľadiska výrobnej štruktúry uplatňuje 38 % skúmaných podnikov ekologický typ výroby a 62 % konvenčnú výrobu. čo sa týka právnej formy podnikania tak v skupine podnikov právnických osôb hospodári 5 podnikov konvenčným spôsobom a ekologickým spôsobom 3 podniky. V skupine podnikov fyzických osôb konvenčným spôsobom hospodári 8 podnikov a ekologickým spôsobom 5 podnikov.tieto podnikateľské subjekty prevádzkujú počas celého roka agroturistické zariadenia pričom poskytujú najmä ubytovacie a stravovacie služby predaj poľnohospodárskych produktov i výrobkov z dvora.okrem toho podniky ponúkajú v závislosti od ročnej sezóny rôzne doplnkové služby pri ktorých využívajú danosti a zaujímavosti okolitej prírody. V nadväznosti na prírodné podmienky lokalít v ktorých sú zariadenia alokované zosúlaďujú služby agroturistiky s hlavným zameraním prvovýroby. Jedná sa predovšetkým o chov koní (prevádzkovanie hipoturistiky) oviec hovädzieho dobytka pestovanie viniča výrobu vína a následný predaj produkcie z dvora. Pri stravovacích službách musia podľa [10] prevádzkovatelia zariadení spoločného stravovania dodržiavať zásady správnej výrobnej praxe a kontrolovať nebezpečenstvá spojené s výrobou a podávaním pokrmov. V skúmanom súbore agroturistických zariadení počas rokov celkový počet zamestnancov vzrástol z pôvodných 273 v roku 2005 na 352 v roku 2009 čo predstavuje 33 % nárast. Pre nárast celkového počtu zamestnancov(graf 1) sa javí najvhodnejšia logaritmická funkcia y = ln (x) ktorá síce charakterizuje rastúci trend avšak predpokladáme že už prišlo k stabilizácii počtu zamestnancov a možné zmeny budú realizované ako presuny v rámci jednotlivých profesií resp. kategórií zamestnancov v sledovaných odvetviach. Nárast počtu zamestnancov v agroturistike vyjadruje lineárna funkcia y = 241x Vychádzajúci z našich prepočtov existuje predpoklad že pri zachovaní súčasného rastu počtu zamestnancov dobrej prezentácií agroturistického zriadenia verejnosti a zachovaní určitého štandardu poskytovaných služieb by tento počet mohol do budúcna mierne zvýšiť. Ak sledujeme počet zamestnancov podľa vzdelanostnej štruktúry výsledky nášho prieskumu ukázali že počet pracovníkov so vzdelaním vysokoškolským a stredoškolským odborným sa stabilizoval čo znamená že už došlo k nasýteniu podnikov týmito pracovnými silami počet zamestnancov so stredoškolským vzdelaním rastie s diverzifikáciou činností

101 FORUM STATISTICUM SLOVACUM 7/ podnikov. Počty zamestnancov vyjadrujú nasledovné funkcie (graf 2): pracovníci so vzdelaním vysokoškolským logaritmická funkcia y = ln (x) pracovníci so stredoškolským vzdelaním lineárna funkcia y = 92 x pracovníkov so vzdelaním stredoškolským odborným logaritmická funkcia y = ln (x) a pracovníci so vzdelaním základným lineárna funkcia y = 19 x Graf1 Vývoj počtu zamestnancov v skúmanom súbore podnikov v diapazóne y = 6141ln(x) R² = y = 241x R² = celkový počet zamestnancov zamestnanci v agroturizme Zdroj: údaje primárny výskum vlastné spracovanie zamestnanci v prvovýrobe Z hľadiska produktivity celkovej práce v podnikoch právnických osôb za celý súbor podnikov môžeme konštatovať že najvyššia produktivita práce bola v roku 2009 kedy z 1 Sk celkových vlastných nákladov podniky dosiahli 131 Sk výnosov. Vývoj produktivity celkovej práce v podnikoch právnických osôb znázorňuje graf 3. V činnostiach agroturistiky bola produktivita celkovej práce najvyššia v roku 2005 a v prvovýrobe v roku 2008.Priemerná hodnota produktivity celkovej práce za agroturistiku v sledovanom období bola 119 Sk. Sk -1. Produktivita práce z pridanej hodnoty v poľnohospodárstve sa v jednotlivých podnikoch rôznych právnych foriem odlišuje. Podľa [8] v roku 2007 dosiahol tento ukazovateľ 227 tis. Sk v podnikoch právnických osôb 207 tis. Sk v podnikoch fyzických osôb a 255 tis. Sk v obchodných spoločnostiach. Údaje sú uvádzané na 1 zamestnanca. V podnikoch fyzických osôb bola produktivita celkovej práce za celý skúmaný súbor najvyššia v roku 2008 kedy z 1 Sk celkových vlastných nákladov podniky dosiahli 199 Sk výnosov (graf 4). V agroturizme bola produktivita celkovej práce najvyššia v roku 2007 a v prvovýrobe v roku 2006.Podniky právnických osôb dosahovali nižšiu produktivitu celkovej práce ako podniky fyzických osôb v sledovanom období. Rast produktivity práce v podnikoch sa prejavuje znížením množstva práce vynaloženej na výrobu jednotky produkcie alebo zvýšením objemu vyrobenej produkcie pri rovnakom množstve vynaloženej práce. Rast produktivity práce tak vedie k úspore vynakladanej práce i úspore mzdových nákladov. Na produktivitu práce vplývajú najmä [6]: technológie resp. spôsob využívania výrobných faktorov

102 100 FORUM STATISTICUM SLOVACUM 7/2011 organizácia a štruktúra výroby zdokonaľovanie výrobných strojov a zariadení zodpovednosti za organizáciu práce skvalitňovaním pracovnej sily motivácia a štýl riadenia. Graf 2 Vývoj štruktúry zamestnancov v skúmanom súbore podnikov podľa vzdelania v diapazóne Zdroj: údaje primárny výskum vlastné spracovanie Graf 3 Vývoj produktivity celkovej práce v podnikoch právnických osôb v diapazóne (v Sk. Sk -1 ) Zdroj: údaje primárny výskum vlastné spracovanie Medzi významné prvky motivácie malých podnikov patrí a z hľadiska právnej formy podnikania pri fyzických osobách je rozhodujúce osobné vlastníctvo. Práve vlastníctvo podniku a záujem vlastníka udržať si jeho trhovú pozíciu (nakoľko nesie zodpovednosť nielen

103 FORUM STATISTICUM SLOVACUM 7/ za seba ale aj za svoj podnik a jeho zamestnancov) motivujú podnikateľov fyzické osoby k podávaniu vyšších pracovných výkonov aj za cenu straty voľného času. Graf 4 Vývoj produktivity celkovej práce v podnikoch fyzických osôb v rokoch (v Sk. Sk -1 ) Zdroj: údaje primárny výskum vlastné spracovanie 4. Záver Uskutočnená analýza v súbore 21 poľnohospodárskych podnikov preukázala že počas skúmaného obdobia celkový počet pracovníkov v podnikoch rástol. Tento nárast bol podmienený nárastom počtu zamestnancov v agroturistike ktorý svojím tempom zmierňoval pokles zamestnancov v prvovýrobe. Trendové čiary naznačujú možný vývoj sledovaných ukazovateľov v roku Hodnoty produktivity práce v podnikoch právnických osôb medzi prvovýrobou a agroturistikou striedavo kolíšu. Je preto možné prijať všeobecné konštatovanie že agroturistika neprináša vyššiu produktivitu práce avšak pomáha zhodnocovať materiálové a ľudské zdroje podniku. Rozdiely v produktivite práce však môžeme pozorovať ak skúmame podniky z hľadiska právnej formy podnikania. Produktivita práce v podnikoch fyzických osôb je vyššia v agroturistike ako v prvovýrobe. Z uvedeného vyplýva že samozamestnávanie ktoré je pre fyzické osoby charakteristické a osobné vlastníctvo týchto podniky motivujú majiteľov a následne aj zamestnancov k vyšším pracovným výkonom k vyššej tvorbe pridanej hodnoty a tým aj k vyššej produktivite. Aby si samotný podnik udržal svoju konkurenčnú pozíciu na trhu je nútený diverzifikovať svoju ekonomickú činnosť o ďalšie aktivity mimo poľnohospodárstva pričom sa snaží zhodnotiť výsledky prvovýroby prírodné podmienky lokality v ktorej sa podnik nachádza ako aj všetky zdroje podniku. 5. Literatúra [1] BÉKEFI E. VARADI L Multifunctionalpondfishfarms in Hungary. In:Aquaculture International roč č. 3-4 s [2] FÁZIKOVÁ M. MILOTOVÁ B Metodologické a metodické prístupy k meraniu kvality života vo vidieckych obciach. In Acta regionaliaetenvironmentalica. roč č. 1 s ISSN [3] GECÍKOVÁ I. HUDÁKOVÁ M. RUMANOVSKÁ Ľ. SCHWARCZ P Aktuálne problémy a otázky rozvoja poľnohospodárstva v podmienkach Slovenskej republiky. Nitra: SPU s. ISBN

104 102 FORUM STATISTICUM SLOVACUM 7/2011 [4] HANSSON H. FERGUSON R. OLOFSSON CH Understandingthediversification and specializationoffarmbusinessesagricultural and FoodScience. roč č. 4 s [5] JARÁBKOVÁ J Theruralareas - theunutilizedpotential in lightoftourism. In Agriculturaleconomics. roč č. 11 s ISSN X [6] KRAUSZOVÁ A Techniky a prístupy podporujúce rast produktivity. In: Novusscientia Zborník príspevkovz X. celoštátnej konferencie doktorandovstrojníckych fakúlt technických univerzít a vysokých škôl s medzinárodnou účasťou. Herľany: 2007 s ISBN [7] NORTHCOTE J. ALONSO A. D Factors underlying farm diversification: the case of Western Australia s olive farmers. In Agriculture and Human Values roč č. 2 s [8] ŠULTEROVÁ S Manažment rozvoja agroturizmu. Dizertačná práca. Nitra: SPU. 132 s. [9] Správa o poľnohospodárstve a potravinárstve v SR Bratislava: MP SR s. 29 ISBN [10] ZAJÁC P. ČAPLA J. GOLIAN J. ZELEŇÁKOVÁ L. et al Príručka správnej výrobnej praxe pre zariadenia spoločného stravovania. Nitrianske Hrnčiarovce : Združenie HACCP Consulting. 220 s. ISBN Adresa autorov: Ing. Dagmar Kozelová PhD. Ing. et Bc. Ladislav Mura PhD. KHBP FBP Katedra ekonomiky Slovenská poľnohospodárska univerzita Ekonomická fakulta UJS Tr. A. Hlinku 2 Hradná ul Komárno Nitra ladislav.mura@gmail.com dkozelova@gmail.com Ing. Ivana Gecíková PhD. Ing. Miriam Pietriková PhD. KVS UVS KŠOV FEM Vysoká škola ekonómie a manažmentu VS Slovenská poľnohospodárska Železničná14 univerzita Bratislava Nitra ivana.gecikova@vsemvs.sk miriam.pietrikova@fem.uniag.sk

105 FORUM STATISTICUM SLOVACUM 7/ Sensitivity of Acoustic Emission Classification under Distribution Mixtures Citlivost klasifikace akustické emise pro odhady distribučních směsí Václav Kůs Jan Tláskal Abstract: The distribution mixture (DM) model is usually applied whenever there is a strong evidence of multimodality in the data which is the case of Acoustic Emission (AE) applications. Our scope is the following: to employ the divergence based set of signal classification attributes and to explore the possible use of the distribution mixture as a model based method in statistical AE classification and cluster analysis. The clusters are considered to be generated from the DM components with normal densities. We deal with the problem of optimal number of components of the mixture. The contaminated model with simulated misleading cluster is considered and comparative sensitivity study is produced to discover the basic stability and robustness properties of DM approach. Abstrakt: Distribuční směsi (DS) jsou použity pro odhad multimodálních dat v akustické emisi. Používáme atributy založené na spektrech signálů a divergencích a zkoumáme použití modelu DS jako statistické metody pro klasifikaci a shlukovou analýzu signálů akustické emise. Zabýváme se problémem optimálního počtu komponent směsi pro normální hustoty pravděpodobnosti. Je uvažován znečištěný model se simulovaným rušivým shlukem a je provedena citlivostní srovnávací studie za účelem prošetření stability a vlastností robustnosti klasifikace pomocí distribučních směsí hustot. Key words: Classification attributes phi-divergences Signal separation Robustness properties. Klíčová slova: Klasifikační atributy phi-divergence separace signálů robustnost odhadů. JEL classification: C61 1. Experiment and model based statistical classification method All processing laboratory measured acoustic signals were detected through the piezo-ceramic sensors attached to the thin metal plate. Emitted signals were measured and stored on a computer by means of measuring device Dakel-Xedo 5 in 12-bit accuracy and 4 MHz sampling rate. The resolution 12-bit means that the measuring sampling apparatus was able to distinguish the voltage in the interval [-2048mV 2048mV ]. We generated several versions of acoustic sources in the central part of experimental plate. We perform our cluster analysis with certain attributes computed from the normalized signal spectrums X found through the discrete Fourier transform. The spectrum is normalized to one in order to obtain the estimate T 1 of spectral density of the signal { X t} t =0 where T stands for digital length of the emission event. The normed spectrum is given by ~ T 1 S ( f ) = X f / X where T = f = 0 f We compute several attributes from the normed spectrums or directly from the signals and then we use these parameters within the statistical method based on numerical iterative EM algorithm applied to the distribution mixtures. This sometimes called Model-Based Clustering (MBC) method supposes that the data belong to a finite mixture of normal densities where each component represents one cluster. It means that we deal with the finite convex f

106 104 FORUM STATISTICUM SLOVACUM 7/2011 combination of probability densities given the sample of signal attributes x ( x K x ) = 1 n d xi R. The best normal mixture fit is performed through the maximum likelihood principle and it is based on a general iterative EM algorithm for finding maximum of the likelihood function under consideration. It manages to work with incomplete data sets in the form of y i = ( xi zi ) which contain the so-called unobserved data z i of the binary values referring to the seeking membership of the corresponding signal to a certain cluster. See [1]-[5] for more detailed analysis and proofs. We apply the MBC statistical method to the proposed classification attributes coming from our laboratory experiment and containing 5 types of acoustic emission sources originated from the measurements handled at the department of mathematics. The data obtained can be seen in Figure 1. Figure 1: Data measurements on acoustic emission with its signals and spectrums. We compute the following signal attributes together with φ -divergence parameter W Q Z D α β c φ = arg = min{ F [0 T 1] : = = T 1 t= t T 1 f =0 min δ ( x ) ~ S ( f ) φ T 1 l [0 T 1] f =0 t l f X F f =0 δ ( xt ) = f X 1 0 X f β} α [1 ) β (01) ifsgn( xt xt+ 1) = 1 otherwise c (01) ~ ( ~ refer S ( f )/ S ( f )) φ : (0 ) R φ(1) = 0 T 1 where X f denotes the arithmetic mean X f = X f / T f =0 f α refer S ~ is a normed reference

107 FORUM STATISTICUM SLOVACUM 7/ ~ refer m ~ i spectrum S ( f ) = S ( f ) / m with the number m of observations from one sort of i=1 ~ acoustic emission signals S i ~ ( f ) are individual realizations of the normed spectrums S ( f ) and J { j [0 T 1] : X γ max X } γ (01). In this paper we work with γ = j f [0 T 1] f W 2 (denoted as W ) Q 0.33 Z c (denoted as Z for c=1/20) and D φ the discrete form of the generalized Hellinger divergence with blending parameter β = 0.5 (denoted as D H ). The general blending parameter β = 1/(1+ b) [01] leads to the divergence functions with the corresponding generalized Hellinger divergences see [6] 2 1 ( p q) H β ( P Q) = d P Q P 2 2 µ ( β p + (1 β ) q) bounded for all β (01) with the skew symmetry H β ( P Q) = H1 β ( Q P) providing the 2 only symmetric divergence H 1/ 2 ( P Q) = 2H ( P Q) in this class. Here P Q are the probability spectral measures and p = dp/dµ q = dq/dµ are two spectral densities of acoustic signals. The attributes were computed for each signal and the separation by means of the proposed attributes can be seen in Figure 2. Figure 2: Signal separation by means of attributes Z W Q 0.33 and Hellinger D H.

108 106 FORUM STATISTICUM SLOVACUM 7/2011 In this case of our laboratory data set emitted on the thin metal plate we can conclude from Figure 2 that none of the attributes is efficient in separation of acoustic emission signals and if a certain selected parameter separates two clusters properly then some other two clusters are overlapping and this situation changes for each attribute computed from the signals. However if we use a suitable subset of the attributes we can achieve relatively good separation as in the case of Figure 1 above. MBC classification successes for these data sets are 88% if we use only two-dimensional attribute space ( Q 033 Zc ) and almost 90% for the three-dimensional case of ( Q Z D 0.33 c ) which is quite satisfactory. 2. Sensitivity of AE signal separation for laboratory data sets H We deal with the classification of acoustic emission signals by means of distribution mixtures under numerical iterative EM algorithm for pure data set which can be seen in Figure 1. Afterwards we proceed in contaminating the pure data by uniformly distributed noise with different contamination rate of 10% 20% 30% 35% and further also severe 50% as is shown in Figure 3 for the original data supposing here the knowledge of the original clusters design was lost. We carry out the clustering algorithm for these contaminated data to discover how sensible and powerful can be our procedure using statistical approach. We will see that the successful classification results mainly depend on the optimal number of clusters selected. a/b c/d Figure 3: Attributes Q 0.33 Z c and D H for laboratory acoustic data set under different uniform contaminations of a=10% b=20% c=30% d=35%.

109 FORUM STATISTICUM SLOVACUM 7/ For 20% contamination rate the algorithm does not manage to classify the 5 original clusters when we forced the procedure to use 6 clusters as proven in Figure 4 (left). However if we use 7 components for EM mixture fitting the original clusters are well visible and clearly separated one bunch from another. The only one problem is distinct here that the smallest original cluster is blurred and partially spread out over half of the attribute space see Figure 4 (right). 6/7 Figure 4: Classifications by means of Q 0.33 Z c and D H for 20%-contaminated laboratory acoustic data with 6 and 7 components of distribution mixtures A different situation emerged while clustering the data contaminated by 35% of uniformly randomly distributed noise. We need greater number of clusters for the successful classification as is shown in Figure 5. Again the problematic cluster is the smallest one i.e. the circles see Figure 5 (left) which is now for the case of 8 clusters used in numerical EM procedure very sparsely mixed with other groups except for the left bunch (red stars). 8/9 Figure 5: Classifications by means of Q 0.33 Z c and D H for 35% contaminated laboratory acoustic data with 8 and 9 components of distribution mixtures

110 108 FORUM STATISTICUM SLOVACUM 7/2011 The classification improves a lot if we force the EM algorithm to work with 9 clusters from the very beginning as was considered in Figure 5 (right). Subsequently all the original clusters are now visible well separated and moreover if the scattered clusters with large covariance matrix should have been removed afterwards from the experiment the next classification could be relatively reliable. 6/7 8/9 Figure 6: Classifications by means of Q 0.33 Z c and D H for 50% contaminated laboratory acoustic data with and 9 components of distribution mixtures The most interesting results were expected in the case of 50% contamination rate of Figure 6 where we carried out the iterative procedure to fit the distribution mixture with and 9 clusters at the starting point. Six or seven clusters in Figure 6 (top left and right) are both obviously insufficiently few. Nine components in Figure 6 (right bottom) seems to be also very spread out and mixed however this run was able to distinguish all the clusters except for the smallest one (brown diamonds) which is quite scattered in the vertical dimension of divergence attribute D H and also the same dispersion occurs to the large left hand-side cluster (black stars). The best result was attained in the case of iterative classification with eight clusters fixed see Figure 6 (left bottom) which is very successful and outstanding for a such level of quite severe contamination level.

111 FORUM STATISTICUM SLOVACUM 7/ Conclusions We have found that the statistical approach in practical acoustic emission applications really works moreover it is performing amazingly well as can be said with respect to the results obtained in Figures 456 compared to original Figure 1. We were able to classify the originally measured five clusters of acoustic emission signals even up to the case of quite severe 50% contamination level with randomly uniformly distributed noise covering the whole attribute space. Moreover these promising results were achieved by means of signal or spectral type simple characteristic attributes combined with information-theoretic based distances employed in statistics and called divergences or disparity measures. 4. References [1] G. McLachlan D. Peel. Finite Mixture Models. J. Wiley New York [2] G. McLachlan T. Krishnan. The EM algorithm and Extensions. J. Wiley New York [3] A.P. Dempster N.M. Laird D.B. Rubin. Maximum likelihood from incomplete data via the EM algorithm (with discussion). Journal of Royal Statist. Society B [4] G. Schwartz. Estimating the dimension of a model. Annals of statistics [5] C. Biernacki G. Celeux G. Covaert. Assesing a mixture model for clustering with the integrated classification likelihood. Technical Rep. No Rhone-Alpes: INRIA [6] V. Kůs D. Morales I. Vajda. Extension of the Parametric Families of Divergences Used in Statistical Inference. In: Kybernetika vol.44/ s Acknowledgments: This work was supported by the grant GACR P202/10/0618 and SGS 10/209/OHK4/2T/14. Authors addresses: Václav Kůs Ing PhD. Katedra matematiky FJFI ČVUT Trojanova Praha 2 vaclav.kus@fjfi.cvut.cz Jan Tláskal Ing. Katedra matematiky FJFI ČVUT Trojanova Praha 2 tlaskalik@ .cz

112 110 FORUM STATISTICUM SLOVACUM 7/2011 Modelovanie prietokov slovenských riek viacrežimovými modelmi Slovak rivers flows modeling by multi-regime models Jana Lenčuchová Anna Petričková Abstract: This article deals with the comparison of multi-regime models and their application to the hydrologic time series which are represented by flows of 14 selected Slovak rivers. SETAR LSTAR ESTAR and MSW models are representatives of this class. We consider two aspects for choosing the best models among them. It is description and prediction ability of time series modeling. Key words: time series multi-regime models predictions rivers flows Kľúčové slová: časové rady viacrežimové modely predikcie prietoky riek JEL classification: C22 1. Úvod Sedemdesiate a osemdesiate roky sa niesli v znamení lineárnych modelov využívajúc Box-Jenkinsonovu metodológiu. Reálny život však ukazuje že mnohé časové rady vykazujú silné nelineárne črty. Preto sa do pozornosti stále viac dostávajú nelineárne modely. Jednou zaujímavou triedou sú aj viacrežimové modely. Ich výhodou je že dobre zachytávajú zmeny ktoré predstavujú napr. obdobia rastu a poklesu. V reči hydrológie a prietokov riek jednotlivé režimy môžu reprezentovať suché daždivé alebo priemerné obdobie. Viacrežimové modely alebo modely s premenlivými režimami vo všeobecnosti rozdeľujeme na tie ktorých režimy sú určené pozorovateľnými premennými (TAR - SETAR STAR) a nepozorovateľnými premennými (MSW). 2. Modely s premenlivými režimami určenými pozorovateľnými veličinami Typickým predstaviteľom tejto triedy sú TAR modely ( Threshold AutoRegressive ). V 80-tych rokoch ich navrhol vo svojich prácach Tong ([10] [11]). Tieto modely predpokladajú že režim ktorý nastane v čase t môže byť určený nejakou pozorovateľnou premennou q t. Hodnoty tejto indikačnej premennej sú porovnávané s tzv. prahovou hodnotou c. V prípade dvojrežimového modelu jeden režim nastane v prípade ak je q t c druhý v prípade q t > c. SETAR modely Ak premenná q t nadobúda oneskorené hodnoty analyzovaného časového radu t. j. X t d kde d > 0 je celé číslo udávajúce oneskorenie hovoríme o modeli SETAR (z angl. Self-Exciting Threshold AutoRegressive) ([4]). Napríklad 2-režimový model SETAR s AR(p) v oboch režimoch má tvar X φ + φ X + L+ φ X I X > c + φ + φ X + L+ φ X I X > c + ε ( )[ ( )] ( ) ( ) t = t 1 p1 t p 1 t d t 1 p 2 t p t d t kde ε t je proces striktného bieleho šumu s E[ ε ] = 0 t D pre všetky t a I[A] je 2 [ ε t ] = σ ε indikačná funkcia s hodnotami Ι[A] = 1 ak udalosť A nastane inak Ι[A] = 0. STAR modely Ak nahradíme indikačnú funkciu I[q t > c] spojitou funkciou F(q t δ c) (prechodová funkcia) ktorá sa s rastúcim q t hladko mení od 0 do 1 výsledný model nazývame STAR (z angl. Smooth Transition AutoRegressive) model ([1] [4]). Napríklad 2-režimový STAR model s AR(p) modelom v obidvoch režimoch a indikačnou premennou q t = X t-d má tvar

113 X FORUM STATISTICUM SLOVACUM 7/ ( φ + φ X + L + φ X )[ F( X δ c) ] + ( φ + φ X + L + φ X ) F( X δ c) + ε. t = t 1 p1 t p 1 t d t 1 p 2 t p t d t Ak prechodová funkcia má tvar logistickej funkcie 1 F( q ; ) t δ c 1+ exp( δ ( qt c) ) δ > 0 (1) potom hovoríme o modeli LSTAR. Ak má tvar exponenciálnej funkcie 2 F( qt ; δ c) = ( 1 exp( δ ( qt c) ) δ > 0 (2) dostaneme model ESTAR. 3. Modely s premenlivými režimami určenými nepozorovateľnými veličinami Markov-switching (skr. MSW) modely patria do triedy modelov s režimami určenými nepozorovateľnými veličinami tzn. že jednotlivé režimy nevieme určiť jednoznačne ako to je pri režimoch určených pozorovateľnými veličinami ale len na základe pravdepodobnosti. MSW modely Definujme náhodnú premennú s t nadobúdajúcu hodnoty z množiny { N } ktorá bude reprezentovať takúto nepozorovateľnú veličinu určujúcu režim. Pomocou nej vytvoríme stochastický proces { s t } ktorý špecifikuje v akom režime sa proces nachádza v danom čase. V roku 1989 Hamilton [5] konkretizoval tento stochastický proces ako homogénny Markovov proces prvého rádu tzn. musí spĺňať nasledujúcu vlastnosť: P s j s = i s = k...) = P( s = j s = i) = ( t = t 1 t 2 t t 1 pij kde i j k = 1... N a N je počet režimov. Táto vlastnosť predstavuje že pravdepodobnosť procesu v režime j v čase t závisí len od predchádzajúceho režimu i v čase t-1. Je zrejmé že musí platiť: p 1 p p = 1 i + i in pre i = 1...N. Takisto vyžadujeme aby bol proces ergodický tzn. p ij > 0 pre i j = 1...N. Základný autoregresný MSW model je v jednotlivých režimoch popísaný AR(p) modelom a má nasledujúci tvar: y φ 0 φ... φ + ε t = s + 1 s yt p s yt p t t kde náhodná premenná s t = N t = p +1...T pričom T je dĺžka časového radu. Proces ε t je typu i.i.d. (rovnako rozdelené nezávislé náhodné premenné) s normálnym rozdelením 2 ε ~ N(0 ). MSW modely môžu nadobúdať aj iné tvary napríklad podmienením t σ ε reziduálnej disperzie náhodnou premennou s t alebo zmenou skeletonu modelu atď. 4. Aplikačná časť V tejto časti porovnávame vyššie spomenuté modely (SETAR LSTAR ESTAR a MSW) aplikované na hydrologické časové rady z dvoch rôznych hľadísk z hľadiska predikcie a popisných vlastností modelu. Pre náš výskum používame hydrologické dáta priemerné mesačné prietoky vybraných 14 slovenských riek meraných v daných obdobiach: Belá (Podbanské): január december 2008 Čierny Váh (Čierny Váh): január december 2008 Dunaj (Bratislava): január december 2008 Dunajec (Červený Kláštor): január december 2008 Handlovka (Handlová): január december 2006 Hnilec (Jalkovce): január december 2008 t t

114 112 FORUM STATISTICUM SLOVACUM 7/2011 Hron (Banská Bystrica): január december 2008 Kysuca (Čadca): január december 2008 Litava (Plastovce): január december 2008 Morava (Moravský Ján): január december 2008 Orava (Drieňová): január december 2008 Poprad (Chmelnica): január december 2004 Topľa (Hanušovce): január december 2008 Torysa (Košické Olšany): január december 2008 Na modelovanie dát využívame výpočtový systém Mathematica verzia 8 a vo všetkých štatistických testoch ktoré používame (test linearity test ostávajúcej nelinearity...) uvažujeme hladinu významnosti V prípade popisných vlastností porovnávame štandardné odchýlky rezíduí modelov a v prípade predikcií porovnávame ich stredné kvadratické chyby (RMSE): (y i y i ) 2 i=1 RMSE = k kde y i je skutočná a y~ i je predpovedaná hodnota časového radu k je počet predikcií v našom prípade 12. k Porovnanie popisných vlastností modelov V prvej časti zhrnieme výsledky odhadov optimálnych hodnôt parametrov modelov s premenlivými režimami konkrétne SETAR LSTAR ESTAR (modely s režimami určenými pozorovateľnými veličinami) a MSW (modely s režimami určenými nepozorovateľnými veličinami). Pri každom modeli sme uvažovali ako 2 tak aj 3 režimy až do rádu q = 5. Testovali sme autokoreláciu rezíduí a testom ostávajúcej nelinearity to či je pre dané dáta vhodnejší dvojrežimový alebo trojrežimový model časového radu. Najlepší model na popis pre každý hydrologický časový rad je model s najmenšou štandardnou odchýlkou rezíduí pozri Tabuľka 1. (vyznačené tučným písmom). Porovnanie predikčných vlastností modelov V druhej časti sa venujeme predikcii hodnôt. Analýzu časového radu vykonávame len na časti dát. Posledných niekoľko údajov v našom prípade 12 (kalendárny rok) používame na porovnanie s predikciami modelov čím pomocou predpovedných chýb RMSE (root mean squared error) zisťujeme predikčné vlastnosti jednotlivých modelov. Ako najlepší model z hľadiska predikcie vyberáme model s najmenšou strednou kvadratickou chybou RMSE (v Tabuľke č. 2 vyznačené tučným písmom). Z hľadiska popisných vlastností najhoršie dopadol model SETAR ktorý mal najmenšiu štandardnú odchýlku rezíduí spomedzi všetkých modelov iba v jednom zo 14 prípadov. Modely LSTAR a MSW sú na tom zhodne; najmenšiu štandardnú odchýlku rezíduí majú v 4 prípadoch. Zvyšných 5 najlepších modelov sú typu ESTAR. Z tohto vyplýva že žiaden z modelov nie je výrazne najlepší na popis dát. Naproti tomu výrazne najhoršie dopadol SETAR model. Z hľadiska predikčných vlastností v 2 prípadoch najmenšiu strednú kvadratickú chybu dosiahol SETAR model. MSW a ESTAR model zhodne dosiahli najlepšie modely z pohľadu predikcií trikrát. Model LSTAR zaznamenal najlepšie výsledky u 6 časových radov.

115 FORUM STATISTICUM SLOVACUM 7/ Tabuľka č. 1: Porovnanie popisných vlastností modelov Dáta štandardná odchýlka rezíduí σ ε SETAR LSTAR ESTAR MSW Belá Podbanské Čierny Váh Dunaj Bratislava Dunajec Červený Kláštor Handlovka Handlová Hnilec Jalkovce Hron BB Kysuca Čadca Litava Plastovce Morava Moravský Ján Orava Drieňová Poprad Chmelnica Topľa Hanušovce Torysa Košické Olšany Tabuľka č. 2: Porovnanie predikčných vlastností modelov Dáta RMSE SETAR LSTAR ESTAR MSW Belá Podbanské Čierny Váh Dunaj Bratislava Dunajec Červený Kláštor Handlovka Handlová Hnilec Jalkovce Hron BB Kysuca Čadca Litava Plastovce Morava Moravský Ján Orava Drieňová Poprad Chmelnica Topľa Hanušovce Torysa Košické Olšany Záver V článku modelujeme vybrané prietoky slovenských riek viacrežimovými modelmi konkrétne modelmi ktorých režimy sú určené pozorovateľnými veličinami SETAR LSTAR a ESTAR a modelmi ktorých režimy sú určené nepozorovateľnými veličinami - MSW model. Porovnávame výsledné modely z pohľadu najmenšiu štandardnej odchýlky

116 114 FORUM STATISTICUM SLOVACUM 7/2011 rezíduí a najmenšiu strednej kvadratickej chyby rezíduí. Z pohľadu popisných vlastností bol mierne najlepší ESTAR model (5 zo 14 časových radov). Najhoršie dopadol SETAR model ktorý bol najlepší len v jednom zo 14 časových radov. LSTAR a MSW boli vybraté ako najlepšie modely zhodne u 4 časových radov čo napokon nie je výrazne za ESTAR modelom. Naše očakávanie bolo v tomto prípade že najlepším modelom na popis dát bude suverénne MSW model pretože po našich skúsenostiach to doposiaľ vždy tak bolo. Predtým sme modelovali ale ekonomické alebo finančné časové rady. Zväčšením našej vzorky zo 14 časových radov na väčší počet by sa táto schopnosť MSW modelov dobre popisovať dáta mohla prejaviť respektíve túto schopnosť majú aj STAR modely pre hydrologické dáta. Čo sa týka predikcií najvýraznejšie výsledky dosiahol LSTAR model (6 najlepších modelov zo 14). SETAR model podobne ako pri popise je aj na predikciu najmenej vhodným modelom (najlepší bol len u dvoch zo 14 časových radov). Ako vidíme pre hydrologické časové rady priemerných mesačných prietokov sú vhodné viacrežimové modely rôznych typov pričom na popis môže byť najlepší jeden typ a na predikciu iný typ viacrežimových modelov. Preto je nutné si ujasniť čo je pri zadaní dôležitejšie skúmať a analýzu časového radu tomu prispôsobiť. 6. Literatúra [1] AKINTUG B. - RASMUSSEN P. F A Markov switching model for annual hydrologic time series. Water Resour Res [2] ARLT JOZEF - ARLTOVÁ MARKÉTA Finanční časové řady. Grada Publishing a.s [3] BOX G. E. P. - JENKINS G. M Time Series Analysis: Forecasting and Control. Holden-Day San Francisco [4] FRANSES P. H. - D. VAN DIJK Non-linear time series models in empirical finance. Cambridge University Press Cambridge [5] HAMILTON J. D A new approach to the economic analysis of nonstationary time series subject to change in regime. In: Econometrica No [6] HAMILTON J. D Time Series Analysis. Princeton University Press [7] LEBARON B Some relationships between volatility and serial correlation in stock market returns. Journal of Business [8] PSARADAKIS Z. - SOLA M Finite-sample properties of the maximum likelihood estimator in autoregressive models with Markov switching. In: Journal of Econometrics No [9] SEAN D. CAMPBELL Specification Testing and Semiparametric Estimation of Regime Switching Models: An Examination of the US Short Term Interest Rate. Department of Economics Brown University [10] TONG H On a threshold model. In: C. H. Chen (ed.) Pattern recognition and Signal Processing Amsterdam [11] TONG H Non-linear time series: A dynamical systems approach. Oxford University Press Oxford Adresa autora (-ov): Jana Lenčuchová Mgr. Department of Mathematics FCE Slovak University of Technology Bratislava Radlinskeho Bratislava lencuchova@math.sk Anna Petričková Mgr. Department of Mathematics FCE Slovak University of Technology Bratislava Radlinskeho Bratislava petrickova@math.sk Poďakovanie: Táto práca bola podporená grantmi APVV č. LPP a VEGA 1/0143/11.

117 FORUM STATISTICUM SLOVACUM 7/ Využitie parametrického bootstrapu pri výpočte poistných rezerv Parametric bootstrap application at claim reserves calculation Bohdan Linda Jana Kubanová Michal Kuban Abstract: The paper shows bootstrap solution of the problem of confidence interval construction for predicted cumulative Chain ladder claims under condition that development factor is lognormal distributed. Abstrakt: V článku je riešená problematika výpočtu intervalu spoľahlivosti pre poistné rezervy za predpokladu lognormálneho rozdelenia pravdepodobností vývojového faktora. Key words: lognormal distribution development factor claim reserve Chain ladder method confidence interval parametric bootstrap nonparametric bootstrap Kľúčové slová: lognormálne rozdelenie vývojový faktor poistná rezerva metóda Chain ladder interval spoľahlivosti parametrický bootstrap neparametrický bootstrap JEL classification: C G 1. Introduction The paper continues the previous authors work about claim reserves calculation. The problem of claim reserves estimate is usually solved without any presumptions about probability distribution. Previous paper dealt with distribution free model [Linda Kubanová Jindrová]. This paper deals with the claim reserves estimate under presumption of lognormal distribution of individual development factors. For estimate of unknown claim reserves values bootstrap is used. 2. Implementation of the lognormal model for the development factor The individual development factors λ ij indicate the relation between the cumulative claims in the period j+1 and j it means that λ ij = C ij+1 / C ij. This individual development factor is considered as random variable with lognormal probability distribution with parameters µ j and σ j i.e. log λ ij = Ci log Ci j j 1 N(µ j ; σ j ). The parameters µ j and σ j are generally unknown and they have to be estimated. The following statistics can serve as the point estimators [Wuettrich Merz]: ˆµ = j I j 1 Ci j log j + 1 i= Ci j I 0 1 I j 1 = Ci j ˆ σ j = log ˆ µ j I j i 0 Ci j 1 The assumption of the lognormal probability distribution of the development factor can be combined with various claim reserving models. The simple Chain Ladder model was applied in this paper [Pacáková]: 2

118 116 FORUM STATISTICUM SLOVACUM 7/2011 C λ i j = j Ci j 1 where λ j is development factor which can be estimated by formula ˆλ J i i= 0 j = J i i= 0 C C i j i j 1 3. Bootstrap procedure for calculating of expected claim reserves a) Download of engaged data C ij ; i = I j = J - i b) Calculation of λ ij log λ ij = Ci log Ci j j 1 ; i = I j = J - i for j = 0 we put log λ i0 = logc i 0 ; i = I c) Estimate of lognormal distributions parameters d) Bootstrap simulations: I j 1 Ci j ˆµ j = log + ; j = J 1 I j 1 i= 0 Ci j 1 I j 1 = Ci j ˆ σ j = log ˆ µ j I j i 0 Ci j 1 r Algorithms for creating of bootstrap samples (values C * ): For r = 1 to R are generated * r log λi j from N( ˆ µ j ; ˆ σ j ) distribution for i = I C = C ; i = I * r i 0 i0 * r i j * r λ = e ; i = I and j = 1 2 J i λ i j log λ * r * r * r j i j 1 λi j i j 2 j = J - i C i = C ; i = I and j = J i J i * r i= 0 j = J i i= 0 C C * r i j * r i j 1 Forecasted values i.e. values * r i j ; j = J i C * for i + j > J are calculate according the formula r i j * r * * = Ci j i λj i+ 1 λj i+ 2 C... λ j This process is repeated for next r. *

119 FORUM STATISTICUM SLOVACUM 7/ Results The application of the bootstrap method enables us to calculate the predicted financial amount of money for claim reserves but even the confidence interval. The calculated values of claims and upper and lower limits of confidence intervals for this values are stated in table 1. Table1: 90% confidence interval for incremental values of claims reserves The left-upper triangle (in grey colour) presents incremental values of known claims in the period of 10 years [Taylor Ash]. The right-lower triangle is created by three values in each cell. The middle value is the incremental claim calculated by parametric bootstrap under condition of lognormal distribution of the development factor upper and lower bold values are limits of 90% confidence interval for claims. These limits were calculated as 50 th and 950 th ordered value of bootstrap replication of cumulative claims [Linda Kubanová]. This is one simple way how to obtain the interval estimates. The classical analytical way application is very difficult the lack of data doesn t allow us to make any assumptions about distribution and the mathematical process is complicated.

120 118 FORUM STATISTICUM SLOVACUM 7/2011 Tab.2 Claim reserving estimates and confidence interval limits - comparison period CL CL log-norm CL-boots low.limit log up.limit log low.limit boots up.limit boots Legend: CL claim reserves calculated by classical Chain ladder method CL log-norm - claim reserves calculated by parametric bootstrap under assumption of lognormal distribution of the development factor CL-boots - claim reserves calculated by nonparametric bootstrap of residuals low.limit log; up.limit log confidence interval limits calculated by parametric bootstrap under assumption of lognormal distribution of the development factor low.limit boots; up.limit boots - confidence interval limits calculated by nonparametric bootstrap The lowest estimated claims were find out at 78% of periods when parametric bootstrap was used and assumption of lognormal distribution presumed. Resting 28% of the lowest claims were obtained by Chain ladder method. On the other side the highest values of claim reserves were obtained by nonparametric Chain ladder. The confidence interval is narrower when assumption of lognormal distribution was used for 67% of periods. 4. Conclusion The paper describes one of rarely know method of claims reserves estimates. This access enables to have wider view at this described problem and to find as possible optimal solution. 5. Literature [1] HINKLEY D. V DAVISON A.C Bootstrap methods and their application. Cambridge University Press s. ISBN [2] KUBANOVÁ J Bootstrapové metody. Monografie. Univerzita Pardubice s. ISBN [3] LINDA B. KUBANOVÁ J. JINDROVÁ P Insurance reserves estimation by bootstrap. In: Proceedings of conference: Modeling simulation and management of insured risks. Univerzita Pardubice [4] LINDA B. KUBANOVÁ J Claim reserves prediction by resampling method. In: Proceedings 2011 World Congress on Engineering and Technology Shanghai Čína ISBN [5] MACKT Distribution-free calculation of the standard error of chain ladder reserve estimates. Astin Bullerin 23/2 s [6] PACÁKOVÁ V Poistná štatistika. Iura Edition. Bratislava ISBN

121 FORUM STATISTICUM SLOVACUM 7/ [7] TAYLOR G. C. ASHE F. R Second moments of estimates of outstanding claims. J. ECONOMETRICS [8] WŐTHRICH M.V. MERZ M Stochastic Claims Reserving Methods in Insurance. John Wiley s.isbn Remark: The article was elaborated with the support of the grant GAČR 402/09/1866 Modelling simulations and management of insurance risk. Authors addresses: Bohdan Lindadoc.RNDr.CSc. FES Univerzita Pardubice Studentská Pardubice Jana Kubanovádoc.PaedDr.CSc. FES Univerzita Pardubice Studentská Pardubice Michal KubanBc. FJFI ČVUT Praha Praha

122 120 FORUM STATISTICUM SLOVACUM 7/2011 Stanovení optimálního počtu shluků při shlukové analýze Determination of Optimal Number of Clusters in Cluster Analysis Tomáš Löster Abstract: Cluster analysis takes an important role in many areas. Since the resulting distribution of objects into clusters may vary depending on the selected methods and specifications it is appropriate to assess the results obtained. This paper proposes new ways of evaluating results in a situation where objects are characterized variables of different types. The newly proposed evaluation methods (modified CHF coefficients) are applied to real data sets (of different sizes with different number of variables including variables of different types) and the behaviour of these coefficients in different conditions is being examined. The analysis has proven that in most cases this value meets the expected results of the well-known classification of objects into clusters.. Key words: Cluster analysis Evaluating coefficients Optimal Number of Clusters Kľúčové slová: Shluková analýza hodnotící koeficienty optimální počet shluků. JEL classification: C02 C38 1. Úvod Shluková analýza zahrnuje řadu metod a postupů které slouží především ke klasifikaci objektů. Zastává významnou roli v mnoha odvětvích. Vzhledem k tomu že se výsledná rozdělení objektů do shluků mohou lišit v závislosti na zvolených metodách a dílčích specifikacích je vhodné získané výsledky hodnotit. V současné odborné literatuře jsou uvažovány téměř výlučně koeficienty používané pro hodnocení výsledků shlukování a pro stanovení optimálního počtu shluků v situaci kdy jsou jednotlivé objekty charakterizovány pouze kvantitativními proměnnými. Současně však také není v literatuře jednoznačně vymezeno za jakých podmínek je každý z existujících koeficientů nejvhodnější pro hodnocení konkrétního shlukování. Některé koeficienty srovnávají shlukovací metody pomocí jiných lze určit optimální počet shluků. Autoři těchto koeficientů řeší problematiku hodnocení z různých pohledů a pomocí různých nástrojů a tak ani jejich vzájemné srovnávání není v mnoha případech možné. V případě že se výsledky hodnocení shodují na základě hodnot více koeficientů současně je možné tyto závěry považovat za správné. Jak uvádějí i samotní autoři koeficientů např. viz [2] v některých případech je dokonce nutné hodnotit výsledky shlukování současně pomocí několika koeficientů. Shlukovat lze ovšem i objekty které jsou charakterizovány kvalitativními proměnnými případně proměnnými různých typů. Problematice hodnocení výsledků shlukování takto charakterizovaných objektů je v literatuře věnována pozornost zatím pouze v omezené míře. 2. Hodnocení disjunktního shlukování Disjunktní shlukování je způsob rozkladu objektů do shluků s pevným přiřazením kdy je objekt zařazen právě do jednoho shluku. Pro hodnocení rozdělení množiny n objektů do k disjunktních shluků bylo navrženo mnoho koeficientů bez ohledu na způsob jakým bylo rozdělování objektů uskutečněno. Obvykle tedy nezáleží na tom zdali jsou shluky výsledkem metod rozkladu a nebo výsledkem hierarchického shlukování viz [5]. Existují však také koeficienty které jsou určeny pouze pro hierarchické shlukování. Nechť jsou dále označeny následující součty čtverců: SS B = součet čtverců mezi shluky (charakteristika mezishlukové variability) SS W = součet čtverců uvnitř shluků (charakteristika vnitroshlukové variability)

123 FORUM STATISTICUM SLOVACUM 7/ SS T = celkový součet čtverců (charakteristika celkové variability). Pro jednotlivé součty čtverců platí: SS k m 2 W = ( xit xht ) h= 1 x C t = 1 SS i h n m 2 T = x it x t ) i= 1 t = 1 SS B T (1) ( (2) = SS SS (3) kde x it je hodnota t-té proměnné u i-tého objektu k je počet shluků m je počet proměnných C h představuje h-tý shluk x ht je průměrná hodnota t-té proměnné v h-tém shluku a n je celkový počet objektů. CHF index (též pseudo F index) navrhli Calinski a Habarasz viz [1]. CHF index je definován jako podíl průměrné mezishlukové a průměrné vnitroshlukové variability tj. podle vzorce I CHF ( k) W SSB k 1 ( n k) SS = B =. (4) SSW ( k 1) SSW n k Používá se pro stanovení optimálního počtu shluků. Vysoké hodnoty tohoto indexu reprezentují dobře oddělené shluky tj. hledá se maximální hodnota tohoto indexu která indikuje optimální počet shluků k* tj. I CHF( CHF 2 k n 1 k*) = max I ( k). (5) 3. Hodnocení shlukování s proměnnými různých typů Hodnocení výsledků shlukové analýzy tj. získaná přiřazení objektů do shluků která jsou uvedena v předchozí části jsou aplikovatelná pouze v případě že jsou objekty charakterizovány kvantitativními proměnnými. V této části jsou navrženy nové postupy a principy hodnocení shlukování pro případ že shlukované objekty jsou charakterizované proměnnými různých typů tj. kombinací kvantitativních a nominálních proměnných. Nově navržené koeficienty jsou založeny na variabilitě. Nově navržené modifikace CHF indexu (též pseudo F) je možné v případě proměnných různých typů stanovit podle vzorce ( ( n k) ( H (1) H ( k) ) ICHFH k) = (6) ( k 1) H ( k) nebo podle vzorce I CHFG ( ( G(1) G( k) ) ( n k) k) =. (7) ( k 1) G( k) Hodnoty H(k) a G(k) představují míry variability stanovené pomocí entropie resp. Giniho koeficientu. Pro k shluků se stanoví podle vzorců resp. k m 1 m2 Kt n h nhtu nhtu H ( k) = ln( s + t sht ) ln (8) h= 1 n t= 1 2 t= 1 u= 1 nh nh 2 k m1 m2 Kt n h nhtu G( k) = ln( s + + t sht ) (1 ) (9) h= 1 n t= 1 2 t= 1 u= 1 nh

124 122 FORUM STATISTICUM SLOVACUM 7/2011 kde K t je počet kategorií t-té proměnné je n htu je počet objektů u-té kategorie t-té proměnné v h-tém shluku n h je počet objektů v h-tém shluku m 1 je počet kvantitativních proměnných m 2 je počet nominálních proměnných s je vyběrový rozptyl t-té proměnné a s je výběrový rozptyl t-té 2 t proměnné v h-tém shluku. Stejně jako v případě kvantitativních proměnných je tento index vhodný pro stanovení optimálního počtu shluků. Vysoké hodnoty tohoto indexu indikují dobře oddělené shluky tedy se hledá maximální hodnota tohoto indexu v rámci předem stanoveného intervalu. Pro ilustraci praktické aplikace nově navržených koeficientů aplikovatelných na proměnné různých typů jsou analyzovány datové soubory které pocházejí z databáze The UCI Machine Learning Repository (webová adresa je: Celkem je analyzováno 16 datových souborů. V tabulce 1 je uveden správný (známý) počet shluků do kterých jsou objekty rozděleny. Pro srovnání je uvedeno kritérium BIC které je aplikováno v systému SPSS a je definováno např. v [1]. Tabulka 1: Stanovené počty shluků a úspěšnost nově navržených kritérií Soubor/kritéria správný počet I BIC I CHFH I CHFG Car Evaluation Adult Wine Wine Wine Wine Wine Iris 1 3(2) Iris 2 3(2) Abalone Contraceptive Contraceptive Cardiotocography Thyroid Disease German Credit German Credit Správné určení % 7500% 9375% 2 ht Z tabulky 1 vyplývá že nově navržené modifikace CHF koeficientu jsou pro stanovení počtu shluků vhodnější než kritérium aplikované v systému SPSS neboť jeho úspěšnost v kombinaci s entropií je u analyzovaných souborů 75 % na rozdíl od kritéria BIC jehož úspěšnost byla pouze 375 %. Modifikace s využitím Giniho koeficientu byla ještě úspěšnější činila 9375 %. 4. Závěr V literatuře bylo navrženo mnoho koeficientů určených k hodnocení výsledků shlukování v případě kvantitativních proměnných z nichž některé již byly implementovány do softwarových produktů a tedy jsou běžně používané k hodnocení reálných datových souborů. Při praktických úlohách je však třeba stanovit hodnoty více koeficientů současně protože neexistuje kritérium které by s jistotou jednoznačně ohodnotilo výsledek shlukování. Některé koeficienty srovnávají shlukovací metody podle jiných lze stanovit optimální počet shluků.

125 FORUM STATISTICUM SLOVACUM 7/ Pro hodnocení shlukování v případě že jsou objekty charakterizovány proměnnými různých typů byly navrženy modifikace CHF koeficientu. Zároveň byla provedena praktická aplikace tohoto nově navrženého koeficientů na různé varianty datových souborů. Celkově bylo hodnoceno 16 variant. Bylo ukázáno že nově navržená modifikace koeficientu CHF dokáže správně indikovat počet shluků. V některých případech dokonce i podle obou jeho variant současně tj. v kombinaci s entropií či Giniho koeficientem. V takovém případě je možné považovat počet shluků za optimální a CHF koeficient je možné považovat za spolehlivý nástroj hodnocení. V případech kdy se počet shluků stanovený na základě CHF koeficientu liší pro kombinaci tohoto koeficientu s entropií nebo Giniho koeficientem byla hodnota na základě kombinace s Giniho koeficientem ve většině případů správná na rozdíl od kombinace s entropií. 5. Literatura [1] GAN G. MA CH. WU J.: Data Clustering Theory Algorithms and Applications ASA Philadelphia [2] HALKIDI M. BATISTAKIS Y. VAZIRGIANNIS M.: Clustering algorithms and validity measures. SSDBM Athens [3] ŘEHÁK J. ŘEHÁKOVÁ B.: Analýza kategorizovaných dat v sociologii Academia Praha [4] ŘEZANKOVÁ H. HÚSEK D. LÖSTER R.: Clustering with Mixed Type Variables and Determination of Cluster Numbers CNAM and INRIA Paříž 2010 s [5] ŘEZANKOVÁ H. HÚSEK D. SNÁŠEL V.: Shluková analýza dat 2. vydání Professional Publishing Praha [6] ŘEZANKOVÁ H. HÚSEK D.: Methods for the determination of the number of clusters in statistical software packages VŠE KSTP; VŠE KMIE Praha 2008 s [7] ŘEZANKOVÁ H. LÖSTER T. HÚSEK D.: Evaluation of Categorical Data Clustering. Fribourg In: Advances in Intelligent Web Mastering 3. Berlin : Springer Verlag 2011 s Adresa autora Tomáš Löster Ing. Ph. D. Katedra statistiky a pravděpodobnosti Fakulta informatiky a statistiky Vysoká škola ekonomická v Praze Nám. W. Churchilla Praha 3 Česká republika losterto@vse.cz

126 124 FORUM STATISTICUM SLOVACUM 7/2011 Porovnanie metód DBSCAN a CLARA na reálnych dátach The comparison of DBSCAN and CLARA algorithms on real dataset Lenka Mackovičová Lukáš Sobíšek Mária Stachová Abstract: The central task of this paper is to present two different clustering algorithms namely CLARA (based on PAM) and DBSCAN algorithms. Both methods were used on real data set comes from Czech insurance company. These analyses were made using R software and its packages cluster fpc a and lattice. Key words: DBSCAN algorithm PAM algorithm CLARA algorithm cluster analysis Kľúčové slová: algoritmus DBSCAN algoritmus PAM algoritmus CLARA zhluková analýza JEL classification: C19 1. Úvod V posledných rokoch sme zaplavení informáciami viac ako kedykoľvek predtým. Proces nazývaný Data Mining (DM) sa nám v tejto záplave dát pomáha vo veľmi výraznej miere orientovať. DM pozostáva z viacerých dôležitých fáz od nastolenia problému cez prípravu a pochopenie dát až po finálne vyhodnotenie výsledkov z vybudovaných modelov a ich implementácie do praxe. Viacrozmerné štatistické metódy nám môžu pomôcť nie len v krokoch už samotného budovania a porovnávania modelov ale aj v skorších fázach v ktorých sa snažíme dátam ktoré máme k dispozícii porozumieť prípadne nájsť medzi nimi vzťahy a vzory. V našom článku sa zameriame práve na druhú spomínanú funkciu viacrozmerných štatistických metód presnejšie sa budeme venovať dvom rôznym algoritmom zhlukovej analýzy dát ktoré sú nám ponúkané balíčkami štatistického softvéru R [6] konkrétne predstavíme algoritmus PAM (Partitioning Around Medoids) resp. jeho rozšírenú verziu pre väčší objem dát CLARA (Clustering Large Applications) [3] a algoritmus DBSCAN (Density Based Spatial Clustering of Applications with Noise) [1]. Na zhlukovanie pomocou CLARA algoritmu sme použili balíček s názvom cluster [4] a funkciu clara(). Pri DBSCAN algoritme sme využili balíček fpc [2] a príkaz dbscan(). 2. Dátová množina Metódy zhlukovania boli aplikované na dáta zákazníkov nemenovanej českej poisťovne. Hľadali sme zhluky poistených vozidiel. Boli vybrané 4 premenné spojitého typu na ktorých boli sledované vzťahy medzi týmito poistenými vozidlami. Použité premenné boli nasledovné: 1. vek vozidla (v rokoch) 2. hmotnosť vozidla (v kilogramoch) 3. výkon motora (v kilowattoch) a 4. objem motora (v kubických metroch). Dáta pochádzajú z reálnej databázy. Z tohto dôvodu bolo nutné ich pripraviť a vyčistiť. Databáza bola očistená o riadky (vozidlá) v ktorých chýbali hodnoty alebo obsahovali hodnoty nezmyselné. Z dôvodu použitých rôznych jednotiek sme dáta zoškálovali. Po vyčistení sme získali dáta s rozsahom 2 milióny riadkov z nich sme následne (kvôli výpočtovým obmedzeniam) vybrali vzorku 20tich tisíc vozidiel.

127 FORUM STATISTICUM SLOVACUM 7/ Metodológia V našej práci sme zhlukovali dátovú množinu pomocou algoritmov CLARA (zahŕňa v sebe PAM algoritmus) a DBSCAN pričom sme využívali štatistický softvér R. CLARA je zhlukovací algoritmus založený na metóde k-medoids [3]. Využíva pritom minimalizáciu sumy vzdialeností medzi každým objektom v zhluku a príslušným reprezentantom zhluku pričom reprezentantom môže byť len niektorý z objektov zhluku (na rozdiel od K-means kde sa môže stať reprezentantom aj akýkoľvek iný prvok). Prvýkrát bol tento algoritmus popísaný Kaufmannom a Rousseeuwom v roku Ako názov napovedá ide o algoritmus ktorý bol špeciálne navrhnutý pre veľké objemy dát. Najprv popíšeme algoritmus PAM ktorý tiež navrhli Kaufmann a Rousseeuw a je aj súčasťou algoritmu CLARA. Algoritmus PAM pozostáva z dvoch fáz: BUILD a SWAP. Hneď v prvej fáze je viditeľný rozdiel medzi klasickým algoritmom K-medoids kde prvých reprezentantov volíme náhodne a algoritmom PAM ktorý má presný postup na voľbu prvých k reprezentantov. V druhej fáze SWAP meníme množinu reprezentantov až kým nie je splnené kritérium bližšie popísané v algoritme. Fáza BUILD: 1) Vyberieme prvého reprezentanta tak aby to bol medoid celej dátovej množiny (taký objekt zhluku ktorého suma vzdialenosti od objektov zhluku je najmenšia spomedzi všetkých ostatných objektov zhluku). Tento medoid priradíme do množiny K ktorá bude tvoriť množinu reprezentantov zhluku. 2) Vyberieme ľubovoľný objekt taký ktorý nie je v množine K a ešte nebol vybraný. 3) Pre všetky objekty mimo množiny K a rôzne od nájdeme hodnotu čo bude najmenšia vzdialenosť objektu od všetkých prvkov množiny K. Označíme kde je vzdialenosť objektov a. Pre všetky vypočítame a spočítame hodnotu. 4) Opakujeme krok 2 a 3 kým nevystriedame všetky objekty ktoré nie sú v množine K. 5) Do množiny K pridáme ten objekt ktorého je maximálna. Vrátime sa do kroku 2 ak množina K neobsahuje nami zvolený počet objektov. Fáza SWAP: Máme množinu K obsahujúcu k reprezentantov nech je objekt z K a je objekt mimo K. Budeme rozhodovať či nahradiť objekt v K objektom teda či zmeniť množinu reprezentantov. 1) Pre všetky mimo množiny K a rôzne od spočítame hodnotu nasledovným spôsobom: - ak a zároveň potom. - ak a zároveň pričom je najnižšia vzdialenosťobjektu od všetkých objektov v množine potom. - ak a zároveň potom. - ak a zároveň potom.

128 126 FORUM STATISTICUM SLOVACUM 7/2011 2) Spočítame. Hodnotu vypočítame pre všetky možné dvojice objektov a a vyberieme ten pár ktorý nadobúda najmenšiu hodnotu ak je táto hodnota záporná tak vymeníme objekt s objektom čiže sme vymenili jedného z reprezentantov. Celý proces prejdeme znova. Ak by minimálna hodnota bola kladná alebo nulová už nemá význam meniť reprezentantov a zhlukovanie ukončíme. Máme teda k reprezentantov a priradíme k ním všetky objekty (každý objekt k tomu reprezentantovi ku ktorému je najbližšie) a dostaneme výsledné zhluky. Keď už vieme ako funguje algoritmus PAM v ďalšom kroku popíšeme algoritmus CLARA ktorý v jednotlivých krokoch využíva PAM algoritmus. Algoritmus PAM však neprebieha cez všetky dáta ale spúšťame ho len na niekoľkých výberoch zo vstupných dát. Na začiatku musíme zvoliť okrem počtu zhlukov k aj počet výberov v a veľkosť týchto výberov m. Historicky sú dané takéto hodnoty: 5 pre počet výberov a 40+2k pre veľkosť výberu ale môžeme si tieto hodnoty zvoliť sami. Popis algoritmu CLARA: Zo vstupných dát náhodne vyberie bez opakovania m objektov. Na týchto objektoch spustí algoritmus PAM vďaka čomu získame k medoidov. Objekty z celej dátovej množiny zaradíme podľa vzdialenosti k najbližšiemu medoidu a spočítame priemerné vzdialenosti v zhlukoch. Urobíme ďalší výber o veľkosti m tým spôsobom že do výberu zaradíme medoidy z predchádzajúceho výberu a náhodne pridáme objekty z celej dátovej množiny. Znovu sa spustí algoritmus PAM na novom výbere a objekty z celej dátovej množiny zaradíme podľa vzdialenosti k najbližšiemu medoidu a spočítame priemerné vzdialenosti v zhlukoch. Zistíme ktoré medoidy dávajú lepšie zhlukovanie tie použijeme pri vytváraní nového výberu. Takto postupujeme pokiaľ neurobíme v výberov a vyberieme to zhlukovanie ktoré malo v zmysle priemernej vzdialenosti od medoidu najlepšie výsledky. Algoritmus DBSCAN patrí do skupiny algoritmov založených na hustote objektov. Prvykrát bol predstavený v práci [1] v roku Veľkou výhodou oproti metódam typu K- means a K-medoids je schopnosť rozoznať zhluky rôznych tvarov. Algoritmus DBSCAN pracuje s pojmom ε-okolie objektu X pričom pod týmto pojmom si predstavíme množinu všetkých tých objektov ktorých vzdialenosť od objektu X je menšia alebo rovná ε. Namiesto toho aby sme na začiatku algoritmu volili počet zhlukov volíme parametre ε a N min. Voľbou ε určujeme veľkosť okolia s ktorým bude algoritmus pracovať a N min bude veľkosť počtu objektov kontrolovaných v ε-okolí. Dôležitým pojmom bude pre nás dostupnosť objektov takže teraz načrtneme čo si pod tým pojmom predstaviť. Budeme hovoriť že objekt A je priamo dostupný z objektu B vzhľadom k danému ε a N min ak A patrí do ε-okolia objektu B a objekt B má vo svojom okolí aspoň N min objektov. Tento pojem zovšeobecníme a budeme hovoriť že objekt A je dostupný z objektu B vzhľadom k danému ε a N min ak pre danú postupnosť objektov O 1 O 2...O n pričom B=O 1 a A=O n platí že objekt O k+1 je priamo dostupný z objektu O k. Algoritmus: 1) Vytvoríme množinu O kde budú patriť všetky objekty a prázdnu množinu L kde sa budú pridávať nezaradené objekty. 2) Vyberieme objekt A ktorý nie je v množine L a zároveň nie je zaradený ešte do žiadneho zhluku. Ak takýto objekt neexistuje tak ukončíme zhlukovanie. 3) Skontrolujeme počet objektov v ε-okolí objektu A: Ak počet objektov v tomto okolí je menší ako N min tak tento objekt uloží do množiny nezaradených objektov L a vráti sa do kroku 2.

129 FORUM STATISTICUM SLOVACUM 7/ Ak A je vnútorný objekt (má vo svojom okolí aspoň N min objektov) tak vytvorí zhluk ktorý bude obsahovať objekt A a všetky objekty ktoré sú dostupné z A a ešte nie sú v žiadnom zhluku. Zároveň označí ktoré z týchto objektov sú hraničné. Vrátime sa do kroku 2. Na zobrazenie úspešnosti použitých zhlukovacích algoritmov pri zatrieďovaní jednotlivých objektov do zhlukov sme použili funkciu silhouette [5] ktorá je súčasťou už spomínaného balíčka cluster štatistického programu R. Táto funkcia vykresľuje graf obrysov zhlukov (silhouette plot) a počíta charakteristiky s ním spojené (šírku obrysu vzorky priemernú šírku obrysu každého zhluku celkový priemer šírky obrysu pre kompletnú databázu). Každý zhluk teda môže byť reprezentovaný šírkou obrysu založenom na porovnaní tesnosti a separácie. Priemerná šírka obrysu môže byť použitá na vyhodnotenie kvality zhlukovania a tiež môže byť nápomocná pri rozhodovaní sa nakoľko bol vhodne vybratý počet zhlukov. Pri konštrukcii grafu obrysov sa využíva vzťah: (1) kde a(i) je priemerná vzdialenosť i-teho objektu od ostatných objektov v tom istom zhluku a b(i) je minimum z priemernej vzdialenosti i-teho objektu od všetkých objektov v rámci ostatných zhlukoch. Zo vzťahu (1) je zrejmé že pre číslo S(i) platí že -1 S(i) 1. Ak je S(i) blízko 1 môžeme predpokladať že objekt je zaradený do správneho zhluku ak je S(i) okolo 0 tak objekt leží medzi dvomi zhlukmi a v prípade že má S(i) zápornú hodnotu je možné že došlo ku zatriedeniu objektu do nesprávneho zhluku. Najväčšia celková priemerná šírka obrysu zhluku indikuje najúspešnejšie zhlukovanie a teda počet zhlukov s maximálnou celkovou priemernou šírkou môžeme vziať ako optimálny počet zhlukov. 4. Výsledky Na našich dátach sme porovnávali zhlukovanie dvoch metód CLARA a DBSCAN zatiaľ čo CLARA je jedným z predstaviteľov rozdeľujúcich metód tak DBSCAN je typickým príkladom metódy založenej na hustote objektov. Vybrali sme ich teda ako nejakých predstaviteľov týchto 2 typov zhlukovacích metód a poukážeme na reálnych dátach k akým typickým rozdielom vedú tieto rozdielne dva prístupy k zhlukovaniu. Čo sa týka voľby množstva zhlukov vyskúšali sme viacero možností a vzhľadom na nami vybrané metódy výsledky z týchto metód a povahu dát sme za vhodný počet zhlukov na naše účely zvolili 3. Pokiaľ ide o algoritmus CLARA počet zhlukov je jedným zo vstupných parametrov metódy zatiaľ čo u metódy DBSCAN to tak nie je. Pri tomto algoritme máme 2 vstupné parametre: veľkosť okolia a počet objektov v okolí ktorých voľba však ovplyvňuje počet zhlukov čo môže byť o niečo náročnejšie pre používateľa. V prípade DBSCAN sme zvolili tieto parametre tak aby sme získali 3 zhluky a zároveň aby to zaradenie bolo optimálne z hľadiska zloženia zhlukov a počtu nezaradených objektov. Keďže máme 4-rozmerné dáta zobrazovali sme ich na prvé 3 hlavné komponenty a príslušne zaradenie do jednotlivých zhlukov môžeme vidieť na Obrázku 1. Algoritmy roztriedili objekty do zhlukov rozdielne. CLARA roztriedila zhluky do rádovo rovnako veľkých zhlukov zatiaľ čo DBSCAN vytvoril jeden veľký zhluk a dva menšie pričom niekoľko objektov nechal nezaradených (modré značky). Pri algoritme PAM je ľahko spozorovateľná typická vlastnosť centroidových metód vytváranie elipsových zhlukov. DBSCAN tvorí zhluky na základe hustoty objektov takže môžeme aj tu vidieť že husté miesta

130 128 FORUM STATISTICUM SLOVACUM 7/2011 povytvárali zhluky a vzniklo niekoľko nezaradených objektov pretože nemajú vo svojom okolí dostatočný počet objektov. Samozrejme pokiaľ musíme mať zatriedené všetky dáta mohli by sme zaradiť nezaradený objekt do najbližšieho zhluku ale niekedy pomocou tejto metódy môžeme nájsť outliery. Obrázok 1: Zaradenie objektov do zhlukov so zobrazením pomocou metódy hlavných komponentov Ďalšia možnosť ako zobraziť zhluky je silhouette graf ktorý sme popísali vyššie. Ako na predchádzajúcom obrázku tak aj na Obrázku 2. Môžeme vidieť základné rozdiely medzi zatriedením do zhlukov pomocou DBSCAN a pomocou CLARA algoritmu. Okrem toho že názorne vidíme rozdiely vo veľkosti zhlukov vidíme aj niečo ako neistotu zatriedenia. V prípade CLARA vidíme že u prvých dvoch zhlukov je si algoritmus istejší ako u posledného zhluku v tom je viac takých objektov ktoré by mali priemernú vnútrozhlukovú vzdialenosť nižšiu v inom zhluku. V tomto zmysle sa javí lepší DBSCAN algoritmus ktorý má určitú nízku neistotu len v prvom zhluku. Nezobrazili sme nezaradené objekty ktoré môžu byť nežiaduce v prípade niektorých aplikácií. Pokiaľ by sme sa chceli rozhodovať vo výbere medzi tými dvoma algoritmami dôležité by bolo aké máme požiadavky na zhlukovanie. Obrázok 2: Silhouette grafy

131 FORUM STATISTICUM SLOVACUM 7/ Záver V našom článku sme ponúkli stručný popis dvoch zhlukovacích algoritmov: DBSCAN a CLARA (založená na algoritme PAM) ktoré sme aplikovali na reálne dáta istej českej poisťovne. Všetky nástroje boli vybudované pomocou príslušných balíčkov štatistického softvéru R. Pri výpočtoch sme boli obmedzení nedostatočnou internou pamäťou počítačov na ktorých sme pracovali a tak sme boli nútení obmedziť dostupnú dátovú množinu len na vzorku obsahujúcu 20 tisíc objektov (z pôvodných 2 miliónov) a aj túto vzorku sme boli schopní spracovať danými metódami vďaka vzdialenému prístupu na výkonný počítač (RAM 24 GB). 6. Literatúra [1] ESTER M. KRIEGEL H-P.SANDER J. XU X A Density-Based Algorithm for Discovering Clusters in Large Spatial Databases with Noise In Proceedings of the Second International Conference on Knowledge Discovery and Data Mining. s ISBN [2] HENNIG Ch. <chrish@stats.ucl.ac.uk> 2010 fpc: Flexible procedures for clustering. R package version [3] KAUFMAN L. ROUSSEEUW J.P Finding Groups in Data: An Introduction to Cluster Analysis. John Wiley and Sons s. ISBN [4] MAECHLER M. ROUSSEEUW P. STRUYF A. HUBERT M Cluster Analysis Basics and Extensions; unpublished. [5] ROUSSEEUW P Silhouettes: a graphical aid to the interpretation and validation of cluster analysis. Journal of Computational and Applied Mathematics [6] VENABLES W. N. & RIPLEY B. D Modern Applied Statistics with S. Fourth Edition. Springer New York. ISBN Adresa autorov: Lenka Mackovičová RNDr. PhD. IMI-CVV UMB Ďumbierska Banská Bystrica lenka.lasova@umb.sk Mária Stachová Mgr. PhD. EF UMB Tajovského Banská Bystrica maria.stachova@umb.sk Lukáš Sobíšek Ing. VŠE Praha nám. W. Churchilla Praha 3 ČR lukas.sobisek@vse.cz Poďakovanie: Príspevok bol napísaný s podporou Univerzitnej grantovej agentúry Univerzity Mateja Bela v Banskej Bystrici v rámci riešenia vedecko-výskumného projektu UGA I a s podporou projektu IGA VSE F4/5/2011. Zároveň ďakujeme skupine teoretických chemikov z Katedry chémie FPV-UMB za sprístupnenie vzdialeného výkonného počítača na naše výpočty.

132 130 FORUM STATISTICUM SLOVACUM 7/2011 Názory študentov LF UK a FaF UK na odvykanie od fajčenia Opinion of students LF UK and FaF UK on smoking cessation Erika Macháčová Ján Luha Abstract: In this article we present results from survey about opinion young people university students on questions concerning smoking cessation. We present answers from university students Faculty of Medicine and Faculty of Pharmacy. Key words: opinion university students smoking cessation comparison Fisher s exact test. Kľúčové slová: názory univerzitní študenti odvykanie od fajčenia porovnanie Fisherov exaktný test. JEL Classification: C1 C12 C14 J10 J Úvod V príspevku uvádzame ďalšiu časť výsledkov vlastného prieskumu názorov mladých ľudí univerzitných študentov ktorí odpovedali na 43 otázok o fajčení. Výskum sme realizovali pomocou štandardizovaného dotazníka zameraného na študentov medicíny ošetrovateľstva zubného lekárstva a farmácie používaného v projekte GLOBAL HEALTH PROFESSIONAL STUDENTS SURVEY. Príspevok nadväzuje na predchádzajúce 4 príspevky [ ] v ktorých sme vyhodnocovali odpovede na otázky študentov či už experimentovali s fajčením veku ich prvej skúsenosti s cigaretou a ich názorov na fajčenie študentov v priestoroch fakulty na pasívne fajčenie a uplatňovanie zákazu fajčenia v rôznych priestoroch na fajčenie zdravotníkov. Dotazník okrem demografických znakov (fakulta forma štúdia ročník štúdia pohlavie a vek) obsahoval 40 meritórnych otázok zameraných na niektoré problémy ohľadne fajčenia. Znenie otázok medzinárodného projektu bolo dané a autori príspevku nemali možnosť ich ovplyvniť hoci by sa to žiadalo najmä pri otázkych skúmaných v tomto príspevku. V tomto príspevku hodnotíme názory na otázky ktoré sa týkali odvykania od fajčenia. Výsledky odpovedí respondentov sú závažnou výpoveďou pretože ide o študentov fakúlt ktorí v rámci štúdia sú oboznamovaní s dôsledkami fajčenia na zdravie Základom štatistickej analýzy sú frekvenčné tabuľky a pri komparáciách kontingenčné tabuľky a Fisherov exaktný test. Štatisticky signifikantné rozdiely sú pri otázkach kde P- hodnota Fisherovho exaktného testu je menšia ako Základné charakteristiky prieskumu Základné parametre prieskumu sú podrobne rozvedené v práci Macháčová E. Luha J. (2011a). Táto štúdia sa uskutočnila v období od novembra 2009 do decembra Do prieskumu bolo zaradených 1215 študentov a to 981 z Lekárskej fakulty Univerzity Komenského v Bratislave (LF UK) a 234 študentov z Farmaceutickej fakulty UK Bratislava (Fa F UK). Z 981 študentov LF UK bolo 930 poslucháčov všeobecného lekárstva a 51 študentov zubného lekárstva. Z FaF UK študentov boli všetci z tretieho ročníka programu farmácia. Z 981 študentov LF UK zaradených do prieskumu študovalo v prvom ročníku 345 študentov v treťom 309 a v piatom ročníku 327 poslucháčov všeobecného lekárstva. Z 51 študentov zubného lekárstva bolo 24 z prvého ročníka a 27 z tretieho ročníka. V dotazníku odpovedali študenti na otázky ktoré súvisia s odvykaním od fajčenia:

133 FORUM STATISTICUM SLOVACUM 7/ Chcete momentálne prestať fajčiť? (Škála odpovedí: 1=Nikdy som nefajčil cigarety 2= Momentálne nefajčím 3=Áno 4=Nie) Pokúsili ste sa fajčiť behom posledného roka? (Škála odpovedí: 1=Nikdy som nefajčil cigarety 2= Nefajčil som behom posledného roka 3=Áno 4=Nie) Pred akým časom ste prestali fajčiť cigarety?? (Škála odpovedí: 1=Nikdy som nefajčil cigarety 2=Neprestal som fajčiť cigarety 3=Menej ako 1 mesiac 4 =1-5 mesiacov 5=6-11 mesiacov 6=jeden rok 7=dva roky 8=3 roky a viac) Dostali ste niekedy radu alebo pomoc týkajúcu sa ukončenia fajčenia cigariet? (Škála odpovedí: 1=Nikdy som nefajčil cigarety 2=Áno 3=Nie) Chcete prestať užívať žuvací tabak šňupací tabak cigarety fajku či vodnú fajku? (Škála odpovedí: 1=Nikdy som neužíval žuvací tabak šňupací tabak cigarety fajku ani vodnú fajku 2=Neužívam žuvací tabak šňupací tabak cigarety fajku ani vodnú fajku 3=Áno 4=Nie) Počuli ste už o nikotínovej náhradnej liečbe (napr. nikotínové náplaste žuvačky) používanej v programoch odvykania od fajčenia? (Škála odpovedí: 1=Áno 2=Nie) Počuli ste už o používaní antidepresív (napr. bupropion alebo Zyban) v programoch odvykania od fajčenia? (Škála odpovedí: 1=Áno 2=Nie) Počuli ste už o použití vareniklinu (Champix) v programoch odvykania od fajčenia? (Škála odpovedí: 1=Áno 2=Nie). Výsledky odpovedí za spojený súbor respondentov z LF UK a FaF UK neuvádzame pretože na FaF UK máme odpovede iba od študentov 3. ročníka. 3. Názory študentov LF UK Na všetky hore uvedené otázky odpovedalo 981 študentov troch ročníkov LFUK. Výsledky odpovedí študentov 3. ročníka FaF UK uvedieme pri komparácii s 3. ročníkom LF UK. Otázky o odvykaní fajčenia sa delia na otázky o pokusoch prestať fajčiť a o vedomosti o existencii programov liečby odvykania fajčenia. Pokusy prestať fajčiť Výsledky odpovedí študentov na otázky mapujúce pokusy prestať fajčiť sú v tabuľke 1. V prieskume boli aj otázky týkajúce sa žuvacieho tabaku šňupacieho tabaku cigariet fajky či vodnej fajky formulácia týchto otázok je značne nepresná- výsledok mapujúci prestať fajčiť uvádzame iba kvôli úplnosti v tabuľke 2. Pri otázkach skúmajúcich názory študentov na odvykanie od fajčenia sa zaujímavo mení podiel respondentov ktorí nikdy nefajčili cigarety. Je to spôsobené aj formuláciou otázok a škálou odpovedí čo bolo dané medzinárodným projektom. Podiel tých čo nikdy nefajčili je pri otázke Chcete momentálne prestať fajčiť? 502% pri otázke Pokúsili ste sa fajčiť behom posledného roka? 428% a pri otázke Pred akým časom ste prestali fajčiť cigarety? 579%. Pri otázke Chcete prestať užívať žuvací tabak šňupací tabak cigarety fajku či vodnú fajku? to bolo 459%. Podiel tých čo chceli prestať fajčiť sa taktiež mení podľa formulácie otázky: pri otázke Chcete momentálne prestať fajčiť? 93% pri otázke Pokúsili ste sa fajčiť behom posledného roka? 354% a pri otázke Pred akým časom ste prestali fajčiť cigarety? 254% (po sčítaní odpovedí na varianty odpovede 3 až 8). Pri otázke Chcete prestať užívať žuvací tabak šňupací tabak cigarety fajku či vodnú fajku? to bolo 49%.

134 132 FORUM STATISTICUM SLOVACUM 7/2011 Tabuľka 1: Pokusy prestať fajčiť Chcete momentálne prestať fajčiť? Frequency Percent Valid 1 Nikdy som nefajčil cigarety Momentálne nefajčím Áno Nie Total Pokúsili ste sa fajčiť behom posledného roka? Frequency Percent Valid 1 Nikdy som nefajčil cigarety Nefajčil som behom posledného roka Áno Nie Total Pred akým časom ste prestali fajčiť cigarety? (neodpovedalo 33 respondentov) Valid Valid Percent Frequency 1 Nikdy som nefajčil cigarety Neprestal som fajčiť cigarety Menej ako 1 mesiac mesiacov mesiacov jeden rok dva roky roky a viac Total Kvôli úplnosti prezentujeme aj výsledky odpovedí na otázku Chcete prestať užívať žuvací tabak šňupací tabak cigarety fajku či vodnú fajku?. V ďalších analýzach sa ňou už nezaoberáme. Tabuľka 2: Chcete prestať užívať žuvací tabak šňupací tabak cigarety fajku či vodnú fajku? (neodpovedali 2 respondenti) Frequency Valid Percent Valid 1 Nikdy som neužíval žuvací tabak šňupací tabak cigarety fajku ani vodnú fajku Neužívam žuvací tabak šňupací tabak cigarety fajku ani vodnú fajku Áno Nie Total Pri otázke či dostali radu alebo pomoc týkajúcu sa ukončenia fajčenia sme u repondentov z LF UK zistili odpovede ktoré sú v tabuľke 3. Tu sme zaznamenali podiel tých čo nikdy nefajčili 532%. Tých čo dostali radu bolo 210% a bez rady bolo 258%. Tabuľka 3: Dostali ste niekedy radu alebo pomoc týkajúcu sa ukončenia fajčenia cigariet? (neodpovedal 1 respondent) Frequency Valid Percent Valid 1 Nikdy som nefajčil cigarety Áno Nie Total Náhrada fajčenia Súčasťou prieskumu boli aj otázky vedomosti o programoch odvykania od fajčenia. Na prvú otázku neodpovedal iba jeden respondent a na ďalšie dve odpovedali všetci repondenti. Vzhľadom na rovnakú škálu odpovedí prezentujeme výsledky v tvare podielov kladných odpovedí.

135 FORUM STATISTICUM SLOVACUM 7/ O nikotínovej náhradnej liečbe fajčenia počulo podľa výsledkov 952% odpovedí respondentov z LF UK (tabuľka 4) menej respondentov počulo o používaní antidepresív pri odvykaní fajčenia - 287% a iba 46%. počulo o používaní vareniklinu pri odvykaní fajčenia. Tabuľka 4: Percento kladných odpovedí na otázky o náhrade fajčenia Počuli ste už o nikotínovej náhradnej liečbe (napr. nikotínové náplaste žuvačky) používanej v programoch odvykania od fajčenia? Počuli ste už o používaní antidepresív (napr. bupropion alebo Zyban) v programoch odvykania od fajčenia? Počuli ste už o použití vareniklinu (Champix) v programoch odvykania od fajčenia? Áno Komparácia názorov študentov všeobecného lekárstva LF UK podľa ročníkov V ročníkoch a 5. bol výskum realizovaný u 930 študentov všeobecného lekárstva LF UK preto budeme komparovať výsledky podľa ročníkov iba u nich. Pokusy prestať fajčiť Diferenciácia odpovedí na otázky o pokusoch prestať fajčiť je v tabuľke 5. Pri otázke Chcete momentálne prestať fajčiť? sú výsledky na hranici signifikantnosti P=0094 pri otázke Pokúsili ste sa fajčiť behom posledného roka? sme zistili signifikantné odlišnosti P=0006. Signifikantná diferenciácia odpovedí podľa ročníkov štúdia pri otázke Pred akým časom ste prestali fajčiť cigarety? P=0013 je spôsobená škálou ktorá bola použitá pre čas pred akým respondenti prestali fajčiť. Keď zlúčime odpovede do jednej prestal fajčiť stanú sa výsledky nesignifikantné P==0329. Výsledky uvádzame v tabuľke 5. Podrobnejšia analýza je kvôli úspore miesta vynechaná. Tabuľka 5: Diferenciácia odpovedí na otázky o pokusoch prestať fajčiť Chcete momentálne prestať fajčiť? Pokúsili ste sa fajčiť behom posledného roka? Nikdy som nefajčil cigarety Ročník štúdia Momentálne nefajčím Áno Nie prvý tretí piaty Pred akým časom ste prestali fajčiť cigarety? Nikdy som nefajčil cigarety Neprestal som fajčiť cigarety Menej ako 1 mesiac Nikdy som nefajčil cigarety Nefajčil som behom posledného roka Áno Nie Ročník štúdia prvý tretí piaty Ročník jeden dva 3 roky štúdia mesiacov mesiacov rok roky a viac prvý tretí piaty Nikdy som nefajčil cigarety Neprestal som fajčiť cigarety Prestal som fajčiť Ročník štúdia prvý tretí piaty

136 134 FORUM STATISTICUM SLOVACUM 7/2011 Diferenciácia odpovedí na otázku či dostali radu o ukončení fajčenia je podľa ročníkov štúdia štatisticky signifikantná P=0011. Výsledky sú v tabuľke 6. Tabuľka 6: Dostali ste niekedy radu alebo pomoc týkajúcu sa ukončenia fajčenia cigariet? Nikdy som Ročník nefajčil štúdia cigarety Áno Nie prvý tretí piaty Náhrada fajčenia Diferenciácia odpovedí podľa ročníkov štúdia pri otázkach o náhrade fajčenia je zrejmá z grafu. Štatisticky signifikantné rozdiely pri otázke Počuli ste už o nikotínovej náhradnej liečbe (napr. nikotínové náplaste žuvačky) používanej v programoch odvykania od fajčenia? P=0003 pri otázke Počuli ste už o používaní antidepresív (napr. bupropion alebo Zyban) v programoch odvykania od fajčenia? P=0000 a nie je signifikantná pri otázke Počuli ste už o použití vareniklinu (Champix) v programoch odvykania od fajčenia? P=0687. Graf 1: Komparácia odpovedí na otázky o náhrade fajčenia Podiel odpovedí áno pri otázkach o náhrade fajčenia Počuli ste už o nikotínovej náhradnej liečbe (napr. nikotínové náplaste žuvačky) používanej v programoch odvykania od fajčenia? Počuli ste už o používaní antidepresív (napr. bupropion alebo Zyban) v programoch odvykania od fajčenia? Počuli ste už o použití vareniklinu (Champix) v programoch odvykania od fajčenia? prvý tretí piaty 5. Komparácia názorov študentov zubného lekárstva LF UK podľa ročníkov 1. a 3. Na rovnaké otázky odpovedali aj študenti zubného lekárstva prvého a tretieho ročníka. Výsledky komparácie nie sú štatisticky signifikantné hoci faktické rozdiely sa nájdu ako vidieť z výsledkov v tabuľkách. Detailnejšiu analýzu necháme kvôli úspore miesta na čitateľovi. V tabuľkách uvádzame aj riadok Total s údajmi odpovedí študentov zubného lekárstva LF UK.

137 FORUM STATISTICUM SLOVACUM 7/ Pokusy prestať fajčiť Tabuľka 7: Diferenciácia odpovedí na otázky o pokusoch prestať fajčiť Chcete momentálne prestať fajčiť? Nikdy som nefajčil cigarety Ročník štúdia Momentálne nefajčím Áno Nie prvý tretí Total Pred akým časom ste prestali fajčiť cigarety? Nikdy som nefajčil cigarety Neprestal som fajčiť cigarety Menej ako 1 mesiac Pokúsili ste sa fajčiť behom posledného roka? Nikdy som nefajčil cigarety Nefajčil som behom posledného roka Áno Nie Ročník štúdia prvý tretí Total Ročník štúdia 1-5 mesiacov 6-11 mesiacov jeden rok dva roky 3 roky a viac prvý tretí Total Nikdy som nefajčil cigarety Neprestal som fajčiť cigarety Ročník štúdia Prestal som fajčiť prvý tretí Total Tabuľka 8: Dostali ste niekedy radu alebo pomoc týkajúcu sa ukončenia fajčenia cigariet? Nikdy som Ročník štúdia nefajčil cigarety Áno Nie prvý tretí Total Náhrada fajčenia Tabuľka 9: Percento kladných odpovedí na otázky o náhrade fajčenia Počuli ste už o nikotínovej náhradnej liečbe (napr. nikotínové náplaste žuvačky) používanej v programoch odvykania od fajčenia? Počuli ste už o používaní antidepresív (napr. bupropion alebo Zyban) v programoch odvykania od fajčenia? Počuli ste už o používaní antidepresív (napr. bupropion alebo Zyban) v programoch odvykania od fajčenia? ročník štúdia prvý tretí Total Komparácia názorov študentov 3. ročníka LF UK a študentov 3. ročníka FaF UK Na Farmaceutickej fakulte odpovedali na otázky štandardizovaného dotazníka iba študenti tretieho ročníka (234 respondentov) preto komparujeme ich odpovede so študentmi 3. ročníka LF UK (309 respondentov). Komparácia odpovedí študentov 3.ročníka LF UK a FaF UK dáva nesignifikantné rozdiely až na otázku Počuli ste už o použití vareniklinu (Champix)

138 136 FORUM STATISTICUM SLOVACUM 7/2011 v programoch odvykania od fajčenia? kde sme zistili štatisticky signifikantný rozdiel P=0002. Pokusy prestať fajčiť Tabuľka 10: Diferenciácia odpovedí na otázky o pokusoch prestať fajčiť Chcete momentálne prestať fajčiť? Pokúsili ste sa fajčiť behom posledného roka? Nikdy som nefajčil Momentálne Fakulta cigarety nefajčím Áno Nie Lekárska Farmaceutická Pred akým časom ste prestali fajčiť cigarety? Nikdy som nefajčil cigarety Neprestal som fajčiť cigarety Menej ako 1 mesiac Nikdy som nefajčil cigarety Nefajčil som behom posledného roka Áno Nie Fakulta Lekárska Farmaceutická jeden dva 3 roky Fakulta mesiacov mesiacov rok roky a viac Lekárska Farmaceutická Nikdy som nefajčil cigarety Neprestal som fajčiť cigarety Prestal som fajčiť Fakulta Lekárska Farmaceutická Tabuľka 11: Dostali ste niekedy radu alebo pomoc týkajúcu sa ukončenia fajčenia cigariet? Fakulta Nikdy som nefajčil cigarety Áno Nie Lekárska Farmaceutická Náhrada fajčenia Tabuľka 12: Percento kladných odpovedí na otázky o náhrade fajčenia Počuli ste už o nikotínovej náhradnej liečbe (napr. nikotínové náplaste žuvačky) používanej v programoch odvykania od fajčenia? Počuli ste už o používaní antidepresív (napr. bupropion alebo Zyban) v programoch odvykania od fajčenia? Počuli ste už o použití vareniklinu (Champix) v programoch odvykania od fajčenia? Lekárska Farmaceutická Záver Študenti medicíny vo svojej budúcej lekárskej praxi budú v rámci systematickej primárnej prevencie okrem informácií o škodlivých účinkoch tabaku na zdravie ako je zníženie rizika predčasnej chorobnosti a úmrtnosti najmä na kardiovaskulárne nádorové a iné mnohé ochorenia musia tiež vedieť pacientom dať informácie a odporúčania týkajúce sa riešenia

139 FORUM STATISTICUM SLOVACUM 7/ odvykania od nikotínovej závislosti jednak nefarmakologickou ale aj farmakologickou liečbou. Z výsledkov odpovedí študentov na otázky týkajúce sa odvykania od fajčenia však vyplýva že je potrebné vo výučbe budúcich lekárov venovať zvýšenú pozornosť týmto smerom. 8. Literatúra [1] Kozák J.T (2000): Mezinárodní konference SZO o tabáku a zdraví Čas. Lék. čes pp [2] Glantz S. A. Parmley W. W. (1995): Passive Smoking and Heart Disease. Mechanisms and Risk Jama 273 pp [3] Baška T. (2008): Prevencia užívania tabaku u školskej mládeže. Národná koalícia pre kontrolu tabaku v SR v spolupráci s Jesseniovou lekárskou fakultou v Martine UK v Bratislave. 1. vydanie Martin s. ISBN: [4] Kanji G. K. (2006): 100 Statistical Tests. 3rd Eddition. SAGE [5] Luha J. (1985): Testovanie štatistických hypotéz pri analýze súborov charakterizovaných kvalitatívnymi znakmi. STV Bratislava [6] Luha J. (2009): Matematicko-štatistické aspekty spracovania dotazníkových výskumov. FORUM STATISTICUM SLOVACUM 3/2009. SŠDS Bratislava ISSN [7] Luha J. (2010): Metodologické zásady záznamu dát z rozličných oblastí medicíny a zásady ich kontroly. FORUM STATISTICUM SLOVACUM 1/2010. SŠDS Bratislava ISSN [8] Macháčová E. Luha J. (2011a): Názory študentov LF UK a FaF UK na fajčenie. FORUM STATISTICUM SLOVACUM 2/2011. SŠDS Bratislava ISSN [9] Macháčová E. Luha J. (2011b): Názory študentov LF UK a FaF UK na fajčenie v priestoroch fakulty. FORUM STATISTICUM SLOVACUM 3/2011. SŠDS Bratislava ISSN [10] Macháčová E. Luha J. (2011c): Názory študentov LF UK a FaF UK na pasívne fajčenie. FORUM STATISTICUM SLOVACUM 4/2011. SŠDS Bratislava ISSN [11] Macháčová E. Luha J. (2011d): Názory študentov LF UK a FaF UK na fajčenie zdravotníkov. FORUM STATISTICUM SLOVACUM 5/2011. SŠDS Bratislava ISSN [12] Macháčová E. Ševčíková Ľ. Baráková A. (2000): Fajčenie ako jeden z rizikových faktorov kardiovaskulárnych ochorení. In: Profesionalita & Progres & Podpora zdravia. Fragment z dejín LFUK Bratislava E &J s.r.o s ISBN [13] Redhamer R.: Fajčenie a zdravie. Slovak Academic Press spol. s r.o. Bratislava s. ISBN [14] Riffenburg R. H.: Statistics in Medicine Second Edition. Academic Press [15] Ševčíková Ľ. Argalášová Ľ. Liu YH. Jurkovičová J. Štefaniková Z. Macháčová E. Rosinský J. Gregušová A. Karpatová E. Kuruc Š. Majzonová M. Zajacová M. Salamonová M. Šimko G. Zenka M. Weitzman M.: Ohrozenie zdravia školských detí vystavených pasívnemu fajčeniu. Adresa autorov: Erika Macháčová MUDr. PhD. Ústav epidemiológie LF UK Bratislava erika.machacova@fmed.uniba.sk Ján Luha RNDr. CSc. Ústav lekárskej biológie genetiky a klinickej genetiky LF UK a UNB Bratislava jan.luha@fmed.uniba.sk Práca bola podporená grantom VEGA 1/0135/09.

140 138 FORUM STATISTICUM SLOVACUM 7/2011 Názory študentov LF UK a FaF UK na výučbu o fajčení na fakulte Opinion of students LF UK and FaF UK on education about smoking at faculty Erika Macháčová Ján Luha Abstract: In this article we present results from survey about opinion young people university students on questions concerning education about smoking at their faculty. We present answers from university students Faculty of Medicine and Faculty of Pharmacy. Key words: opinion university students education about smoking at faculty comparison Fisher s exact test. Kľúčové slová: názory univerzitní študenti výučba o fajčení na fakukte porovnanie Fisherov exaktný test. JEL Classification: C1 C12 C14 J10 J Úvod V príspevku uvádzame ďalšiu časť výsledkov vlastného prieskumu názorov mladých ľudí univerzitných študentov ktorí odpovedali na 43 otázok o fajčení. Výskum sme realizovali pomocou štandardizovaného dotazníka zameraného na študentov medicíny ošetrovateľstva zubného lekárstva a farmácie používaného v projekte GLOBAL HEALTH PROFESSIONAL STUDENTS SURVEY. Príspevok nadväzuje na predchádzajúcich 5 príspevkov [ ] v ktorých sme vyhodnocovali odpovede na otázky študentov či už experimentovali s fajčením veku ich prvej skúsenosti s cigaretou a ich názorov na fajčenie študentov v priestoroch fakulty na pasívne fajčenie a uplatňovanie zákazu fajčenia v rôznych priestoroch na fajčenie zdravotníkov na odvykanie od fajčenia. Dotazník okrem demografických znakov (fakulta forma štúdia ročník štúdia pohlavie a vek) obsahoval 40 meritórnych otázok zameraných na niektoré problémy ohľadne fajčenia. V tomto príspevku hodnotíme názory na otázky ktoré sa týkali výučby o fajčení na fakulte. Výsledky odpovedí respondentov sú závažnou výpoveďou pretože ide o študentov fakúlt ktorí v rámci štúdia sú oboznamovaní s dôsledkami fajčenia na zdravie. Základom štatistickej analýzy sú frekvenčné tabuľky a pri komparáciách kontingenčné tabuľky a Fisherov exaktný test. 2. Základné charakteristiky prieskumu Základné parametre prieskumu sú podrobne rozvedené v práci Macháčová E. Luha J. (2011a). Táto štúdia sa uskutočnila v období od novembra 2009 do decembra Do prieskumu bolo zaradených 1215 študentov a to 981 z Lekárskej fakulty Univerzity Komenského v Bratislave (LF UK) a 234 študentov z Farmaceutickej fakulty UK Bratislava (Fa F UK). Z 981 študentov LF UK bolo 930 poslucháčov všeobecného lekárstva a 51 študentov zubného lekárstva. Z FaF UK študentov boli všetci z tretieho ročníka programu farmácia. Z 981 študentov LF UK zaradených do prieskumu študovalo v prvom ročníku 345 študentov v treťom 309 a v piatom ročníku 327 poslucháčov všeobecného lekárstva. Z 51 študentov zubného lekárstva bolo 24 z prvého ročníka a 27 z tretieho ročníka. V dotazníku odpovedali študenti na otázky ktoré súvisia s výučbou o fajčení na fakulte: Počas výučby na vašej fakulte ste sa na niektorom predmete učili o nebezpečenstve fajčenia?

141 FORUM STATISTICUM SLOVACUM 7/ Počas výučby na vašej fakulte ste diskutovali na niektorom predmete o príčinách prečo ľudia fajčia? Počas výučby na vašej fakulte ste sa učili o tom aké je dôležité je zaznamenávať anamnézu užívania tabaku ako časť pacientovho chorobopisu/dokumentácie? Počas výučby na vašej fakulte ste absolvovali oficiálnu výučbu o prístupoch odvykania od fajčenia využívaných pacientom? Počas výučby na vašej fakulte ste sa učili o tom aké je dôležité poskytovať pacientom ktorí chcú prestať fajčiť edukačné materiály na podporu odvykania? Otázky mali rovnakú škálu odpovedí: 1=Áno 2=Nie. Výsledky za spojený súbor respondentov z LF UK a FaF UK neuvádzame pretože na FaF UK máme odpovede iba od študentov 3. ročníka. 3. Názory študentov LF UK Na všetky hore uvedené otázky odpovedalo 981 študentov troch ročníkov LFUK. Výsledky odpovedí študentov 3. ročníka FaF UK uvedieme pri komparácii s 3. ročníkom LF UK. Pri otázkach skúmajúcich názory študentov na výučbu o fajčení na fakulte boli získané výsledky ktoré prehľadne prezentujeme v tabuľke 1 a grafe 1. Podrobnejšiu analýzu kvôli úspore miesta nerobíme. Tabuľka 1: Názory študentov LF UK na výučbu o fajčení; Podiel kladných odpovedí v % na otázky Počas výučby na vašej fakulte ste sa na niektorom predmete učili o nebezpečenstve fajčenia? 668 Počas výučby na vašej fakulte ste diskutovali na niektorom predmete o príčinách prečo ľudia fajčia? 291 Počas výučby na vašej fakulte ste sa učili o tom aké dôležité je zaznamenávať anamnézu užívania tabaku ako časť pacientovho chorobopisu/dokumentácie? 642 Počas výučby na vašej fakulte ste absolvovali oficiálnu výučbu o prístupoch odvykania od fajčenia využívaných pacientom? 74 Počas výučby na vašej fakulte ste sa učili o tom aké je dôležité poskytovať pacientom ktorí chcú prestať fajčiť edukačné materiály na podporu odvykania? 149 Graf 1: Názory študentov LF UK na výučbu o fajčení Frekvencie odpovedí 100% 90% 80% 70% 60% 50% 40% Nie Áno 30% 20% 10% 0% Počas výučby na vašej fakulte ste sa na niektorom predmete učili o nebezpečenstve fajčenia? Počas výučby na vašej fakulte ste diskutovali na niektorompredmete o príčinách prečo ľudia fajčia? Počas výučby na vašej fakulte ste sa učili o tom aké dôležité je zaznamenávať anamnézu užívania tabaku ako časť pacientovho chorobopisu/dokumentácie? Počas výučby na vašej fakulte ste absolvovali oficiálnu výučbu o prístupoch odvykania od fajčenia využívaných pacientom? Počas výučby na vašej fakulte ste sa učili o tom aké je dôležité poskytovať pacientom ktorí chcú prestať fajčiť edukačné materály na podporu odvykania?

142 140 FORUM STATISTICUM SLOVACUM 7/ Komparácia názorov študentov všeobecného lekárstva LF UK podľa ročníkov V ročníkoch a 5. bol výskum realizovaný u 930 študentov všeobecného lekárstva LF UK preto budeme komparovať výsledky podľa ročníkov iba u nich. Diferenciácia odpovedí podľa ročníkov je pri všetkých otázkach štatisticky signifikantná s rovnakou P-hodnotou P=0000. Dokonca aj test lineárnej asociácia má rovnaké P-hodnoty a teda s rastom ročníka štúdia rastie aj podiel kladných odpovedí na otázky o výučbe o fajčení. Pri otázke Počas výučby na vašej fakulte ste absolvovali oficiálnu výučbu o prístupoch odvykania od fajčenia využívaných pacientom? je podiel kladných odpovedí v treťom ročníku mierne nižší ako v prvom ale v piatom je podiel kladných odpovedí jasne najvyšší. Graf 2: Porovnanie podielu kladných odpovedí podľa ročníkov štúdia Komparácia podľa ročníkov tretí piaty Počas výučby na vašej fakulte ste sa na niektorom predmete učili o nebezpečenstve fajčenia? Počas výučby na vašej fakulte ste diskutovali na niektorom predmete o príčinách prečo ľudia fajčia? Počas výučby na vašej fakulte ste sa učili o tom aké dôležité je zaznamenávať anamnézu užívania tabaku ako časť pacientovho chorobopisu/dokumentácie? Počas výučby na vašej fakulte ste absolvovali oficiálnu výučbu o prístupoch odvykania od fajčenia využívaných pacientom? Počas výučby na vašej fakulte ste sa učili o tom aké je dôležité poskytovať pacientom ktorí chcú prestať fajčiť edukačné materály na podporu odvykania? prvý 5. Komparácia názorov študentov zubného lekárstva LF UK podľa ročníkov 1. a 3. Na rovnaké otázky odpovedali aj študenti zubného lekárstva prvého (24 respondentov) a tretieho (27 respondentov) ročníka. Výsledky komparácie sú v tabuľke 2 kde uvádzame podiely kladných odpovedí a P-hodnoty Fisherovho exaktného testu. Z tabuľky vidíme že rozdiely sú fakticky rozdielne ale štatistickú signifikantnosť sme zistili iba pri otázke Počas výučby na vašej fakulte ste sa učili o tom aké dôležité je zaznamenávať anamnézu užívania

143 FORUM STATISTICUM SLOVACUM 7/ tabaku ako časť pacientovho chorobopisu/dokumentácie?. Pri malých súboroch ako máme v tomto prípade okrem väčšej variability sa môže viac prejaviť aj prípadná inkonzistencia ako napríklad pri otázke Počas výučby na vašej fakulte ste absolvovali oficiálnu výučbu o prístupoch odvykania od fajčenia využívaných pacientom? keď žiaden študent zubného lekárstva v treťom ročníku nedal kladnú odpoveď. Tabuľka 2: Komparácia kladných odpovedí podľa ročníkov Počas výučby na vašej fakulte ste sa na niektorom predmete učili o nebezpečenstve fajčenia? Počas výučby na vašej fakulte ste diskutovali na niektorom predmete o príčinách prečo ľudia fajčia? Počas výučby na vašej fakulte ste sa učili o tom aké dôležité je zaznamenávať anamnézu užívania tabaku ako časť pacientovho chorobopisu/dok umentácie? Počas výučby na vašej fakulte ste absolvovali oficiálnu výučbu o prístupoch odvykania od fajčenia využívaných pacientom? Počas výučby na vašej fakulte ste sa učili o tom aké je dôležité poskytovať pacientom ktorí chcú prestať fajčiť edukačné materiály na podporu odvykania? Ročník štúdia prvý tretí P- hodnota Komparácia názorov študentov 3. ročníka LF UK a študentov 3. ročníka FaF UK Na Farmaceutickej fakulte odpovedali na otázky štandardizovaného dotazníka iba študenti tretieho ročníka (234 respondentov) preto komparujeme ich odpovede so študentmi 3. ročníka LF UK (309 respondentov). Faktické aj štatisticky signifikantné rozdiely sú v odpovediach na otázky o výučbe o fajčení u študentov 3.ročníka medzi fakultami ako vidno z výsledkoch v tabuľke 3. Príčiny tejto rozdielnosti sú pravdepodobne spôsobené rozdielnosťou výučby na týchto fakultách. Tabuľka 3: Porovnanie kladných odpovedí študentov tretích ročníkov podľa fakúlt Počas výučby na vašej fakulte ste sa na niektorom predmete učili o nebezpečenstve fajčenia? Počas výučby na vašej fakulte ste diskutovali na niektorom predmete o príčinách prečo ľudia fajčia? Počas výučby na vašej fakulte ste sa učili o tom aké dôležité je zaznamenávať anamnézu užívania tabaku ako časť pacientovho chorobopisu/do kumentácie? Počas výučby na vašej fakulte ste absolvovali oficiálnu výučbu o prístupoch odvykania od fajčenia využívaných pacientom? Počas výučby na vašej fakulte ste sa učili o tom aké je dôležité poskytovať pacientom ktorí chcú prestať fajčiť edukačné materiály na podporu odvykania? Fakulta Lekárska Farmaceutická P-hodnota

144 142 FORUM STATISTICUM SLOVACUM 7/ Záver Podľa relatívne nízkych percentuálne kladných výsledkov odpovedí na otázky Počas výučby na vašej fakulte ste absolvovali oficiálnu výučbu o prístupoch odvykania od fajčenia využívaných pacientom? a Počas výučby na vašej fakulte ste sa učili o tom aké je dôležité poskytovať pacientom ktorí chcú prestať fajčiť edukačné materiály na podporu odvykania? sa ukazuje že by bolo potrebné vo výučbe budúcich lekárov venovať zvýšenú pozornosť aj týmto smerom. Študenti medicíny vo svojej budúcej lekárskej praxi budú robiť nielen systematickú primárnu prevenciu ale sa stretnú aj s problémom ako je riešenie odvykania od fajčenia a liečby nikotínovej závislosti. 8. Literatúra [1] Kozák J.T (2000): Mezinárodní konference SZO o tabáku a zdraví Čas. Lék. čes pp [2] Glantz S. A. Parmley W. W. (1995): Passive Smoking and Heart Disease. Mechanisms and Risk Jama 273 pp [3] Baška T. (2008): Prevencia užívania tabaku u školskej mládeže. Národná koalícia pre kontrolu tabaku v SR v spolupráci s Jesseniovou lekárskou fakultou v Martine UK v Bratislave. 1. vydanie Martin s. ISBN: [4] Kanji G. K. (2006): 100 Statistical Tests. 3rd Eddition. SAGE [5] Luha J. (1985): Testovanie štatistických hypotéz pri analýze súborov charakterizovaných kvalitatívnymi znakmi. STV Bratislava [6] Luha J. (2009): Matematicko-štatistické aspekty spracovania dotazníkových výskumov. FORUM STATISTICUM SLOVACUM 3/2009. SŠDS Bratislava ISSN [7] Luha J. (2010): Metodologické zásady záznamu dát z rozličných oblastí medicíny a zásady ich kontroly. FORUM STATISTICUM SLOVACUM 1/2010. SŠDS Bratislava ISSN [8] Macháčová E. Luha J. (2011a): Názory študentov LF UK a FaF UK na fajčenie. FORUM STATISTICUM SLOVACUM 2/2011. SŠDS Bratislava ISSN [9] Macháčová E. Luha J. (2011b): Názory študentov LF UK a FaF UK na fajčenie v priestoroch fakulty. FORUM STATISTICUM SLOVACUM 3/2011. SŠDS Bratislava ISSN [10] Macháčová E. Luha J. (2011c): Názory študentov LF UK a FaF UK na pasívne fajčenie. FORUM STATISTICUM SLOVACUM 4/2011. SŠDS Bratislava ISSN [11] Macháčová E. Luha J. (2011d): Názory študentov LF UK a FaF UK na fajčenie zdravotníkov. FORUM STATISTICUM SLOVACUM 5/2011. SŠDS Bratislava ISSN [12] Macháčová E. Luha J. (2011e): Názory študentov LF UK a FaF UK na odvykanie od fajčenia. FORUM STATISTICUM SLOVACUM 5/2011. SŠDS Bratislava ISSN [13] Macháčová E. Ševčíková Ľ. Baráková A. (2000): Fajčenie ako jeden z rizikových faktorov kardiovaskulárnych ochorení. In: Profesionalita & Progres & Podpora zdravia. Fragment z dejín LFUK Bratislava E &J s.r.o s ISBN [14] Redhamer R.: Fajčenie a zdravie. Slovak Academic Press spol. s r.o. Bratislava s. ISBN [15] Riffenburg R. H.: Statistics in Medicine Second Edition. Academic Press [16] Ševčíková Ľ. Argalášová Ľ. Liu YH. Jurkovičová J. Štefaniková Z. Macháčová E. Rosinský J. Gregušová A. Karpatová E. Kuruc Š. Majzonová M. Zajacová M. Salamonová M. Šimko G. Zenka M. Weitzman M.: Ohrozenie zdravia školských detí vystavených pasívnemu fajčeniu. In: Szárazová M. Kavcová E. Janušová T.:

145 FORUM STATISTICUM SLOVACUM 7/ Podpora zdravia prevencia a hygiena v teórii a praxi VII. Martin: Jesseniova lekárska fakulta Univerzity Komenského v Martine 2011 s ISBN Adresa autorov: Erika Macháčová MUDr. PhD. Ústav epidemiológie LF UK Bratislava erika.machacova@fmed.uniba.sk Ján Luha RNDr. CSc. Ústav lekárskej biológie genetiky a klinickej genetiky LF UK a UNB Bratislava jan.luha@fmed.uniba.sk Práca bola podporená grantom VEGA 1/0135/09.

146 144 FORUM STATISTICUM SLOVACUM 7/2011 Závislosť dojčenskej úmrtnosti od zvolených faktorov v krajinách EÚ Dependence of infant mortality and selected factors in EU countries Silvia Megyesiová Matej Hudák Abstract: The dependence of the mean age of women at childbirth and infant mortality in all 27 EU countries in 2009 was statistically significant. The relationship was strong and negative. It has been confirmed that the higher mean age of women at childbirth is negatively correlated with infant mortality. The next logical explanation for the lower rates of infant mortality is high level of wellbeing in individual countries. We thought that in countries with high per capita GDP expressed in PPS is also the support of health care and social care better distributed to the population and the result could be visible through lower levels of infant mortality. The correlation between the GDP per capita and the infant mortality was also statistically significant and negative. Key words: infant mortality mean age of women at childbirth HDP per capita in PPS linear regression. Kľúčové slová: dojčenská úmrtnosť priemerný vek matky pri pôrode HDP na obyvateľa v parite kúpnej sily lineárna regresia. JEL classification: J10 C39 1. Úvod Sledovanie sociálnoekonomického stavu krajín je možné prostredníctvom rôznych ukazovateľov. Cieľom nášho záujmu v tomto príspevku bolo overenie vzťahu medzi zvolenými ukazovateľmi ktoré popisujú sociálnoekonomický stav krajiny a ukazovatele verejného zdravia. Snažili sme sa overiť či existuje vzťah medzi dojčenskou úmrtnosťou a priemerným vekom matky pri pôrode a následne vzťah medzi dojčenskou úmrtnosťou a hrubým domácim produktom na obyvateľa v parite kúpnej sily (PPS). Charakter týchto ukazovateľov je rôzny a preto nás zaujíma či existuje medzi nimi závislosť. Túto závislosť sme overovali na základe reálnych údajov krajín Európskej únie v roku Dojčenská úmrtnosť a priemerný vek matky pri pôrode Pôrodnosť a úmrtnosť sú základnými demografickými procesmi. Jedným z najdôležitejších ukazovateľov úmrtnostných pomerov je dojčenská úmrtnosť (infant mortality) ktorá charakterizuje sociálno-zdravotnú vyspelosť spoločnosti. Dojčenská úmrtnosť je úmrtnosť detí do jedného roka. Vyjadruje sa ako podiel detí zomretých do jedného roku veku vzhľadom na 1000 živonarodených detí. V krajinách s vyspelou zdravotnou a sociálnou starostlivosťou je tento ukazovateľ nízky. Krajiny EÚ sú vo všeobecnosti považované za krajiny ekonomicky vyspelé avšak medzi jej členskými krajinami sú značné rozdiely. Priemerný vek matky pri pôrode (mean age of women at childbirth) sa v posledných rokoch zvyšuje má teda rastúci trend čo však prináša aj problém s poklesom fertility. Najvýraznejšou zmenou v demografickom správaní populácie Českej republiky od roku 1989 je výrazný pokles fertility 1. Z hľadiska sociálnoekonomického zabezpečenia rodiny a starostlivosti o deti je zvyšovanie priemerného veku akceptované pozitívne avšak z pohľadu zdravotníckeho zvyšovanie veku matky v čase pôrodu súvisí s istými komplikáciami. Zaujíma nás preto či existuje lineárny vzťah medzi dojčenskou úmrtnosťou a priemerným vekom matky pri pôrode. Tento vzťah sme overovali na údajoch o dojčenskej 1 FIALA T. LANGHAMROVÁ J. Změny demografického vývoje a populační struktury v ČR od roku 1989

147 FORUM STATISTICUM SLOVACUM 7/ úmrtnosti a priemernom veku matky pri pôrode v krajinách EÚ v roku Hľadanie podobnosti v dosahovaných úrovniach demografických dát vedie k zhlukovaniu krajín s podobnou sociálno-ekonomickou situáciou 2. Na obrázku 1 vidíme že pravý dolný kvadrat ktorý reprezentuje krajiny s nízkou mierou dojčenskej úmrtnosti a vysokým priemerným vekom matky pri pôrode je typický hlavne pre krajiny pôvodnej EÚ-15 ktoré sú považované na najvyspelejšie. Z nových členských krajín sa do tohto kvadrantu zaradili iba Slovinsko a Cyprus. Pravý horný kvadrant je prázdny v porovnaní s priemernými hodnotami krajín EÚ-27 sa v danom kvadrante nenachádza žiadna krajina. Pre tento kvadrant by boli typické vyššie hodnoty dojčenskej úmrtnosti ako je priemer EÚ-27 a zároveň vyšší priemerný vek matiek v čase pôrodu. V ľavom hornom kvadrante sú hlavne krajiny ktoré vstúpili do EÚ ako posledné okrem Veľkej Británie. Tieto krajiny majú jednak nižšiu životnú úroveň a pravdepodobne aj nižšiu úroveň zdravotnej starostlivosti. Hlavne najnovšie členské krajiny teda Bulharsko a Rumunsko dosiahli pomerne vysoké hodnoty dojčenskej úmrtnosti. V Rumunsku pripadlo na 1000 živonarodených detí približne 10 úmrtí detí do jedného roka. Pre krajiny v tomto kvadrante je ešte typický nižší priemerný vek matky pri pôrode. V ľavom dolnom kvadrante ktorý znamená nižší priemerný vek matky pri pôrode a zároveň nižšiu dojčenskú úmrtnosť v porovnaní s priemernom EÚ-27 a umiestnili len štyri krajiny. Na základe tohto obrázku je možné očakávať že medzi sledovanými dvoma ukazovateľmi bude silný nepriamy vzťah Rumunsko Bulharsko dojčenská úmrtnosť Lotyšsko Slovensko Poľsko Malta Litva Maďasko Veľká Británia EÚ-27 Rakúsko Francúzsko Holandsko Taliansko Estónsko Belgicko Nemecko Cyprus Španielsko Grécko Dánsko Írsko ČR Slovinsko Fínsko Portugalsko Luxembursko Švédsko priemerný vek matky pri pôrode Obrázok 1: Vybrané demografické charakteristiky krajín EÚ v roku 2009 Uskutočnili sme korelačnú a lineárnu analýzu závislosti dojčenskej úmrtnosti a priemerného veku matky pri pôrode. Koeficient korelácie bol štatisticky významný a záporný nadobudol hodnotu Znamená to že čím je priemerný vek matky v čase pôrodu vyšší tým je dojčenská úmrtnosť nižšia. 2 LÖSTER T. LANGHAMROVÁ J. EU countries from the viewpoint of demographic data and finding of clusters of similar countries

148 146 FORUM STATISTICUM SLOVACUM 7/2011 Na obrázku 2 je výstup regresnej analýzy. Koeficient determinácie je vysoký a charakterizuje že sme zvoleným modelom vystihli približne 744% variability hodnôt dojčenskej úmrtnosti. Bodové odhady koeficientov regresnej funkcie ako aj regresná funkcia ako celok sú štatisticky významné. Ak sa priemerný vek matky pri pôrode zvýši o jednu jednotku (o jeden rok) tak sa v priemere zníži dojčenská úmrtnosť o 144 promilových bodov. Vyšší priemerný vek matky pri pôrode teda znamená pokles v ukazovateli dojčenská úmrtnosť. Samozrejme že je to zjednodušený pohľad na daný problém avšak matky vo vyššom veku sú zrelšie väčšinou vzdelanejšie a sú už často krát aj ekonomicky zabezpečené a súbor týchto všetkých pozitívnych hodnôt môže predstavovať skutočnosť že poskytnú narodeným deťom lepšiu a zodpovednejšiu starostlivosť. Na druhej strane matky s vyšším priemerným vekom pri pôrode pochádzali z krajín ekonomicky vyspelejších kde je aj zdravotná starostlivosť na najvyššej úrovni. Obrázok 2: Lineárna regresia dojčenskej úmrtnosti od priemerného veku matky pri pôrode EÚ (SAS-EG 4.2) 3. Dojčenská úmrtnosť a hrubý domáci produkt v parite kúpnej sily Hrubý domáci produkt (HDP) v parite kúpnej sily (PPS - Purchasing power standards) sme zvolili ako všeobecný ukazovateľ ekonomickej úrovne krajín. V dôsledku

149 FORUM STATISTICUM SLOVACUM 7/ prerozdeľovania HDP do jednotlivých sfér spoločnosti sa dá očakávať že jeho vysoké hodnoty sa prejavia aj vo výraznejšom financovaní zdravotníctva a sociálnej starostlivosti. Prepočet ukazovateľa vyjadrený v PPS umožňuje jeho porovnávanie medzi krajinami pričom eliminuje rozdiely cenových úrovní daných krajín. Prepočet na obyvateľa zasa umožňuje jeho porovnávanie ekonomík ktoré sú veľmi rozdielne vzhľadom k ich veľkosti. Hrubý domáci produkt je všeobecne považovaný za indikátor ekonomickej situácie danej krajiny. HDP predstavuje celkovú hodnotu všetkých vyprodukovaných tovarov a služieb zníženú o hodnotu tovarov a služieb použitých vo forme medzispotreby pri ich produkcii. Vyjadrenie HDP v parite kúpnej sily eliminuje rozdiely v cenových úrovniach jednotlivých krajín a prepočet na obyvateľa umožňuje jeho porovnanie ekonomík výrazne rozdielnych vo veľkosti 3. V roku 2009 v priemere na 1 obyvateľa krajín EÚ-27 bol vytvorený HDP v PPS v hodnote Eur (viď obrázok 3). HDP na obyvateľa v PPS vyšší než priemerná hodnota EÚ-27 sa dosiahol v 13 krajinách všetky tieto krajiny boli súčasťou predchádzajúcej starej EÚ-15. Najvyšší HDP na obyvateľa bol v roku 2009 vytvorený v Luxembursku a to vo výške čo je aj v porovnaní s ostatnými krajinami extrémne vysoká hodnota. HDP na obyvateľa nižší než jeho priemerná hodnota krajín EÚ-27 bol vytvorený v štrnástich krajinách sú to väčšinou krajiny ktoré vstúpili do EÚ iba nedávno. Medzi týmito krajinami je aj Slovensko kde bol vytvorený HDP na obyvateľa v PPS v hodnote Eur. Najnižšia životná úroveň meraná hrubým domácim produktom na obyvateľa v roku 2009 bola dosiahnutá v Rumunsku a v Bulharsku. HDP na obyvateľa v PPS Rumunska dosiahol Eur a HDP na obyvateľa Bulharska Eur HDP na obyvateľa v Eurách bežné ceny Obrázok 3: HDP na obyvateľa v PPS EÚ Koeficient korelácie medzi dojčenskou úmrtnosťou a hrubým domácim produktom na obyvateľa v PPS bol štatisticky významný charakterizoval nepriamu závislosť pretože jeho hodnota bola záporná Po následnej regresnej analýze závislosti dojčenskej úmrtnosti od HDP na obyvateľa v PPS všetkých 27 krajín EÚ v roku 2009 sme získali nasledovné výsledky viď obrázok

150 148 FORUM STATISTICUM SLOVACUM 7/2011 Obrázok 4: Lineárna regresia dojčenskej úmrtnosti od HDP na obyvateľa v parite kúpnej sily EÚ (SAS-EG 4.2) Na základe vyššie uvedenej regresnej analýzy môžeme skonštatovať že koeficient determinácie nadobudol nižšiu hodnotu než tomu bolo pri regresnej analýze dojčenskej úmrtnosti a priemerného veku matky pri pôrode. Regresná funkcia je však štatisticky významná podobne ako odhady regresných koeficientov. V prípade HDP na obyvateľa však vidíme aj na základe grafického zobrazenia jednu extrémnu hodnotu a to HDP na obyvateľa Luxemburska. Preto sme sa rozhodli Luxembursko z analýzy vylúčiť a zopakovať tak korelačnú ako aj regresnú analýzu údajov 26 krajín EÚ. Korelačný koeficient po vylúčení Luxemburska z ďalšej analýzy stúpol z hodnoty -059 na podstatne vyššiu úroveň a to Po uskutočnení regresnej analýzy vidíme opäť výrazné zlepšeniu hodnôt regresného modelu. Koeficient determinácie za zvýšil z 035 na 053 viď obrázok 5. Touto zvolenou lineárnou regresnou funkciou sa nám podarilo vysvetliť 53% variability hodnôt znaku teda dojčenskej úmrtnosti. Model ako celok ako aj regresné koeficienty sú štatisticky významné. Vychádzajúc z danej regresnej funkcie môžeme skonštatovať že zvýšenie HDP na obyvateľa o jednu jednotku (1000 Eur) bude predstavovať zníženie dojčenskej úmrtnosti o 022 promilového bodu. Obrázok 5: Lineárna regresia dojčenskej úmrtnosti od HDP na obyvateľa v parite kúpnej sily EÚ po vylúčení Luxemburska 2009 (SAS-EG 4.2)

151 FORUM STATISTICUM SLOVACUM 7/ Záver Analýzou závislosti medzi dojčenskou úmrtnosťou a priemerným vekom matky pri pôrode krajín EÚ v roku 2009 sme zistili štatisticky významný negatívny vzťah týchto dvoch premenných. Potvrdilo sa nám že čím je priemerný vek matky pri pôrode vyšší tým je dojčenská úmrtnosť nižšia. Ďalším logickým vysvetlením nižších mier dojčenskej úmrtnosti je kvalitná zdravotná a sociálna starostlivosť v jednotlivých krajinách. Uvažovali sme že v krajinách s vysokou životnou úrovňou vyjadrenou výškou HDP na obyvateľa v PPS je aj zdravotníctvo vyspelejšie a poskytuje dostatočne vysokú starostlivosť tak o rodičky ako aj o narodené deti výsledkom čoho by mala byť nízka úroveň dojčenskej úmrtnosti. To sa nám aj potvrdilo pretože vzťah medzi dojčenskou úmrtnosťou a HDP na obyvateľa v PPS bol negatívny a štatisticky významný. Hodnota koeficienta korelácie sa výrazne zvýšila po vyradení Luxemburska z analýzy. Luxembursko sme sa rozhodli z analýzy v druhom prípade vylúčiť kvôli extrémne vysokej hodnote HDP na obyvateľa v PPS a táto extrémna hodnota ovplyvňovala výsledky hodnotenia. Príspevok bol vypracovaný v rámci riešenia projektu VEGA 1/0906/ Literatúra [1] FIALA T. LANGHAMROVÁ J. Změny demografického vývoje a populační struktury v ČR od roku In: Forum Statisticum Slovacum. 5/2010. ISSN s [2] LÖSTER T. LANGHAMROVÁ J. EU countries from the viewpoint of demographic data and finding of clusters of similar countries. In: Reprodukce lidského kapitálu Vzájemné vazby a souvislosti [CD-ROM]. Praha : Oeconomica 2009 ISBN s [3] MEGYESIOVÁ S. LIESKOVSKÁ V. Recent population change in Europe. In Sborník příspěvků International Days of Statistics and Economics at VŠE (Mezinárodní statisticko-ekonomické dny na VŠE v Praze ISBN [CD-ROM]. [4] MURA L. Demografická analýza okresu Komárno. In: Forum Statisticum Slovacum. 6/2011. ISSN s [5] MURA L. Dynamika zmien demografických ukazovateľov Nitrianskeho kraja. In: Forum Statisticum Slovacum. 6/2011. ISSN s [6] [7] &plugin=1 Adresa autora (-ov): Silvia Megyesiová Ing. PhD. Ekonomická univerzita v Bratislave Podnikovohospodárska fakulta v Košiciach Tajovského Košice silvia.megyesiova@euke.sk Matej Hudák Ing. PhD. Ekonomická univerzita v Bratislave Podnikovohospodárska fakulta v Košiciach Tajovského Košice matej.hudak@euke.sk

152 150 FORUM STATISTICUM SLOVACUM 7/2011 Analýza ekonomického sentimentu The analysis of economic sentiment Ladislav Mura Abstract: The present article deals with current issues of economic sentiment indicator and its analysis. The economic sentiment index compiled by the European Commission and reflects the opinions of respondents from the sectors of the current and expected economic developments. The article focuses on the current value of the economic sentiment indicator and its components in the Slovak Republic. Key words: Indicator economic sentiment analysis Kľúčové slová: Indikátor ekonomický sentiment analýza JEL classification: E29 C19 1. Úvod Aktuálnym problémom analytikov a štatistikov je hodnotenie vývoja makroekonomických ukazovateľov ekonomiky Slovenskej republiky. Osobitne v súčasnom stave druhého cyklu hospodárskej recesie keď analýza vývoja makroekonomických ukazovateľov slúži nielen na predikciu budúceho možného vývoja pre národohospodárske plánovanie ale i pre prijímanie dôležitých rozhodnutí vlády. Bližšie sa skúmaniu ekonomického cyklu sa okrem iných odborníkov venovali aj [1] Jednou z možností je využiť tzv. rýchle odhady makroekonomických ukazovateľov. Rýchle odhady vývoja týchto ukazovateľov je Štatistický úrad Slovenskej republiky (ŠÚ SR) povinný zverejňovať vždy do 45 dní po skončení štvrťroka čiže 15 dní pred zverejnením oficiálnej štatistickej správy o základných vývojových tendenciách v hospodárstve SR v danom štvrťroku. Vo vyspelých krajinách predstavujú rýchle odhady vývoja hlavných ukazovateľov na makroúrovni neoddeliteľnú súčasť oficiálne dostupných štatistických informácií. [2] Sem zaraďujeme i konjunkturálne prieskumy ktoré poskytujú cenné informácie o aktuálnom vývoji slovenskej ekonomiky a majú vo väčšej miere kvalitatívny charakter. Výsledky týchto zisťovaní sa veľmi široko uplatňujú v ekonomickom výskume hlavne pri identifikácii bodov obratu v ekonomickom cykle. V súvislosti s tým sa konjunkturálne prieskumy stali kľúčovým doplnkom k oficiálnym štatistickým informáciám kvantitatívneho charakteru ktoré sú k dispozícií až s relatívne veľkým časovým oneskorením. O mimoriadnom význame svedčí fakt že tieto prieskumy sa používajú na monitorovanie ekonomického vývoja v rôznych integračných zoskupeniach ako napríklad v členských krajinách Európskej únie krajinách OECD a podobne. 2. Cieľ materiál a metódy Cieľom článku je analyzovať vývoj ukazovateľa indikátor ekonomického sentimentu za vybrané obdobie. Analyzovali sme diapazón pričom dôraz sme kládli na detailnejšiu analýzu súčasného obdobia (2011). Splnenie vytýčeného cieľa si vyžiadalo sústrediť primárne údaje. Údaje ktoré sme podrobili analýze boli získané z databázy ŠÚ SR a databázy etrend. Z metodického hľadiska sme využili najmä stredné hodnoty. Zistenia sú interpretované komentárom ako aj prostredníctvom grafického spracovania. Pre spresnenie uvádzame že vychádzame zo zmeny bázického obdobia na priemer roku 2005=100.

153 FORUM STATISTICUM SLOVACUM 7/ Výsledky a diskusia 3.1 Východiská skúmania indikátora ekonomického sentimentu Indikátor ekonomického sentimentu (v skratke IES) je zložený ukazovateľ ktorý má za cieľ zobrazovať aktuálny stav očakávaní všetkých účastníkov ekonomického prostredia. Pozostáva z agregovaných údajov z výsledkov konjunkturálnych prieskumov v priemysle stavebníctve obchode službách a z výsledkov prieskumu o názoroch spotrebiteľov na aktuálnu ekonomickú situáciu. V ďalšej časti článku v krátkosti charakterizujeme zložky indikátora ekonomického sentimentu. Indikátor dôvery v priemysle je kompozitný ukazovateľ vypočítaný ako aritmetický priemer konjunkturálnych sáld úrovne celkového dopytu stavu zásob hotových výrobkov (s opačným znamienkom) a očakávaného objemu priemyselnej produkcie. Saldá z ktorých je indikátor dôvery v priemysle počítaný sú sezónne očistené a majú rovnakú váhu. Indikátor dôvery v stavebníctve je kompozitný ukazovateľ vypočítaný ako aritmetický priemer konjunkturálnych sáld úrovne celkového dopytu a očakávanej zamestnanosti. Obe saldá sú sezónne očistené a majú rovnakú váhu. Indikátor dôvery v obchode je kompozitný ukazovateľ vypočítaný ako aritmetický priemer konjunkturálnych sáld súčasnej a očakávanej ekonomickej situácie a stavu zásob tovarov (s opačným znamienkom). Saldá sú sezónne očistené a majú rovnakú váhu. Indikátor dôvery v službách je kompozitný ukazovateľ vypočítaný ako aritmetický priemer konjunkturálnych sáld úrovne dopytu podnikateľskej situácie a očakávaného dopytu. Saldá sú sezónne očistené a majú rovnakú váhu. Indikátor spotrebiteľskej dôvery je súhrnná charakteristika ktorá približuje celkovú očakávanú spotrebiteľskú dôveru obyvateľstva. Tento súhrnný ukazovateľ je vypočítaný ako aritmetický priemer sáld predpokladaného vývoja ekonomiky nezamestnanosti v štáte a predpokladaného vývoja finančnej situácie a úspor vo vlastnej domácnosti (nezamestnanosť je s opačným znamienkom). [3] Indikátor ekonomického sentimentu (pri podmienke zmeny bázického obdobia na priemer roku 2005 = 100) je vážený aritmetický priemer z indikátora dôvery v priemysle (40%) indikátora dôvery v stavebníctve (5%) indikátora dôvery v obchode (5%) indikátora dôvery v službách (30%) a spotrebiteľského indikátora dôvery (20%). Konštrukcia ukazovateľa je nasledovná: IES = a*ici + b*bci + c*rci + d*sci + e*cci Vysvetlivky: ICI = indikátor dôvery v priemysle BCI = indikátor dôvery v stavebníctve RCI = indikátor dôvery v obchode SCI = indikátor dôvery v službách CCI = indikátor spotrebiteľskej dôvery abcde = váhy jednotlivých zložiek indikátora Vypočítané hodnoty sú prevedené do formy indexu k bázickému obdobiu ktorým je priemer roku Indikátor ekonomického sentimentu je od marca 2007 spracovaný podľa novej metodiky t. j. do výpočtu indikátora je zahrnutý indikátor dôvery služieb pri zmenenom váhovom systéme.

154 152 FORUM STATISTICUM SLOVACUM 7/ Indikátor ekonomického sentimentu SR a jeho zložky Indikátor ekonomického sentimentu je vážený aritmetický priemer a skladá sa z nasledovných komponentov: z indikátora dôvery v priemysle (40%) indikátora dôvery v stavebníctve (5%) indikátora dôvery v maloobchode (5%) indikátora dôvery v službách (30%) a spotrebiteľského indikátora dôvery (20%). [4] Pomocou konjunkturálnych sáld za vybrané otázky je pre každý z piatich skúmaných sektorov konštruovaný na mesačnej báze kompozitný (zložený) indikátor dôvery ktorý odzrkadľuje (jedným číslom) vnímanie ekonomického vývoja v príslušnom sektore. Cieľom ich konštrukcie je detailnejšie popísať vývoj v daných odvetviach a tým pomôcť s predstihom identifikovať možné zlepšenie alebo zhoršenie ich aktuálnych vývojových tendencií. Vývojové tendencie indikátora ekonomického sentimentu zachytené v ročných časových radoch ilustruje spolu s dlhodobým priemerom graf 1. Graf 1 Vývoj indikátora ekonomický sentiment v SR v diapazóne Zdroj: ŠÚ SR Indikátor ekonomického sentimentu je na rozdiel od odvetvových indikátorov dôvery kompozitným indikátorom ktorý odzrkadľuje názory respondentov z uvedených odvetví na súčasný a očakávaný ekonomický vývoj komplexne. Ako sme už uviedli vypočítava sa ako vážený aritmetický priemer z piatich čiastkových indikátorov dôvery. V dôsledku toho sa na makroúrovni považuje za referenčný ukazovateľ pre medziročnú relatívnu zmenu reálneho HDP. [2] Tabuľka 1 v syntetickej forme ilustruje vývoj indikátora ekonomického sentimentu a jeho jednotlivých komponentov v súčasnom období v roku Pretrváva každomesačný trend poklesu súhrnného ukazovateľa. Výnimku tvoril mesiac máj 2011 kedy sa ukazovateľ mierne zlepšil na úroveň z marca 2011 a svoju hodnotu si konštantne držal na danej úrovni aj v mesiaci jún Letné mesiace (júl a august) boli charakterizované poklesom výroby a obchodu vplyvom čerpania dovoleniek a zhoršovania sa všeobecnej hospodárskej situácie v eurozóne. Najnižšiu hodnotu dosiahol IES v októbri 2011 keď sa prepadol pod hranicu celého čísla 90.

155 FORUM STATISTICUM SLOVACUM 7/ Komponent Indikátor dôvery v priemysle patril počas prvých piatich mesiacov roku 2011 k prevažne pozitívne prispievajúcim komponentom ukazovateľa IES. V júni a v júli nastal prepad 13 resp. 15% oproti máju Od augusta hodnota osciluje okolo 0. K trvale negatívne prispievajúcim komponentom ukazovateľa IES patrí Indikátor dôvery v stavebníctve. Počas celého roku 2011 pozorujeme pesimistickú náladu v tomto odvetví hospodárstva. Pod vysoko negatívne hodnoty sa podpisuje pretrvávajúca recesia útlm stavebných činností prevys ponuky nehnuteľností nad dopytom čo nepriaznivo ovplyvňuje stavebnú činnosť a budúce očakávania sú preto nepriaznivé. Tabuľka 1 Vývoj indikátora ekonomický sentiment v SR a jeho zložiek v roku 2011 IES a jeho zložky Indikátor ekonomického sentimentu Indikátor dôvery v priemysle Indikátor dôvery v stavebníctve Indikátor dôvery v obchode Indikátor dôvery v službách Indikátor spotrebiteľskej dôvery Zdroj: ŠÚ SR Mesiace roku Vysvetlivky: - všetky indikátory s výnimkou indikátora spotrebiteľskej dôvery sú sezónne očistené - pri spracovaní údajov od mája 2011 sa začala využívať nová klasifikácia ekonomických činností SK NACE 2 implementáciou ktorej prišlo k revízii časových radov. Opačný trend (aj keď relatívne ustálený na rovnakých hodnotách) vykazuje komponent Indikátor dôvery v obchode. Pozitívne hodnoty podporuje ešte relatívne stabilný dopyt po spotrebných tovarov. Je odrazom očakávanej ekonomickej situácie a stavu zásob tovarov. Najviac pozitívne prispievajúcim komponentom IES sa stal v roku 2011 Indikátor dôvery v službách. Trvale dosahuje hodnoty nad 25% výnimku tvoria posledné tri mesiace roku Pozitívne hodnoty dosahuje vďaka relatívne stabilnému dopytu aktuálnej podnikateľskej situácie. Znižovanie hodnôt súvisí s prehĺbením dlhovej krízy v eurozóne a jej očakávanému negatívnemu dosahu na ekonomickú situáciu subjektov. Indikátor spotrebiteľskej dôvery približuje celkovú očakávanú spotrebiteľskú dôveru obyvateľstva. Komponent tvorí aritmetický priemer sáld predpokladaného vývoja ekonomiky nezamestnanosti v štáte a predpokladaného vývoja finančnej situácie a úspor vo vlastnej domácnosti (pozn. nezamestnanosť je s opačným znamienkom). Práve tieto zložky indikátora spotrebiteľskej dôvery sa podpisujú pod jej trvale negatívny trend.

156 154 FORUM STATISTICUM SLOVACUM 7/ Aktuálne hodnoty komponentov indikátora ekonomického sentimentu za október 2011 V októbrovej štatistike sa prejavili predovšetkým pesimistickejšie hodnotenia podnikateľov v obchode a v službách ale takisto aj rastúci pesimizmus u spotrebiteľov. Indikátor ekonomického sentimentu (ako trojmesačný kĺzavý priemer) v októbri pokračoval v poklese a dosiahol najnižšiu úroveň od apríla Hodnota trojmesačného kĺzavého priemeru indikátora sa oproti predchádzajúcemu mesiacu znížila o 07 bodu na 897 vplyvom pesimistickejších hodnotení podnikateľov v obchode čiastočne i v službách a spotrebiteľov. Názory respondentov boli pesimistickejšie ako v rovnakom období minulého roka (o 25 bodu) aktuálny údaj za úrovňou dlhodobého priemeru zaostáva o 83 bodu. [4] Indikátor dôvery v priemysle sa v októbri zvýšil o 1 % na hodnotu 07 bodu. Podľa štatistík bol rast indikátora ovplyvnený očakávaným zvýšením produkcie na najbližšie tri mesiace. Indikátor dôvery v stavebníctve oproti revidovanej septembrovej hodnote vzrástol o 65 bodu na -375 a to najmä vplyvom zvýšenia optimizmu pri očakávanej zamestnanosti a pri súčasnom dopyte. V októbri sa jeho zaostávanie za hodnotou dlhodobého priemeru znížilo na 135 bodu. V desiatom mesiaci výrazne klesol aj indikátor dôvery v obchode. Znížil sa o 6 % a po druhýkrát v tomto roku sa dostal pod úroveň dlhodobého priemeru. Vývoj indikátora nepriaznivo ovplyvnili vysoké zásoby a pesimistické prognózy vývoja ekonomickej situácie na najbližšie tri mesiace. Hodnota indikátora dôvery v službách v októbri opäť klesla oproti minulému mesiacu o 1 % na úroveň 12. Pokles indikátora ovplyvnil negatívny vývoj podnikateľskej situácie ktorý bol čiastočne kompenzovaný priaznivejším vývojom súčasného dopytu pričom očakávaný dopyt ostal na úrovni predchádzajúceho mesiaca. Naďalej klesá aj indikátor spotrebiteľskej dôvery ktorého hodnota sa a v októbri znížila oproti predchádzajúcemu mesiacu o 52 bodu na Stalo sa tak v dôsledku zvýšenia obáv respondentov pri hodnotení všetkých štyroch zložiek ktorými sú očakávaná ekonomická situácia a nezamestnanosť v SR perspektívy úspor a predpokladaná finančná situácia v domácnostiach. Pesimizmus obyvateľov sa podľa údajov ŠÚ SR zvýšil v porovnaní s rovnakým obdobím minulého roka o 18 bodu Indikátor ekonomického sentimentu za Európsku úniu a zónu menovej únie Vývojové tendencie indikátora ekonomického sentimentu v Európskej únii a zóne menovej únie ( zóne) zachytené v ročných časových radoch ilustruje graf 2. Z neho je zrejmé že IES v zóne menovej únie osciluje blízko IES za celú Európsku úniu vrátane členských štátov bez účasti na jednotnej mene. Je tomu tak z dôvodu že z 27 členských štátov EÚ sú v menovej únii práve najväčšie a najsilnejšie ekonomiky ktoré najviac ovplyvňujú celkové výsledky únie Aktuálne hodnoty komponentov indikátora ekonomického sentimentu EÚ V septembri indikátor ekonomického sentimentu výrazne klesol v Európskej únii a súčasne aj v zóne jednotnej menovej únie (-34 bodu) na úroveň 940 resp Pokles IES je dôsledkom zníženia dôvery vo všetkých sektoroch najvýraznejšie v priemysle a službách. Napriek skutočnosti že dôvera v priemysle zotrváva nad dlhodobým priemerom zaznamenala v EÚ výrazné zhoršenie o 33 bodu a v zóne menovej únie o 32 bodu najmä pre nízke hodnotenia úrovne očakávanej produkcie a objednávok. Zvýšil sa podiel respondentov hodnotiacich zásoby ako vysoké. Manažéri v Európskej únii boli tiež pesimistickejší v

157 FORUM STATISTICUM SLOVACUM 7/ posudzovaní výšky objednávok pre export a v hodnotení produkcie za posledné mesiace. V službách dôvera klesla v EÚ (-28) aj v zóne menovej únie (-37). Rozdiel medzi týmito dvomi oblasťami v porovnaní s augustovým výrazným poklesom spôsobil malý rast sentimentu v Spojenom kráľovstve. V obidvoch oblastiach sa významne zhoršili hodnotenia minulého a očakávaného dopytu. V obchode klesol sentiment v Európskej únii o 24 bodu a v zóne menovej únie o 11 bodu najmä vplyvom pesimistického hodnotenia súčasnej podnikateľskej situácie a v EÚ aj vplyvom hodnotenia očakávanej podnikateľskej situácie. V stavebníctve sentiment oslabil v EÚ (-21) aj v zóne menovej únie (-26). Dôvera u spotrebiteľov sa zhoršila ako v Európskej únii (-23) tak aj v zóne menovej únie (-26). Spotrebitelia sú pesimistickí pri posudzovaní všeobecnej ekonomickej situácie a prejavujú zvýšené obavy z nezamestnanosti. V porovnaní s minulým mesiacom sú tiež pesimistickejší pri hodnotení očakávanej finančnej situácie a možnosti úspor. Graf 2 Vývoj indikátora ekonomický sentiment v EÚ v diapazóne Zdroj: ŠÚ SR 4. Záver Štatistické úrady (či už ŠÚ SR alebo Eurostat) skúmajú nielen minulé javy ale snažia sa aj predikovať očakávaný vývoj v budúcnosti. Z tohto dôvodu realizujú konjunkturálny prieskum pri ktorom sa zisťujú očakávania u vybraných subjektov (domácnosti podnikateľské subjekty). Zistenia poskytujú cenné informácie o očakávaných tendenciách vo vývoji hlavných oblastí podnikovej ekonomiky v najbližšej budúcnosti. Zistenia sú významné najmä v tom že postihujú atmosféru v podnikateľskom prostredí a poskytujú informácie s veľkým časovým predstihom a slúžia k identifikácii bodu zvratu v ekonomike. V rámci uskutočnenej analýzy sme zistili že IES za SR pokračuje v poklese a v októbri dosiahol najnižšiu úroveň za posledných 16 mesiacov.

158 156 FORUM STATISTICUM SLOVACUM 7/ Literatúra [1] BOĎA M. - STRIEŽOVSKÁ L. Existencia a stabilita ekonomického cyklu v podmienkach Slovenskej republiky. In: Forum Statisticum Slovacum č. 4 roč. 6. ISSN S [2] HALUŠKA J. a kol. Modelový aparát na rýchle odhady vývoja makroekonomických ukazovateľov Slovenskej republiky. Bratislava: Infostat s. ISBN [3] ŠÚ SR Výsledky konjunkturálneho prieskumu. [online] [cit ] Dostupné na: [4] TREND. Databáza etrend. [online] [cit ] Dostupné na: Adresa autora: Ing. et Bc. Ladislav Mura PhD. Katedra ekonomiky Ekonomická fakulta Univerzita J. Selyeho Hradná ul Komárno ladislav.mura@gmail.com

159 FORUM STATISTICUM SLOVACUM 7/ Možnosti odhadu regionálního indexu spotřebitelských cen Estimation possibilities of regional Consumer Price Index Petr Musil Jana Kramulová Abstract: This paper focuses on estimation possibilities of price development in the Czech Republic regions. Official statistics (Czech Statistical Office) publishes Consumer Price Index (hereinafter CPI) just for the whole republic. The paper describes problems connected with CPI regionalization (for example lack of data data resources shattering and so on). Also possible alternative approaches to this problematic are presented. Regional differences are illustrated on division Food and non-alcoholic beverages example. Key words: Consumer Price Index the Czech Republic regional differences national accounts classification COICOP. Klíčová slova: Index spotřebitelských cen Česká republika regionální rozdíly národní účty klasifikace COICOP. JEL classification: E21 E31 O18 R29 1. Úvod Cílem tohoto článku je odhad regionálních indexů spotřebitelských cen pro oblasti NUTS 2 České republiky. Český statistický úřad publikuje tento index pouze na úrovni celé České republiky proto si tento článek klade za cíl odhalit případné odlišnosti v regionálních hodnotách které jsou díky tomuto faktu zatím opomíjeny. Co se týče struktury článku nejprve je stručně představena regionální struktura ČR a identifikovány základní odlišnosti mezi jednotlivými kraji. Dále je popsána datová základna pro výpočet a představena podstata indexu. Jsou také diskutovány problémy které se objevily při aplikaci metodiky do praxe ČR. Následuje odhad regionálních cenových indexů pro potraviny a nealkoholické nápoje (oddíl 01 klasifikace COICOP) neboť právě v tomto oddílu se vyskytuje nejméně popsaných problémů. V závěru článku jsou diskutovány výsledky a zmíněn další možný směr výzkumu. 2. Regiony ČR Česká republika je z hlediska klasifikace NUTS rozdělena do 8 regionů soudržnosti (NUTS 2) a 14 krajů (NUTS 3). Jak ukazují tabulka 1 a obrázek 1 jednotlivé oblasti (někdy nazývány také regiony soudržnosti) jsou tvořeny jedním dvěma nebo třemi kraji. NUTS klasifikace byla Eurostatem vytvořena zejména z důvodu srovnatelnosti územních jednotek z hlediska počtu obyvatel. Přestože ani toto hledisko není v ČR zcela splněno Moravskoslezský kraj jako nejpočetnější kraj čítá obyvatel (údaj za rok 2009) zatímco nejméně početný Karlovarský kraj čítá obyvatel (2009) významný rozdíl je mezi jednotlivými regiony především v oblasti ekonomického výkonu 1. Tento výkon je obvykle měřen pomocí ukazatelů jako je HDP (ať již absolutně či v PPS) míra nezaměstnanosti či disponibilní důchod domácnosti. Následující tabulka ukazuje HDP jednotlivých krajů ČR. 1 Blíže k této problematice viz [3] str Autoři v [3] člení jak regiony soudržnosti NUTS 2 tak kraje NUTS 3 podle ekonomické výkonnosti do několika poměrně homogenních skupin.

160 158 FORUM STATISTICUM SLOVACUM 7/2011 Tabulka 1: NUTS 2 a NUTS 3 jednotky v ČR NUTS 2 NUTS 3 Praha Praha Střední Čechy Středočeský kraj Jihozápad Jihočeský kraj Plzeňský kraj Severozápad Karlovarský kraj Ústecký kraj Severovýchod Liberecký kraj Královéhradecký kraj Pardubický kraj Jihovýchod Vysočina Jihomoravský kraj Střední Morava Olomoucký kraj Zlínský kraj Moravskoslezsko Moravskoslezský kraj Zdroj: [5] Obrázek 1: Oblasti (NUTS 2) a kraje (NUTS 3) České republiky Právě ukazatel regionálního HDP a jeho porovnání s průměrem EU je stěžejním ukazatelem pro čerpání podpory z evropských fondů. Odhad regionálního indexu spotřebitelských cen (dále ISC) by měl následně přispět k posouzení správnosti hodnot regionálního HDP publikovaných dle současné metodiky.

161 FORUM STATISTICUM SLOVACUM 7/ Tabulka 2: HDP na 1 obyvatele v PPS (2008) v krajích ČR NUTS 3 HDP na 1 obyvatele v PPS (2008) Praha Středočeský kraj Jihočeský kraj Plzeňský kraj Karlovarský kraj Ústecký kraj Liberecký kraj Královéhradecký kraj Pardubický kraj Vysočina Jihomoravský kraj Olomoucký kraj Zlínský kraj Moravskoslezský kraj Zdroj: [6] 3. Datová základna Cenový vývoj v ekonomice patří mezi velmi sledované makroekonomické ukazatele pro tvorbu fiskální i monetární politiky. Komplexním ukazatelem cenového vývoje je implicitní deflátor Hrubého domácího produktu (dále HDP). Ovšem HDP je odhadován čtvrtletně a navíc s jistým zpožděním což není pro účely odhadu cenového vývoje vhodné. Odhad HDP je primárně zaměřen na odhad reálné změny; odhad deflátoru je vedlejší a můžou v něm být zahrnuty organizační změny nebo změny metodiky. Pro rychlý odhad cenového vývoje se používá index spotřebitelských cen založený na sledování cenového vývoje zboží a služeb které nakupuje typická (průměrná) domácnost. Tento index tak pokrývá přibližně polovinu ekonomiky (výdaje na konečnou spotřebu domácností) a lze jím částečně aproximovat i výdaje vládních institucí na konečnou spotřebu. ISC je měsíční statistika která se publikuje ve třech formách: meziměsíční (k předchozímu měsíci) meziroční (ke stejnému měsíci minulého roku) a průměrný roční index (průměr za posledních 12 měsíců k předchozím 12 měsícům) viz [2]. V České republice zodpovídá za odhad indexu spotřebitelských cen Český statistický úřad (dále ČSÚ) který publikuje data měsíčně. Část cen je zjišťována tazateli/tazatelkami přímo v prodejnách nebo provozovnách po celém území ČR. Zbytek tvoří tzv. centrálně zjišťované ceny které jsou stejné po celém území ČR nebo se sice si liší v regionech ale je výhodnější sledovat je centrálně (např. pojištění). Některé centrální ceny existují pouze ve formě tzv. subindexů kdy je zjišťován pouze cenový index a nikoliv vlastní cena a tedy i absolutní cenová úroveň. Tento postup je využit např. u osobní železniční dopravy. ISC je index typu Laspeyres přičemž váhové schéma je odvozeno od výdajů domácností na konečnou spotřebu v národních účtech až do úrovně čtyř míst klasifikace COICOP 2. Na detailnější úrovni jsou váhy založeny na statistice rodinných účtů. Komplexní revize vah probíhá jednou za 5 let. Od roku 2008 se během pětiletého období provádí tzv. malé revize 2 Klasifikace COICOP se používá pro třídění výdajů domácností podle účelu. Je tedy podstatné za jakým účelem domácnost nakupuje a nikoliv co kupuje. V oddílu doprava jsou například za výdaje domácností považovány pohonné hmoty jízdenky oprava motorových vozidel apod.

162 160 FORUM STATISTICUM SLOVACUM 7/2011 ve kterých se reviduje váhové schéma pouze na vyšších agregacích klasifikace. Účelem těchto revizí je zachytit změnu ve struktuře výdajů a zvýšit vypovídající schopnost indexu. Do vlastního výpočtu ISC nevstupují všechny zjištěné ceny. U některých výrobkových skupin (např. elektronika) dochází ke kvalitativnímu očišťování proto byla do indexu zahrnuta i změna kvality. V dané této výrobkové skupině také dochází k časté výměně reprezentantů a proto se v jednom měsíci sleduje cena starého i nového reprezentanta ale do výpočtu indexu vstupuje pouze cena jednoho z nich (blíže viz [4]). Kvalitativní očišťování se provádí na úrovni celé ČR. Na regionální úrovni ČSÚ publikuje ceny vybraných reprezentantů za jednotlivé kraje. Jedné se o především o ceny potravinářských výrobků a některých služeb což jsou reprezentanti u kterých kvalitativní očisťování není podstatné. Regionální cenové indexy vypočtené za tyto položky je možné považovat za reprezentativní. 4. Metodika Odhad regionálních cenových indexů s sebou přináší některé problémy které se na úrovni celé republiky nevyskytují. V národním účetnictví existují výdaje na konečnou spotřebu ve dvou pojetích: národním a domácím. Národní pojetí obsahuje výdaje rezidentských domácností na domácím území a výdaje rezidentských domácností v zahraničí. Domácí pojetí se skládá z výdajů rezidentských domácností na domácím území a výdajů nerezidentských domácností na domácím území. Údaje o nákupech rezidentů v zahraničí a nerezidentů v domácí ekonomice jsou získány z platební bilance. Údaje o meziregionálních nákupech nejsou k dispozici z žádného statistického zjišťování a tudíž chybí datové zdroje pro sestavení regionálních makroagregátů. Regionální cenový index je pak nutné chápat spíše jako změnu cen na daném území. Pohyb osob mezi regiony ČR je relativně významnější než pohyb mezi ČR a ostatními státy. Významný pohyb je například mezi Prahou a Středočeským krajem který obklopuje Prahu. Pro experimentální odhad regionálních cenových indexů byly zvoleny roční průměrné ceny. Důvodem je odstranění sezónnosti a dalších faktorů které se mění v průběhu roku (cena živého kapra se sleduje pouze v prosinci na jaře se na trhu objevují nové brambory apod.). Dalším důvodem je vyhlazení případných meziměsíčních výkyvů v časové řadě a také částečná kompenzace nemožnosti provést kvalitativní očištění na regionální úrovni. Sběr cen je prováděn v místech obvyklého nákupu domácností tak aby výběr byl reprezentativní za celou ČR. Ovšem v rámci regionů není reprezentativnost zaručena zejména za malé kraje například Karlovarský kraj. Při analýze dostupných dat se objevilo několik problémů se kterými je nutné vypořádat. Za některé reprezentanty jsou dostupné regionální ceny pouze ve vybraných regionech. V některých případech to vyplývá z povahy reprezentanta a proto se například ceny za lyžařský vlek v Praze nesledují. Jindy se reprezentant v daném regionu vůbec nevyskytuje jako v případě ***** hotelu v Pardubickém kraji. V těchto případech byla vypočtena průměrná cena za celou ČR z dostupných údajů jako vážený aritmetický průměr (vahami je počet obyvatel). U internetového prodeje se předpokládají stejné ceny v rámci celé ČR. Je pravděpodobné že struktura výdajů na konečnou spotřebu domácností se regionálně liší což naznačuje statistika rodinných účtů. Regionální HDP se sestavuje výrobní a důchodovou metodou nikoliv ovšem výdajovou metodou. Není tedy znám podíl výdajů na konečnou spotřebu domácností (dále VKSD) na HDP v jednotlivých regionech ani struktura VKSD 3. Regionální cenové indexy potom představují čistou cenovou změnu bez vlivu různé struktury výdajů v regionech. 3 Detailní popis metodiky odhadu HDP na úrovni celé ekonomiky i regionů je možné nalézt v publikaci [1].

163 FORUM STATISTICUM SLOVACUM 7/ Ilustrační příklad s potravinami Regionální cenový index byl odhadnut pro potraviny a nealkoholické nápoje (oddíl 01 klasifikace COICOP). V tomto oddílu se téměř neprovádí kvalitativní očišťování nevyskytují se chybějící ceny pro reprezentanty a je zde nejvíce reprezentantů ze všech oddílů. V tabulce jsou uvedeny meziroční regionální indexy za rok Tabulka 3: Regionální cenové indexy (2008) v oblastech ČR COICOP 01 Region NUTS 2 Index Praha CZ Střední Čechy CZ Jihozápad CZ Severozápad CZ Severovýchod CZ Jihovýchod CZ Střední Morava CZ Moravskoslezko CZ Zdroj: výpočet autorů V roce 2008 došlo v ČR k relativně rychlému růstu cen potravin. Při porovnání indexů je možné konstatovat že tempa růstu se příliš neliší. Rozdíl mezi nejrychlejším a nejpomalejším růstem je pouze 12 p. b. Vzhledem k nereprezentativnosti výběru na úrovni regionů je nutné posuzovat výsledky s jistou dávkou obezřetnosti. 6. Závěr Cílem tohoto článku bylo odhadnout regionální indexy spotřebitelských cen pro oblasti České republiky. Tyto odhady jsou shrnuty v tabulce 3. Přestože jsou oblasti NUTS 2 v ČR považovány za heterogenní v oddílu potraviny a nealkoholické nápoje (oddíl 01 klasifikace COICOP) nebyly pozorovány významnější rozdíly v tempech růstu cen (rozdíl mezi nejrychlejším a nejpomalejším růstem byl pouze 12 p. b.). Výsledky dosažené v této analýze mohou být dobrým východiskem pro konstrukci a odhady celkových indexů spotřebitelských cen. Přestože se jedná o první odhady které budou postupně zpřesňovány mohou být tyto snahy cílem dalšího výzkumu. Je ovšem třeba brát v úvahu že v ostatních oddílech bude nutno čelit problémům zmíněným výše (kvalitativní očišťování chybějící ceny pro reprezentanty nedostatek regionálních dat a další). Literatura [1] HRONOVÁ S. FISCHER J. HINDLS R. SIXTA J Národní účetnictví: nástroj popisu globální ekonomiky. Praha: C. H. Beck s. ISBN [2] JÍLEK J Nástin sociálněhospodářské statistiky. Praha: Oeconomica 2005 S ISBN [3] KOLEKTIV AUTORŮ Úvod do regionálních věd a veřejné správy. Plzeň: Vydavatelství a nakladatelství Aleš Čeněk s. ISBN [4] ČSÚ. Indexy spotřebitelských cen (metodická příručka pro uživatele). [online ] [5] ČSÚ. Oblasti (NUTS 2) a kraje (NUTS 3) České republiky. ke_republiky [online ]

164 162 FORUM STATISTICUM SLOVACUM 7/2011 [6] ČSÚ. Statistická ročenka České republiky Vybrané ukazatele oblastí a krajů. [online ] Adresa autorů: Petr Musil Ing. VŠE Praha Náměstí W. Churchilla Praha 3 petr.musil@vse.cz Jana Kramulová Bc. Ing. VŠE Praha Náměstí W. Churchilla Praha 3 jana.kramulova@vse.cz Poděkování: Tento článek byl vypracován v rámci grantu Vysoké školy ekonomické v Praze č. 12/2011 Odhad regionálních cenových hladin.

165 FORUM STATISTICUM SLOVACUM 7/ Využitie samoorganizujúcich sa máp pri navigácií autonómnych robotov Application of the self-organizing maps in the autonomous robot navigation Lukáš Pastorek Hana Řezanková Abstract: In this paper we present a novel approach in the autonomous robot navigation based on bio-inspired clustering techniques: Kohonen's self-organizing maps and its derivative Neural gas (NG). The high-dimensional and high-scale dataset of SURF descriptors which helps robot to navigate in the indoor and outdoor conditions is compressed into the map of cluster prototypes. This map is consequently used as a basis for the robot decision making. Key words: SURF Autonomous robot navigation Feature descriptor clustering SOM Neural gas Kľúčové slová: SURF Navigácia autonómnych robotov zhlukovanie deskriptorov Neurónový plyn. JEL classification: C45 1. Úvod Na základe výskumu v oblasti počítačového videnia (angl. computer vision) konkrétne detekcie a popisu významných bodov na obraze ktorý uskutočnil Bay [1] T. Krajník zostrojil inteligentný rozhodovací systém (algoritmus SURFNav) ktorý implementoval do navigácie autonómneho robota a odprezentoval v [3][4]. Tento rozhodovací mechanizmus čerpajúci vo veľkej miere práve zo spomínaného Baya [1] je implementáciou a modifikáciou pôvodného SURF algoritmu (angl. Speeded-Up Robust Features) ktorý je kombináciou detekčných a popisných metód uplatňovaných pri obrazovom spracovaní. Detekčná časť algoritmu využíva kritérium založené na štvorcovej Hessovej matici a popisná časť ktorej výsledkom je tzv. SURF deskriptor je založená na štatistických rozdeleniach. Veľkou výhodou SURF algoritmu je schopnosť detekovať rovnaké miesta v prostredí pri rôznych pozorovacích podmienkach (iný uhol škála). Zároveň tento algoritmus hoci si z hľadiska zjednodušenia a funkčnosti vybral z existujúcich metód spracovania obrazu len to nevyhnutné dokázal vysokú úspešnosť z pohľadu opakovateľnosti robustnosti a hlavne rýchlosti výpočtu. Tým zaujal významné postavenie v tejto oblasti. Krajník upravil predstavený SURF algoritmus pre potreby navigácie keď zredukoval Bayom navrhnutý rozmer popisného vektoru (SURF deskriptoru) zo 128 dimenzí na 64 rozmerov. Zároveň v [4] dokázal funkčnosť navigačného SURFNav algoritmu ktorý pracuje prostredníctvom 2 fáz učenia sa a testovania. V prvej fáze (učení sa) je robot vedený prostredníctvom diaľkového ovládania vonkajším alebo vnútorným prostredím po zvolenej trase a v určitých časových intervaloch robí obrazové záznamy videného prostredia. V tejto trénovacej fáze si robot všíma významné body na obraze napr. rohy kúty T-križovatky škvrny či kontrastné línie. Každý takto detekovaný bod je zaznamenaný uložený a popísaný 64-rozmerným vektorom (SURF deskriptorom). Prvky vektora nesú obrazovú informáciu o samotnom bode a i okolí tohoto bodu. Týmto spôsobom si robot vygeneruje mapu videných významných bodov v prostredí spolu s ich popisom (súbor obsahujúci popisné vektory). V testovacej (navigačnej) fáze prechádza robot prostredím bez pomoci človeka a snaží sa prejsť identickú trasu iba na základe znalostí mapy SURF deskriptorov. Usiluje sa priradiť k novo zaznamenaným bodom už predtým videné miesta (uložené SURF

166 164 FORUM STATISTICUM SLOVACUM 7/2011 deskriptory). Vypočíta rozdiely v x a y súradniciach medzi spárovanými vektormi a modus rozdielov vypočítaný z histogramu je použitý ako opravná hodnota pre pohyb robota. Obrázok 1: SURF deskriptory (biele body) na vzorovom obrázku 2. Zhlukovanie Súbor zaznamenaných SURF deskriptorov (Matica cca x 64) vykazuje klasické znaky viacrozmerného priestoru. Všetky zložky týchto vektorov sú naviac v normovanom tvare a hlavne objemnosť súboru dáva veľký priestor na uplatnenie viacrozmerných štatistických metód. Zhlukovanie bolo zvolené ako doposiaľ nevyskúšaný alternatívny prístup k problému navigácie autonómnych robotov. Rozhodli sme sa aplikovať dve metódy pochádzajúce z oblasti umelej inteligencie všeobecne známe pod označením samoorganizujúce sa mapy (konkrétne Kohonenov SOM a Neurónový plyn). 3. Kohonenove samoorganizujúce sa mapy Kohonenove samoorganizujúce sa mapy známe skôr pod skratkou SOM popísané v [2] využívame k transformácií nelineárnych vzťahov v trénovacej množine dát prostredníctvom sady uzlov (neurónov) na menej rozmerný (1- alebo 2- rozmerný) priestor. S využitím iteračného trénovania a jednoduchých geometrických vzťahov medzi neurónmi na fixnej topologickej mriežke SOM zachováva rozloženie pôvodných viacrozmerných dát a i vzťahy medzi nimi. Podobné signály zo vstupného priestoru evokujú tiež podobnú odozvu v blízkych neurónoch na mriežke vo výstupnom priestore. Každý neurón z celkovej populácie neurónov je reprezentovaný d- rozmerným váhovým vektorom (nazývaným tiež aj referenčný vektor alebo prototyp zhluku) kde d je rozmer vstupného priestoru a i je číslo neurónu. Kohonenove mapy pozostávajú z dvoch vrstiev (vstupná a výstupná vrstva). Vstupnú vrstvu považujeme za distribučnú kde sú vstupné vektory prezentované uzlom (neurónom) vo výstupnom vrstve. Výstupná vrstva je tvorená spomínanými váhovými vektormi. Predtým ako začnú vektory súperiť o najbližšie postavenie vzhľadom na vstupný vektor musí prebehnúť váhová inicializácia. SOM toolbox [7] v programe Matlab poskytuje 2 druhy inicializácie pri ktorých sa buď volia váhy referenčných vektorov náhodne alebo lineárne. Pri lineárnej inicializácií počítame vlastné čísla a vektory vstupného súboru a následne sú referenčné váhové vektory neurónov zvolené pozdĺž prvých dvoch hlavných vlastných vektorov ktoré špecifikujú hlavné smery v dátach.

167 FORUM STATISTICUM SLOVACUM 7/ Rovnako SOM toolbox poskytuje dva druhy učenia siete neurónov sekvenčný a batch algoritmus. V prípade sekvenčného algoritmu náhodne vyberieme niektorý z vektorov v súbore kde n je dĺžka trénovacieho súboru a predložíme ho sieti neurónov aby súťažili o najbližšiu pozíciu k tomuto vektoru. Ten neurón ktorý je najbližšie je považovaný za víťaza (c k ). Vzdialenosti počítame s použitím Euklidovskej metriky (1) Víťazný neurón (angl. Best matching unit - BMU) a jeho topologickí susedia na mriežke neurónov prispôsobia svoj váhový vektor podľa vzorca (2) kde t predstavuje čas stupeň učenia v čase t funkciu okolia (susedstva) okolo BMU k v čase t a x(t) vstupný vektor v čase t. V batch verzií trénovania referenčných vektorov prezentujeme neurónom v jednom momente celý súbor pričom ten sa následne rozpadne na oblasti zvané Voronoiove regióny v závislosti od toho ktoré neuróny sú najbližšie ku ktorým vstupným vektorom. Váhové referenčné vektory sa potom upravia podľa vzorca ktorý je priemerom súčinov váh hodnôt funkcie susedstiev a hodnôt vstupných vektorov.. (3) 4. Neurónový plyn Na rozdiel od SOM-u Neurónový plyn (angl. Neural Gas) ktorý prvýkrát spomenul Martinetz v [5] neobsahuje fixnú topológiu siete ale obsahuje zoznam tzv. poradie susedov (angl. neighborhood ranking ). Počas tréningu sú váhové referenčné vektory radené podľa euklidovskej vzdialenosti od vstupného vektora kde je najbližší referenčný vektor k vstupnému vektoru je druhý najbližší referenčný vektor a je referenčný vektor pre ktorý existuje k vektorov takých že (4) Index l ktorý je spojený s každým vektorom c je určený funkciou závislej na x a c = (c 1... c c ). Adaptačný krok je vyjadrený vzorcom (5) kde je stupeň učenia a je exponenciálna forma funkcie susedstva. Parameter λ(t) určuje počet referenčných vektorov ktoré upravujú svoje váhy a je definovaný diskrétnou klesajúcou funkciou:

168 166 FORUM STATISTICUM SLOVACUM 7/ Aplikácia metód a experiment Predstavené metódy boli aplikované na 3 skúmané súbory SURF deskriptorov pričom sme zadefinovali pri každej metóde počet neurónov na c = V prípade SOM-u sme vyskúšali najprv lineárnu inicializáciu váhových vektorov a následne inicializovali váhy náhodne. V oboch prípadoch sme natrénovali sieť s použitím ako sekvenčného tak i batch algoritmu. Neurónový plyn sme natrénovali s použitím sekvenčného učenia ale pri rôznej dĺžke učenia sa (5 a 10 epoch). Kvalitu zhlukovania sme ohodnotili s použitím Priemernej štvorcovej odchýlky (angl. MSE) vektorov vstupného súboru od referenčných vektorov a Davies-Bouldinovho indexu. Z výsledkov v tabuľke 1 a 2 vyplýva že víťazom z pohľadu týchto dvoch ukazovateľov sa jasne stal algoritmus Neurónového plynu ktorý v oboch prípadoch dosiahol lepšie výsledky ako SOM. Väčšia dĺžka učenia nie vždy preukázala lepšie rozloženie referenčných vektorov nakoľko výsledky sú buď veľmi tesné alebo v 2 prípadoch DB indexu aj odporujúce našej intuícií. Tabuľka 1: Priemerná štvorcová odchýlka (MSE) Tabuľka 2: Davies-Bouldin index Samotný princíp zhlukovania a kompresie súboru SURF deskriptorov len na súbor referenčných vektorov bol experimentálne otestovaný priamo na navigácií autonómneho robota. Mapa SURF deskriptorov bola vygenerovaná v decembri avšak otestovaná v marci. Napriek tomuto sezónnemu posunu bol robot schopný bez väčších problémov zopakovať pôvodnú trasu čím bola dokázaná i experimentálne funkčnosť zhlukovacieho prístupu k navigácii. 6. Záver V práci sme sa snažili predstaviť invenčný prístup k navigácií založený na teoretickom výpočte optimálnej polohy centier zhlukov prostredníctvom iteračného učenia a adaptácie váh referenčných vektorov metódou SOM a Neurónového plynu. Z výsledkov možno usúdiť že Neurónový plyn napriek tomu že neobsahuje fixnú mriežku susedstiev ale nahrádza ju flexibilným poradím susedov umožňuje optimálnejšie pokrytie priestoru tak ako rozpínajúci sa plyn v uzavretom priestore. Práca na tomto algoritme a ďalších derivátoch môže priniesť sľubné výsledky do rôznych oblastí výskumu.

169 FORUM STATISTICUM SLOVACUM 7/ Literatúra [1] BAY H. - TUYTELAARS T. - VAN GOOL L SURF: Speeded up robust features. In: Proceedings of the Ninth European Conference on Computer Vision. pp Graz 2006 [2] KOHONEN T Self-organizing maps (3rd ed.). Berlin : Springer. [3] KRAJNIK T.- PREUCIL L A Simple Visual Navigation System with Convergence Property European Robotics Symposium 2008 Springer Heidelberg 2008 pp [4] KRAJNIK T. - FAJGL J. - VONASEK V.- KOSNAR K. - KULICH M. PREUCIL L Simple yet stable bearing-only navigation Journal of Field Robotics [5] MARTINETZ T.M. BERKOVICH S.G. SCHULTEN K.J Neural-gas network for vector quantization and its application to time-series prediction. In: IEEE Transactions on Neural Networks č s [6] REZANKOVA H. - HUSEK D. - SNASEL V Cluster Analysis of the Data (in Czech) Professional Publishing Prague [7] VESANTO J. ALHONIEMI E. HIMBERG J. KIVILUOTO K. PARVIAINEN J SOM Tool-box for Matlab 5. Poďakovanie: Táto práca bola spracovaná s finančnou podporou grantu IGA VSE F4/5/2011. Adresa autora (-ov): Lukáš Pastorek Mgr. Katedra statistiky a pravdepodobnosti Fakulta informatiky a statistiky VŠE v Praze nám. W. Churchilla Praha 3 lukas.pastorek@vse.cz Hana Řezanková prof. Ing. CSc. Katedra statistiky a pravdepodobnosti Fakulta informatiky a statistiky VŠE v Praze nám. W. Churchilla Praha 3 hana.rezankova@vse.cz

170 168 FORUM STATISTICUM SLOVACUM 7/2011 Comparison of clustering methods applied to hydrological data Porovnanie zhlukovacích metód a ich použitie v hydrológii Elena Pastuchová Miroslav Sabo Silvia Kohnová Abstrakt: V článku porovnávame 3 rôzne zhlukovacie algoritmy za účelom nájdenia zhlukov podobných povodí na území Slovenska. Analyzované dáta pozostávajú z 217 malých a stredne veľkých povodí z ktorých bolo každé charakterizované mesačnými frekvenciami minimálnych prietokov nižších ako Q 95. Zhlukovanie metódou DBSCAN nenašlo predpokladané zhluky avšak metódy SOM a k-means rozdelili povodia Slovenska do dvoch takmer podobných zhlukov. Najviac sa pre typizáciu povodí ako vhodná metóda javí typizácia pomocou SOM. Kľúčové slová: zhluky k-means zhlukovanie založené na hustote samoorganizujúce sa mapy typizácia JEL Classification: C1 C18. Abstract: In this paper some of clustering methods applied to identify the homogeneous pooling groups required for typological regionalization are compared. The analysis was carried out within the framework of the sample of 217 small and medium basins from the whole territory of Slovakia. As a pooling variable the relative frequency of occurrence of low flows lower than Q 95 was used. Among all employed clustering methods the results show that the SOM can determine the cluster membership more accurately than other methods. Keywords: clusters k-means density-based methods self-organizing maps typological regionalization JEL classification: C Introduction Studies on seasonality analyses in the context of low flow regionalizations are however rare. Young (2000) applied a low flow seasonality index for an estimation of low flow seasonality in the UK. Laaha (2006) and Laaha and Bloeschl (2006) compared various seasonality measures for low flows monitored at stream gauges in Austria. They found that seasonality measures were able to classify catchments into summer and winter low-flowdominated subregions. Aschwander and Kan (1999) investigated the long-term characteristic of seasonal distribution of Q 95 for representative gauges from 143 headwater catchments in Switzerland. They found two different typical seasonal distributions of low flows again depending on the catchment s altitude. Schreiber and Demuth (1997) analysed the seasonality of the mean annual 10-day minimum discharges measured in 169 catchments in southwest Germany. The results indicated typical low flow occurrences from September to October for large parts of the area studied apart from the Pre-Alps which are dominated by winter low flows. Some of the low-flow studies led to the following development of national low flow estimation procedures e.g. for the UK Gustard et al. (1992) or Switzerland Aschwanden and Kan (1999). A self-organizing map (SOM) as superior hydrological clustering technique was successfully applied by Minns et al. (1996) for rainfall-runoff models by Chen et al.(2006) for regional frequency analysis and by Lin et al. (2009) who created a hybrid neural network for typhoon-rainfall forecasting.

171 FORUM STATISTICUM SLOVACUM 7/ In Slovakia latest studies on low flows were published by e.g. Majerčáková Lešková Šedík (1995) and Demeterová (2000) who analysed the low flows of various duration periods for catchments from all over Slovakia and mapped their regional and seasonal distributions. Some interesting studies were published also by Fendeková and Némethy (1994) dealing with low flow analyses in the Starohorský River basin. The aim of this study is to test various clustering techniques for pooling the analysed catchments of Slovakia into pooling groups based on seasonality of low flows lower than Q Clustering Algorithms K-means [MacQueen] The algorithm is very simple. Denote D set of all objects i.e. D = x x... x }. Each { 1 2 n object x i has p features i.e. x i = ( xi1 xi2... xip ). Then k-means algorithm can be described as follows: 1. The user set number of clusters k. Denote these clusters X 1 X 2... X k. 2. The algorithm randomly initializes (by random seed) k cluster centers { µ 1 µ 2... µ k } as random points in p dimensional space. 3. Then it repeats these two steps until convergence criterion is satisfied (for example until clusters will change) - i { n} assign x i to cluster X j if j = arg min d( x µ ) l {12... k} where d(..) is some distance measure (mostly Euclidean) -find new cluster centers as x µ i i xi X l l = : X l where l { k} and. denotes cardinality of set. DBSCAN [Ester] Comparing to traditional methods DBSCAN has two advantages-it is able to reveal clusters of any shape and also able to identify outliers (kmeans and fuzzy approach search only for globular clusters). Similar methods were named as density based clustering according to technique which are they based on (in fact they seach space in order to identify areas with higher density of objects-clusters). The mostly used algorithm from all density based algorithms is DBSCAN-Density-Based Spatial Clustering of Applications with noise Ester(1996). We start describing the algorithm with some basic definitions. Definition 1: ε neighborhood of object x D is N ε ( x) y D : d( x y) ε where D is set of all objects (points in space) ε can take positive values and d (..) is some distance measure. Definition 2: We say that object x is directly density-reachable from object y with respect to some ε and N min if i l

172 170 FORUM STATISTICUM SLOVACUM 7/2011 where. is sign for cardinality of set. x N ε (y) and N ( y) N min ε Definition 3: Object x is density-reachable from object y if there exists a sequence of objects x 1 = x x 2... x i = y such that x k is directly density-reachable from x k + 1 for k = i 1 (also w.r.t. ε and N min ) Definition 4: 2 objects x and y are density-connected if there exists such object z that both are density-reachable from it (w.r.t. ε and N min ). Definition 5: We say that nonempty set of objects C D is a cluster (w.r.t. ε and N min ) if these two conditions hold if x C and y is density reachable from x than also y C. x y C holds that x and y are connected. According to previous definitions there are only three types of objects: Core points-all such points that have in their ε -neighborhood at least N min points; Border points-all such points that do not have in their ε -neighborhood at least points but they are close enough to some core point; Outliers-all other points. The only question is how to set two parameters of algorithm ε and N min. Parameter N min is minimal desired number of objects in each clusters mostly used is 4 (if we deal with large dataset then we can raise this number to some higher value). Before setting another parameter we define new function D k (x) = distance of the k th nearest neighbour for object x D When we use k = 4 and compute values for each object in dataset then we can plot this function. The only condition is to first sort obtained values in ascending or descending order. The resulting plot will be similar as the one in fig. 1. First part of plot are objects in clusters (solid curve in the left) since their distance to their fourth nearest neighbour is small. As can be seen there are also some objects (dots on the right) whose distance to their fourth nearest neighbour is very large-these are evidently outliers. Therefore ε is chosen as threshold in the plot of function D k (x) (in fig. 1. this threshold is app. 0.4) N min Fig. 1. Function D k (x)

173 FORUM STATISTICUM SLOVACUM 7/ Self organizing (Kohonen) maps Kohonen maps (2001) are used for projecting high dimensional space (mainly spaces with more than 3 dimensions) to two or three dimensional space that can be easily visualized. Every map consists of some number of neurons (in most cases neurons are represented by hexagons). The aim of algorithm is to project all objects to neurons under the condition that similar objects should be projected to similar neurons (this is called topology preserving). If we want to find clusters we have to project all objects into two-dimensional space and identify similar objects. The advantage of such approach is that we also identify outliers in data that do not belong to any cluster. Algorithm that produces such a network can be briefly described as follows: Suppose that we have set of n objects (called input vectors) described by p features. Denote M set of all neurons used in network (number of neurons is specified by statistician). Since neurons are organized in grid each neuron is represented by 2D coordinates in this grid. Denote grid coordinates of neuron i as r i. Then sequential training algorithm (there also exists batch training algorithm but we will describe only first one) works in the following way: 1. Each neuron in is represented by its weight vector (also called prototype vector or codebook vector) which is p-dimensional. At first weight vector of each neuron is randomly set. 2. One of n objects is randomly chosen and the nearest neuron to that one is found (using Euclidean distance). This neuron is called best matching unit (BMU) more precisely i * = arg min x w i M i = arg min i M where x = x x... x ) is randomly chosen object from dataset w = w w... w ) is ( 1 2 p p k = 1 ( x k w ik ) 2 i ( i1 i2 ip * weight vector of i th neuron and i is the closest neuron to object x w.r.t Euclidean distance. 3. In third step weight of each neuron is adjusted as follows w ( t + 1) = w ( t) + α ( t). h * ( t).( x( t) w ( )) i M i i t i i i where w i (t) is weight of th neuron in t-th step x (t) is randomly chosen input vector in t- th step α(t) is speed of learning (also learning rate) in t-th step (function known in advance) and h i * ( t) i is some measure of neighborhood (also known before the algorithm starts). When third step is done the algorithm goes to step 2 and randomly chooses another object from original dataset and finds its BMU and adjusts weights of all neurons. The algorithm repeats these steps so many times as determined in advance. After all BMU is found for every of n-samples in dataset. Finally each sample is projected to the BMU neuron (of course more than one sample can be assigned to one neuron and vice versa there may be neurons that no sample was projected to them). 3. Experiments and results The analysis in this study is based on the data from 217 gauging stations selected from the whole territory of Slovakia with catchments areas ranging from 4 to 500 km 2 and with observation periods longer than 20 years (fig. 2.). Number of days with low-flow discharge less than Q 95 was calculated in each basin and the relative frequency of low flows in each month during the year was estimated at all monitoring stations.

174 172 FORUM STATISTICUM SLOVACUM 7/2011 Fig. 2. Locations of selected catchment For data processing an open-source R [11] was used together with R packages cluster fpc FNN and Kohonen. K-means method belongs to the oldest but most widely used cluster algorithms. The application of the k-means method was analyzed by two clusters as the optimal solution (average silhouette coefficient was used to determine optimal number of clusters). The first cluster has 130 objects and covers a larger part of Slovakia while the second one has 87 objects that are situated in the northern part of Slovakia (see fig. 3. where results from k- means algorithm are displayed in the first two principal components). The results of clustering with DBSCAN were significantly different only one cluster was found (in fig. 4. the 4-th nearest function is displayed in order to identify optimal value for parameterε ) and some objects were identified as outliers (see fig. 5.). DBSCAN seems inappropriate for this data; because two clusters are slightly overlapping and there is no clear separator between them which would have significantly low density of points (therefore only one large cluster of objects has been found). Moreover DBSCAN cannot cluster data sets with large differences in densities since the N min ε combination cannot be chosen appropriately for all clusters. Fig. 3. Results of clustering based on k- means method Fig. 4. Identifying parameter ε from the 4-th nearest neighbour function In order to identify clusters using SOM algorithm we first used so-called U-matrix and identified 2 clusters. PCA projection using first two principal components with SOM results can be seen in fig. 6.

175 FORUM STATISTICUM SLOVACUM 7/ The smaller cluster contains 85catchment where high values of relative frequency of occurrence of low flows were calculated especially in January and February and in opposition very small values in May June July August and September. The bigger cluster consists of 132 objects where high values of relative frequency of occurrence of low flows were calculated especially in July August September and October and conversely very low values in December January March and April. Fig. 5. Results of clustering by DBSCAN Fig. 6. Results of clustering using SOM 4. Comparison of methods K-Means The main advantages of this algorithm are its simplicity and speed which allows it to run on large datasets. K-Means may produce tighter clusters than hierarchical clustering especially if the clusters are globular. An important question that needs to be answered before applying the k-means clustering algorithm is how many clusters are in the data. This is not known a priori and in fact there might be no definite or unique answer as to what value k should take. Determining the number of clusters is not trivial (we used average silhouette coefficient for determining true number of clusters). There are difficulties in comparing quality of the clusters produced and does not work well with non globular clusters. DBSCAN DBSCAN is robust enough to identify clusters in noisy data requires just two parameters and is mostly insensitive to the ordering of the points in the database. This algorithm is efficient even for large spatial databases discovers clusters of arbitrary shape and does not require to know the number of clusters in the data a priori as opposed to k-means. DBSCAN cannot cluster well datasets with large differences in densities since the N min ε combination cannot be chosen appropriately for all clusters and therefore for this kind of hydrological data is unacceptable. SOM One of the advantages of SOM is to cluster data without specifying the number of clusters in advance. The SOM algorithm is very efficient in handling large datasets robust

176 174 FORUM STATISTICUM SLOVACUM 7/2011 even when the data set is noisy and topology preserving feature superior to K-means methods. One major problem with SOM is getting the right data. Unfortunately researchers need a value for each dimension of each member of samples in order to generate a map. Sometimes this is not possible and often it is very difficult to acquire all of this data so this is a limiting feature to the use of SOM often referred to as missing data. Another problem is that every SOM is different and finds different similarities among the sample vectors. SOM organize sample data so that in the final product the samples are usually surrounded by similar samples however similar samples are not always near each other. The superior accuracy and robustness of the neural network can improve the effectiveness of decisions and research based on clustering messy empirical data. 5. Conclusion In this article three of clustering methods applied to identify the homogeneous areas are compared. The analysis was carried out within the framework of the sample of 217 small and medium basins from the whole territory of Slovakia. As a pooling variable the relative frequency of occurrence of low flows lower then Q95 was used. While K-means and SOM give very similar results DBSCAN has proved inappropriate for these data because this method cannot cluster data with overlapping clusters. Among all employed clustering methods the results show that the SOM can determine the cluster membership more accurately than other methods. Procedures as well as the results indicate that the SOM is more quick and efficient than other methods. Acknowledgement This work was supported by the Slovak Research and Development Agency under the contract No. APVV and the Slovak VEGA Grant Agency under the project No. 1/0103/10. References: [1]AschwandenH.-KanC Le d ebit d etiage Q347 Etat de la question. Communications hydrologiques 27. Service hydrologique et geologique national: Berne [2] Burn D. H Cluster analysis as applied to regional flood frequency. Journal of Water Resources Planning and Management 115 pp [3] Demeterová B Analysis of hydrological drought in Slovakia. PhD. Thesis STU Bratislava 103 pp. (in Slovak) [4] Ester M. - Kriegel H. - Sander J. - Xu X A density based algorithm for discovering clusters in large spatial databases with noise Proceedings of 2nd International Conference of Knowledge Discovery and Data Mining Portland OR pp [5] Fendeková M.-Némethy P Low flows of Starohorský potok brook and their affecting factors. IAHS publ. Vol. 221 Wallingford UK [6] Gustard A.- Bullock A.- Dixon J.M Low flow estimation in the United Kingdom. Report No. 108 Institute of Hydrology: Wallingford [7] Chen L.- Lin G. F Identification of homogeneous regions for regional frequency analysis using the self-organizing map.journal of Hydrology Volume 324 Issue 1-4 pp.1-9 [8] Kohonen T Self-Organizing Maps. Third extended edition. Springer. [9] Laaha G. - Bloschl G A comparison of low flow regionalisation methods catchment grouping. Journal of Hydrology Volume 323 Issues

177 FORUM STATISTICUM SLOVACUM 7/ [10] Laaha G. P Process-based regionalisation of low flows. Wiener Mitteilungen Wasser Abwasser Gewässer. [11] Lin G. F.- Chen L.H A hybrid neural network model for typhoon/rainfall forecasting. Journal of Hydrology 375 pp [12] MacQueen J. B Some Methods for classification and Analysis of Multivariate Observations Proceedings of 5th Berkeley Symposium on Mathematical Statistics and Probability Berkeley University of California Press 1 pp [13] Majerčáková O.- Lešková D.- Šedík P Selected characteristics of low flows of Slovak rivers. J. Hydrol. Hydromech [14] Minns A. W.- Hall M.J Artificial neural networks as rainfall-runoff models. Hydrological Sciences Journal Volume 3 Issue 41 pp [15] R Development Core Team R: A language and environment for statistical computing. R Foundation for Statistical Computing Vienna Austria. ISBN URL [16] Schreiber P.- Demuth S Regionalisation of low flows in southwest Germany. Hydrol. Sci. J [17] Young A.R- Round C.E- Gustard A. 2000: Spatial and temporal variations in the occurrence of low flow events in the UK. Hydrology and Earth System Sciences 4 pp Addreses: RNDR. Elena Pastuchová PhD. ÚIM Ilkovičova Bratislava elena.pastuchova@stuba.sk Mgr. Miroslav Sabo KMaDG SvF STU Radlinského Bratislava miro165sabo@googl .com doc. Ing. Silvia Kohnová PhD. KVHK SvF STU Radlinského Bratislava silvia.kohnova@stuba.sk

178 176 FORUM STATISTICUM SLOVACUM 7/2011 Priestorová autokorelácia národností na Slovensku v roku 2001 Spatial autocorrelation of nationalities in Slovakia in 2001 Ivica Paulovičová Abstract: This article aims to study spatial autocorrelation of major nationalities in Slovak Republic in In the beginning there is short introduction to the study of spatial autocorrelation. Then the article continues with quick view to the assumptions. In the end there is presented the analysis its results and short conclusion. Key words: spatial autocorrelation nationality Moran s I G-statistics Kľúčové slová: priestorová autokorelácia národnosť Moranovo I G-štatistika JEL classification: C21 1. Úvod Priestorová štatistika ponúka veľa možností pre demografický výskum medzi nimi aj priestorovú autokoreláciu. V tomto článku bude sledovaná potenciálna priestorová autokorelácia národnostného zloženia Slovenka v roku 2001 z pohľadu vybraných náboženstiev. Územnou jednotkou bude najmenšia sídelná jednotka na Slovensku ZSJ (základná sídelná jednotka). Zdrojové dáta sú zo sčítania obyvateľov domov a bytov na Slovensku z roku Priestorová autokorelácia Pojem autokorelácie úzko súvisí s Toblerovým prvým zákonom geografie. Priestorová autokorelácia sa dá vysvetliť ako závislosť premennej samej zo sebou v priestore a môže byť pozitívna a negatívna. Pozitívna autokorelácia indikuje zhlukovanie podobných hodnôt (vysoké s vysokými nízke s nízkymi). Naopak negatívna priestorová autokorelácia indikuje rozptýlenie hodnôt. [1] Priestorová autokorelácia sa dá študovať z globálneho alebo lokálneho hľadiska. Globálne sa skúma územie ako celok ako ukazovateľ sa používa index Moranovo I. [1] Spomínaný index je primárne určený na skúmanie areálových jednotiek ale dá sa upraviť aj pre ostatné typy priestorových jednotiek. V prípade kladnej hodnoty ukazovateľa je sledovaný jav v území pozitívne autokorelovaný. V prípade zápornej hodnoty sa jedná o negatívnu autokoreláciu a v prípade hodnoty blízkej nule jav na sledovanom území nie je autokorelovaný. Vzorec je vlastne úpravou Gearyho indexu: w c i I M = (1) 2 s w kde w ij sú váhy pre dvojicu jednotiek ij (vysvetlené nižšie); počítajú podľa nasledujúcich vzorcov: c = z z * z z i j j ( ) ( ) ij ij ij c ij a 2 s (rozptyl) sa ij i j (2) z sú hodnoty sledovaného javu v skúmanom území i alebo j; z je priemerná kde z i a j hodnota tohto javu na celom území; ( z z) i i s = n kde n je početnosť súboru. [4] a [2] 2 (3)

179 FORUM STATISTICUM SLOVACUM 7/ Lokálne (LISA local indicators of spatial association) sa skúma okolie každej jednotky zvlášť pomocou lokálneho Moranovho I G-štatistiky G*-štatistiky alebo K- štatistiky. Výsledok lokálneho Moranovho I sa dá zobraziť aj graficky kde na x-ovú os sa nanášajú hodnoty jednotiek a na y-ovú priemer okolia danej jednotky. Výstupom z takéhoto skúmania môže byť aj mapa zhlukov v štatisticky významných oblastiach ako aj samotná mapa miery významnosti ktoré môžu byť použité pre zisťovanie priestorovej homogenity identifikovanie priestorového dosahu autokorelácie dekompozíciu celkovej miery autokorelácie a pod. [1] V článku bude požitá G-štatistika: n ij j= 1` j i w ( d) * x Gi ( d) = (4) 2 n n 2 ( n 1) w ( ) ( ) ij d wij d j= 1` j i 1` ( ) j= j i S i N 2 kde d je kritická vzdialenosť; n početnosť súboru; x j je hodnota sledovaného javu v skúmanom území j; w ij (d) sú váhy pre dvojicu jednotiek ij a vzdialenosť d; N je počet j x n i ij j= 1` j i w ( d) jednotiek skúmaného okolia; S i ako rozptyl okolia jednotky i sa vypočíta [2] a [6]: a x i sa vypočíta podľa vzorca: S x 2 j j` j i 2 ( i) = xi N 1 j` j i x j xi = N 1 (6) Do každej priestorovej analýzy vstupujú takzvané priestorové váhy. Dajú sa určiť tromi spôsobmi podľa počtu spoločných bodov (Rook-based Queen-based a Bishop-based). Váhy môžu byť rôznych stupňov pričom 1. stupeň predstavujú priami susedia. Najjednoduchšou je matica susedstiev prvého stupňa ktorá bola použitá aj v tomto článku. [3] Pri analýze priestorových javov sa vyskytuje problém modifikovateľnej priestorovej jednotky (MAUP modiffiable area unit problem) ktorý súvisí s mierkou a tvarom jednotiek a agregátov. Skúmaný jav sa môže viazať k istej mierke tým pádom v inej nemusí byť detekovaný. Tak isto jednotky môžu byť rôznych úrovní a ich tvar nemusí zodpovedať priestorovému reálnemu rozloženiu sledovaného javu. [2] Možnosť skúmať priestorovú autokoreláciu poskytujú viaceré programy buď formou modulou (ArcGIS Idrisi) alebo ako hlavné zameranie (GeoDa STIS). [1] V tomto príspevku bol využitý modul programu ArcGIS na globálne štúdium autokorelácie a program GeoDa na štúdium autokorelácie z lokálneho hľadiska. 3. Historický vývoj národnostného zloženia Slovenska Súčasné národnostné zloženie je výsledkom dlhodobého vývoja mechanického a prirodzeného vývoja na každom území. Závisí od rôznych nie len historickogeografických a demografických faktorov ako sú spoločenské subjektívne a štatistické. Z tohto dôvodu predpokladám že v rámci výskytu jednotlivých národností bude silná závislosť. [5] Medzi historické faktory sa zaraďujú napríklad vládou podporované presuny obyvateľstva vznik štátov a zmeny hraníc vojnové udalosti a nariadené presuny obyvateľstva. [5] Zároveň tu pôsobia aj geografické vplyvy napríklad v hraničných oblastiach kde sa prirodzene vyskytujú susediace národnosti (maďarské obyvateľstvo pozdĺž (5)

180 178 FORUM STATISTICUM SLOVACUM 7/2011 celej južnej hranice ukrajinské a rusínske obyvateľstvo na severovýchode obyvatelia poľskej národnosti na severe). 4. Priestorová autokorelácia národností v roku 2001 Pri všetkých výpočtoch bola použitá jednoduchá binárna matica váh určená na základe susedstiev typu Queen-based 1. stupňa štandardizovaná podľa počtu susedov. Hladina významnosti bola nastavená na α = 05%. Územie celého Slovenska bolo globálne skúmané pomocou indexu Moranovo I v module programu ArcGIS. Výsledok pre prvé 4 najpočetnejšie národnosti je uvedený v tabuľke 1 aj s testom nulovej hypotézy. Na základe vypočítaných hodnôt môžeme tvrdiť že všetky skúmané národnosti sú na území Slovenska významne pozitívne autokorelované. Tabuľka 1: Priestorová autokorelácia vybraných národností na Slovensku v roku 2001 národnosť Moran's I Z-score [s 2 ] slovenská maďarská rómska rusínska Moranov diagram pre obyvateľstvo slovenskej národnosti vypočítaný v programe GeoDa je na obrázku 1. Samotná hodnota indexu je uvedená navrchu a graf indikuje pozitívnu autokoreláciu sledovanej národnosti čo dokazuje aj samotný graf. Obrázok 1: Moranov diagram obyvateľstva slovenskej národnosti za ZSJ na Slovensku v roku 2001 Priestorová autokorelácia z lokálneho hľadiska počítaná v programe GeoDa na základe G-štatistiky je za jednotlivé národnosti zobrazená na nasledujúcich obrázkoch 2 5. Hodnoty sú počítané pomocou G-štatistiky. Takýto výstup poskytuje oveľa podrobnejšie informácie ako tabuľka 1. Mierka všetkých máp je 1 : a zdroj je sčítanie obyvateľov domov a bytov na Slovensku z roku 2001.

181 FORUM STATISTICUM SLOVACUM 7/ Obrázok 2: Priestorová autokorelácia obyvateľov slovenskej národnosti Obrázok 3: Priestorová autokorelácia obyvateľov maďarskej národnosti Obrázok 4: Priestorová autokorelácia obyvateľov rómskej národnosti

182 180 FORUM STATISTICUM SLOVACUM 7/2011 Obrázok 5: Priestorová autokorelácia obyvateľov rusínskej národnosti Pri slovenskej národnosti sú významné hlavne zhluky nízkych hodnôt v hraničných oblastiach Slovenska. Väčšia časť nie je významná z pohľadu priestorovej autokorelácie z dôvodu relatívne malého celkového rozptylu hodnôt. Obyvateľstvo maďarskej národnosti vykazuje dva typy významných zhlukov. V južnej časti krajiny sú to 3 výrazne pozitívne autokorelované zhluky vysokých hodnôt. Nad nimi sa nachádza pás nevýznamnej autokorelácie ktorý sa približne kryje s hranicou medzi slovenským a maďarským etnikom na Slovensku. V prípade rómskej národnosti sa pozitívne zhluky vysokých hodnôt taktiež prekrývajú s predpokladanými oblasťami až na pár ZSJ na juhozápade. Priestorová autokorelácia rusínskeho obyvateľstvo vyšla tak isto podľa predpokladov. 5. Záver Pri štúdií priestorovej autokorelácie národností Slovenska sa potvrdila ich silná pozitívna autokorelácia vychádzajúca zo spomínaných faktorov a predpokladov. Zhluky pozitívnej priestorovej autokorelácie vysokých hodnôt skúmaných národností sa približne kryjú s mapami ich výskytu na Slovensku. Zhluky jednotiek s nízkymi hodnotami indikujú oblasti s nízkym zastúpením sledovanej národnosti. 6. Literatúra [1] CHI G. ZHU J Spatial Regression Models for Demographic Analysis. In: Population Research and Policy Review č. 1 roč s [2] KEMPF-LEONARD K Encyclopedia of Social Measurement. London: Academic Press s. ISBN [3] KUSENDOVÁ D. SOLČIANSKA J Testovanie priestorovej autokorelácie nezamestnanosti absolventov vysokých škôl okresov Slovenska. Ostrava. VŠB-TUO ISBN X. [4] LO C. P. YEUNG A. K. W Concepts and Techniques in Geographical Information Systems. Upper Saddle River: Pearson Education s. ISBN X. [5] MLÁDEK J ET AL Demografická analýza Slovenska. Bratislava: Univerzita Komenského v Bratislave s. ISBN [6] STEHLÍKOVÁ B Priestorová štatistika. Nitra. Slovenská poľnohospodárska univerzita s. ISBN Adresa autora: Ivica Paulovičová Mgr. Prírodovedcká fakulta UK Bratislava Mlynská dolina Bratislava paulovicova@fns.uniba.sk

183 FORUM STATISTICUM SLOVACUM 7/ Srovnání dlouhodobé nezaměstnanosti v České republice a Slovenské republice A comparison of long-term unemployment in the Czech Republic and Slovak Republic Tomáš Pavelka Petr Makovský Abstract: Labour markets in the Czech Republic and the Slovak Republic for a long time have showed a high incidence of long-term unemployment the unemployment that lasts longer than one year. The paper includes a comparison of long-term unemployment in the Czech and Slovak Republic. The attention is paid to the connection of development of the gross domestic product unemployment and long-term unemployment. Apart from the overall analysis of long-term unemployment paper deals with the incidence of long-term unemployment by the gender and by major age groups. Key words: economic recession labour market long-term unemployment rate of unemployment Klíčové slova: ekonomická recese trh práce dlouhodobá nezaměstnanost míra nezaměstnanosti JEL classifications: J64 J65 J68 1. Úvod Evropský trh práce je často charakterizován jako málo flexibilní. Jedním z důkazů tohoto tvrzení je i relativně vysoký výskyt dlouhodobé nezaměstnanosti neboli nezaměstnanosti která trvá déle jak jeden rok. Česká republika se dlouhodobě vyznačuje spíše nižší celkovou mírou nezaměstnanosti. Slovenská republika naopak patří již delší dobu mezi členské státy které vykazují vysokou celkovou míru nezaměstnanosti. I přes rozdíly ve výši celkové míry nezaměstnanosti oba státy se potýkají s jedním z nejvyšších podílů dlouhodobé nezaměstnanosti na celkové nezaměstnanosti. Nezaměstnanost přináší značné ekonomické i mimoekonomické ztráty jednotlivcům ale také celé společnosti. Negativní dopady nezaměstnanosti se prohlubují zejména s délkou trvání nezaměstnanosti. Dlouhodobé nezaměstnanosti je ve světové odborné literatuře věnována značná pozornost. Analytické publikace zveřejňuje zejména Organizace pro hospodářskou spolupráci a rozvoj (například: OECD 1992; OECD 2004; OECD 2011). Detailnější popis dlouhodobé nezaměstnanosti před rokem 1998 včetně některých jejich příčin lze nalézt v článku Machin a Manning (Machin Manning 1998). Nezaměstnanost a zejména dlouhodobá nezaměstnanost však může způsobovat vyšší nezaměstnanost i v následujícím období. Tato skutečnost je vysvětlována jevem hystereze kterou v souvislosti s nezaměstnanosti v Evropě zdůraznili ve svém článku Blanchard a Summers (Blanchard Summers 1986). Vývoj nezaměstnanosti obecně a i vývoj dlouhodobé nezaměstnanosti je propojen s celkovým vývojem ekonomiky. Z tohoto důvodu je v příspěvku nejprve stručně pojednáno o vývoji hrubého domácího produktu České republiky a Slovenské republiky. Poté je pozornost věnována celkové míře nezaměstnanosti. V hlavní části se příspěvek věnuje vývoji dlouhodobé nezaměstnanosti v obou státech. Dlouhodobá nezaměstnanost je porovnávána podle podílu dlouhodobé nezaměstnanosti na celkové míře nezaměstnanosti a to v členění

184 182 FORUM STATISTICUM SLOVACUM 7/2011 podle pohlaví a podle věkových skupin. Ve všech případech jsou pro srovnání uváděna i data za celou Evropskou unii. Veškerá data v příspěvku o nezaměstnanosti a dlouhodobé nezaměstnanosti jsou čerpány z Evropského statistického úřadu (Eurostatu) a to z části Výběrové šetření pracovních sil. Pokud není uvedeno jinak data o nezaměstnanosti i o dlouhodobé nezaměstnanosti jsou pro věkové vymezení let. Data o vývoji reálného hrubého domácího produktu pocházejí také z databáze Evropského statistického úřadu. Příspěvek vznikl v rámci grantu Interní grantové agentury Vysoké školy ekonomické v Praze (IG305071) s názvem: Dlouhodobá nezaměstnanost v České republice. 2. Vývoj hrubého domácího produktu a míry nezaměstnanosti Tabulka 1 zachycuje údaje o vývoji reálného hrubého domácího produktu v Evropské unii jako celku v České republice a Slovenské republice. Jak je patrné z tabulky Česká i Slovenská republika za celé sledované období měly rychlejší růst reálného hrubého domácího produktu než byl růst Evropské unie jako celku. Jedinou výjimkou byl rok 2009 kdy v obou státech klesl reálný hrubý domácí produkt více než v průměru Evropská unie. Od roku 2001 do roku 2008 vykazovala Slovenská republika rychlejší tempo růstu reálného hrubého domácího produktu než Česká republika. V roce 2008 respektive v druhé polovině roku se již začaly projevovat první příznaky světové ekonomické recese. Tempo růstu reálného hrubého domácího produktu zpomalilo v České republice o 26 p.b. a v Slovenské republice dokonce o 46 p.b. Plně dopadla ekonomická recese na českou a slovenskou ekonomiku v průběhu roku Česká ekonomika se podle nejnovějších údajů propadla o 47 % a slovenská o 49 %. V minulém roce nastalo v obou zemích jisté oživení. Česká ekonomika vzrostla o 27 % a slovenská o 42 %. Podle posledních údajů se však zdá že toto oživení bylo pouze krátkodobé. V letošním roce dochází ke zpomalení tempa růstu reálného hrubého domácího produktu. Pro příští rok se již objevují názory o návratu recese. Tabulka 1: Meziroční změny reálného hrubého domácího produktu Evropská unie Česká republika Slovenská republika Pramen: Eurostat ( ) Vývoj hrubého domácího produktu má samozřejmě svůj odraz také na trhu práce. Tabulka 2 obsahuje údaje o míře nezaměstnanosti v České republice Slovenské republice a v Evropské unii jako celku. Jak již bylo uvedeno Česká republika vykazovala po celé sledované období nižší míru nezaměstnanosti než byl průměr Evropské unie. Naopak Slovenská republika měla vždy vyšší míru nezaměstnanosti než v průměru celá Evropská unie. V České republice míra nezaměstnanosti postupně klesala od roku Rychlejší pokles nastal zejména v souvislosti s vysokým růstem reálného hrubého domácího produktu tedy v letech V roce 2008 se sice již tempo růstu reálného produktu snížilo ale jak je všeobecně známo míra nezaměstnanosti reaguje na vývoj produkce s určitým časovým zpožděním. Ve spojitosti s poklesem reálného produktu v roce 2009 míra nezaměstnanosti v České republice v posledních dvou letech opětovně narůstá. Na Slovensku byla co se týče trendu vývoje situace obdobná jako v České republice. Slovensko však v roce 2000 vykazovalo míru nezaměstnanosti o více jak 10 p.b. vyšší než Česká republika. V roce 2001 se navíc míra nezaměstnanosti zvýšila a to i přes relativně

185 FORUM STATISTICUM SLOVACUM 7/ vysoký růst produkce v tomto roce. Nejnižší míru nezaměstnanosti zaznamenalo Slovensko také v roce 2008 a to 95 %. To bylo o 51 p.b. více než v České republice. Srovnáme-li však míru nezaměstnanosti mezi roky 2000 a 2008 zjistíme že na Slovensku klesla o úctyhodných 93 p.b. V této souvislosti je nutno připomenout že se jedná o míru nezaměstnanosti zjišťovanou Výběrovým šetřením pracovních sil a ne o registrovanou míru nezaměstnanosti která může být ovlivněna např. zpřísněním podmínek pro registraci na úřadech práce. Jak je však patrné z Tabulky 2 v následujících dvou letech již míra nezaměstnanosti na Slovensku opětovně roste a v roce 2010 dosáhla výše 144 %. Tabulka 2: Míra nezaměstnanosti Evropská unie Česká republika Slovenská republika Pramen: Eurostat ( ) 3. Výskyt dlouhodobé nezaměstnanosti Na grafu 1 jsou zachyceny procentní podíly dlouhodobé nezaměstnanosti na celkové nezaměstnanosti v Evropské unii jako celku v České republice a Slovenské republice v období Graf 1: Výskyt dlouhodobé nezaměstnanosti Pramen: Eurostat ( ) Z grafu jsou evidentní některé skutečnosti. Slovenská republika vykazovala po celé sledované období vyšší procentní podíl dlouhodobě nezaměstnaných na celkové nezaměstnanosti než tomu bylo v případě České republiky a i v průměru v celé Evropské unii. Pokud bychom porovnali tento údaj u všech členských států Evropské unie zjistili bychom že právě Slovensko vykazovalo v tomto ukazateli nejhorší výsledky. V roce 2000 bylo na Slovensku ze sta nezaměstnaných osob více jak 54 osob nezaměstnaných déle než jeden rok zatímco v České republice to bylo 50 osob a v Evropské unii v průměru o něco více než 45 osob. V následujících letech se toto číslo v případě Slovenska postupně zvyšovalo až do roku 2006 kdy ze sta nezaměstnaných bylo

186 184 FORUM STATISTICUM SLOVACUM 7/2011 nezaměstnáno déle jak jeden rok více jak 76 osob. Nárůst podílu dlouhodobě nezaměstnaných byl spojen s poklesem celkové míry nezaměstnanosti. Z tohoto vývoje je patrné že slovenský trh práce nebyl schopen absorbovat dlouhodobě nezaměstnané. Je možné že se zde projevoval efekt hystereze na trhu práce který znamená že podnikatelé nechtějí přijímat dlouhodobě nezaměstnané neboť o nich předpokládají že již ztratili své pracovní návyky a svou kvalifikaci. Z pohledu nezaměstnaných lze hysterezi na trhu práce vysvětlit tím že si již nezaměstnaní zvykli na život bez práce na dávkách a nesnaží se najít si své nové místo. V České republice procentní podíl dlouhodobě nezaměstnaných na celkovém počtu nezaměstnanosti kolísal až do roku 2008 kolem 50 %. Výrazné snížení výskytu dlouhodobě nezaměstnaných nastalo v roce V České republice klesl podíl dlouhodobě nezaměstnaných na celkovém počtu nezaměstnaných na 30 % (meziročně pokles o 192 p.b.). Ve Slovenské republice dosáhl v roce 2009 tento podíl 54 % (meziročně pokles o 156 p. b.) a v Evropské unii jako celku 332 % (meziročně pokles o 38 %). V roce 2009 se procentní podíl dlouhodobě nezaměstnaných na celkovém počtu nezaměstnaných v České republice poprvé snížil pod úroveň průměru Evropské unie. Toto zlepšení však nelze v žádném případě považovat za úspěch politiky zaměstnanosti jak se v některých případech uvádělo. Vysvětlení tohoto pozitivního vývoje je mnohem prostší. Rok 2009 byl rokem propadu hrubého domácího produktu a nárůstu celkové nezaměstnanosti. Mezi nezaměstnanými začal výrazně stoupat počet krátkodobě nezaměstnaných kteří v tomto a předcházejícím roce přicházeli o svá místa. Toto vysvětlení jen dosvědčuje fakt že v roce následujícím tedy v roce 2010 se již podíl dlouhodobě nezaměstnaných na celkovém počtu nezaměstnaných začal opětovně zvyšovat. Nezaměstnaní kteří se stali nezaměstnanými v roce 2009 nenašli nová místa a přesunuli se tak do kategorie dlouhodobě nezaměstnaných. Tabulka 3: Výskyt dlouhodobé míry nezaměstnanosti podle pohlaví Evropská unie - muži Evropská unie - ženy Česká republika - muži Česká republika - ženy Slovenská republika - muži Slovenská republika -ženy Pramen: Eurostat ( ) Tabulka 3 obsahuje data o procentním podílu dlouhodobě nezaměstnaných na celkovém počtu nezaměstnaných členěných podle pohlaví. Z dat je patrné že ve většině let přesahoval podíl dlouhodobě nezaměstnaných žen na celkovém počtu nezaměstnaných žen stejný ukazatel u mužů. Výjimku tvoří pouze některé roky. Tabulka 4 obsahuje data o procentním podílu dlouhodobě nezaměstnaných na celkovém počtu nezaměstnaných v členění podle věkových skupin. Některé věkové skupiny jsou dlouhodobou nezaměstnaností postiženy více některé méně. V tabulce jsou použita data pro 3 věkové skupiny. První věkovou skupinu tvoří mladí lidé ve věku let. Vysoká míra výskytu dlouhodobé nezaměstnanosti v této věkové skupině představuje značný problém neboť tito mladí nezaměstnaní často nikdy nepracovali. Neměli šanci si tak vytvořit pracovní návyky a někteří z nich si dokonce myslí že nepracovat je normální. Někteří z nich dosáhli vyšších stupňů vzdělání které byly spojeny s vysokými náklady pro společnost. Tito mladí nezaměstnaní jsou často frustrovaní svou situací a existuje zde riziko jejich radikalizace. Druhou věkovou skupinou jsou osoby ve věku let tedy osoby v hlavním pracovním věku. A poslední skupinou jsou starší osoby ve věku let. Tito lidé se blíží konci svého

187 FORUM STATISTICUM SLOVACUM 7/ produktivního věku. V případě jejich dlouhodobé nezaměstnanosti existuje riziko sociálního vyčlenění které je často spojeno s rizikem chudoby. Za celé sledované období vykazují nejnižší výskyt dlouhodobé nezaměstnanosti mladé osoby ve věku let. V Evropské unii jako celku činil podíl dlouhodobě nezaměstnaných na celkovém počtu nezaměstnaných v případě mladých osob v průměru cca 27 % v České republice téměř 34 % a na Slovensku 53 %. Prostřední hodnoty lze pozorovat u věkové skupiny let. V Evropské unii jako celku činil podíl dlouhodobě nezaměstnaných na celkovém počtu nezaměstnaných u této skupiny osob v průměru cca 47 % v České republice téměř 52 % a na Slovensku 69 %. Nejvyšší výskyt dlouhodobé nezaměstnanosti lze tedy pozorovat u starších osob. V Evropské unii jako celku činil podíl dlouhodobě nezaměstnaných na celkovém počtu nezaměstnaných u této skupiny osob v průměru cca 57 % v České republice téměř 55 % a na Slovensku 72 %. Tabulka 4: Výskyt dlouhodobé míry nezaměstnanosti podle věkových skupin věk Evropská unie Česká republika Slovenská republika věk Evropská unie Česká republika Slovenská republika věk Evropská unie Česká republika Slovenská republika Pramen: Eurostat ( ) 4. Závěr Existence dlouhodobé nezaměstnanosti je závažným problémem který způsobuje celé společnosti značné ekonomické i mimoekonomické ztráty. Vývoj míry dlouhodobé nezaměstnanosti v podstatě kopíruje s určitým časovým zpožděním vývoj celkové míry nezaměstnanosti. Před ekonomickou recesí dosahoval podíl dlouhodobě nezaměstnaných na celkovém počtu nezaměstnaných vysokých hodnot. Z důvodu rychlého nárůstu počtu nezaměstnaných v období ekonomické recese se podíl dlouhodobě nezaměstnaných na celkovém počtu nezaměstnaných dočasně snížil. Vyšší podíl dlouhodobě nezaměstnaných zpravidla najdeme u žen a u starších pracovníků. Česká republika i Slovenská republika vykazuje v porovnání s průměrem Evropské unie vyšší výskyt dlouhodobé nezaměstnanosti. Právě z důvodu značných ekonomických a mimoekonomických nákladů které způsobuje dlouhodobá nezaměstnanost je třeba aby se politika zaměstnanosti zaměřila právě na tuto skupinu osob. Neexistuje pouze jedno opatření které by bylo účinné vždy a všude. Jistě je třeba přijmout opatření v závislosti na aktuální situaci na trhu práce neboli podle toho zda na trhu práce převyšuje poptávka či nabídka. V případě převisu poptávky je třeba zvýšit motivaci dlouhodobě nezaměstnaných osob k nalezení práce. Svou roli v tomto případě

188 186 FORUM STATISTICUM SLOVACUM 7/2011 samozřejmě hraje i systém rekvalifikací. V případě převisu nabídky je třeba aktivovat možnosti zvýšení poptávky po práci. V obou případech se však nesmí zapomínat na skutečnost že čím déle nezaměstnanost trvá tím silnější jsou projevy hystereze na trhu práce. Literatura [1] BLANCHARD O. SUMMERS L Hysteresis and Unemployment Problem. Cambridge: NBER Working paper No [2] EUROSTAT. Employment and unemployment database. [accessed ]. ase [3]MACHIN S. MANNING A The Causes and Consequences of Long-Term Unemployment in Europe. Centre for Economic Performance London School of Economics and Political Science [5] OECD Employment Protection Regulation and Labour Market Performance. Chapter 2 OECD Employment Outlook [6] OECD Persistence of high unemployment: What risks? What Policies? Chapter 5 Economic Outlook Preliminary Version [7] OECD The long-term unemployed and measures to assist them. Labour market and social policy occasional papers No 7 Paris: OECD [8] PAVELKA T Long term unemployment in the Czech Republic in comparison with the other countries of the European Union. [CD-ROM] Prague: International Days of Statistics and Economics 2011 Conference proceedings Adresa autorů: Ing. Tomáš Pavelka Ph.D. Ing. Petr Makovský Vysoká škola ekonomická v Praze Vysoká škola ekonomická v Praze nám. W. Churchilla 4 Nám. W. Churchilla Praha Praha 3 pavelkat@vse.cz petr.makovsky@vse.cz

189 FORUM STATISTICUM SLOVACUM 7/ Metody řešení problematiky neúplných dat Methods for solving of incomplete data David Pejčoch Abstract: It is possible to consider the level of data quality as a rate of fullfilment of expected data characteristics e.g. accuracy credibility completness uniqueness etc. The aim of this work is to focus on completness with respect to statistical analysis and knowledge discovery in databases. The main goal is to map possible methods which can be used to eliminate negative impacts of missing data to provide brief comparation and to find out topics for possible future research. Key words: data quality missing values incomplete records completness statistical methods machine learning methods Klíčová slova: datová kvalita chybějící hodnoty nekompletní záznamy úplnost statistické metody metody strojového učení. JEL classification: C11 C38 C45 C53 1. Úvod S enormním nárůstem dat zpracovávaných ve firmách i státním sektoru v posledních třech desetiletích se stala populární problematika řízení kvality těchto dat. Pokud bychom si položili otázku co přesně se v tomto případě rozumí pod abstraktním pojmem kvalita dospěli bychom k závěru že se jedná o míru naplnění určitých vlastností které od dat očekáváme. Jako příklad těchto vlastností lze uvést správnost dat (jak po syntaktické tak po semantické stránce) důvěryhodnost unikátnost nebo též jejich úplnost kterou lze zjednodušeně vyjádřit jako míru vyplněnosti datových atributů. Má práce se soustřeďuje právě na tuto poslední uvedenou vlastnost dat. Jejím cílem je především zmapování přístupů pro řešení problému neúplných dat které jsou popsány v odborné literatuře a byly uplatněny při praktickém řešení reálných problémů. Ve své práci abstrahuji od metod ponechávajících status quo (Stepwise Pairwise kódování chybějících hodnost) a doplňování pomocí SQL join / lookup. V textu používám pojem imputace kterým rozumím nahrazování chybějících hodnot jedním nebo více kandidáty. 2. Metody imputace nezaložené na modelu Do této skupiny metod patří metody doplňující jednu konkrétní hodnotu pro každou chybějící anebo pro všechny chybějící v rámci jedné proměnné. Jako příklad tohoto typu metod lze uvést náhradu chybějících hodnot nepodmíněným průměrem hodnot proměnné (SMI Sample Mean Imputation) (viz např. [11] [2] [6] [4]) resp. vhodnějším mediánem v případě kategoriálních proměnných doplnění modální kategorií (viz např. [4]). Další možnost představuje doplnění středem rozpětí (midrange) spočteným jako aritmetický průměr maximální a minimální hodnoty dané proměnné. Nevýhodou všech dosud zmíněných metod je doplnění jediné hodnoty jako substitutu všech chybějících hodnot v rámci dané proměnné. Tím dochází k deformaci odhadu parametrů rozdělení. Lepším způsobem imputace je použití podmíněného průměru v odborné literatuře též uváděným pod názvem Buckova metoda (viz např. [10]). Spočívá v doplnění více průměrných hodnot podmíněných hodnotami ostatních proměnných nicméně i tak podhodnocuje variabilitu doplňované proměnné. 3. Metody imputace založené na implicitním modelu Poměrně známou metodou z této oblasti je hot-deck imputace (HDSI Hot Deck Single Imputation) uvedená např. v [11] [1] [6] založená na doplnění shodné hodnoty jaká se

190 188 FORUM STATISTICUM SLOVACUM 7/2011 vyskytuje u podobných reprezentantů. Záznamy jsou nejprve rozděleny do jednotlivých tříd s využitím technik jako je např. shlukování podle nejbližšího souseda. Chybějící hodnota je poté doplněna na základě příslušnosti pozorování k dané třídě. Výhodou této metody je to že k odhadu nepotřebuje žádné složité předpoklady. Je též oceňována pro svou jednoduchost a tím i malé nároky na strojový čas. Na druhou stranu její aplikace umožňuje značnou míru subjektivity při určování podobnosti mezi záznamy. Podobným způsobem jako u metody HDSI je postupováno u metody cold-deck (CDSI Cold Deck Single Imputation) s tím rozdílem že v tomto případě probíhá výběr kandidátů z jiného datového zdroje než toho obsahujícího chybějící pozorování (viz např. [11] [1] [4]). V rámci přístupu hot-deck byla zmíněna jako jedna z možností hledání podobnosti mezi záznamy metoda nejbližšího souseda. Její přímou aplikaci na doplňování chybějícího pozorování (k-nnsi k-nearest Neighbour Single Imputation) popisuje [5] a zmiňuje ji též např. [1] [4] nebo [15]. Algoritmus spočívá v hledání pozorování nejbližšího tomu s chybějící hodnotou. Při takovém postupu však dochází k velkému množství operací porovnávání což vede ke značné náročnosti metody na strojový čas. [2] popisuje přístup nazvaný DCI (Dynamic Clustering Imputation) založený na fuzzy shlukové analýze. Shluky jsou deterministicky vytvářeny na základě měr vzdálenosti okolo instancí s chybějícími hodnotami na základě jejich podobnosti přičemž jedno chybějící pozorování může být současně obsaženo ve více shlucích. V případě kategoriálních atributů je místo chybějící hodnoty doplněna hodnota ze shluku s nejvíce přirozenými sousedy. V případě spojitého atributu je hodnota odhadnuta na základě všech hodnot shluku s nejvíce přirozenými sousedy. [11] popisuje hot-deck techniku pracující s tzv. přibližnými množinami (Rough Sets). Přibližné množiny jsou podobné fuzzy množinám v tom smyslu že obě teorie pracují s pojmem vágnosti. Zatím co fuzzy množiny pracují s mírou s níž hodnota příšluší do dané množiny přibližné množiny aproximují přesnou množinu pomocí dvojice jiných množin představujících horní a dolní odhad původní množiny. Myšlenka aplikace této metody je založena na očekávání že v databázi existují stejné nebo podobné záznamy. 4. Metody imputace založené na explicitním modelu V odborné literatuře (např. [16] [11] [1] nebo [6]) jsou hojně zmíněny příklady aplikace lineární regrese jako způsobu pro doplňování chybějících hodnot kdy jsou chybějící hodnoty predikovány pomocí modelu vytvořeného na úplných datech na základě ostatních proměnných. Její použití se samozřejmě (stejně tak jako použití jiné prediktivní metody) odvíjí od existence závislosti mezi prediktory a doplňovanou proměnnou. Použití regrese vede k nežádoucímu snížení variability a kovariance dat. S tímto nedostatkem se pokouší vypořádat stochastická regresní imputace (viz např. [6]) v rámci níž jsou doplňované hodnoty korigovány o rezidua tj. odchylky reálných pozorování od proložené regresní přímky. Použití metody Naïve Bayes jako způsobu imputace kategoriálních proměnných popisuje [7]. Metoda je založena na analýze vztahů mezi každou nezávisle proměnnou a závisle proměnnou s cílem stanovit podmíněnou pravděpodobnost pro každý vztah. [7] tuto metodu hodnotí jako velmi efektivní už z toho důvodu že pro vytvoření modelu potřebuje pouze jeden průchod daty. Pokud bychom zůstali u Bayesovského téma nelze opomenout popis aplikace Bayesovských sítí v [12] a [1]. Bayesovské sítě (též kauzální sítě) představují pravděpodobnostní modely využívající grafickou reprezentaci formou acyklického grafu. Imputace s využitím této metody probíhá na základě jednoho nebo více modelů simulujících posteriorní rozdělení chybějících hodnot. [12] uvádí algoritmus IMPUTE BN(S;N) jako konkrétní metodu pro doplňování chybějících hodnot s využitím Bayesovských sítí. [1]

191 FORUM STATISTICUM SLOVACUM 7/ upozorňuje na zásadní nevýhodu této metody když ji označuje jako velice komplexní a náročnou na čas. Pro imputaci lze rovněž s úspěchem využít neuronové sítě. Zcela jistě nejobsáhlejší publikací zpracovávající toto téma je [11]. Tato knižní monografie porovnává využití neuronových sítí s několika alternativními metodami a současně hledá kombinace s dalšími metodami umožňující jejich optimalizaci. V mnoha popisovaných případech jsou autoasociativní neuronové sítě za tímto účlem použity v kombinaci s genetickými algoritmy. V prvním uváděném příkladu je porovnáno použití vícevrstevného perceptronu (MLP) s radiální bazickou funkcí (RBF). MLP užívá 3 a více vrstev neuronů s nelineární aktivační funkcí. Umí si poradit i s daty nelineárně separabilními nebo separabilními pomocí nadroviny. RBF se typicky skládá z jedné skryté vrstvy neuronů jejichž aktivační funce je vybírána z třídy tzv. bazických funkcí. Oproti zpětné propagaci používané MLP představuje použití RBF některé výhody: rychlejší trénování sítě a menší náchylnost k problémům s nestacionárními vstupy. Genetické algoritmy byly v obou případech použity pro minimalizaci Euklidovské normy chybové funkce (MDEEF Missing Data Estimation Error Function) spočtené jako čtverec rozdílu výstupního vektoru naučené neuronové sítě a vstupního vektoru. V dalším uváděném příkladu [11] porovnává použití Bayesovských neuronových sítí v kombinaci s genetickým algoritmem (BANN-GA) hybridní sítě složené z RBF a MLP a kombinace PCA s autoasociativní neuronovou sítí (PCA-NN). Bayesovské neuronové sítě jsou tvořeny MLP formulovaném na základě Bayesovského přístupu kdy jsou chápány jako parametrizovaný regresní model vytvářející pravděpodobnostní hypotézy o datech a trénovány s využitím hybridní metody Monte Carlo. GA byl opět použit pro minimalizaci chyby. U PCA-NN byla metoda hlavních komponent použita pro redukci dimenzionality před aplikací NN vedoucí ke snížení počtu neuronů. Po aplikaci neuronové sítě byla použita inverzní PCA pro rekonstrukci původních dat. Další experiment porovnával kombinaci smíšených Gaussovských modelů a EM algoritmu (GMM-EM) s kombinací autoasociativních neuronových sítí a evolučního algoritmu v české literatuře popisovaného jako optimalizace pomocí hejna částic (Particle Swarm Optimalization Method) (viz např. [34]). [11] neponechává stranou testování ani relativně mladou a nadějnou metodu Support Vector Machine (SVM) konkrétně její nadstavbu Support Vector Regression (SVR). SVR v kombinaci s GA porovnává s autoasociativní neuronovou sítí (ANN) optimalizovanou pomocí GA a již zmiňovanou kombinací PCA-ANN-GA. Algoritmus SVM je založen na převedení úlohy klasifikace do nelineárně separovatelných tříd na úlohu klasifikace do tříd lineárně separovatelných. V prostoru transformovaných atributů se poté snažíme nalézt dělící nadrovinu která má co největší vzdálenost od příkladů různých tříd. Metoda MCMC tvoří jádro metod pro generování pseudonáhodných čísel z pravděpodobnostních rozdělení prostřednictvím Markovských řetězců. Jak uvátí např. [14] Markovský řetězec je sekvence náhodných veličin u nichž rozdělení každého elementu závisí na hodnotě předchozího. Tudíž i hodnota každého náhodného vzorku závisí na hodnotě vzorku předchozího. Dvěmi nejpopulárnějšími metodami pro generování pseudonáhodných čísel pro účely MCMC jsou Gibbsovské samplování (Gibbs Sampling) a Metropolis-Hastings algoritmus. Gibbsovské samplování generuje hodnotu z podmíněného rozdělení každé komponenty vícerozměrné náhodné veličiny ponechávaje ostatní komponenty v cyklické modifikaci. Tím dostáváme řetězec hodnot konvergující ke vzorku z posteriorního rozdělení. Algoritmus Metropolis-Hastings poskytuje výběr z pravděpodobnostního rozdělení za účelem aproximace rozdělení chybějící hodnoty a posléze přijetí nebo zamítnutí simulované hodnoty s konkrétní pravděpodobností. Výhodou těchto přístupů jsou především jejich nízké nároky na výpočetní kapacitu. Jak uvádí [14] existují dva hlavní důvody proč pro imputaci uvažovat

192 190 FORUM STATISTICUM SLOVACUM 7/2011 simulační metody: 1) představují přirozený doplněk stávajících nástrojů. Zatímco např. EM poskytuje pouze bodový odhad neznámých parametrů MCMC poskytuje přímo náhodný výběr z jejich společného posteriorního rozdělení. 2) tyto metody umožňují vícenásobnou imputaci tzn. pro každou chybějící hodnotu metoda nabízí m > 1 simulovaných kandidátů. Metodu propensitního skóre s imputací založenou na přibližném Bayesovském bootsrapingu používá řada SW řešení (viz kapitola 1.3). Jak uvádí např. [35] nebo [16] metoda je určena pro imputaci spojité proměnné za předpokladu monotónního vzoru chování chybějících dat. Monotonním vzorem rozumí situaci kdy pokud pro i-té pozorování j-tá proměnná obsahuje chybějící hodnotu pak všechny další proměnné s vyšším indexem tohoto pozorování obsahují chybějící hodnotu též. V rámci této imputační metody je pro každou proměnnou obsahující chybějící hodnoty každému pozorování přiřazeno tzv. propensitní skóre jako odhad pravděpodobnosti že pozorování je chybějící. Propensitní skóre je odvozeno z modelu logistické regrese jehož vysvětlující proměnné jsou ve vztahu k doplňované proměnné jako covariates. Pozorování jsou poté sloučena podle propensitního skóre do předem daného počtu skupin (zpravidla 5). Následně je na ně uplatněna přibližná Bayesovská bootstrap imputace. Uvažujme že ve skupině č. 1 je n1 pozorování bez chybějících hodnot (podskupina A) a n0 pozorování s chybějícími hodnotami (podskupina B). Algoritmus nejprve z první skupiny vybere náhodně s vracením n1 pozorování a dá je stranou. Poté z nich vybere náhodně s vracením n0 pozorování a jejich hodnotami nahradí chybějící pozorování v podskupině B. Tento postup se opakuje pro každou proměnnou s chybějícími hodnotami. Rozhodovací stromy je možné snadno transformovat na rozhodovací pravidla která lze později využít v automatizovaném systému (v našem případě pro imputaci). Rozhodovací stromy lze vytvářet na základě kategoriálních atributů. V případě imputace spojitých atributů by bylo nutné nejprve data transformovat na intervaly a po aplikaci stromu pro predikci imputované hodnoty vybrat z intervalu některou z hodnot. Tím bychom se ale dopustili nežádoucího zkreslení. Lepší metodou pro predikci spojité proměnné jsou regresní stromy. Od rozhodovacích stromů se liší jednak použitým kritériem pro větvení které v tomto případě minimalizuje variabilitu ale též tím že v listech stromu nejsou uvedeny kategorie třídy ale konkrétní hodnota odpovídající hodnotě průměrné. Jedním z nejznámějších systémů pro vytváření rozhodovacích stromů je C4.5 spojený se jménem Johna Rosse Quinlana. Jak uvádí [9] jednoduchá imputace pomocí tohoto systému může vést k lepším výsledkům než použití Autoclass. Jiné využití pro C4.5 navrhuje[11] když jej kombinuje s již uvedenými metodami PCA-NN-GA a AANN-GA použití rozhodovacích stromů konkrétně algoritmu C4.5. Rozhodovací strom je použit pro klasifikaci intervalů chybějících hodnot spojitých proměnných před použitím v již uvedených přístupech. Rozšíření o C4.5 v obou případech vedlo k zvýšení spolehlivosti o 13%. [7] popisuje použití algoritmu pro generování rozhodovacích pravidel CLIP4 pro jednoduchou imputaci. Algoritmus imputace se skládá z vytvoření stromu jeho prořezání vygenerování produkčních pravidel a validace jejich spolehlivosti. Specifickým rysem tohoto algoritmu je využití optimalizačního modelu celočíselného programování při vykonávání operací jako je např. rozdělování dat do podmnožin během první fáze algoritmu imputace. [8] ukazuje použití systému CART pro klasifikační a regresní stromy na imputaci chybějících dat ze senzorů bezdrátové sítě. [1] tuto metodu hodnotí pozitivně z pohledu její relativní rezistence vůči odlehlým pozorováním. Představuje podle něj snadný nástroj pro imputaci více hodnot (míněno ve smyslu jednoduché imputace v rámci jednoho atributu). K dalšímu zlepšení spolehlivosti doplňovaných hodnot došlo kombinací CART s lineární interpolací. [1] zmiňuje techniku Forest Climbing publikovanou v [3] spočívající v konstrukci q různých klasifikačních stormů pro imputaci hodnot q atributů současně. Jedná se o případ

193 FORUM STATISTICUM SLOVACUM 7/ kdy jsou imputovány hodnoty proměnných v rámci dvou datových zdrojů z nichž v prvním obsaženy jsou a v druhém chybí. Imputovaný vektor je průnikem hodnot koncových nodů jednotlivých stromů do nichž sestoupí oskórované pozorování. [1] též popisuje přístup RTII (Robust Tree-based Incremental Imputation) umožňující doplňování chybějících hodnot pomocí klasifikačních a regresních stromů jak ze zdrojového souboru (tj. ze souboru obsahujícího chybějící data) tak z externího dárcovského souboru s využitím techniky AdaBoost. AdaBoost je známý meta-algoritmus používaný pro optimalizaci klasifikace tím že kombinuje rozhodnutí několika jednodušších klasifikátorů v tomto případě reprezentovaných rozhodovacími stromy. 5. Závěr V rámci předchozích kapitol jsem stručně seznámil s problematikou neúplných dat uvedl jsem známé mechanismy vzniku tohoto jevu od nichž se odvíjí způsob jakým je možné se s neúplnými daty vypořádat. V prostudovaných zdrojích se lze setkat s dílčími porovnáními jednotlivých metod. V tomto směru je relativně nejobsáhlejší studie [5] srovnávající efektivnost celkem sedmi metod dále publikace [13] poskytující srovnání které se asi nejvíce podobá metodicky ucelenému benchmarku resp. podobné srovnání publikované v [7] příp. seznam dílčích srovnání publikovaný v [11] hledající též způsoby kooperace jednotlivých metod. Nesetkal jsem se však s komplexním benchmarkem který by na reálných datech porovnával všechny přístupy a pro jednotlivé typy atributů doporučoval konkrétní metody. Je sice zřejmé že u pravděpodobnostních metod lze částečně aplikovat závěry komparativních studií efektivnosti využití jednotlivých metod jako jsou např. STATLOG a METAL přesto zde chybí ucelené porovnání s ostatními uvedenými nepravděpodobnostními metodami. V souladu s připomínkou [11] k testování spolehlivosti MLP-GA proti RBF-GA považuji též za vhodné takový benchmark konstruovat na základě dat z různých předmětných oblastí současně aby byla eliminována možnost ovlivnění výsledků konkrétním data setem. 6. Literatura [1] D'AMBROSIO A. Boosted Incremental Tree-based Imputation of Missing Data. Neapoli PhD. thesis. Universitá degli Studi di Napoli Federico II. [2] AYUYEV V.V. JUPIN J. HARRIS P.W. & OBRADOVIC Z. Dynamic Clustering- Based Estimation of Missing Values in Mixed Type Data. In T.B. Pedersen M.K. Mohania and A M. Tjoa (Eds.) Data Warehousing and Knowledge Discovery. Book Series: Lecture Notes in Computer Science. Heidelberg: Springer Berlin. s [3] BARCENA J.M. TUSELL F. Data imputation and file merging using the forest climbing algorithm. Universidat del País Vasco [online] [cit ]. Dostupné z: [4] BATISTA G.E. MONARD M.C. A study of k-nearest neighbour as an imputation method in: Second International Conference on Hybrid Intelligent Systems. vol. 87. Santiago de Chile: s [5] CARTWRIGHT M. SHEPPERD M. and TWALA B. Ensemble of missing data techniques to improve software prediction accuracy In 28th International Conference on Software Engineering (ICSE 2006) May Shanghai China 4. [6] ENDERS Craig K. Applied missing data analysis (Methodology in the social sciences). New York: Guilford Press p. ISBN : [7] FARHANGFAR A. KURGAN L. PEDRYCZ W. Experimental analysis of methods for imputation of missing values in databases in: Intelligent Computing: Theory and Applications II Conference in conjunction with the SPIE Defense and Security Symposium (formerly AeroSense) Orlando FL s

194 192 FORUM STATISTICUM SLOVACUM 7/2011 [8] HIGASHIJIMA Yuka YMAMOTO Atsushi NAKAMURA Takayuki NAKAMURA Motonori MATSUO Masato. Missing Data Imputation Using Regression Tree Model for Sparse Data Collected via Wide Area Ubiquitous Network. In Applications and the Internet IEEE/IPSJ International Symposium th IEEE/IPSJ International Symposium on Applications and the Internet s [9] LAKSHIMINARAYAN K. HARP S. A. SAMAD T. Imputation of Missing Data in Industrial Databases. Applied Intelligence s [10] LITTLE R. J. A. and RUBIN D.B. Statistical Analysis with Missing Data. New York: Wiley ISBN: [11] MARWALA Tshilidzi. Computational Intelligence for Missing Data Imputation Estimation and Management: Knowledge Optimization Techniques. Information Science Reference. ISBN: [12] ROMERO Vanessa SALMERÓN Antonio. Multivariate imputation of qualitative missing data using Bayesian networks. (English) Soft methodology and random information systems. In Collection of papers presented at the 2nd international conference on soft methods in probability and statistics (SMPS 2004) Oviedo Spain September Berlin: Springer s ISBN /pbk. [13] SENTAS P. LEFTERIS A. and STAMELOS I. (2004). Multiple Logistic Regression as Imputation method Applied on Software Effort prediction. In Proc. of the 10th Int. Symp. on Software Metrics Chicago September Chicago [14] SCHAFER J. L. Analysis of Incomplete Multivariate Data. London: Chapman & Hall ISBN: [15] SONG Q. and SHEPPERD M. A Short Note on Safest Default Missingness Mechanism Assumptions. In Empirical Software Engineering. (accepted in 2004). [16] YANG Y.C. Multiple imputation for missing data: Concepts and new development. SAS Institute [online] [cit ]. Dostupné z: app/papers/multipleimputation.pdf. Adresa autora: David Pejčoch Ing. KIZI Fakulta informatiky a statistiky Vysoká škola ekonomická Nám. W. Churchilla Praha 3 Česká republika david@pejcoch.com

195 FORUM STATISTICUM SLOVACUM 7/ Ekonomická aktivita obyvatelstva z pohledu střední délky ekonomické aktivity 1 Economic activity in wiew of working life expectancy Ludmila Petkovová Petr Mazouch Abstract: The population ageing became recent problem which attract attention of many experts from different disciplines. As a result of population ageing is expected increasing proportion of economic inactive people in population. But it is necessary to analyze not only population in postproductive age as a main factor economic inactivity but the development of economic activity during the life structure and changes in economic activity too. The aim of this paper is to analyze economic activity of population in relation to the education level with using working life expectancy in comparison with life expectancy. This paper contains analysis of data sources which are useful for construction of economic activity tables and the associated problems too. Key words: economic inactivity tables of economic activity working life expectancy Klíčová slova: ekonomická aktivita obyvatelstva tabulky ekonomické aktivity střední délka ekonomické aktivity JEL classification: J24 1. Úvod Stárnutí populace a s tím související růst počtu obyvatel v postproduktivním věku je obecně vnímán jako potenciální problém pro budoucí vývoj společnosti. Tyto obavy vyvolává kontinuální nárůst indexu ekonomického zatížení. Bylo by však příliš zjednodušující nahlížet na tuto problematiku pouze z hlediska věkové struktury obyvatelstva. Ekonomická aktivita a důvody neaktivity obyvatelstva jsou předmětem zájmu mnoha analýz a prací publikovaných statistiky ekonomy sociology atd. Velmi málo je však věnováno myšlence možnosti zvyšování podílu ekonomicky aktivních v produktivním věku. Opomíjené jsou i analýzy beroucí v úvahu vzdělanostní strukturu obyvatelstva její vývoj a to jakým způsobem může ovlivnit počet a strukturu ekonomicky neaktivních obyvatel v populaci. Tento příspěvek si klade za cíl analyzovat ekonomickou aktivitu obyvatelstva v návaznosti na výši dosaženého vzdělání obyvatel pomocí střední délky ekonomické aktivity a jejího porovnání se střední délkou života. To by mělo přispět k zamyšlení nad otázkou zda je opravdu nevyhnutelný rychlý nárůst podílu ekonomicky neaktivního obyvatelstva z důvodu stárnutí populace. 2. Data a metodika V souvislosti s postavením na trhu práce je možné obyvatelstvo členit na tři vzájemně se vylučující skupiny zaměstnaní nezaměstnaní a osoby které nejsou pracovními silami. První dvě kategorie souhrnně označujeme jako ekonomicky aktivní a třetí ekonomicky neaktivní. Ekonomicky aktivní mohou být u nás pouze osoby starší patnácti let. Další kritéria pro zařazení jsou závislá na použitých doporučeních a metodikách. Zde využitá data o obyvatelstvu z pohledu ekonomického statusu pochází z Výběrového šetření pracovních sil prováděného Českým statistickým úřadem. Ten pro účely zařazená obyvatel mezi zaměstnané či nezaměstnané používá doporučení Mezinárodní organizace práce.[7] 1 Příspěvek vznikl v rámci projektu Interní grantové agentury VŠE v Praze Analýza a predikce struktury ekonomicky aktivního obyvatelstva IG402011

196 194 FORUM STATISTICUM SLOVACUM 7/2011 Ekonomicky neaktivní mohou být lidé z důvodů objektivních či subjektivních. Mezi osoby neaktivní z objektivních důvodů patří například děti studenti starobní důchodci nemocní či invalidní důchodci. Ze subjektivních důvodů jsou to pak osoby v domácnosti rentiéři či osoby v produktivním věku které ale pracovat nechtějí. Data o ekonomické aktivitě obyvatel jsou zjišťována především Českým statistickým úřadem a to v rámci Sčítání lidu domů a bytů a ve Výběrovém šetření pracovních sil které již bylo zmíněno i výše. Sčítání lidu domů a bytů je vyčerpávajícím šetřením prováděným v periodicitě deseti let. Poslední sčítání proběhlo v roce S ohledem na náročnost zpracování a publikace výsledků sčítání nejsou data za rok 2011 stále k dispozici. Oproti tomu Výběrové šetření pracovních sil je prováděné čtvrtletně. Jeho počátky spadají do roku Jedná se o velmi komplexní šetření podávající detailní o informace o struktuře zaměstnaných a nezaměstnaných. Spolu s údaji o ekonomicky neaktivních osobách tak lze získat cenné informace o pracovní síle. Výběrové šetření pracovních sil ale neposkytuje jen údaje o trhu práce ale podává i mnoho demografických informací o obyvatelstvu a v neposlední řadě i údaje vyplývající z ad-hoc modulů (jednorázových šetření prováděné na specifické téma) konaných vždy ve druhém čtvrtletí daného kalendářního roku. Velkou předností Výběrového šetření pracovních sil je jeho krátká periodicita která umožňuje využití výsledků pro kontinuální sledování a analyzování vývoje ekonomické aktivity obyvatelstva. 2 Pro bližší zkoumání vztahů ekonomických a demografických proměnných lze využít tabulek ekonomické aktivity. Jejich výstupem je pak střední délka ekonomické aktivity. Touto oblastí se již zabýval J. Hrkal v příspěvku Ekonomický model života a stacionární populace [6]. Střední délka ekonomické aktivity je počítána ve věku 15 let kdy člověk může vstoupit do ekonomicky aktivního života. Její výše udává průměrnou dobu kterou by osoba z dané populace setrvala ve stavu ekonomické aktivity za podmínky že se během jejího zbývajícího života nezmění úmrtnostní poměry a míry ekonomické aktivity. Tabulky ekonomické aktivity vychází z úmrtnostních tabulek které by pro zjištění střední délky ekonomické aktivity podle nejvyššího dokončeného vzdělání měly být také sestaveny podle nejvyššího dosaženého vzdělání. Úmrtnostní tabulky podle vzdělání je však možné sestavovat jen na základě dat ze Sčítání lidu domů a bytů kdy máme k dispozici strukturu obyvatelstva podle pohlaví věku a vzdělání. I v tomto případě není ale zaručená dostupnost potřebných dat. Po posledním sčítání v roce 2001 byly tyto tabulky sestaveny ale opublikována byla pouze část z úplných úmrtnostních tabulek [9]. Na základě této části nelze získat střední délku ekonomické aktivity a také se v současnosti již jedná o mírně zastaralá data. Navíc absence třídění zemřelých podle nejvyššího ukončeného vzdělání neumožňuje do výpočtů zahrnout rozdílnost v úrovni úmrtnosti podle výše vzdělání. Z těchto důvodů byly pro výpočty využity konvenční tabulky ekonomické aktivity a úmrtnostní tabulky. Vzhledem k uspořádání dat o ekonomické aktivitě obyvatelstva do pětiletých věkových intervalů bylo nutné oba typy tabulek počítat jako zkrácené tabulky tj. v pětiletých věkových intervalech. Z výše popsaných důvodů byla také pro sestavení tabulek ekonomické aktivity použita u všech typů vzdělání úroveň úmrtnosti celé populace. Základem konstrukce tabulek ekonomické aktivity byly tabulkové funkce dožívajících se l(x) a žijících L(x) z úmrtnostní tabulky. Tabulkový počet žijících v ekonomické aktivitě L a (x) je součinem míry ekonomické aktivity a(x) a tabulkového počtu žijících. Výsledná hodnota (střední délka ekonomické aktivity e a (x)) je pak podílem od spodu kumulovaného tabulkového počtu žijících v ekonomické aktivitě T a (x) a tabulkového počtu dožívajících se v příslušném věku l(x): 2 v sekci metodika

197 FORUM STATISTICUM SLOVACUM 7/ (1) (2) (3) kde: je střední délka ekonomické aktivity (počet let ekonomicky aktivních bez ohledu na aktuální stav) je tabulkový počet žijících v ekonomické aktivitě je míra ekonomické aktivity je tabulkový počet žijících v ekonomické aktivitě je tabulkový počet dožívajících se v příslušném věku. Tabulky ekonomické aktivity byly spočítány pro celou populaci a pro skupiny s nejvyšším ukončeným základním středním bez maturity středním s maturitou a vysokoškolským vzděláním. Absence úmrtnostních tabulek podle dosaženého vzdělání vedla i k použití střední délka života pro muže a ženy bez ohledu na dosažené vzdělání při porovnávání střední délky ekonomické aktivity a střední délky života. Nejsou zde tedy opět respektovány rozdíly v populaci a úmrtnosti podle dosaženého vzdělání které byly zmíněny již výše. 3. Střední délka ekonomické aktivity Na výši střední délky ekonomické aktivity a tedy očekávané doby strávené v ekonomické aktivitě má vliv jak pohlaví tak výše dokončeného vzdělání. Rozdíl mezi muži a ženami tvoří na prahu ekonomicky aktivního života ve věkovém intervalu 15 až 19 let více než 6 let. Mezi hlavní důvody delšího setrvání mužů ve stavu ekonomické aktivity patří jistě dřívější odchod do důchodu u žen a také jejich relativně dlouhá doba strávená v domácnosti z důvodu péče o dítě. Z pohledu vzdělanostní struktury je u mužů i u žen výrazně nižší střední délka ekonomické aktivity v případě osob s dokončeným pouze základním vzděláním. To je však možné přičítat i dalšímu studiu těchto osob na středních školách. Rozdíl je však zřetelný i v pozdějším věku. V případě mužů je na počátku produktivního věku nejdelší střední délka ekonomické aktivity u osob se středním vzděláním bez maturity. To je způsobeno vysokou mírou ekonomické aktivity této skupiny ve věku let která pak vstupuje do výpočtu střední délky ekonomické aktivity. Zastoupení osob se středním vzděláním bez maturity je v této věkové skupině ale velmi malé. V roce 2009 činil počet těchto osob podle výsledků Výběrového šetření pracovních sil přibližně 22 tisíc. Vhodnější by proto bylo uvažovat věkovou skupinu let kdy je již ve všech vzdělanostních skupinách dostatečné zastoupení. S tím je i spojená počáteční nižší úroveň ukazatele u osob se středním vzděláním s maturitou a vysokoškolským vzděláním kterou můžeme připsat studiu. Podíváme-li se tedy na střední dobu ekonomické aktivity u osob ve věku kdy již studium není příliš častým důvodem k ekonomické neaktivitě dojdeme k přímé úměře její výše a dosaženého vzdělání (od věkového intervalu let). Delší doba nutná k získání vyššího vzdělání vede ke snížení nejvyšší střední délky ekonomické aktivity na počátku produktivního věku. Vysoké míry ekonomické aktivity ale způsobují pomalý pokles očekávané doby ekonomické aktivity.

198 196 FORUM STATISTICUM SLOVACUM 7/2011 Tabulka 1: Střední délky ekonomické aktivity v roce 2009 dosažené vzdělání střední bez věk celkem základní maturity střední s maturitou vysokoškolské muži ženy muži ženy muži ženy muži ženy muži ženy Zdroj: ČSÚ Demografická ročenka VŠPS vlastní výpočty V případě mužů je na počátku produktivního věku nejdelší střední délka ekonomické aktivity u osob se středním vzděláním bez maturity. To je způsobeno vysokou mírou ekonomické aktivity této skupiny ve věku let která pak vstupuje do výpočtu střední délky ekonomické aktivity. Zastoupení osob se středním vzděláním bez maturity je v této věkové skupině ale velmi malé. V roce 2009 činil počet těchto osob podle výsledků Výběrového šetření pracovních sil přibližně 22 tisíc. Vhodnější by proto bylo uvažovat věkovou skupinu let kdy je již ve všech vzdělanostních skupinách dostatečné zastoupení. S tím je i spojená počáteční nižší úroveň ukazatele u osob se středním vzděláním s maturitou a vysokoškolským vzděláním kterou můžeme připsat studiu. Podíváme-li se tedy na střední dobu ekonomické aktivity u osob ve věku kdy již studium není příliš častým důvodem k ekonomické neaktivitě dojdeme k přímé úměře její výše a dosaženého vzdělání (od věkového intervalu let). Delší doba nutná k získání vyššího vzdělání vede ke snížení nejvyšší střední délky ekonomické aktivity na počátku produktivního věku. Vysoké míry ekonomické aktivity ale způsobují pomalý pokles očekávané doby ekonomické aktivity. Vysokoškolsky vzdělané ženy dosahují nejdelší střední délky ekonomické aktivity již od počátku produktivního věku. Jedním z důvodů je nižší plodnost této skupiny obyvatelstva a s ní spojený nižší podíl žen na rodičovské dovolené a vyšší věk odchodu do důchodu. Přímá úměra mezi střední délkou ekonomické aktivity a nejvyšším ukončeným vzděláním nastává oproti mužům o něco dříve už od věkového intervalu let. Při pohledu na vývoj střední délky ekonomické aktivity v čase vzrostla hodnota ukazatele od roku 2002 o 036 roku pro muže a 002 pro ženy. U mužů můžeme pozorovat růst u všech vzdělanostních skupin vyjma osob s vysokoškolským vzděláním kde se odráží prodlužující se doba vzdělávání a pokles je tak viditelný pouze v nižším věku. Od intervalu let je naopak patrný nárůst předpokládané doby strávené v ekonomické aktivitě. V případě žen vzrostla střední délka ekonomické aktivity i přes stále rostoucí hranici odchodu do důchodu jen velmi málo. V absolutním vyjádření pouze o 002 roku. Značný vliv lze přičíst velkému rozdílu v porodnosti mezi oběma sledovanými roky. Zatímco v roce 2002 byl počet narozených dětí necelých 93 tis. a spadal do období extrémně nízké porodnosti v letech v roce 2009 se naopak narodilo téměř 119 tis. dětí. Tato hodnota byla po roce

199 FORUM STATISTICUM SLOVACUM 7/ nejvyšší v ČR od roku Takto velký rozdíl v počtu narozených dětí velmi úzce souvisí s následným počtem žen na rodičovské a mateřské dovolené. U žen se středním a vyšším vzděláním pak dokonce střední délka ekonomické aktivity klesla. Nejviditelnější pokles o 116 roku je možné sledovat u vysokoškolsky vzdělaných žen. Při podrobnějším pohledu na míru ekonomické aktivity podle věku je právě u této skupiny žen viditelný velký pokles míry ekonomické aktivity ve věkovém intervalu let ve srovnání obou sledovaných roků (viz výše). Na tomto příkladu je možné ukázat vliv zvýšené porodnosti na snižování střední délky ekonomické aktivity neboť právě věková skupiny vykazovala u žen s vysokoškolským vzděláním nejvyšší intenzitu plodnosti.[5] Vypočtenou střední délku ekonomické aktivity můžeme déle porovnat se střední délkou života. I v tomto případě je zřetelně viditelný rozdíl muži a ženami ale také výrazně nižší podíl střední délky ekonomické aktivity na střední délce života u osob s dokončeným pouze základním vzděláním. Tabulka 2: Podíly střední délky ekonomické aktivity a střední délky života ve věkovém intervalu let v letech 2002 a 2009 dosažené vzdělání rok 2002 pohlaví Celkem základní střední bez maturity střední s maturitou vysokoškolské muži ženy muži ženy Zdroj: ČSÚ Pohyb obyvatelstva Demografická ročenka VŠPS vlastní výpočty U žen nepřesáhl podíl v žádné ze skupin ani v jednom z uvedených let 55 % a v případě skupiny s dokončeným pouze základním vzděláním ani 40 % což je nejméně o 10 procentních bodů méně v porovnání s ostatními skupinami. U mužů se naopak podíl pohybuje mezi 60 % a 70 %. Pouze opět u osob se základní vzděláním klesá na 50 % až 55 %. Ve všech sledovaných případech ale došlo mezi roky 2002 a 2009 k poklesu podílu střední délky ekonomické aktivity na střední délce života a to v řádu několika málo setin roku. To je způsobeno rychlejším nárůstem střední délky života. Zatímco v případě střední délky ekonomické aktivity došlo k již zmíněnému zvýšení o 036 u mužů resp. 002 roku u žen (celkem bez rozlišení dosaženého vzdělání) vzrostla střední délka života ve věkovém intervalu let o 202 u mužů resp. 169 roku u žen 4. Závěr Současný demografický vývoj a z něj odvozené populační prognózy počítají s trvalým růstem podílu osob v důchodovém věku a s tím souvisejícím růstem počtu ekonomicky neaktivních osob. Důvodů nárůstu podílu ekonomicky neaktivních v populaci je však více nejen rostoucí zastoupení seniorů. Ve spojení s prodlužující se délkou studia klesají míry ekonomické aktivity především u mladých lidí. I když střední doba ekonomické aktivity roste u obou pohlaví dochází k poklesu jejího podílu na střední délce života způsobeného rychlejším prodlužováním očekávané délky života. Výrazně odlišná střední doba ekonomické aktivity je u osob s dokončeným pouze základním vzděláním mezi zbylými skupinami obyvatelstva podle vzdělání již takové rozdíly patrné nejsou. Hodnoty pro osoby se základním vzděláním na prahu produktivního věku jsou až o deset let nižší než je tomu u ostatních skupin. Od období mezi dvacátým a třicátým rokem života existuje přímá úměra mezi dosaženým vzděláním a střední dobou ekonomické aktivity která je způsobena právě vyšší mírou účasti více vzdělaných osob v pracovním procesu.

200 198 FORUM STATISTICUM SLOVACUM 7/2011 Tyto výsledky zcela jistě vedou k otázkám zda jsou obavy prognostiků a jiných autorů prognóz vývoje společnosti oprávněné zda opravdu bude docházet k rychlému nárůstu ekonomicky neaktivních osob z důvodu odchodu do starobního důchodu. Zcela jistě lze tvrdit že bude docházet ke stárnutí obyvatelstva z důvodu přibývání starších osob ale již v současné době lze říci že tyto osoby jestliže bude pokračovat směr vývoje měr ekonomické aktivity se budou aktivně zapojovat do ekonomického života v mnohem širší míře než je tomu dnes. 5. Literatura [1] ČSÚ 2011: Vývoj počtu ekonomicky neaktivních obyvatel ČR v letech 2006 až ČSÚ 2011 ( [2] ČSÚ: Zaměstnanost a nezaměstnanost v ČR podle výsledků výběrového šetření pracovních sil - roční průměry 1993 až 2009 Praha 1994 až 2010 [3] ČSÚ 2010: Demografická ročenka ČR ČSÚ 2010 ( [4] ČSÚ 2003: Pohyb obyvatelstva v České republice za rok ČSÚ 2003 ( [5] HOLÁ B. 2008: Plodnost a vzdělání konference Reprodukce lidského kapitálu (vzájemné vazby a souvislosti) Praha 15. a 16 prosince 2008 ( [6] HRKAL F. 2002: Ekonomický model života a stacionární populace. ČSÚ 2002 ( [7] MORAVOVÁ J. 1998: Základy sociální statistiky. VŠE Praha ISBN [8] PETKOVOVÁ L. 2011: Příčiny a důsledky ekonomické neaktivity v České republice. Diplomová práce. Fakulta informatiky a statistiky. Vysoká škola ekonomická. Praha s. [9] ZEMAN K. 2006: Úmrtnostní tabulky podle nejvyššího ukončeného vzdělání Česká republika2001. Demografie 2006 roč. 48 č. 3 s ISSN Autoři: Ludmila Petkovová Ing. Katedra ekonomické statistiky Fakulta informatiky a statistiky VŠE v Praze Nám. W. Churchilla Praha 3 ludmila.petkovova@vse.cz Petr Mazouch Ing. Ph.D. Katedra ekonomické statistiky Fakulta informatiky a statistiky VŠE v Praze Nám. W. Churchilla Praha 3 mazouchp@vse.cz

201 FORUM STATISTICUM SLOVACUM 7/ Ekvivalencia Ohlsonovho a Žežulovho prístupu k rovnomernej korelačnej štruktúre v modeli rastových kriviek Equivalence of Ohlson s and Žežula s approach to uniform correlation structure in the growth curve model Rastislav Rusnačko Abstract: In this text we compare the estimators of variance parameters in the growth curve model with uniform correlation structure derived by Žežula on the one side and Ohlson on the other side. We will show equivalence between these two approaches. Key words: Growth curve model uniform correlation structure linearly structured matrix Kľúčové slová: Model rastových kriviek rovnomerná korelačná štruktúra lineárne štrukturovaná matica JEL classification: C13 C29 C39 1. Úvod Štandardný model rastových kriviek predstavili Potthoff a Roy už v roku Tento model sa zvykne označovať aj ako zovšeobecnený model viacrozmernej analýzy variancie alebo aj Potthoffov a Royov model. Má veľké využitie vo viacerých oblastiach vrátane ekonómie psychológie medicíny biológie... Časom sa objavili rôzne modifikácie tohto modelu ktorými sa zaoberali viacerí matematici ako Grizzle Allen Geisser Rao a ďalší. Jednou z často používaných korelačných štruktúr v tomto modeli je rovnomerná korelačná štruktúra. V tomto texte rozoberieme Ohlsonov a Žežulov prístup k tejto štruktúre a ukážeme ich ekvivalenciu. 2. Model rastových kriviek Štandardný model rastových kriviek je tvaru kde je matica pozorovaní je ANOVA matica je matica regresných konštánt je matica neznámych parametrov (1) je matica náhodných chýb s normálnym rozdelením je jednotková matica je variančná matica riadkov matice a vec operátor poskladá stĺpce matice pod seba a vytvorí tak z matice stĺpcový vektor. Pri takomto označení indexov predstavuje počet meraní počet objektov a počet skupín. V prípade že je úplne neznáma tak jej rovnomerne najlepší nestrannný odhad v prípade normality je definovaný ako pričom. 3. Žežulov prístup k rovnomernej korelačnej štruktúre (2)

202 200 FORUM STATISTICUM SLOVACUM 7/2011 Pretože variančná matica obsahuje veľa neznámych parametrov tak je užitočné ich počet redukovať uvažovaním jednoduchej štruktúry. Jednou z nich je rovnomerná korelačná štruktúra: kde a sú neznáme parametre. Keďže matica definovaná vzťahom (2) je nevychýleným odhadom matice tak Rovnice a a Na základe toho potom platia vzťahy sú potom nevychýlené odhadovacie rovnice parametrov a Z toho hneď vyplýva že prirodzené odhady neznámych parametrov sú Na porovnanie týchto odhadov budeme potrebovať ich variancie. Jednoduchým výpočtom dostávame že tieto variancie sú tvaru (3) (4) 4. Ohlsonov odhad v prípade lineárne štrukturovanej kovariančnej matice Ohlson odvodil explicitný tvar odhadu parametrov v modeli rastových kriviek s kovariančnou maticou patriacou do špeciálnej triedy štrukturovaných matíc konkrétne do triedy lineárne štrukturovaných matíc. Štrukturované matice sú definované v nasledujúcej definícií. Definícia: Nech je daná matica a nech je množina jej indexov teda Potom nazývame štrukturovanou maticou a množinu vzorom matice Štrukturovaná matica obsahuje prvky matice kde Musíme však poznamenať že nie je matica v pravom slova zmysle. Je to len označenie pre špeciálnu triedu prvkov matice Pri tomto prístupe budeme v ďalej potrebovať tzv. transformačnú maticu definovanú vzťahom (5) alebo pomocou Moore-Penrosovej inverzie ako (6) Definujme si teraz lineárne štrukturovanú maticu.

203 FORUM STATISTICUM SLOVACUM 7/ Definícia: Matica taká že je lineárne štrukturovaná keď existuje aspoň jedna dvojica Ďalej uvažujme model rastových kriviek s lineárne štrukturovanou kovariančnou maticou. Označme ju Model (1) je teda tvaru Nech je stĺpcový vektor získaný z matice pričom vynecháme opakujúce sa a nulové prvky. Napríklad Ohlson odvodil že v prípade lineárne štrukturovanej kovariančnej matice jej odhad je Využitím toho že lineárny priestor generovaný stĺpcami matice je rovnaký ako lineárny priestor generovaný stĺpcami matice dostaneme nevychýlenosť Ohlsonovho odhadu. Teda Takže stredná štvorcová chyba tohto odhadu je rovná jeho variancii. Na vyjadrenie tejto variancie nám poslúži nasledujúca nasledujúca veta. Veta: Nech má Wishartove rozdelenie kde je pozitívne definitná matica. Potom platí pričom je komutačná matica definovaná vzťahom kde je vektor dĺžky obsahujúci 1 na -tom mieste s ostatnými nulovými prvkami. Vieme že pre maticu definovaná vzťahom (2) platí teda na základe predchádzajúcej vety platí Takže varianciu Ohlsonovho odhadu môžeme napísať v tvare V nasledujúcej kapitole porovnáme Ohlsonov a Žežulov odhad pre neznáme parametre v prípade rovnomernej korelačnej štruktúry. 5. Porovnanie Ohlsonovho a Žežulovho prístupu k rovnomernej korelačnej štruktúre v modeli rastových kriviek (7)

204 202 FORUM STATISTICUM SLOVACUM 7/2011 V tretej kapitole sme uviedli Žežulove odhady pre rovnomernú korelačnú štruktúru. Táto štruktúra však spĺňa predpoklady lineárne štrukturovanej matice a preto na ňu môžeme aplikovať aj Ohlsonov odhad. Variancie Žežulových odhadov máme vyjadrené vzťahmi (3) a (4). Pozrime sa ešte na variancie odhadov pri Ohlsonovom prístupe. Pre prípad rovnomernej korelačnej štruktúry dostávame že a transformačná matica definovaná vzťahom (5) je tvaru (8) Keďže diagonálne prvky variančnej matice v tomto prípade sú parametra pri Ohlsonovom prístupe je tak variancia odhadu tohto Táto variancia je však rovnaká ako variancia Žežulovho odhadu tohto parametra. Takže Žežulovým aj Ohlsonovým prístupom dostávame rovnaký odhad parametra Všetky mimo diagonálne prvky v tejto štruktúre sú takže nevieme rovnakým spôsobom odvodiť aj varianciu parametra. Keďže stredná štvorcová chyba sa nešíri lineárne nemôžme písať Lenže vieme že Teda Takže v prípade rovnomernej korelačnej štruktúry je odhad parametrov a Ohlsonovým a Žežulovým prístupom rovnaký. 6. Aplikácia na Potthoffových dátach Model rastových kriviek vznikol keď sa Potthoff a Roy snažili odpovedať na otázku či vzdialenosť medzi hypofýzou a pterygomaxilárnou brázdou u chlapcov a u dievčat je rovnaká a tiež či rýchlosť rastu tejto vzdialenosti je u oboch pohlaví rovnaká. K dispozícií mali merania o 11 dievčatách a 16 chlapcoch vo veku a 14 rokov. Potthoff a Roy si uvedomili že oba súbory majú rovnakú variančnú maticu a navrhli dnes známy model rastových kriviek. Na týchto dátach si ukážeme Žežulov a Ohlsonov prístup pri predpoklade rovnomernej korelačnej štruktúry. Ak by sme jednotlivé merania usporiadali do matice dostaneme maticu pozorovaní so stĺpcami a pričom (9)

205 FORUM STATISTICUM SLOVACUM 7/ ANOVA matica je v našom prípade tvaru a matica regresných konštánt Na výpočet Žežulových odhadov neznámych parametrov budeme potrebovať maticu definovanú vzťahom. Po výpočte dostávame že je tvaru Žežulove odhady neznámych parametrov sú teda Na ich porovnanie s Ohlsonovými odhadmi budeme potrebovať ich variancie ktorých tvar máme vo vzťahoch a Jednoduchým výpočtom dostávame že ich hodnota je Pozrime sa teraz na Ohlsonov prístup. Pri tomto prístupe budeme potrebovať transformačnú maticu Tá je podľa vzťahu tvaru Ohlsonov odhad odhaduje vec variančnej matice a je definovaný ako Po jeho vyčíslení a usporiadaní do odhadu variančnej matice dostaneme jej odhad v tvare

206 204 FORUM STATISTICUM SLOVACUM 7/2011 Keďže diagonálne prvky tejto matice sú a mimodiagonálne sú tak Ohlsonovým prístupom dostávame odhady neznámych parametrov v tvare Potrebujeme ešte variancie týchto odhadov a teda variančnú maticu odhadu. Tvar tejto matice sme odvodili vo vzťahu (7). V našom prípade je to matica typu a preto ju nebudeme vypisovať celú. Zaujíma nás jej prvý prvok na hlavnej diagonále keďže tento prvok je variancia odhadu parametra pri Ohlsonovom prístupe. Výpočtom dostávame že táto variancia je a teda je rovnaká ako variancia Žežulovho odhadu parametra Vzťah hovorí že Žežulov odhad parametra vieme napísať ako podiel Ohlsonovho odhadu parametra a Ohlsonovho odhadu parametra Na základe tohto sú rovnaké aj odhady parametra 7. Záver V tomto texte sme ukázali Ohlsonov a Žežulov prístup k odhadovaniu neznámych parametrov v modeli rastových kriviek s rovnomernou korelačnou štruktúrou. Na základe variancie odhadov sme poukázali na rovnosť medzi týmito prístupmi. V poslednej kapitole sme ukázali aplikáciu týchto postupov na Potthoffových dátach. 8. Literatúra [1] Ohlson M. von Rosen D Explicit estimators of parameters in the Growth Curve model with linearly structured covariance matrices. In: Journal of Multivariate Analysis č [2] Žežula I Special variance structure in the growth curve model. In: Journal of Multivariate Analysis č Adresa autora: Rastislav Rusnačko Mgr. Prírodovedecká fakulta UPJŠ Jesenná Košice rastislav.rusnacko@student.upjs.sk Tento článok vznikol za podpory grantu VVGS PF 42/2011/M VEGA 1/0325/10 VEGA 1/0410/11.

207 FORUM STATISTICUM SLOVACUM 7/ Recent advances in multivariate statistical techniques Clustering European countries IT skills data with artificial neural networks Najnovšie pokroky vo viacrozmernej štatistike Zhlukovanie európskych štátov z hľadiska úrovne počítačových zručností pomocou umelých neurónových sietí Miroslav Sabo Abstract: In this paper we analyse multivariate Eurostat data with self-organizing maps (SOM). These belong to artificial neural networks algorithms and are able to visualize and analyse high-dimensional spaces in effective way. We are using Individual`s level of computer skills dataset from 2009 to find countries with similar values of 10 different computer skills indicators. After projection all countries to SOM map three well separated clusters were revealed. Moreover using additional component planes (that are available as graphical output of SOM) we described properties of each cluster. Differences between countries can be justified with different historical conditions and especially with later development of technologies in some European regions. Key words: cluster analysis Eurostat Kohonen maps self-organization multivariate data computer skills Abstrakt: V článku analyzujeme viacrozmerné dáta získané z Eurostatu metódou samoorganizujúcich sa máp (SOM) ktoré sa používajú na zobrazenie viacrozmerných dát do dvojrozmerného priestoru. Na analýzu sme použili dáta z roku 2009 v ktorých je každý z uvažovaných štátov popísaný desiatimi ukazovateľmi súvisiacimi s úrovňou počítačových zručností. Výsledkom analýzy boli identifikovanie troch zhlukov a následne ich popísanie. Získané výsledky korešpondujú s odlišnými historickými vývojmi jednotlivých štátov Európy. Kľúčové slová: zhluková analýza Eurostat Kohonenove mapy samo-organizácia viacrozmerné dáta počítačové zručnosti JEL classification: C38 C45 1. Introduction At the moment there is a large amount of applications of artificial neural networks (briefly ANN). They are able to easily handle multivariate data and give more accurate results than other multivariate methods. Especially data available on Eurostat website are often multivariate since objects can be European countries (or regions) and variables can be indices of some particular area. We selected Individual s level of computer skills table since this one is very suitable for multivariate analysis. Most published IT-skills statistics are only one-dimensional (only average level is always presented) therefore we decided to compare European countries w. r.

208 206 FORUM STATISTICUM SLOVACUM 7/2011 t. all features available. The aim is to find out if there are any similarities between countries and also to check if these similarities correspond to geographical or historical relations between assumed countries. For this purpose we are using artificial neural networks namely unsupervised self-organizing map also called Kohonen map (Kohonen 1997). This map can easily handle high-dimensional data that cannot be simply visualized. Specifically our dataset is 10 dimensional with strong nonlinear relations between variables what is extra suitable for ANN analysis. We have to note that there are also other methods on how to analyse this data (for example PCA method) we are using ANN since it can handle high dimensional data with nonlinear relations between variables (of course also graphical output of ANN is more sophisticated and helpful when comparing with other methods). As mentioned the task of this article is to compare European countries with respect to similarities according to 10 different computer skills indices. This is called clustering problem and in general ANN bring better results in this area than other mostly used clustering methods (hierarchical clustering k- means fuzzy clustering). In the past self-organizing maps have been successfully used in many areas when one deals with multivariate data for example in hydrology (Čistý 2009) finance (Bolton et al. 2002) or fraud detection theory (Gorbunov 1999). The rest of the article is organized as follows. In section 2 we describe the basic concepts of Kohonen maps in detail and in section 3 we apply the algorithm to Individual s level of computer skills data. 2. Artificial neural networks (ANN) Kohonen maps Kohonen maps are used for projecting high dimensional space (mainly spaces with more than 3 dimensions) to two or three dimensional space that can be easily visualized. Every map consists of some number of neurons arranged in two or three dimensional grid that can be either rectangular (then each neuron has 4 neighbors in case of von Neumann s neighborhood or 8 in case of Moore s neighborhood) or hexagonal (then each neuron is connected with 6 of its neighbours). In our case neurons are represented by hexagons see Figure 2. The aim of algorithm is to project all objects to neurons under the condition that similar objects should be projected to similar neurons (this is called topology preserving). If we want to find clusters we have to project all objects into two-dimensional space and identify similar objects. The advantage of such approach is that we also identify outliers in data that do not belong to any cluster. Algorithm producing such network can be briefly described as follows: Suppose that we have set of n objects (called input vectors) described by p features. Denote as M set of all neurons used in network (number of neurons is specified by user). Since neurons are organized in grid each neuron is represented by 2D coordinates in this grid. Denote grid coordinates of neuron i as i r. Sequential training algorithm (there is also a batch training algorithm but we are going to describe only the first one) then works in the following way: 1. Each neuron in grid is represented by its weight vector (also called prototype vector or codebook vector) that is p-dimensional. At first weight vector of each neuron is set randomly.

209 FORUM STATISTICUM SLOVACUM 7/ One of n objects is randomly chosen and the nearest neuron to that one is found (using Euclidean distance). This strategy is also called competitive learning or "winner takes all". The nearest neuron is named as best matching unit (BMU) more precisely i * i M i M p 2 = arg min x w = arg min ( x w ) (1) i where x = x x... x ) is randomly chosen object from dataset w = w w... w ) ( 1 2 p k= 1 k ik i ( i1 i 2 ip * is weight vector of i th neuron and i is the closest neuron to object x w.r.t Euclidean distance. 3. In the third step weight of each neuron is adjusted as follows w i t + 1) = w ( t) + α ( t). h ( t).( x( t) w ( )) i M (2) ( * i t i i i where w i (t) is weight of i-th neuron in t-th step x (t) is randomly chosen input vector in t-th step α (t) is speed of learning (also learning rate) in t-th step (function known in advance) and h i * ( t) i is some measure of neighborhood (also known before the algorithm starts). When the third step is done the algorithm goes to step 2 and randomly chooses another object from original dataset finds its BMU and adjusts weights of all neurons. The algorithm repeats these steps so many times as determined in advance. After all BMU is found for every of n-samples in dataset. Finally each sample is projected to the BMU neuron (of course more than one sample can be assigned to one neuron and vice versa there may be neurons that no sample was projected to them). Speed of learning Function α (t) takes values from interval < 01) and has to be decreasing with time. When it reaches zero the learning stops. There are some possible functions that can be used for example: 1 hyperbolic speed of learning α ( t) = t kt exponential speed of learning α ( t) = e for some constant k > 0 Neighborhood function This function describes which neurons will be adjusted in step 3. Therefore it measures neighborhood of neurons. Possible variants are: ri r * i Gaussian neighborhood function h * ( t) = exp( ) i i λ( t) where r i and r are coordinates of neurons i and * i decreasing to zero that ensures reducing the neighborhood 2 * i in grid and (t) λ is positive function

210 208 FORUM STATISTICUM SLOVACUM 7/2011 * rectangular neighborhood h i * ( t) = 1 i if d M ( i i ) λ( t) 0 otherwise * where d M ( i i ) is Manhattan distance of neurons i and * i in grid and (t) λ is function decreasing to zero (obviously in each time step the value of this function corresponds to radius of neighborhood of each neuron). U-matrix and component planes Graphical output of Kohonen map is so called U-matrix (unified distance matrix see Fig. 2 left) (Alhoniemi et al. 2011). Colour of each neuron in U-matrix represents Euclidean distance between all neighboring neurons in original grid (i.e. at the end of sequential training algorithm Euclidean distance between all neighboring neurons in grid is computed and represented by colour). Therefore large distances can be interpreted as cluster margins. Another graphical output of Kohonen map are component planes see Fig. 2 right. From these we can easily read properties of objects that were projected in some part of U-matrix. 3. Preprocessing and analyzing data In this section we first describe data in detail then preprocess them and analyse by clustering. We are using data from 2009 (the latest available data in this category) that capture computer skills of 33 European countries described by these 10 indicators: Individuals who have copied or moved a file or folder (denoted as V2) Individuals who have used copy or cut and paste tools to duplicate or move information on screen (V3) Individuals who have used basic arithmetic formulas to add subtract multiply or divide figures in a spreadsheet (V4) Individuals who have compressed files (V5) Individuals who have written a computer program using a specialised programming language (V6) Individuals who have connected and installed new devices e.g. a printer or a modem (V7) Individuals who have not done any of i_cms i_ccpy i_ccpps i_csum i_czip i_cprg (V8) where I_CMS is a percentage of individuals who have used a mouse to launch programs such as an Internet browser or word processor. I_CCPY is a percentage of individuals who have copied or moved a file or folder I_CCPPS is a percentage of individuals who have used copy or cut and paste tools to duplicate or move information on screen I_CSUM is a percentage of individuals who have used basic arithmetic formulas to add subtract multiply or divide figures in a spreadsheet I_CZIP is a percentage of individuals who have compressed files I_CPRG is a percentage of individuals who have written a computer program using a specialised programming language

211 FORUM STATISTICUM SLOVACUM 7/ Individuals who have carried out 1 or 2 of the computer related activities (V9) Individuals who have carried out 3 or 4 of the computer related activities (V10) Individuals who have carried out 5 or 6 of the computer related activities (V11) Table 1(left) : Percentages of individuals of 10 assumed computer skills indicators Figure 1 (right): Boxplots of 10 assumed variables Source: Own construction using data from We selected data of all aged individuals and percentages of individuals of total population were assumed unit. Moreover there were a further 4 objects added to the 33 already considered countries in order to find out what countries are they most similar to. Summary values of former 15 countries of European Union (denoted as European Union 15) Summary values of former 25 countries of European Union (denoted as European Union 25) Summary values of 27 countries of European Union (denoted as European Union 27) Whole Euro area countries (Euro area) Entire resulting dataset can be seen in Table 1. In further analyses we will be using open-source statistical language R (R Development Core Team 2007) and Matlab (The MathWorks Inc. 2010) with SOM toolbox (Alhoniemi et al. 2011) that allows ANN analysis. We first displayed boxplots of all 10 variables (see Figure 1) to find out if all have the same variance. Since this was not true (compare for example variables V7 and V8) before cluster analysis we first standardized data using z-scores. After preprocessing phase we loaded data into Matlab and using SOM toolbox we displayed U-matrix (Fig. 2 left). As we mentioned in section 2 U-matrix is used for visual identifications of clusters in data. In U-matrix cluster margins are represented by white areas (long distances between neighboring neurons). We can easily see 3 clear clusters; the first one

212 210 FORUM STATISTICUM SLOVACUM 7/2011 is situated in the upper part of U-matrix and consists of Poland Macedonia Serbia Bulgaria Greece Romania and Turkey. The second one is situated in the lower part of U-matrix consisting of Germany Finland Iceland Austria France Luxembourg and Netherlands. All other countries with 4 summary European statistics objects were projected to the middle part of U-matrix. From these findings and using component planes described later we can conclude that clustering with 10 computer skills indicators created following 3 clusters: cluster 1 consists of countries with very low level of all 10 computer skills (7 countries in total) cluster 2 consists of countries with very high level of computer skills (9 countries) and the last one is created by 17 European countries that are characterized by medium level of computer skills. Four European summary statistics objects were projected to this cluster which is not a surprise since these 4 represent average values of selected European countries. Moreover from U-matrix we can also find out that from all European countries Slovenia has the most similar computer skills indicators to average values in Europe since it has been projected to the same neuron as European Union 25 and European Union 27 objects. When looking at the second cluster we can see that France Luxembourg and Netherlands were projected far from other objects of this cluster what indicates extra computer skills of individuals of these countries. Figure 2: U-matrix (left) and component planes for all variables (right) Source: Own construction using Matlab and SOM toolbox From component planes (see Fig. 2 right) we can read properties of created clusters. These planes describe properties of all neurons i.e. what values take variables on objects projected to specific neurons. White colour corresponds to high values while black to low values. It can be seen that planes for variables V2 V3 V4 V5 V6 V7 V10 and V11 are

213 FORUM STATISTICUM SLOVACUM 7/ very similar what indicates high correlations between this variables see also Pearson correlations in Table 2. Variables V8 (Individuals who have not done any of i_cms i_ccpy i_ccpps i_csum i_czip i_cprg) and V9 (Individuals who have carried out 1 or 2 of the computer related activities) significantly differ from other ones and there are only weak linear correlations between them and the rest of the 8 variables. Moreover it is interesting that there are countries from different clusters that take large values of these variables. On the contrary when assuming the rest of the 8 variables they uniformly differ from cluster to cluster i.e. lower cluster has always the biggest values and the upper one lowest. Table 2: Pearson correlations of variables Source: Own construction using R language 4. Conclusion In this article we have described an attempt of analysis of multivariate data using ANN. We proposed on how to use SOM technique to find similarities between data to identify clusters and to analyse their properties. Final result indicates 3 well separated clusters the first one (consisting of countries with low level of computer skills) is created by eastern Europe countries. The second one is characterized with very high level of IT skills and consists of northern and north-west European countries together with Austria. The last one (medium level of IT skills) is created by all other countries mainly central Europe south and south-east countries. Possible causes of such a division may be primarily historical since in eastern European countries computers were introduced into everyday life later then in the rest of the European countries. Acknowledgments This work was supported by VEGA 1/0103/10. References [1] ALHONIEMI E. J. HIMBERG J. PARHANKANGAS and J. VESANTO. Som toolbox version 2.0 beta. Last accessed February [2] BOLTON J.R. and HAND D.J. Unsupervised Profiling Methods for Fraud Detection Technical Report (Department of Mathematics Imperial College London) [3] ČISTÝ M. Využitie umelých neurónových sietí typu SOM pri riešení vodohospodárskych problémov krajiny. Acta Hydrologica Slovaca ročník číslo 2 pp

214 212 FORUM STATISTICUM SLOVACUM 7/2011 [4] GORBUNOV A. Application of the Self-Organizing Map in Business and Finance Bank Technologies 4 Wasserman Neural Computing: Theory and Practice pp [5] KOHONEN T. Self-Organizing Maps. Series in Information Sciences Vol. 30. Springer: Heidelberg. Second ed [6] MATLAB version 7.6. Natick Massachusetts: The MathWorks Inc [7] R DEVELOPMENT CORE TEAM (2007) R Development Core Team R: A Language and Environment for Statistical Computing R Foundation for Statistical Computing Vienna. [cit ] [cit ] [cit ] en. Adresa autora: Miroslav Sabo Mgr. Katedra matematiky a deskriptívnej geometrie Stavebná fakulta STU v Bratislave Radlinského Bratislava miro165sabo@gmail.com

215 FORUM STATISTICUM SLOVACUM 7/ Makroekonomická statistika České Republiky v letech Macroeconomic Statistics for the Czech Republic in Jaroslav Sixta Jakub Fischer Abstract: The system of macroeconomic indicators has been used for long time. Since 1950s these indicators are formalised in the form of accounts. Currently developed countries use statistical model called a System of National Accounts (SNA). This mode has a long tradition in western countries but in former Soviet bloc a different system called Material Product System (MPS) was used. Both systems have many similar features but they differ in the scope. The paper deals with the transition from Material Product System to System of National Accounts and shows key elements of both statistical systems. Key Words: MPS SNA GDP National Income Abstrakt: Systémy makroekonomických ukazatelů jsou využívány již poměrně dlouhou dobu ale teprve od padesátých let minulého století získávají podobu účtů. Rozvinuté země dnes používají statistický model nazývaný systém národního účetnictví (SNA). Tento model má dlouhou tradici v západních zemích ale v zemích sovětského bloku byl užíván systém tzv. materiálního produktu (MPS). Základní rysy obou systému jsou obdobné liší se však především v míře záběru. Tento text je věnovaný přechodu ze systému materiálního produktu k systému národního účetnictví a ilustruje základní stavební prvky obou systémů. Kľúčové slová: MPS SNA HDP národní důchod JEL classification: E01 C01 1. Foreword The development of statistical tools for description of economy has been quite fast since 1950s. The System of National Accounts became famous in for its standard SNA 1968 in the West. Contrary to it socialist countries used similar system aimed at material production called Material Product System (MPS). In 1980s the statistical systems in post-communist countries were also transformed from MPS to SNA for the purposes of international comparisons. Finally MPS was totally overcome by SNA when Communist regimes collapsed. Before 1989 it was supposed to find a common system covering both approaches (SNA and MPS) but it was rejected and SNA was adopted in the Central and East Europe as well. During 1990s European System of Accounts (ESA 1995) was being implemented in the EU and this was a complication for transforming countries. Another important events like accession to the EU and harmonization of statistics caused that many new member states of the EU are able to compile national accounts since 1995 onwards. Moreover the SNA 2008 was adopted and in 2014 the EU countries will have adopt ESA 2010 (small differences from SNA 2008). Similar situation is in the Czech Republic official data for national accounts are published since 1995 onwards. The Czech Statistical Office intends to revise goods and services account for and therefore basic economic indicators will be available. Anyway official statistics will never deal with the past (before 1989). The aim of our project is prepare time series of gross domestic product (GDP) for both at current prices and volume indices. Due to the lack of data on series of GDP for central and east European countries the possibility of long-term economic analyses is very limited. We consider the US 1 This paper is prepared under the support of the project Historical Time Series of Gross Domestic Product of the Czech Republic of the Czech Science Foundation project No. P402/10/1275.

216 214 FORUM STATISTICUM SLOVACUM 7/2011 data starting in 1929 as optimal. Statistical systems in the East were subordinated to the political system and Soviet model had to be used. The main difference was in the scope that was covered by the system. What was different to material products and what was used outside of productive industries was not covered. There are also some specific features that complicate the issue. The first is that the Czech Republic was established in 1993 and former international cooperation programmes were prepared only for Czechoslovakia. The second is the time that lasted from 1990s and many skilled experts left the Statistical Office or even died. The last but not least are the catastrophic floods in 2002 that destroyed the Czech Statistical Office (mainly library) and lots of data were lost. 2. Main Differences Between SNA and MPS Both MPS and SNA are aimed at the description of the economy by sets of tables (accounts) and input-output tables. The key concept of presentation of increase of wealth - production generation and distribution of income is very similar. The most important difference is that MPS does not cover non-productive sphere. It means some market services and non-market services in nowadays terms. Services like education health or personal transport were not recorded within the system. Data for such services were presented in additional tables in financial balance. The explanation of this issue was that these services are financed by productive sphere of the economy. It is clear that even the socialist system was material oriented it was not correct. If we focus on education the outcome of the service (education process) is knowledge. From nowadays perspective it is a very valuable thing. The main indicators are described in table 1. Table 1: Main indicators of both systems System MPS SNA Output Global product covering material goods and services for material sphere Intermediate consumption Current costs covering consumption of material sphere including depreciation Output covering both market and non-market products. Products are broadly defined. Intermediate consumption of market and non-market producers Domestic product (value added) National income (net) Gross value added / gross domestic product Private consumers Personal consumption of Household consumption of material goods products Collective consumers Social consumption of Intermediate consumption of material goods non-market producers Investments Investments Capital formation Foreign trade Export/import Export/import As there is a key role of output in SNA in MPS the global product had a similar meaning. Global product covered material production and services for material sphere. Services provided to households or to non-productive sphere were not covered. Currently we distinguish market output output for our final use and other non-market output in SNA. It means that this concept covers a lot of different activities. Gross value added (GVA) is defined as a difference between output and intermediate consumption (current cost) and the meaning in both concepts were similar. The most important indicator of SNA gross domestic products (GDP) expressed as a sum of GVA and net taxes on products had its counterpart in national income in MPS. But the meaning of national income was different from nowadays national income covering GDP and net primary incomes with non-residents. Indicators of

217 FORUM STATISTICUM SLOVACUM 7/ expenditure approach 2 to GDP were similar but there were also methodical differences table 1 shows the most important indicators of both systems. 3. Methodology We use transformation of existing macroaggregates and this approach is different to official statistics. Originally aggregates are compiled on the basis of surveyed data model adjustments and balancing adjustments. This bottom-up method is not possible today and therefore we studied the differences between both methodologies. Macro indicators like global output and intermediate consumption (based on MPS) are transformed into output and intermediate consumption in SNA methodology. Adjustments representing the most important differences between MPS and SNA are following: a) non-material sphere b) non-market producers (part of non-material sphere) c) dwelling services (imputed rent) d) financial services (FISIM) e) other adjustments. Some issues cannot be reconstructed due to the lack of data e.g. illegal or shadow activities that are difficult to measure and therefore these activities will be covered by item other adjustment. The value of other adjustments will be derived from the difference between official data and model data for The first issue was to change used classification because national accounts are being compiled in NACE rev.2 since Original MPS data are based on very old classification influenced by socialism. We carried out rough transformation based on the similarity and derived share for some specific issues. The most important data sources are following: a) input-output table for 1973 from 28x28 transformed into 25x25 b) input-output table for 1978 from 30x30 transformed into 25x25 c) supply and use tables for 1992 from 60x28 transformed into 25x25. The transition of original MPS aggregates is based on following steps 3 : 1. Original input-output tables for the Czech Socialist Republic ( ) and for Czechoslovakia ( ) represent the basic data sources 2. Using existing data for non-productive sphere and diving it between market and nonmarket industries 3. Estimate methodical adjustments given by NA rules (imputed rent self-supply illegal activities etc.) 4. Compare estimates for the Czech Republic with former Czechoslovak estimates. 5. Estimates of nominal GDP for time series Volume estimates for Generally the adjustments can be correctly derived for the years with input-output tables; it means 1973 and Since we have to estimate series we use model approach for other years (mainly extrapolation). Due to the nature of adjustments the most important is non-productive sphere and its division into market and non-market output. The division is based on current approach. According to ESA 1995 the non-market producer is a producer whose sales cover less than 50% of the costs. A positive thing is that input-output tables compiled in Czechoslovakia are very close to current concept of symmetric input- 2 Expenditure approach is represented by the sum of final expenditures (consumption capital formation and net export). 3 More details can be found in (Arvay 1992) or in Comparisons of the System of National Accounts and the System of Balances of the National Economy (part I and II).

218 216 FORUM STATISTICUM SLOVACUM 7/2011 output tables. These tables are more similar than balance of national income 4 accounts. to sector 4. Transition from National Income to Gross Domestic Product Currently we have provisional estimates adjustment of national income. These estimates will be finished by December Gross domestic product is between 116% and 130% of national income. The growth of GDP is faster than the growth of national income since 1980s see figure 1. It means that the importance of services was rising from 1980 and national income based on MPS methodology was not able to record it % 1232% 1216% 1214% 1192% 1200% 1168% 1185% 1226% 1267% 1274% 1263% 1247% 1270% 1300% 1250% GDP current prices National income current prices (used) GDP/Nationa Income % % 1150% 1100% 1050% 1000% Figure 1: GDP and National income current prices mil. CZK % The same method is used for expenditure approach. The most important adjustments were done in household consumption. The composition of different adjustments is seen in figure 2. In 1989 original personal consumption was 233 CZK bil non-productive services 31 CZK bil and transport services 8 CZK bil. Total adjustments including FISIM imputed rent and other adjustments count about 20% of original personal consumption. Beside household consumption inventories are adjusted for losses and differences published in inputoutput tables. Investments are not adjusted because we suppose that total investment do not significantly differ from gross fixed capital formation % 900% 850% 800% Other adjustments - Transport services - Market non-productive - Non-market - Dwellings - FISIM - Personal consumption Figure 2: Household consumption mil. CZK The final part of our project is a volume estimate of GDP. The core consists in the deflation of national income and separate deflation of different adjustments. Initial adjustments 5 were based on national income at constant prices see figure 3. We will use 4 Methods of the Compilation of Sources and Uses of Global Product and National Income Other issues were published in (Sixta Fischer 2008)

219 FORUM STATISTICUM SLOVACUM 7/ modern approach deflation into previous years prices and chain-linking. We intend to publish this last stage on input-output conference in Bratislava in summer Czechoslovakia national income volumes Czech R. national income volumes Figure 3: Czech and Czechoslovak national income y-o-y change previous year = 100 T 5. Conclusion Long time series of GDP are important not only for economic analyses but they also show the general level of statistics of the country. The most developed countries have a lot of information on the development and GDP time series is on the most important. Unfortunately new members of the EU have data on GDP since A good example that should be followed is the US BEA that offers GDP series starting in 1930s. Our project is aimed at the reconstruction of GDP for The Czech Statistical Office has official figures since The reconstruction of GDP for the period of socialism is being prepared in the close cooperation with the Czech Statistical Offices. Final figures will be consistent with SNA 1993 and ESA 1995 because updated standards of national accounting will take place in The GDP reconstruction is based on transition from MPS macroaggregates to SNA indicators. Finally the goods and services account should be prepared. Current prices estimates are nearly finished and volume indices of GDP should be prepared by December References [1] Arvay J.: The Material Product System (MPS): A Retrospective. Twenty-second General Conference of the International Association for Research of Income and Wealth (IARIW) Switzerland [2] Comparisons of the System of National Accounts and the System of Balances of the National Economy Part One. United Nations [3] Comparisons of the System of National Accounts and the System of Balances of the National Economy Part Two. United Nations [4] European System of Accounts (ESA 1995). Eurostat Luxembourg [5] Methods of the Compilation of Sources and Uses of Global Product and National Income. Federal Statistical Office of Czechoslovakia Prague [6] Selected Indicators of the Balance of Sources and Uses of Global Product and National Income Czech Statistical Office Prague 1987.

220 218 FORUM STATISTICUM SLOVACUM 7/2011 [7] SIXTA Jaroslav FISCHER Jakub. Estimates of the historical GDP series for the Czech Republic ( ): Methodological issues. Radenci In: Statistical Days. Ljubljana [8] SIXTA Jaroslav FISCHER Jakub. Retrospective Measures of GDP Using Input-output Tables for Former Czechoslovakia. Alexandria USA [9] Statistical Yearbook 1990 Federal Statistical Office of Czechoslovakia Prague [10] System of National Accounts 1968 (SNA 1968). United Nations New York [11] System of National Accounts 1993 (SNA 1993). United Nations New York [12] Yearbook of Historical Series Federal Statistical Office of Czechoslovakia [13] Adresa autora (-ov): Jaroslav Sixta Ing. Ph.D. Vysoká škola ekonomická v Praze Náměstí W. Churchilla Praha 3 sixta@vse.cz Jakub Fischer doc. Ing. Ph.D. Vysoká škola ekonomická v Praze Náměstí W. Churchilla Praha 3 fischerj@vse.cz

221 FORUM STATISTICUM SLOVACUM 7/ Príspevok k metódam hodnotenia inovačnej výkonnosti krajín EÚ Contribution to the methods of evaluation of innovation performance EU countries Iveta Stankovičová Abstract: The new Innovation Union Scoreboard (IUS) has been adapted to help monitor the implementation of the Europe The IUS is providing a comparative assessment of the innovation performance of the EU27 Member States. The new list of 25 indicators in the IUS 2010 captures better the performance of national research and innovation systems. The aim of the article is to analyse the results of multidimensional evaluation of innovation performance of the EU member states. We would like to show that multivariate methods as principal component analysis (PCA) and factor analysis (FA) lead to the similar results as are by the IUS 2010 methodology. Key words: innovation EU countries innovation performance summary innovation index (SII) multidimensional statistical method SAS Enterprise Guide system Kľúčové slová: inovácie krajiny EÚ inovačná výkonnosť súhrnný ukazovateľ inovácií viacrozmerné štatistické metódy systém SAS Enterprise Guide JEL classification: C10 D22 O31 1. Úvod Inovácie a inovačná schopnosť podnikov je v súčasnosti považovaná za nevyhnutnú podmienku konkurencieschopnosti na globálnych trhoch. V meniacom sa podnikateľskom prostredí ktorého hnacou silou sú stále náročnejšie požiadavky zákazníkov zvyšujúca sa konkurencia technologický rozvoj a globalizácia sú inovácie prostriedkom na prispôsobenie sa týmto zmenám (Okruhlica 2011 s. 72). Inovácie sú celosvetovo považované za jednu z možností ako urýchliť prechod z pokrízovej ekonomiky na silnejšiu a trvalo udržateľnú ekonomiku. Hoci nejde o riešenie pre všetky svetové problémy inovácie poskytujú základ pre nové odvetvia podniky a pracovné miesta. Inovácie sú nevyhnutné pre zvýšenie konkurencieschopnosti diverzifikáciu ekonomických aktivít a pohyb smerom k činnostiam s vyššou pridanou hodnotou. Vlády členských krajín sa snažia inovačné procesy vo svojich krajinách podporovať ale aj riadiť prostredníctvom svojich politík. Európska komisia rozlišuje 3 stupne (generácie) inovačnej politiky. Inovačná politika prvej generácie bola zameraná na právny regulačný a finančný rámec inovačných aktivít. Inovačná politika druhej generácie zdôrazňovala a stále zdôrazňuje systémový prístup a význam infraštruktúr podporujúcich inovácie. Inovačná politika tretej generácie má za úlohu zabezpečiť aby sa inovácie stali integrálnou súčasťou všetkých politík. Inovácie hrajú teda zásadnú úlohu v prebiehajúcej ekonomickej politickej a sociálnej transformácii štátov EÚ ako aj ich regiónov. V rámci Európskej únie sa pravidelne uskutočňuje analýza ktorej názov je v súčasnosti Innovation Union Scoreboard (IUS) 1 ktorá hodnotí stav v oblasti inovačnej výkonnosti členských krajín EU27. Ide o viackriteriálne hodnotenie ktoré ako výsledok poskytuje určitý benchmarkový pohľad na jednotlivé aspekty inovačnej výkonnosti krajín ako celkov. Táto analýza má pomôcť Európskej komisii pri monitorovaní implementácie cieľov stratégie Európa Výsledky analýzy sú každoročne uverejnené na webovej stránke PRO INNO Europe. 1 V roku 2010 bol European Innovation Scoreboard (EIS) premenovaný na Innovation Union Scoreboard (UIS).

222 220 FORUM STATISTICUM SLOVACUM 7/2011 Cieľom tohto príspevku je ukázať že sú aj iné možnosti a metódy zostavovania hodnotiacich rebríčkov na základe viacerých ukazovateľov a prinášajú podobné výsledky. 2. Metodika a dáta Európsky systém inovačného bodovania (Innovation Union Scoreboard - IUS) je nástroj vyvinutý z iniciatívy Európskej komisie v rámci Lisabonskej stratégie. Má za úlohu komparatívne hodnotiť inovačnú výkonnosť členských krajín EÚ27 ale aj iných európskych krajín konkrétne: Nórsko Švajčiarsko Srbsko a kandidátske krajiny do EÚ: Chorvátsko Island Macedónsko a Turecko. Hodnotenie je založené na širokom spektre relatívnych ukazovateľov ktoré pokrývajú štruktúrne podmienky pre inovačné procesy tvorbu vedomostí pre inovácie inovácie na úrovni firiem výkonnosť a výstupy z inovácií vo forme produktov a služieb. Toto hodnotenie sa robí každoročne od roku V porovnaní s predchádzajúcim rokom sa počet ukazovateľov znížil z 29 (rok 2009) na 25 (rok 2010) a niektoré ukazovatele boli zmenené. Súbor 25-tich hodnotiacich ukazovateľov je rozdelený do troch základných blokov 2 a ôsmich podskupín takto: 1. Možnosti (Enablers) - 8 ukazovateľov ktoré majú za cieľ ohodnotiť hlavne externé vstupy pre inovačné aktivity firiem. Tento blok sa delí ešte na 3 podskupiny: 1. ľudské zdroje (3 ukazovatele predtým 5) 2. systémy výskumu (3 ukazovatele úplne nové) a 3. financie a podpora (2 ukazovatele predtým 4). 2. Činnosť firiem (Firm activities) - 9 ukazovateľov ktoré majú ohodnotiť inovácie na úrovni podnikov v troch inovačných dimenziách (3 podskupiny): 1. firemné investície (2 ukazovatele predtým 3) 2. spolupráca a podnikanie (3 ukazovatele ale zmenené) a 3. intelektuálne vlastníctvo (4 ukazovatele - zmenené). 3. Výstupy (Outputs) - 8 ukazovateľov ktoré majú charakterizovať a ohodnotiť výstupy inovačných aktivít firiem v členských krajinách v dvoch dimenziách (2 podskupiny): 1. inovátori (3 ukazovatele - zmenené) 2. ekonomické efekty (5 ukazovateľov zmenené). Údajovú základňu pre vybrané ukazovatele predstavujú oficiálne výberové štatistické zisťovania v krajinách EÚ organizované Eurostatom (napr. dáta z CIS = Community Innovation Survey) a tiež dokumenty a štatistiky OECD UN Comtrade Science Metrix Scopus (Elsevier) CWT (Thomson Reuters) a OHIM 3. Získané hodnoty vstupných 25 ukazovateľov pre sledované krajiny sa potom upravia a prepočítajú na skóre. Na základe skóre ukazovateľov sa ďalej vypočítajú hodnoty pre 8 kompozitných indikátorov. Používa sa nevážený aritmetický priemer z ukazovateľov danej podskupiny. Kompozitných ukazovateľov je teda 8 tak ako je 8 podskupín ukazovateľov. Hodnoty kompozitných indikátorov sú v normovanom tvare a preto nadobúdajú hodnoty len z intervalu <0 1>. Presný metodologický postup výpočtu normovaných skóre za kompozitné indikátory a databáza 4 týchto údajov je k dispozícii na webovej stránke PRO INNO Europe ( Dáta využijeme pre potreby tohto článku. Údaje za rok 2010 s použitými skratkami uvádzame v tabuľke 6 v prílohe článku. Sú to údaje za 34 európskych krajín (t.j. 27 krajín EU a 7 iných európskych štátov) a priemer za krajiny EU27. Pre Island však nebol zistený údaj za jeden kompozitný indikátor (I_10) preto bude z našej analýzy vylúčený (teda n = 34). 2 Presný a podrobný popis všetkých 25 indikátorov a tiež metodologický postup pre výpočet skóre pre jednotlivé indikátory a aj hodnoty SII je možné nájsť v Innovation Union Scoreboard Methodology report (January 2011): 3 OHIM - Úrad pre harmonizáciu (obchodné značky a dizajny) Office for Harmonization in the Internal Market (Trade Marks and Designs) 4 Innovation Union Scoreboard 2010 Database:

223 FORUM STATISTICUM SLOVACUM 7/ Kompozitných indikátorov je osem toľko koľko je podskupín vytvorených z 25 vstupných ukazovateľov. Použité skratky a popis kompozitných indikátorov je nasledovný: 1. HR_10 ľudské zroje (Human resources) 2. RS_10 výskumné systémy (Research systems) 3. FAS_10 financie a podpora (Finance and support) 4. FI_10 podnikové investície (Firm investments) 5. LAE_10 - spolupráca a podnikanie (Linkages & entrepreneurship) 6. IA_10 - duševné vlastníctvo (Intellectual assets) 7. I_10 - inovátori (Innovators) 8. EE_10 - ekonomické efekty (Economic effects). Na základe týchto kompozitných indikátorov sa potom počíta úhrnný (zložený) inovačný index (Summary Innovation Index - SII) pre každú krajinu za analyzovaný rok. Tento index sa v IUS vypočíta ako nevážený aritmetický priemer z uvedených ôsmich normovaných kompozitných indikátorov čiže každý indikátor má rovnakú váhu v hodnotení. Úhrnný inovačný index (SII) dosahuje teda tiež hodnoty z intervalu <0 1>. Na základe hodnôt SII sa súbor krajín v hodnotení IUS 2010 rozdeľuje do štyroch skupín podľa nasledujúcich pravidiel: inovační lídri sú krajiny ktoré dosiahli v sledovanom roku vyšší SII až o 20% ako bol priemerný SII krajín EU27; medzi inovačných nasledovníkov patria krajiny ktoré dosiahli SII okolo priemeru EU27 viac ako 20% pod a menej ako 10% nad priemerom EU27; medzi miernych inovátorov sa zaradia krajiny ktoré dosiahli nižšie hodnoty SII ako bol priemer EU27 konkrétne o viac ako 50% pod a menej ako 10% pod priemerom EU27; medzi dobiehajúcich inovátorov patria krajiny ktorých hodnoty SII sú nižšie ako 50% pod priemerom EU27. Obrázok 1: Rebríček krajín EU27 na základe ich inovačnej výkonnosti (rok 2010) Zdroj: IUS 2010 Na základe hodnotenia IUS 2010 (priemerná hodnota v EU pre SII sa rovnala číslu 0.516) boli hodnotené krajiny rozdelené do štyroch skupín podľa dosiahnutých hodnôt SII takto (Obrázok 1 a Obrázok 2): 1. Inovační lídri (innovation leaders) dosiahli SII v intervale ( > a patrili sem 4 krajiny EÚ: Švédsko Dánsko Fínsko Nemecko a Švajčiarsko. 2. Inovační nasledovníci (innovation followers) dosiahli SII v intervale ( > a bolo to až 10 krajín EÚ a Island: Veľká Británia Belgicko Rakúsko Holandsko Írsko

224 222 FORUM STATISTICUM SLOVACUM 7/2011 Luxembursko Francúzsko Cyprus Estónsko Slovinsko. Patrí sem aj Island ktorý sa do našej analýzy nedostal lebo mu chýbal údaj za jeden kompozitný indikátor. 3. Mierni inovátori (moderate innovators) dosiahli SII v intervale ( > a do tejto skupiny patrí 9 krajín EÚ: Česká republika Grécko Maďarsko Taliansko Malta Poľsko Portugalsko Slovensko Španielsko a aj Chorvátsko a Nórsko. 4. Dobiehajúce krajiny resp. slabí inovátori (modest innovators) dosiahli SII len v intervale < > a sú to tieto 4 krajiny EÚ: Bulharsko Litva Lotyšsko a Rumunsko a tiež 3 kandidujúce krajiny: Srbsko Macedónia a Turecko. Obrázok 2: Rebríček 34 krajín za rok 2010 na základe úhrnného inovačného indexu SII_10 Zdroj: vlastné výpočty 3. Výsledky na základe PCA a faktorovej analýzy V tejto časti ukážeme že sú aj iné spôsoby na hodnotenie krajín na základe viacerých ukazovateľov v porovnaní s postupom použitým v IUS Je možné použiť viacrozmerné štatistické metódy konkrétne analýzu hlavných komponentov (PCA) alebo faktorovú analýzu (FA). Sú to v literatúre podrobne popísané metódy (napr. Stankovičová Vojtková 2007) preto sa o nich nebudeme v článku rozpisovať a uvedieme len dosiahnuté výsledky. Obe spomínané metódy sú vhodné len pre vzájomne korelované premenné. V korelačnej matici kompozitných ukazovateľov sú všetky koeficienty korelácie vyššie ako 0.5 a štatisticky významné (všetky p-hodnoty < ). Hodnota celkovej KMO štatistiky je takmer 0.83 a pre jednotlivé premenné sú KMO miery tiež vysoké vyššie ako 0.77 (Tab. 1). Signalizuje to veľmi vysokú vhodnosť týchto dát pre zvolené viacrozmerné metódy. Pretože jednotlivé kompozitné indikátory sú už normované hodnoty stačí pri výpočtoch pre PCA aj FA vychádzať z nekorigovanej kovariančnej matice indikátorov.

225 FORUM STATISTICUM SLOVACUM 7/ Výsledky PCA ukazujú že prvý hlavný komponent (PRIN1) vytvorený z 8 indikátorov vysvetľuje takmer 93% celkovej variability dát (92.83% Tab. 5) a je vysoko korelovaný s pôvodnými hodnotami všetkých 8 indikátorov (Tab. 2). Môžeme ho teda pokladať za úhrnný index inovačnej výkonnosti krajín vytvorený na základe kompozitných indikátorov (alternatívny ukazovateľ pre SII). Na základe komponentných skóre PRIN1 je možné priamo vytvoriť rebríček hodnotenia analyzovaných krajín. Vytvorený prvý hlavný komponent PRIN1 má tiež vysoký korelačný koeficient (0.993) so súhrnným inovačným indexom SII vypočítaným podľa metodiky IUS 2010 (Tab. 2). Tab. 1: Hodnoty KMO miery pre kompozitné indikátory Kaiser's Measure of Sampling Adequacy: Overall MSA = HR_10 RS_10 FAS_10 FI_10 LAE_10 IA_10 I_10 EE_ Tab. 2: Koeficienty korelácie kompozitných indikátorov s hlavným komponentom PRIN1 Pearson Correlation Coefficients SII_10 HR_10 RS_10 FAS_10 FI_10 LAE_10 IA_10 I_10 EE_10 PRIN Na základe použitia faktorovej analýzy vykonanej metódou maximálnej vierohodnosti sme aj otestovali hypotézy či jeden lebo viac spoločných faktorov je možné extrahovať zo skúmaných dát (Tab. 3). Z výsledku je zrejmé že je možné extrahovať minimálne 1 a maximálne 4 faktory. Z hodnoty vlastných čísiel je však zrejmé že prvý nerotovaný faktor vysvetľuje viac ako 90% variability a ostatné 3 faktory už len malé množstvo. Preto môžeme tento 1. faktor považovať za súhrnný index inovačnej výkonnosti. Tab. 3: Test významnosti pre rôzny počet faktorov Significance Tests Based on 34 Observations Test DF Chi-Square Pr >ChiSq H0: No common factors <.0001 HA: At least one common factor H0: 1 Factor is sufficient HA: More factors are needed H0: 2 Factors are sufficient HA: More factors are needed H0: 3 Factors are sufficient HA: More factors are needed H0: 4 Factors are sufficient HA: More factors are needed Na základe komponentného skóre PRIN1 (hodnota PRIN1 pre EU je Tab. 6) boli analyzované krajiny rozdelené do štyroch skupín podľa dosiahnutých hodnôt. Pre stanovenie hraníc intervalov sme použili rovnaký postup ako bol použitý v IUS 2010 a je vyššie popísaný. Dostali sme nasledovné výsledky (Obrázok 3): 1. Inovační lídri (innovation leaders) dosiahli PRIN1 v intervale ( > a zaradilo sa sem až 6 krajín z toho 5 krajín EU: Dánsko Fínsko Nemecko Švédsko Belgicko a Švajčiarsko. Belgicko nepatrilo do tejto skupiny na základe hodnotenia IUS Inovační nasledovníci (innovation followers) dosiahli PRIN1 na úrovni priemeru EÚ konkrétne v intervale ( >. Patrí sem až 10 krajín (z toho 9 krajín EÚ): Veľká Británia Holandsko Rakúsko Luxembursko Írsko Francúzsko Estónsko Cyprus Slovinsko a tiež Nórsko.

226 224 FORUM STATISTICUM SLOVACUM 7/ Mierni inovátori (moderate innovators) dosiahli PRIN1 v intervale ( > a do tejto skupiny sa dostalo 10 krajín: Portugalsko Taliansko Česká republika Španielsko Grécko Maďarsko Malta Poľsko Litva a ja Chorvátsko. Slovensko však sem už nepatrí a spadlo o skupinu nižšie. 4. Dobiehajúce krajiny (modest innovators) dosiahli PRIN1 len v intervale < > a je to týchto 7 krajín: Slovensko Rumunsko Bulharsko Lotyšsko a tiež kandidátske krajiny Macedónia Srbsko a Turecko. Obrázok 3: Rebríček krajín 2010 na základe prvého hlavného komponentu PRIN1 Zdroj: vlastné výpočty 4. Záver Na základe výsledkov je možné konštatovať že celkovo nie sú veľké rozdiely v poradiach získaných metódou hlavných komponentov resp. faktorovou analýzou a hodnotením podľa IUS Získané dáta sú vysoko korelované a preto vhodné na PCA resp. FA. Z takýchto dát je možné vytvoriť a extrahovať už len jeden hlavný komponent resp. faktor ktorý možno pokladať za súhrnný index a potom sa dá na základe jeho hodnôt určiť poradie štatistických jednotiek (krajín) v súbore. Z hodnotenia IUS 2010 a aj našej analýzy vyplynulo že Slovensko si celkovo nestojí dobre v inovačnej výkonnosti. V našom rebríčku sa dokonca dostalo až do poslednej skupiny dobiehajúcich krajín. V podmienkach globálnej ekonomiky sa pre SR do budúcna ukazujú ako neudržateľné stratégie typu nízko nákladovej ekonomiky využívajúce v súčasnosti ešte sčasti existujúce komparatívne konkurenčné výhody na báze nízkych nákladov (nízke mzdy výhodný menový kurz a pod.). Najmä rastúca konkurencia krajín disponujúcich lacnou pracovnou silou rýchlo znehodnocuje tieto dočasné komparatívne výhody. Je zrejmé že SR

227 FORUM STATISTICUM SLOVACUM 7/ musí smerovať k zdrojom výhod ktoré sú už dnes reprezentované na báze znalostnej ekonomiky t.j. rastúci inovačný potenciál podnikov kvalita ľudských zdrojov výskumu a technológií ktoré sú považované za kľúčové faktory rastu európskej konkurencieschopnosti (Okruhlica 2009) Strategický cieľ SR v oblasti inovácií do roku 2013 bol už v roku 2007 definovaný takto: Inovácie sa stanú jedným z hlavných nástrojov rozvoja znalostnej ekonomiky a zabezpečovania vysokého hospodárskeho rastu SR s cieľom dosiahnuť úroveň najvyspelejších ekonomík Európskej únie (Návrh Inovačnej stratégie SR na roky 2007 až 2013 MH SR 2007). Aj keď na Slovensku bolo v minulosti vytvorených niekoľko stratégií budovania inovačného systému či vedomostnej ekonomiky žiadna z nich nebola zatiaľ dostatočne úspešne implementovaná. Aby sa udržalo tempo reforiem a prekonal prirodzený inštitucionálny odpor je nevyhnutné aby mal proces budovania vedomostnej ekonomiky politickú podporu na národnej a regionálnej úrovni a aby boli jednotlivé iniciatívy efektívne politicky koordinované a poháňané nielen v dobe písania akčných plánov ale aj po celú dobu ich následnej implementácie. Literatúra [1.] ARUNDEL A. BORDOY C. AND KANERVA M. (2008). Neglected innovators: How do innovative firms that do not perform R&D innovate? Results of an analysis of the Innobarometer 2007 survey No INNO-Metrics Thematic Paper. MERIT March [2.] EURÓPSKA KOMISIA (2010). Communication from the Commission to the European Parliament the Council the European Economic and Social Committee and the Committee of the Regions. Europe 2020 Flagship Initiative Innovation Union. SEC(2010) Brussels COM(2010) 546 final. Dostupné na: [3.] EUROSTAT (2011). Science technology and innovation in Europe. Pocketbook. Luxembourg: Publications Office of the European Union. [4.] HEČKOVÁ J. (2008). Multikriteriálne hodnotenie inovačnej výkonnosti SR a členských štátov EÚ. In Zborník vedeckých prác katedry ekonómie a ekonomiky ANNO Rastislav Kotulič (ed.). Univerzitná knižnica Prešovskej univerzity v Prešove. ISBN str [5.] HOLLANDERS H. VAN CRUYSEN A. (2008). Rethinking the European Innovation Scoreboard: A New Methodology for September INNO METRICS. [6.] IUS (2010). Innovation Union Scoreboard The Innovation Union's performance scoreboard for Research and Innovation: INNO METRICS: Dostupné na: [7.] MH SR (2007). Návrh Inovačnej stratégie SR na roky 2007 až Ministerstvo hospodárstva SR Dostupné na: v časti Inovácie. [8.] MH SR (2010). Inovačná politika na roky v pôsobnosti Ministerstva hospodárstva SR. Dostupné na: v časti Inovácie. [9.] OECD (2005). Oslo Manual. Third Edition. Guidelines for collecting and interpreting innovation data. OECD and Eurostat. [10.] OKRUHLICA F. (2009). Inovačné procesy ako konkurenčná výhoda. Zlín: Tomas Bata University. CD-ROM. ISBN

228 226 FORUM STATISTICUM SLOVACUM 7/2011 [11.] OKRUHLICA F. (2011). Kapitola č. 3: Strategické řízení podniku str In Hučka M. Kislingerová E. Malý M. a kol. Vývojové tendence velkých podnikú. Podniky v 21. století. 1. vydaní. Praha: C. H. Beck [12.] STANKOVIČOVÁ I. VOJTKOVÁ M. (2007): Viacrozmerné štatistické metódy s aplikáciami. Bratislava Iura Edition. [13.] ŠÚ SR (2010). Inovačná aktivita podnikov v Slovenskej republike Bratislava: Štatistický úrad SR. ISBN Dostupné na: [14.] ZAJKO M. (2010). Inovačná výkonnosť Slovenska v rámci krajín V4 a Rakúska na základe správy o EIS In Forum Statisticum Slovacum 6/2010. Bratislava. SŠDS. Adresa autora: Ing. Iveta Stankovičová Ph.D. Katedra informačných systémov Fakulta managementu UK v Bratislave Odbojárov 10 P. O. Box Bratislava 25 iveta.stankovicova@fm.uniba.sk Poďakovanie: Príspevok bol podporený a vytvorený ako súčasť riešenia projektu VEGA č. 1/0536/10: Inovácie ako strategický základ zvyšovania konkurenčnej schopnosti SR. Smerovanie meranie a podpora inovačných procesov. Príloha 1 Tab. 4: Popisné štatistiky kompozitných indikátorov (2010) Indikátor N Priemer Priemer EU27 Std. oddchýlka Medián Minimum Maximum SII_ HR_ RS_ FAS_ FI_ LAE_ IA_ I_ EE_ Zdroj: Vlastné výpočty v SAS EG Tab. 5: Hodnoty vlastných čísiel získané pomocou PCA Eigenvalues of the Uncorrected Covariance Matrix Eigenvalue Difference Proportion Cumulative Zdroj: Vlastné výpočty v SAS EG

229 FORUM STATISTICUM SLOVACUM 7/ Príloha 2 Tab. 6: Východiskové údaje zoradené zostupne podľa SII_10 a hodnoty PRIN1 No State Country SII_10 HR_10 RS_10 FAS_10 FI_10 LAE_10 IA_10 I_10 EE_10 PRIN1 IG 5 1 CH Switzerland SE Sweden DK Denmark DE Germany FI Finland UK United King BE Belgium AT Austria NL Netherlands IE Ireland LU Luxembourg FR France EU EU CY Cyprus SI Slovenia IS Iceland EE Estonia NO Norway PT Portugal IT Italy CZ Czech Rep ES Spain EL Greece MT Malta HU Hungary HR Croatia PL Poland SK Slovakia RO Romania RS Serbia MK Macedonia LT Lithuania BG Bulgaria TR Turkey LV Latvia Zdroj: Innovation Union Scoreboard 2010 Database: 5 IG (Innovation group) skupina inovátorov podľa rebríčka IUS 2010 (zoradené podľa veľkosti SII_10).

230 228 FORUM STATISTICUM SLOVACUM 7/2011 Parametrický model pre 3D vyhladzovanie Parametric model for 3D smoothing Imrich Szabó Csaba Török Abstract: The paper proposes a unique way how to utilize the IZA representation of polynomials along with the proper allocation of its reference points. We focus our attention on the two-part smoothing scheme which represents a basic form of piecewise approximation of 3D data. Keywords: representation of polynomials reference points piecewise approximation parametric model Kľúčové slová: reprezentácia polynómov referenčné body úseková aproximácia parametrický model JEL klasifikácia: C35 - Discrete Regression and Qualitative Choice Models; Discrete Regressors; Proportions 1. Úvod Cieľom prác [1] [2] a [3] bolo vytvoriť základný konštrukčný prvok ktorý v konečnom dôsledku prispeje k vytvoreniu nástroja pre aproximáciu zašumených dát komplexnej štruktúry teda nevyjadriteľných pomocou jednej funkcie. Pre takéto dáta klasická regresia sama o sebe nepostačuje. Okrem neparametrických metód môžeme uvažovať aj o parametrickom úsekovom prístupe. My v danej práci kombinujeme postupnú úsekovú aproximáciu s konceptom referenčných bodov v rámci IZA reprezentácie polynómov. Transformácie zavedené vo vyššie uvedených prácach nachádzali uplatnenie pri odvodení spomínanej reprezentácie. Otázkou vhodného rozmiestnenia referenčných bodov a spôsobu výpočtu ich tretej súradnice spejeme k ďalšiemu dôležitému bodu nášho bádania a tým je model z dvoch častí v ktorom vďaka IZA reprezentácii je problém hladkého spájania susedných segmentov riešený explicitne. Model z dvoch častí predstavuje základný konštrukčný prvok pre schémy z viacerých častí. Ústredným bodom článku je model z dvoch častí ktorý je popísaný v časti 3. Pred tým v časti 2 stručne zhrnieme teoretické základy IZA reprezentácie. Príklad v časti 4 ilustruje praktické použitie modelu. 2. Teoretické základy Na základe predchádzajúceho avíza sa v tejto časti zameriame na vetu o IZA reprezentácii polynómov z=p(xy) ktorá je základom pre konštrukciu modelu z dvoch častí. Po vete o IZA reprezentácii dôkaz ktorej tvoril značnú časť obsahu článku [3] uvedieme dva nové výsledky o tejto reprezentácii. Oba výsledky majú konštrukčný výpočtový charakter na základe vektorov bázových funkcií a funkčných hodnôt. Dané vektory sa uplatnia pri konštrukcii modelu v časti 3. Zaveďme označenie t vk p ( t vi ) = (1) v v napr. p( x µ 2) = k { 0123}\{2} 2 x v v v k {0123}\{ i} k i k ( x µ 0) ( x µ 1) ( x µ 3) = ( µ µ ) ( µ µ ) ( µ µ ) k Veta (IZA reprezentácia polynómov) Nech p q 4 µ = ( µ 0... µ 3) a ν = ( ν 0... ν 3) kde prvky vektorov sú ľubovoľné ale navzájom rôzne. Potom sa dá polynóm

231 FORUM STATISTICUM SLOVACUM 7/ vyjadriť v tvare P P p q( x y) = p q i= 0 j= 0 i a x y ij µ ν ν ν µ µ µ ν ( x y) = I ( x y) + z ( y) A ( x y) + z ( x) A ( x y) A ( x ) (2) p q P 4 q 4 4 p 4 + p 4 q 4 y kde neúplná interpolácia I µ ν P ( x y) = 3 3 i= 0 j= 0 p( x µ ) p( y ν ) P i j p q ( µ ν ) paraboly p sú definované podľa (1) nulovacie polynómy ďalej A µ ν p 4 q i= 0 µ z ( x) = ( x µ ) 3 q 3 q 4 = ij j 4.4 i= 0 j= 4 k= 0 i 3 ν z4 ( y) = ( y ν j ) j= 0 ν ν i A ( x y) a S ( y) p( x µ ). µ A p 3 3 µ µ j p 4 ( x y) = aij Si 4.4 ( x) p( y ν l ). ν l i= 4 j= 0 l = 0 p q ( ( x) z ( y) S k ( x y) = µ µ j ν ν i aij z4 ( x) Si 4.4( x). p( y ν l ). ν l + z4 ( y) S j 4.4( y). p( x µ k ). µ k + i= 4 j= 4 + z µ 4 ν 4 3 l= 0 µ i 4.4 i ( x) S j k ν j 4.4 ( y) v a ( ) pre m = ij v = µν t = xy určujeme vzťahom S m 44 t S v v v v j k ( t) S j k = S j k 1 + k S j 1 k v v v j pre 1 j 1 k 4 kým S 1 k 1 S = v j 1 a v = v v v v ]. Všimnime si že 0 k = j0 v v = t a napr. S v = v + v + v + v = i t i= 0 ) j [ t V ďalšom výklade budeme predpokladať že µ µ ν < ν Pretože neúplná i < i+ 1 i i+ i = µ ν interpolácia I P ( x y) zohráva základnú úlohu v zabezpečení hladkého prechodu medzi susednými segmentmi plôch v nasledujúcom tvrdení ju vyjadríme ako súčet štyroch skalárnych súčinov bázových funkcií a funkčných hodnôt I = I LB + I RB + I RT + I LT kde L(eft) a R(ight) zodpovedajú prvým a posledným dvom parametrom µ µ a 0 1 µ µ 2 3 a podobne B(ottom) a T(op) prvým a posledným dvom parametrom ν ν a ν ν Tvrdenie 1 µ ν Neúplný interpolačný polynóm I P ( x y) sa dá vyjadriť v tvare 3 k = 0 I x y = I + I + I + I µ ν µ ν µ ν µ ν µ ν P ( ) P LB P RB P RT P LT µ ν µ ν kde (kvôli prehľadnosti namiesto I P LB ( x y) = qlb ϕp LB píšeme stručne I LB ( x y) = q LB ϕlb ; pochopiteľne v prípade potreby budú označené aj ďalšie indexy) I LB = q LB ϕlb I RB = q RB ϕrb I RT = q RT ϕrt I LT = q LT ϕlt a vektory bázových a funkčných hodnôt sú zadane vzťahmi

232 FORUM STATISTICUM SLOVACUM 7/ )] ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( [ ν µ ν µ ν µ ν µ y p x p y p x p y p x p y p x p q LB = )] ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( [ ν µ ν µ ν µ ν µ y p x p y p x p y p x p y p x p q RB = )] ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( [ ν µ ν µ ν µ ν µ y p x p y p x p y p x p y p x p q RT = )] ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( [ ν µ ν µ ν µ ν µ y p x p y p x p y p x p y p x p q LT = )] ( ) ( ) ( ) ( [ ν µ ν µ ν µ ν µ ϕ F F F F LB = )] ( ) ( ) ( ) ( [ ν µ ν µ ν µ ν µ ϕ F F F F RB = )] ( ) ( ) ( ) ( [ ν µ ν µ ν µ ν µ ϕ F F F F RT = )] ( ) ( ) ( ) ( [ ν µ ν µ ν µ ν µ ϕ F F F F LT =. Pomocou bázových vektorov LT RT RB LB q q q q a vektorov funkčných hodnôt LT RT RB LB ϕ ϕ ϕ ϕ ľahko môžeme preusporiadať neúplnú interpoláciu I podľa potreby. Tvrdenie 2 Vzťah (2) z Vety 1 je možné vyjadriť nasledujúcim ekvivalentným spôsobom ) ( ) ( ) ( ) ( ) ( ) ( ) ( y x A y x A x z y x A y z y x I y x P q p p q P q p µ ν µ µ ν ν µ ν = kde s využitím vyššie uvedeného tvrdenia ) ( ) ( ) ( ) ( ) ( ) ( y x I y x I y x I y x I I I LT P LB P LT P LB P L P L µ ν ν ν µ µ µ ν ν ν µ µ µ ν µ ν µ ν + + ) ( ) ( ) ( ) ( ) ( ) ( y x I y x I y x I y x I I I RT P RB P RT P RB P R P R µ ν ν ν µ µ µ ν ν ν µ µ µ ν µ ν µ ν + + a w R β R = w R (a a 34 a a a 0q... a 3q ) w B β B = w B (a a 43 a a a p0... a p3 ) w C β C = w C (a a 4q a a 5q... a p4... a pq ). Konkrétny tvar bázových funkcií w * uvádzame nižšie pre w B. 3. Model a odhady V tejto časti popíšeme aproximačný model z dvoch častí s hladkým spojením v ktorom k prvému polynomiálnemu segmentu sprava pripojíme druhý. Tento model sa opiera o IZA reprezentáciu a vhodné rozmiestnenie referenčných bodov. Síce prvá rovnica modelu by mohla byť vyjadrená aj klasickou polynomiálnou regresiou pre jednotnosť však obe rovnice uvedieme v IZA tvare. Keďže používame 4 4 bodovú IZA reprezentáciu polynómov pre oba polynómy L I R I + C C w β B B w β R R w β wβ

233 FORUM STATISTICUM SLOVACUM 7/ máme k dispozícii 16 referenčných bodov ktoré s cieľom pružného narábania s nimi a dosiahnutia hladkosti spojenia susedných segmentov usporiadame do obdĺžnikov. Náčrt možného hladkého spojenia dvoch segmentov je uvedený na Obr. 1 kde ústrednú úlohu zohrávajú prostredné dva obdĺžniky na vertikálnej hranici spojenia. Poloha prvých súradníc ďalších obdĺžnikov v rámci daných segmentov pozdĺž horizontály je ľubovoľná. Kým v prostredných dvoch obdĺžnikoch horizontálna vzdialenosť medzi referenčnými bodmi musí byť kvôli hladkému spojeniu malá (experimentálne sa potvrdila voľba τ [ ] ) pre ostatné obdĺžniky to neplatí. Na druhé súradnice pozdĺž vertikály nie sú kladené obmedzenia: vertikálna vzdialenosť v rámci obdĺžnika nemusí byť malá a nie je ani viazanosť obdĺžnikov na vertikálne hranice segmentov štvorice môžu byť aj vo vnútri segmentov. Uvažujme polynómy stupňa p=4 a q=3. Pretože q=3 zodpovedajúce vektory koeficientov a ij a b ij sú nulové a tým pádom netreba uvažovať tvare wr F( x y) = I β G( x y) = I R a wc βc µ a ν F L ( x y) + I (x y) + I z tvrdenia 2 a polynómy môžeme vyjadriť v µ a ν FR (x y) + w ( x y) + w µ a ν F β β µ b ν µ b ν µ b ν FL G R G G ν a = ν b = ( ν 0 ν1 ν 2 ν 3 ( µ 0 µ 1 µ 2 µ 3) µ b = ( µ 2 µ 3 µ 4 µ 5 a µ 3 = µ 2 + τ x s 24 referenčnými bodmi 1 na báze ) µ a = ) kde τ x je malé kladné reálne číslo interpolačné zložky I získame podľa tvrdenia 1 µ a ν µ a µ a µ a 2 µ a 3 w = [ z ( x) z ( x). y z ( x). y z ( x). y ] β a a a ) a w F µ b ν G = F ( a4 3 µ b µ b µ b 2 µ b 3 = [ z ( x) z ( x). y z ( x). y z ( x). y ] β b b b ) G = ( b4 3 Všimnime si zo zadania µ a a µ b že µ 2 a µ 3 sú spoločnými parametrami a prvá interpolačná zložka G ( x y) sa opiera o funkčné hodnoty ľavej funkcie F v µ b. Odtiaľ a z blízkosti µ 2 µ 3 vyplýva hladké spojenie dvoch segmentov čo sformulujeme nasledujúcou lemou. Lema Pre rovnice z (3) s danými parametrami platí G( µ 2 y) F( µ 2 y) G( µ 2 y) = F( µ 2 y) + o( τ x ) 1. a 2. x x G( µ 3 y) = F( µ 3 y) G( µ 3 y) F( µ 3 y) + o( τ ) x x x teda v x = µ 2 x = µ 3 majú polynómy F(xy) G(xy) kvázi hladké spojenie. Dôkaz 1. Nech F(xy) a G(xy) sú vyjadrené v tvare (3). V x = µ 2 budú I FL I GR a w F w G rovné nule keďže obsahujú činiteľ (x - µ 2 ). Preto G µ y) = I ( µ y) = I ( µ y) = F( ) čo sme mali ukázať. Analogicky sa ukazuje druhá rovnosť. ( 2 G L 2 F R 2 µ 2 y G( µ 2 y) 2 2. Z Taylorovho rozvoja G( x y) = G( µ 2 y) + ( x µ 2) + o( τ x ). Odtiaľ s využitím rovností z x bodu 1 pre x=µ 3 =µ 2 +τ x dostávame F (3) G( µ 2 y) G( µ 2 + τ x y) G( µ 2 y) F( µ 2 + τ x y) F( µ 2 y) F( 2 y) = + o( τ x ) = + o( τ x ) = µ. x τ τ x x x 1 Pôvodne 32 ibaže 8 z toho je zdieľaných.

234 232 FORUM STATISTICUM SLOVACUM 7/2011 Na báze (3) definujeme schému/model z dvoch častí nad segmentmi S = u u ] [v v ] a S = [ u1 u2] [v0 v1] 2 F ~ ( x y) = I ~ G( x y) = I µ a ν F L µ b ν FL ( x y) + I (x y) + I µ a ν FR µ b ν G R (x y) + w ( x y) + w µ a ν F µ b ν G 1 [ β F G + ε F β + ε s hladkým prechodom v µ 2 = u1 kde ε F a ε G sú nekorelované chybové sekvencie a prvky µ a µ b sú z intervalu [ u u 0 1] prvky ν z intervalu [ v v 0 1] a µ a = ( µ 0 µ 1 µ 2 µ 3) µ b = ( µ 2 µ 3 µ 4 µ 5). ~ Uvažujme M a N meraní {[ ~ z ] 1 ~ i xi yi i = M zi = F( xi yi )} a ~ {[ ~ z ] 1 ~ i xi yi i = N zi = G( xi yi )}. Aproximanty F ˆ ( x y) a G ˆ ( x y) získame sekvenčne. Aproximant F ˆ ( x y) prvého segmentu sa odhaduje pomocou MNŠ nezávisle od druhého segmentu dva interpolačné zložky obsahujú dokopy 16 a vektor β F 4 parametre. Pristúpme teraz k odhadu ˆ µ ν G ( x y). Namiesto I F b L (x y) s neznámou F po získaní ˆ µ b ν F ( x y) môžeme uvažovať I (x y) teda 8 parametrov už máme odhadnutých a FL ˆ µ ν aj hladké spojenie je zaručené. Ostáva nám odhadnúť 8 parametrov interpolačnej zložky ( x ) a 4 parametre pre β G. Z druhej časti modelu (4) obdržíme pre i = 1 N ~ ~ µ b ν µ b ν z = G( x y ) I ( x y ) = I ( x y ) + w alebo v maticovom tvare Odtiaľ získame MNŠ odhad 4. Príklad i i i Fˆ L i i G R ~ Z = Xβ. i i µ b ν G B β G G x y i i IG b R y ˆ T ( ) 1 T β = X X X Z ~. (5) Uvažujme po sto hodnôt (pozri obr. 2a) generovaných nad segmentmi S = [ ] [ ] a S = [ ] [ ] na báze funkcií G( x y) = I = x y -x y a F(xy) + ( x y) + q ( x y) [ ] + q 2 ( x y) [1111] + w ( x y) β µ G ν µ G ν µ G ν µ G ν F L G RB G RT G B G s µ = [ ] ν = [ ] a β = [ ]. G Najprv sme odhadli Fˆ (x y) nad oblasťou S1 nezávisle od dát z S 2. Odhad Ĝ(x y) sme vypočítali na základe modelu z dvoch častí podľa (5). Hladký prechod v µ 2 (pozri obr. 2c) sme dosiahli voľbou µ = τ 00.4] ν = [ ] s odstupom τ = G [ x G x (4)

235 FORUM STATISTICUM SLOVACUM 7/ Obr. 2 a) 200 generovaných bodov b) Fˆ (x y) a Ĝ (x y) c) 2D pohľad na prechod v x = µ 3 = Záver (Diskusia) S odvodením IZA reprezentácie polynómov vyvstávala otázka jej využitia pri odšumení dát prvou odpoveďou na ktorú je tento článok. Z vety pojednávajúcej o konštrukcii reprezentácie polynómov sa získali bázové funkcie ktoré následne našli uplatnenie v modeli z dvoch častí. Bázové funkcie spolu s vhodným rozmiestnením referenčných bodov zohrali základnú úlohu pri hladkom spájaní dvoch segmentov a výsledkom je model slúžiaci ako základný konštrukčný prvok pri aproximácii zložitejších schém. Poďakovanie Táto publikácia vznikla vďaka Agentúre na podporu výskumu a vývoja v rámci projektu APVV Algorithms Automata and Discrete Data Structures a v rámci OP Výskum a vývoj pre projekt: CaKS - Centrum excelentnosti informatických vied a znalostných systémov (ITMS: ) spolufinancovaný zo zdrojov Európskeho fondu regionálneho rozvoja.. Literatúra [1] SZABÓ I. Discrete transformation of 3D data Forum Statisticum Slovacum 7/2009 Slovac statistical and demographic society Bratislava 2009 p [2] SZABÓ I. TÖRÖK Cs. Reference points based representation of polynomials in space Management 2010 Knowledge and management in times of crisis and ensuing development part II University of Prešov 2010 p [3] SZABÓ I. TÖRÖK Cs. Symmetric representation of polynomials Forum Statisticum Slovacum 5/2010 Slovac statistical and demographic society Bratislava 2010 p Kontakt Imrich Szabó Csaba Török P.J. Šafárik University in Košice Faculty of Science Institute of Computer science Jesenná Košice Slovak Republic imrich.szabo@gmail.com csaba.torok@upjs.sk

236 234 FORUM STATISTICUM SLOVACUM 7/2011 Štatistické spracovanie údajov z chemických analýz pôdy Statistical processing of data from chemical analysis of soil Edita Szabová Michal Hudec Abstract: The paper deals with the use of statistics and statistical programs in the sciences (in chemistry) in the evaluation of the identified parameters of soil chemical properties. We examined the content of nitrate nitrogen (N-NO - 3 ) in soil in spring and autumn. Statistically we evaluated the individual measured values with Excel using ANOVA - two-factor analysis - of variance with repetition. We found a statistically significant dependence of the N-NO 3 on - the season. Dependence of N-NO 3 depth collection of soil samples was not confirmed statistically significant. - Key words: content of N-NO 3 in soil statistical hypothesis testing ANOVA two-factor analysis of variance - Kľúčové slová: obsah N-NO 3 v pôde testovanie štatistických hypotéz ANOVA dvojfaktorová analýza rozptylu JEL classification: C12 1. Úvod Celkový obsah dusíka v pôde sa skladá z organického a anorganického dusíka (Šoltýsová 2007). Anorganický dusík má v pôde minimálny podiel (05 5 % z celkového dusíka) a jeho množstvo podlieha častým a rýchlym zmenám (Ondrišík 1998). Množstvo a formy anorganického dusíka sa neustále menia vzhľadom na biologické chemické a fyzikálne procesy ktoré v pôde prebiehajú. Vo výžive rastlín je veľmi dôležitý anorganický dusík a preto je nevyhnutné sledovať dynamiku zmien jeho jednotlivých foriem (Hudec 2009). Zložkou anorganického dusíka je dusičnanový a amónny dusík (Bielek 1998). Podľa Ondrišíka a Urminskej (2005) množstvo anorganického dusíka v pôde determinujú pôdne a klimatické podmienky vegetačný kryt aplikácia hnojív ale aj antropogénna činnosť vplývajúca na intenzitu uvoľňovania a viazania anorganického dusíka. Organický dusík sa premieňa na anorganické formy s konečným produktom NH + 4 ktorý sa z pôdy nevyplavuje rastlina ho dokáže prijímať (Ondrišík Urminská 2005). V pôdach dochádza k dôležitej transformácii nepohyblivej formy NH + 4 na pohyblivú formu NO - 3 (Števlíková 2002). Podľa Fecenka a Ložeka (2000) sa dusičnany najintenzívnejšie vyplavujú koncom zimného obdobia v predjarí a v jarnom období keď je pôda bez vegetačného krytu. Nasledujúca tabuľka - predstavuje namerané hodnoty obsahu N-NO 3 v pôde v rôznych hĺbkach v oblasti k. ú. Jastrabá okres Žiar nad Hronom počas jesene 2009 a jari Zo zistených hodnôt dusičnanového dusíka chceme zistiť či je rozdiel medzi nameranými hodnotami vzhľadom na ročné obdobie ako aj na hĺbku odberu pôdnej vzorky štatisticky významný. Cieľom príspevku je taktiež poukázať na možnosti využitia štatistických metód a programu Excel v chemickom či environmentálnom výskume. Zo zistených hodnôt dusičnanového dusíka chceme zistiť či je rozdiel medzi nameranými hodnotami vzhľadom na ročné obdobie ako aj na hĺbku odberu pôdnej vzorky štatisticky významný. Cieľom príspevku je taktiež poukázať na možnosti využitia štatistických metód a programu Excel v chemickom či environmentálnom výskume.

237 FORUM STATISTICUM SLOVACUM 7/ Tabuľka 1: Hodnoty N-NO 3 - v pôde (Zdroj: Hudec 2010) Úrovne faktora A Úrovne faktora B Hĺbka [m] Jeseň 2009 Jar Metódy získavania a vyhodnocovania údajov Pôdne vzorky boli odobrané z rôznych hĺbok na jeseň 2009 na jar 2010 a analyzované štandardnými postupmi (Kováčik 1997) dusičnanový dusík (N-NO - 3 ) - spektrofotometricky kyselinou fenol disulfónovou amónny dusík (N-NH + 4 ) - spektrofotometricky Nesslerovým činidlom. - Pozorovaným znakom je v našom prípade obsah N-NO 3 v pôde. Na štatistické vyhodnotenie závislosti zistených množstiev jednotlivých foriem dusíka bola použitá analýza rozptylu ktorá je uvedená v programe Excel pod názvom ANOVA. Ako uvádzajú Markechová Tirpáková Stehlíková (2011 s. 261) analýzu rozptylu môžeme použiť len vtedy ak sú splnené podmienky: 1. Výberové súbory pochádzajú zo základných súborov s normálnymi rozdeleniami. 2. Výberové súbory sú navzájom nezávislé. 3. Rozptyly základných súborov sa rovnajú. Platnosť prvej podmienky bola preverená Shapirovým-Wilkovým testom ktorý je vhodné použiť pre. Testovali sme hypotézu že náhodný výber pochádza z normálneho rozdelenia. Postup testovania ukážeme pri realizácii náhodného výberu v súbore Jeseň Namerané hodnoty usporiadame do neklesajúcej postupnosti a ako testovacie kritérium použijeme štatistiku Vypočítame najskôr súčet

238 236 FORUM STATISTICUM SLOVACUM 7/2011. Koeficienty sme vyhľadali v tabuľkách. Ďalej vypočítame a Na záver vypočítame hodnotu testovacieho kritéria V tabuľke nájdeme ku zvolenej hladine významnosti a pre hodnotu Pretože hodnota testovacieho kritéria je väčšia ako 0887 testovanú hypotézu o normálnom rozdelení hodnôt nemôžeme na hladine významnosti zamietnuť. Rozdelenie hodnôt pozorovaného znaku budeme teda považovať za normálne. Fisherovým F-testom sme zisťovali rovnosť disperzií dvoch normálnych rozdelení teda hodnôt nameraných na jeseň 2009 a na jar V Exceli sme použili dvojvýberový F-test pre rozptyl. Použitím hodnoty pravdepodobnosti chyby ktorej sa dopustíme keď zamietneme testovanú hypotézu o rovnosti rozptylov dvoch výberových súborov v prospech alternatívnej hypotézy sme dospeli k výsledku že rozptyly daných súborov nemôžeme považovať za rovnaké. Nie je splnená tretia podmienka avšak ako uvádzajú Markechová Tirpáková a Stehlíková (2011 s. 261) pri vyváženom modeli teda ak výberové súbory majú rovnaké rozsahy nemusí byť predpoklad o rovnakých rozptyloch nutne splnený lebo vplyv rozdielnych rozptylov je minimálny. 3. Dvojfaktorová analýza rozptylu V našom vyhodnocovaní nameraných hodnôt obsahu N-NO - 3 v pôde sledujeme vplyv dvoch faktorov na hodnoty pozorovaného znaku. V našom prípade faktor je hĺbka odberu pôdnej vzorky a faktorom je ročné obdobie pričom smerodajnými sú pre nás obdobia jeseň a jar. Faktor nadobúda 4 úrovne faktor nadobúda 2 úrovne. Keďže pre každú kombináciu úrovní máme viacero pozorovaní konkrétne 4 pozorovania pre vyhodnocovanie výsledkov použijeme dvojfaktorovú analýzu rozptylu s opakovaním. Matematický výpočet by bol značne náročný pomôžeme si Excelom v ktorom je zabudovaná metóda ANOVA: dva faktory s opakovaním. Budeme testovať hypotézu hĺbka odberu pôdnej vzorky nemá vplyv na hodnotu N-NO - 3 v pôde a hypotézu ročné obdobie nemá vplyv na hodnotu N-NO - 3 v pôde. Zvolíme hladinu významnosti. V Exceli získavame výstup uvedený v Tabuľke 2. V prvej časti tabuľky sú uvedené hodnoty základných výberových charakteristík rozsah súčet priemer rozptyl pre každú kombináciu úrovní faktorov. V druhej časti tabuľky je zobrazená tabuľka dvojfaktorovej analýzy rozptylu s opakovaním. Sú v nej uvedené súčty štvorcov odchýlok SS počty stupňov voľnosti Rozdíl hodnoty rozptylov MS a hodnoty testovacích kritérií a. Posledné dva stĺpce obsahujú P hodnoty a kritické hodnoty. Pre hodnotu testovacieho kritéria platí že preto testovanú hypotézu nemôžeme zamietnuť. Znamená to že hĺbka z ktorej pochádza vzorka pôdy nemá vplyv na - hodnotu obsahu N-NO 3 v pôde. Takýto výsledok dostávame aj pomocou P hodnoty čo je väčšie ako nami zvolená hladina významnosti. Pozorované rozdiely nie sú štatisticky významné. Keďže pre hodnotu testovacieho kritéria platí že testovanú hypotézu zamietame na hladine významnosti - čo znamená že obsah N-NO 3 v pôde závisí od ročného obdobia. Rovnaký záver dostaneme aj použitím P hodnoty ktorá je menšia ako hladina významnosti takže pravdepodobnosť chyby ktorej sa týmto rozhodnutím dopúšťame je blízka nule. Vo výstupe v riadku Interakce sme získali hodnotu P = 016 ktorá hovorí o tom že - vzájomný vplyv interakcia oboch faktorov na obsah N-NO 3 nie je štatisticky významný

239 FORUM STATISTICUM SLOVACUM 7/ nakoľko táto hodnota je vyššia ako zvolená hladina významnosti. Znamená to že medzi uvažovanými faktormi nie je vzájomná interakcia a teda nemôžeme ju zamietnuť. Tabuľka 2: Výstup ANOVA testu Anova: dva faktory s opakovaním Faktor Jeseň 2009 Jar 2010 Celkem m Počet Součet Průměr Rozptyl m Počet Součet Průměr Rozptyl m Počet Součet Průměr Rozptyl m Počet Součet Průměr Rozptyl Celkem Počet Součet Průměr Rozptyl ANOVA Zdroj variability SS Rozdíl MS F Hodnota P F krit Výběr Sloupce Interakce V Dohromady Celkem Záver V príspevku sme sa zaoberali možnosťami štatistického vyhodnocovania výskumu v prírodných vedách konkrétne sme skúmali vplyv dvoch faktorov na hodnoty dusičnanov v pôde. Dusičnany sa najintenzívnejšie vyplavujú koncom zimného obdobia v predjarí a toto nám dokazujú aj zistené hodnoty dusičnanového dusíka v jarnom období 2010 kedy bol

240 238 FORUM STATISTICUM SLOVACUM 7/2011 obsah v intervale od mg.kg -1 čo je nižšie ako v jesennom období 2009 kedy obsah bol v intervale od mg.kg -1. Použitím testu ANOVA Dvojfaktorová analýza rozptylu s opakovaním v programe Excel sme zistili že štatisticky významný je vplyv ročného obdobia na obsah dusičnanov v pôde pričom pri hĺbke odberu pôdnej vzorky sa nepreukázal štatisticky významný vplyv na obsah dusičnanov. 5. Literatúra [1] BIELEK P Dusík v poľnohospodárskych pôdach Slovenska. Bratislava : Výskumný ústav pôdnej úrodnosti s. ISBN [2] FECENKO J. LOŽEK O Výživa a hnojenie poľných plodín. Nitra : SPU s. ISBN [3] HUDEC M Využitie analytických metód pri stanovení anorganického dusíka v pôde. In: Studentská odborná konference Chemie a společnost sborník přispěvků [CD- ROM]. Brno: Vysoké učení technické v Brně ISBN [4] HUDEC M Vplyv sezónnej zmeny na dynamiku anorganického dusíka v pôdnom type kambizem. XI. medzinárodná vedecká konferencia doktorandov a mladých vedeckých pracovníkov Mladí vedci zborník vedeckých prác doktorandov mladých vedeckých a pedagogických pracovníkov [CD-ROM]. Nitra: UKF ISBN [5] KOVÁČIK P Rozbory pôd rastlín hnojív a výpočet dávok živín k poľným a záhradným plodinám. 1. vyd. Nitra : SPU s. ISBN [6] MARKECHOVÁ D. TIRPÁKOVÁ A. STEHLÍKOVÁ B Štatistické metódy a ich aplikácie. Nitra : UKF s. ISBN [7] ONDRIŠÍK P Dynamika a migrácia minerálnych zlúčenín dusíka v pôdnom profile a možnosti ich regulácie : habilitačná práca. Nitra: SPU s. [8] ONDRIŠÍK P. URMINSKÁ J Dynamika anorganického dusíka v pôde v závislosti od agronomických opatrení. In: Poľnohospodárstvo roč č. 8 s [9] ŠOLTYSOVÁ B Dusík v prírode a v pôde [Online]. [citované ]. Dostupné na internete: < [10] ŠTEVLÍKOVÁ T. A KOL Mikrobiológia. 1. vyd. 2. časť. Nitra: SPU s. ISBN Adresa autora (-ov): Edita Szabová Mgr. Univerzita Konštantína Filozofa v Nitre Fakulta prírodných vied Katedra matematiky Tr. A. Hlinku Nitra edita.szabova@ukf.sk Michal Hudec Mgr. Univerzita Konštantína Filozofa v Nitre Fakulta prírodných vied Katedra ekológie a environmentalistiky Tr. A. Hlinku Nitra michal.hudec@ukf.sk

241 FORUM STATISTICUM SLOVACUM 7/ Vývoj ekonomicky aktivního obyvatelstva v České republice The development of economically active population in the Czech Republic Martina Šimková Abstract: The aging of population is nowadays very actual problem. The most of projections predict significant decline in population in working age. But these projections do not compute with the changes in education structure and with changes in economic activity. In this paper is included the development of the economic activity of the population which allows the determination of real participation in the labour market. The aim of this paper is to analyze the sex-age-education structure of the population and to introduce some possible alternatives for development of economically active population at a given level of educational structure and economic activity rate. Key words: aging of population economic activity educational structure projections Klíčová slova: stárnutí populace ekonomická aktivita vzdělanostní struktura projekce JEL Code: I21 J11 J Úvod Většina ekonomicky vyspělých zemí se dnes potýká s problémem stárnutí populace z důvodu klesající porodnosti a prodlužující se střední délky života. Mezi jeho nejvážnější důsledky a hrozby patří jednoznačně rostoucí finanční zátěž pro důchodový systém a systém zdravotní péče. (EC 2008) Samotný fakt přibývání starších osob by nebyl problémem kdyby to nebylo provázeno úbytkem osob v produktivním věku. V současnosti žije v České republice 15 % osob starších 65 let. Podle prognóz Českého statistického úřadu má podíl lidí v důchodovém věku narůstat (v roce 2050 se počítá až s třetinovým podílem). (ČSÚ 2009) Otázka je jednoduchá a v posledních letech často diskutovaná dokáže v budoucnu část ekonomicky aktivní populace uživit tu ekonomicky neaktivní část? Jednou z možností jak alespoň částečně zabránit úbytku ekonomicky aktivní populace je zvýšení věku odchodu do důchodu. V návaznosti na rostoucí střední délku života se pomalu postupně posunuje i důchodový věk. Dalším řešením které se v této souvislost může provést je zvýšit počet ekonomicky aktivních osob tím že zvýšíme míry ekonomické aktivity. Zejména ve vyšších věcích jestliže se prodlouží věk odchodu do důchodu. Věková skupina let je dnes přechodová zahrnuje osoby na přelomu pracovního života a důchodu proto tuto skupinu osob nelze považovat čistě za produktivní. Demografické stárnutí ale přináší nutnost aby lidé zůstávali v pracovním procesu déle a jejich ekonomická aktivita byla vyšší. Cílem tohoto příspěvku je představit možné varianty vývoje počtu ekonomicky aktivních obyvatel při dané úrovni vzdělanostní struktury a měr ekonomické aktivity a následně pak určit zda je na místě obava z výrazného poklesu práceschopného obyvatelstva. 2. Data a metodika Základní a nejjednodušší možností jak rozdělit obyvatelstvo podle ekonomické aktivity je vymezení věky 0-19 let či a 65+. První skupina je definovaná jako ekonomicky neaktivní druhá skupina (20-64) jako ekonomicky aktivní a poslední opět jako neaktivní. (Roubíček V 2002) Kromě věku je ovšem také důležité to jestli je opravdu osoba ekonomicky aktivní podle toho pak dělíme obyvatelstvo do tří vzájemně se vylučujících skupin na zaměstnané nezaměstnané a ty kteří nepředstavují pracovní sílu. Zaměstnaní a nezaměstnaní se

242 240 FORUM STATISTICUM SLOVACUM 7/2011 souhrnně označují jako ekonomicky aktivní třetí skupina jako ekonomicky neaktivní obyvatelstvo. (Jílek Moravová 2007) Do kategorie ekonomicky neaktivního obyvatelstva patří všichni bez ohledu na věk kteří z nějakého důvodu objektivního nebo subjektivního nejsou produktivní. Ekonomicky neaktivní z objektivních důvodů jsou děti do 15 let žáci studenti starobní důchodci dlouhodobě nemocní a invalidé. Ze subjektivních důvodů jsou za ekonomicky neaktivní považovány osoby v domácnosti rentiéři nebo např. osoby které jsou v produktivním věku ale pracovat nechtějí. (Moravová 1998) Jako datové prameny jsou použity především data z Českého statistického úřadu. Jediným úplným šetřením týkajícím se demografických dat na našem území je Sčítání lidu domů a bytů které je ovšem konáno jednou za deset let. Proto je třeba pravidelně doplňovat a aktualizovat informace prostřednictvím registrů obyvatel a výběrových šetření jejichž předností je právě pohotovost a hospodárnost. Výběrovým šetřením je myšleno především Výběrové šetření pracovních sil které šetří údaje o ekonomické aktivitě zaměstnanosti nezaměstnanosti vzdělání a s tím souvisejícími charakteristikami částečně také demografického charakteru. Z dalších pramenů z oblasti statistiky ekonomické aktivity byla využita data z evidence úřadů práce které spadají pod Ministerstvo práce a sociálních věcí. Tato evidence se ovšem zaměřuje pouze na evidované uchazeče o zaměstnání. (Jílek Moravová 2007) Podíl ekonomicky aktivních obyvatel ve věku x pohlaví p a vzdělání v na celkové populaci ve věku x pohlaví p a vzdělání v vyjadřují specifické míry ekonomické aktivity. kde axpv je specifická míra ekonomické aktivity osob ve věku x pohlaví p a vzdělání v Axpv je počet ekonomicky aktivních osob ve věku x pohlaví p a vzdělání v a Pxpv je celkový počet osob ve věku x pohlaví p a vzdělání v. Obrázek 1 Míry ekonomické aktivity podle nejvyššího dosaženého vzdělání v roce 2009 (1) Zdroj: ČSÚ 2010b Míry ekonomické aktivity podle věku a nejvyššího dokončeného vzdělání jsou vidět na obrázku 1. Ve věku let jsou míry z důvodů studia velmi nízké proto se veškeré výpočty v prognózách týkají jen obyvatelstva staršího 25 let. Na obrázku je patrný velký rozdíl mezi měrami osob se základním a s vyšším vzděláním. Je zde také vidět že čím vyšší má populace vzdělání tím vyšší má také míru ekonomické aktivity. Ve věku let jsou nižší především

243 FORUM STATISTICUM SLOVACUM 7/ z důvodu mateřských povinností žen. (ČSÚ 2010a) Po čtyřicítce dosahují nejvyšších hodnot ve všech vzdělanostních skupinách. Po tomto věku také dochází k prohloubení rozdílů mezi ekonomickou aktivitou osob se základním a ostatním vyšším vzděláním. Po 55 roce života se ekonomická aktivita snižuje a ve věku kdy se běžně odchází do důchodu (tj let) je velmi nízká. Vzhledem k rostoucímu věku odchodu do důchodu by bylo žádoucí míry v těchto věkových skupinách zvýšit aby nedocházelo k obávanému velkému úbytku ekonomicky aktivních osob. Základem pro prognózu ekonomicky aktivních je prognóza vzdělávací soustavy která byla vypracována v rámci projektu RELIK 1. Tato prognóza byla vypočtena pro čtyři vzdělanostní skupiny základní vzdělání (zahrnuto i nedokončené základní vzdělání) střední vzdělání bez maturity střední vzdělání s maturitou a vyšší vzdělání (vzdělání na konzervatoři vyšší odborné škole a vysoké škole). (Langhamrová J. aj. 2009) Prognóza budoucího vývoje předpokládá že poroste podíl s dokončeným vyšším vzděláním. Jak je vidět na obrázku 2 do roku 2050 by se měl snížit počet osob se základním nebo nedokončeným základním vzděláním a také by měl klesnout počet osob se středním vzděláním bez maturity. Oproti tomu mírně přibude osob s maturitou a nejvíce se změna projeví u kategorie vyšší vzdělání. Tato prognóza předpokládá že se tato skupina osob zdvojnásobí. Obrázek 2 Prognóza vývoje struktury vzdělanostních skupin v ČR Zdroj: Langhamrová J. aj V tomto příspěvku jsou zpracovány tři různé varianty budoucího vývoje počtu ekonomicky aktivního obyvatelstva které se liší předpokladem o vývoji vzdělanostní struktury a měr ekonomické aktivity. Počet ekonomicky aktivních osob je vypočten z počtu osob s určitým vzděláním násobený příslušnou mírou ekonomické aktivity vypočtenou dle vzorce (1). V jednotlivých prognózách byly použity následující scénáře: a) Po celou projektovanou dobu zůstane stejná vzdělanostní struktura jako je dnes. Nepředpokládá se žádný vývoj této struktury se kterým počítá prognóza výkonů vzdělávací soustavy z projektu RELIK. Výchozí vzdělanostní struktura je uvedena výše a zobrazena na obrázku 2. Na tuto vzdělanostní strukturu jsou aplikovány míry ekonomické aktivity rozlišené podle věku pohlaví a vzdělání také z roku Výzkumný projekt 2D06026 Reprodukce lidského kapitálu financovaný MŠMT v rámci Národního programu výzkumu II.

244 242 FORUM STATISTICUM SLOVACUM 7/2011 b) Vzdělanostní struktura se změní podle výsledků prognózy RELIK. V této verzi jsou po celou projektovanou dobu předpokládány stejné míry ekonomické aktivity (viz obr. 1). c) Předpokládá se nejen vývoj vzdělanostní struktury ale také vývoj měr ekonomické aktivity. V rámci probíhající důchodové reformy se postupně zvyšuje věk odchodu do důchodu. Tato varianta předpokládá že hodnota se má z původních 60 let pro muže a 57 let pro bezdětné ženy dostat a vyrovnat na 65 let pro obě pohlaví v roce Pro odhad velikosti ekonomicky aktivní populace do budoucna byl použit předpoklad že míry ekonomické aktivity ve vyšších věkových skupinách se do roku 2030 posunou o jednu věkovou kategorii výše (meziroční změna bude konstantní). Do horizontu projekce tj. do roku 2050 míry ekonomické aktivity zůstanou na úrovni z roku Výsledky Pokud by se vzdělanostní struktura do roku 2050 nezměnila tj. neodvíjela by se pozitivním směrem ve smyslu přibývání osob se vzděláním vyšším (varianta a) počet ekonomicky aktivních osob by se za předpokladu měr ekonomické aktivity na úrovni roku 2009 vyvíjel následujícím způsobem (obrázek 3). Obrázek 3 Prognóza počtu ekonomicky aktivních osob do roku 2050 (v mil.) Zdroj: ČSÚ 2010c Langhamrová J. aj vlastní výpočty V roce 2009 bylo v ČR 49 mil. ekonomicky aktivních osob (starších 25 let) což je v relativním vyjádření 467 % z celkového počtu osob. Nadále bude tento počet dále klesat a v roce 2050 dosáhne hodnoty 44 mil. tj. 362 % práceschopných osob což je pokles o téměř 11 p. b. Pokud by se do budoucna měnila vzdělanostní struktura a neměnily by se míry ekonomické aktivity (varianta b) i nadále by ubývalo práceschopných osob ovšem ne tak dramaticky. Na obrázku 4 je patrný výrazný pokles ekonomicky aktivních se středním vzděláním bez maturity. Tento úbytek alespoň částečně nahradí rostoucí počet ekonomicky aktivních s vyšším vzděláním. V roce 2050 by tak podíl ekonomicky aktivních osob (starších 25 let) klesl na 388 % tedy o 7 p. b. V porovnání s první variantou bez vývoje vzdělanostní struktury je to zlepšení o 3 p. b. absolutně se jedná o cca 320 tisíc ekonomicky aktivních osob více. Z obrázku 5 je na první pohled jasné že počet ekonomicky aktivních osob se bude zvyšovat pokud budou platit předpoklady z varianty c). Počet ekonomicky aktivních osob (starších 25 let) se v tomto případě zvýší až na hodnotu 61 mil. v roce 2050 tj. 497 %. Maxima přitom dosáhne po roce 2030 kdy tak bude v ČR téměř 52 % ekonomicky aktivních osob.

245 FORUM STATISTICUM SLOVACUM 7/ Obrázek 4 Prognóza počtu ekonomicky aktivních osob do roku 2050 (v mil.) Zdroj: ČSÚ 2010c Langhamrová J. aj vlastní výpočty Obrázek 5 Prognóza počtu ekonomicky aktivních osob do roku 2050 (v mil.) Zdroj: ČSÚ 2010c Langhamrová J. aj vlastní výpočty 4. Diskuze a závěr Lze říci že ve vzdělání je možné spatřovat určitou naději že důsledky stárnutí populace by ještě minimálně půl století neměly ohrožovat životní úroveň občanů České republiky. Nejenom že lidé s vyšší úrovní vzdělání mají vyšší míru ekonomické aktivity zejména ve vyšším věku ale také mají vyšší příjmy což zároveň znamená možnost vyšších daňových odvodů a odvodů na pojištění a menší ekonomické zatížení pro důchodový systém. Nejlepší výsledky přináší varianta třetí která počítá s vývojem nejen vzdělanostní struktury ale hlavně se zvýšením ekonomické aktivity zejména starších osob. V kombinaci s celkovým počtem obyvatel České republiky vychází že podíl ekonomicky aktivních starších 25 let zůstane na stejné úrovni jako dnes dokonce se nepatrně zvýší. Tato možnost je pro budoucí demografický vývoj populace ČR příznivá. Lze předpokládat že ve skutečnosti

246 244 FORUM STATISTICUM SLOVACUM 7/2011 budou míry ekonomické aktivity oproti uvažovaným nižší ale přesto i tak se dá očekávat že k drastickému snížení ekonomicky aktivního obyvatelstva nejspíše nedojde. Odpověď na otázku položenou v úvodu příspěvku je jasná: ano ekonomicky aktivní část populace dokáže v budoucnu uživit tu neaktivní část ale jen za předpokladu zvýšení ekonomické aktivity ve vyšších věkových skupinách. 5. Literatura a zdroje [1] ČSÚ Projekce obyvatelstva České republiky do roku 2065 [online] Praha: Český statistický úřad Dostupný na: [2] ČSÚ 2010a. Ročenka statistiky trhu práce 2010 [online] Praha. Český statistický úřad Dostupný z: [3] ČSÚ 2010b. Zaměstnanost a nezaměstnanost v ČR podle výsledků výběrového šetření pracovních sil - roční průměry [online] Praha: Český statistický úřad Dostupný z WWW: [4] ČSÚ 2010c. Zaměstnanost a nezaměstnanost v ČR podle výsledků výběrového šetření pracovních sil - roční průměry [online] Praha: Český statistický úřad [5] EC Ageing characterises the demographic perspectives of the European societies [online]. Luxembourg: European Communities ISSN Dostupný z: EN.PDF [6] JÍLEK J. MORAVOVÁ J Ekonomické a sociální indikátory: Od statistik k poznatkům. Futura Praha s. ISBN [7] KOSCHIN F Kapitoly z ekonomické demografie. Oeconomica Praha s. ISBN [8] LANGHAMROVÁ J. KOSCHIN F. FIALA T. FISCHER J. FOŘTOVÁ S. HULÍK V. KAČEROVÁ E. KONRÁDOVÁ J. MAZOUCH P. MISKOLCZI M. ŠŤASTNOVÁ P Prognóza lidského kapitálu obyvatelstva České republiky do roku 2050 (aktualizovaná verze r. 2009). Oeconomica Praha s. ISBN [9] MORAVOVÁ J Základy sociální statistiky. VŠE Praha ISBN [10] ROUBÍČEK V Základní problémy obecné a ekonomické demografie. VŠE Praha s. ISBN [11] ŠLAPÁK M Ekonomická aktivita starších osob a důchodový systém v České republice. In: Reprodukce lidského kapitálu. Oeconomica. Praha s. Adresa autora Martina Šimková Ing. Katedra demografie Fakulta informatiky a statistiky VŠE v Praze Nám. W. Churchilla Praha 3 martina.simkova@vse.cz Příspěvek vznikl v rámci projektu Interní grantové agentury VŠE v Praze Analýza a predikce struktury ekonomicky aktivního obyvatelstva IG402011

247 FORUM STATISTICUM SLOVACUM 7/ Identifikace globálních a lokálních vln v kontextu implementace monetární politiky v Eurozóně Global and Local Waves Identification in the Context of Single Monetary Policy Implementation in the Eurozone Petra Šírková Jitka Poměnková Abstract: The paper deals with macroeconomic cycle identification and its differencing into the local and global types. The authors applied frequency-domain analysis of business activity movements especially the similarities between the US (presented as global macroeconomic waves) and Eurozone business cycles. Baxter-King and Hodrick-Prescott filters with standard parameters were used to estimate growth business cycles from the data. Frequency-domain analysis of growth business cycles is based on the spectrum estimation via periodogram. The empirical analysis focuses on the industrial production as the business activity movements in EA15. Key words: frequency-domain analysis spectrum Baxter-King filter Hodrick-Prescott filter Klíčová slova: frekvenční doména spektrum Baxterův-Kingův filtr Hodrickův-Prescottův filter JEL Classification: E32 C Úvod Hospodářský cyklus lze charakterizovat jako opakující se výkyvy v ekonomické aktivitě zapříčiněné fluktuací inflace zaměstnanosti HDP spotřeby investic a dalších proměnných. Příčiny jeho kolísání patří k aktuálním tématům současné makroekonomie. Je to dáno především snahou o nalezení charakteristických vlastností hospodářského cyklu které přispívají k efektivnějšímu využití hospodářské politiky a účinnější stabilizace. Podle Holmana (2005) lze v ekonomice hospodářské výkyvy rozdělit na strukturální a cyklické. Strukturální výkyvy jsou způsobeny neustálou změnou preferencí spotřebitele objevy nových výrobních poznatků a technologií proto se některá odvětví v ekonomice se rozšiřují zatímco jiná stagnují. Naopak cyklické výkyvy ekonomiky chápeme jako celkový pokles nebo růst ekonomiky jako celku ne jen určitého odvětví. Hospodářský cyklus má čtyři fáze které rozlišujeme na expanzi vrchol recesy a dno. Všeobecně se za recesi považuje pokles reálného HDP pod potenciální produkt ve dvou po sobě jdoucích čtvrtletích. Dlouhotrvající hospodářský pokles je označován jako deprese. Za vrchol cyklu lze považovat relativně vysokou ekonomickou aktivitu vzhledem k trendu za dno naopak dosažení nejnižší úrovně této aktivity. Expanze je charakteristická významným růstem trvajícím několik měsíců. Délka jednoho cyklu je dána dobou mezi dvěma vrcholy (Artis 2004). Romer (2006) člení hospodářské cykly podle časové délky které pojmenovává podle autorů kteří se studiu těchto cyklů věnovali a to na cykly Kitchinovy (3 roky) Juglarovy (10 let) Kuznetsovy (20 let) a Kondratievovy (50 let). Převládající názor je že je ekonomika narušována poruchami šoky různých typů a velikostí v méně či více náhodných intervalech a tyto poruchy a šoky se pak šíří ekonomikou. Hlavní ekonomické proudy se liší v názorech na vznik těchto poruch a šoků a rovněž na způsob jejich šíření ekonomikou. Holman (2005) předkládá členění ekonomických proudů které se zabývají hospodářským cyklem na směry vyznávající monetární a reálné teorie. Monetární teorie vidí příčinu cyklických výkyvů ve změnách peněžní zásoby jenž ekonomice působí poptávkové šoky. Reálné teorie naopak vidí příčinu cyklických pohybů v reálných silách jako jsou investiční nebo inovační vlny jedná se

248 246 FORUM STATISTICUM SLOVACUM 7/2011 tedy o šoky na straně nabídky. Nabídkový šok zrychlí ekonomiku ale po vyčerpání investiční nebo inovační vlny nastane rychlé zpomalení ekonomiky. Předkládaný příspěvek se zabývá rozdělením hospodářských cyklů prostřednictvím identifikace frekvenčního chování růstového hospodářského cyklu podle geografické a ekonomické příslušnosti k určitému regionu na hospodářské cykly lokální a globální na jejichž základě lze předpokládat i existenci lokálních a globálních makroekonomických šoků. Nelze sice zabránit vzniku těchto šoků ale v případě nalezení jejich zdrojů a identifikování na jaké šoky je daná ekonomika náchylnější je možné lépe předvídat jak bude hospodářský cyklus a tím i daná ekonomika na makroekonomický šok reagovat. 2. Metodika Hospodářský cyklus je zpravidla modelován na časové řadě ekonomického ukazatele. Tradičním výchozím principem při aditivním modelování časové řady jednorozměrného přístupu je rozložení na trendovou sezónní a cyklickou složku. Je-li zájem analytika soustředěn na odhad a následný popis trendové funkce při použití sezónně očištěných dat pak lze zjednodušit vyjádření časové řady Y t = xt + ε t = qt + ct t = 1 n jako aditivní spojení trendové složky q t a cyklické složky c t kdy ε t nepravidelná složka odrážející nesymetrický pohyb časové řady může být vnímána právě jako součást cyklické složky. Z hlediska metodických přístupů lze analýzu časové řady rozdělit na analýzu v časové doméně a analýzu ve frekvenční doméně. Analýza hospodářského cyklu v časové doméně zpravidla sestává z identifikace růstového hospodářského cyklu prostřednictvím zvolené detrendovací nebo filtrační techniky následované datováním získaného růstového cyklu. Jak ukazuje Fidrmuc a Korhonen (2006) tento přístup byl dlouhou dobu dominantní. Zabývali se jím například Bonenkamp (2001) nebo Artis Marcellino a Proietti (2004). Naopak analýza ve frekvenční doméně se začala prosazovat až v devadesátých letech minulého století. Za povšimnutí stojí práce Baxtera a Kinga (1999) ve které se věnují pásmovým typům filtru a z novějších například práce Halletha a Richtera (2004) kteří ve svém článku provádějí dekompozici hospodářského cyklu v časové i frekvenční doméně. Oproti analýze v časové doméně poskytuje analýza ve frekvenční doméně další informace jako je identifikace periodicity a analýza typu cyklického kolísání. Nevýhodou frekvenčního přístupu je nemožnost nalezení začátku a konce jednotlivých identifikovaných period proto je vhodné kombinovat oba výše uvedené přístupy. Jeden ze způsobů kterým lze z časových řad odstranit dlouhodobý trend je pomocí filtračních technik. Filtraci je možné provádět pomocí technik v časové i frekvenční doméně. Konstrukce filtrů které lze použít pro odstranění dlouhodobé složky jsou založeny na aproximaci ideálního filtru který představuje filtrování nekonečné vstupní časové řady a nekonečného počtu vah. V případě konečné délky vstupní časové řady je to nemožné proto se používají filtry které ideální filtr aproximují (Iacobucci 2005). V předkládaném příspěvku je využito Baxterova-Kingova (BK) filtru typu pásmová propust (Baxter a King 1999) a Hodrickova-Prescottova (HP) filtru typu horní propust (Hodrick a Prescott 1980). Pro popis frekvenčního chování časové řady bude využito odhadu spektra metodou periodogramu (Hamilton 1994). 3. Výsledky Makroekonomický ukazatel který byl pro identifikaci hospodářského cyklu v příspěvku zvolen je index průmyslové produkce pro EA15 a USA za období 1986/M1 2010/M6. Zdrojem dat pro EA15 byl Eurostat (Eurostat) pro USA americký Federal Reserve Systém (FED) data jsou sezónně očištěná vyjádřena v meziročních procentních změnách. Nejprve bylo provedeno detrendování vstupní časové řady a to pomocí HP filtru

249 FORUM STATISTICUM SLOVACUM 7/ s parametrem λ = 400 (Hodrick Prescott; 1980) a BK pásmového filtru s délkou klouzavé části K = 12 (Baxter King; 1999). Nastavení pásma BK filtru je provedeno dle Guaye a St. Amanda (1997). Pomocí rozšířeného Dickey-Fulerova testu bylo zjištěno že hodnoty růstových cyklů jsou stacionární v úrovni při % (Seddidghi Lawler Katos; 2000). Následně byly hodnoty růstových cyklů datovány v časové doméně pomocí Bry-Boschanova algoritmu (Bry a Boschan 1971) a vypočteny délky cyklů přičemž se za cyklus považuje období od jednoho vrcholu k druhému (Artis 2004). V další fázi analýzy byl proveden ve frekvenční doméně odhad spektra metodou periodogramu a výsledné hodnoty testovány na statistickou významnost pomocí R. A. Fisherova testu (Anděl 1976). Na základě srovnání nalezených délek hospodářských cyklů v předchozí části práce došlo k rozdělení nalezených cyklů na lokální a globální hospodářské cykly podle formulovaného kritéria. Obrázek 1: Růstový cyklus indexu průmyslové produkce pro EA 15 (vlevo) a FED (vpravo) Ze zobrazení růstových cyklů modelovaných na hodnotách indexu průmyslové produkce EA 15 a FED (graf 1) je patrné že v případě EA15 je růstový cyklus získaný aplikací HP filtru více volatilní než při použití BK filtru zvláště na začátku zvoleného období. Na konci časového období vykazuje růstový cyklus identifikovaný HP filtrem rozdílný vývoj než růstový cyklus nalezený BK filtrem. Za povšimnutí stojí i menší volatilita nalezených růstových cyklů v období od roku 1992 do roku 2001 slabší podobnost je viditelná až do roku 2008 od kdy se datuje začátek hypoteční krize v USA. V případě růstových cyklů FED (graf 1) můžeme vidět že aplikací obou filtračních technik byly získány cykly s velmi podobným vývojem. U růstového cyklu nalezeného HP filtrem jsou znatelná výraznější vychýlení v koncových bodech než v případě ostatních růstových cyklů což je možné přičítat problému hraničních efektů HP filtru. Z tabulky 2 která popisuje délky cyklů identifikované v časové doméně v ročním vyjádření je patrné že největší počet hospodářských cyklů byl identifikován pro růstový cyklus získaný aplikací HP filtru na datech EA15 a to devět. V případě FED byl identifikován shodný počet cyklů při použití obou filtračních metod a to osm. Jak pro EA15 tak i pro FED byla většina cyklů delších než dva a půl roku. Tabulka 2: Identifikované délky cyklů v časové doméně EA15 Délky cyklů v počtu čtvrtletí Počet cyklů HP BK FED Délky cyklů v počtu čtvrtletí HP BK Zdroj: vlastní výpočet

250 248 FORUM STATISTICUM SLOVACUM 7/2011 Porovnáním získaných růstových cyklů modelovaných na hodnotách indexu průmyslové produkce EA 15 a USA bylo možné v tabulce 3 pozorovat odlišnosti pomocí nichž lze rozdělit hospodářské cykly na lokální a globální. Za tímto účelem bylo formulováno následující kritérium lokálního a globálního hospodářského cyklu. O globálním hospodářském cyklu hovoříme v případě že byla na růstových cyklech EA 15 a FED současně identifikována statisticky významná frekvence na jednoprocentní či pětiprocentní hladině významnosti pro zvolené filtry. O lokálním hospodářském cyklu hovoříme v případě že statisticky významná frekvence byla identifikována na růstovém cyklu modelovaném pouze na datech EA 15 nebo FED na jednoprocentní či pětiprocentní hladině významnosti pro zvolené filtry. Tabulka 3: Odhad periodogramu pro EA15 a FED (periody vyjádřeny v letech) EA 15 FED Periody HP Periody BK Periody HP Periody BK *** *** *** *** *** 608 ** 558 *** 608 *** 558 *** *** 487 ** 447 *** 406 *** 372 *** 406 *** 372 *** 348 *** 348 *** 304 *** 319 *** 304 *** 319 *** 270 *** 279 *** 270 *** 279 *** 243 *** 248 *** 243 *** 248 *** 221 *** 223 *** 221 *** 223 *** 203 *** 203 *** 203 *** 203 *** 187 *** 186 *** 187 *** 186 *** 174 *** 172 *** 174 *** 172 *** 162 *** 162 *** 152 *** 160 *** 152 *** 160 *** 143 *** 149 *** *** *** *** 131 *** 131 *** *** *** *** 122 *** 118 *** ** *** ** 106 ** 106 *** ** ** ** ** ** ** 090 ** ** ** 080 ** 076 ** ** * ** Zdroj: (vlastní výpočet)

251 FORUM STATISTICUM SLOVACUM 7/ Pro přehledné zobrazení jsou v tabulce 3 lokální a globální cykly odlišeny ve stupni šedi i odsazením čísla. Pro globální hospodářský cyklus byla zvolena světle šedá barva a tučné písmo zarovnané vlevo pro lokální hospodářský cyklus tmavší šedá zarovnání hodnot vpravo. Tabulka 4 názorně shrnuje všechny identifikované cykly pro EA15 a FED. Tabulka 4: Rozdělení period podle délky trvání ve frekvenční doméně pro EA15 a FED Filtrační technika velmi krátké do 3 let krátké 3 5 let Délky cyklů střednědobé 7 11 let cykly výstavby let EA15 USA EA15 USA EA15 USA EA15 USA HP x x x x BK x x x x x x Zdroj: (vlastní výpočet) Z tabulky 5 můžeme vidět že globální hospodářské cykly modelované na datech indexu průmyslové produkce pro EA 15 a FED byly identifikovány především jako velmi krátké a krátké cykly. Lokální hospodářské cykly byly nalezeny především na datech FED jeden cyklus byl identifikován jako krátký zbytek cyklů patří mezi velmi krátké cykly které je možné považovat i za sezónní výkyvy. Tabulka 5: Rozdělení lokálních a globálních hospodářských cyklů velmi krátké do 3 let Identifikované cykly krátké 3 5 let Lokální cyklus x x střednědobé 7 11 let Globální cyklus x x x Zdroj: vlastní výpočty cykly výstavby let 4. Závěr Předkládaný příspěvek se zabývá rozdělením hospodářských cyklů prostřednictvím identifikace frekvenčního chování růstového hospodářského cyklu podle geografické a ekonomické příslušnosti k určitému regionu na hospodářské cykly lokální a globální. Na základě provedeného filtrování vstupních časových řad byly získány růstové cykly indexu průmyslové produkce pro data EA 15 a FED. Jako filtrační techniky byly zvoleny Hodrickův- Prescottův filtr a Baxterův-Kingův filtr. Každá zvolená filtrační technika vykazovala určitá specifika. Růstové cykly identifikované za použití Hodrickova-Prescottova filtru vykazovaly vyšší volatilitu než cykly nalezené Baxterovým-Kingovým filtrem. Současně za použití Hodrick-Prescottova filtru bylo identifikováno největší množství růstových cyklů a to v případě EA15. V případě FDE byl identifikován stejný počet cyklu při použití obou filtračních metod. Z hlediska délky cyklů umožnila časová doména identifikovat cykly délek do tří let v případě EA15 je možné hovořit i o cyklu délky od tří do pěti let (HP 317 let; BK 392 let). Rozlišení na cykly lokálního nebo globálního charakteru tento přístup však neumožňoval. Vzhledem k omezené možnosti časové domény proběhla následně analýza ve frekvenční doméně s jejíž pomocí byly identifikovány cykly velmi krátké (do tří let) i krátké (3-5 let) pro EA15 i FED při použití růstového cyklu získaného aplikací Hodrickova- Prescottova filtru. V případě využití Baxterova-Kingova filtru byly navíc identifikovány cykly střednědobé (7-11let). Na základě porovnání odhadnutých spekter příslušných růstových cyklů byly vypozorovány odlišnosti a navrženo kritérium pro rozdělení cyklů na lokální a globální. Bylo zjištěno že lokální cykly jsou délky spíše krátké a velmi krátké tj.

252 250 FORUM STATISTICUM SLOVACUM 7/2011 s trváním do pěti let globální cykly jsou délky spíše střední s dobou trvání od sedmi do jedenácti let. Předkládaný příspěvek vznikl za podpory projektu GA ČR č. P402/11/0570 s názvem Časově-frekvenční přístup k datování hospodářského cyklu České republiky. 5. Literatura [1] ARTIS M. MARCELLINO M. PROIETTI T.: Characterising the Business Cycles for Accession countries. CEPR-EABCN Conference of Business Cycle and Acceding Countries Vienna [2] BAXTER R. KING R. G.: Measuring Business Cysles: Approximate Band-Pass Filters for Economic Time Series. Review of Economic and Statistics 1999 Vol. 81 No. 4 pp [3] BONENKAMP J. JACOBSJ. KUPER G.H.: Measuring Business Cycles in the Netherlands : A comparison of Business Cycle Dating Methods. SOM Research Report No. 01C25 Systems Organisation and Management Groningen. Uversity of Groningen [online] [4] EUROSTAT: National Accounts (including GDP) [on-line]. [cit ]. URL: [5] FED: Gross Domestic Product (GDP) & Components [on-line]. [cit ]. URL: [6] FIDRMUC J. KORHONEN I.: Meta-Analysis of the Business Cycle Correlation between the Euro Area and the CEECs. Journal of Comparative Economics No. 3: EconLit with Full Text EBSCOhost (accessed May ). [7] HALLETH A. H. RICHTER C.: A Time-frequency Analysis of the Coherences of the US Business Cycle and the European Business Cycle CEPR Discussion Paper no London 2004 Centre for Economic Policy Research. [8] HAMILTON J. D.: Time Series Analysis. Princenton University Press pp. ISBN -10: [9] HODRICK R.J. PRESCOTT E.C.: Post-war U.S. Business Cycles: An Empirical Investigation mimeo Carnegie-Mellon University Pitsburgh PA pp. [10] HOLMAN R.: Ekonomie. 4. vyd. Praha: C.H. Beck s. Beckovy ekonomické učebnice. ISBN [11] IACOBUCCI A. NOULLEZ A.: Computational Economics [online]. February 2005 v. 25 iss. 1-2 pp [cit ]. URL: pdf [12] ROMER D.: Advanced macroeconomics. 3. vyd. Boston Mass.: McGraw-Hill pp. ISBN Adresy autorů: Petra Šírková Bc. Výzkumné centrum PEF MZLU v Brně Zemědělská l Brno petra.sirka@gmail.com Jitka Poměnková Ph.D. doc. RNDr. Výzkumné centrum PEF MZLU v Brně Zemědělská l Brno pomenka@mendelu.cz

253 FORUM STATISTICUM SLOVACUM 7/ Odhad hustoty rozdelenia zmesou exponenciálnych funkcií Density estimation using mixture of exponential distributions Alena Tartaľová Abstract: Parametric and nonparametric methods have been considered in describing the size distribution of income. This paper provides a survey of the mixture of exponential distributions as an income distribution. The paper deals with the probability density estimation for household s income in Slovak republic. We described how to obtain the estimate of density and distribution function. In order to identify the number of components we construct kernel density estimator and found that mixture of two distributions is suitable. We showed that the free statistical software XploRe for the kernel density and mixture of exponential distributions estimation is suitable. Key words: density estimation kernel density mixture of exponential distributions the income of households Kľúčové slová: odhad hustoty jadrová hustota zmes exponenciálnych rozdelení príjem domácností JEL classification: C13 C16 O15 1. Úvod Odhad pravdepodobnostného rozdelenia príjmov obyvateľstva zohráva dôležitú úlohu v ekonomickej analýze. Informácie získané z odhadu pravdepodobnosti najvyšších a najnižších príjmov sú dôležité pri ohodnotení nerovnosti príjmov pri meraní chudoby ako aj pri daňových reformách. Zisťovaniu životnej úrovne obyvateľstva a sociálnej situácii jednotlivcov je venovaných množstvo publikácií v časopisoch a zborníkoch (domácich aj zahraničných) pozri napr. [1][4] [7] [7] [9][10]. Z teórie pravdepodobnosti poznáme dva základné prístupy k odhadu hustoty výberových údajov: Parametrický prístup ktorý je v súčasnosti najviac používaný a menej známy neparametrický prístup ktorý sme podrobnejšie popísali v [8]. Pri parametrickom prístupe na základe vlastností výberového súboru urobíme predpoklad že údaje pochádzajú z nejakého známeho rozdelenia s funkciou hustoty. Následne odhadujeme parametre rozdelenia pomocou jednej zo známych metód (napr. metódou maximálnej vierohodnosti). Problémom pri parametrickom modelovaní je že obmedzenie odhadu na konkrétny typ pravdepodobnostného rozdelenia urobí určité dôležité predpoklady o hodnotách ktoré sme nepozorovali ale ktorých pravdepodobnosť výskytu chceme vypočítať. 2. Modelovanie príjmov pravdepodobnostnými rozdeleniami Neparametrický prístup k odhadu predstavuje niekoľko metód z ktorých najpoužívanejšou je jadrová hustota (z angl. Kernel density estimation). Všeobecné vyjadrenie odhadu hustoty rozdelenia fˆ h ( x) pre hodnotu funkcie f(x) v bode x založenom na náhodnom výbere x 1 x2 K x n pomocou jadrovej funkcie n x xi f ˆ 1 h ( x) = K nh i= 1 h (1)

254 252 FORUM STATISTICUM SLOVACUM 7/2011 Tabuľka 1: Jadrové funkcie Obrázok 1: Grafy jadrových funkcií Odhad jadrovej hustoty rozdelenia teda závisí od dvoch parametrov. Pre výpočet jadrovej hustoty je dôležité na začiatku zvoliť jadrovú funkciu K a vyhladzujúci parameter h. Ukazuje sa že voľba jadrovej funkcie nie je rozhodujúca (vo viacerých vedeckých článkoch používajú Epanechnikovu funkciu) dôležitejšie je správne zvoliť parameter h. Veľmi vysoké hodnoty h spôsobujú tzv. prehladenie (angl. oversmoothed) a naopak veľmi nízke hodnoty tzv. podhladenie (angl. undersmoothed). Okrem neparametrického prístupu je stále najpoužívanejším práve parametrický prístup. Ako prvý začal modelovať rozdelenie príjmov Vilfred Pareto ešte v roku Vtedy vynašiel Paretovo rozdelenie ktoré môže byť prvého druhého alebo tretieho resp. štvrtého typu (podľa [1]): I. Typ: II. Typ: = α F ( x σ α ) = x x > σ. (2) σ α x µ F( x µ σ α) = 1 + σ x > µ. (3) 1 1/ γ x µ III. Typ: F ( x µ σ γ ) = 1 + x > µ. (4) σ α 1/ γ x µ IV. Typ: F ( x µ σ γ α) = 1 + x > µ. (5) σ Ďalšími najčastejším modelmi sú lognormálne rozdelenie exponenciálne alebo tiež Weibullovo rozdelenie. Menej známymi rozdeleniami sú Dagumovo alebo Singh-Maddalovo rozdelenie dané hustotou rozdelenia (podľa [1]): Dagumovo rozdelenie b+ 1 ( ) = abcx f x a>1 b>0 c>0. (6) = b + 1 (1 + ax ) c Singh-Maddalovo rozdelenie: b= 1 ( ) = abcx f x a>0 b>0 c>0 bc>.1 (7) b + 1 (1 + ax ) c

255 FORUM STATISTICUM SLOVACUM 7/ Rozdelenie ročných príjmov je asymetrické rozdelenie a navyše môže byť aj viac modálne (viac vrcholové). V takom prípade všetky bežne používane distribučné funkcie nie sú vhodné a ako vhodný model sa ponúka zmes pravdepodobnostných rozdelení. 3. Zmes exponenciálnych rozdelení F k Nech p p 1 2 K pk je postupnosť nezáporných váh takých že p i i= 1 1( x) F2 ( x) Fk ( x) = 1 ďalej nech K je postupnosť distribučných funkcií exponenciálneho rozdelenia s parametrami λ λ 1 2 K λk. Potom distribučná funkcia definovaná vzťahom F( x) = k i= 1 p F ( x) = i i k i= 1 p i λi x ( 1 e ) (8) je zmesou k exponenciálnych rozdelení. Hustota pre zmes exponenciálnych rozdelení je v tvare: f ( x) = k p f ( x) = i i k p λ e i= 1 i= 1 (9) Teda okrem parametrov exponenciálneho rozdelenia je potrebné odhadnúť aj pravdepodobnosti pi. Odhad parametrov zmesi rozdelení je možné urobiť momentovou metódou alebo metódou maximálnej vierohodnosti. Keďže každá z týchto metód dáva odlišné výsledky kvalita odhadu sa určuje na základe jeho disperzie (pomocou Rao-Cramerovej nerovnosti pre minimálnu hranicu ktorú môže dosiahnuť ľubovoľný nevychýlený odhad). Okrem toho je známy aj tzv. EM algoritmus (pozri napr. [1]). 4. Modelovanie príjmov domácností Základom analýzy sú údaje o celkovom disponibilnom príjme domácností pochádzajúce z výberového zisťovania o príjmoch a životných podmienkach domácností (EU SILC 2009). Z výberových charakteristík (v Tabuľke 1) vyplýva že príjmy domácností sú nesymetrické pravostranne zošikmené a z histogramu je vidieť že rozdelenie má predĺžený pravý koniec rozdelenia. Preto ako vhodný model môže poslúžiť niektoré z pravostranne zošikmených rozdelení. Najprv sme údaje modelovali pomocou známych pravdepodobnostných rozdelení ktoré sú k dispozícii v programe STATGRAPHICS Centurion XV. Po aplikácii testov dobrej zhody ani jedno z rozdelení nemodeluje empirické údaje dobre pre všetky rozdelenia by sme hypotézu o zhode s teoretickým rozdelením zamietli. Najlepším modelom by z týchto rozdelení mohlo byť trojparametrické loglogistické rozdelenie s odhadnutými parametrami: µ = σ 2 = γ= pre ktoré je p-hodnota = E-8 čo je maximálna spomedzi všetkých rozdelení. Toto rozdelenie nie je vhodným modelom najmä pre najvyššie príjmy na pravom konci rozdelenia. Vhodný tvar rozdelenia pravdepodobnosti príjmov je teda potrebné nájsť použitím iných metód. Vhodnou alternatívou je použitie kvantilových funkcií ktorým sa na Slovensku a v Čechách venujú autori napr. v [5]. i i λi x

256 254 FORUM STATISTICUM SLOVACUM 7/2011 (X 10000) 3 frequency Histogram for prijem (X ) prijem Distribution Loglogistic (3-Parameter) Count 5264 Average Standard deviation Coeff. of variation % Minimum 00 Maximum Range Stnd. skewness Stnd. kurtosis Obrázok 2 : Histogram rozdelenia Tabuľka 2: Výberové charakteristiky Všetky rozdelenia ktoré sú bežne dostupné v štatistických programových balíkoch sú jednomodálne rozdelenia ktoré nemusia byť vhodné modelovanie príjmov. Na identifikáciu počtu komponentov zmesi rozdelenia sa používa jadrový odhad hustoty. Odhad hustoty rozdelenia nájdeme pomocou jadrových odhadov v programe XploRe. Štatistický program XploRe je voľne dostupný na Najskôr je potrebné načítať knižnice programu zadaním príkazov: library( smoother ) library( plot ) Príkazom denbwsel(prijmy) sa otvorí ponuka kde je na výber sedem rôznych metód odhadu parametra h. Ako jadrovú funkciu sme zvolili Epanechnikovu jadrovú funkciu. Hodnoty parametra h sú v tabuľke 3. Podobne by sme dostali odhady parametra aj pre ďalšie jadrové funkcie ak by sme zmenili parametre pomocou (Change parameters). Záver urobíme na základe grafického porovnania. Porovaním odhadu jadrovej hustoty a histogramu na obrázku 5 je zrejmé že želaný tvar hustoty rozdelenia príjmov najlepšie vystihuje krivka jadrovej hustoty s vypočítaným prametrom h= podľa Silvermanovho pravidla. Metódou krížovej validácie sme dostali krivku ktorá nie je dostatočne hladká. Podľa jadrovej hustoty sa zdá byť vhodné použiť dva komponenty a teda zmes dvoch exponenciálnych rozdelení. V štatistickom programe XploRe sme použitím funkcie estmixexp odhadli parametre zmesi dvoch exponenciálnych rozdelení použitím dvoch metód odhadu parametrov metódy momentov (MM) a metódy maximálnej vierohonosti (MMV). Výsledky sú v tabuľke 4: V tabuľke 5 sú hodnoty testovacích štatistík pre Kolmogorov Smirnovov test (KS) pre Kuiperov test (K) a pre Cramer von Misesov test (CvM). Malé hodnoty testovacej štatistiky pre KS test a pre Kuiperov test indikujú vhodnosť zmesi dvoch exponenciálnych rozdelení pre výšku príjmov obyvateľstva. 5. Záver V príspevku sme sa venovali pravdepodobnostnému modelovaniu hustoty rozdelenia náhodnej premennej. Na príklade modelovania príjmov domácností sme ukázali že použitie parametrických modelov je pre heterogénne populácie nepostačujúce a je nutné použiť iné metódy. Použitie neparametrických metód je výhodné vtedy ak dopredu nepoznáme tvar a vlastnosti rozdelenia pretože nevyžaduje žiaden predpokladom. V prípade modelovania príjmov sme zistili že vhodným modelom je dvojmodálne rozdelenia. Na odhad

257 FORUM STATISTICUM SLOVACUM 7/ pravdepodobnosti rozdelenia sme použili zmes dvoch exponenciálnych rozdelení pre ktoré sme odhadli parametre a porovnali zhodu s empirickým rozdelením pomocou testov dobrej zhody. Least Squares CV Biased CV Smoothed CV Jones MarronPark CV Park Marron plug-in Silverman's rule of thumb Obrázok 3: Metódy odhadu parametra h Tabuľka 3: Hodnoty parametra h Obrázok 4: Odhad jadrovej hustoty použitím Silvermanovho pravidla (vľavo) a metódy krížovej validácie (vpravo) Metóda odhadu p λ 1 λ 2 MM e e-05 MMV e e05 Tabuľka 4: Odhady parametrov pre zmes exponenciálnych rozdelení Metóda odhadu KS K CvM MM MMV Tabuľka 5: Výsledky testov dobrej zhody pre zmes exponenciálnych rozdelení

258 256 FORUM STATISTICUM SLOVACUM 7/ Literatúra [1] BARTOŠOVÁ J. FORBELSKÁ M Mixture Model Clustering for Household Incomes In: Aplimat - Journal of Applied Mathematics Bratislava : Slovak University of Technology in Brati 3 (2010) 3 od s s. ISSN [2] CHOTIKAPANICH D Modelling Income Distributions and Lorenz Curves. Springer Science+Business Media LLC 2008 ISBN: [3] HARDLEW. et al Nonparametric and Semiparametric Models[online]. Springer Verlag 2004[cit ]. Dostupné na internete: fedc.wiwi.huberlin.de/xplore/ebooks/html/spm [4] JUHÁS M. SKŘIVÁNKOVÁ V Analýza extrémnych hodnôt v poistení motorových vozidiel metódou POT. č s ISSN [5] PACÁKOVÁ V. SIPKOVÁ Ľ. SODOMOVÁ E Štatistické modelovanie príjmov domácností v Slovenskej republike In: Ekonomický časopis č. 4 d [6] SILVERMAN B. W : Density estimation for Statistics and Data Analysis New York: CHAPMAN AND HALL S. ISBN [7] STANKOVIČOVÁ I Analýza monetárnej chudoby v domácnostiach Českej republiky In: Forum Statisticum Slovacum č s [8] TARTAĽOVÁ A. 2010: Neparametrické metódy odhadu hustoty rozdelenia. In: Forum Statisticum Slovacum č s ISSN [9] ŽELINSKÝ T Porovnanie alternatívnych prístupov k odhadu individuálneho blahobytu domácností ohrozených rizikom chudoby. In: Ekonomický časopis. - ISSN Roč. 58 č. 3 (2010) s [10] ŽELINSKÝ T Analýza chudoby na Slovensku založená na koncepte relatívnej deprivácie. In: Politická ekonomie. - ISSN Vol. 58 no. 4 (2010) p [11] WAND M. P. JONES M.C. 1995: Kernel Smoothing London: Chapman and Hall s. ISBN Poďakovanie: Príspevok bol vytvorený s podporou vedeckovýskumného projektu VEGA 1/0127/11 Priestorová distribúcia chudoby v Európskej únii. Adresa autora: Alena Tartaľová Mgr. PhD. Technická univerzita v Košiciach Ekonomická fakulta Katedra aplikovanej matematiky a hospodárskej informatiky Nemcovej Košice alena.tartalova@tuke.sk

259 FORUM STATISTICUM SLOVACUM 7/ Štatistické zisťovanie preferencií prekladateľských postupov Statistical Findings in Preferences of Translation Methods Ľuboš Török Ladislav Mura Abstract: The article presents statistical findings in preferences of translation methods of infopromotional texts in tourism. The aim of the research was to describe preferred tendencies in translation activity. The outlined working hypotheses were subjected to non-parametric statistical analysis. Key words: Translation methods translators preferences non-parametric statistical methods Kľúčové slová: Prekladateľské postupy preferencie translatológov neparametrické štatistické metódy JEL classification: C14 1. Úvod Medzinárodný prenos informácií a vedomostí patrí v týchto dňoch medzi kľúčové potreby v každom odbore. Regionalizácia a globalizácia výrazne posunuli hranice vzájomnej komunikácie a štáty či krajiny sa už nemôžu spoliehať na dlhodobo zaužívané zastarané spôsoby medzinárodného prenosu vedomostí. Existencia medzinárodných inštitúcií zodpovedných za poskytovanie prekladateľských služieb v oblasti inštitucionálnych textov by mala prispieť k eliminácii výskytu podpriemerných prekladov. Cestovný ruch je v mnohých krajinách jedným z hlavných priemyselných odvetví zdrojom štátnych príjmov preto si iste zaslúži zvýšenú pozornosť. Domnievame sa že turistický propagačný materiál reprezentujúci napríklad aj našu republiku si zaslúži aby ho prekladali skúsení profesionálni prekladatelia. Vďaka globalizačným tendenciám a doslova revolučnému rozmachu multilingválnej komunikácie sa translatológia ako veda ktorá ešte pred pár rokmi bojovala za svoju identitu stáva jednou z dôležitých disciplín z pohľadu teórie praxe a metodiky. Sociokultúrne zmeny súvisiace s globalizáciou svetovej ekonomiky a zrýchlený tok informácií preukázateľne ovplyvňujú aj výber prekladateľských metód a stratégií. Z uvedeného dôvodu sme realizovali štatistické zisťovanie prekladateľských postupov. [2] 2. Cieľ materiál a metódy Cieľom predkladaného článku je analyzovať aplikované prekladateľské postupy v oblasti tvorby a prekladu informačno-propagačných materiálov o Slovensku a vyhodnotiť ich vplyv na zahraničného čitateľa. Predmetom nášho záujmu sú turistické texty (letáky brožúry a sprievodcovia) v anglickom jazyku publikované na našom území a v zahraničí. Pri ich komparatívnej analýze sa sústreďujeme predovšetkým na preklad kultúrne špecifických prvkov (kulturém) pretože sa nazdávame že prístup prekladateľov zo Slovenska a Veľkej Británie k ich prekladu je podmienený jazykovým a kultúrnym úzom danej krajiny. Očakávame že britskí a slovenskí autori budú pri prekladoch kulturém vychádzať z vlastnej nomenklatúry a kultúry a teda ich prístup a výber prekladateľských postupov bude preukázateľne odlišný. Za účelom dosiahnutia vytýčeného cieľa bolo potrebné sústrediť primárne informačné pramene a realizovať prieskum technikou dotazníka. Jadrom dotazníka sú samotné otázky. Metodika sa podriaďovala vytýčeným cieľom. Získané výsledky z dotazníkového prieskumu sme spracovali do tabuliek a štatisticky vyhodnotili. Našou úlohou bolo poukázať na možné preferencie prekladateľských postupov jednotlivých skupín respondentov. Pre naše účely sme

260 258 FORUM STATISTICUM SLOVACUM 7/2011 sa rozhodli najprv použiť Dixonov test ktorý nám pomohol vylúčiť extrémne hodnoty negatívne ovplyvňujúce ďalšie výpočty. [1] V druhom kroku pomocou Wilcoxonovho α-testu zisťovali či medzi jednotlivými skupinami existujú preukázateľné rozdiely v používaní prekladateľských metód. Vzhľadom na obmedzený rozsah článku sústredíme našu pozornosť na analýzu repetície. 3. Výsledky a diskusia Keďže získané výsledky chceme vyhodnotiť pomocou štatistických metód vopred si musíme stanoviť premenné. Našou úlohou je analyzovať výber prekladateľských metód z pohľadu rôznych skupín respondentov. Na základe toho budeme získané odpovede kategorizovať do troch skupín podľa prislúchajúcej kategórie respondentov: rodení anglicky hovoriaci (aj bilingválni) nerodení anglicky hovoriaci a profesionáli (t.j. absolventi filológie anglického jazyka). Z dôvodu sprehľadnenia a uľahčenia spracovania dát sme sa rozhodli ich prehľadne zobraziť v nasledujúcich troch tabuľkách podľa skupín respondentov medzi ktorými budeme robiť štatistické porovnanie preferencií. Tabuľka 1 Prehľad odpovedí rodených hovoriacich Zdroj: primárny prieskum vlastné spracovanie

261 FORUM STATISTICUM SLOVACUM 7/ Tabuľka 2 Prehľad odpovedí nerodených hovoriacich Zdroj: primárny prieskum vlastné spracovanie Tabuľka 3 Prehľad odpovedí profesionálov Zdroj: primárny prieskum vlastné spracovanie

262 260 FORUM STATISTICUM SLOVACUM 7/2011 Pred tým ako začneme tieto dáta podrobne analyzovať zosumarizujeme si všetky použité prekladateľské postupy: Repetícia: 1A 2B 3C 4B 5A 6B 8A 9A 10B 11A 14C 16A 17B; Doslovný preklad: 1B 2C 3A 13A 13B 15D; Adícia: 1C 3B 4A 5B 6A 7B 8B 9B 10C 12A 15B 16B; Repetícia + doslovný preklad: 2A 5C 7A 13C 15A. Kompenzácia: sa zakladá na čiastočnom preklade: 4D 6C 7C 8C 10A 11B 12C 14A 15C 16C; Kompenzácia + modifikácia: 4C 9C 11C 12B; Transliterácia: 17A; Transliterácia + kompenzácia: 14B. Po spracovaní údajov do tabuliek môžeme pristúpiť k niekoľkým štatistickým testom aby sme si urobili reálnejší obraz o rozdieloch (či podobnostiach) medzi jednotlivými skupinami respondentov. Našou úlohou je zistiť ako reagujú respondenti na jednotlivé prekladateľské postupy. Nazdávame sa ako sme to už postulovali v hypotézach že na základe odlišného lingvistického pozadia vedomostí a skúseností budú jednotlivé skupiny reagovať odlišne. Pred zisťovaním rozdielov vykonáme neparametrický Dixonov test na zistenie extrémnych hodnôt. Pomocou neho zistíme ktoré hodnoty v súbore sú vybočujúce a teda by mali byť pri ďalšom štatistickom spracovaní vynechané. Tieto extrémne hodnoty vypočítame pomocou vzorca: xn xn 1 Qn = kde x n je najvyššia hodnota; x n 1 je druhá najvyššia hodnota; xn x1 x 1 je najnižšia hodnota; Po výpočte Q n si v tabuľke kritických hodnôt vyhľadáme hodnotu Q n( α ) pre daný počet hodnôt n. Minimálna počet n je 3 takže test môžeme uplatniť iba v prípade že počet odpovedí pre danú prekladateľskú metódu je viac ako tri. Ak Q n > Q n( α ) poprieme nulovú hypotézu H 0 a teda extrémnu hodnotu vypustíme. Dixonov test rodení hovoriaci repetícia Všetky získané hodnoty pre danú prekladateľskú metódu usporiadame v zostupnom poradí: n = 13 x n 11 x n 1 8 x Q n = = 03 pre hodnotu n = 13 v tabuľke vyhľadáme Q n( 005) = Q n = 3 Q n 005 = 0361 => hodnota 11 je prijateľná. 0 < ( ) Dixonov test nerodení hovoriaci repetícia Všetky získané hodnoty pre danú prekladateľskú metódu usporiadame v zostupnom poradí: n = 13 x n 18 x n 1 17 x Q n = = 006 pre hodnotu n = 13 v tabuľke vyhľadáme Q n( 005) = Q n = 06 Q n 005 = 0361 => hodnota 18 je prijateľná. 0 < ( ) Dixonov test profesionáli repetícia Všetky získané hodnoty pre danú prekladateľskú metódu usporiadame v zostupnom poradí: n = 12

263 FORUM STATISTICUM SLOVACUM 7/ x n 8 x n 1 6 x n = = Q n = 285 Q n 005 = 0376 => hodnota 8 je prijateľná. Q pre hodnotu n = 12 v tabuľke vyhľadáme n( 005) 0 < ( ) Q = 0376 V ďalšom kroku sme realizovali Wilcoxonov α-test. Ide o neparametrický párový test ktorým stanovujeme či rozdielne hodnoty sú štatisticky preukázateľné. Vo svojom princípe je veľmi podobný napr. znamienkovému testu avšak jeho výsledky sú precíznejšie a teda dôveryhodnejšie. Postupujeme nasledovne: 1. Hodnoty A a B resp. ich percentuálne vyjadrenie umiestnime do oddelených riadkov pod seba; 2. Odčítame B-A; 3. Absolútne hodnoty rozdielov usporiadame v zostupnom poradí; 4. Absolútne hodnoty rozdielov očíslujeme; 5. Každú identickú absolútnu hodnotu označíme priemernou hodnotou napr. ak pozícia 3 a 4 obsahuje rovnakú hodnotu povedzme 3 nie je možné ich usporiadať do poradia tak im pridelíme priemernú hodnotu 35; n n Pomocou vzorca T + T spočítame kladné a záporné hodnoty absolútnych 2 hodnôt; 7. Zistíme minimálnu hodnotu T = min ( T + T ) a potom v štatistickej tabuľke vyhľadáme T ( α ) pre daný počet párov n; 8. ak T > T (α ) H 0 = A = B je potvrdená; ak T T (α ) H 0 = A = B je zamietnutá. Výsledky zistenia prostredníctvom Wilcoxonov α-testu uvádzame v tabuľkách 4 až 6. Tabuľka 4 Wilcoxonov α-test - I A B Rodení h. [%] Nerodení h. [%] B-A Usporiadané B-A Poradie Upravené poradie T T - Zdroj: primárny prieskum vlastné spracovanie

264 262 FORUM STATISTICUM SLOVACUM 7/ n n T + T = 0 = n n T T + = 91 = T = min ( T + T ) = 0 T < T ( 001) = 0 < 98 => H 0 je zamietnutá. Pomocou štatistického zisťovania sme dokázali že tieto dve skupiny sa líšia v používaní repetícii. Rodení hovoriaci využívajú repetíciu v menšej miere ako nerodení hovoriaci. Priemerný rozdiel medzi skupinami respondentov je 10%. Tabuľka 5 Wilcoxonov α-test - II A Rodení h. [%] B Profesionáli [%] B-A usporiadané B-A Poradie Upravené poradie T T - Zdroj: primárny prieskum vlastné spracovanie + 1 n n T + T = 0 = n n T T + = 78 = T = min ( T + T ) = 0 T < T ( 001) = 0 < 72 => H 0 je zamietnutá. Opäť sa nám potvrdilo že rodení hovoriaci a profesionáli majú rozdielne preferencie v tom že profesionáli majú výraznejšiu tendenciu používať repetíciou o 22% častejšie ako rodení hovoriaci. + 1 n n T + T = 13 = n n T T + = 65 = T = min ( T + T ) = 13 T < T ( 005) = 13 < 138 => H 0 je zamietnutá.

265 FORUM STATISTICUM SLOVACUM 7/ Hoci majú nerodení hovoriaci a profesionáli odlišné percentuálne zastúpenie realizované testovanie potvrdzuje že tieto dve skupiny sa od seba veľmi nelíšia pokiaľ ide o používanie repetície. Rozdielnosť v preferenciách medzi oboma skupinami respondentov je teda bezvýznamná. Tabuľka 6 Wilcoxonov α-test - III A Nerodení h. [%] B Profesionáli [%] B-A Usporiadané B-A Poradie Upravené poradie T T Zdroj: primárny prieskum vlastné spracovanie 4. Záver V pracovnej hypotéze sme predpokladali že medzi stanovenými skupinami prekladateľov (rodení hovoriaci nerodení hovoriaci a profesionálni) existujú preukázateľné rozdiely v preferencii prekladateľských postupov. Zo všetkých prekladateľských metód sa v prípade repetície potvrdili rozdiely ktoré respondenti (rodení hovoriaci vs. nerodení hovoriaci a rodení hovoriaci vs. profesionáli) využívajú v odlišnej miere. Pokiaľ ide o porovnanie nerodených hovoriacich a profesionálov výsledky preukazujú isté rozdiely avšak nie v takom rozsahu ako to mu bolo v prípade predchádzajúcich párov respondentov. 5. Literatúra [1] STEHLÍKOVÁ B. Neparametrické štatistické metódy. Nitra: SPU s. ISBN [2] TÖRÖK Ľ Civilizačno-kultúrne procesy v preklade informačno-propagačných materiálov. DDP. Nitra: UKF s. Adresa autorov: PhDr. Ľuboš Török PhD. Ing. et Bc. Ladislav Mura PhD. Katedra translatológie Katedra ekonomiky Filozofická fakulta Ekonomická fakulta Univerzita Konštantína Filozofa Univerzita J. Selyeho Štefánikova trieda 67 Hradná ul Nitra Komárno ltorok@ukf.sk ladislav.mura@gmail.com

266 264 FORUM STATISTICUM SLOVACUM 7/2011 Inovačné aktivity firiem elektrotechnického priemyslu v SR Innovative activities firms in the electronics industry in SR Ondrej Tretiak Abstract: In this article we analyze innovative activities and degries of importance. The goal is to arrange innovating activities of firms in the electronics industry in SR in year 2008 Key words: report Inov 1-99 goals of innovation activities degree of importance labour productivity takings empoyees. Kľúčové slová: výkaz Inov 1-99 ciele inovačných aktivít stupeň dôležitosti produktivita práce tržby zamestnanci. JEL classification: O3 1. Úvod Štatistické zisťovanie o inováciách za rok 2008 pomocou výkazu Inov 1-99 ktorý realizoval Štatistický Úrad Slovenskej republiky obsahuje množstvo modulov inovácií. V príspevku sa venujeme analýze vybraných údajov za modul 653 CIELE INOVAČNÝCH AKTIVÍT V ROKOCH Ciele inovačných aktivít 1. Rozšírenie sortimentu výrobkov a služieb; 2. Nahradenie zastaraných produktov alebo procesov; 3. Vstup na nové trhy; 4. Zvýšenie podielu na trhu; 5. Zvýšenie kvality výrobkov alebo služieb; 6. Zvýšenie pružnosti výroby výrobkov alebo poskytovania služieb; 7.Zvýšenie kapacity výroby výrobkov alebo poskytovania služieb; 8. Zvýšenie ochrany zdravia a bezpečnosti; 9. Zníženie mzdových nákladov na jednotku produkcie Získané údaje boli vytriedené podľa stupni dôležitosti 1-4 (vysoký - nevýznamný) jednotlivých cieľov inovačných aktivít. Na základe získaných odpovedí dopytovaných osôb sa zistili počty respondentov objemy tržieb počty zamestnancov a percentuálne podiely všetkých spomínaných agregátov a tiež produktivity práce. V stĺpcoch tabuliek sú zobrazené: 1.Ciele inovačných aktivít na ktoré sa firmy zamerali. 2. Počet elektrotechnických firiem realizujúcich a nerealizujúcich skúmané aktivity. 3.Tržby sumy peňažných prostriedkov získaných za predaj tovarov vykonaných prác alebo poskytnutých služieb. 4. Počet zamestnancov pôsobiacich v skúmaných firmách. Všetky číselné hodnoty sú vyjadrené absolútnymi a tiež percentuálnymi hodnotami. Posledným stĺpcom je vyjadrená produktivita práce ktorá predstavuje produkciu zhotovenú jedným pracovníkom za jednotku času. Produktivita práce je vyjadrená len v absolútnych hodnotách. 2. Rozšírenie sortimentu výrobkov a služieb Výsledky o stupni dôležitosti cieľa Rozšírenie sortimentu výrobkov a služieb sú uvedené v tab. 2.1 a ich grafické znázornenie na grafe 2.1. Tento cieľ možno považovať za vysoko dôležitý tak z pohľadu podielu podnikov podielu na objeme tržieb a tiež podielu na počte zamestnancov. Odpoveď Vysoký uviedlo 76 respondentov 6320% (z inovujúcich respondentov) z objemu tržieb inovujúcich podnikov to je 8485% (z objemu tržieb inovujúcich podnikov) a z počtu zamestnancov 7734 % (z počtu zamestnancov v inovujúcich podnikov. Produktivita práce v podnikoch s vysokým hodnotením je druhá najvyššia a predstavuje sumu 2691 eur na zamestnanca. Pri porovnaní inovujúcich podnikov s neinovujúcimi podnikmi vidíme veľký rozdiel pri produktivite práce. Produktivita práce neinovujúcich podnikov dosahovala (podnikov ktoré uviedli že momentálne neinovujú) viac ako dvojnásobok hodnoty inovujúcich podnikov. Pri cieli Rozšírenie sortimentu výrobkov a služieb najvyššia pridaná hodnota inovujúcich

267 FORUM STATISTICUM SLOVACUM 7/ podnikov dosahuje hodnotu 3682 eur na zamestnanca. Táto hodnota je však tiež 18 krát menšia ako pridaná hodnota neinovujúcich podnikov. Príčina môže byť nízky dopyt po nových výrobkoch a službách prípadne nedostatočná propagácia týchto produktov. Tab.2.1 Rozšírenie sortimentu výrobkov a služieb a) súbor vrátane neinovujúcich podnikov (riadok bez ) AQ4275 Počet %Počet TRZBY %TRZBY ZAM % ZAM PP vysoký % % % 2691 stredný % % % 884 nízky 6 345% % % 3682 nevýznamný 1 115% % % 2392 Bez % % % 6633 Spolu % % % 4737 b) len podniky využívajúce inovácie AQ4275 Počet %Počet TRZBY %TRZBY ZAM % ZAM PP Vysoký % % % 2691 Stredný % % % 884 Nízky 6 502% % % 3682 Nepoužiteľný 1 088% % % 2392 Spolu % % % 2453 Graf Nahradenie zastaraných produktov alebo procesov Cieľ Nahradenie zastaraných produktov a procesov je znázornený v tab. 2.2 jeho 90% (111 zo 121) inovujúcich podnikov pridelilo tomuto cieľu vysoký alebo stredný stupeň dôležitosti. Ale aj napriek tomu najväčšiu produktivitu práce dosiahli pri tejto aktivite firmy ktoré jej pridelili nízky stupeň dôležitosti. Hodnota produktivity práce pri nízkom stupni dôležitosti predstavovala 3131 eur na zamestnanca. Tab.2.2 Nahradenie zastaralých produktov alebo procesov a) súbor vrátane neinovujúcich podnikov (riadok bez ) AR3064 Počet %Počet TRZBY %TRZBY ZAM % ZAM PP vysoký % % % 2076 stredný % % % 2728 nízky 4 460% % % 3131 nevýznamný 6 230% % % 2371 Bez % % % 6633 Spolu % % % 4737

268 266 FORUM STATISTICUM SLOVACUM 7/2011 b) len podniky využívajúce inovácie AR3064 Počet %Počet TRZBY %TRZBY ZAM % ZAM PP vysoký % % % 2076 stredný % % % 2728 nízky 4 342% % % 3131 nevýznamný 6 480% % % 2371 Spolu % % % 2453 Graf Vstup na nové trhy Výsledky z cieľa Vstup na nové trhy sú uvedené v tab. 2.3 a ich grafické znázornenie na grafe 2.3. Tomuto cieľu až 52 firiem pridelilo vysoký stupeň dôležitosti. Napriek tomu najvyššia produktivita práce bolo dosiahnutá pri nízkom stupni dôležitosti 3237 eur na zamestnanca. Tab.2.3 Vstup na nové trhy a) súbor vrátane neinovujúcich podnikov (riadok bez ) AR3065 Počet %Počet TRZBY %TRZBY ZAM % ZAM PP vysoký % % % 2469 stredný % % % 1846 nízky % % % 3237 nevýznamný 5 345% % % 2632 Bez % % % 6633 Spolu % % % 4737 b) len podniky využívajúce inovácie AR3065 Počet %Počet TRZBY %TRZBY ZAM % ZAM PP vysoký % % % 2469 stredný % % % 1846 nízky % % % 3237 nevýznamný 5 425% % % 2632 Spolu % % % 2453 raf. 2.3

269 FORUM STATISTICUM SLOVACUM 7/ Zvýšenie podielu na trhu Výsledky o stupni dôležitosti cieľa Zvýšenie podielu na trhu sú uvedené v tab. 2.4 a ich grafická prezentácia je na grafe 2.4. Vysoký stupeň pridelilo 67 respondentov 5524 % ( z inovujúcich respondentov) na čo pripadalo až 7027 % tržieb (z objemu tržieb inovujúcich podnikov) a 6384% zamestnancov (z počtu zamestnancov v inovujúcich podnikov). Produktivita práce v podnikoch s vysokým hodnotením je najvyššia a predstavuje sumu 2700 eur na zamestnanca. Tab.2.4 Zvýšenie podielu na trhu a) súbor vrátane neinovujúcich podnikov (riadok bez ) AR3066 Počet %Počet TRZBY %TRZBY ZAM % ZAM PP vysoký % % % 2700 stredný % % % 2333 nízky % % % 1569 nevýznamný 3 345% % % 2607 Bez % % % 6633 Spolu % % % 4737 b) len podniky využívajúce inovácie AR3066 Počet %Počet TRZBY %TRZBY ZAM % ZAM PP vysoký % % % 2700 stredný % % % 2333 nízky % % % 1569 nevýznamný 3 259% % % 2607 Spolu % % % 2453 Graf Zvýšenie kvality výrobkov alebo služieb Výsledky o stupni dôležitosti cieľa Zvýšenie kvality výrobkov a služieb sú uvedené v tab. 2.5 a ich grafické znázornenie na grafe 2.5. Tejto aktivite vysokú dôležitosť pridelilo 72 inovujúcich podnikov (takmer 60%). Tržby v týchto podnikoch predstavovali 6636% z celkové počtu tržieb inovujúcich podnikov. Zamestnávali tvorili dokonca viac ako 66 % všetkých zamestnancov inovujúcich podnikov. Ich produktivita práce dosahovala ale až tretiu najvyššiu hodnotu a to 2389 eur na zamestnanca.

270 268 FORUM STATISTICUM SLOVACUM 7/2011 Tab.2.5 Zvýšenie kvality výrobkov alebo služieb a) súbor vrátane neinovujúcich podnikov (riadok bez ) AQ4277 Počet %Počet TRZBY %TRZBY ZAM % ZAM PP vysoký % % % 2389 stredný % % % 2372 nízky 5 575% % % 3177 Bez % % % 6633 Spolu % % % 4737 b) len podniky využívajúce inovácie AQ4277 Počet %Počet TRZBY %TRZBY ZAM % ZAM PP vysoký % % % 2389 stredný % % % 2372 nízky 5 430% % % 3177 Spolu % % % 2453 Graf Zvýšenie pružnosti výroby výrobkov alebo poskytovania služieb Výsledky z cieľa Zvýšenie pružnosti výroby výrobkov alebo poskytovania služieb sú uvedené v tab. 2.6 a ich grafické znázornenie na grafe 2.6. Pri tomto cieli dosahujú firmy realizujúce inovácie najvyššiu produktivitu práce pri stupni dôležitosti nevýznamný a to 4835 eur na zamestnanca. Táto pridaná hodnota má dokonca vyššiu hodnotu ako je priemerná pridaná hodnota za všetky podniky 4737 eur. Ale na druhej strane pridaná hodnota neinovujúcich podnikov je aj v tomto prípade väčšia o cca 37%. Tab.2.6 Zvýšenie pružnosti výroby výrobkov alebo poskytovania služieb a) súbor vrátane neinovujúcich podnikov (riadok bez ) AQ4278 Počet %Počet TRZBY %TRZBY ZAM % ZAM PP vysoký % % % 2552 stredný % % % 2552 nízky 8 575% % % 1684 nevýznamný 4 230% % % 4835 Bez % % % 6633 Spolu % % % 4737

271 FORUM STATISTICUM SLOVACUM 7/ b) len podniky využívajúce inovácie AQ4278 Počet %Počet TRZBY %TRZBY ZAM % ZAM PP vysoký % % % 2552 stredný % % % 2552 nízky 8 631% % % 1684 nevýznamný 4 331% % % 4835 Spolu % % % 2453 Graf Zvýšenie kapacity výroby výrobkov alebo poskytovania služieb Pri cieli Zvýšenie kapacity výroby výrobkov alebo poskytovania služieb sú uvedené výsledky v tab. 2.7 a ich grafické znázornenie na grafe 2.7. Firmy ktoré pridelili tomuto cieľu najvyšší stupeň dôležitosti dosiahli viac ako polovicu tržieb zamestnávali okolo 50 % zamestnancov a ich PP dosahovala druhú najvyššiu hodnotu 2534 eur na zamestnanca. Tab. 2.7 Zvýšenie kapacity výroby výrobkov alebo poskytovania služieb a) súbor vrátane neinovujúcich podnikov (riadok bez ) AQ4279 Počet %Počet TRZBY %TRZBY ZAM % ZAM PP vysoký % % % 2534 stredný % % % 2503 nízky % % % 1972 nevýznamný 6 230% % % 2839 Bez % % % 6633 Spolu % % % 4737 b) len podniky využívajúce inovácie AQ4279 Počet %Počet TRZBY %TRZBY ZAM % ZAM PP vysoký % % % 2534 stredný % % % 2503 nízky % % % 1972 nevýznamný 6 485% % % 2839 Spolu % % % 2453

272 270 FORUM STATISTICUM SLOVACUM 7/2011 Graf Zvýšenie ochrany zdravia a bezpečnosti Výsledky z ôsmeho sledovaného cieľa Zvýšenie ochrany zdravia a bezpečnosti sú znázornené v tab. 2.8 a ich grafická prezentácia je na grafe 2.8. Tomuto cieľu pridelilo vysoký stupeň dôležitosti len niečo viac ako 33 % firiem v ktorých pracovalo niečo cez 30% zamestnancov ale na druhej strane dosiahli takmer najvyššiu produktivitu práce 2935 eur pri tomto cieli. Tab.2.8 Zvýšenie ochrany zdravia a bezpečnosti a) súbor vrátane neinovujúcich podnikov (riadok bez ) AR3067 Počet %Počet TRZBY %TRZBY ZAM % ZAM PP vysoký % % % 2935 stredný % % % 2050 nízky % % % 3071 nevýznamný 2 230% % % 2740 Bez % % % 6633 Spolu % % % 4737 b) len podniky využívajúce inovácie AR3067 Počet %Počet TRZBY %TRZBY ZAM % ZAM PP vysoký % % % 2935 stredný % % % 2050 nízky % % % 3071 nevýznamný 2 176% % % 2740 Spolu % % % 2453 Graf Zníženie mzdových nákladov na jednotku produkcie Výsledky z cieľa Zníženie mzdových nákladov na jednotku produkcie sú znázornené v tab. 2.9 a ich grafická prezentácia je na grafe 2.9. Pri tomto cieli bola dosiahnutá najvyššia produktivita práce pri nízkom stupni dôležitosti 3457 eur na jedného zamestnanca.

273 FORUM STATISTICUM SLOVACUM 7/ Tab.2.9 Zníženie mzdových nákladov na jednotku produkcie a) súbor vrátane neinovujúcich podnikov (riadok bez ) AQ4280 Počet %Počet TRZBY %TRZBY ZAM % ZAM PP vysoký % % % 2428 stredný % % % 1984 nízky % % % 3457 nevýznamný 1 115% % % 2980 Bez % % % 6633 Spolu % % % 4737 b) len podniky využívajúce inovácie AQ4280 Počet %Počet TRZBY %TRZBY ZAM % ZAM PP vysoký % % % 2428 stredný % % % 1984 nízky % % % 3457 nevýznamný 1 088% % % 2980 Spolu % % % 2453 Graf Súhrne výsledky Na základe údajov uvedených v tabuľke 3.1 príp. na grafe 3.1 môžeme konštatovať najvyššie ocenenie dôležitosti (1-4 ) má Rozšírenie sortimentu výrobkov a služieb (ID1). A najnižšie ocenenie dôležitosti (1-4) má Zvýšenie ochrany zdravia a bezpečnosti. Z tabuľky 3.1 príp. z grafu 3.1. vyplýva že priemerné ocenenia vypočítané z frekvencií Počet sú horšie ako počítané z Tržieb či Počtu zamestnancov. Tab. 3.1 Priemerné ocenenie dôležitosti Cieľov inovačných aktivít podľa jednotlivých početností a) Usporiadané podľa Inov 1-99 ID Ciele Počet Tržby Zam. ID1 Rozšírenie sortimentu výrobkov a služieb ID2 Nahradenie zastaralých produktov alebo procesov ID3 Vstup na nové trhy ID4 Zvýšenie podielu na trhu ID5 Zvýšenie kvality výrobkov alebo služieb ID6 Zvýšenie pružnosti výroby výrobkov alebo poskytovania služieb ID7 Zvýšenie kapacity výroby výrobkov alebo poskytovania služieb ID8 Zvýšenie ochrany zdravia a bezpečnosti ID9 Zníženie mzdových nákladov na jednotku produkcie

274 272 FORUM STATISTICUM SLOVACUM 7/2011 b) Usporiadané podľa intenzity priemerného ocenenia (z počtu) ID Ciele Počet Tržby Zam. ID1 Rozšírenie sortimentu výrobkov a služieb ID5 Zvýšenie kvality výrobkov alebo služieb ID4 Zvýšenie podielu na trhu ID2 Nahradenie zastaralých produktov alebo procesov ID6 Zvýšenie pružnosti výroby výrobkov alebo poskytovania služieb ID9 Zvýšenie kapacity výroby výrobkov alebo poskytovania služieb ID7 Zvýšenie kapacity výroby výrobkov alebo poskytovania služieb ID3 Vstup na nové trhy ID8 Zvýšenie ochrany zdravia a bezpečnosti a) Usporiadané podľa Inov 1-99 b) Usporiadané podľa intenzity priemerného ocenenia (z počtu) Graf 3.1 Priemerné ocenenie dôležitosti Cieľov inovačných aktivít podľa jednotlivých početností 5. Závery Z konečných výsledkov v tabuľkách vyplýva že firmy realizujúce inovačné aktivity kládli najväčší dôraz (pridelili vysoký stupeň dôležitosti): na inováciu 1 - Rozšírenie sortimentu výrobkov a služieb (76 firiem) na inováciu 5 - Zvýšenie kvality výrobkov alebo služieb (72 firiem) na inováciu 4 - Zvýšenie podielu na trhu (19 firiem). Tomu však nezodpovedali vždy aj najvyššie tržby alebo produktivita práce na zamestnanca ako ukazujú nasledujúce závery. Firmy realizujúce inovačné aktivity dosiahli najvyššie tržby zameraním sa: na inovačnú aktivitu 1- Rozšírenie sortimentu výrobkov a služieb tržby: cca 153 mld Sk (508 mil ) pričom dosiahli produktivitu práce 81 tis. Sk (2691 ) /zamestnanec na inovačnú aktivitu 4 Zvýšenie podielu na trhu tržby: cca 121 mld Sk (402 mil ) pričom dosiahli produktivitu práce 813 tis. Sk (2700 ) /zamestnanec na inovačnú aktivitu 5. Zvýšenie podielu na trhu: cca 116 mld Sk (385 mil ) pričom dosiahli produktivitu práce 72 tis. Sk (2389 ) /zamestnanec Najvyššiu produktivitu práce dosiahli firmy: inovačnou aktivitou 6 - Zvýšenie pružnosti výroby výrobkov alebo poskytovania služieb: 1457 tis Sk (4835 ) /zamestnanec hoci respondenti uviedli pre ňu nevýznamný stupeň dôležitosti inovačnou aktivitou 1. Rozšírenie sortimentu výrobkov a služieb: 111 tis. Sk

275 FORUM STATISTICUM SLOVACUM 7/ (3682 )/zamestnanec hoci respondenti uviedli pre ňu nízky stupeň dôležitosti inovačnou aktivitou 8. Zníženie mzdových nákladov na jednotku produkcie: 1042 tis. Sk (3457 )/zamestnanec pričom respondenti uviedli pre ňu nízky stupeň dôležitosti Najvyššia produktivita práce pri ktorom respondenti uviedli vysoký stupeň dôležitosti bola dosiahnutá firmami pri inovačnej aktivite: 8. Zvýšenie ochrany zdravia a bezpečnosti: 8842 tis. Sk (2935 )/zamestnanec. 6. Literatúra [1] CHAJDIAK Jozef. Ekonomika firmy. Bratislava: Statis 2011 ISBN [2] CHAJDIAK Jozef. Štatistika jednoducho. 3. vyd. Bratislava: Statis 2010 ISBN [3] CHAJDIAK Jozef. Štatistika v Exceli 2007.Bratislava: Statis 2009 ISBN [4] STANKOVIČOVÁ Iveta a Mária VOJTKOVÁ. Viacrozmerné štatistické metódy s aplikáciami. Bratislava: Iura Edition ISBN [5] Štatistický úrad Slovenskej republiky výkaz Inov 1-99 Štatistické zisťovanie o inováciách [6] Súbor anonymizovaných údajov CIS2008SK. Zdroj Štatistický úrad Slovenskej republiky Adresa autora : Ondrej Tretiak Ing. et Ing. Slovenská technická univerzita Ústav manažmentu Vazovova Bratislava ondrej.tretiak@yahoo.com ondrejtretiak@gmail.com

276 274 FORUM STATISTICUM SLOVACUM 7/2011 Vyučovanie kombinatoriky a pravdepodobnosti s využitím štatistiky The teaching of combinatorics and probability using statistics Eva Uhrinová Miroslav Mesaroš Abstract: The article focuses on playful teaching of topical unit Combinatorics Probability and Statistics which importance has grown since the arrival of the new educational reform. We are trying to break artificial boundary between Combinatorics Probability and Statistics through the Galton Board whereby we can explain Probability and Combinatorics with the use of Statistics. Key words: Didactic game Galton Board Random phenomenon Symmetrical distribution of probability Kľúčové slová: didaktická hra Galtonova doska náhodný jav symetrické rozdelenie pravdepodobnosti JEL classification: C Úvod V článku sa zaoberáme vyučovaním tematického okruhu Kombinatorika pravdepodobnosť štatistika ktorého význam príchodom Novej školskej reformy vzrástol. Vyučovanie tohto tematického okruhu sa realizuje v oddelených častiach kombinatoriky pravdepodobnosti a štatistiky ktoré však tvoria jeden celok a úzko spolu súvisia. Tento spôsob výučby prináša mnohé nedostatky v podobe nepochopenia súvislosti a závislostí medzi týmito časťami čo pozorujeme i pri príprave budúcich učiteľov matematiky. V nasledujúcom príspevku poukazujeme na výučbu kombinatoriky a pravdepodobnosti s využitím štatistických údajov a to jednoduchou hravou formou využitím Galtonovej dosky. Venujeme sa výučbe tohto tematického okruhu u žiakov ktorí ešte nemajú priamu skúsenosť s pojmami náhodnosť pravdepodobnosť ap. Zameriavame sa na sprostredkovanie vedomostí žiakom strednej školy ale s istou úpravou (zjednodušením) je možné sprostredkovať vedomosti navrhnutým spôsobom aj u žiakov základných škôl. Našim cieľom je predostrieť iný spôsob výučby tohto tematického okruhu. Snažíme sa sprístupniť pochopenie náhodného javu rozdelenie pravdepodobnosti kvalitatívneho určenia pravdepodobnosti symetrie v rozložení pravdepodobnosti. 2. Motivácia žiakov pomocou hry Ako vhodný spôsob motivovania žiakov k rozoberanej problematike vidíme zahranie si didaktickej hry prostredníctvom ktorej sa snažíme vyvolať u žiakov záujem o rozoberanú problematiku. O nasledujúcej didaktickej hre (v podobnom znení) sa zmieňuje aj Hejný [3] v Teórii vyučovania matematiky. Pomôcky: hracie pole (Obrázok 1) minca figúrka Pravidlá hry: Hru hrajú žiaci v dvojiciach. Každá dvojica dostane herný plán (Obrázok 1) mincu a figúrku. Jeden z hráčov bude hádzať mincou druhý posúvať figúrkou po hracom poli. Po odohratí hry sa žiaci vymenia. Na začiatku hry sa položí figúrka na východiskovú polohu ktorou je hlavný vrchol (temeno) trojuholníka (Obrázok 1) cieľovou polohou je ľubovoľný krúžok ležiaci na základni tohto trojuholníka. Žiak hádže mincou a podľa toho či padne líce (averz - tá strana mince na ktorej je vyznačený obrazom a písmom vydavateľ mince) alebo rub zaujme ďalšiu polohu v hracom pláne v zmysle priloženej legendy (averz - doľava reverz doprava). Aby sa hráč dostal na základňu je potrebných 6 hodov mincou. Ak sa hráč ocitol v cieľovej polohe prečíta si zodpovedajúci odkaz.

277 FORUM STATISTICUM SLOVACUM 7/ Obrázok 1: Hrací plán Po skončení hry vyzveme žiakov aby zdvihli ruku Einsteinovia Truhlíci a pod. a výsledky zapíšeme na tabuľu. Všímame si počty žiakov v jednotlivých cieľových skupinách. Žiaci určite odhalia že tu platí istá zákonitosť správania tohto náhodného javu. 3. Motivácia žiakov využitím simulácie Správanie tohto náhodného javu môžeme pozorovať na Galtonovej doske ktorú predstavoval v predchádzajúcej hre hrací plán. Galtonova doska (alebo tiež Quincunx) je losovací nástroj ktorý pozostáva z krabičky rozdelenej na 8 očíslovaných sektorov a veka ktoré je do nej naklonené. Na veku sú rozmiestené kolíky valcového tvaru v siedmich radoch nabitých do tvaru rovnostranného trojuholníka postupne kolíkov. Guľka po spustení po doske naráža na kolíky ktoré ju odrazia vpravo alebo vľavo s pravdepodobnosťou 05. Guľka končí svoju dráhu v jednej z ôsmich priehradok očíslovaných [7]. Pád veľkého počtu guľôčok po Galtonovej doske nám umožňujeme simulovať program Plinko probability (Obrázok 2) [6]. alebo aj program Quincunx (Obrázok 3) [8] ktoré sú voľne dostupné na internete. Obrázok 2: Simulácia hodu guľôčok po Galtonovej doske [6] V programe Plinko probability môžeme zvoliť počet kolíkov v dolnom rade (rows) minimum je 5 maximum je 41. Ďalej je tu možné meniť pravdepodobnosť odrazenia guľôčky

278 276 FORUM STATISTICUM SLOVACUM 7/2011 od kolíka (p). Môžeme nechať padať guľôčky po jednej (1 ball) alebo nechať padať naraz viacero guľôčok (continuous). Stlačením tlačidla Start začne padať podľa voľby buď jedna alebo viacero guľôčok po Galtonovej doske a budú sa zachytávať v dolných priehradkách. Obrázok 3: Simulácia hodu guľôčok po Galtonovej doske [8] V programe Quincumx (Obrázok 3) tiež môžeme meniť počet kolíkov v dolnom rade (Rows) pričom tu je minimum 1 a maximum 19 kolíkov. Možnosť voľby jedného kolíka pokladáme za výhodu. Pod jedným kolíkom sa objavia dve priehradky a môžeme sa presvedčiť že v oboch priehradkách sa bude nachádzať polovica z padnutých guľôčok (50%) teda pravdepodobnosť odrazu guľôčky od kolíka vpravo (resp. vľavo) je ½. Takisto sa dá v tomto programe meniť aj veľkosť tejto pravdepodobnosti čím sa bude meniť rozloženie pravdepodobnosti. Výhodou tohto programu je že nad priehradkami ukazuje počet guľôčok ktoré padli do jednotlivých priehradok. 4. Skúmanie náhodného pokusu Pád guľôčky po Galtonovej doske Pád guľôčky po Galtonovej doske predstavuje náhodný pokus skladajúci sa zo siedmich etáp (máme na mysli klasickú Galtonovu dosku s ôsmimi priehradkami). Obrázok 4: Dráha padnutia guľôčky po Galtonovej doske [4] Každá etapa sa skladá z úsečiek idúcej buď vpravo (označme 1) alebo vľavo (označme 0) (Obrázok 4). Problém 1: Aká je pravdepodobnosť že guľôčka po odraze od kolíka pôjde vpravo (vľavo)? Na skúmanie tejto pravdepodobnosti môžeme využiť aj hod mincou (pravdepodobnosť padnutia líca na minci) alebo simuláciu odrazu niekoľkých guľôčok od jedného kolíku v programe Quincumx kde žiaci názorne uvidia rovnomerné rozdelenie padnutých guľôčok do dvoch priehradok a teda pravdepodobnosť že guľôčka po odraze od kolíka pôjde doprava (respektíve) je ½.

279 FORUM STATISTICUM SLOVACUM 7/ Ďalej si všímame že každú dráhu guľôčky v Galtonovej doske môžeme zapísať pomocou sedemčlennej variácie núl a jednotiek. Napríklad dráha znázornená na obrázku 4 sa dá zapísať nasledovne Problém 2: Koľko existuje rôznych dráh po klasickej Galtonovej doske? Vytvárame sedemčlenné postupnosti núl a jednotiek. Ide teda o variácie s opakovaním siedmej triedy z dvoch prvkov. Počet týchto variácií s opakovaním je 2 7 = 128. Ak sa guľôčka pri náraze na kolík vychýli vpravo môžeme hovoriť o úspechu ak sa vychýli vľavo môžeme hovoriť o neúspechu. Pád guľôčky po Galtonovej doske je teda Bernoulliho schémou so siedmimi pokusmi. Pravdepodobnosť úspechu aj neúspechu je ½. Problém 3: Koľko rôznych dráh vedie do k-tej priehradky Galtonovej dosky ak mám n priehradok? Guľôčka padne do priehradky s číslom 0 ak sa pri každom zo siedmich kolíkov odrazí vždy vľavo. Jej dráhu možno zapísať Guľôčka padne do priehradky s číslom 1 ak sa práve raz vychýli vpravo teda Máme 7 rôznych ciest guľôčky. Všeobecne guľôčka padne do k-tej priehradky ak sa pri páde odrazí práve k-krát doprava teda ak v postupnosti núl a jednotiek sa bude nachádzať práve k jednotiek. Počet n všetkých dráh pri ktorých sa guľôčka odrazí doprava práve k-krát je. k Obrázok 5: Počty ciest vedúcich k jednotlivým kolíkom Galtonovej dosky [5] K jednotlivým kolíkom môžeme dopísať čísla ktoré predstavujú počet ciest vedúcich k týmto kolíkom (Obrázok 5). Toto číslo dostaneme ako súčet počtu ciest vedúcich k dvom vyššie sa nachádzajúcim kolíkom pretože ak sa má guľôčka odraziť od tohto kolíka musela sa tesne predtým odraziť od jedného z dvoch vyššie sa nachádzajúcich kolíkov- buď toho napravo alebo naľavo. Takéto rozloženie prirodzených čísel sa nazýva Pascalov trojuholník. Obrázok 6 Pascalov trojuholník [1]

Témy dizertačných prác pre uchádzačov o doktorandské štúdium

Témy dizertačných prác pre uchádzačov o doktorandské štúdium Témy dizertačných prác pre uchádzačov o doktorandské štúdium Študijný odbor: 3.3.15 Manažment, Študijný program: Znalostný manažment Akademický rok 2010/2011 1. Školiteľ: doc. Ing. Vladimír Bureš, PhD.

More information

Sledovanie čiary Projekt MRBT

Sledovanie čiary Projekt MRBT VYSOKÉ UČENÍ TECHNIC KÉ V BRNĚ BRNO UNIVERSITY OF T ECHNOLOGY FAKULTA ELEKTROTECHNIKY A KOMUNIKAČNÍCH TECHNO LOGIÍ ÚSTAV AUTOMATIZA CE A MĚŘÍCÍ TECHNIKY FACULTY OF ELECTRICAL ENGINEERING AND COMUNICATION

More information

OSOBNOSTNÉ ASPEKTY ZVLÁDANIA ZÁŤAŽE

OSOBNOSTNÉ ASPEKTY ZVLÁDANIA ZÁŤAŽE OSOBNOSTNÉ ASPEKTY ZVLÁDANIA ZÁŤAŽE Katarína Millová, Marek Blatný, Tomáš Kohoutek Abstrakt Cieľom výskumu bola analýza vzťahu medzi osobnostnými štýlmi a zvládaním záťaže. Skúmali sme copingové stratégie

More information

ING (L) Société d Investissement à Capital Variable 3, rue Jean Piret, L-2350 Luxembourg R.C.S.: Luxembourg B č. 44.873 (ďalej ako spoločnosť )

ING (L) Société d Investissement à Capital Variable 3, rue Jean Piret, L-2350 Luxembourg R.C.S.: Luxembourg B č. 44.873 (ďalej ako spoločnosť ) ING (L) Société d Investissement à Capital Variable 3, rue Jean Piret, L-2350 Luxembourg R.C.S.: Luxembourg B č. 44.873 (ďalej ako spoločnosť ) Oznam pre akcionárov 1) Správna rada spoločnosti rozhodla

More information

CHARACTERISTICS OF THE CURRENT STATE IN THE CONSTRUCTION INDUSTRY

CHARACTERISTICS OF THE CURRENT STATE IN THE CONSTRUCTION INDUSTRY The evaluation study concerning the measure Possible solutions to unemployment in the fields of agriculture and construction industry Hodnotiaca štúdia k opatreniu Možnosti riešenia nezamestnanosti pracovníkov

More information

Pracovná skupina 1 Energetický management a tvorba energetických plánov mesta

Pracovná skupina 1 Energetický management a tvorba energetických plánov mesta Pracovná skupina 1 Energetický management a tvorba energetických plánov mesta Metodológia a podpora poskytovaná v rámci Dohovoru primátorov a starostov Skúsenosti českých miest Skúsenosti mesta Litoměřice

More information

CONTEMPORARY POSSIBILITIES OF MODELING OF THE PROBLEMS OF VEHICLE TRACK INTERACTION

CONTEMPORARY POSSIBILITIES OF MODELING OF THE PROBLEMS OF VEHICLE TRACK INTERACTION ROCZNIKI INŻYNIERII BUDOWLANEJ ZESZYT 8/2008 Komisja Inżynierii Budowlanej Oddział Polskiej Akademii Nauk w Katowicach CONTEMPORARY POSSIBILITIES OF MODELING OF THE PROBLEMS OF VEHICLE TRACK INTERACTION

More information

PORUCHY A OBNOVA OBALOVÝCH KONŠTRUKCIÍ BUDOV - Podbanské 2012

PORUCHY A OBNOVA OBALOVÝCH KONŠTRUKCIÍ BUDOV - Podbanské 2012 PORUCHY A OBNOVA OBALOVÝCH KONŠTRUKCIÍ BUDOV Podbanské 2012 CIEĽ A ZAMERANIE KONFERENCIE : Cieľom konferencie je poskytnúť priestor pre prezentovanie nových a aktuálnych výsledkov vedeckej a výskumnej

More information

THE ROLE OF NON-PROFIT ORGANIZATIONS IN A REGIONAL DEVELOPMENT IN A CONTEXT OF SOCIAL COHESION: THE CASE OF ICELAND

THE ROLE OF NON-PROFIT ORGANIZATIONS IN A REGIONAL DEVELOPMENT IN A CONTEXT OF SOCIAL COHESION: THE CASE OF ICELAND DOI: 10.5817/CZ.MUNI.P210-6840-2014-73 THE ROLE OF NON-PROFIT ORGANIZATIONS IN A REGIONAL DEVELOPMENT IN A CONTEXT OF SOCIAL COHESION: THE CASE OF ICELAND ROLA NEZISKOVÝCH ORGANIZÁCIÍ V ROZVOJI REGIÓNOV

More information

FORUM STATISTICUM SLOVACUM

FORUM STATISTICUM SLOVACUM 2/2010 FORUM STATISTICUM SLOVACUM I SSN 1336-7420 9 7 7 1 3 3 6 7 4 2 0 0 1 2 0 1 0 1 Slovenská štatistická a demografická spoločnosť Miletičova 3, 824 67 Bratislava www.ssds.sk Naše najbližšie akcie:

More information

VYSOKÉ UČENÍ TECHNICKÉ V BRNĚ BRNO UNIVERSITY OF TECHNOLOGY

VYSOKÉ UČENÍ TECHNICKÉ V BRNĚ BRNO UNIVERSITY OF TECHNOLOGY VYSOKÉ UČENÍ TECHNICKÉ V BRNĚ BRNO UNIVERSITY OF TECHNOLOGY FAKULTA STAVEBNÍ ÚSTAV BETONOVÝCH A ZDĚNÝCH KONSTRUKCÍ FACULTY OF CIVIL ENGINEERING INSTITUTE OF CONCRETE AND MASONRY STRUCTURES PRIESTOROVÝ

More information

Application of new information and communication technologies in marketing

Application of new information and communication technologies in marketing Application of new information and communication technologies in marketing Ladislav Izakovič, Department of Applied Informatics, Faculty of Natural Sciences, University of SS. Cyril and Methodius, J. Herdu

More information

Kozmické poasie a energetické astice v kozme

Kozmické poasie a energetické astice v kozme Kozmické poasie a energetické astice v kozme De otvorených dverí, Košice 26.11.2008 Ústav experimentálnej fyziky SAV Košice Oddelenie kozmickej fyziky Karel Kudela kkudela@kosice.upjs.sk o je kozmické

More information

Asertivita v práci s klientom banky

Asertivita v práci s klientom banky Bankovní institut vysoká škola Praha zahraničná vysoká škola Banská Bystrica Katedra ekonomie a financií Asertivita v práci s klientom banky Diplomová práca Autor: Viera Košteková Finance Vedúci práce:

More information

FORUM STATISTICUM SLOVACUM

FORUM STATISTICUM SLOVACUM 7/2013 FORUM STATISTICUM SLOVACUM ISSN 1336-7420 9 771336 742001 2 0 1 3 7 Slovenská štatistická a demografická spoločnosť Miletičova 3, 824 67 Bratislava www.ssds.sk Naše najbližšie akcie: (pozri tiež

More information

FORUM STATISTICUM SLOVACUM

FORUM STATISTICUM SLOVACUM 6/008 FORUM STATISTICUM SLOVACUM I S SN 1 3 3 6-7 4 0 8 6 9 7 7 1 3 3 6 7 4 0 0 1 Slovenská štatistická a demografická spoločnosť Miletičova 3, 84 67 Bratislava www.ssds.sk Naše najbližšie akcie: (pozri

More information

Tourism, Hospitality and Commerce

Tourism, Hospitality and Commerce Ročník III, číslo 2, 2012 Volume III, Number 2, 2012 Journal of Tourism, Hospitality and Commerce Vysoká škola obchodní a hotelová s.r.o. College of Business and Hotel Management Ltd. ISSN 1804-3836 Journal

More information

FORUM STATISTICUM SLOVACUM

FORUM STATISTICUM SLOVACUM 5/ FORUM STATISTICUM SLOVACUM I SSN 336-74 9 7 7 3 3 6 7 4 5 Slovenská štatistická a demografická spoločnosť Miletičova 3 84 67 Bratislava www.ssds.sk Naše najbližšie akcie: pozri tiež www.ssds.sk blok

More information

Technická efektívnosť a odmeny zdravotníckeho personálu v zdravotníctve

Technická efektívnosť a odmeny zdravotníckeho personálu v zdravotníctve Technická efektívnosť a odmeny zdravotníckeho personálu v zdravotníctve Ivana Novosádová Vysoká škola ekonomická v Praze Abstract: This paper is focus on the evaluation of technical efficiency of acute

More information

JEDNOFÁZOVÝ STATICKÝ ELEKTROMER NA VIACSADZBOVÉ MERANIE ČINNEJ ENERGIE

JEDNOFÁZOVÝ STATICKÝ ELEKTROMER NA VIACSADZBOVÉ MERANIE ČINNEJ ENERGIE JEDNOFÁZOVÝ STATICKÝ ELEKTROMER NA VIACSADZBOVÉ MERANIE ČINNEJ ENERGIE AMS B1x-xAx Applied Meters, a. s. Budovateľská 50, 080 01 Prešov Tel.: +421-51-758 11 69, Fax: +421-51-758 11 68 Web: www.appliedmeters.com,

More information

: Architectural Lighting : Interiérové svietidlá

: Architectural Lighting : Interiérové svietidlá SEC Lighting : Architectural Lighting : nteriérové svietidlá : Shape Harmony : Tradition The company SEC accepts with enthusiasm the challenges of continuously changing world. n our opinion, luminaries

More information

Informace o programu Horizon 2020

Informace o programu Horizon 2020 Informace o programu Horizon 2020 Pracovní snídaně Zabezpečení železniční dopravy s využitím GNSS GNSS Centre of Excellence, Navigační 787, 252 61 Jeneč, Česká republika; IČO: 01269313 kontakt: info@gnss-centre.cz;

More information

Môže sa to stať aj Vám - sofistikované cielené hrozby Ján Kvasnička

Môže sa to stať aj Vám - sofistikované cielené hrozby Ján Kvasnička Môže sa to stať aj Vám - sofistikované cielené hrozby Ján Kvasnička Territory Account Manager Definícia cielených hrozieb Široký pojem pre charakterizovanie hrozieb, cielených na špecifické entity Často

More information

Manažment v teórii a praxi on-line odborný časopis o nových trendoch v manažmente

Manažment v teórii a praxi on-line odborný časopis o nových trendoch v manažmente Manažment v teórii a praxi Odborné zameranie Zámerom časopisu je vytvoriť priestor pre autorov z vedecko-výskumných a vzdelávacích inštitúcií, ako aj pre autorov z podnikovej praxe, ktorí sa chcú podeliť

More information

Kľúčové porovnateľné ukazovatele Poľsko (PL) Slovensko (SK)

Kľúčové porovnateľné ukazovatele Poľsko (PL) Slovensko (SK) VYSOKÉ ŠKOLY V POĽSKU Alena ŠTURMOVÁ Kľúčové porovnateľné ukazovatele Poľsko (PL) Slovensko (SK) Počet obyvateľov (2014) 38,0 mil. 5,4 mil. Počet vysokoškolských (VŠ) študentov (2012) > 2 mil. 221 tis.

More information

FORUM STATISTICUM SLOVACUM

FORUM STATISTICUM SLOVACUM 7/8 FORUM STATISTICUM SLOVACUM I S SN 3 3 6-7 4 8 7 9 7 7 3 3 6 7 4 Slovenská štatistická a demografická spoločnosť Miletičova 3, 84 67 Bratislava www.ssds.sk Naše najbližšie akcie: (pozri tiež www.ssds.sk,

More information

Február 2013 Ročník 21 ODBORNÝ BANKOVÝ ČASOPIS NÁRODNÁ BANKA SLOVENSKA

Február 2013 Ročník 21 ODBORNÝ BANKOVÝ ČASOPIS NÁRODNÁ BANKA SLOVENSKA 2 Február 2013 Ročník 21 ODBORNÝ BANKOVÝ ČASOPIS NÁRODNÁ BANKA SLOVENSKA B I A T E C B I A T E C Strieborná zberateľská minca Pamiatková rezervácia Košice Už dvadsať rokov vydáva Národná banka Slovenska

More information

FORUM STATISTICUM SLOVACUM

FORUM STATISTICUM SLOVACUM 6/2007 FORUM STATISTICUM SLOVACUM I S SN 1 3 3 6-7 4 2 0 7 6 9 7 7 1 3 3 6 7 4 2 0 0 1 Slovenská štatistická a demografická spoločnosť Miletičova 3, 824 67 Bratislava www.ssds.sk Naše najbližšie akcie:

More information

Konkurence na železnici

Konkurence na železnici MASARYKOVA UNIVERZITA Ekonomicko-správní fakulta Konkurence na železnici budoucnost pro 21. století nebo destrukce sítě? Sborník příspěvků ze semináře Telč 2012 editoři: Martin Kvizda Zdeněk Tomeš Brno

More information

J&T FINANCE GROUP, a.s. a dcérske spoločnosti

J&T FINANCE GROUP, a.s. a dcérske spoločnosti J&T FINANCE GROUP, a.s. a dcérske spoločnosti Konsolidovaná účtovná závierka za rok, KONSOLIDOVANÝ VÝKAZ ZISKOV A STRÁT za rok, v tis. EUR Bod 2013 2012 Úrokové výnosy 7 295 075 163 724 Úrokové náklady

More information

Univerzita J. Selyeho Selye János Egyetem Ekonomická fakulta Gazdaságtudományi Kar

Univerzita J. Selyeho Selye János Egyetem Ekonomická fakulta Gazdaságtudományi Kar Univerzita J. Selyeho Selye János Egyetem Ekonomická fakulta Gazdaságtudományi Kar Gazdaságtudományi Kar Ekonomická Fakulta Inovačný potenciál, inovačné podnikanie a podnikateľské siete Monografický zborník

More information

Prehľad patentovej literatúry + Prehľad voľne dostupných zdrojov

Prehľad patentovej literatúry + Prehľad voľne dostupných zdrojov Prehľad patentovej literatúry + Prehľad voľne dostupných zdrojov Literatúra s tematikou duševného vlastníctva a priemyselného práva (zakúpené z prostriedkov projektu do knižničného fondu Akademickej knižnice

More information

MARKETING A OBCHOD 2006

MARKETING A OBCHOD 2006 EDUCA MaO a Katedra marketingu, obchodu a svetového lesníctva zborník z medzinárodnej vedeckej konferencie MARKETING A OBCHOD 2006 TRVALO UDRŽATEĽNÝ ROZVOJ PREDPOKLAD HOSPODÁRSKEHO RASTU MARKETING AND

More information

6/08. a KARTOGRAFICKÝ GEODETICKÝ. Český úřad zeměměřický a katastrální Úrad geodézie, kartografie a katastra Slovenskej republiky

6/08. a KARTOGRAFICKÝ GEODETICKÝ. Český úřad zeměměřický a katastrální Úrad geodézie, kartografie a katastra Slovenskej republiky GEODETICKÝ a KARTOGRAFICKÝ Český úřad zeměměřický a katastrální Úrad geodézie, kartografie a katastra Slovenskej republiky 6/08 Praha, červen 2008 Roč. 54 (96) Číslo 6 str. 101 120 Cena Kč 24, Sk 27, GEODETICKÝ

More information

IBM Security Framework: Identity & Access management, potreby a riešenia.

IBM Security Framework: Identity & Access management, potreby a riešenia. Juraj Polak IBM Security Framework: Identity & Access management, potreby a riešenia. Nová doba inteligentná infraštruktúra Globalizácia a globálne dostupné zdroje Miliardy mobilných zariadení s prístupom

More information

Economic efficiency of agricultural enterprises and its evaluation

Economic efficiency of agricultural enterprises and its evaluation Economic efficiency of agricultural enterprises and its evaluation Ekonomická efektivnost zemìdìlských podnikù a její hodnocení E. ROSOCHATECKÁ Czech University of Agriculture, Prague, Czech Republic Abstract:

More information

TVORBA KOMUNIKAČNEJ KAMPANE S VYUŢITÍM DIGITÁLNYCH MÉDIÍ

TVORBA KOMUNIKAČNEJ KAMPANE S VYUŢITÍM DIGITÁLNYCH MÉDIÍ Masarykova univerzita Ekonomicko-správní fakulta Študijný odbor: Podnikové hospodárstvo TVORBA KOMUNIKAČNEJ KAMPANE S VYUŢITÍM DIGITÁLNYCH MÉDIÍ Development of Communication Campaign (Utilisation of Digital

More information

Edičná séria: OŠETROVATEĽSTVO FYZIOTERAPIA LABORATÓRNA MEDICÍNA VEREJNÉ ZDRAVOTNÍCTVO. Trenčianska univerzita Alexandra Dubčeka v Trenčíne

Edičná séria: OŠETROVATEĽSTVO FYZIOTERAPIA LABORATÓRNA MEDICÍNA VEREJNÉ ZDRAVOTNÍCTVO. Trenčianska univerzita Alexandra Dubčeka v Trenčíne Edičná séria: OŠETROVATEĽSTVO FYZIOTERAPIA LABORATÓRNA MEDICÍNA VEREJNÉ ZDRAVOTNÍCTVO Trenčianska univerzita Alexandra Dubčeka v Trenčíne Fakulta zdravotníctva Zdravotnícke Listy Vedecký recenzovaný časopis,

More information

Ekonomické listy. Odborný vědecký časopis Vysoké školy ekonomie a managementu. 3 Financing of tertiary education: the Czech Republic and Europe

Ekonomické listy. Odborný vědecký časopis Vysoké školy ekonomie a managementu. 3 Financing of tertiary education: the Czech Republic and Europe Odborný vědecký časopis Vysoké školy ekonomie a managementu el Ekonomické listy 1 2014 3 Financing of tertiary education: the Czech Republic and Europe 16 Možnosti ovplyvňovania organizačnej kultúry rozmiestňovaním

More information

Centrálny register záverečných prác a antiplagiátorský systém ako komplexné riešenie na národnej úrovni

Centrálny register záverečných prác a antiplagiátorský systém ako komplexné riešenie na národnej úrovni Národná infraštruktúra pre podporu transferu technológií na Slovensku NITT SK Centrálny register záverečných prác a antiplagiátorský systém ako komplexné riešenie na národnej úrovni Seminář NUŠL, Praha,

More information

!T =!Mobile=== Nastavenia dátových a multimediálnych služieb pre multifunkčné zariadenia s operačným systémom Windows Mobile 5.0 NASTAVENIE MMS 1 /18

!T =!Mobile=== Nastavenia dátových a multimediálnych služieb pre multifunkčné zariadenia s operačným systémom Windows Mobile 5.0 NASTAVENIE MMS 1 /18 Nastavenia dátových a multimediálnych služieb pre multifunkčné zariadenia s operačným systémom Windows Mobile 5.0 Nastavenie je možné vykonať manuálnym resetom zariadenia, pričom všetky nastavenie sa vrátia

More information

PRODUCT LIFE CYCLE COST MANAGEMENT RIADENIE NÁKLADOV ŽIVOTNÉHO CYKLU VÝROBKU

PRODUCT LIFE CYCLE COST MANAGEMENT RIADENIE NÁKLADOV ŽIVOTNÉHO CYKLU VÝROBKU ACTA FACULTATIS TECHNICAE XVI ZVOLEN SLOVAKIA 2011 PRODUCT LIFE CYCLE COST MANAGEMENT RIADENIE NÁKLADOV ŽIVOTNÉHO CYKLU VÝROBKU František FREIBERG Erika SUJOVÁ ABSTRACT: The management of life cycle costing

More information

CENOVÁ NABÍDKA. jednatc~ Krmivo pro laboratorní zvířata" k veřejné soutěži. Krnov, 17.09.2014. Ing. Jiří Bauer. Předmět zakázky:

CENOVÁ NABÍDKA. jednatc~ Krmivo pro laboratorní zvířata k veřejné soutěži. Krnov, 17.09.2014. Ing. Jiří Bauer. Předmět zakázky: CENOVÁ NABÍDKA k veřejné soutěži Předmět zakázky: Krmivo pro laboratorní zvířata" Krnov, 17.09.2014 Ing. Jiří Bauer jednatc~ Obsah cenové nabídky:!.identifikace uchazeče výběrového řízení str.2 2.Cenová

More information

I SSN 1336-7420 9 7 7 1 3 3 6 7 4 2 0 0 1 2 0 1 2 7

I SSN 1336-7420 9 7 7 1 3 3 6 7 4 2 0 0 1 2 0 1 2 7 ISSN 1336-7420 9 771336 742001 2 0 1 2 7 Slovenská štatistická a demografická spoločnosť Miletičova 3, 824 67 Bratislava www.ssds.sk Naše najbližšie akcie: (tiež na www.ssds.sk, blok Organizované akcie)

More information

VZDELÁVANIE ZDRAVOTNÍCKYCH PRACOVNÍKOV V OBLASTI PALIATÍVNEJ STAROSTLIVOSTI Education of healthcare professionals in the field of palliative care

VZDELÁVANIE ZDRAVOTNÍCKYCH PRACOVNÍKOV V OBLASTI PALIATÍVNEJ STAROSTLIVOSTI Education of healthcare professionals in the field of palliative care OŠETŘOVATELSTVÍ VZDELÁVANIE ZDRAVOTNÍCKYCH PRACOVNÍKOV V OBLASTI PALIATÍVNEJ STAROSTLIVOSTI Education of healthcare professionals in the field of palliative care Jana Slováková 10: 247 482, 2008 ISSN 1212-4117

More information

Rychlý průvodce instalací Rýchly sprievodca inštaláciou

Rychlý průvodce instalací Rýchly sprievodca inštaláciou CZ SK Rychlý průvodce instalací Rýchly sprievodca inštaláciou Intuos5 Poznámka: chraňte svůj tablet. Vyměňujte včas hroty pera. Bližší informace najdete v Uživatelském manuálu. Poznámka: chráňte svoj

More information

SEARCH ENGINE MARKETING (SEM) - CURRENT STATUS

SEARCH ENGINE MARKETING (SEM) - CURRENT STATUS SEARCH ENGINE MARKETING (SEM) - CURRENT STATUS Robert Štefko - Radovan Bačík - Richard Fedorko Faculty of management - Department of Marketing and International Trade -University of Presov in Presov; Konštantínova

More information

Návod k použití: Boxovací stojan DUVLAN s pytlem a hruškou kód: DVLB1003

Návod k použití: Boxovací stojan DUVLAN s pytlem a hruškou kód: DVLB1003 Návod na použitie: Boxovací stojan DUVLAN s vrecom a hruškou kód: DVLB1003 Návod k použití: Boxovací stojan DUVLAN s pytlem a hruškou kód: DVLB1003 User manual: DUVLAN with a boxing bag and a speed bag

More information

Polymérne konštrukčné materiály

Polymérne konštrukčné materiály Polymérne konštrukčné materiály Odborná publikácia Tatiana Liptáková, Pavol Alexy, Ernest Gondár, Viera Khunová Recenzenti: prof. Ing. Ivan Hudec, PhD. prof. Ing. Ivan Chodák, DrSc. Vedecký redaktor: prof.

More information

LV5WDR Wireless Display Receiver Rýchla príručka

LV5WDR Wireless Display Receiver Rýchla príručka LV5WDR Wireless Display Receiver Rýchla príručka 1 1. Predstavenie Wireless display receiver S Wireless display receiver (ďalej len WDR) môžete jednoducho zobrazovať multimediálny obsah (videá, fotografie,

More information

NÁRODNÁ BANKA SLOVENSKA ODHAD MOŽNÝCH VPLYVOV ZAVEDENIA EURA NA PODNIKATEĽSKÝ SEKTOR V SR

NÁRODNÁ BANKA SLOVENSKA ODHAD MOŽNÝCH VPLYVOV ZAVEDENIA EURA NA PODNIKATEĽSKÝ SEKTOR V SR NÁRODNÁ BANKA SLOVENSKA ODHAD MOŽNÝCH VPLYVOV ZAVEDENIA EURA NA PODNIKATEĽSKÝ SEKTOR V SR Odbor výskumu NBS Jún 2006 Národná banka Slovenska, 2006 Prezentované názory a výsledky v tejto štúdii sú názormi

More information

Viega Visign Cenník 2014

Viega Visign Cenník 2014 Viega Visign Cenník 2014 Ceny sú uvedené vrátane DPH Viega Eco Plus: Podomietková splachovacia nádržka na zabudovanie do odľahčených stien. Akčný balík Viega Eco Plus: prvok Viega Eco Plus + biela ovládacia

More information

ROČNÍK 43 ČÍSLO 4. psychológia a patopsychológia

ROČNÍK 43 ČÍSLO 4. psychológia a patopsychológia ROČNÍK 43 ČÍSLO 4 psychológia a patopsychológia VÝSKUMNÝ ÚSTAV DETSKEJ PSYCHOLÓGIE A PATOPSYCHOLÓGIE BRATISLAVA 2008 Redakčná rada: F. Baumgartner, Spoločenskovedný ústav SAV, Košice J. Dan, Pedagogická

More information

GEOGRAFICKÉ INFORMÁCIE 13

GEOGRAFICKÉ INFORMÁCIE 13 UNIVERZITA KONŠTANTÍNA FILOZOFA V NITRE FAKULTA PRÍRODNÝCH VIED KATEDRA GEOGRAFIE A REGIONÁLNEHO ROZVOJA GEOGRAFICKÉ INFORMÁCIE 13 TRENDY REGIONÁLNEHO ROZVOJA V EURÓPSKEJ ÚNII NITRA 2009 GEOGRAFICKÉ INFORMÁCIE

More information

Manažerské transakce

Manažerské transakce Manažerské transakce Josef Kotásek 1 Čl. 6 odst. 4 MAD Persons discharging managerial responsibilities within an issuer of financial instruments and, where applicable, persons closely associated with them,

More information

Postup pre zistenie adries MAC a vytvorenie pripojenia. v OS Windows

Postup pre zistenie adries MAC a vytvorenie pripojenia. v OS Windows 1 Postup pre zistenie adries MAC a vytvorenie pripojenia v OS Windows Obsah: a) Zistenie hardwarovych adries MAC Windows 10 str. 2 Windows 8.1 str. 4 Windows 7 str. 6 Windows Vista str. 8 Windows XP str.

More information

FORUM STATISTICUM SLOVACUM

FORUM STATISTICUM SLOVACUM 5/006 FORUM STATISTICUM SLOVACUM I SSN 1336-740 6 5 9 771336 74001 Slovenská štatistická a demografická spoločnosť Miletičova 3, 84 67 Bratislava www.ssds.sk Naše najbližšie akcie: (pozri tiež www.ssds.sk,

More information

Silver economy as possible export direction at ageing Europe case of Slovakia

Silver economy as possible export direction at ageing Europe case of Slovakia Silver economy as possible export direction at ageing Europe case of Slovakia Marek Radvanský, Viliam Páleník* 1 Abstract: Aging of European citizens is a real threat for public finances of member countries,

More information

PSPP ako nová alternatíva spracovania dát

PSPP ako nová alternatíva spracovania dát 1 Sociálne a politické analýzy 2012, 6, 1, s. 1-16 http://sapa.ff.upjs.sk ISSN 1337 5555 PSPP ako nová alternatíva spracovania dát Alojz Ritomský 1 Univerzita Komenského v Bratislave Fakulta sociálnych

More information

Ekonomické spektrum. Economic Spectrum. National economy. Banking. Insurance. Finances. Business Economics. Marketing. Management.

Ekonomické spektrum. Economic Spectrum. National economy. Banking. Insurance. Finances. Business Economics. Marketing. Management. National economy Banking Ekonomické spektrum Economic Spectrum Insurance Finances Business Economics Marketing Management Scientific on-line journal about Economy and Economics Vedecký on-line časopis

More information

My Passport Ultra Metal Edition

My Passport Ultra Metal Edition My Passport Ultra Metal Edition Prvotriedne úložisko Príručka používateľa Externý pevný disk Príručka používateľa My Passport Ultra Metal Edition Servis a technická podpora spoločnosti WD Ak narazíte na

More information

SPRÁVA FLOOD MODELING AND LOGISTIC MODEL DEVELOPMENT FOR II/II. ČIASTKOVÁ ÚLOHA FLOOD CRISIS MANAGEMENT" - FLOODLOG

SPRÁVA FLOOD MODELING AND LOGISTIC MODEL DEVELOPMENT FOR II/II. ČIASTKOVÁ ÚLOHA FLOOD CRISIS MANAGEMENT - FLOODLOG VSBM, Vysoká škola bezpečnostného manažérstva v Košiciach SPRÁVA FLOOD MODELING AND LOGISTIC MODEL DEVELOPMENT FOR FLOOD CRISIS MANAGEMENT" - FLOODLOG II/II. ČIASTKOVÁ ÚLOHA BAY ZOLTÁN ALKALMAZOTT KUTATÁSI

More information

WLA-5000AP. Quick Setup Guide. English. Slovensky. Česky. 802.11a/b/g Multi-function Wireless Access Point

WLA-5000AP. Quick Setup Guide. English. Slovensky. Česky. 802.11a/b/g Multi-function Wireless Access Point 802.11a/b/g Multi-function Wireless Access Point Quick Setup Guide 1 5 Česky 9 Important Information The AP+WDS mode s default IP address is 192.168.1.1 The Client mode s default IP is 192.168.1.2 The

More information

Spoznávame potenciál digitálnych technológií v predprimárnom vzdelávaní

Spoznávame potenciál digitálnych technológií v predprimárnom vzdelávaní Spoznávame potenciál digitálnych technológií v predprimárnom vzdelávaní Ivan Kalaš Spoznávame potenciál digitálnych technológií v predprimárnom vzdelávaní Analytická štúdia Inštitút UNESCO pre informačné

More information

BURZA CENNÝCH PAPIEROV PRAHA. Prague Stock Exchange

BURZA CENNÝCH PAPIEROV PRAHA. Prague Stock Exchange MASARYKOVA UNIVERZITA Ekonomicko správní fakulta Studijní obor: Finanční podnikání BURZA CENNÝCH PAPIEROV PRAHA Prague Stock Exchange Seminární práce Matej Michlík Brno, říjen 2007 Obsah Obsah... 1 Úvod...

More information

E-LOGOS. usudzovanie z časti na celok. Miroslav Titze ELECTRONIC JOURNAL FOR PHILOSOPHY ISSN 1211-0442 14/2013. University of Economics Prague

E-LOGOS. usudzovanie z časti na celok. Miroslav Titze ELECTRONIC JOURNAL FOR PHILOSOPHY ISSN 1211-0442 14/2013. University of Economics Prague E-LOGOS ELECTRONIC JOURNAL FOR PHILOSOPHY ISSN 1211-0442 14/2013 University of Economics Prague e Makroekonómia a mylné usudzovanie z časti na celok Miroslav Titze Abstract Main goal of the paper is discuss

More information

Nové trendy v marketingovej komunikácii

Nové trendy v marketingovej komunikácii Fakulta masmediálnej komunikácie Univerzita sv. Cyrila a Metoda v Trnave Nové trendy v marketingovej komunikácii doc. Ing. Jozef Matúš, CSc. a PhDr. Dana Petranová, PhD. Zborník z medzinárodnej vedeckej

More information

How To Understand The Economic Development Of The Czech Republic

How To Understand The Economic Development Of The Czech Republic The role of employment in the development of Czech rural areas Úloha zaměstnanosti v rozvoji českého venkovského prostoru G. PAVLÍKOVÁ, P. MAŘÍKOVÁ Czech University of Agriculture, Prague, Czech Republic

More information

Licenčná zmluva k softwaru IBM SPSS Statistics pre Windows

Licenčná zmluva k softwaru IBM SPSS Statistics pre Windows Licenčná zmluva k softwaru IBM SPSS Statistics pre Windows Uzatvorená medzi: ACREA SR, spol. s r.o. Zapísaná: OR Okresného súdu Bratislava I., oddiel: Sro, vložka číslo: 77703/B so sídlom: Andrusovova

More information

Economics and Management

Economics and Management UNIVERSITY OF DEFENCE / CZECH REPUBLIC UNIVERZITA OBRANY / ČESKÁ REPUBLIKA Economics and Management EKONOMIKA A MANAGEMENT 2010 1 UNIVERSITY OF DEFENCE / CZECH REPUBLIC UNIVERZITA OBRANY / ČESKÁ REPUBLIKA

More information

SECONDARY MARKET FOR LOAN RECEIVABLES IN THE TRANSFORMING ECONOMIES OF SLOVAKIA AND THE CZECH REPUBLIC

SECONDARY MARKET FOR LOAN RECEIVABLES IN THE TRANSFORMING ECONOMIES OF SLOVAKIA AND THE CZECH REPUBLIC CURRENT TOPIC 13 SECONDARY MARKET FOR LOAN RECEIVABLES IN THE TRANSFORMING ECONOMIES OF SLOVAKIA AND THE CZECH REPUBLIC doc. Ing. Mária Klimiková, PhD., Ing. Dana Forišková, PhD., Ing. Martin Vovk, Ing.

More information

ŠPECIÁLNY PEDAGÓG. Časopis pre špeciálnopedagogickú teóriu a prax. 2 2013 Ročník 2 ISSN 1338-6670

ŠPECIÁLNY PEDAGÓG. Časopis pre špeciálnopedagogickú teóriu a prax. 2 2013 Ročník 2 ISSN 1338-6670 ŠPECIÁLNY PEDAGÓG Časopis pre špeciálnopedagogickú teóriu a prax ISSN 1338-6670 2 2013 Ročník 2 ŠPECIÁLNY PEDAGÓG Časopis pre špeciálnopedagogickú teóriu a prax 2. ročník, 2013, č. 2 Redakčná rada: doc.

More information

EDÍCIA SLOVENSKEJ LEKÁRSKEJ KNIŽNICE. InfoMedLib. Bulletin Slovenskej lekárskej knižnice. Ročník 11

EDÍCIA SLOVENSKEJ LEKÁRSKEJ KNIŽNICE. InfoMedLib. Bulletin Slovenskej lekárskej knižnice. Ročník 11 EDÍCIA SLOVENSKEJ LEKÁRSKEJ KNIŽNICE InfoMedLib Bulletin Slovenskej lekárskej knižnice 2 2010 Ročník 11 OBSAH Na prahu šesťdesiatky... 4 INFORMÁCIE ZO SLOVENSKEJ LEKÁRSKEJ KNIŢNICE Marta Weissová Štatistické

More information

Trestná politika štátu a zodpovednosť právnických osôb. Penal Policy of the State and Liability of Legal Entities

Trestná politika štátu a zodpovednosť právnických osôb. Penal Policy of the State and Liability of Legal Entities Trestná politika štátu a zodpovednosť právnických osôb Penal Policy of the State and Liability of Legal Entities Sekcia trestného práva Session of Criminal Law Garanti sekcie/ Scholastic Referees: doc.

More information

Ekonomická univerzita v Bratislave REVUE SOCIÁLNO-EKONOMICKÉHO ROZVOJA

Ekonomická univerzita v Bratislave REVUE SOCIÁLNO-EKONOMICKÉHO ROZVOJA Ekonomická univerzita v Bratislave Národohospodárska fakulta Katedra sociálneho rozvoja a práce REVUE SOCIÁLNO-EKONOMICKÉHO ROZVOJA Vedecký recenzovaný on-line časopis Ročník I číslo 2/2015 ISSN 2453 6148

More information

Prestige 660HN-T3A Príručka k rýchlej inštalácii splittra a smerovača (routra)

Prestige 660HN-T3A Príručka k rýchlej inštalácii splittra a smerovača (routra) Prestige 660HN-T3A Príručka k rýchlej inštalácii splittra a smerovača (routra) Volajte na našu zákaznícku linku: 02/208 28 208 Prestige 660HN-T3A Príručka k rýchlej inštalácii splittra a smerovača (routra)

More information

Združenie Pre reformu zdravotníctva Páričkova 18 SK - 811 02 Bratislava. www.reformazdravotnictva.sk

Združenie Pre reformu zdravotníctva Páričkova 18 SK - 811 02 Bratislava. www.reformazdravotnictva.sk Združenie Pre reformu zdravotníctva Páričkova 18 SK - 811 02 Bratislava www.reformazdravotnictva.sk Corporate Design: M.E.S.A. 10 Consulting Group Obálka & Print: Publicis Knut Copyrights Pre reformu zdravotníctva

More information

hodnotu v medzilaboratórnych porovnávacích experimentoch

hodnotu v medzilaboratórnych porovnávacích experimentoch Metódy výpočtu konfidenčných intervalov pre referenčnú hodnotu v medzilaboratórnych porovnávacích experimentoch Ústav merania Slovenská akadémia vied Dúbravská cesta 9 84104 Bratislava REQUEST 2006 30.1.-1.2.,

More information

Foreign trade of the Slovak Republic with selected agrarian commodities of animal origin

Foreign trade of the Slovak Republic with selected agrarian commodities of animal origin 5 (54) 2011 Dušan Šimo Foreign trade of the Slovak Republic with selected agrarian commodities of animal origin Paper points at research of import and export of beef, pork, poultry, cow's milk, cheese

More information

Cost-benefit analýza skládky odpadov

Cost-benefit analýza skládky odpadov Masarykova univerzita Ekonomicko-správní fakulta Studijní obor: Veřejná ekonomika a správa Cost-benefit analýza skládky odpadov Cost-benefit analysis of the landfill Bakalárska práca Vedúci bakalárskej

More information

KONTAKT CHEMIE Kontakt PCC

KONTAKT CHEMIE Kontakt PCC Cleaner and flux remover for printed circuit boards KONTAKT CHEMIE Kontakt PCC Technical Data Sheet KONTAKT CHEMIE Kontakt PCC Page 1/2 Description: Mixture of organic solvents. General properties and

More information

Štefan Šutaj NÚTENÉ PRESÍDĽOVANIE MAĎAROV DO ČIECH

Štefan Šutaj NÚTENÉ PRESÍDĽOVANIE MAĎAROV DO ČIECH Štefan Šutaj NÚTENÉ PRESÍDĽOVANIE MAĎAROV DO ČIECH UNIVERSUM PREŠOV 2005 NÚTENÉ PRESÍDĽOVANIE MAĎAROV DO ČIECH (Výskumná správa pripravená v rámci riešenia projektu štátneho programu výskumu a vývoja Národ,

More information

Európska komisia stanovuje ambiciózny akčný program na podporu vnútrozemskej vodnej dopravy

Európska komisia stanovuje ambiciózny akčný program na podporu vnútrozemskej vodnej dopravy IP/06/48 Brusel 17. januára 2006 Európska komisia stanovuje ambiciózny akčný program na podporu vnútrozemskej vodnej dopravy Komisia dnes navrhla viacročný akčný program s cieľom podporiť rozvoj prepravy

More information

EDUCATION IN MASTER STUDY PROGRAM NURSING IN SLOVAKIA

EDUCATION IN MASTER STUDY PROGRAM NURSING IN SLOVAKIA EDUCATION IN MASTER STUDY PROGRAM NURSING IN SLOVAKIA Iveta Matišáková 1, Katarína Gerlichová 1, Daniela Knápková 2 1 Faculty of Healthcare, Alexander Dubček University of Trenčín, Študentská 2, 911 01

More information

PERSONNEL OUTSOURCING PROCESSES

PERSONNEL OUTSOURCING PROCESSES PERSONNEL OUTSOURCING PROCESSES Marek Potkány EKONOMIKA A MANAGEMENT 1. Introduction The success of every company depends on fast and precise market orientation and the ability to react to future changes

More information

Aktuální otázky přípravy budoucích učitelů VÝZNAM TEORIE, EMPIRIE A PEDAGOGICKÉ přírodovědných, PŘÍBUZNÝCH OBORŮ

Aktuální otázky přípravy budoucích učitelů VÝZNAM TEORIE, EMPIRIE A PEDAGOGICKÉ přírodovědných, PŘÍBUZNÝCH OBORŮ VI. Mezinárodní konference k problematice přípravy učitelů pro přírodovědné a zemědělské předměty na téma: Aktuální otázky přípravy budoucích učitelů VÝZNAM TEORIE, EMPIRIE A PEDAGOGICKÉ PRAXE přírodovědných,

More information

Vybrané aspekty financovania vysokého školstva na Slovensku

Vybrané aspekty financovania vysokého školstva na Slovensku Vybrané aspekty financovania vysokého školstva na Slovensku Jana JURKOVÁ Úvod V súčasnom období sa realizujú v Európe rozsiahle reformy systémov vysokoškolského vzdelávania, súčasťou ktorých je plnenie

More information

Ingerencia súdov do súkromnoprávnych zmlúv: Zásahy súdov do obsahu súkromnoprávnych zmlúv

Ingerencia súdov do súkromnoprávnych zmlúv: Zásahy súdov do obsahu súkromnoprávnych zmlúv Justičná akadémia Slovenskej republiky Ingerencia súdov do súkromnoprávnych zmlúv: Zásahy súdov do obsahu súkromnoprávnych zmlúv Kol. autorov Pezinok 2014 Ingerencia súdov do súkromnoprávnych zmlúv: Zásahy

More information

APPLICATION OF ANALYTIC HIERARCHY PROCESS METHOD IN THE EVALUATION OF MANAGERS OF INDUSTRIAL ENTERPRISES IN SLOVAKIA

APPLICATION OF ANALYTIC HIERARCHY PROCESS METHOD IN THE EVALUATION OF MANAGERS OF INDUSTRIAL ENTERPRISES IN SLOVAKIA Trendy v podnikání, 5(3) 28-35 The Author(s) 2015 ISSN 1805-0603 Publisher: UWB in Pilsen http://www.fek.zcu.cz/tvp/ APPLICATION OF ANALYTIC HIERARCHY PROCESS METHOD IN THE EVALUATION OF MANAGERS OF INDUSTRIAL

More information

MEDZINÁRODNÝ SEMINÁR MLADÝCH VEDECKÝCH PRACOVNÍKOV

MEDZINÁRODNÝ SEMINÁR MLADÝCH VEDECKÝCH PRACOVNÍKOV Kaedra operačného výskumu a ekonomerie Fakuly hospodárskej informaiky EU v Braislave a Kaedra ekonomerie Fakuly informaiky a saisiky VŠE v Prahe MEDZINÁRODNÝ SEMINÁR MLADÝCH VEDECKÝCH PRACOVNÍKOV Kaedry

More information

Sborník vědeckých prací Vysoké školy báňské - Technické univerzity Ostrava číslo 2, rok 2006, ročník LII, řada strojní článek č.

Sborník vědeckých prací Vysoké školy báňské - Technické univerzity Ostrava číslo 2, rok 2006, ročník LII, řada strojní článek č. Sborník vědeckých prací Vysoké školy báňské - Technické univerzity Ostrava číslo 2, rok 2006, ročník LII, řada strojní článek č. 1530 Radim FARANA *, Jaromír ŠKUTA **, Lačezar LIČEV ***, Josef SCHREIBER

More information

Management of agricultural production in the conditions of information society

Management of agricultural production in the conditions of information society Management of agricultural production in the conditions of information society Riadenie poľnohospodárskej výroby v podmienkach informačnej spoločnosti A. LÁTEČKOVÁ, M. KUČERA Slovak University of Agriculture,

More information

FORUM STATISTICUM SLOVACUM

FORUM STATISTICUM SLOVACUM FORUM STATISTICUM SLOVACUM I SSN 1336-7420 6/2015 9 7 7 1 3 3 6 7 4 2 0 0 1 2 0 1 5 6 Slovenská štatistická a demografická spoločnosť Miletičova 3, 824 67 Bratislava www.ssds.sk Plán akcií na rok 2016:

More information

OUTSOURCINGOVÉ MODELY A PREVÁDZKA INFORMAČNÉHO SYSTÉMU

OUTSOURCINGOVÉ MODELY A PREVÁDZKA INFORMAČNÉHO SYSTÉMU OUTSOURCINGOVÉ MODELY A PREVÁDZKA INFORMAČNÉHO SYSTÉMU Bohuslav Martiško Fakulta financií, Univerzita Mateja Bela, Cesta na amfiteáter 1, 974 01 Banská Bystrica, SR bohuslav.martisko@umb.sk Abstrakt Článok

More information

Zmluvný systém a rekodifikácia Občianskeho zákonníka. Contractual system and Recodification of the Civil Code. Dokazovanie v civilnom procese

Zmluvný systém a rekodifikácia Občianskeho zákonníka. Contractual system and Recodification of the Civil Code. Dokazovanie v civilnom procese Zmluvný systém a rekodifikácia Občianskeho zákonníka Contractual system and Recodification of the Civil Code Dokazovanie v civilnom procese Discovery in Civil Proceedings Sekcia občianskeho práva Civil

More information

Doprava a spoje elektronický časopis Fakulty prevádzky a ekonomiky dopravy a spojov Žilinskej univerzity v Žiline, ISSN 1336-7676

Doprava a spoje elektronický časopis Fakulty prevádzky a ekonomiky dopravy a spojov Žilinskej univerzity v Žiline, ISSN 1336-7676 SCHEDULING OF WORKING TIME OF DRIVERS IN REGULAR BUS TRANSPORT Miloš Poliak 1, Linda Forrest 2 and Štefánia Semanová 3 Introduction In terms of regular bus transport in the Slovak Republic (SR), the work

More information

Výkonnosť podniku VÝSLEDOK HOSPODÁRENIA AKO UKAZOVATEĽ MERANIA A HODNOTENIA VÝKONNOSTI PODNIKU PODĽA SLOVENSKEJ PRÁVNEJ ÚPRAVY

Výkonnosť podniku VÝSLEDOK HOSPODÁRENIA AKO UKAZOVATEĽ MERANIA A HODNOTENIA VÝKONNOSTI PODNIKU PODĽA SLOVENSKEJ PRÁVNEJ ÚPRAVY Vedecký časopis Výskumného ústavu ekonomiky a manažmentu Výkonnosť podniku Ročník I Číslo 3/2011 ISSN 1338-435X Výkonnosť podniku VÝSLEDOK HOSPODÁRENIA AKO UKAZOVATEĽ MERANIA A HODNOTENIA VÝKONNOSTI PODNIKU

More information

CÏESKEÂ A SLOVENSKEÂ FEDERATIVNIÂ REPUBLIKY

CÏESKE A SLOVENSKE FEDERATIVNI REPUBLIKY RocÏnõÂk 199 2 SbõÂrka zaâkonuê CÏESKE A SLOVENSKE FEDERATIVNI REPUBLIKY CÏ ESKE REPUBLIKY / SLOVENSKE REPUBLIKY CÏ aâstka 64 RozeslaÂna dne 26. cïervna 1992 Cena 11,± OBSAH: 317. Za kon Slovenskej

More information

Politológia a politická analýza. Syllabus kurzu

Politológia a politická analýza. Syllabus kurzu Politológia a politická analýza Syllabus kurzu Prednáška: streda 11.30 13.00 streda 9.45 11.15 Lucia Klapáčová 13.30 15.00 - Andrea Figulová 15.15 16.45 - Teodor Gyelnik (ENG) Prednášajúci Andrea Figulová

More information

How To Write A Program On The National Bank Of Slovakia

How To Write A Program On The National Bank Of Slovakia NÁRODNÁ BANKA SLOVENSKA NATIONAL BANK OF SLOVAKIA vo funkcii od 1. decembra 2000 Ing. EUGEN JURZYCA Narodil sa 8. februára 1958 v Bratislave. V roku 1981 ukončil štúdium na Vysokej škole ekonomickej v

More information