FORUM STATISTICUM SLOVACUM
|
|
|
- Bertina Rodgers
- 9 years ago
- Views:
Transcription
1 6/008 FORUM STATISTICUM SLOVACUM I S SN
2 Slovenská štatistická a demografická spoločnosť Miletičova 3, Bratislava Naše najbližšie akcie: (pozri tiež blok Poriadané akcie) 17. Medzinárodný seminár VÝPOČTOVÁ ŠTATISTIKA , Bratislava, Infostat Prehliadka prác mladých štatistikov a demografov , Bratislava, Infostat Pohľady na ekonomiku Slovenska apríl 009, Bratislava EKOMSTAT 009, 3. škola štatistiky tematické zameranie: Štatistické metódy vo vedecko-výskumnej, odbornej a hospodárskej praxi , Trenčianske Teplice 1. SLOVENSKÁ DEMOGRAFICKÁ KONFERENCIA tematické zameranie: Demografická budúcnosť Slovenska , Belušské Slatiny, Trenčiansky kraj Aplikácie metód na podporu rozhodovania vo vedeckej, technickej a spoločenskej praxi jún 009, STU Bratislava Regiónálne akcie priebežne
3 ÚVOD Vážené kolegyne, vážení kolegovia, šieste íslo piateho roníka vedeckého asopisu Slovenskej štatistickej a demografickej spolonosti je zostavené z príspevkov, ktoré sú obsahovo orientované v súlade s tematikou V. roníka Medzinárodnej konferencie aplikovanej štatistiky FernStat 008. Táto konferencia sa uskutoila v doch. a 3. októbra 008 v hoteli Lesák v Tajove. Tradiné tematické okruhy konferencie sú: Aplikovaná štatistika, Demografická štatistika, Matematická štatistika, Štatistické riadenie kvality. Akciu z poverenia Výboru SŠDS, zorganizoval Organizaný a programový výbor: Ing. Vladimír Úradníek PhD. predseda, Ing. Mária Kanderová, PhD. tajomník, RNDr. Ján Luha, CSc., doc. Ing. Jozef Chajdiak, CSc., doc. RNDr. Bohdan Linda, CSc., doc. Dr. Jana Kubanová, PhD., RNDr. Peter Mach, Ing. Iveta Stankoviová PhD. Na príprave a zostavení tohto ísla FORUM STATISTICUM SLOVACUM participovali: Ing. Vladimír Úradníek PhD, Ing. Mária Kanderová PhD., doc. Ing. Jozef Chajdiak, CSc., RNDr. Ján Luha, CSc., Miroslav Kello, Juraj Varga. Recenziu príspevkov zabezpeili: Ing. Vladimír Úradníek PhD, Ing. Mária Kanderová PhD., doc. Ing. Jozef Chajdiak, CSc., RNDr. Ján Luha, CSc., doc. RNDr. Bohdan Linda, CSc. Výbor SŠDS
4 - - Approaches to volatility estimation based on historical data * Martin Boa Abstract: Volatility as a quantifiable characteristic is an input to many applications in the area of financial risk management. Even so, it possesses features of abstraction of some degree as for its unequivocal definition. It is because of the unstable mechanics of financial markets and vagueness of its perception in some sense that several ways to estimate volatility have been devised, and the most commonly preferred ones are summarized by the article. Key words: historical volatility, geometric Brownian motion, close-to-close volatility, Parkinson s high-low estimator of volatility, Garman-Klass estimator of volatility, Rogers- Satchell estimator of volatility, Yang-Zhang estimator of volatility.. 1. Introduction Speaking of risk management, it must be understood that its chief focus is measuring risk and that its attempt to translate risk into a quantifiable characteristic, a number, is utilized throughout virtually entire contemporary financial management. Theory and practice have come to the mutual agreement that risk is a pervading and unavoidable trait of any entrepreneurial activity (to say nothing of any human activity), and that it must be measured. This statement especially holds for the field of financial markets where consequences of risk are possibly felt severer than elsewhere. Financial reality forces traders to take care in building their positions and menaces with the repetition of the well documented events of Black Monday and Black Tuesday of 199 or Black Monday of Measuring risk has become a necessity for the engagement in trading at financial markets. Whereas, not even a century ago, theoretical literature occupied itself with debates on what risk is and sought to define the distinctive terms risk and uncertainty correctly; nowadays, these efforts per se are abandoned and in most literature the terms risk and uncertainty are interpreted loosely. At financial markets the term risk is construed operationally as synonymous with the term volatility, and this is where the interest of this paper lies. Volatility, as a measure of market risk, must be estimated and several ways to its estimation are employable it is the intention of this paper is to summarize some of commonly employed approaches and to demonstrate its practical use.. Theoretical and practical perspective on volatility It is frequently assumed that the process generating returns of an asset follows a geometric Brownian motion. This implies albeit several writings are possible that the price of an asset S t at any time t (0, ) shall be governed by the formula d St t St dt t St dw t, (1) where W t is a Wiener process, t denotes the drift of the process and t represents a noise factor of the process. The task is to estimate correctly the noise factor of the process. Taking t and t to be constant, i. e. and respectively, and defining W t as a onedimensional Gaussian process (in consistency with literature, see Baxter, Rennie, 1999), one obtains instantly that (A.) for any t (0, ) the random variable d S t / S t is independent of all prices until t, and * The paper was prepared under the framework of VEGA project No. 1/4634/07 Variant methods of prediction of small and medium sized enterprises development after introducing single European currency in the Slovak Republic.
5 - 3 - (B.) for any t (0, ) the random variable d S t / S t is normally distributed with mean dt and dispersion dt. It is vital to notice that the relativized increments of the price of an asset having may be treated as the returns of the asset; and that having complied with implication (A.), formula (1) introduces the normal distribution for the asset returns. The assumption of formula (1) is then utilized in constructing estimators for the noise factor, i. e. volatility of the process. In this quest, observations of historical prices are often utilized and this approach leads to estimates of historical volatility. Theoretically, the process determined by formula (1) is assumed to run continually and continuously at (0, ). Never the less, empirically, asset prices are observable only during the periods they are traded. Therefore, there are some time pauses in the series of asset price observations, and the series of observations of one trading day does not link to the series of observations of the day before without intermittence. Furthermore, these observations are discrete, not continuous; all though they are usually so dense that they can be approximated as continuous. These statements are illustrated in scheme 1 by a series of Google Inc. share prices over 5 trading days (from 08/09/008 until 1/09/008). High frequency of transactions with the shares of Google Inc. conduces to creating of an impression of a continuous process, however, the differences between closing prices and opening prices between to subsequent trading days are remarkable. It is needless to say that trading days are scarcer than civil days and that between two available observations need not necessarily be the same time gap of, say, 16 hours as it is between two subsequent civil days which are trading days. Scheme 1 Observations of the Google Inc. share prices from 08/09/008 to 1/09/008 with time interruptions (Source: Another aspect to make allowance for is the availability of information. All though it is possible, at certain costs, to equip oneself with all price observations during the given period, for day-to-day estimation of volatility of a large portfolio of assets it may amount dear to found the estimation procedure upon all price observations. Rather, as some information is made public free of charge once the trading day has been closed, it may be useful and reasonable to base the estimation procedure upon this information providing that it substitutes all price observations satisfactorily. This information includes opening prices (open), maximum prices (high), minimum prices (low), and closing prices (close) of every trading day as it is reported in table 1 for the prices of the Google Inc. shares from 08/09/008 up to 1/09/008 (all denominated in USD). The table moreover contains the volume of transactions (in USD) and the adjusted closing price (in USD) which accounts for dividends and splits.
6 - 4 - Table 1 The published free information on the Google Inc. share prices from 08/09/008 to 1/09/008 (Source: Date Open High Low Close Volume Adjusted Close 1/09/ /09/ /09/ /09/ /09/ In accordance with the aforementioned remarks it must be borne in mind that the process generating asset prices is considered a geometric Brownian motion which is continuous regardless of the fact that some of its development is regularly unobservable. During the observable periods, the information on the process comprises the opening price, the highest price, the lowest price and the closing price at which the asset was traded at a given trading period. The alternation of trading periods and non-trading periods with the process running in their background is illustrated in scheme. In the following sections are set forth the approaches towards volatility estimation based upon the information on opens, highs, lows and closes. TRADING CLOSED TRADING OPEN TRADING CLOSED TRADING OPEN Yesterday s high Yesterday s close Today s high Today s close Yesterday s open Today s open The day before yesterday s close Yesterday s low YESTERDAY Today s low TODAY Scheme The process generating asset prices in the flow of time (Adjusted according to Garman and Klass, 199) 3. Notation Whilst it is assumed that one uses T historical days to estimate volatility, the estimation procedures described later are presented under this adopted notation: O t The opening price on day t, H t The highest price on day t, L t The lowest price on day t, C t The closing price on day t, R t := ln(c t / C t 1 ) The logarithmic return on day t, h (0, 1) The fraction of the civil day when it is traded in the financial market, M The number of trading days in a year.
7 - 5 - It is obvious that it is convenient to estimate variance of returns (the square of volatility) instead of volatility itself. 4. Procedures for estimating daily volatility The classical line works on closing prices and employs the unbiased variance estimator in the form 1 tt ˆ closetoclose : R t 1 t R, () T1 where R is the mean return over the T days. This close-to-close is preferred for its simplicity and intuition; the recommendations for its use can be found in most of textbooks (see e. g. Hull, 000, or Ross, 1999). However, grounded in closing prices only, this estimator ignores much information on intraday volatility which may significantly contribute to its magnitude. First advances in the improvement of volatility estimation are due to Parkinson (1980) who derived the formula using only the high and low prices (which he regards as extreme values, whilst he calls his method the extreme value method) 1 tt H t ˆ Parkinson' s high-low : l t1 n. (3) T 4ln Lt As Garman and Klass (199) remark, intuition would then tell us that high/low prices contain more information regarding volatility than do open/close prices. The drawback of Parkinson s high-low estimator rests with the assumptions. He (implicitly) assumes that the process in (1) has zero drift (i. e. = 0) and that trading is conducted ceaselessly over the entire day. Garman and Klass (199) assist in improving Parkinson s formula by remedying the second said imperfection and they suggest the estimator tt H t 0.17 tt O t ˆ improved Parkinson' s high-low : ln l t1 t1 n, (4) T h 4ln Lt 1 h C t1 in which the coefficients 0.83 and 0.17 were determined in the fashion providing (4) with the highest efficiency. Criticism of Parkinson s formula is established on the fact that formulæ (3) and (4) do not allow for the joint effects between the open, high, low and close of a given day. Garman and Klass (199), too, assume zero drift and no interruptions in trading, however, they seek the best analytic scale-invariant estimator, whereas best stands for unbiased with minimum variance. They derive their best analytic scale-invariant estimator of historical volatility in the simplified form 1 1 tt H t tt C t ˆ GarmanKlass : ln ln 1 ln t1 T L 1, (5) t t Ot and suggest its improvement after considering interruptions in trading in the form ˆ tt O t : ˆ improved GarmanKlass GarmanKlass t1 h 1 h T t1 ln C, (6) where, again, the values 0.88 and 0.1 were set to bring forth the highest efficiency. Rogers and Satchell in 1991 take into account non-zero drift of the process in (1), albeit they operate under the assumption of no interruptions in trading. Their estimator is given by
8 - 6-1 H H L L. (7) tt t t t t ˆ RogersSatchell : ln ln ln ln t1 T Ot Ct Ot Ct A very interesting result is by Yang and Zhang (000) who were the first to construct an historical volatility estimator that besides the property of minimum variance is independent of the drift and is independent of interruptions in trading. It thus does not matter whether there be zero or nonzero drift or how long trading be closed. Its efficiency is 14 times higher than that of the close-to-close estimator in (). The advantages of the estimator of Yang and Zhan are at the expense of simplicity. The formula is ruled by ˆ ˆ ˆ ˆ YangZhang : open k close (1 k) RogersSatchell, (8a) where tt t ˆ open : ln ln t1 T 1 Ct O O C, (8b1) 1 tt Ct C ˆ close : ln l t1 n, (8b) T1 Ot O 1 k T, (8b3) O 1 tt Ot C 1 tt Ct with ln : ln and ln : t1 ln. t1 C 1 T Ct 1 O T Ot The formula in (8a) is suggestive of some weighted average of the open-to-close volatility, the close-to-open volatility and the cross-product open-high-low-close estimator of Rogers and Satchell. It is worth mentioning that Magdon-Ismail and Atiya establish their derivation of the volatility estimator on the maximum likelihood approach. They set up the conditional probability density f (H, L,, S) for the high price (H) and the low price (L) over a period of T days if the process undergoes a geometric Brownian motion with the parameters and respectively and begins at a certain value S. The estimate for volatility is determined by ˆ : arg max L,, (9) MLE wherein f (H, L,, S) L(, ). In the article, the presentation of the likelihood function (or the conditional density) is omitted for its pure technical character. 5. Procedures for obtaining yearly volatility Having the estimate of daily volatility at hand, one can use the square-root-of-time rule, which is under the assumption of geometric Brownian motion true, to obtain the estimate of yearly volatility. This requires the employment of the conversion relationship M ˆ. (10) 6. Summary ˆ yearly The article gives a brief insight on some of the ways to estimate historical volatility in financial markets. Over 30 years, several methods (more or less adequate to the true spirit of financial markets) have been invented since literature commenced to occupy itself with the correct estimation of volatility. The most spread method is based upon closing prices solely so called close-to-close volatility. Notwithstanding, its simplicity warrants not its precision. It daily
9 - 7 - is to be taken under advisement that closing prices solely do not exhaust the entire information on price dynamics, realizing that there are also opening prices, maximum prices and minimum prices available. In general, assuming a geometric Brownian motion for the process generating asset prices it was arrived at volatility estimators also considering opens, highs and lows. At present, the theoretically and empirically soundest estimator of volatility is perhaps ascribable to Yang and Zhang and is free of the shortcomings of the other volatility estimators overviewed in the article. 7. References [1.] BAXTER, Martin, RENNIE, Andrew Financial calculus. An introduction to derivative pricing. Cambridge : Cambridge University Press, ISBN [.] BRANDT, Michael W., KINLAY, Jonathan Estimating historical volatility. Workpaper. [3.] GARMAN, Mark B., KLASS, Michael J The estimation of security price volatility from historical data. An updated version of work originally titled "On the estimation of security price volatilities from historical data," published in Journal of Business Vol. 53. No. 1. Pp [4.] HULL, John C Options, Futures & Other Derivatives. Fourth Edition. Upper Saddle River [USA] : Prentice Hall 000. ISBN [5.] MAGDON-ISMAIL, Malik, ATIYA, Amir F. Volatility estimation using high, low, and close data a maximum likelihood approach. Workpaper [6.] PARKINSON, Michael, The extreme value method for estimating the variance of the rate of return. In Journal of Business Vol. 53. No 1. Pp [7.] ROSS, Sheldon M An introduction to mathematical finance: options and other topics. Cambridge : Cambridge University Press ISBN [8.] YANG, Dennis, ZHANG, Qiang 000. Drift-Independent volatility estimation based on high, low, open, and close prices. In Journal of Business Vol. 73. No 3. Pp The author s address Martin Boa, Ing. et Bc. Univerzita Mateja Bela v Banskej Bystrici Ekonomická fakulta Katedra kvalitatívnych metód a informaných systémov Tajovského Banská Bystrica [email protected]
10 - 8 - Overovanie efektívnosti trhového portfólia v priestore mean-variance: model CAPM 1 Martin Boa Mária Kanderová 3 Abstract: In this contribution we present some results from Markowitz model of the selection of efficient portfolio in space mean-variance. The usual CAPM equation is direct implication of the mean-variance efficiency of the market portfolio. We focus on the econometric analysis of Sharpe and Lintner version of the CAPM. The contribution presents the framework for the estimation of the parameters of the CAPM and some statistical tests for verification of its validity. Key words: mean-variance efficient portfolio, market portfolio, expected excess return, riskfree asset, zero-beta portfolio, Sharpe ratiowald test statistic, MacKinlay statistic 1. Úvod Markowitzová teória výberu portfólia položila základy pre odvodenie modelov oceovania kapitálových aktív, ktoré vysvetujú vzah medzi oakávaným výnosom každého rizikového aktíva a jeho rizikom za podmienok rovnováhy na trhu. Poda tejto teórie investori budú drža efektívne portfólio v priestore mean-variance, to znamená také, ktoré má najvyšší oakávaný výnos pre danú úrove rizika. Sharpe (1964) a Lintner (1965) rozšírili výsledky Markowitzovho modelu. Ukázali, že ak investori majú homogénne oakávania a držia portfóliá, ktoré sú efektívne v priestore mean-variance, potom za predpokladu, že neexistujú trhové obmedzenia, trhové portfólio bude tiež portfólio efektívne v priestore mean-variance.. Výber portfólia v priestore mean-variance Modely oceovania kapitálových aktív sú založené na Markowitzovej teórii portfólia. Markowitz vysvetlil fenomén diverzifikácie portfólia v priestore mean-variance. Nech portfólio obsahuje N rizikových aktív s (Nx1) vektorom oakávaných výnosov a (NxN) kovariannou maticou. Nech w je (Nx1) vektor váh aktív v portfóliu. Portfólio P je portfólio s minimálnym rozptylom zo všetkých portfólií so stredným výnosom P ak vektor váh w je riešením nasledujúcej úlohy kvadratického programovania min p = ww (1) za podmienok w =p () w e = 1 (3) Úloha vyjadruje vzah medzi rozptylom portfólia p s minimálnym rozptylom a jeho okávaným výnosom p. Grafické vyjadrenie vzahu medzi smerodajnou odchýlkou portfólia s minimálnym rozptylom a jeho oakávaným výnosom predstavuje hranicu portfólií s minimálnym rozptylom (obrázok 1). Portfóliá s minimálnym rozptylom s výnosom väším alebo rovným, ako je oakávaný výnos portfólia s globálne minimálnym rozptylom G, sú efektívne portfólia. Nech P a Z sú portfólia s minimálnym rozptylom. Ak platí, že ich kovariancia je rovná nule w w = 0 (4) p Z 1 Tento príspevok bol sspracovaný v rámci riešenia grantovej úlohy KEGA3/514/07 Martin Boa, Katedra kvantitatívnych metód a informatiky, Ekonomická fakulta UMB v Banskej Bystrici 3 Mária Kanderová, Katedra kvantitatívnych metód a informatiky, Ekonomická fakulta UMB Banskej Bystrici
11 - 9 - takéto portfólia sú ortogonálne. Portfólio Z sa nazýva zero-beta portfólio vzhadom na portfólio P. Obrázok 1 Hranica portfólií N-rizikových aktív s minimálnym rozptylom P P G G Z Z Dôležitou vlastnosou úlohy výberu portfólia je veta o vylenení dvoch fondov. Nech P a R sú dve portfólia s minimálnym rozptylom, s oakávaným výnosom p a R, kde P R. Potom 1. Každé portfólio S s minimálnym rozptylom je lineárnou kombináciou portfólií P a R.. Hranica portfólií s minimálnym rozptylom môže by generovaná z ubovoných dvoch rôznych portfólií s minimálnym rozptylom. 3. Každé portfólio, ktoré je lineárnou kombináciou portfólií s minimálnym rozptylom, je tiež portfóio s minimálnym rozptylom. 3. Nech portfóia P a R sú efektívne portfólia s minimálnym rozptylom. Potom portfólio S, ktoré je ich lineárnou kombináciou, je tiež efektívne portfólio v priestore mean-variance. 4. Ku každému portfóliu P s minimálnym rozptylom okrem portfólia s globálne minimálnym rozptylom existuje jedno portfólio Z s minimálnym rozptylom s oakávaným výnosom Z, ktoré má nulovú kovarianciu s portfóliom P. V špeciálnom prípade, ak existuje bezriziková úroková sadzba R f, potom Z = R f. Z uvedených tvrdení vyplýva, že akékovek efektívne portfólio v priestore mean-variance možno generova ubovonými dvoma portfóliami, ktoré sú efektívne v tomto priestore. 3. Portfólio v priestore mean-variance a bezrizikové aktívum. Predpokladajme, že portfólio je zložené z bezrizikového aktíva a z N rizikových aktív. Nech = - R f e je (Nx1) vektor dodatoných výnosov portfólia, R f je bezriziková úroková sadzba a e je (Nx1) jednotkový vektor. Pre dodatoný oakávaný výnos portfólia p platí P = w T + (1- w T e)r f R f = w T. (5) Úloha výberu portfólia N rizikových aktív s bezrizikovým aktívom je riešením nasledovnej úlohy kvadratického programovania za podmienok min p = w T Cw (6) w T = P. (7)
12 Efektívne portfólia, ktoré vzniknú kombináciou bezrizikového aktíva a mean - variance portfólia rizikových aktív ležia na priamke, ktorá prechádza bodmi [R f, 0] a [ T, T ] a má maximálny sklon zo všetkých priamok, ktoré sú kombináciou bezrizikového aktíva a mean-variance portfólia. Priamka urená danými bodmi je priamka kapitálového trhu a portfólio T je dotynicové portfólio. Obrázok : Efektívna hranica a bezrizikové aktívum P T T T -R f R f F T p Sklon tejto priamky charakterizuje Sharpovú mieru portfólia v tvare p - R f sr p =. (8) p Sharpova miera portfólia definuje dodatoný oakávaný výnos na jednotku rizika. Oakávaný dodatoný výnos na jednotku portfólia je vhodný ako východisko pre ekonomickú interpretáciu testov CAPM modelu. Testovanie efektívnosti portfólia v priestore mean-variance je ekvivalentné testovaniu, i Sharpova miera portfólia (8) je maximálna zo všetkých prípustných portfólií. 4. Model oceovania kapitálových aktív Základy CAPM modelu položil Markowitz (1959), ktorý v svojej pôvodnej práci argumentoval, že investori držia efektívne portfólio v priestore mean-variance, to znamená portfólio s najvyšším oakávaným výnosom pri danej úrovni rizika. Sharpe (1964) a Lintner (1965) ukázali, že ak investori majú homogénne oakávania a každý z nich drží optimálne mean-variance efektívne portfólio, pri neexistencii trhových obmedzení, portfólio celého investovaného bohatstva alebo trhové portfólio bude tiež efektívne portfólio v priestore mean-variance. Sharpe a Lintner odvodili CAPM za predpokladu existencie bezrizikovej zapožiiavacej a požiiavacej sadzby. V tejto verzii CAPM pre oakávaný výnos i-tého aktíva platí: E[R i ] = R f + im (E[R m ]-R f ), (9) kde R m je výnos trhového portfólia, R f je výnos bezrizikového aktíva. im i Cov R,R D R m m, (10)
13 Sharpova-Lintnerova verzia CAPM modelu môže by vysvetlená cez pojem dodatoný výnos. Nech i je dodatoný výnos i-tého aktíva nad výnosom bezrizikového aktíva, i = R i - R f. Potom pre CAPM model platí E[ i ] = im E[ m ], (11) im i Cov, D m m, (1) kde m je dodatoný výnos trhového portfólia. Empirické testy Sharpe-Lintnerovho CAPM sú zamerané na tri implikácie modelu (11): 1. Intercept (úrovová konštanta) je rovná nule.. Beta úplne vyerpáva variabilitu oakávaných dodatoných výnosov. 3. Oakávaná trhová riziková prémia (oakávaný dodatoný výnos trhu E[ m ]) je kladná. V našom príspevku budeme testova prvú implikáciu, že úrovová konštanta je rovná nule. Black (197) odvodil zovšeobecnenú verziu CAPM modelu za predpokladu neexistencie bezrizikovej úrokovej sadzby. V tejto verzii dodatoný oakávaný výnos aktíva i nad výnosom zero-beta portfolia je v lineárnom vzahu k jeho beta. E[R i ] = E[R 0m ] + im (E[R m ]- E[R 0m ] ), (13) im i Cov R,R D R m, (14) m kde R m je výnos trhového portfólia, R 0m je výnos zero-beta portfólia, ktoré je ortogonálne k trhovému portfóliu m. Zero-beta portfólio je definované ako portfólio, ktoré má minimálny rozptyl zo všetkých portfólií nekorelovaných s trhovým portfóliom m. Ekonometrická analýza Blackovej verzie CAPM považuje výnos zero-beta portfólia ako nemeratenú veliinu. Blackova verzia môže by testovaná ako obmedzenie na reálnom modeli výnosov trhu. Pre reálny výnos modelu trhu platí E[R i ] = i + im E[R m ], (15) kde poda (13) i = E[R 0m ](1- im ). (16) CAPM v tvare (11) a (15) je model pre jedno obdobie, nemá asovú dimenziu. Pre ekonometrickú analýzu je nevyhnutné prida predpoklad, ktorý zohaduje vývoj výnosov v ase a odhadnú model v ase. 5. Ekonometrický model Sharpe- Lintnerovej verzie CAPM. Predpokladáme že výnosy sú nezávislé a rovnako rozdelené v ase a majú združené N-rozmerné normálne rozdelenie. Tieto predpoklady aplikujeme na dodatoné výnosy pre testovanie Sharpovej-Lintnerovej verzie CAPM. alej predpokladajme, že investori majú možnos zapožiiava a vypožiiava za bezrizikovú výnosovú mieru. Nech t je (Nx1) vektor dodatoných výnosov N aktív v portfóliu. Pre týchto N aktív môže by dodatoný výnos vyjadrený trhovým modelom v tvare
14 - 1 - t = + mt + t, (16) E[ t ]=0, E[ t t T ]=, E[ mt ]= m, E[( mt - m ) ]= m, Cov [ mt, t ] = 0, (17) kde je (Nx1) vektor koeficientov beta, mt je dodatoný výnos trhového portfólia za obdobie t, je (Nx1) vektor koeficientov alfa a t je (Nx1) vektor náhodných chýb. Dôsledkom verzie CAPM (8) je, že všetky prvky vektora sú nulové. Z toho vyplývajú základné hypotézy pre testovanie tohto modelu. Ak všetky prvky vektora sú nulové, potom portfólio m je dotynicové portfólio. Na odhad parametrov modelu (16) použijeme metódu maximálnej vierohodnosti. Rozdelenie dodatoných výnosov aktív je podmienené dodatonými výnosmi trhu. Za predpokladu, že dodatoné výnosy t majú združené normálne rozdelenie, potom pre ich funkciu hustoty rozdelenia pravdepodobnosti platí -1 - t --mt t --mt -1/ -N/ f = () e. (18a) t mt 1 Keže dodatoné výnosy sú v ase IID, potom pre T pozorovaní je združená pravdepodobnostná funkcia hustoty 1 T -1 T - t --mt t --mt -N/ -1/,,...,,..., f 1 T m1, m mt = () e. (18b) t1 Odhad parametrov získame, ak parciálne derivácie logaritmu združenej funkcie hustoty (18b) poda,, položíme rovné 0. Maximálny vierohodný odhad pre parametre a ich podmienené rozdelenia T ˆ ˆ m, 1 m ˆ ~ N N ; 1 (19) T sm t T 1 T t1 ˆ t mt m, s m ˆ 1 1 ~ N N ; T s (0) m ˆ 1 T t T t1 T t -ˆ -ˆ mt t -ˆ - ˆ mt, T ˆ ~ T ; W (1) N kde 1 t T T t1 t t T 1 m t 1 mt, T s m T t1 1 t T, mt m. () Pre testovanie nulovej hypotézy H 0 : = 0 oproti alternative H 1 : 0 použijeme Waldovu testovaciu štatistiku a MacKinley testovaciu štatistiku. Waldova testovacia štatistika W Ts T 1 ˆ sm m 1 m T covˆ ˆ ˆ ˆ má za predpokladu platnosti nulovej hypotézy asymptoticky chí-kvadrát rozdelenie s N stupami vonosti. (3)
15 MacKinlay-Gibbons-Ross-Shanken (1989) odvodili testovaciu štaistiku pre konený výber 1 T N sm T ˆ ˆ MK 1 ˆ, (4) N sm m ktorá ma za predpokladu platnosti nulovej hypotézy F-rozdelenie s potom stupov vonosti N; (T-N-1). T -1 Gibbons, Ross a Shanken dokázali, že kvadratická forma môže by vyjadrená pomocou Sharpovej miery portfólia T -1 q = - m, (5) s q s m kde q je ex post dotynicové portfolio a m je trhové portfólio. Potom testovacia štatistika sa dá napísa v tvare q - m T - N -1 s q s m MK = N m m 1+ s. (6) Poda (6) portfólio s maximálnou hodnotou Sharpovej miery zo všetkých prípustných portfólií je dotynicové portfolio. To znamená, že ak ex post trhové portfólio je dotynicové portfólio, potom hodnota MK bude rovná nule, o vedie k záveru, že trhové portfolio je efektívne portfólio. 6. Dáta Uvedené testy sme aplikovali na skupine akcií 10 amerických spoloností, ktoré sú súasou indexu S&P 500. K dispozícii sme mali denné ceny akcií a denné hodnoty indexu S&P 500, z ktorých sme vypoítali mesané logaritmické výnosy a anualizovali sme ich. Trhové výnosy boli nahradené výnosmi akciového indexu S&P 500. Bezriziková úroková miera bola reprezentovaná asovým radom 6-mesaných úrokových sadzieb LIBOR USD p. a. asový rad výnosov zahal 40 mesaných pozorovaní v priebehu 0 rokov od 9. januára 1988 do 31. decembra 007. asový rad 40 pozorovaní sme rozdelili na štyri neprekrývajúce sa iastkové obdobia po 5-rokoch (60 mesaných pozorovaní v každom období) a na dve 10-roné iastkové obdobia (10 mesaných pozorovaní). Odhady parametrov, a použitie vyššie popísaných testov sme aplikovali osobitne pre 5-roné obdobia, potom pre 10-roné obdobia a pre celé 0-roné obdobie. Výsledky testov sú v tabuke 1. Výsledky testov sú pre jednotlivé iastkové obdobia rozdielne. Vidíme, že v 5 ronom období 1/1998 1/00 na základe obidvoch testov nezamietame nulovú hypotézu a vzhadom na použité dáta sa potvrdila platnos Sharpovej-Lintnerovej verzie CAPM modelu. Keže dané 5 roné obdobie je súasou desaroného obdobia 1/1998-1/007, tento výsledok sa potvrdil aj v tomto iastkovom období. V ostatných obdobiach sme na 5 %-nej hladine významnosti zamietli nulovú hypotézu, o vedie k záveru, že sa nepotvrdila platnos Sharpovej-Lintnerovej verzie CAPM a vzhadom na dané dáta trhové portfólio nie je efektívne portfólio.
16 Tabuka 1: Výsledky testovania validity CAPM Obdobie 5 roné obdobie poet pozorovaní Wald test p-value MacKinlay test test p-value 1/1988-1/ ,03 0,007 1,977 0,057 1/1993-1/ ,346 0,06 1,66 0,117 1/1998-1/ ,548 0,919 0,371 0,953 1/003-1/ ,158 0,007 1,973 0, roné obdobie 1/1988-1/ ,4 0,0007,763 0,004 1/1998-1/ ,81 0,18 1,55 0,65 0 roné obdobie 1/1988-1/007 40,361 0,013,133 0,03 7. Záver Testy, ktoré sme použili na overenie platnosti Sharpe-Lintnerovej verzie CAPM modelu sú založené na predpoklade, že výnosy aktív majú združené N-rozmerné rozdelenie. Pri testovaní združenej normality našich dát sme použili testy založené na viacrozmerných charakteristikách šikmosti a špicatosti (Mardinove testy z roku 1970). Na základe týchto testov sa ukázalo, že rozdelenie výnosov je symetrické, ale špicatejšie ako viacrozmerné normálne rozdelenie. Takéto rozdelenie je typické pre rozdelenie trhových výnosov a je v súlade s inými empirickými štúdiami. Porušenie predpokladu o združenej normalite výnosov môže by jednou z príin, preo sa nepotvrdila platnos CAPM. Literatúra ANDL, Jií 005. Základy matematické statistiky. Praha : Matfyzpress, s. ISBN BENNINGA, Simon 000. Financial modeling. With a section on Visual Basic for Applications by Benajmin Czaczkes. Second Edition. Cambridge / London : The MIT Press, s. ISBN CAMPBELL, John Y., LO, Andrew W., MACKINLAY, A. Craig The econometrics of financial markets. Second printing, with corrections. Princeton [New Jersey, USA] : Princeton University Press, s. ISBN ELTON, Edwin J., GRUBER, Martin J. et al. Modern portfolio theory and investment analysis. Seventh edition. Hoboken [New Jersey, USA] : Wiley, pp. ISBN MLYNAROVI, Vladimír 001. Finanné investovanie. Teórie a aplikácie. Bratislava: Iura Edition, s. ISBN POTOCKÝ, Rastislav, LAMOŠ, František Pravdepodobnos a matematická štatistika. Bratislava : Alfa, s. ISBN RAO, C. Radhakrishna, 00. Linear statistical inference and its applications (second) edition. New York : Wiley, s. ISBN Adresa autorov Martin Boa, Ing. Et Bc., Mária Kanderová, Ing., PhD. Katedra kvantitatívnych metód a informatiky Ekonomická fakulta, UMB Tajovského Banská Bystrica [email protected]; [email protected]
17 Branch structure of employment in particular regions of the Czech Republic Hana Boháová, Pavla Jindrová, Jana Heckenbergerová Abstract: The aim of this paper is to analyse the branch structure of employment in the Czech Republic regions according to the Industrial Classification of Economics Activities. The branch structure resemblance between the regions during was studied and an algorithm of the future resemblance forecast was proposed. Key words: Industrial classification of economic activities, Czech Republic regions, cluster analysis. 1. Industrial classification of economic activities The industrial classification of economic activities focuses on all the working activities performed by economic subjects in a given region. There was the OKE classification used in Czech Republic during the period 1994 to 007. Since January 008 CZ-NACE classification is being used. The similarities and differences in the branch structure of employment in particular regions of the Czech Republic in years are investigated in this paper in so far that the OKE classification is adequate for our purpose. Following OKE categories are involved here: A 01 A 0, B C D E F G H I J K L M N O Agriculture, hunting and related activities, Forestry, fishing, fish farming and related activities, Mineral raw materials mining, Manufacturing industry, Production and distribution of electricity, gas and water, Building industries, Business, car and consumer items repair, Accommodation and boarding, Transfer, stocking and communication, Factoring, Real properties and lease, related entrepreneurial activities, Public administration and defence, obligatory social security, Education, Health care and social-service work, veterinary activities, Other public, social and personal services.. Resemblance between the regions of the Czech Republic in view of the branch structure of employment The task now is to find out the resemblance and discrepancies in the branch structure of employment between particular regions of the Czech Republic in the period of 1993 to 006.
18 The time series of the numbers of employees in separate categories listed above per a NUTS 3 regions in mentioned period published on the web of the Czech Statistical Office (cf. [3]) are used. Let us choose the time series from the beginning, the middle and the end of the period under consideration it means from 1993, 000 and 006. Cluster analysis is applied on these data - average distance method and Euclidean norm are used, the clustering indicators are the numbers of employees and classified objects are particular regions (cf. [1] or []). Unistat 5.6 was used. Let us have a look at the dendrogram in figure 1. It is the output of cluster analysis for the year Particular regions are denoted as follows: 1 Královéhradecký, Jihoeský, 3 Jihomoravský, 4 Karlovarský, 5 Liberecký, 6 Moravskoslezský, 7 Olomoucký, 8 Pardubický, 9 hl. m. Praha, 10 Plzeský, 11 Stedoeský, 1 Ústecký, 13 Vysoina, 14 Zlínský. 10 Dendrogram M Euklid, Metoda:Prmr mezi skupinami Vzdálenost Shluky Figure 1: Dendrogram cluster analysis, branch structure of employment in the Czech Republic, 1993.
19 We can see the biggest resemblance between Pardubický and Královéhradecký region and resemblance between Olomoucký and Plzeský region at the first sight. Next we can notice that the regions are splitted into three groups the first group is formed by Pardubický, Královéhradecký, Zlínský, Liberecký, Olomoucký, Plzeský, Karlovarský, Jihoeský and Vysoina region. The second group consists of Jihomoravský, Stedoeský, Moravskoslezský and Ústecký region. The capital city of Prague is in the third group separately. We will try to explain the reason why these three groups are formed a little bit later. Let us now see the result of cluster analysis for year 000 in figure. 10 Dendrogram M Euklid, Metoda:Prmr mezi skupinami Vzdálenost Shluky Figure : Dendrogram cluster analysis, branch structure of employment in the Czech Republic, 000. The most telling resemblance is between Královéhradecký and Plzeský region in this case, then Olomoucký and Pardubický region come in within the next two steps. Figure shows three groups of regions as well. The first group is formed by the above mentioned regions, Zlínský, Jihoeský, Karlovarský, Liberecký, Ústecký and Vysoina region. Jihomoravský, Stedoeský and Moravskoslezský region are in the second group. The last group is the capital city of Prague on its own again. In figure 3 we can find the dendrogram for the last year of the considered period for the year 006. The situation is quite similar to that in figure 1. The most significant resemblance can be seen between Královéhradecký and Pardubický region and then between Olomoucký and Plzeský region. This figure has the three groups too. The first group consists of Královéhradecký, Pardubický, Zlínský, Vysoina, Olomoucký, Plzeský, Jihoeský, Karlovarský and Liberecký region. Jihomoravský, Stedoeský, Moravskoslezský and Ústecký region are in the second group. The third group is the capital city of Prague.
20 Dendrogram M Euklid, Metoda:Prmr mezi skupinami Vzdálenost Shluky Figure 3: Dendrogram cluster analysis, branch structure of employment in the Czech Republic, 006. When we look for the reason that causes the splitting of the regions in the dendrogram into the three groups we have to focus on the percentual distribution of the branches in each region. We can find that the main difference between the first and the second group is in the distribution of the D category (manufacturing industry). E.g. in ,5% of the economically active people in the whole Czech Republic were employed in the manufacturing industry. In the regions of the first group in figure 3 the percentual distribution of category D Manufacturing industry was slightly higher then the republic one. In the regions from the second group it was a little lower. Next we can see that the capital city of Prague is much different from the other groups (which is of course exactly what we could expect). The main difference is that the capital city has markedly lower distribution of categories D Manufacturing industry, A 01 Agriculture, hunting and related activities, A 0 and B - Forestry, fishing fish farming and related activities and higher distribution of K - Real properties and lease, related entrepreneurial activities and O - Other public, social and personal services on the opposite side. 3. Resemblance estimate algorithm proposal We have no objective reason to expect some expressive changes in the resemblance and/or differences in the branch structure of employment between the regions of the Czech Republic. But when we decide to estimate the future situation (or when we need to estimate the future cluster splitting for some other problem) we can fit the time series data with a suitable trend curve, make the prediction of the future values and then use these predicted values as the input of the cluster analysis.
21 References [1] ANDL, J Mathematical Statistics. (in Czech), Praha: SNTL, [] KUBANOVÁ, J Statistical Methods for Economical and Technical Practices. (in Czech), Bratislava: Statis, 004. ISBN [3] Authors addresses: Mgr. Hana Boháová Institute of Mathematics Faculty of Economics and Administration Studentská Pardubice Mgr. Pavla Jindrová Institute of Mathematics Faculty of Economics and Administration Studentská Pardubice Mgr. Jana Heckenbergerová Institute of Information Technologies Faculty of Electrical Engineering and Informatics Studentská Pardubice
22 - 0 - Vývoj rozvodovosti na Slovensku Divorce Rate Progress in Slovakia from 1997 to 007 Rastislav ief Abstract: Divorce is one of the forms of the marriage disintegration, based on a legal way to end the marriage. The divorce rate negatively affects the population reproduction and has a very negative effects on children s upbringing. In Slovakia, from 1997 to 005, the number of divorces was growing, only in last two years it has recorded some decrease. The new trends have been noticed - increasing of the average duration of divorced marriages, increasing proportion of men suing for divorce and increasing proportion of divorces on divorce proceedings results. key words: Divorce, divorce rate, reason for divorce, duration of divorced marriages kúové slová: rozvod, rozvodovos, príiny rozvratu manželstiev, džka trvania rozvedených manželstiev 1. Úvod Rodina je základnou bunkou spolonosti. Na vytvorenie rodiny má kúový vplyv inštitúcia manželstva, ktorá je známa vo všetkých civilizáciách na svete. Vo vyspelých krajinách v 0-tom storoí nastala kríza rodiny, ktorá pokrauje aj v súasnosti. Dôsledkom je masový rozpad manželstiev, prípadne v niektorých oblastiach aj minimálny vznik nových manželstiev, ktoré sú nahradzované partnerstvom bez sobáša. Tieto trendy zasahujú aj Slovensko a v tomto sa príspevku venujeme najnovší vývoj. Rozvod je jedna z foriem rozpadu manželstva založená na zákonnom spôsobe ukonenia manželstva. Rozvodovos negatívne ovplyvuje reprodukciu obyvatestva a má výrazne nepriaznivé dôsledky na výchovu detí (Mládek, J.,199).. Vývoj rozvodovosti na Slovensku V období poet ukonených konaní neustále rástol z v roku 1997 až na v roku 005, no v posledných dvoch rokoch zaznamenal menší pokles. Podobne aj poet rozvodov stúpal z v roku 1997 až na v roku 006. Ostatné výsledky konania zaznamenali pokles: zamietnuté návrhy klesli zo 187 v roku 1997 na 87 v roku 007, vzaté návrhy spä klesli z na 653 a iné rozhodnutia z 566 na 133 za rovnaké obdobie. Stúpajúci trend mali rozvedené manželstva s maloletými demi, kým v roku 1997 ich bolo v roku 006 až 8 474, popritom, ale poklesol priemer potu maloletých detí v rozvedenom manželstve na 1,5 a potvrdilo sa, že manželstva s 3 a viac demi sa ukázali stabilnejšie, keže ich poty v danom období stagnovali (rone okolo 540 rozvodov). Vemi výrazné zmeny vidie v džke trvania rozvedeného manželstva, kde vidie trend každorone sa zvyšujúceho priemeru z 11,8 rokov v 1997 na 14, rokov v 007 a zdá sa, že tento trend ešte môže pokraova. Znamená to, že sa oraz astejšie rozvádzajú aj staršie manželstvá, ktoré by už mali ma prekonané kritické obdobia. U krátko trvajúcich manželstiev vidno pokles, prípadne stagnáciu potu rozvodov ( s výnimkou dvojroných manželstiev). Naproti tomu v kategórii 9 a viacroné manželstva stúpol poet rozvodov s 5 1 v roku 1997 na v roku 007 (pritom v roku 006 bol ešte vyšší 8 61 rozvodov!). Zaujímavú zmenu vidno v podávaní návrhu dlhé desaroia výrazne dominujú v podávaní návrhov ženy (69%v roku 1997), ale v súasnosti sa ich dominancia zaína
23 - 1 - znižova (65% v roku 006). Zdá sa, že kým v minulosti boli so svojim manželstvom ovea viac nespokojné ženy v súasnosti stúpa poet mužov ktorí sú nespokojný v danom manželstve a dávajú návrh na rozvod. Od roku 1963 súd pri rozvode povinne uruje príinu rozvratu manželstva. Momentálne klesá kvalita tohto urovania, o je vidie v tom, že sa výrazne zvyšuje kategória 6-rozdielnos pováh, názorov a záujmov, za ktorú sa zrejme skrývajú aj iné príiny, ktoré je pred súdom nepríjemné rozobera (z v roku 1997 stúpla na 7 796! v roku 006). Stúpli aj kategórie 3-nevera (u mužov o 38% u žien len o 18%) a kategória 9-ostatné príiny (u mužov o polovicu a u žien takmer na dvojnásobok). Zaujímavo sa vyvíjala kategória - alkoholizmus, kde u mužov mierne poklesla (z 1109 v roku 1997 na 1064 v roku 007) a naopak u žien zaznamenala nárast (z 10 v roku 1997 na 15 v roku 007). Ostatné kategórie stagnovali alebo dlhodobo klesali, logický je pokles kategórie 1- neuvážené uzavretie manželstva jednak vzhadom na nižšiu sobášnos a jednak vzhadom na zvyšovanie veku rozvádzaných manželstiev. Najvýraznejší pokles zaznamenala kategória 8- sexuálne nezhody, ktorá klesla 104 v roku 1997 na 47 v roku 007. Dlhodobo vidie pokles nevinných žien, iže pokles v kategórii 0-nezistené zavinenie, ktoré v roku 1985 bolo až 46,5% v roku 1997 bolo % a v roku 007 bolo už len necelých 15%. Muži v tejto kategórii stagnovali na okolo 300 prípadov (necelé 3%). Tab..1: Rozvody na Slovensku v rokoch Poet z nich Výsledok konania ukone- podal návrh manžel. návrh návrh iné manželstvo Územie ných rozve- zamiet- vzatý rozhod- vyhlásené muž žena konaní dené nutý spä nutie za neplat zdroj: Základné demografické údaje Prešovského kraja. ŠÚ SR, Prešov, Tab..: Rozvody manželstiev s maloletými demi Z rozvedených manželstiev manželstvá s maloletými demi priemerná spolu poet maloletých detí džka trva priemer nia manž ,6 11, ,6 1, ,5 1, ,5 1,7
24 ,5 13, ,5 13, ,5 13, ,5 13, ,5 13, ,5 14, ,5 14, zdroj: Základné demografické údaje Prešovského kraja. ŠÚ SR, Prešov, Tab..3:Rozvody poda džky trvania manželstva roky Džka trvania rozvedeného manželstva (v rokoch) do a viac zdroj: Základné demografické údaje Prešovského kraja. ŠÚ SR, Prešov, Tab..4:Rozvody poda príiny rozvratu manželstva a trvalého pobytu manželov v SR príina rozvratu manželstva (kód) na strane muža rok
25 - 3 - príina rozvratu manželstva (kód) na strane ženy rok zdroj: Základné demografické údaje Prešovského kraja. ŠÚ SR, Prešov, kód- príina rozvratu: 1-neuvážené uzavretie manželstva -alkoholizmus 3-nevera 4-nezáujem o rodinu, vrátane ukonenia spolužitia 5-zle zaobchádzanie, odsúdenie pre trestný in 6-rozdielnos pováh, názorov a záujmov 7-zdravotné dôvody, vrátane neplodnosti 8-sexuálne nezhody 9-ostatné príiny 0-súd nezistil zavinenie 3. Záver Na Slovensku v období 1997 až 005 poet rozvodov rástol až v posledných dvoch rokoch zaznamenal menší pokles. Z nových trendov sú najmä neustále zvyšovanie priemernej džky trvania rozvedených manželstiev a zvýšenie podielu rozvodov z výsledkov konania, keže sa výrazne znížili zamietnuté a stiahnuté návrhy. Kým v minulosti výrazným modelom bolo, že nespokojná manželka dávala, návrh na rozvod a súd ju v polovici prípadoch uznal nevinou, v súasnosti sa tento model narúša zvyšujúcim sa potom podaní návrhov mužov a klesajúcim podielom žien u ktorých súd nezistil zavinenie. Zdá sa, že tento trend je je dôsledkom zvyšujúcej sa emancipácie žien. alším novým trendom je hadanie si mladších partneriek u mužov, o môže ma za dôsledok nárast rozvodov dlhotrvajúcich manželstiev. Celkovo možno poveda, že Slovensko napodobuje v rozvodovosti celosvetové trendy a v budúcnosti zrejme nemožno oakáva výrazné zlepšenie. 4. Literatúra [1] MLADEK,J.199.Základy geografie obyvatestva. SPN, Bratislava,199. [] Základné demografické údaje Prešovského kraja ŠÚ SR, KS Prešov, [3] Základné demografické údaje Prešovského kraja ŠÚ SR, KS Prešov, [4] Základné demografické údaje Prešovského kraja ŠÚ SR, KS Prešov, 000.
26 - 4 - [5]Základné demografické údaje Prešovského kraja 000. ŠÚ SR, KS Prešov, 001. [6] Základné demografické údaje Prešovského kraja 001. ŠÚ SR, KS Prešov, 00. [7] Základné demografické údaje Prešovského kraja 00. ŠÚ SR, KS Prešov, 003. [8] Základné demografické údaje Prešovského kraja 003. ŠÚ SR, KS Prešov, 004. [9] Základné demografické údaje Prešovského kraja 004. ŠÚ SR, KS Prešov, 005. [10] Základné demografické údaje Prešovského kraja 005. ŠÚ SR, KS Prešov, 006. [11] Základné demografické údaje Prešovského kraja 006. ŠÚ SR, KS Prešov, 007. [1] Základné demografické údaje Prešovského kraja 007. ŠÚ SR, KS Prešov, 008. Adresa Autora: Rastislav ief Dobrianského Humenné [email protected]
27 - 5 - Regionální demografie v SÚ - prezentace a analytické využívání Eduard Durník, Jií Kamenický Regional Demography in CSO presentations and analytical applications Eduard Durník, Jií Kamenický Abstrakt: eský statistický úad pechází stále astji na využívání administrativních dat z externích zdroj. Demografická statistika vychází z tradiních hlášení o jednotlivých demografických jevech, ale od roku 005 se opírá i o údaje z centrální evidence obyvatel Ministerstva vnitra. Pi zpracování výsledk se potýká s problematikou územních zmn, ale také s astou zmnou legislativy týkající se dat za cizince. Pro úely regionální statistiky se pipravují pepoty nkolika set demografických ukazatel podle aktuální píslušnosti do územních celk, ímž vzniká dležitý zdroj pro analýzy regionálních asových ad. Prezentace demografických dat je zajišována vydáváním klasických publikací, ale perspektivu má pedevším webová prezentace demografických dat. K tomu slouží nejen specializované aplikace (umožují mimo jiné prezentovat i územní zmny), ale také univerzální aplikace (veejná databáze) umožující ad-hoc specifikaci uživatel vetn možnosti pepínat zobrazení tabulka graf mapa. Vedle popisných výstup roenkového typu nebo asových ad se vnuje velký prostor i analytickým publikacím. V nabídce SÚ najdeme jak komplexní analýzy, jejichž souástí jsou i kapitoly demografické analýzy (nap. demografický pilí v publikacích Demografický, sociální a ekonomický vývoj v kraji, analýza demografických jev v publikaci Život cizinc v R) nebo specializované monotematické analýzy zamené výhradn na oblast demografie (nap. Vysokoškoláci z demografického pohledu). Klíová slova: Organizace regionální a demografické statistiky Datové zdroje Standardní publikaní výstupy Webové prezentace Demografické analýzy Multikriteriální hodnocení Key words: organisation of regional and demgraphic statistics Data sources Standard publications - Web presentations Demographical analyses multicriterial evaluations 1. Úvod Demografická statistika zstává i v souasné dob rodinným stíbrem vtšiny statistických úad, stejn tak tomu je i v eském statistickém úad. Pomrn stabilizovaný systém zjišování dat, vysoká spolehlivost údaj, atraktivnost výstup, schopnost vyrovnat se i s požadavky lokální statistiky, to patí k výrazným pozitivm. Tématem našeho píspvku je poskytnutí základního obrázku, jak je VSÚ organizovaná demografická a regionální statistika. Nartneme,, jak zacházíme s výstupy demografické statistiky, abychom uspokojili dlouhodob vysoký zájem uživatel o relevantní data. Po vstupu eska do Evropské unie se razantn zvyšuje význam výstup regionální statistiky. Pi píprav program rozvoje region, typování zaostalých region z rzných hledisek, patí mezi významné pilíe data demografické statistiky. Chceme nastínit i pístupy regionálních analytik SÚ, kteí se touto tematikou asto zabývají, pedstavit nkteré analytické práce. Rovnž chceme dokumentovat stžejní roli webu pi prezentaci demografických a regionálních dat, ale také se zmíníme o standardních publikacích demografické statistiky.
28 Organizace regionální a demografické statistiky v SÚ, základní metodické pístupy V SÚ neexistuje specializovaný útvar, který by ml na starosti regionální statistikou. Regionální statistikou se na SÚ zabývají: oddlení regionálních databází (správa a rozvoj regionálních databází, regionální analýzy, mezirezortní vazby zejména v pracovních skupinách pro udržitelný rozvoj, webové prezentace regionálních údaj) oddlení informaních služeb a regionálních analýz (14 krajských pracoviš tvorba a správa krajských webových stránek SÚ, produkce tabulkových publikací, ale i monotématických i komplexnjších analýz (zpracovaných obvykle podle jednotné osnovy vytvoené v rámci pracovních skupin) specialisté na regionální úty zabývají se aplikací rzných metod odhad regionálního hrubého domácího produktu a dalších ukazatel Demografickou statistikou se na SÚ zabývají: oddlení demografické statistiky (zpracování hlášení o demografických událostech a zpracování údaj centrální evidence obyvatel, produkce dat bžné demografické statistiky, analýzy populaního vývoje, demografické projekce) referát regionální demografie v Olomouci (funguje zhruba od roku 003, zabývá se pedevším pípravou tabulkových výstup asových ad za rzné územní celky (od úrovn LAU1 ale i ad-hoc mikroregiony), územními pepoty, ale i demografickými analýzami, vede severomoravsko poboku eské demografické spolenosti, která je živou diskusní platformou pro aktuální otázky populaního vývoje samostatné oddlení specifických specifických statistik obyvatelstva (gender statistika, cizinci) oddlení sítání lidu (píprava SLDB 011, metodika, organizace, ale i diseminace) Základem zpracování demografických údaj zstává v SÚ zpracování statistik jednotlivých hlášení o demografických událostech (narození, úmrtí, satek, rozvod). SÚ erpá rovnž z registru o potratech ministerstva zdravotnictví. Významnou zmnou byl v roce 005 nový zpsob zpracování migrace. Zaaly se využívat data z centrální evidence obyvatel ministerstva vnitra (vnitní a v souasné dob i zahraniní sthování), bylo zrušeno hlášení o sthování. Data demografické statistiky významn doplují populaní censy, vláda R již schválila návrh zákona o SLDB 011, nyní se jím bude zabývat Parlament. Sítání by mlo probhnout Metodickou otázkou zatím v ešení zstává vztah standardní bilance stavu obyvatel a výsledk SLDB. eská demografická data za jednotlivá území jsou pepoítávána podle aktuálního územního zalenní obcí do vyšších územních celk. Sice již klesá poet zmn v potu obcí (rozdlování a sluování), ale významn se mní píslušnost obcí do okres v souvislosti se zmnou hranic okres i kraj. V R stál ješt není schválen zákon o územním uspoádání zem, mní se zejména struktura územních celk na úrovni LAU 1. Pepoty demografických údaj vycházejí z pesné evidence vazeb územní píslušnosti tedy mezi íselníkem obcí a dalšími íselníky rzných územních typ. Do databází jsou ukládány informace jak poplatné územní píslušnosti v referenním období, tak zptné pepoty starších údaj s respektováním aktuální územní píslušnosti.
29 - 7 - Regionální údaje vetn demografických se snažíme prezentovat na webu, v uživatelsky pátelském prostedí. Cílem je, aby uživatel mohl výbrem parametr získat co nejrychleji data za požadované území. Snažíme se k tomu využívat i prostedk GIS technologií. Zatím nabízíme jen generování peddefinovaných tabulek v podob jednoduchých kartogram. V jednotlivých publikacích však využíváme funkcionality produkt firmy ESRI (ArcMap) a vyrábíme pestré mapy. Pipravuje se projekt, který by ml pomoci dokonit vybudování GIS databáze v úad a jejím propojení s budovaným centrálním datovým skladem. Rovnž je naším zámrem využít zkušeností vysokých škol, testujeme nap. využívání mapových služeb (MASHUPS) pi prezentaci dat demografické statistiky. 3. Regionální publikace s demografickými údaji Standardní publikace regionální statistiky obsahující nejdležitjší demografické údaje za kraje a nižší územní celky (do úrovn obcí, v Praze 57 mstských ástí). Jejich výhodou je možnost prezentace reprezentativního vzorku demografických dat v kontextu ostatních socioekonomických charakteristik zemních celk. V ústedí jsou každoron vydávány publikace: Okresy, Kraje, Malý lexikon obcí R. Jednotlivá pracovišt SÚ v regionech prezentují za svá území ve stejné periodicit demografické údaje v krajských roenkách, v menším rozsahu ve tvrtletní periodicit v bulletinech (jejich souástí bývají 1-x ron i adhoc analýzy, které se asto zaobírají aktuálním demografickými problémy-migrace obyvatel, bytová výstavba). K podrobnjším regionálním analýzám jsou ureny specializované demografické publikace. Základem je tzv. pramenné dílo Demografická roenka R. Jeho výhodou je dlouhodobá tradice, možnost komparace základních regionáln lenných (oblasti, kraje, okresy, velikostní skupiny obcí, od r. 006 rozšíeny o pohled msta-venkov) demografických údaj s celorepublikovými tendencemi, v územním lenní jsou prezentovány i specializované analytické výstupy (podrobné úmrtnostní tabulky). Specializované pracovišt SÚ v Olomouci pipravuje každoron obdobná pramenná díla zamené na kraje, správní obvody obcí s rozšíenou psobností a msta (s desetiletými asovými adami, všechny údaje jsou pi územním zmnách zptn pepoítány). Uživateli se zde otevírá možnost využití i analytitjších ukazatel populaního vývoje (prmrný vk pi satku, rozvodu, podíl pedmanželských koncepcí, úhrnná potratovost, nadje dožití ve vybraných letech aj.). Vedle toho se vnuje i rekonstrukci historických asových ad (Pirozená mna obyvatelstva v zemích Koruny eské v letech 1. svtové války 1914 až 1918, Zemelí podle podrobného seznamu píin smrti, pohlaví a vku v R (1919 až 006). Samostatnou kapitolu pedstavují výstupy ze SLDB (jejich popis je nad rámec tohoto píspvku, pro pipravovaný cenzus v roce 011 se poítá se zachování jejich podrobnosti v intencích roku 001, podstatn by však mly být rozšíeny formy diseminace veejná databáze, specializované mapové výstupy). Pro regionální statistiku bylo povzbuzujícím poinem zpracování Historického lexikonu obcí R ( ), jehož význam je podtržen faktem, že byl zpracován v dob probíhající reformy veejné správy. Zmny v územní struktue státu z toho plynoucí (mj. vznik nových územn-správních celk-05 obvod obcí s rozšíenou psobností) byly do pipravovaného lexikonu promítnuty (lexikon je navíc vydáván každý rok v elektronické podob s pepotem cenzálních dat na aktuální územní strukturu). Historický lexikon byl zpracován v nkterých krajských mutacích, obohacený i detailnjší místopisné zajímavosti (dobové fotografie obcí), nap. za Liberecký kraj. SÚ reagoval na legislativní zmny (umožnily vybraným obcím navrácení historického statutu msta a mstytse) a pipravil rozsáhlou datovou publikaci za tato území (v. souasných mst)
30 - 8 - obsahující vedle dlouhodobé ady potu obyvatel také aktuální sociodemografické údaje z mstské a obecní statistiky, které mají vztah k stediskovosti obcí. 4. Webová prezentace demografických dat Demografické údaje na webu SÚ lze nalézt v nkolika sekcích, napíklad: ve specializované sekci Nejžádanjší pod odkazem Obyvatelstvo zde mžete nalézt nejaktuálnjší údaje (tzv.rychlé informace), pramenné dílo, specializované aplikace i odkazy (databáze demografických údaj za obce R vetn územních pesun), asové ady, zajímavé grafy a kartogramy, ale i teba atraktivní animované grafy (nap. s vývojem obyvatel v jednotlivých krajích do roku 006 viz Obrázek 1), ale také napíklad píspvky z demografické konference Obrázek 1 Animovaný graf Populaní vývoj v hlavním mst Praha v sekci Data v publikacích po odkazem Obyvatelstvo, volby souhrnný pehled všech vydaných publikací v elektronické podob, s možností zobrazení a ukládání jednotlivých tabulek v XLS nebo PDF formátu, pehledem metodik apod. Je zde k dispozici i rozsáhlý archiv. v sekci Regiony, msta, obce pod odkazem Stránky krajských pracoviš - každý kraj zde prezentuje publikace (viz nap. Obrázek ), asové ady, animované grafy, ale teba i krátké demografické analýzy rychlé informace. v sekci Databáze, registry, IO pod odkazem Veejná databáze s odkazem na specializovanou zobrazovací aplikaci umožuje pístup do centrální veejné databáze vetn kapitoly Demografie, uživatelé mohou uživatelsky pívtivou formou vybírat i požadované parametry pro jednotlivé peddefinované tabulky a volit alternativní zpsoby zobrazení Tabulka-Graf-Mapa. Jsou navíc okamžit dostupné definice ukazatel a další metainformace vztažené ke každému údaji (viz Obrázek 3).
31 - 9 - Obrázek Ukázka z analytické publikace publikace krajského pracovišt v Ostrav Obrázek 3 Ukázka zobrazení mapy ve veejné databázi SÚ 5. Regionální analýzy v demografii Regionální analýzy se v oblasti demografie mohou opít o tradin širokou datovou základnu (roní bilance demografických událostí, populaní cenzus). Mezi uživateli statistických údaj patí takové produkty k nejžádanjším. Každoroní rozbor populaního vývoje je možno nalézt ve zpráv Vývoj obyvatelstva R, která má od roku 00 i kapitolu vnující se analýze populaního vývoje v krajích. Pedevším pracovišt v Olomouci pipravuje tematicky zamené ad-hoc analýzy, vtšina z nich pojednává o zvoleném demografickém problému i v regionální dimenzi, by jejich hlavní zamení je pevážn republikové (Sebevraždy, Vysokoškoláci v demografickém pohledu, Vnitní sthování v R). Ke speciálním výstupm mžeme zaadit Populaní projekce. K jejich zpracování je teba kvalifikovaného posouzení tendencí všech složek populaního vývoje, jde tedy o práci analytického zamení. Poslední takový odhad zpracoval SÚ v roce 003 (Populaní prognóza R do r. 050) Byla to již pátá projekce zpracovaná SÚ po vzniku samostatné R a zárove první, která obsahovala výhled populaního vývoje pro jednotlivé kraje (zpracovaný bez vlivu migrace). Na rok 009 pipravuje SÚ jejich aktualizaci.
32 Regionální analýzy s demografickou problematikou zpracovávají také pracovníci informaních služeb SÚ v jednotlivých krajích. Každý rok je pro daný kraj zpracovávána 1 velká analýza. Její jednotnou metodologickou pípravu má na starosti pracovní skupina složená z regionálních analytik (z ústedí i jednotlivých krajských pracoviš). V letech byly touto formou zpracovány 3 významné analýzy, ve kterých se mj. uplatnilo víceaspektní hodnocení demografických ukazatel: Demografický, sociální a ekonomický vývoj kraje v letech Vývoj lidských zdroj v kraji v letech Regionální rozdíly v demografickém, sociálním a ekonomickém vývoji kraje v letech V souasnosti probíhající v jednotlivých krajských pracovištích SÚ práce na dvou významných analýzách: vývoje venkova a bytová výstavba, v obou z nich se ve výrazné míe uplatují aktuální demografické otázky (nap. suburbanizaní tendence, vzestup porodnosti). 6. Závr Píspvkem jsme se pokusili ilustrovat souasnou podobu prezentace demografických dat v eském statistickém úad a zachytit i vazbu na regionální statistiku. Její klíový význam spoívá v poskytování objektivních a vysoce kvalitních údaj, které by mly nejen poskytnout souhrnný obrázek o demografickém vývoji v republice a jeho ástech, ale také pomoci pi formování strategií udržitelného rozvoje se zajištním harmonického rozvoje v jednotlivých regionech. 7. Literatúra [1]SÚ 005. Demografický, sociální a ekonomický vývoj kraje v letech 000 až 004 (mutace za jednotlivé kraje). [] SÚ 006. Cizinci v regionech R (celorepubliková publikace), kap E (Analýza regionálních rozdíl), str [3] SÚ 007. Regionální rozdíly v demografickém, sociálním a ekonomickém vývoji R v letech 000 až 005 (celorepubliková publikace), 90 s. [4] SÚ 007. Analýza regionálních rozdíl v R. (celorepubliková publikace), 8 s. [5]KUPROVÁ, L. KAMENICKÝ, J Multikriteriální hodnocení postavení kraj v rámci R v letech In: STATISTIKA. 006,. 4. Praha : eský statistický úad, 006, s Adresa autor: Eduard Durník, Ing. eský statistický úad Na padesátém 81, Praha 10, [email protected] Jií Kamenický, Bc. eský statistický úad Na padesátém 81, Praha 10, [email protected]
33 Analýza rstu stední délky života v R metodou klouzavé lineární regrese The analysis of the growths of the life expectation in the Czech Republic by the method of moving linear regression Tomáš Fiala Abstract: The paper contains the analysis of the development of the life expectancy in the Czech Republic after the World War II by the method of moving linear regression computed for 10 years period. The initial rapid growth of the life expectancy was followed by the stagnation or even drop in the sixties and seventies. Relatively rapid growth in the nineties was slowed down at present time. The present annual average increment of life expectancy (measured by regression coefficient) is about 0.7 years for males and 0.0 years for females. In 050 the estimated life expectancy for males is about 85 years, for females about 88 years. Key words: mortality, life expectation, linear regression. Klíová slova: úmrtnost, stední délka života, lineární regrese. 1. Úvod Jednou z nejastji používaných souhrnných charakteristik úmrtnosti je stední délka života novorozence. Její hodnoty v R po druhé svtové válce mly rostoucí trend perušený obdobím stagnace i dokonce mírného poklesu. Jedná se o trend po ástech lineární, proto byl vývoj stední délky života modelován lineární regresní funkcí, ovšem pouze za 10letá období vzájemn se pekrývající. Byl analyzován vývoj stední délky života v letech , první desetiletá regrese byla proto vypotena za období , druhá za období , atd., poslední za období Jedná se o uritou analogii výpotu klouzavých prmr, používám proto pojmu klouzavá lineární regrese. Parametr u lineárního lenu regresní funkce (regresní koeficient) lze pak interpretovat jako prmrný roní nárst stední délky života v píslušném desetiletém období, za které byla regrese vypotena. Na základ regresních model byl rovnž proveden extrapolovaný odhad stední délky života v roce 050. Analýza byla provádna zvláš pro muže a pro ženy.. Vývoj stední délky života Empirické hodnoty stední délky života muž a žen v R od roku 1947 zobrazuje Graf 1. Základní trend vývoje je stejný pro ob pohlaví: pomrn prudký rst do roku 1955 a jeho postupné zpomalení do roku V 60. letech pozorujeme u žen stagnaci, u muž dokonce pokles stední délky života. Teprve v 70. letech zaíná opt rst, ovšem pomrn mírný trvající do konce 80. let. Od roku 1991 se rst stední délky života u obou pohlaví výrazn zvýšil a trvá do souasné doby. 3. Hodnoty regresních koeficient Podívejme se nyní na vývoj regresních koeficient klouzavé lineární regrese poítané vždy pro 10leté období (viz Graf ). Letopoet na vodorovné ose v grafech oznauje vždy konec píslušného období. Nap. hodnota pro rok 000 znamená hodnotu regresního koeficientu lineární regrese vypotené pro období atd. Hodnoty regresních koeficient se bhem sledovaného období pomrn výrazn mnily. Vysoké poátení hodnoty pomrn rychle klesly. Zatímco za období byla hodnota regresního koeficientu pro muže i pro ženy blízká 0,8, za období již byla pouze zhruba poloviní.
34 Zdroj: Vlastní graf na základ dat CSÚ Graf 1: Vývoj stední délky života muž a žen v R rok ženy muži ,8 0,7 0,6 0,5 0,4 0,3 0, 0,1 muži ženy 0,8 0,7 0,6 0,5 0,4 0,3 0, 0,1 0,0 0, , ,1-0, poslední rok desetiletého období výpotu regrese -0, Zdroj: Vlastní výpoet Graf : Hodnoty regresních koeficient klouzavé lineární regrese pro desetiletá období
35 Poínaje obdobím a kone obdobím jsou hodnoty regresního koeficientu pro muže záporné, což svdí o poklesu stední délky života. Pro ženy se v uvedených obdobích pohybují regresní koeficienty kolem nulových hodnot, stední délky života tedy stagnovala. Poínaje obdobím jsou hodnoty regresních koeficient pro muže i pro ženy trvale kladné, což svdí o obnovení trendu rstu stední délky života. Tempo rstu však kolísá. Zatímco za období dosahují regresní koeficienty hodnot tém 0,15, za období jsou jen o málo vyšší než 0. Teprve pak pozorujeme dlouhodobé zvyšování tempa rstu stední délky života vrcholící v období , kdy je hodnota regresního koeficientu pro muže vyšší než 0,4 a pro ženy vyšší než 0,3. V posledních letech došlo k uritému zpomalení rstu stední délky života. Hodnota regresního koeficient pro muže za období inila 0,7, pro ženy pak 0,0. Poznamenejme ješt, že v minulých obdobích byl regresní koeficient pro ženy vyšší než pro muže (nebo zhruba stejný), stední délky života žen rostla rychleji než u muž nebo alespo stejn rychle. Teprve poínaje obdobím dochází ke zmn; stední délka života muž roste rychleji než stední délka života žen. 4. Hodnoty koeficient korelace Jednoduchou mírou tsnosti lineární závislosti je koeficient korelace. Jeho hodnoty zachycuje Graf 3. Vidíme, že zatímco v minulosti mže být použití lineární regrese ponkud diskutabilní, poínaje obdobím zhruba je lineární závislost pomrn tsná (koeficient korelace je vyšší než 0,8, pozdji dokonce vyšší než 0,9). 1,0 0,9 0,8 0,7 0,6 0,5 0,4 0,3 0, 0,1 0,0-0,1-0, -0,3-0,4-0,5-0,6-0,7-0,8-0,9-1,0 ženy , -0,3-0,4-0,5-0,6-0,7 muži -0,8-0,9-1,0 poslední rok desetiletého období výpotu regrese Zdroj: Vlastní výpoet Graf 3: Hodnoty koeficient korelace pro desetiletá období 5. Extrapolovaná stední délka života v roce 050 Na základ regresního modelu lze provádt extrapolaci budoucího vývoje. Následující graf zachycuje hodnoty stední délky života v roce 050 vypotené extrapolací na základ re- 1,0 0,9 0,8 0,7 0,6 0,5 0,4 0,3 0, 0,1 0,0-0,1
36 gresních model vycházejících z jednotlivých desetiletých období. Byly použity pouze modely poínaje obdobím , kdy regresní model opt pedpokládal rst stední délky života. Pokud by i v tomto tisíciletí pokraoval rst stední délky života stejným tempem jako v období , mohla by být v roce 050 stední délky života muž i žen vyšší než 90 let. Pi zachování souasného pomalejšího tempa rstu však lze pedpokládat v roce 050 stední délku života muž pouze kolem 85 let, u žen zhruba o 3 roky vyšší ženy muži poslední rok desetiletého období výpotu regrese Zdroj: Vlastní výpoet Graf 4: Hodnoty extrapolované stední délky života v roce 050 na základ klouzavé lineární regrese pro desetiletá období 6. Závr Stední délka života v R po druhé svtové válce do roku 1960 pomrn rychle rostla. Pak však následuje dvacetileté období stagnace, u muž dokonce mírného poklesu stední délky života. K výraznému rstu stední délky života dochází od druhé poloviny 80. let, pedevším pak po roce Míme-li nárst stední délky života regresním koeficientem poítaným za 10letá období, k nejvyššímu nárstu v poslední dob došlo v období (roní nárst zhruba 0,4 let u muž a 0,3 roku u žen). Za poslední desetileté období ( ) byl prmrný roní nárst zhruba 0,7 let u muž a 0, roku u žen. Pi zachování tohoto tempa rstu by se stední délka života muž v roce 050 pohybovala kolem 85 let, stední délka života žen kolem 88 let. 7. Literatura [1]FIALA, T Prezová a kohortní analýza úmrtnosti v R pomocí životních potenciál. Bratislava In: Forum Statisticum Slovacum. Bratislava : Slovenská štatistická a demografická spolonos, 006, s ISSN []KOSCHIN, F Základní demografické trendy v eské republice a v Evrop. Praha In: BEST. [online] Berlín : European Academy of the Urban Environment, 006, s URL: 65
37 [3]LANGHAMROVÁ, J. FIALA, T Stední délka života zemí EU. Praha : SÚ, s. ISSN Tabulkový soubor asopis Demografie, ro. 49,. 3. Adresa autora: Tomáš Fiala, RNDr., CSc. katedra demografie fakulta informatiky a statistiky VŠE Praha nám. W. Churchilla Praha 3 eská republika [email protected] lánek vznikl v rámci dlouhodobého výzkumného projektu D0606 Reprodukce lidského kapitálu financovaného MŠMT v rámci Národního programu výzkumu II.
38 Aplikácia metódy QFD v hutníckej výrobe Applikation of method QFD in metallurgical production Zuzana Hajduová, Cyril Závadský, Erika Liptáková Abstract: The presented work paper deals with the systems of quality control, specialy with systems and methods of measurements of quality costs. An implementation of such a measurement in practice is presented. The QFD method uses data and rigorous statistical analysis to identify defects in a process or a product. In this paper we present basic informations about this method. Key words: quality, statistical method, QFD, copper wire. Kúové slová: kvalita, štatistická metóda, QFD, medený drôt. 1. Úvod Zlá kvalita vyvoláva celý rad ekonomických problémov u producentov i užívateov. Naopak, špiková schopnos uspokojova požiadavky zákazníkov prináša všetkým úastníkom trhu znané efekty. Preto sa vo fungujúcich systémoch kvality musí rozvíja aj prvok, ktorý sa najastejšie oznauje ako zlepšenie kvality. Štatistické metódy tvoria jeho neoddelitenú súas. Cieom našej práce bolo navrhnú postupy pre vykonávanie meraní, monitorovania a zlepšovania procesov zabezpeujúcich výrobu medeného drôtu v konkrétnej hutníckej výrobe. Bolo poukázané na opodstatnené využívanie metódy QFD (Quality Function Deployment) na identifikáciu faktorov, ktoré majú vplyv na kvalitu vyrábaného medeného drôtu.. Charakteristika metódy QFD QFD je metódou formálne založenou na systéme matíc, ktorý umožuje aktuálne reagova na priania zákazníka a rešpektova ich vo všetkých fázach tvorby výrobku. Dôvody použitia QFD: Sústredenie úsilia na zaiatok procesu tvorby výrobku znižuje poet konštrukných a technologických zmien. Skracuje dobu vývoja, o znamená, že zákazník dostane výrobok, ktorý práve požaduje a prostredníctvom takto získanej flexibility sa zrýchuje reakná doba. Zlepšuje komunikáciu vo vývojovom štádiu a špecifikuje požiadavky do výrobného procesu, o má za následok menej problémov pri rozbehu výroby. Znižuje náklady na výrobu nových výrobkov. Redukuje problémy v distribunej sieti. Orientácia na zákazníka zabezpeí predajnos výrobkov a stálu pozíciu na trhu. Metóda je charakterizovaná systematickým poznávaním zákazníckych prianí a ich transformáciou do technických špecifikácií výrobku, riadením k stanoveným cieom. 1. krok: Identifikova potreby zákazníkov Potreby zákazníkov sú ich požiadavky na produkty alebo služby vyjadrené slovami a termínmi, ktoré oni sami používajú. Dôležitú úlohu v tejto etape zohrávajú marketingoví pracovníci. Jednotlivé oblasti definovaných potrieb (obsluha, ekonomická stránka) sa lenia na ich hlavné komponenty (napríklad v obsluhe je to individuálny prístup, vasnos, jednoduchos, vhodné správanie). Tie sa alej lenia na jednoduchšie konkrétne zvládnutené prvky (v správaní je to priateské vystupovanie, nijaké akanie v radoch, at.).
39 krok: Zostavi zoznam charakteristík procesu (produktu) zodpovedajúcich definovaným potrebám Charakteristiky produktu i procesu predstavujú technické parametre, ktoré sú vyvíjané za úelom o najlepšieho uspokojovania potrieb. V domeku kvality sa umiestujú pod striešku. Jednotlivé charakteristiky alebo interné procesy asto navzájom súvisia. Tieto vzahy (korelácie) sa znázorujú v asti predstavujúcej striešku pomocou symbolov napríklad: krúžok s bodkou uprostred znázoruje vemi silný vzah, O prázdny krúžok predstavuje silný vzah, trojuholník znamená slabú vzájomnú súvislos. 3. krok: Zostroji maticu vzahov medzi atribútmi zákazníka a zodpovedajúcimi charakteristikami produktu V tretej fáze budujeme základnú maticu (pod strieškou ). Exaktne vypoítavame, alebo poda možnosti o najviac objektívne odhadujeme vzahy medzi atribútmi zákazníka (potrebami) a zodpovedajúcimi charakteristikami produktu alebo služby. Na zaznaenie vzahu sa spravidla používajú tie isté symboly, ktoré boli definované v. kroku. 4. krok: Zhodnoti situáciu na trhu V tejto etape sa každá požiadavka zákazníka ohodnotí poda jeho vyjadrenia známkou (prioritou) od 1 (menej významné) po 5 (extrémne významné). V asti matice pre hodnotenie konkurencie sa zvýraznia silné a slabé stránky konkurencie v dosahovaní uspokojenia daných potrieb zákazníkov. Toto hodnotenie napomáha pri rozhodovaní o prioritách pre nové produkty, respektíve uruje stratégiu rozvoja kvality. Tam, kde napríklad zákazník požaduje uspokojenie na úrovni 5 a pôsobenie konkurencie je len na úrovni 1 alebo, existuje spravidla reálna možnos uplatnenia sa na tomto trhu. 5. krok: Zhodnoti zodpovedajúce charakteristiky procesov (produktov) konkurencie a stanovi ciele V tomto bode zohráva dôležitú úlohu prieskum trhu. V dolnej asti domeka kvality sa zaznaujú miery (od 1 po 5), akými jednotlivé konkrétne charakteristiky procesu (produktu) konkurencie uspokojujú zákazníka. Ak konkurenný produkt alebo služba uspokojuje potreby a požiadavky zákazníkov na dobrej úrovni (matica vpravo), ale hodnotenie charakteristík procesov (produktov) nezodpovedá vyjadreniu tohto uspokojenia, bu hodnotenie príslušných charakteristík nie je pravdivé, alebo existuje nieo iné, o ovplyvuje vnímanie zákazníka (nepostrehnutá dôležitá potreba zákazníka). 6.krok: Vytipova zodpovedajúce charakteristiky pre následný rozvoj Podstatu tvorí identifikácia charakteristík, ktoré predstavujú významnú súvislos s definovanými potrebami zákazníkov, alebo je v danej oblasti chabé uplatnenie konkurencie. Vybrané charakteristiky sa stanú cieom následných opatrení na zlepšenie uspokojenia zákazníkov. 3. Implementácia metódy QFD Výhodou metódy QFD (Quality Function Deployment), ktorej teoretický základ už bol opísaný, je to, že v sebe efektívnym spôsobom zaha niekoko dôležitých funkcií potrebných na definovanie hlavných smerov a problémov zlepšovania. Ide o: formuláciu najdôležitejších požiadaviek zákazníka, ich hierarchizáciu, teda urenie významu pre zákazníka,
40 vyhodnotenie konkurencieschopnosti z pohadu vnímania zákazníkom, vyhodnotenie konkurencieschopnosti z pohadu dosahovania konkrétnych technických parametrov, transformáciu požiadaviek zákazníka do technických parametrov výroby, urenie kritických parametrov výroby na základe odhadu tesnosti väzby. Jedným z najdôležitejších atribútov kvality medeného drôtu je jeho odolnos proti pretrhnutiu. Problém spoíva v tom, že opätovne ahaný drôt sa pretrhne skôr, než výrobcovia dosiahnu potrebný rozmer( od = 0, mm až po = 1,85 mm). Veký vplyv na to majú materiálové vlastnosti (kompaktnos materiálu), obsah kyslíka v medi a iné dôležité faktory. Úlohou je dosiahnu stav, aby sa drôty s požadovanými rozmermi nepretrhli pri výrobe a mali požadované vlastnosti. Aby sme splnili tento cie, musíme si zvoli vhodné kvalitatívne znaky a kritéria, poda ktorých vieme zhodnoti, i sme splnili vytýený cie alebo nie. Za hlavnú odozvu sme si zvolili pretrhnutie drôtu, atribútovú náhodnú veliinu, ktorá je meratená u zákazníka. Problém s takto definovanou odozvou spoíva v relatívne komplikovanom spôsobe identifikácie drôtu u zákazníka a vekým asovým oneskorením. Podklady pre vykonanie metódy QFD boli získané na základe reklamácií, ako aj ohlasov zákazníkov danej hutníckej firmy. alším zdrojom informácií bol brainstorming, vykonaný so skupinou odborníkov, bývalých zamestnancov prevádzky Cu drôt. Na základe týchto informácií boli vyhodnotené vstupné charakteristiky metódy QFD. Požiadavky zákazníkov na vstupe boli rozdelené do štyroch základných astí kvalita, ekonomika, servis a ekológia. Kvalita Ekonomika Servis Ekológia Chemická istota medi Nízka cena Vasnos dodávok Ekologická nezávadnos Kompaktnos materiálu Flexibilita pri uzatváraní zmlúv Flexibilita dodávok Nízka prašnos pri spracovaní Stabilný priemer drôtu Dlhšia doba splatnosti faktúr Kvalitné balenie Ekológia obalov (cievky) Kvalitný povrch Povrchová istota drôtu Tabuka 1: Požiadavky zákazníkov Formulár, na základe ktorého je možné identifikova priebeh vypracovania analýzy QFD, je na Obr. 1.
41 Obrázok 1: QFD pre skúmanú hutnícku výrobu Z pohadu vnímania zákazníkom najväší význam mali požiadavky na chemickú istotu medi, odolnos voi prietrhom a požiadavka nízkej prašnosti pri ahaní drôtu na tandemových ahakách u zákazníka. Pri hodnotení konkurencieschopnosti sa práve posledne uvádzaná požiadavka javí ako konkurenná nevýhoda sledovanej spolonosti Konkurenné podniky totiž vplyvom inej technológie výroby z pohadu zákazníka dosahovali podstatne menšie percento prašnosti. Jednotlivé súvzažnosti, na základe ktorých možno transformova požiadavky zákazníka do technických parametrov, sú zaznamenané
42 v štruktúre matice QFD. Vo vypracovanom formulári QFD (Obrázok 1) sú tiež uvedené íselné hodnoty charakterizujúce význam jednotlivých technických parametrov, pri ktorých ako hranicu kritinosti sme uvažovali hodnotu 100 bodov. Na základe takéhoto kritéria nám z metódy QFD ako kritické faktory výroby jednoznane vyšli dva parametre percento prietrhov u zákazníka s bodovou hodnotou 115 a obsah oxidov s bodovou hodnotou 163. Práve pomocou skúmanej metódy sme došli k záveru, že týmto spomínaným dvom parametrom, ktoré tvoria jednoznane základné kritické prvky prípadného zlepšovania, musia zamestnanci podniku venova zvýšenú pozornos, ak chcú by na trhu firmou, ktorá prosperuje a je konkurencie schopná. 4. Záver Využívanie štatistických metód vo výrobe už v súasnosti nie je niím výnimoným. Tento príspevok v skrátenej forme poukázal na možnos, opodstatnenos, ale aj vykonatenos implementácie sofistikovaných štatistických metód ako je QFD v rámci systému zlepšovania v praktických podmienkach výrobného procesu. Okrem teoretického zdôvodnenia použitia tejto metódy, bola prezentovaná aplikácia QFD na konkrétnych údajoch získaných z praxe. Prostredníctvom nej boli urené kritické aspekty merania výkonnosti a efektívnosti jednotlivých podprocesov. 5. Literatúra [1] TKÁ, M.: Matematická štatistika a teória pravdepodobnosti. In: PROJEKT TEMPUS PHARE IB_JEP , SjF TU Košice, ISBN X. [] WENDLING, R., LESEUX, B.: Ekonomické aspekty prevencie.in: Projekt TEMPUS- PHARE IB_JEP_ , SjF, Technická univerzita v Košiciach, , ISBN [3] PETER S. PANDE, ROBERT P. NEUMAN, ROLAND R. CAVANAGH: The Six Sigma Way: How GE, Motorola, and other companies are honing their perfromance. New York 000. [4] TIŽOVÁ, M. - TURISOVÁ, R. - HAJDUOVÁ, Z.: Environmentálna a ekonomická analýza nákladov a úžitkov. In: Trendy v systémoch riadenia podnikov: 7. medzinárodná vedecká konferencia, Herany, november 004: Zborník príspevkov. Košice: TU, s.. ISBN [5] MIXTAJ. L.:Economics of quality i an aviation company. In ACTA AVIONICA 007, ro. XI,.13,s , ISSN [6] TKÁ, M.: Štatistické riadenie kvality v praxi. In: EKONOMICKÁ UNIVERZITA BRATISLAVA, Ekonóm, Bratislava, 001, s , ISBN X. Adresa autora (-ov): Zuzana Hajduová, RNDr., PhD. Tajovského Košice [email protected] Cyril Závadský, Ing. Tajovského Košice [email protected] Erika Liptáková, RNDr. Tajovského Košice [email protected]
43 Asymptotické vlastnosti odhad s minimální Kolmogorovskou vzdáleností Asymptotic properties of Minimum Kolmogorov distance density estimators Bc. Jitka Hanousková a Ing. Václav Ks, PhD. ~ Abstrakt: This paper focuses on the minimum Kolmogorov distance density estimate f n of probability density f on the real line. The rate of consistency for n is known if the degree of variations is finite. The rate of consistency is studied under more general conditions. The generalization of degree of variation - the partial degree of variation is defined for density g of nonparametric family D containing the unknown density f. If the partial degree is finite and some aditional assumptions are fulfilled then the Kolmogorov distance estimate is 1/ n L1 L1 consistent of the order of in -norm and also in the expected -norm. The examples confront this method with the method based on Vapnik-Chervonenkis dimension. Key words: Kolmogorov estimators, degree of variation, Vapnik-Chervonenkis dimension Klíová slova: Kolmogorvské odhady, stupe variace, Vapnik-Chervonenkisova dimenze 1. Úvod Zaveme znaení, které budeme v dalším textu používat. Nech je finitní míra na (R,B), kde B je borelovská algebru na R. Bu F (R) množina všech distribuních funkcí na (R,B). Ozname F podmnožinu všech rozdlení absolutn spojitých vzhledem k míe na (R,B). Ozname D množinu v Banachov prostoru L ( R,d ) obsahující hustoty 1 odpovídající distribuním funkcím z F,D její libovolnou neprázdnou podmnožinu a F podmnožinu F, obsahující distribuní funkce odpovídající hustotám z podmnožiny D. V dalším textu bude F ~ ~ n oznaovat distribuní funkce odpovídající odhadu hustoty f. Dále bute X,.., stejn a nezávisle rozdlená pozorování, symbolem F budeme 1 X n n oznaovat empirickou distribuní funkci na založenou na ( X 1,.., X n ) a symbolem (A n ) budeme oznaovat empirickou distribuci založenou na X,.., X ) ( 1 n n n 1 1 Fn ( x) = I{ X x}, n( A) = I{ X A}, A R, n j n j j=1 kde I je indikátor jevu (, x] a I je indikátor jevu X j A. { X j x} X j { X j A} ~ Definice 1. ekneme, že odhad f n hustoty f D je Kolmogorovským odhadem práv tehdy, když odpovídající distribuní funkce F ~ n F vyhovuje podmínce: ~ K F n, F ) = inf K( F, F ) ( n n F kde K je Kolmogorovská vzdálenost na F (R) definována níže. Každá metrická vzdálenost D na F (R) definuje psedometriku D na D tímto zpsobem: D( f, g) = D( F, G), kde F, G F jsou distribuní funkce odpovídající hustotám f, g D j=1 s.j., n
44 - 4 - ~ Definice. íkáme, že odhad f n hustoty f D je konzistentní v dané D vzdálenosti, resp. ~ ~ v její stední hodnot, práv když (, f ) 0 skoro jist, resp. když E ( f, f ) 0. íkáme, že odhad f n D f n ~ je konzistentní ádu rn 0 ve vzdálenosti D, resp. v její stední ~ ~ hodnot, práv tehdy, když f, f ) = O ( r ), resp. když E f, f ) = O( r ). D( n p n D D( n n Nebudeme se zabývat obecnými vzdálenostmi D a D, ale pouze Kolmogorovskou vzdáleností na D ( K ) a vzdáleností v totální variaci na D ) definovanými jako: kde ( f, g) = K( F, G) = sup F( x) G( x), ( f, g) = V ( F, G) = f g d, K xr F, G F a f, g jsou jim odpovídající hustoty.. Konzistence v L 1 -norm Definice 3. ekneme, že K dominuje posloupnost f f 1, f, D konvergence f n f v V V na D (ozn. ( V ) práv, když pro každou, K pro n implikuje konvergenci f n f v V. A ekneme, že K stejnomrn dominuje V lokáln vzhledem k K na D u (ozn. K V / K ) práv, když pro každou hustotu g D existuje c > 0 a Kolmogorovské okolí hustoty g, BK ( g) D takové, že ( f, g) c ( f, g) pro všechny f B (g). K Vta 1. Nech na D, potom každý Kolmogorovský odhad hustoty z D je konzistentní K V u v L - norm. Pokud / na D, potom každý Kolmogorovský odhad hustoty z D je 1 K V 1 1/ konzistentní ádu n v L norm i stední hodnot K V L 1 K V normy. Je známo, že každá dvojice hustot f, g D definuje finitní míru s hustotou d = f g. Tato míra je rozdílem dvou finitních mr na (R,B), horní variace a dolní d d variace s hustotami = ( f g) = max{0, f g} a s d d = ( f g) = max{0, g f }. d Definice 4. ekneme, že A B separuje a, práv když platí bu ( A ) = ( R) a ( R A ) = ( R), a nebo ( R A ) = ( R) a ( A ) = ( R). Definice 5. Bute f, g D. Potom stupe variace DV ( f, g) [0, ] je definován takto: DV ( f, g) = 0, když A separuje a a (A) = 0. Jinak DV ( f, g) = infm N : A m j1 Jj, A separuje, kde J, J m jsou neprázdné intervaly v R. Je-li minimalizovaná množina prázdná, tj. neexistuje-li žádné m s požadovanými vlastnostmi, pokládáme. R n, DV ( f, g) = Definice 6. Pro danou f D D a > 0 definujeme lokální stupe variace LDV ( f ) K
45 hustoty f vzhledem ke Kolmogorovské vzdálenosti v D vztahem LDV ( f ) = sup{ DV ( f, g) : g B, ( f ) K D}, kde B K, ( f ) je Kolmogorovská koule v D o polomru se stedem v f. Dále stupnm variace DV (D) rodiny D D nazveme: DV (D) = sup{ DV ( f, g) : f, g D}. Vta. Bu D D, nech pro každou hustotu LDV ( f ) <. Potom u ( / ) na D. K V K f D existuje > 0 tak, že K stejnomrn dominuje V lokáln vzhledem k 3. Konzistence v L 1 -norm za obecnjších pedpoklad Nyní zobecníme teorii ze Sekce a ukážeme, že i Kolmogorovské odhady, pro které LDV ( f ) nemusí být konený a které splují jisté dodatené pedpoklady, jsou konzistentní v -norm a její stední hodnot. Za tímto úelem zavedeme nové typy dominancí. L 1 Definice 7. ekneme, že K asymptoticky dominuje V ádu / ( a ) práv tehdy, když ( na D (ozname 0) K V K n an K lokáln s ohledem na f D ) ( B K ( f ) ) takové, že ( ( fn) 1B K ( f ), fn f v K ) ( c>0) tak, že K ( fn, f ) cv ( fn, f ) an, kde B K ( f ) je Kolmogorovské okolí hustoty f a a je nezáporná posloupnost splující lim a = 0. n n Nov definovaná dominance je skuten zobecnním pvodní Definice 3 (viz píklad v [1]). Dkazy dále uvedených vt lze nalézt v [7]. ~ Vta 3. Nech K V / K ( a n 0) na D. Potom každý Kolmogorovský odhad f n hustoty 1/ z D je konzistentní v -norm a ve stední hodnot L -normy. Pokud navíc = o( n ), f L1 1 1/ potom každý Kolmogorovský odhad hustoty f z D je konzistentní ádu v L -norm a ve stední hodnot L 1 -normy. n a n n 1 Nyní budeme formulovat podmínky, za kterých rodina D D vyhoví podmínkám dominance pedpokládaným ve vt 3. Definujme zobecnnou podobu stupn variace a podívejme se na jeho vztah k díve definovanému stupni variace z Definice 6. Definice 8. Bute f, g D a nech a [0,]. Potom parciální stupe variace DV a ( f, g) [0, ] je definován takto: DV ( f, g) = infm N{0}: A m j1 kde J, J m jsou neprázdné disjunktní intervaly v R a a ( I) a piemž J žádné m j1 j I = J j + I, A separuje,, K I R množina taková, že ( I ) a. Je-li minimalizovaná množina prázdná, tj. neexistuje-li m a množina I s požadovanými vlastnostmi, potom pokládáme DV a ( f, g) =. Pokud a > b > 0, potom DVa DVb DV 0 = DV. Pvodní stupe variace DV nás informuje o potu znaménkových zmn rozdílu f g. Z parciálního stupn variace nezjistíme poet
46 znaménkových zmn, víme jen, že pokud DV a ( f, g) <, potom až na konený poet výjimek se všechny znaménkové zmny odehrávají na množin I. Vta 4. Bu D D. Nech pro každou hustotu f D existuje Kolmogorovské okolí B K ( f ) a konstanta K [0,) a dále nezáporná posloupnost a s lim a n = 0 tak, že n n ( ( fn) 1 BK ( f ), fn fv K ) platí, že n je DV ( f, f ) < K. Potom K asymptoticky stejnomrn dominuje V ádu an a n n lokáln s ohledem na K na D. 4. Vapnik-Chervonenkisova dimenze Krátce zmime jiný pístup pro ovování konzistence Kolmogorovských odhad []. Definice 9. Bu A tída mitelných množin. Pro d n ( z 1,.., ) { R } ozname NA z,.. z ) z n ( 1 n poet rzných množin ve tíd {{ z 1,.. zn } A; A A}. Dále n-tý shatter koeficient definujme jako s(a,n) = max N ( z 1,.. z ) { d } n n A ( z 1,.. z n ). Tedy shatter koeficient je maximální poet rzných podmnožin z n bod, které mohou být vybrány pomocí tídy množin A. Definice 10. Bu A tída množin A ( A je poet prvk množiny A). Nejvtší k pirozené íslo k1, pro které platí s(a, k) = nazývejme Vapnik-Chervonenkisovou (VC) n dimenzí tídy A, ozname VA. Pokud s(a, n) = pro každé n, položme VA =. d k Definice 11. Bu F = { f : } parametrická tída hustot v R ( R ) a X 1,..X n stejn nezávisle rozdlená pozorování na f F. Definujme tídu množin d A = {{ x : f > f } 1, } 1 ~ a následn odhad parametru s minimální D A vzdáleností vztahem n = arg min D A P, ), ( n kde P je distribuce odpovídající hustot f a DA je zobecnná Kolmogorov-Smirnovova vzdálenost D A ( P, Q) = sup P( A) Q( A). Vta 5. Pokud A z Definice 11 má konenou VC dimenzi, pak odhad hustoty 1/ zobecnnou Kolmogorovskou vzdálenost je konzistentní ádu ( n ) ve stední hodnot L1 - normy. AA 5. Vapnik-Chervonenkisova dimenze a stupe variace Na píkladech porovnejme oba zmínné pístupy a podívejme se na vzájemný vztah jim odpovídajících charakteristik: stupn variace, parciálního stupn variace a VC dimenze. Protože VC dimenze je citlivá na zmny hustot na množinách nulové míry, zatímco stupn variace ne, uvažujeme dále rodiny D obsahující hustoty lišící se pouze na množinách nenulové míry. Na jednoduchém píklad snadno ovíme, že v obecném pípad z konenosti Vapnik- Chervonenkisovy dimenze neplyne konenost stupn variace, tedy je možné použít Vapnik- Chervonenkisovu teorii, ale teorii založenou na stupni variace nikoli. Píklad 1. Nech rodina hustot D obsahuje rovnomrnou hustotu g intervalu (0,1) a hustoty definované takto f n f pro
47 n 1 1 x(, ), i = 1,,.. i i1 n1 n fn = x(, ), i = 1,,.. i1 i n1 1 1 x(,1) Potom DV(D) =, protože napíklad DV ( g, f 1) =, zatímco V A <, protože tída množin A obsahuje pouze dv rzné množiny. Avšak je možné použít teorii parciálního stupn variace vybudovanou v ásti 3. Snadno zjistíme, že totiž existuje posloupnost a n lim a = 0, taková, že DV a n ( f, g) < K < n pro n N., n n V následujících dvou píkladech zkonstruujeme rodinu hustot, na které bude možné použít ob teorie (tj. DV(D) < VA < ) a dále rodinu hustot, na které ob teorie selžou (tj. DV(D) VA ). Píklad. Uvažujme rodinu D všech hustot Gaussova normálního rozdlení. Potom zejm DV(D) = 1 a VA = 3. Píklad 3. Zvolme kn libovoln a vyberme k rzných bod z 1,.., zk v intervalu (k,k1) a ozname z(1),.. z( k ) jejich vzestupné perovnání. Pro j = 1,.. k definujme intervaly z( j1) z( j) U j = ( u j1, u j ) (k,k1),kde u j = pro j = 1,.., k1 = k, u = k 1. u0 k k k k Existuje rzných podmnožin množiny {1,.., k}, ozname je M, i = 1,.., a definujme f = j M k i 0 Definujme rodinu hustot D k M i U j 1 na k jm i U jinde na R, j i, kde je Lebesqueova míra na R. k = { f : i = 1,.., k}. Z konstrukce je zejmé, že pro každé M k i k N existuje množina { z 1,.., z k }, která je roztídna tídou množin k A = { x : f > f, i, j{1,.. }, k}, tzn. VA =. V tomto pípad také DV(D) =. M k i M k j Následující píklad ukáže, že z konenosti stupn variace neplyne konenost Vapnik- Chervonenkisovy dimenze. Píklad 4. (viz [1]) Zvolme kn libovoln a vyberme k rzných bod z 1,.., zk v intervalu (k 1,k) a ozname z (1),.. z( k ) jejich vzestupné perovnání a Z k = { z 1,.. z k }. Pro j = 1,.. k z( j1) z( j) definujme intervaly Ui = ( ui 1, ui ),kde ui = pro i = 1,.. k1 u0 = k1, uk = k. k k k Existuje rzných podmnožin S Z j = 1,... Pro j = 1,.. a i = 1,.., k definujme hustoty j k
48 proxu,kdyžu S = j i i j k 1 g j ( x) = 1 proxu,kdyžu S, j1 i i j k i 1 pro (,.. 1) jdi x k k i=1 kde d i = u i u i 1 je délka intervalu U i a 1 1 když Ui S = j j i = j. 1 1 když U j1 i S j k k Sestrojíme rodinu hustot D = { g : j = 1,..,, k} { f, k}, kde f je rovnomrná j hustota na intervalu (k1,k). Vidíme, že DV(D) = 1, zatímco VC dimenze tídy množin A = { x : f ( x) > g( x), f, g D} je VA =, protože z konstrukce je patrné, že pro každé k N existuje množina Z { z,.., z }, která je roztídna tídou množin A. k = 1 k Je tedy vidt, že podmínka DV(D) < pro Kolmogorovské odhady je pímo neporovnatelná s podmínkou V A < pro zobecnné Kolmogorovské odhady bez dalších omezujících požadavk na rodiny D. Nicmén zobecnný Kolmogorovský odhad je výpoetn znan náronjší než Kolmogorovský odhad, nebo minimalizace se provádí pes mnohem vtší tídu množin. Také ovení podmínky DV(D) < je snažší než ovování podmínky V A <. 6. Literatura k 1/ n 1 [1] KS, V Nonparametric density estimates consistent of the order of in the -norm. In: Metrika, 004, s [] DEVROYE, L. - GYÖRFI, L. - LUGOSI, G.: A Probabilistic Theory of Pattern Recognition, New York: SPRINGER, 1996 [3] IZENMAN, A. J Recent Developments in Nonparametric Density Estimation. In: Journal of the American Statistical Association, 1991, s [4] YATRACOS, Y. G Rates of Convergence of Minimum Distance Estimators and Kolmogorov's Entropy. In: Annals of Statistics,., 1985, s [5] DEVROYE, L. - GYÖRFI, L.: Nonparametric density Estimate, the L 1 view, New York: WILEY, 1985 [6] GYÖRFI, L. - VAJDA I. - VAN DER MEULEN, E : Minimum Kolmogorov Distance Estimates of Parameters and Parametrized Distributions. In: Metrika, 1996, s [7] HANOUSKOVÁ, J Asymptotické vlastnosti Kolmogorovských odhad hustot pravdpodobnosti, Katedra matematiky FJFI VUT Praha, 008. Jitka Hanousková, Bc. a Václav Ks, Ing., PhD. KM FJFI VUT Praha, Trojanova 13, Praha. k L
49 Štatistické riadenie kvality Taguchiho návrhy experimentov v SAS-e Statistical Quality Control Taguchi Design of Experiments within SAS Adriana Horníková Abstract: Taguchi experimental designs consider the economical qualities when judging the feature of a design. These designs are strongly related to quality control theory. In this contribution come up principles of Taguchi designs and what distinguishes them from other kinds of design. Loss function is the primary difference in understanding of quality of products followed by orthogonal arrays (inner and outer arrays), signal to noise ratio characteristic and others. All important steps of creating a Taguchi design, e.g. orthogonal arrays or orthogonal matrix, inner and outer arrays, SN ratio variable, etc., are illustrated with an example manufacturing of nylon tubes (after Byrne and Taguchi, 1986) while utilizing the statistical module SAS JMP. Confidence intervals for average factor levels, particular treatment or prediction intervals are detailed according to Taguchi. Keywords: design of experiments, Taguchi designs, statistical software SAS, SAS Slovakia Kúové slová: navrhovanie experimentov, Taguchiho návrhy, štatistický softvér SAS. 1. Úvod Metodika vytvárania návrhov experimentov nesie pomenovanie japonského profesora Genichiho Tagichiho, ktorý sa zaslúžil o vytvorenie nového prístupu kontroly kvality, priom použil teóriu navrhovania experimentov. Taguchi navrhol a použil iný model pre charakteristiku nákladov výrobku, aký je typický v klasickom ponímaní. V ekonomickom ponímaní znižovanie nákladov je spojené so znižovaním variability. Definoval stratu (stratovú funkciu), ktorá zohaduje odberateove oakávania, aby kúpil kvalitnejší výrobok a tiež potreby výrobcu produkova nízko nákladové výrobky. Princípom Taguchiho návrhov je maximalizácia strát, kde stratu matematicky vyjadruje stratová (penalizaná) funkcia, L y. Unikátne je používanie pomeru signálu k šumu, ozn. SN (z angl. signal to noise ratio ). Tabuka 1: Zhrnutie - typy stratovej funkcie a priemerná strata na výrobok. Typ charakteristiky Strata jedného výrobku Priemerná strata na jeden výrobok Pomer signálu k šumu (SN) k k 3 n ím väšie, tým Y 1 Y log Y lepšie Y n i 1 Yi Y ím bližšie k T, k Y T k ky tým lepšie Y 10 log s n 1 ím menšie, tým ky 10 log k Y ky Y i n i 1 lepšie n n Yi Yi Y i V tabuke 1 je Y 1 i1 a s, k je koeficient úmernosti, T je cieová n n1 hodnota, Y i je skutoná hodnota výkonovej charakteristiky a L Y je strata spôsobená odchýlkou charakteristiky od cieovej hodnoty T.
50 Inžinierska stratégia V inžinierskej stratégii sa poda G. Taguchiho postup navrhovania výrobku lení do troch základných metodických postupov: 1) návrh systému (tiež primárny návrh): Ide o krok, kedy sa navrhne nový výrobok použitím nových metód, koncepcií, nápadov, prístupov, at. Jednou z možností ako si zachova konkurencieschopnos na trhu je, sta sa lídrom v aplikovaní moderných technológií. Avšak v dôsledku kopírovania tento krok dlho nevydrží. ) návrh parametrov (tiež sekundárny návrh): V tejto fáze je cieom zlepšenie uniformnosti výrobku, teda jeho vlastností a to s vemi nízkymi nákladmi alebo ušetrením. Niektoré parametre výrobku sa upravia tak, že správanie sa výrobku je menej citlivé k zdrojom variability. Toto je uskutonené analýzou podielu variability vzhadom na ozvu, teda pomer signálu k šumu. Z pohadu získania cieového nastavenia faktora je z inžinierskeho hadiska menej nároné prestavenie strednej hodnoty faktora na cieovú hodnotu, ako zníženie variability. Návrh parametrov je návrh, ktorého poslaním je ekonomické zvýhodnenie produkcie výrobku. 3) návrh tolerancií (tiež terciálny návrh): Ide o fázu zlepšovania kvality s minimálnymi nákladmi a to pomocou zužovania toleranných hraníc výrobku alebo výrobného procesu s cieom zníži vlastnú variabilitu výrobku. Tento návrh sa v praxi používa hlavne vtedy, ke zníženie variability z návrhu parametrov nebolo postaujúce. Ide o akúsi trojkrokovú procedúru, kedy sa pre kontrolne faktory vnútorného poa nájdu optimálne nastavenia. Potom sa v rámci jednotlivých pokusov vonkajšieho poa urí, ako na ozvu vplývajú šumové faktory. Toto sa realizuje pre všetky kombinácie pokusov vnútorného a vonkajšieho poa. V prípade, že je potrebné optimalizova nie len variabilitu, ale aj polohu premennej, je vhodné použi novú premennú, ktorá je vytvorená ako pomer medzi signálom k šumu. Pri hadaní optimálneho riešenia maximalizujeme pomer signálu k šumu pre potrebné charakteristiky a strednú hodnotu udržiavame napríklad na cieovej hodnote (vi tab. 1). Ešte k štatistickej podstate Taguchiho návrhov. Teoretické základy ortogonálnych matíc (Taguchiho návrh sa oznauje aj ortogonálnym poom, ktorý sa dá matematicky vyjadri formou ortogonálnej matice) siahajú už do roku 1897, kedy Jacques Hadamard, francúzsky matematik popisoval polia a matice. O znovuobjavenie sa až po druhej svetovej vojne postarali Blackett a Burman, štatistici z Vekej Británie, ktorí vytvorili tiež po nich pomenované návrhy, a to hlavne saturované návrhy. Vo všeobecnosti sú Hadamardové matice identické s maticami Taguchiho, líšia sa len v poradí medzi riadkami a stpcami. Výstupy z analýzy experimentov sa zobrazujú aj graficky, priom sa znázorujú úrovne významných faktorov, ich kombinácie na posúdenie interakcií, poradie pokusov alebo sa vytvárajú normálne diagramy, poloviné normálne diagramy alebo Danielové diagramy. Takýto prístup podporuje aj systém JMP SAS. Modul obsahuje rovnomennú vlastnú platformu pomenovanú Taguchiho polia (Taguchi Arrays). Softvér v súlade s teóriou navrhovania Taguchiho návrhov umožuje rozlíši medzi kontrolovanými a šumovými faktormi, vytvori vnútorné a vonkajšie polia, ako aj vyšpecifikova pomer signálu k šumu. S cieom vytvori Taguchiho návrh sa zvolí v hlavnom menu rovnomenná platforma. Vo vstupnom okne ponuky sa zvolí cie pre ozvu (Response), pomenujú sa faktory a priradí sa im úloha, signálny faktor (signal factor) alebo šumový faktor (noise factor). Následne sa z ponúkaných vnútorných a vonkajších polí zvolia požadované návrhy. Následne program vytvorí návrh tabuky údajov, aby sa mohlo zaa s experimentovaním. 3. Interval spoahlivosti Ak je návrh konený, je možné získa výsledok aj v podobe odhadu strednej hodnoty, ktorá predstavuje odhad skutonej hodnoty zisovanej veliiny. Rovnako Taguchi definoval tri rôzne intervaly spoahlivosti okolo strednej hodnoty:
51 interval spoahlivosti pre priemernú hodnotu úrovne faktora predikný interval okolo odhadu priemernej hodnoty pokusu interval okolo odhadu priemernej hodnoty pokusu, ktorý sa použije v potvrdzujúcom experimente na overenie predikcie. Prvý z troch intervalov spoahlivosti okolo strednej hodnoty úrovne faktora sa vypoíta: alebo ˆ A 1 A 1 CI 1 A CI A ˆ A 1 CI1 priom A 1 je priemerná hodnota faktora A pri úrovni 1 a CI 1 F 1, n s e, kde se je rozptyl náhodnej chyby, n je poet opakovaní v danom pokuse a F 1, je príslušný kvantyl Fisherovho rozdelenia pravdepodobnosti so stupami vonosti 1 a, sú stupne vonosti asociované so stupami vonosti pre chybu e. Interval spoahlivosti pre strednú hodnotu pokusu uvažuje s nasledovným intervalom spoahlivosti: CI F 1, kde s je rozptyl náhodnej chyby, n je efektívny poet opakovaní v danom pokuse e eff n e eff s e, n eff N 1... A B F, priom v menovateli zlomku v zátvorke je celkový poet stupov vonosti v spojitosti s odhadom strednej hodnoty, konkrétne A sú stupne vonosti faktora A, ktoré sa vypoítajú ako poet úrovní faktora A mínus jedna a F 1, e je kvantyl Fisherovho rozdelenia pravdepodobnosti so stupami vonosti 1 a e. Predikný interval pre nový pokus použitený na overenie správnosti nastavení sa dá uri poda nasledujúceho vzahu: CI 1 1 F 1, e se, neff r 3 kde s je rozptyl náhodnej chyby, n je efektívny poet opakovaní v danom pokuse a r e predstavuje vekos výberu v prognózovanom pokuse. eff 4. Príklad aplikácie Taguchiho polí do systému SAS JMP Príklad popísal Byrne a Taguchi v roku 1986 na štyridsiatom výronom kongrese kontroly kvality v Milwaukee, WI v USA. Cieom návrhu experimentu je nájs také
52 nastavenia kontrolovaných faktorov, aby sa docielilo maximalizácie prinavosti a minimalizácie nákladov na montáž nylonových výrobkov. Experiment definuje sedem faktorov, tri šumové (s dvomi úrovami) a štyri kontrolované (každý s tromi úrovami). Obrázok 1: Zadanie faktorov, ciea a vytvorenie Taguchiho polí. Ide o návrh so siedmimi faktormi L9 - vnútorné pole a L8 - vonkajšie pole. Obrázok : Tabuka návrhu experimentu aj s údajmi. G. Taguchi navrhol procedúru, ktorú je možné všeobecne aplikova pri Taguchiho návrhoch na identifikovanie nastavení parametrov, ktoré maximalizujú výkonovú charakteristiku: urenie najvhodnejších a iných porovnatene výhodných nastavení parametrov návrhu a identifikovanie významných šumových faktorov
53 skonštruovanie vnútorného a vonkajšieho poa a vytvorenie návrhu experimentu parametrov uskutonenie návrhu experimentu parametrov vyjadrenie nového nastavenia parametrov poda výkonovej charakteristiky potvrdenie, že nové nastavenia naozaj zlepšujú výkonovú štatistiku (najastejšie experimentálne). Postup je aplikovaný s menšími obmedzeniami aj v tomto príklade. Tabuka : Analýza rozptylu pre SN pomer. Zdroj Df Súet štvorcov Priemerné štvorce F štatistika Model 8 5, , Chyba 0 0, Prob > F C. Total 8 5, Obr. 3: Vavo 3D vyobrazenie premennej SN pomer. Štatistický modul SAS JMP poskytol výsledky metódou najmenších štvorcov, vo forme výpotov aj grafických výstupov. Vo funkcii Prediction profiler (profil predikcií) možnos zvoli funkciu Maximalize desirability (maximalizácia funkcie vhodnosti nastavení úrovní faktorov), ktorá umožuje nájs také nastavenia faktorov (predikciu), aby získané výsledky boli, o možno najžiadanejšie a to vzhadom na Desirability function (funkcia vhodnosti). Pomer SN sa touto maximalizáciou zmenil z hodnoty 4,0534 na 6, Maximalizácia zmenila nastavenie faktora interferencia a stena z úrovne L1 na L, nastavenie faktora hbka z L1 na L3. Posledný štvrtý kontrolovaný faktor svoje nastavenie nezmenil. Takto sa získalo požadované nastavenie kontrolovaných faktorov tak, aby boli minimalizované náklady a maximalizovaná prinavos nylonových výrobkov. 3 Mean Y, SN Ratio Y 6, Desirability 0, ,5 1 Interfer 1 Wall Depth Adhesive 3 0 0,5 0,5 0,75 Desirability Obrázok 4: Funkcia Prediction profiler okrem úinku faktorov umožuje nájs aj najvhodnejšie nastavenie, resp. vo vobe Desirability functions (funkcia vhodnosti nastavení) získa požadované maximum tejto funkcie. 1
54 Záver Navrhovanie experimentov je metodika, ktorá sa používa pred samotným uskutonením experimentu, pred tým ako sa vôbec zane nieo testova, mera, skúša alebo sledova. Experimentovanie sa používa za úelom pochopenia a zlepšenia systému. Príspevok prináša základy tvorby Taguchiho návrhov a všetky významné kroky, ako vytvorenie ortogonálneho poa a pod. vysvetuje aj pomocou štatistického softvéru SAS JMP. Najvhodnejšie nastavenie z aplikaného príkladu je v pokuse. 5 poda obr., kedy je hodnota ozvy najvyššia (vyše a SN pomer vyše 6). Pre danú hodnotu je možné vypoíta poda podkapitoly 3 interval spoahlivosti pre jeden pokus v 5 riadku, ktorý sa rovná: na 0, 05 pre ozvu,03 3, 60 m.j., na 0, 01 pre ozvu,03 5, 4 m.j. V závere príspevku je treba poznamena, že Taguchi robustný návrh je možné aplikova na statické systémy. Rovnako však je aplikovatený aj na dynamické systémy. Dynamickým oznaujeme taký systém, kedy výstupná premenná závisí od vstupnej premennej (signálu). Príkladom je brzdový systém automobilu, kedy vodi generuje stlaením brzdy vstupný signál, ktorý sa lineárne prenáša alej v podobe brzdného úinku (výstupný signál), a pod. Poakovanie: Príspevok vznikol s prispením grantovej agentúry VEGA v rámci projektov 1/0437/08 Kvantitatívne metódy v stratégii šes sigma a 1/318/06 Zlepšovanie kvality produkcie strojárskych výrobkov pomocou moderných štatistických metód. 5. Literatúra [1] Byrne, D. M., Taguchi, G.: ASQC 40th Anniversary Quality Control Congress Transactions, Milwaukee, WI: American Society of Quality Control, [] Dehnad, K.: Quality Control, Robust Design, and the Taguchi Method (edited by), Wadsworth and Brooks/Cole (ISBN ) [3] Janiga, I., Garaj, I. One-sided tolerance factors of normal distributions with unknown mean and variability. In: Measurement Science Review. ISSN Vol. 6, No. (006), s [4] Horníková, A.: Navrhovanie experimentov so štatistickým softvérom SAS. 14. Slovenská štatistická konferencia Regionálna štatistika, Streno [5] Müllerová, A.: Taguchiho prístup k štatistickému riadeniu kvality (dizertaná práca) Ekonomická univerzita v Bratislave, 00. [6] Ross, F. J.: Taguchi Techniques for Quality Engineering (Loss Function, Orthogonal Experiments, Parameter adn Tolerance Design, McGraw-Hill Book Company [7] Taguchi, G.: Introduction to Quality Engineering (Designing Quality into Products and Processes), Asian Productivity Organization, (ISBN ) [8] TEREK, M., HRNIAROVÁ,.: Štatistické riadenie kvality, Edícia ekonómia, 004. [9] TEREK, M., HRNIAROVÁ,.: Výberové skúmanie. Vydavatestvo EKONÓM, 008. [10] Tošenovský J., Noskieviová, D.: Statistické metody pro zlepšování jakosti. Montanex a.s (ISBN X) Adresa autorky: Adriana Horníková, Ing., Mgr., PhD., Fakulta hospodárskej informatiky, Katedra štatistiky Ekonomická univerzita v Bratislave Dolnozemská cesta 1/B, Bratislava [email protected]
55 Možnosti využitia MS Excel pri operatívnom sledovaní kvality výrobného procesu Possibilities of using MS Excel to operative control of manufacturing process quality Stella Hrehová Abstract: In this paper are presented the possibilities of using MS Excel such as a tool of operative process control. There is shown a connection between MS Excel and the internet explorer in time. The principle of this method is using the empty cells to prepare the graph of manufacturing process which will be gradually completed. Key words: Quality, MS Excel, Process, Control Kúové slová: kvalita, MS Excel, proces, riadenie. 1. Úvod Štatistické riadenie procesov aplikujeme na kritické znaky, ktoré sú dôležité i už z hadiska funknosti výrobku, alebo sú požadované priamo odberateom. Dôležité je stanovi si jasné pravidlá a postupy, ako sa zachova v prípade prekroenia povolených hraníc. oraz astejším štandardom je stanovenie dvoch regulaných medzí pre rôzne sigma úrovne. Poda prekroenia týchto regulaných medzí sa rozhoduje o tom, i je potrebné danú dávku aj triedi, alebo je potrebné iba regulaný zásah. Pri hodnotení kvality výrobného procesu sa vytvára regulaný graf, ktorý v grafickej podobe popisuje schopnos procesu dodržiava požadované toleranné hranice. Používanie regulaných diagramov sa lení na dve etapy. V prvej etape je úlohou zostroji regulaný graf, uri jeho : - dolnú tolerannú medzu, - hornú tolerannú medzu. V rámci týchto toleranných pásiem sa môže pohybova skúmaný parameter. Druhou etapou je vlastné monitorovanie priebehu výrobného procesu. V prípade, že hodnota regulovaného parametra padne mimo regulaného pásma, výrobca zisuje príinu tohto javu a prijíma opatrenia na návrat parametra medzi regulané medze. V priebehu monitorovania možno tiež sledova priebeh regulovaných hodnôt a poda ich vývoja možno prija opatrenia na korekciu tohto smeru vývoja skôr, než nastane mimoriadna situácia. Je predpoklad, že zabehnutá výroba už má vytvorený regulaný graf. Pre takýto prípad, je možné použitie programového prostriedku MS Excel.. Spôsoby hodnotenia regulovaných hodnôt Hodnotenie regulovaných hodnôt je možné vykonáva dvoma možnosami. - off-line techniky. Tieto techniky sú založené na hodnotení parametrov až po ich vyhodnotení, teda až po uritom ase. V mnohých prípadoch však tieto techniky nie sú vhodné pre plynulé, kontinuálne systémy [6]. - on-line techniky. Pri takomto prístupe nie sú definované len regulané hranice, ale sú tiež definované pravidlá ako regulova proces tak, aby boli regulované parametre v rámci regulaných medzí. Tieto techniky sa ukazujú by efektívne pre regulovanie procesu, avšak ich použitie si vyžaduje špecifický softvér a hardvér a samozrejme sú aj finanné nároné. Pre použitie u malých a stredných firiem by to zrejme nebolo efektívne.
56 V takýchto prípadoch je možné použitie konvenného prostriedku, ktorý je schopný vytvára ilúziu on-line hodnotenia kvality výrobného procesu. Predpokladom je, že regulaný graf je vytváraný pomocou tabukového prostriedku MS Excel. Pre potreby využitia jeho prostredia je dôležitá jeho vlastnos prepojenia zdrojovej tabuky pre graf a samotného grafického zobrazenia. V prípade takéhoto použitia je potrebné dopredu myslie na tento fakt a oznai oblas pre vytvorenie grafu aj z prázdnych buniek, ktoré sa potom priebežne pri kontrolách budú dopa. Takto zostrojený graf sa bude sám aktualizova po doplnení hodnoty do zdrojovej tabuky bu pri každom otvorení, alebo pri každom stlaení tlaidla "Obnovit" ( Refresh) na paneli nástrojov internetového prehliadaa. Nasledujúci obrázok ukazuje zostrojený regulaný graf s použitím prázdnych buniek. Vytvorme graf priemerov z nasledujúcich hodnôt. Tabuka 1 : Zdrojová tabuka P.. Priemery Rozpätie CL UCL LCL 1,8 3,4 3,1 3,8,7, ,7 3, ,85419, ,4 3,3 3,3 3, 3,1 3,3 3, ,3 3, ,85419, ,1,9 3, 3, 3,3 3,3 3, ,4 3, ,85419, ,8,7,7 3, 3,9 0,5 3, ,85419, ,1,9 3,1 3 3, , 3, ,85419, ,9,9 3,,9 3,3 3,1 3,05 0,4 3, ,85419, ,8 3 3,,9 3, 3, 3,05 0,4 3, ,85419, , 3, ,1 3, ,4 3, ,85419, , 3,4 3,,9 3,1 3, 3, ,5 3, ,85419, ,5 3,4 3, 3,1 3 3,1 3, ,5 3, ,85419, , 3,3 3,3 3, 3,1 3, ,3 3, ,85419, , 3,1 3,1,9,9,8 3 0,4 3, ,85419, ,1 3, 3, 3,1 3,1 3, , 3, ,85419, ,5 3,1 3,9, ,6 3, ,85419, ,3 3, ,1 3, ,3 3, ,85419, ,4 3, 3, 3,1 3,1 3,1 3, ,3 3, ,85419, , 3, 3,1 3,9,8 3, ,4 3, ,85419, , 3, 3, 3,4 3,4 3,4 3,3 0, 3, ,85419, , 3,,7 3, ,5 3, ,85419, ,9 3, , ,3 3, ,85419, ,3 3, ,1 3, 3,15 0,3 3, ,85419, ,1,8 3,4 3 3,3 3,1 3, ,6 3, ,85419, ,9,9 3,1 3, 3,4 3,1 3,1 0,5 3, ,85419, ,1 3,7,8 3,3 3,1 3 0,6 3, ,85419, , ,85419, , ,85419, , ,85419, , ,85419, , ,85419, Na základe týchto získaných hodnôt bol vytvorený regulaný graf priemerov v prostredí MS Excel, priom boli použité prázdne bunky (sivo vyplnené), ktoré sa rezervovali na alšie dopanie hodnôt poda toho, ako sa bude proces vyvíja. Hodnoty sú urené automaticky z nameraných hodnôt pomocou vzorca, ktorý je skopírovaný aj do týchto buniek. Podobne sú urené hodnoty toleranných hraníc. Je potrebné však dôsledne dodržiava odkazy na bunky, aby sa ich hodnoty menili poda aktuálneho stavu.
57 Regulaný graf priemerov 3,4 3,3 3, 3,1 3,9,8,7,6 UCL CL LCL Obrázok 1: Zostrojený regulaný graf Pre vytvorenie webovskej stránky použijeme vobu MS Excel a to uloženie súboru v tvare web stránky. Z možnosti si vyberieme len položku grafu, ktorý má pre nás najvyššiu vypovedaciu hodnotu a prípadne si dáme zobrazi aj vytvorenú stránku, ktorú si uložíme. Obrázok : Okno pre aktiváciu grafu v internetovom prehliadai Pretože predpokladáme, že graf sa bude aktualizova po nejakom ase, je potrebné zaškrtnú Znovu automaticky publikova pi každém uložení tohoto sešitu. Po otvorení tejto stránky budú zobrazené hodnoty už poda novej situácie a je možné rozhodnú i proces je stabilný, alebo nie.
58 Obrázok 3: Zobrazenie webovskej stránky 3. Záver V príspevku bol uvedený možný spôsob využitia MS Excel, ktorý umožuje ukladanie súborov aj ako web súbory a teda je ich možné zobrazi v internetovom prehliadai. Spojením tejto vlastnosti a vlastnosti prepojenia oblasti z ktorej vytvárame graf sa z MS Excelu stáva použitený prostriedok pre operatívne riadenie kvality výrobného procesu. Možnosou tvorby web stránky, ktorá by zobrazovala regulaný graf má zodpovedný pracovník možnos operatívne riadi tento proces. Okrem tejto možnosti využitia sa táto informácia môže poskytova aj vyššiemu manažmentu pri potrebe hodnotenia výrobného procesu. 4. Literatúra [1]FLOREKOVÁ, L Metódy štatistického hodnotenia kvality SPC, Acta Montanistica Slovaca, ro. 3,.1, Ediné stredisko na fakulte BERG Košice 1998, ISSN []CHAJDIAK, J. 1998: Štatistické riadenie kvality, Statis Bratislava, ISBN [3]NENÁDAL,J. A KOL. 007: Moderní systémy ízení jakosti. Quality management., Management Press, Praha 007, ISBN [4]ŠESTÁK, M. 007 : LEAN Six Sigma a štatistická regulácia procesov, Kvalita, MASM Žilina 007,ro. XV,.-007, ISSN [5]TEREK, M.; HRNIAROVÁ, L. 004: Štatistické riadenie kvality, IURA EDITION spol s r.o., Bratislava 004, ISBN [6] Adresa autora (-ov): Stella Hrehová, Ing. PhD. FVT TU v Košiciach Katedra matematiky, informatiky a kybernetiky Bayerova Prešov [email protected] Príspevok bol vypracovaný v rámci projektu : Asymptotické a oscilatorické vlastnosti riešení nelineárnych diferenciálnych systémov,. 1/4004/07
59 Štatistické riadenie kvality. Analýza spôsobilosti procesu. Statistical Quality Control. Process Capability Analysis. ubica Hrniarová, Milan Terek Abstract: Statistical techniques are able to be much useful before process activities, to modelling of process variation, to analysis of this variation in respect of demands or specifications and also they can help to its reduction. This common activity is known as process capability analysis. The content of this contribution is short description of the techniques, which are possible to use in process capability analysis. Key words: Statistical Quality Control, Process Quality Analysis, Histograms, Control Charts, Process Capability Indices, Experimental Design. Kúové slová: štatistické riadenie kvality, analýza spôsobilosti procesu, histogramy, regulané diagramy, indexy spôsobilosti procesu, navrhovanie experimentov. 1. Úvod Na dnešných svetových trhoch, s množstvom konkurencieschopných firiem, otázka kvality má významnejšie postavenie, ako v minulosti. Efektívne programy zlepšovania kvality sú nástrojom udržiavania, resp. zlepšovania pozície podnikov na trhu. Integrálnou súasou týchto programov je analýza spôsobilosti procesu. Obsahom príspevku je struný prehad techník, ktoré možno použi v analýze spôsobilosti procesu. Získané informácie o spôsobilosti procesu sú: 1. pre výrobcov vemi dôležitým podkladom pre kvalifikované rozhodnutia pri plánovaní kvality.. pre zákazníka dôkazom o tom, i výrobok bol vyrobený v stabilných výrobných podmienkach a boli dodržané predpísané kritéria kvality.. Analýza spôsobilosti procesu pomocou histogramu Histogram sa používa na grafické znázornenie rozdelenia poetností hodnôt znaku. V riadení kvality možno túto grafickú metódu použi pri analýze spôsobilosti procesu. Ak budeme mieru spôsobilosti definova ako 6 a možno prija predpoklad o pomernej stabilite rozdelenia poetností, potom 6 rozpätie rozdelenia pravdepodobnosti ukazovatea kvality centrované na strednej hodnote možno odhadnú pomocou výberového priemeru X a výberovej smerodajnej odchýlky S ako X 3S. Použitie histogramu na odhad spôsobilosti procesu umožuje získa okamžitú vizuálnu predstavu o spôsobilosti procesu, ale nie vždy o potenciálnej spôsobilosti. Príslušné rozdelenie môže by napríklad ovplyvnené vymedzitenými príinami, elimináciou ktorých sa môže variabilita ukazovatea kvality redukova. Na redukciu variability eliminovaním vymedzitených príin variability je vhodné použi regulané diagramy. 3. Analýza spôsobilosti procesu pomocou regulaných diagramov Regulané diagramy sa považujú za primárnu techniku analýzy spôsobilosti [6]. Analýza spôsobilosti pomocou regulaného diagramu môže indikova, že proces sa dostal do štatisticky nezvládnutého stavu. Vtedy nie je vhodné odhadova spôsobilos procesu. Stabilita procesu je nevyhnutným predpokladom na získanie spoahlivého odhadu
60 spôsobilosti procesu. Ke je proces nestabilný, prvou úlohou je samozrejme nájs a eliminova vymedzitené príiny variability. V analýze spôsobilosti možno využi 3 - regulané diagramy na reguláciu meraním aj 3 - regulané diagramy na reguláciu porovnávaním. Pri aplikácii regulaných diagramov je nevyhnutné stanovi rozsah výberu n, frekvenciu výberov a parametre regulaného diagramu (regulané hranice UCL a LCL, centrálna priamka CL). Vzahy na výpoet hornej regulanej hranice UCL a dolnej regulanej hranice LCL v 3 - regulanom diagrame sú nasledovné: UCLV 3 V, UCL 3 V V V uvedených vzahoch V je výberová charakteristika, pomocou ktorej odhadujeme nejaký parameter rozdelenia pravdepodobnosti regulovaného ukazovatea kvality a predpokladáme, že V má strednú hodnotu V a smerodajnú odchýlku V. Konštrukcie základných typov Shewhartových regulaných diagramov na reguláciu meraním a na reguláciu porovnávaním možno nájs napríklad v [1] [6], [8] [9]. Poda [6], by sa mali vždy ke je to možné uprednostni regulané diagramy priemerov a regulané diagramy rozpätí, pretože poskytujú lepšiu informáciu v porovnaní s regulanými diagramami na reguláciu porovnávaním, aj ke aj tieto môžu by v analýze spôsobilosti užitoné. Pomocou regulaných diagramov priemerov a regulaných diagramov rozpätí možno analyzova proces bez ohadu na toleranné hranice. Naopak, napríklad regulané diagramy podielu nezhodných jednotiek umožujú analyzova proces len s ohadom na toleranné hranice [8]. 4. Analýza spôsobilosti procesu pomocou indexov spôsobilosti Na hodnotenie spôsobilosti procesu sa najprv používali histogramy. Požiadavkou manažérov z praxe bolo, aby to, o prezrádza histogram, bolo možné vyjadri nejakým íslom (ukazovateom). To bol základ pre vznik indexov spôsobilosti procesu (Process Capability Indices). V itateli indexov je požadovaná (predpísanú) presnos procesu, v menovateli inherentná (prirodzená) variabilita procesu. Pri výpote indexov spôsobilosti sa všeobecne predpokladá že proces je stabilný, pozorovania sú štatisticky nezávislé a majú normálne rozdelenie. J. M. Juran, so svojimi spolupracovníkmi v roku 1974 navrhol index spôsobilosti procesu : C p USL - LSL C p (1) 6 kde USL je horná toleranná hranica, LSL je dolná toleranná hranica a je smerodajná odchýlka procesu. Index spôsobilosti prvej generácie je iba potencionálnou mierou spôsobilosti procesu, pretože nevyísuje, kde je proces centrovaný. Pri používaní indexu C p C p iba
61 predpokladáme, že stredná hodnota procesu sa rovná cieovej hodnote T sledovaného ukazovatea kvality. Od zaiatku používania indexu spôsobilosti sa používa hodnota 1,33 za minimálne požadovanú hodnotu spôsobilosti procesu. alším indexom spôsobilosti prvej generácie je C pk. Tento index už reaguje na vychýlenie strednej hodnoty procesu od stredu toleranného intervalu procesu MSL, resp. od cieovej hodnoty T sledovaného ukazovatea kvality, ke T = MSL. Je ukazovateom aktuálnej spôsobilosti procesu. Index kvantifikuje spôsobilos horšej polovice údajov procesu. Vyplýva to z toho, že C min C, C ), () pk ( pu pl USL LSL kde C pu a C pl. C pu je horný index spôsobilosti a C pl je dolný 3 3 index spôsobilosti pri zadaní jednostranného toleranného intervalu (teda bu LSL = (resp. 0 ) alebo USL = ) a minimálne C, resp. C obsahuje vyšší podiel hodnôt sledovaného ukazovatea kvality mimo požadovaných toleranných hraníc USL, resp. LSL. Kde je proces centrovaný, možno zisti napríklad z nasledujúcich vzahov: ke C = C, proces je centrovaný v strede toleranného intervalu, p pk pu C p ke C > C, proces nie je ideálne centrovaný, ke p C pk pk pl C pk = 0, proces je centrovaný na jednej z toleranných hraníc, ke C pk < 0, proces je centrovaný mimo toleranných hraníc. V prípade, ke sa stredná hodnota procesu približuje k niektorej z toleranných hraníc procesu (LSL, resp. USL) a súasne sa zmenšuje smerodajná odchýlka procesu, nereaguje ani C na vychýlenie strednej hodnoty procesu od stredu toleranného pk intervalu procesu MSL, resp. ke T=MSL od cieovej hodnoty T sledovaného ukazovatea kvality. Ke T MSL, C vôbec nevystihuje odchýlku od cieovej hodnoty T. pk Kde je proces centrovaný možno zisti aj pomocou indexu prvej generácie K. Tento index sa niekedy nazýva ukazovate presnosti nastavenia a je definovaný vzahom: K T 1 ( USL LSL ) (3) Ke T = MSL, index K zachytáva odchýlku strednej hodnoty od stredu toleranného intervalu. Ke T MSL, index K zachytáva odchýlku strednej hodnoty od požadovanej hodnoty, o je vemi užitoná informácia. Obor hodnôt indexu K je [0, ). Ke: 4. K = 0, potom = T, 5. 0 < K < 1, potom sa nachádza medzi LSL a USL, 6. K > 1, potom sa nachádza mimo toleranných hraníc.
62 Pretože index K nevyjadruje vzah vekosti prirodzeného toleranného rozpätia k predpísanému tolerannému rozpätiu, je vhodné ho používa spolu s niektorým zo skôr uvedených indexov. Konštrukcia indexov prvej generácie vychádza z klasického prístupu k riadeniu kvality, poda ktorého sa výrobky vyrobené v rozsahu požadovanej tolerancie považujú za zhodné a výrobky vyrobené mimo požadovanej tolerancie za nezhodné. Klasické štatistické riadenie kvality je však podriadené programom zlepšovania kvality zameraným na výrobu výrobkov, ktorých ukazovatele kvality by sa rovnali cieovej hodnote. Použitím Taguchiho stratovej funkcie boli indexy spôsobilosti procesu prvej generácie modifikované na indexy spôsobilosti procesu druhej generácie. Index C pm je definovaný takto USLLSL C pm (4) 6 kde je druhá odmocnina zo. vyjadruje oakávanú mieru kolísania ukazovatea kvality X okolo cieovej hodnoty T a je definovaná: = X T E = T Ke sa rozptyl zväšuje a (alebo) sa stredná hodnota procesu vzauje od cieovej hodnoty T, menovate indexu rastie a C pm klesá. Obyajne sa predpokladá, že cieová hodnota je v strede toleranného rozpätia (T = MSL). Ke T MSL, index nie je vhodnou mierou spôsobilosti procesu. Ke T =, potom C = C. Ke proces nie je centrovaný na cieovú hodnotu (T MSL), index nie je vhodnou mierou spôsobilosti procesu. V tomto prípade je vhodné použi index druhej * generácie. C pm Je definovaný takto C * pm min USLT ;T LSL 3 T pm p C pm C pm * alebo C = min C,C ), (5) pm ( pml pmu kde C pml = 3 T LSL T a C pmu = 3 USLT T Ke T = MSL, potom C = C. Ke sa okrem toho = MSL, potom = C = C. pm pm * Nevýhodou indexu C, podobne ako C je, že hoci poskytuje informáciu, že pm proces je aktuálne nespôsobilý, neposkytuje informáciu o jej príinách. Preto je vhodné spolu * s indexom sledova aj index K. C pm Medzi indexy tretej generácie patria napríklad indexy C, C. pk pmk C pm jkp pm pk
63 Index C, je kombináciou indexov C a C a je definovaný takto pmk pk pm C pmk min USL, LSL 3 T (6) indexy Výhodou tohto indexu je, že je citlivejší na variabilitu okolo cieovej hodnoty ako C a C pk pm alší index spôsobilosti procesu tretej generácie meria variabilitu ukazovatea kvality X pred aj za cieovou hodnotou. Index možno použi aj v prípade, ke rozdelenie pravdepodobnosti X je zošikmené. Index údajov: jkp jkp jkp C jkp C jkp je definovaný takto C min CU, CL. (7) Indexy CU, CL definujú spôsobilos procesu na základe hornej a dolnej polovice jkp jkp CU jkp 1 3 E USL T XT X T CL jkp 1 3 T LSL E X T, kde X T E X T X T E X T X T PX T E X T X T E X T X TP X T Podrobnejšie informácie o indexoch spôsobilosti možno nájs napríklad v [3] [4], [5], [6], [8], [9]. 5. Analýza spôsobilosti procesu pomocou navrhnutých experimentov Zlepšovanie kvality možno chápa jednoducho ako redukciu variability procesu a produktov[6]. V procese hadaní možností redukcie tejto variability sú vemi úinným nástrojom metódy navrhovania (plánovania) experimentov (Experimental Design alebo Design of Experiments). Základné poznatky o navrhovaní experimentov s jedným faktorom a viacfaktorových experimentov (dvojúrovových) a analýze úinkov faktora (faktorov) na výstupnú premennú možno nájs napríklad v [7], [9]. 6. Záver Úsilie o zlepšovanie kvality bude naalej pokraova a vyvíja sa. Všeobecne sa zlepšovaním kvality chápe as manažérstva kvality zameraná na zvyšovanie spôsobilosti plni požiadavky na kvalitu [10].
64 - 6 - Literatúra [1] JANIGA, I. FILIP, I.: Výpoet ARL pre regulané diagramy aritmetických priemerov s výstražnými medzami pomocou programu Microsoft Excel.. Forum Statisticum Slovacum 3/006, s ISSN [] JANIGA, I.: Normalizácia metód štatistického riadenia kvality. Forum Statisticum Slovacum /007. ISSN [3] KOTZ, S.-JOHNSON, N. L.: Process Capability Indices. London, Chapman & Hall 1993 [4] KUREKOVÁ, EVA - PALENÁR, RUDOLF: Posudzovanie spôsobilosti meracích procesov.in: Strojnícky asopis = Journal of Mechanical engineering. - ISSN Ro. 53,. 3 (00), s [5] KUREKOVÁ, EVA: Analýza metód výpotu indexov spôsobilosti. In: Strojné inžinierstvo Bratislava : STU v Bratislave, ISBN S [6]MONTGOMERY, D. C: Introduction to Statistical Quality Control. New York, J. Wiley [7]MONTGOMERY, D. C.: Design and Analysis of Experiments. New York, J. Wiley [8]TEREK, M. HRNIAROVÁ,.: Analýza spôsobilosti procesu. Bratislava: Ekonóm 001, ISBN [9]TEREK M., HRNIAROVÁ.: Štatistické riadenie kvality. Bratislava: Vydavatestvo Iura Edition., 004, ISBN [10]STN EN ISO Systémy Manažérstva kvality. Základy a slovník. Úrad pre normalizáciu, metrológiu a skúšobníctvo SR, 001. Tento príspevok vznikla s prispením grantovej agentúry VEGA v rámci projektu íslo 1/0437/08 Kvantatitatívne metódy v stratégii šes sigma a projektu íslo 1/318/06 Zlepšovanie kvality produkcie strojárenských výrobkov pomocou štatistických metód. Adresa autorov: ubica Hrniarová, doc.ing. PhD. Ekonomická univerzita, Dolnozemská cesta Bratislava [email protected] Milan Terek, prof.ing. PhD. Ekonomická univerzita, Dolnozemská cesta Bratislava [email protected]
65 Štatistické porovnanie zhody analyzovaného a referenného súboru Statistical comparison deuces to analyse and reference file Jozef Chajdiak, Maroš Suchánek Abstract: Príspevok obsahuje štatistické porovnanie súboru pacientiek s indikáciou abruptio placentae praecox a referenného súboru rodiacich žien bez tejto indikácie. Paper includes statistical comparison file patient with indication abruptio placentae praecox and reference file bearing woman without this indication. Key words: abruptio placentae praecox, F test, t test, Chi square test. Kúové slová: abruptio placentae praecox, F test, t test, Chi kvadrát test. 1. Úvod Analyzuje sa súbor pacientiek s indikáciou abruptio placentae praecox. Na kontrolu slúži referenný súbor rodiacich žien bez tejto indikácie. Našou úlohou je porovna zhodu súborov poda vybraných znakov.. Použité testy Pri kardinálnych znakoch a nominálnych znakoch s alternatívnymi hodnotami kódovanými íslami 0 a 1 resp. 1 a sme zhodu hodnôt príslušných premenných overovali prostredníctvom zhody stredných hodnôt a zhody rozptylov. Testovali sme hypotézy zhody rozptylov (homoskedasticitu resp. heteroskedasticitu): H 0 : 1, H1 : 1 kde dolný index 1 predstavuje rozptyl hodnôt v súbore PLACE (súbor pacientiek s indikáciou abruptio placentae praecox) a index rozptyl v referennom súbore REFER (súbor rodiiek bez indikácie abruptio placentae praecox). Poda výsledku vyjadrujúcom zhodu rozptylov (homoskedascititu) alebo rôznos rozptylov (heteroskedasticitu) sme použili príslušnú verziu t testu zhody stredných hodnôt v súboroch PLACE a REFER: H : 0 1 H1 : 1 Pri nominálnych znakoch s viac ako dvoma hodnotymi sme použili test (chí kvadrát test) testujúcom zhodu napozorovaných hodnôt f(x) (Actual) a teoretických hodnôt g(x) (Expected): H : f x g x H 0 1 : f x gx kde funkcie f a g predstavujú funkcie rozdelenia hodnôt premennej x. K numerickym výpotom boli použité funkcie FTEST, TTEST a CHITEST systému Excel verzie 007. Výstupom funkcií je p-hodnota, ktorú porovnávame s zvolenou hladinou významnosti (v našom prípade sme zvolili =0,05). V prípade, že p-hodnota je väšia ako nie je dôvod zamietnu hypotézu H 0 (prijímame hypotézu H 0 ). V prípade, že p-hodnota je menšia ako je dôvod zamietnu hypotézu H 0 (prijímame hypotézu H 1 ). 3. Overovanie vstupnej zhody Súbor PLACE obsahuje údaje o 106 pacientkach a referenný súbor REFER údaje o 110 rodikách.
66 Testovali sme zhodu stredných hodnôt a rozptylov za vek, hmotnos pri pôrode, prírastok hmotnosti za tehotenstvo, hmotnos pred pôrodom, výšku a týžde ukonenia tehotenstva. Základný štatistický rozbor premenných a výsledky testov sú v tab.1. Tabuka 1: Výsledky za íselné premenné vek hmot Kg+ Kg vyška týžde pred PLACE N MIN MAX PRIEMER 30,80 71,8 11,89 59,48 165,5 36,8 MEDIAN , STDEV 5,67 9,15 4,0 8,46 6,68 3,66 REFER N MIN MAX PRIEMER 33,87 77,03 14,47 6,5 167,76 39,71 MEDIAN STDEV 8,0 11,80 5,54 10,5 5,40 1,03 TESTY F 0, , ,0533 0,08 E-3 Výsledok T 0, ,61E ,0017 0,003 7E-16 Výsledok Referenný súbor obsahuje variabilnejšie hodnoty ako analyzovaný súbor - ženy sú trocha staršie, hmotnejšie, vyššie a porodili neskôr. Všetky testy zhody naznaujú rôznos údajov. U premených poet plodov, DVT (deep venous thrombosis - hlboká žilová trombóza), DM (diabetes mellitus - pravá netehotenská cukrovka) a IUD (intrauterine device - vnútromaternicové antikoncepné teliesko pred tehotnosou) boli zistené len hodnoty 0 (nie) - nevyskytujú sa. 4. Overovanie výsledkov experimentu Postatnými výsledkami experimentov je preukázanie/nepreukázanie štatisticky významného vplyvu lenenia žien do experimentálneho súboru PLACE a do referenného súboru REFER pri premenných FVL (faktor V Leiden dediná mutácia 5. faktora krvnej zrážanlivosti - zvyšuje tendenciu ku krvnej zrážanlivosti), PL (mutácia génu protrombínu dediná mutácia zvyšujúca krvnú zrážanlivos) a MTHFR (mutácia génu enzýmu metyléntetrahyrofolátreduktázy zvyšuje krvnú zrážanlivos). Premenné FVL, PL a MTHFR majú možnosti: mutácia neprítomná (0), heterozygotná mutácia (1) - 1 gén zdravý a 1 chorobný,
67 homozygotná mutácia () oba chorobné gény (od oboch rodiov). K testu výsledkov experimentu sme použili test (chí kvadrát test) testujúcom zhodu napozorovaných hodnôt f(x) (Actual) a teoretických hodnôt g(x) (Expected). Výsledky testov sú v tab., 3 a 4. Tabuka : Výsledky významnosti FVL FVL(Actual) PLACE REFER Spolu FVL(Actual) PLACE REFER Spolu Spolu Spolu FVL(Expected) PLACE REFER Spolu FVL(Expected) PLACE REFER Spolu 0 93,4 96, ,4 96, ,78 1, ,76 13,4 6 0,98 1,0 Spolu Spolu CHI TEST 0,0404 CHI TEST 0, Zhoda Zhoda Poznámka: Vzhadom k tomu, že poetnos tried s výskytom FVL= je menšia ako 5, triedy FVL=1 a FVL= sme zlúili do spolonej triedy (1+). Tabuka 3: Výsledky významnosti PL PL(Actual) PLACE REFER Spolu Spolu PL(Expected) PLACE REFER Spolu 0 103,55 107, ,45, Spolu CHI TEST. Zhoda.
68 Tabuka 4: Výsledky významnosti MTHFR MTHFR(Actual) PLACE REFER Spolu Spolu MTHFR(Expected) PLACE REFER Spolu 0 40,4 41, ,56 51, ,19 16,81 33 Spolu CHI TEST 0, Zhoda Experiment preukázal štatisticky významný vplyv faktorov FVL a MTHFR (p-hodnota v riadku CHI TEST v tabukách a 4 je menšia ako hladina významnosti =0,05). Pri faktore PT vzhadom k rozdeleniu hodnôt možno len slovne konštatova, že výskyt PT v súbore PLACE je 4/106 o je zhruba štyri krát viac ako výskyt v súbore REFER rovný 1/ Záver Z výsledkov experimentálneho súboru a referenného súboru vyplýva, že vplyv faktora FVL a MTHFR je štatisticky významný, pri PT faktore je len vyšší vplyv. Ženy v referennom súbore sú v priemere biologicky mohutnejšie, t.j. staršie, hmotnejšie (pred a po pôrode ako aj prírastkom hmotnosti poas tehotenstva), sú vyššie a rodia neskôr (nerodia predasne) ako ženy s experinetálneho súboru s indikáciou abruptio placentae praecox. 6. Literatúra [1] CHAJDIAK, J Štatistika jednoducho. Bratislava: Statis s. ISBN X. [] CHAJDIAK, J Štatistické úlohy a ich riešenie v Exceli. Bratislava: Statis s. ISBN Adresa autorov: Jozef Chajdiak, Doc., Ing., CSc. Ústav manažmentu STU Bratislava [email protected] Maroš Suchánek, MUDr. FN Ružinov Bratislava [email protected]
69 Štatistická regulácia v plniacom procese Statistical control in filling process Ivan Janiga Abstract: In the paper we deal with the filling process. We want to find out if the filling process can be controlled. Key words: filling process, statistical process control, control chart, normal distribution, statistical hypothesis, goodness-of-fit test. Kúové slová: plniaci proces, štatistická regulácia procesu, regulaný diagram, normálne rozdelenie, štatistická hypotéza, test dobrej zhody. 1. Úvod V príspevku sa zaoberáme možnosou zavedenia štatistickej regulácie do plniaceho procesu. Uvažujeme objemové plniky, ktoré tvoria najrozsiahlejší používaný systém plnenia homogénnych tekutých látok. Charakteristickým predstaviteom objemovej plniky je univerzálna štvorpolohová objemová kruhová kroková plnika, ktorá sa používa na plnenie rastlinných stolových olejov, ale aj na plnenie motorových i alších syntetických olejov. Linka na plnenie oleja obsahuje plniacu jednotku, ktorú tvoria dva rotory spojené dopravným pásom, na ktorom sú uchytené nosie. Nosie vykonávajú plynulý pohyb z jednej polohy do druhej. Ke sa nosie zastavia v danej polohe, nasleduje proces plnenia. Plnika má dva odmerné valce (OV1, OV) a štyri hubice (H1, H, H3, H4). Objemové plnenie sa vykonáva v štyroch fázach, ktoré sa cyklicky opakujú. Pri štarte je nultá fáza pri, ktorej sa napa OV1, potom nasledujú jednotlivé fázy plnenia: 1. fáza. OV1 sa vyprázduje cez H1 do faše. 1 OV sa napa,. fáza. OV sa vyprázduje cez H do faše. OV1 sa napa, 3. fáza. OV1 sa vyprázduje cez H3 do faše. 3 OV sa napa, 4. fáza. OV sa vyprázduje cez H do faše. 4 OV1 sa napa.. Realizácia experimentu plniaceho procesu Boli vykonané tri etapy merania pre H1, H, H3 a H4. V druhej etape vypadlo jedno meranie pri H aj H 4. Teda v etapách 1 a 3 bolo naplnených a odmeraných po 40 fliaš, v etape len 38 fliaš. Faše o objeme 1 liter sa plnili vodou. Oznaené boli tak, aby sa dalo identifikova, na ktorej z plniacich hubíc bola faša naplnená. Dbali sme pritom aj na dodržanie asovej následnosti plnenia. Objem plnenia bol nastavený na 1000 ml, avšak namerané hodnoty sa pohybovali v intervale od 989 ml do 1006 ml. Merania ukazujú na závislos medzi plniacimi hubicami H1 a H3, ktoré sú plnené plniacim valcom OV1, a hubicami H ah 4, ktoré sú plnené odmerním valcom OV. Pri H1 a H3 sa zdajú odchýlky od 1000 ml nevýrazné, avšak H a H4 plnili s výnimkou 5 hodnôt pod 1000 ml. 3. Model vyhodnotenia experimentálnych dát Predpokladajme, že náhodná premenná, ktorá predstavuje meranie hodnôt vo fašiach naplnených na i-tej hubici v k-tej etape, má rozdelenie s distribunou funkciou ( ) F k (k) (k) ( x), priom parametre rozdelenia sú stredná hodnota a smerodajná i i (k ) X i i
70 odchýlka. Celkove je to dvanás náhodných premenných, pretože v experimente sa použijú štyri plniace hubice ( i 1,, 3, 4 ) a tri etapy plnenia ( k 1,, 3). alej uvažujeme alšie štyri náhodné premenné: X i s distribunou funkciou F i (x), s parametrami i a i, ktorá predstavuje meranie hodnôt vo fašiach naplnených na i-tej hubici, priom i 1,, 3, 4, X 13 s distribunou funkciou 13( x), s parametrami meranie hodnôt vo fašiach naplnených hubicami H1 a H3, F 13 X 4 s distribunou funkciou 4 ( x), s parametrami meranie hodnôt vo fašiach naplnených hubicami H a H4, F 4 a 13, ktorá predstavuje a 4, ktorá predstavuje X 14 s distribunou funkciou F1 4 ( x), s parametrami 14 a 14, ktorá predstavuje meranie hodnôt vo fašiach naplnených hubicami H1 až H4. Predpokladáme, že rozdelenia všetkých 19 náhodných premenných sú spojité. Definujme a ozname náhodné výbery takto: V je množina hodnôt náhodného výberu z rozdelenia s distribunou funkciou (alej (k ) i ( ) F k i d. f.) ( x), ktoré predstavujú merania vo fašiach naplnených na i-tej hubici v k-tej etape. Pretože v experimente sa použijú štyri plniace hubice ( i 1,, 3, 4 ) a tri etapy plnenia ( k 1,, 3), predstavuje to celkove hodnoty dvanástich náhodných výberov. V i je množina hodnôt náhodného výberu z rozdelenia s d. f. F i (x), ktoré predstavujú všetky hodnoty namerané vo fašiach naplnených i-tou hubicou, priom i 1,, 3, 4. (1) () (3) Matematicky to vyjadrime ako =. V i V i V i V 13 je množina hodnôt náhodného výberu z rozdelenia s d. f. F ( x 13 ), ktoré predstavujú všetky hodnoty namerané vo fašiach naplnených hubicami H1 a H3, o vyjadríme matematicky = V. V13 V1 3 V 4 je množina hodnôt náhodného výberu z rozdelenia s d. f. F 4 ( x), ktoré predstavujú všetky hodnoty namerané vo fašiach naplnených hubicami H a H4, priom matematický zápis je = V. V4 V 4 V 14 je množina hodnôt náhodného výberu z rozdelenia s d. f. F1 4 ( x), o sú hodnoty namerané vo fašiach naplnených všetkými hubicami. Matematicky to zapíšeme = V. V14 V1 V V3 4 Overenie predpokladu normality Pri implementácii štatistickej regulácie do procesu predpokladáme, že merania (výberové dáta) pochádzajú z normálneho rozdelenia. Tento predpoklad treba overi na základe výberových dát. Overovanie sa robí pomocou testov zhody. Testuje sa pritom nulová hypotéza, že daná náhodná premenná má normálne rozdelenie oproti alternatívnej H 0 hypotéze H 1, že nemá normálne rozdelenie. V našom prípade testujeme tieto nulové hypotézy: H : (k ) ( ) X má normálne rozdelenie s d. f. F k ( x) pre i 1,, 3, a k 1,, 3, 0 i V i i 4 H : X má normálne rozdelenie s d. f. F i (x) pre i 1,, 3, 4, 0 i
71 H : X má normálne rozdelenie s d. f. F ( x 13 ), 0 13 H : X má normálne rozdelenie s d. f. F 4 ( x) a 0 4 H : X má normálne rozdelenie s d. f. ) F1 4 ( x Chceme zisti i sa dá proces regulova tak, že sa reguluje proces plnenia každej hubica samostatne, alebo sa reguluje proces napania každého odmerného valca samostatne, alebo sa reguluje celý proces plnenia. Pri štatistickej regulácii procesu musí by splnený aj predpoklad, že merania pochádzajú z toho istého rozdelenia, z oho vyplýva, že musia ma rovnaké rozptyly aj stredné hodnoty. Tento predpoklad treba overi na základe výberových dát. Overenie predpokladov sa robí pomocou dvoch testov v uvedenom poradí: 1. Testuje sa nulová hypotéza, že všetky rozptyly sú rovnaké oproti alternatívnej hypotéze H 1 H 0, že aspo jeden sa líši od ostatných. H 0. Testuje sa nulová hypotéza, že všetky stredné hodnoty sú rovnaké oproti alternatívnej hypotéze H 1, že aspo jeden sa líši od ostatných. V alšom vyhodnocovaní porovnávame tri etapy plnenia pre každú zo štyroch hubíc samostatne. alej porovnávame plnenie hubicou H1 s plnením hubicou H3 a plnenie hubicou H s plnením hubicou H4. Nakoniec porovnávame plnenie hubicami H1 a H3 s plnením hubicami H a H4. Najprv testujeme nulové hypotézy o rovnosti rozptylov: (1) () (3) H :, i 1,, 3, 4, 0 i i i H :, :, :, : H 0 4 H H Ak danú hypotézu rovnosti rozptylov nezamietneme, považujeme rozptyly za rovnaké. V alšom kroku testujeme nulové hypotézy o rovnosti stredných hodnôt: H, i 1,, 3, 4, : (1) () (3) 0 i i i H 0 : 1 3, H0 : 4, H0 : 13 4, 0 : H V alšom postupe na testovanie rovnosti príslušných stredných hodnôt resp. mediánov použijeme analýzu rozptylu (ANOVA), ak ide o porovnávanie normálnych rozdelení alebo Kruskalov-Wallisov test (K-W test), ak porovnávame iné ako normálne rozdelenia. V prípade, že hypotézu rovnosti rozptylov zamietneme, nemáme momentálne k dispozícii vhodnú metódu na testovanie hypotézy o rovnosti príslušných stredných hodnôt. V každom prípade však môžeme použi metódy opisnej štatistiky (MO), ke sa nedajú použi exaktnejšie metódy. 4. Vyhodnotenie experimentálnych dát Postupujeme poda asti 3. Na testovanie normality sme použili pä testov (Kolmogorovov-Smirnovov D, Kuiperov V, Cramerov-Von Misesov W, Watsonov U a Andersonov-Darlingov A ),V tabuke 1 sú uvedené Phodnoty pre jednotlivé testy. Tabuka 1: Testy normality výberov (Phodnoty)
72 Výber Rozsah Test D Test V Test W Test U Test A Normálne rozdelenie 1 - (1) V 10 0,10 0,10 0,3476 0,3097 0,4408 má 90% 1 () V 10 0,10 0,10 0,3436 0,3099 0,4498 má 90% 1 (3) V 10 0,10 0,10 0,5738 0,589 0,541 má 90% 1 V ,10 0,01 0,003 0,014 0,0104 nemá 99% (1) V 10 0,10 0,10 0,4606 0,4899 0,5030 má 90% () V 9 0,05 0,05 0,0098 0,0069 0,0153 nemá 95% (3) V 10 0,10 0,10 0,175 0,1710 0,1871 má 90% V 9 0,01 0,01 0,0016 0,0010 0,004 nemá 99% (1) V 10 0,10 0,10 0,8359 0,8060 0,8630 má 90% 3 () V 10 0,10 0,10 0,1748 0,1619 0,1618 nemá 90% 3 (3) V 10 0,10 0,05 0,051 0,0511 0,0696 nemá 95% 3 V ,10 0,10 0,4831 0,4399 0,5083 má 90% (1) V 10 0,10 0,10 0,8396 0,8404 0,8345 má 90% 4 () V 9 0,10 0,10 0,796 0,559 0,179 má 90% 4 (3) V 10 0,10 0,10 0,8014 0,7965 0,7999 má 90% 4 V ,10 0,10 0,1703 0,159 0,1378 má 90% V ,10 0,10 0,3 0,045 0,1741 nemá 90% V ,05 0,01 0,0164 0,0107 0,0150 nemá 99% V ,01 0,01 0,0000 0,0000 0,0000 nemá 99% () X 3 () Z tabuky 1 vyplýva, že normálne rozdelenie nemajú náhodné premenné, X,, X 3 X13 X 4 X 1 4 (1) X 3 3 X 4 X 4 X 4 4 (3) (1) () (3) (1) (3),,, a. Naopak náhodné premenné,,,,, (1) () (3), X,,, a X majú normálne rozdelenia. X 1 X 1 X 1 X 1 X Pri testovaní rovnosti rozptylov sme použili Cochranov test, Bartlettov a Leveneov test. Výsledky testov o rozptyloch sú uvedené v tabuke. Bartlettov test sa používa vtedy, ke je splnený predpoklad normality. Leveneov možno použi vtedy, ke nie je splnený predpoklad normality. Výsledky testov sú v tabuke. Tabuka : Testy rovnosti rozptylov (Phodnoty) Nezáv. výbery Hypotéza H 0 C-test B-test L-test Rovnos 1 - (1) () (3) V 1, V 1, V (1) () (3) 1 0,00 0,00 0,03 nie 95% () V,, (1) (1) 3 V () V,, V 3 (3) V (1) () (3) (3) 3 V (1) () (3) ,36 0,55 0,99 áno 95% 0,37 0,55 0,8 áno 95% X X
73 () V,, (1) 4 V 1, (3) V 4 4 V 1, V 3 V, V 4 V 13, V 4 V,, V (1) () (3) V V ,41 0,06 0,16 áno 95% 0,63 0,63 0,59 áno 95% 0,19 0,19 0,8 áno 95% 4 0,00 0,00 0,00 nie 95% ,00 0,00 0,00 nie 95% Z tabuky vidie, že sme zamietli 3 hypotézy o rovnosti rozptylov (1) () (3) H :, :, : H H Na sprehadnenie korektnosti použitých metód a praktického významu testovaných štatistických hypotéz sme vytvorili tabuku 3, z ktorej možno nasledujúce porovnania. Tabuka 3: Použitie korektných metód a praktický význam hypotéz Rozdelenia normálne? Rozptyly rovnaké? áno nie ) Test hypotézy H 0 Metódy Praktický význam hypotézy. Plnenie fliaš. Porovnanie (1) () (3 MOŠ etáp plnenia 1. hubicou nie áno (1) () (3) K-W test etáp plnenia. hubicou nie áno (1) () (3) K-W test etáp plnenia 3. hubicou áno áno (1) () (3) ANOVA etáp plnenia 4. hubicou nie áno 1 3 K-W test plnenia 1. hubicou s plnením 3. hubicou nie áno 4 K-W test plnenia. hubicou s plnením 4. hubicou nie nie 13 4 MOŠ plnenia 1. a 3. hubicou s plnením. a 4. hubicou nie nie MOŠ plnení štyroch hubíc medzi sebou Porovnanie etáp plnenia na jednotlivých hubiciach H1. Dátové súbory v jednotlivých etapách pochádzajú z normálnych rozdelení s rozdielnymi rozptylmi, nespajú teda požiadavky pre použitie vyšších štatistický metód. Použili sme nástroje opisnej štatistiky (MOŠ), konkrétne íselné charakteristiky (priemer, medián, smerodajné odchýlku, minimálnu a maximálnu hodnotu, dolný a horný kvartil) potrebné na konštrukciu Boxovho-Whiskerovho. Rozpätie hodnôt v etape 1 je 3,6 krát väšie ako v etapách a 3. Najmenší priemer hodnôt je v etape 1, najväší v etape 3. Medián je naopak najmenší v etape, najväší v etape 1. Rozdielnos medzi plnením fliaš v etape 1 a v alších evidentne existuje, nevieme ho však rozumne vysvetli. H. Dáta z etapy a 3 nespajú požiadavku normality, rozptyly v jednotlivých etapách sú však rovnaké. Použili sme preto Kruskalov-Wallisov test, ktorý ukázal štatisticky významný rozdiel medzi mediánmi jednotlivých etáp na úrovni spoahlivosti 95%. Z Boxovho-Wiskerovho grafu sme zistili, že medián v etape 3 sa významne líši od ostatných.
74 - 7 - Teda v etape plnenia fliaš hubicou H boli výrazne nižšie hodnoty ako v ostatných dvoch etapách. Rozdielnos plnenia v jednotlivých etapách nevieme rozumne vysvetli. H3. Dáta z etapy nespajú požiadavku normality, rozptyly v jednotlivých etapách sú však rovnaké. Použili sme preto Kruskalov-Wallisov test, ktorý ukázal štatisticky významný rozdiel medzi mediánmi jednotlivých etáp na úrovni spoahlivosti 95%. Z Boxovho- Wiskerovho grafu sme zistili, že mediány sa medzi sebou výrazne odlišujú. V etape 1 je medián najnižší (998,5 ml), vyšší je v etape (1000,5 ml), avšak najvyšší je v etape 3 (100,5 ml). Toto rozdielne plnenie v jednotlivých etapách nevieme rozumne vysvetli. H4. Dáta vo všetkých troch etapách plnenia spajú obidve požiadavky (normalitu, rovnos rozptylov) pre použitie metódy ANOVA. Pretože P-hodnota (0,001) F-testu je menšia ako 0,05, existuje štatisticky významný rozdiel medzi strednými hodnotami jednotlivých etáp plnení na úrovni spoahlivosti 95%. Na zistenie rozdielov medzi strednými hodnotami sme použili Fisherovu LSD (Fisher s least significant difference) metódu, na základe ktorej sme zistili, že existuje štatisticky významný rozdiel medzi strednými hodnotami, stredná hodnota etapy 3 je štatisticky významne menšia ako stredné hodnoty etáp 1 a. Porovnanie dvoch hubíc (spoloný odmerný valec) H1 s H3. Namerané hodnoty vo fašiach naplnených hubicou 1 a hubicou (dáta zo všetkých troch etáp) nespajú predpoklad normality, spajú však predpoklad rovnosti rozptylov. Použili sme preto Kruskalov-Wallisov test, ktorý nepreukázal štatisticky významný rozdiel medzi dvomi mediánmi na úrovni spoahlivosti 95%. Z Boxovho-Wiskerovho grafu sme zistili, že mediány sa rovnajú. Môžeme teda konštatova, že obidve hubice plnia rovnako správne. H s H4. Dáta v tomto prípade nespajú predpoklad normality, spajú však predpoklad rovnosti rozptylov. Použili sme preto Kruskalov-Wallisov test, ktorý síce nepreukázal štatisticky významný rozdiel medzi mediánmi dvoch základných súborov. Ke sa však porovnáme výberové hodnoty priemerov, mediánov, rozptylov a pozrieme na Boxov- Wiskerov graf zistíme, že ich nemôžeme považova za rovnaké s 95% spoahlivosou. Nemôžeme teda tvrdi, že obidve hubice plnia rovnako. Porovnanie všetkých štyroch hubíc Na porovnanie môžeme korektne použi iba metódy MO. Na základe Boxovho- Wiskerovho grafu môžeme tvrdi, že H1 a H plnia rovnaké objemové množstvo, ktoré je väšie ako 1000 ml, kým H plní priemerne o 5 ml menej a H4 priemerne o 6 ml menej. V mediánoch je medzi H a H4 ešte väší rozdiel, teda plnenie týmito dvoma hubicami nemôžeme považova za rovnaké. V13 4 Porovnanie dvoch odmerný valcov (, V ) Vieme, že V 13 predstavuje všetky hodnoty namerané vo fašiach naplnených hubicami H1 a H3, ktoré sú napané z odmerného valca OV1. V 4 predstavujú všetky hodnoty namerané vo fašiach naplnených hubicami H a H4, ktoré sú napané z odmerného valca OV. Dáta nespajú ani jeden z predpokladov (normalita, rovnos rozptylov). Môžeme použi iba metódy MO. Boxov-Wiskerov graf ukazuje pomerne veký rozdiel medzi mediánmi (5,5 ml) aj medzi priemermi (5,4 ml). Môžeme teda tvrdi, že dva odmerné valce neplnia do príslušných hubíc rovnaký objem. 5. Záver Na základe výsledkov analýzy dát sme dospeli k názoru, že všetky uvažovane procesy proces plnenia každej hubice samostatne, proces napania každého valca samostatne a celý
75 proces plnenia vykazujú nestabilitu. Nespajú základne predpoklady ako je normalita, homoskedasticita a pod. Na záver možno konštatova, že prezentované procesy sa v danom stave nedajú regulova ani pomocou jednorozmerných ani pomocou viacrozmerných regulaných diagramov. Štatistickými metódami v riadení kvality sa zaoberajú citované publikácie [1], [], [3], [5], [6], [7], [8], [9] [10]. 6. Literatúra 1. GARAJ, I., JANIGA, I. Dvojstranné toleranné medze pre neznámu strednú hodnotu a rozptyl normálneho rozdelenia. Bratislava: STU, s. ISBN GARAJ, I., JANIGA, I. Dvojstranné toleranné medze normálnych rozdelení s neznámymi strednými hodnotami a s neznámym spoloným rozptylom. Two sided tolerance limits of normal distributions with unknown means and unknown common variability. Bratislava: STU, s. ISBN GARAJ, I., JANIGA, I. Jednojstranné toleranné medze normálneho rozdelenia s neznámou strednou hodnotou a rozptylom. One sided tolerance limits of normal distribution with unknown mean and variability. Bratislava: STU, s. ISBN MICHALKOVÁ, M. Štatistická kontrola presnosti plnenia tekutých látok vo firme AMT, s. r. o. Nové Mesto nad Váhom. Diplomová práca. Vedúci DP: doc. RNDr. Ivan Janiga, PhD. 5. TEREK, M., HRNIAROVÁ,. Štatistické riadenie kvality. Vydavatestvo IURA EDITION, 004, 34 s. ISBN TEREK, M.: Analýza rozhodovania. Bratislava: IURA Edition 007. ISBN TEREK, M., HRNIAROVÁ,. Výberové skúmanie. Bratislava: Ekonóm 008. ISBN GARAJ, I. Požiadavky na rozsah náhodného výberu jednostranných preberacích plánov meraním. In FORUM STATISTICUM SLOVACUM. ISSN , 1/006, s HORNÍKOVÁ, A.: Navrhovanie experimentov so štatistickým softvérom SAS. In FORUM STATISTICUM SLOVACUM. ISSN , 5/008 (v tlai). 10. HORNÍKOVÁ, A.: Normalizácia pri aplikácii štatistických metód. Štatistické metódy v ekonómii: 1. vedecký seminár, Horný Smokovec september 007 : zborník príspevkov. - S Bratislava : Vydavatestvo EKONÓM, 007. Poakovanie: Tento príspevok vznikol s podporou grantových projektov VEGA. 1/318/06 Zlepšovanie kvality produkcie strojárskych výrobkov pomocou moderných štatistických metód a VEGA. 1/147/08 Kvantitatívne metódy v stratégii šes sigma. Adresa autora: Ivan Janiga, doc. RNDr. PhD. Strojnícka fakulta STU, Nám. slobody17, Bratislava, [email protected]
76 Nezamstnanost cizinc v eské republice podle vzdlání Unemployment of Foreigners in the Czech Republic Eva Kaerová Abstract: The number of long-term or permanently residing foreigners in the CR exceeded in the 008 the amount of More then 50 % of them are in the age of economic activity. This paper is focused on unemployment of foreigners in the Czech Republic according to education level. This article came into being within the framework of the long-term research project D0606, "Reproduction of Human Capital", financed by the Ministry of Education, Youth and Sport within the framework of National Research Program II. Key words: Unemployment, education, Czech Republic. Kúové slová: Nezamstnanost, vzdlání, eská republika 1. Úvod Nezamstnanost cizinc je v eské republice relativn novým jevem, který mže v budoucnu nabývat na významu. Dlouhodobý trend nárstu potu cizinc na území eské republiky, rst potu cizinc s trvalým pobytem, piemž vtšina cizinc je ve vku ekonomické aktivity, a tedy pohybují se aktivn na trhu práce, zvyšují riziko nárstu potu nezamstnaných cizinc na území eské republiky. Rizikovým faktorem pro nezamstnanost cizinc je zejména neznalost jazyka a nedostatená integrace do spolenosti. Tyto faktory se však netýkají zamstnanc-cizinc v nadnárodních spolenostech, v nichž dorozumívacím jazykem není jenom eština. Cizinci jsou na trhu práce velmi zranitelným segmentem, jehož (ne)zamstnanost je podstatn ovlivnna výkyvy hospodáského cyklu, a proto je na míst uvažovat o aktivní politice zamstnanosti cílené práv na tuto rizikovou skupinu. V neposlední ad zstává též nezodpovzenou otázkou, zda-li by se v pípad zvyšující se nezamstnanosti cizinc na území eské republiky (zejména pak tch, kteí by mli nárok na podporu v nezamstnanosti a jiné dávky ze systému státní sociální pée a podpory) nezaaly projevovat nacionalistické tendence v majoritní spolenosti, jak tomu bylo v nedávné dob ve Francii a v Nizozemsku.. Nezamstnanost cizinc Kvantitativní data o zamstnanosti cizinc poskytují jednotlivé okresní úady práce, dále Ministerstvo práce a sociálních vcí a eský statistický úad. Avšak údaje jimi poskytované mnohdy postrádají asovou kontinuitu. Tak je tomu napíklad pi zjišování vlivu struktury vzdlání cizinc na jejich nezamstnanost. Poet nezamstnaných meziron ( ) klesl z 371 tisíce na 98 tisíc, piemž klesající tendence vývoje (s výjimkou sezónního kolísání) je patrná již od poloviny roku 004 kdy došlo ke zmn metodiky v mení nezamstnanosti. U uchaze o zamstnání vedených v evidenci úadu práce se krom mnoha jiných údaj zjišuje také údaj o nejvyšším dosaženém vzdlání. Dosažené vzdlání je tídno do 14 skupin (tab. 1). Poet nezamstnaných v jednotlivých vzdlanostních skupinách samozejm krom rizika být nezamstnaný s uritou úrovní vzdlání je ovlivnn celkovým potem osob s dosaženým vzdláním v celé populaci, resp. v nkteré její zkoumané ásti. Úrove dosaženého vzdlání se zjišuje pi sítání lidu, poslední bylo na území R k Tato struktura se samozejm od uvedeného data zmnila o nové absolventy jednotlivých typ škol a také se mní úmrtním. Bohužel nejsou k dispozici údaje o hledajících zamstnání podle všech
77 obanství, a tak jsou poty nezamstnaných v tabulkách 1 a tídny z hlediska obanství dle dostupných kritérií. EU v tomto pípad znamená obany nejen zemí Evropské unie ale i Islandu, Norska, Lichtenštejnska a Švýcarska. asová ada za obany tetích zemí nebo obany R podle vzdlání není k dispozici, tak data celkem bez EU zahrnují jak obany R tak i uchazee o zamstnání ze tetích zemí, kterých bylo evidováno okolo 3 tisíc. Ženy pedstavují mezi nezamstnanými vtšinu (56 %). V celkové populaci je pomr žen a muž 51:49, takže lze konstatovat, že v majoritní populaci jsou nezamstnaností více ohroženy ženy. Mezi nezamstnanými cizinci z EU tvoí ženy také 56 %, pitom však v populaci cizinc z tchto zemí ženy tvoí pouze 40 %. Z hlediska vzdlání jsou nejvíce nezamstnaností ohroženy osoby se základním vzdláním, osoby s výuním listem a osoby se stedoškolským vzdláním, kterému nepedcházelo vyuení. Tyto kategorie jsou zcela jasn vysvtlitelné i etností výskytu tchto vzdlanostních skupin v celkové populaci. Podobná situace je i u oban EU, avšak zde více než polovinu nezamstnaných pedstavují osoby se základním vzdláním. V roce 006 provedlo Ministerstvo práce a sociálních vcí R analýzu míry využívání výuky eského jazyka v rámci rekvalifikaních kurz pro cizince vedené v evidenci úad práce a její efektivity. Údaje byly zjišovány za rok 005 a za období leden až íjen 006. Z analýzy vyplývá, že v roce 005 byla z celkového potu cizinc v evidenci úad práce poskytnuta výuka eského jazyka jako rekvalifikace 66 cizincm (tj. 1,0 %). V období leden až íjen 006 to bylo z 7 64 cizinc 115 cizinc (1,5 %). Podle uvedené analýzy je tento nízký podíl dán zejména malým zájmem cizinc o úast na rekvalifikaci. V roce 005 projevilo zájem o výuku 89 cizinc, v období leden až íjen roku 006 to bylo 157 cizinc. V nkterých pípadech však nebylo možné zájemce do rekvalifikace zaadit, protože se jednalo o jednotlivce a nebylo možné otevít kurz a individuální kurzy úady práce nehradí. Co se týe efektivity kurz zhruba 58 % cizinc, kteí se v roce 005 zúastnili výuky eského jazyka jako rekvalifikace, našlo do 6 msíc práci. Celkem Trvalý pobyt Dlouhodobý pobyt nad 90 dn * Obr. 1: Poet cizinc s trvalým a dlouhodobým pobytem nad 90 dn v R v letech k a v roce 008 k 31.5 Zdroj: MPSV
78 Tabulka 1: Poet nezamstnaných v R k VI.08 Celkem bez "EU" "EU" ženy muži ženy muži bez vzdlání neúplné zákl. vzdlání základní vzdlání nižší stední vzdlání nižší stední odborné vzdlání stední odborné vzdlání s výu.listem st.nebo st.odb. bez mat.i výu.listu ÚSV ÚSO s vyuením i maturitou ÚSO s maturitou (bez vyuení) vyšší odborné vzdlání bakaláské vzdlání vysokoškolské vzdlání doktorské vzdlání Tabulka : Poet nezamstnaných v R k VI.07 Celkem bez "EU" "EU" ženy muži ženy muži Bez vzdlání Neúplné zákl. vzdlání Základní vzdlání Nižší stední vzdlání Nižší stední odborné vzdlání Stední odborné vzdlání s výu.listem St.nebo st.odb. bez mat.i výu.listu ÚSV ÚSO s vyuením i maturitou ÚSO s maturitou (bez vyuení) Vyšší odborné vzdlání Bakaláské vzdlání Vysokoškolské vzdlání Doktorské vzdlání Celkem Nezamstnanost cizinc ze tetích zemí Podle údaj k bylo vedeno v evidenci úad práce celkem 710 oban tetích zemí, z ehož 58 % tvoily ženy. Nárok na dávky v nezamstnanosti mlo 45 % tchto cizinc. Vzdlanostní strukturu oban tetích zemí vedených v evidenci uchaze o zamstnání bylo možné jistit pouze k (obr. ). Potíže pi optovném zalenní na trhu práce lze oekávat u uchaze ze základním vzdláním, kterých je více než polovina. Protože obané tetích zemí asto vykonávají zamstnání s nižšími požadavky na vzdlání mže být ukazatel o nejvyšším dosaženém vzdlání cizinc zavádjící. U nezamstnaných z ad cizinc ze tetích zemí prmrná mzda v posledním zamstnání jen o málo pekraovala minimální mzdu, která byla 8 000,- K. Pouze 34 (1, %) osob z uvedeného
79 celkového potu nezamstnaných oban tetích zemí bylo zaazeno do nkterého z opatení aktivní politiky zamstnanosti. doktorské vzdlání 0% vysokoškolské vzdlání 14% vyšší odborné vzdlání 1% úplné stední odborné vzdlání s maturitou stední odborné vzdlání 14% 17% základní vzdlání 54% 0% 10% 0% 30% 40% 50% 60% Obr. : Vzdlanostní struktura oban tetích zemí vedených v evidenci uchaze o zamstnání (stav k ) Zdroj: MPSV 4. Závr Pro podrobnjší zkoumání integrace cizinc na trhu práce bude do budoucna teba vytvoit systém pravidelného monitoringu nezamstnanosti cizinc, a to jak oban tetích zemí, tak také oban EU/EHP. Jedná se o potebu pravidelného sbru dat týkajících se zejména délky nezamstnanosti cizinc a jejího opakování, výše dávek v nezamstnanosti a posledních výdlk, tíd zamstnání a opatení aktivní politiky zamstnanosti, do nichž jsou cizinci zaazováni. Tyto údaje by mohly pomoci odhalit pípadnou marginalizaci cizinc na eském pracovním trhu. Údaje o cílenosti opatení aktivní politiky zamstnanosti na cizince pak mohou odhalit možné institucionální vylouení cizinc v eské republice. 5. Literatura [1] KOSCHIN, F. A KOL Prognóza lidského kapitálu obyvatelstva eské republiky do roku 050, VŠE, Praha 007. [] BULLETIN. 0 MEZINÁRODNÍ PRACOVNÍ MIGRACE V R. Výzkumný ústav práce a sociálních vcí, Praha 008. [3] [4] [5] [6] Adresa autora Eva Kaerová, RNDr. Vysoká škola ekonomická v Praze Fakulta informatiky a statistiky Katedra demografie nám. W. Churchilla Praha 3 [email protected]
80 Robust GMM estimation Jan Kalina Abstract: The robustification of the GMM (generalized method of moments) estimation has obtained an attention in robust econometrics only recently. This work discusses the weighted generalized method of moments (WGMM) estimator, which is a robust analogy of the GMM estimator based on downweighting less reliable observations. Our aim is to describe possible applications and two special cases of the WGMM estimator for the linear regression and their computational aspects. The first case is the least weighted squares regression modified to be efficient under heteroscedasticity. Another application is the instrumental weighted variables (IWV) estimator, which is a robust analogy of the instrumental variables. We present the computational aspects of the least weighted squares regression, which is crucial for understanding the computational aspects of the robust GMM estimator. Key words: robust econometrics, computational aspects, generalized method of moments, least weighted squares, instrumental variables. Acknowledgement: This work is supported by the grant 40/06/408 (Robustification of the generalized method of moments) of the Grant Agency of the Czech Republic. 1. GMM estimation The generalized method of moments (GMM) was proposed by [4] as a general tool for statistical estimation. The estimator is given by orthogonality conditions and is defined in a very abstract way for a general parametric situation, involving instrumental variables. This chapter starts with a short general description of the estimator and proceeds to two special cases which are popular in applied econometrics. [1] showed the connection to the classical method of moments, so that the estimator can be defined by means of moment conditions allowing for an overidentification. In other words there can be more conditions than parameters of the model. While the classical method of moments estimator is given as the solution of the system of equations g=0, where g is the vector of particular moment conditions, there is no such solution if the overidentifaction occurs. There [4] proposed the estimator in the form min g T Wg and computed the optimal weight matrix W to be the inverse of the variance matrix of the equations g. In practice a consistent estimator is however used instead of W itself. [1] explains that this estimator can be useful as a combination of several available consistent estimators. A numerical example is presented for example in [3] for estimating two parameters of the gamma distribution combining four different moment conditions. The computation involves optimizing a nonlinear function and iterative procedures must be applied, usually based on a linear approximation to the nonlinear function g T Wg. Further paragraphs are devoted to two special cases for the linear regression context. One special case of the GMM estimator is the well known instrumental variables estimator, which has become a standard tool for estimation in econometrics (see [3]).
81 Another special case of the GMM estimator proposed by John Cragg in [] is less known. It is a modification of the least squares regression, which is efficient also under heteroscedasticity. Let us consider the linear regression model in the form Yi b0 b1 xi 1... bp xip ei, i 1,,..., n, (1) which can be rewritten in the usual matrix notation as Y=X+e. [3] or [6] warn that under heteroscedasticity of the random errors e the least squares estimator b of the regression parameters is not efficient, and further the estimator of var b is biased. It follows that the confidence intervals and hypothesis tests concerning are not valid. Therefore it is very useful that [] proposed such transformation, which allows to obtain a more reliable estimator of itself and mainly of var b even without testing if the heteroscedasticity is present in the model (1) or not. The idea of [] is to use some auxiliary variables which could contribute to explaining the variability of the errors e. The usual choice contains squares of all independent variables from (1) and also products of always two different independent variables. This corresponds to using a matrix Q consisting of all columns of the original design matrix X and the auxiliary variables as additional columns. The model (1) is transformed to Q T Y = Q T X + Q T e. () The parameters can be estimated by Aitken s estimator. The variance of matrix of the errors e can be estimated by diagonal matrix S containing squares of residuals Now var b can be estimated by u i = Y i - b -b 1 x -...-b x. 0 1 i p ip X T Q (Q T S Q) -1 Q T X.. Least weighted squares regression The least weighted squares (LWS) regression is a robust regression method with a high breakdown point proposed by [9]. There must be nonnegative weights w1, w,..., w n specified before the computation of the estimator. While the classical weighted regression assigns a fixed and known weight to each observation, in the context of least weighted squares only the magnitudes of the weights are known a priori. These are assigned to the data after a permutation, which is determined automatically only during the computation based on the residuals. It is reasonable to choose such weights so that the sequence w1, w,...,w n is decreasing (non-increasing), so that the most reliable observations obtain the largest weights, while outliers with large values of the residuals get small (or zero) weights. Let us denote the i th order value among the squared residuals for a particular value of the estimate b of the parameter by ui (b ). The least weighted squares estimator b LWS for model (1) is defined as b argmin w u ( b. LWS h i1 i ( i) )
82 The least trimmed squares (LTS) regression proposed by [8] represents a special case of least weighted squares with weights equal to zero or one only. The computation of the LWS estimator is intensive and an approximative algorithm is proposed in [6]. The least weighted squares estimator has interesting applications, which follow from its robustness and at the same time efficiency for normal data. Theoretical properties including the breakdown point of the estimator are studied by [1]. It is especially suitable to use the LWS estimator rather than other robust regression estimators, because diagnostic tools (such as tests of heteroscedasticity and autocorrelation of the errors e) can be computed directly using the weighted residuals and again are not affected by outliers. Such diagnostic tests are equivalent with those computed for least squares regression, see [5]. Another advantage of the estimator is that no detection of outliers is actually needed to compute it, because outlying data are downweighted automatically. [11] conjectures that the LWS estimator is a reasonable compromise between the least squares and least trimmed squares, namely the estimator combines the efficiency of the least squares with the robustness of the least trimmed squares. 3. Robust GMM estimation This section discusses a robust version of the GMM estimator together with robustifications for the two special cases from Section 1, namely the instrumental variables and the regression efficient under heteroscedasticity. All these approaches are based on downweighting less reliable observations similarly with the idea of the LWS regression. While some methods are proposed already by [10] or [11], we discuss other possible ways how to propose robust estimators. [10] proposes the weighted generalized method of moments (WGMM) estimator as a robustification of the GMM estimator in a very general context. There are weights in the system of equations g assigned to particular observations in an implicit way based on the values of the residuals. The equations can be interpreted as weighted sums of residuals. While an algorithm is not available, it must combine the iterative search for the optimal permutation of weights with the iterative nonlinear optimization. Such computation is very intensive. We believe that only the two special cases in the following paragraphs are useful for practical applications. Recalling that [1] recommends the GMM estimator in this general form mainly as a tool to combine several estimators, we suggest to use always robust estimators (robust equations g) and to use the GMM estimator itself, which does not need to be robustified any more. A robust version of the instrumental variables was proposed by [11] and called instrumental weighted variables (IWV) estimator. [11] studies the consistency and asymptotic normality of the estimator and [7] derives asymptotic diagnostic tools based on its residuals, namely tests of heteroscedasticity and autocorrelation of the errors e. The definition is rather technical. The usual instrumental variables is computed as the two-stage least squares estimator, using the regression of the regressor against the instruments in the first step and using the regression of the response against the fitted values from the first step (see [3]). Therefore we propose to compute the robust instrumental variables estimator by applying the least weighted squares in both steps of this two-stage procedure. The other special case of the GMM estimator described in Section 1 was Cragg s modification of least squares ensuring efficiency under heteroscedasticity. The robustification was proposed by [10], who introduces weights to the model (). We stress that there are as many rows in the model () as there are columns in the matrix Q. This is the number of variables in the original model (1) together with the number of auxiliary variables contained
83 in Q. Therefore is an error in the definition of the estimator in [10] and we propose a different approach. Namely our idea is to introduce the weights directly in the model () in the form Q T WY = Q T WX + Q T We, (3) where W is a weight matrix containing weights determined by the least weighted squares in the original model (1). Therefore the whole procedure starts by the LWS and then uses the (classical) weighted regression to estimate in the transformed model (3). The computation of the robust instruments and robust regression efficient under heteroscedasticity is based on computing the least weighted squares regression. Therefore it is crucial to study its computational aspects now. 4. Computational aspects of the least weighted squares regression A fast and reliable algorithm for computing the least weighted squares regression is proposed by [6]. Now we study the computational aspects of both the least weighted squares (LWS) and the least trimmed squares (LTS) estimators. We use the function ltsreg() from package VR of the software package R to compute the LTS estimator and our own subroutine programmed in C++ to compute the LWS estimator, which is not implemented in any commercial software. The following example studies the time series of real gross domestic product (GDP) and real gross private domestic investment (INVESTMENT) in the United States in the years from 1980 to 001. Both variables are expressed as multiples of 10 9 dollars. The data are summarized in Table 1 and come from the website of the U.S. Department of Commerce. The data are adjusted for deflation of money rather than nominal. Therefore it has a reasonable economic interpretation to model INVESTMENT as a linear response of GDP. [3] presents a similar investment equation. Year GDP Investment Year GDP Investment Year GDP Investment Year GDP Investment Table 1: Investment data.
84 - 8 - The least squares estimate for the slope b 1 is highly significant, the t statistic equals t=15.8 and the corresponding p-value is less than Therefore the linear model appears to be reasonable. The coefficient of determination equals R =0.91. Intercept GDP u i1 19 i1 19 i1 i u( i ) w u i ( b) ( i ) ( b) LS LTS; h=19 LWS Table : Results of the example with investment data. Table starts with results of the least squares. A subjective search for a proper value of the trimming constant for the least trimmed squares suggests to choose h=19. The years 1998, 1999 and 000 are detected as outliers. The weights determined by the least weighted squares are values of a linear decreasing function with values 1, 1-1/n,..., 1/n standardized so that the sum of weights equals 1. The least weighted squares regression searches for the minimal weighted sum of squared residuals over all permutations of the weights. In our example, these optimal weights are equal to (15,9,,0,6, 10,18,1,17,13, 8,,4,7,14, 1,19,11,5,3, 1,16) T standardized so that the sum of weights equals 1. The estimates of the intercept and slope in Table suggest the least weighted squares to be a reasonable compromise between the least squares and least trimmed squares. Now we verify that our algorithm for computing the least weighted squares estimate gives a reliable result. Our argument resembles that of [9] who studies the tightness of his least trimmed squares algorithm. We compare the trimmed sum of squared residuals and the weighted sum of squared residuals of the least trimmed squares (again with h=19) and the least weighted squares with linear weights from Table. The least trimmed squares minimize the value of 19 i1 u( i ) and namely they find the minimal value of this loss function to be (see again Table ). While the least weighted squares yield a much larger value , one would deduce that also ( b)
85 i 1 w u i is larger compared to least trimmed squares. However the LTS yield the value and the LWS designed to minimized this weighted sum of squared residuals find a much smaller value Therefore the approximation to least weighted sum of squares minimizes the loss function reliably, which gives evidence in favour of the approximative algorithm. ( i ) ( b) 5. References [1] ÍŽEK, P Efficient robust estimation of time-series regression models. In: Applications of Mathematics 53, Nr. 3, [] CRAGG, J.G More efficient estimation in the presence of heteroscedasticity of unknown form. In: Econometrica 51, No. 3, [3] GREENE, W.H. 00. Econometric analysis. Fifth edition. Macmillan, New York. [4] HANSEN, L.P Large samples properties of generalized method of moments estimators. In: Econometrica 50, Nr. 4, [5] KALINA, J Autocorrelated errors of least weighted squares. In: Forum Statisticum Slovacum 3, Nr., [6] KALINA, J Robust regression and diagnostic tools. In Kupka K. (ed.): Data analysis 007/II, Progressive methods of statistical data analysis and modelling for research and technical practice, Trilobyte, Pardubice. In print. [7] KALINA, J Computing robust GMM estimators. Submitted to Computational statistics and data analysis. [8] ROUSSEEUW P.J. LEROY A.M Robust regression and outlier detection. Wiley, New York. [9] VÍŠEK, J.Á Regression with high breakdown point. In Antoch J., Dohnal G. (eds.): Proceedings of ROBUST 000, Summer School of JMF, JMF and Czech statistical society, [10] VÍŠEK, J.Á Robustifying generalized method of moments. In Kupka K. (ed.): Data analysis 004/II, Progressive methods of statistical data analysis and modelling for research and technical practice, Trilobyte, Pardubice, [11] VÍŠEK, J.Á Instrumental weighted variables. In: Austrian Journal of Statistics 35, Nr. &3, [1] WOOLDRIDGE, J.M Applications of generalized method of moments estimation. In: Journal of Economic Perspectives 15, Nr. 4, Address of the author: Jan Kalina, Dr.rer.nat. KPMS MFF UK Sokolovská Praha 8 Czech Republic [email protected]
86 Stabilita poptávky po penzích v eské republice Money Demand Stability in the Czech republic Svatopluk Kapounek Abstrakt The effectiveness and success of a monetary policy depends on a stable money demand function. The stable money demand function ensures that the money supply would have predictable impact on the macroeconomic variables such as inflation and real economic growth. This article deals with the money demand definition under the Keynes theoretical aproach and selected monetary aggregates M1, M and M3 in the Czech republic for the year The target of the article is empirical analysis of the money demand stability with the CUSUM and Hansen s stability tests. Key words stability test CUSUM, Hansen s stability test, monetary aggregates, optimum currency area, asymmetric shock Kúové slová test stability CUSUM, Hansenv test stability, penžní agregáty, efektivita hospodáské politiky 1. Úvod Stabilita poptávky po penzích je spolu s její úrokovou elasticitou hlavní podmínkou efektivnosti mnové a fiskální politiky, nebo umožuje zajistit pímou vazbu mezi relevantními mnovými agregáty a nominálním dchodem. Její dležitost roste v prostedí inflaního cílení spolu s potebou predikce dopad zmn charakteru monetární politiky na inflaci a ekonomický rst. Kvantitativní rovnice penz definuje vztah mezi množstvím penz v ekonomice, reálnou produkcí a inflací prostednictvím následujícího vztahu: M V PY, (1) kde M vyjaduje mnovou zásobou, V rychlost obhu penz v ekonomice, P agregátní cenovou hladinou a Y reálný produkt. Z pohledu keynesiánc lze za pedpokladu konstantní rychlosti obhu penz v ekonomice považovat za jediný spojovací lánek (mezi zmnou množství penz v ekonomice a reálným dchodem) úrokovou sazbu. Pedpokládejme, že pro uritý objem celkového bohatství drží ekonomické subjekty jednu jeho ást v penžní form a zbývající ást bohatství v jiných formách aktiv. V cenných papírech, nemovitostech, dlouhodobých vkladech, cennostech apod. Keynes vymezuje poptávku po penzích prostednictvím funkce preference likvidity a motiv držby penz (transakní, opatrnostní a spekulaní motiv). Poptávka po penzích z transakního a opatrnostního motivu je pitom pozitivn závislá zejména na úrovni reálného dchodu a negativn na úrokové sazb. Spekulativní motiv pedstavuje poptávku po alternativních aktivech, než jsou peníze. Tato alternativní aktiva se ovšem vyznaují rznými výnosy i riziky. Reakce poptávky po penzích na výši úrokové sazby v pípad spekulativního motivu je proto více i mén diskutabilní. Pi oekávaní zvýšení úrokových sazeb tento motiv mže pozitivn ovlivnit poptávku investor po penzích, nebo se tito mohou pesunovat svá aktiva z alternativních, rizikovjších aktiv zpt do penžních zstatk.
87 Keynesovu funkci poptávky po penzích (funkci preference likvidity) lze zapsat vztahem: M D f ( Y, IR) P, () kde M D je poptávka po nominálních penžních zstatcích, P agregátní cenová hladina, Y reálný dchod a IR úroková sazba. Keynes dále pedpokládá, že agregátní cenová hladina je v krátkém období nepružná z dvodu rigidit mezd a cen (Mach, 00). Pro další empirickou analýzu proto faktor zmny cenové hladiny nebude uvažován. Pi empirických odhadech rzn specifikovaných model poptávky po penzích k tmto (výše uvedeným) základním vysvtlujícím faktorm pistupují i exogenní vlivy, které se však v ad pípad nahrazují z dvodu obtížné kvantifikace pomocí proxy promnných (Hušek a Pelikán, 003, s.114). Zatímco teoretické vymezení poptávky po penzích je založeno na pístupech jednotlivých ekonomických škol, její empirická definice vychází z pedpokladu rovnosti skutené penžní zásoby a poptávky po penzích. S rozvojem finanních trh lze do empirické poptávky po penzích zahrnout nejen poptávku po obživu jako takovém ale také bezhotovostní peníze (vklady u bankovních i jiných institucí). Závislost rzných druh penz, odlišujících se rzným stupnm jejich likvidity, na úrokové sazb a dchodu z dvodu rzných motiv poptávky po penzích je diskutabilní. Jak uvádí Revenda (Revenda a kol, 1999, s.6): nejlepším vymezením penz je to, které nejlépe pedpovídá vývoj tch promnných, jež by peníze mely vysvtlit. V empirické ásti tohoto lánku bude proto uvažováno s více zpsoby vymezení penz prostednictvím penžních agregát M1, M a M3. Penžní agregát M1 tvoí hotovostní obživo a vklady na bžných útech v bankách. Penžní agregát M se skládá z penžního agregátu M1, z úsporných vklad v bankách a termínovaných vklad v bankách. Penžní agregát M3 je pak oproti M rozšíen o euromnové vklady u domácích bank. V nkterých pípadech lze použít také agregáty M4 i M5, od širšího vymezení penz než je vymezuje penžní agregát M3 bude ovšem vzhledem k teoretickým úvahám pramenících z keynesiánské poptávky po penzích v tomto píspvku abstrahováno. Píspvek se zabývá nejen výše uvedenou definicí poptávky po penzích z pohledu keynesiánské ekonomické teorie a jejím empirickým odvozením pro eskou republiku, ale pedevším testováním její stability. Cílem píspvku je ovit hypotézu, zda je poptávka po penzích mená rznými penžními agregáty v eské republice stabilní i nikoliv.. Metodika Thomas (1993) popisuje stabilitu funkce poptávky po penzích jako stálost vztahu mezi poptávkou po penzích a nkolika málo promnnými. Pedpokládá, že více než dv i ti významné vysvtlující promnné identifikované vícerozmrnou regresní analýzou negativn ovlivují stabilitu poptávky po penzích. Hušek a Pelikán (003) hovoí o stabilit poptávky po penzích v souvislosti se stálostí parametr vícerozmrné regresní funkce v ase a zárove v souvislosti s relativn malým rozptylem náhodné složky. Nejastji používaným testem stability poptávky po penzích je CUSUM test založený na kumulovaných soutech reziduí (Greene, 003). Testovou statistikou je: S n tk1 t N tk1 w w t t kde w t jsou rekurzivní rezidua modelu. Za pedpokladu hypotézy o konstantnosti parametr (3)
88 ( t k) E S t (4) ( T k) pro t jdoucí od nuly za pedpokladu t=k k t=t. Test je prezentován prostednictvím grafu promnné S t vi t, kde horní a dolní mez tvoí hranice 5% hladiny významnosti. (Brown, Durbin a Evans, 1975) Pomocným nástrojem pro identifikaci stability/nestability modelu slouží také graf rekurzivních reziduí w t yt x tbt1 wt pro t=k+1,...,t. (5) 1 1/ 1 x( XX ) x ) ( t t t1 t Podmínkou je nezávislé a normální rozdlení s nulovou stední hodnotou a konstantním rozptylem rekurzivních reziduí. Pokud rekurzivní rezidua v grafu pekroí horní i dolní mez, model lze považovat za nestabilní. Velmi elegantním nástrojem pro identifikaci nestability parametr v lineárním modelu je Hansenv test. (Hansen, 199). Mjm standardní lineární regresní model, kde: y 1, (6) t x1, t x, t mxm, t E e t x t 0, E e. t Prostednictvím OLS odhadu získáváme odhad parametr kde eˆ t t t 0 n t1 n x i e ˆ, t t 0 ( ˆ ˆ ), t1 e t t ˆ a ˆ. Za podmínky pro i = 1,..., m (7) y x ˆ. Vztah (7) lze pro úely definice testového kritéria zapsat jako f i, t x ˆ i, tet, i1,..., m. (8) eˆ ˆ t, i m1 Za pedpokladu, že je kumulativní souet reziduí S i,t roven nule, kde n S i f, t t1 i, t, (9) je testové kritérium pro stabilitu jednotlivých parametr modelu definován vztahem kde 1 Li nv n t1 n i t1 V i f i, t S i, t, (10). (11) Testové kritérium pro stabilitu všech parametr modelu souasn pak kde 1 L n V n t1 n t1 S V 1 t S t, (1) f t f t. (13)
89 Hypotéza pitom pedpokládá nulovou stední hodnotu podmínky f i,t a kumulativnímu soutu blížícímu se nule, proti hypotéze alternativní, že parametry modelu jsou nestabilní. 3. Výsledky empirické analýzy Pro empirickou analýzu byly zvoleny mezironí zmny tvrtletních absolutních hodnot mnové zásoby definované penžním agregátem M1, M a M3, dle mezironí zmny tvrtletních absolutních hodnot HDP v konstantních cenách a mezironí zmny tvrtletních prmr krátkodobé jednodenní úrokové sazby na mezibankovním trhu a to v období 003/1 008/1. Výsledky vícerozmrné regresní analýzy v Tabulce 1 prezentují 3 statisticky významné modely na 1% hladin významnosti. Druhý a tetí model odhaduje poptávku po penzích definovanou prostednictvím penžních agregát M a M3. Oba tyto modely sice vykazují významnost a to vetn parametr, nicmén pozitivní kauzalitu mezi úrokovou sazbou a poptávkou po penzích lze pedpokládat pouze v pípad spekulativního motivu, kdy je poptávka po penzích determinována oekáváním ekonomických subjekt, tedy budoucími hodnotami úrokové sazby. Výsledky odhad model pedpokládají zpoždní ádu t-1, což nekoresponduje s pedpoklady ekonomické teorie. Tabulka1: Výsledky vícerozmrné regresní analýzy odhad parametr SE t-statistika F-test p-value DW n Model M1 53,930 0,000 0,66 1 Y t,317 0,3 10,380 0,000 IR t -0,094 0,047-1,999 0,060 Model M 148,880 0,000 0,378 0 Y t 1,701 0,107 15,940 0,000 IR t-1 0,058 0,03,486 0,03 Model M3 153,560 0,000 0,550 0 Y t 1,754 0,108 16,196 0,000 IR t-1 0,059 0,04,506 0,0 Naopak, model poptávky po penzích definovaný prostednictvím penžního agregátu M1 napluje keynesiánské pedpoklady motiv držby penz v souvislosti s transakním i opatrnostním motivem. Nízký rozptyl náhodné složky daný významností modelu (F-test) a pouze dv promnné mající vliv na poptávku po penzích potvrzují volbu prvního modelu pro testování stability jeho parametr. Obrázek 1 prezentuje výsledky CUSUM testu. Kumulativní souet reziduí modelu poptávky po penzích neprotíná horní i dolní mez danou 5% hladinou významnosti a tedy lze pedpokládat, že funkce poptávky po penzích odvozená v tomto píspvku je stabilní. Graf rekurzivních reziduí (obrázek ) již tak pesvdiv o stabilit poptávky po penzích definované prostednictvím penžního agregátu M1 nehovoí. Výsledky Hansenova testu stability parametr modelu prezentuje Tabulka. Na 5% hladin významnosti nezamítnul Hansenv test hypotézu o stabilit parametr pouze v pípad parametru reálného HDP. Spolený test parametr i parametr úrokové sazby zamítl hypotézu o stabilit.
90 Obrázek 1: Kumulativní souet reziduí (CUSUM test) Obrázek : Rekurzivní rezidua Tabulka: Výsledky Hansenova testu stability parametr Test parametr t-statistika p-value Spolený 1,9141 0,0000 Y t 0,4466 0,0600 IR t 1,057 0, Závr Jak již bylo eeno v úvodu tohoto píspvk, stabilita poptávky po penzích je základní podmínkou efektivní aplikace nástroj hospodáské politiky, zejména pak monetární politiky ve smyslu podpory trvalého a udržitelného ekonomického rstu a stabilizace cenové hladiny ze strany centrální banky. Poptávka po penzích byla dle keynesiánského konceptu definována prostednictvím transakního, opatrnostního a spekulativního motivu a determinována reálným ekonomickým rstem a krátkodobou úrokovou sazbou na mezibankovním trhu. Z empirického hlediska bylo pro odvození keynesiánské funkce preference likvidity použito penžního agregátu M1, zahrnujícího hotovostní obživo a vklady na bžných útech v bankách. Pro agregáty M a M3 nebyl v tomto píspvku nalezen významný regresní model.
91 Hypotéza o stabilit poptávky po penzích byla podpoena jednoduchostí modelu (pouze dv promnné), jeho významností i významností jeho parametr. Stabilitu podpoil také test založený na kumulovaných soutech reziduí, CUSUM test. Test rekurzivních reziduí a Hansenv test stability parametr modelu hovoí ovšem proti stabilit poptávky po penzích definované v tomto píspvku. Základní problém odhadu poptávky po penzích je možné vidt v její determinaci. Pokud je poptávka po penzích urována exogenním zpsobem ze strany centrální banky, lze jednorovnicový model odhadnutý v tomto píspvku považovat za dostatený. Za pedpokladu endogenního charakteru poptávky po penzích je nutné uvažovat nap. soustavu simultánních rovnic i kiontegraní analýzu zahrnující error correction model. Z výsledk empirické analýzy v tomto píspvku lze íci, že poptávka po penzích v eské republice v letech je významn determinována reálným ekonomickým rstem a krátkodobou tržní úrokovou sazbou a je tedy možné ji efektivn ovlivovat nástroji monetární politiky centrální banky (operace na mezibankovním trhu urující výši tamní krátkodobé úrokové sazby). eská republika se ovšem stále adí mezi posttransformaní ekonomiky s ne pln rozvinutým kapitálovým trhem. Stejn tak ada strukturálních zmn související s procesem evropské integrace významn omezují stabilitu poptávky po penzích testovanou metodami vyvinutými pedevším pro rozvinuté tržní ekonomiky a dlouhé asové ady. 5. Literatura [1] BROWN, R.L., DURBIN, J. AND EVANS, J.M. (1975): TECHNIQUES FOR TESTING THE CONSTANCY OF REGRESSION RELATIONSHIPS OVER TIME. JOURNAL OF THE ROYAL STATISTICAL SOCIETY B37, PP ; [] GREENE, W.H. (003): ECONOMETRIC ANALYSIS. FIFTH EDITION. NEW JERSEY: PEARSON EDUCATION PP ISBN: ; [3] HANSEN, B.E. (199): TESTING FOR PARAMETER INSTABILITY IN LINEAR MODELS. JOURNAL OF POLICY MODELING. VOL 14 PP ; [4] HUŠEK, R., PELIKÁN, J. (003): APLIKOVANÁ EKONOMETRIE. TEORIE A PRAXE. PRAHA: PROFESSIONAL PUBLISHING PP , ISBN: ; [5] MACH, M. (00): MAKROEKONOMIE, POKROILEJŠÍ ANALÝZA. PRAHA: MELANDRIUM. 00. PP 7-74, ISBN: ; [6] REVENDA, Z. A KOL. (1999): PENŽNÍ EKONOMIE A BANKOVNICTVÍ. PRAHA: MANAGEMENT PRESS PP ISBN: ; [7] THOMAS, R.L. (1993): INTRODUCTORY ECONOMETRICS: THEORY AND APPLICATIONS. LONDON: LONGMAN ECONOMICS ISBN: Adresa autora: Ing. Svatopluk Kapounek Ph.D. Ústav financí Mendelova zemdlská a lesnická univerzita v Brn Zemdlská l eská republika Brno [email protected]
92 Diferenciácia slovenských domácností vyplývajúca z ekonomickej aktivity Differentiation of Slovak Households Followed from the Activity Status Alena Kašáková, Gabriela Nedelová Abstract: The aim of this article is to detect the difference in demographic and incomeexpenditure characteristics among the Slovak households separated into groups according to activity status using the logistic regression. Key words: household income, consumption expenditures, Household Budget Surveys, activity status, logistic regression. Kúové slová: príjem domácnosti, spotrebné výdavky, štatistika rodinných útov, ekonomická aktivita, logistická regresia. 1. Úvod Cieom príspevku je popísa rozdiely v demografických a príjmovo-výdavkových charakteristikách medzi skupinami slovenských domácností v lenení poda ekonomickej aktivity s využitím nominálnej (multinomickej) logistickej regresie. Pre analýzu sme použili najnovšie údaje štatistiky rodinných útov, ktoré sme mali k dispozícii a to za rok 006, pre ich spracovanie sme využili štatistický softvér SPSS.. Vybrané ukazovatele domácností v lenení poda ekonomickej aktivity Do roku 003 sa na Slovensku realizoval kvótový zámerný výber spravodajských jednotiek do výberovej vzorky. Na základe odporúania Eurostatu sa od roku 004 zmenil spôsob výberu a od sa výber uskutouje náhodne. Zmenil sa aj spôsob klasifikácie domácnosti poda ekonomickej aktivity. Tabuka 1. Klasifikácia domácností poda ekonomickej aktivity Do roku 003 Od roku manuálne pracujúci mimo 1 ponohospodárstva pracujúci (na plný aj iastoný úväzok) samostatne zárobkovo inný zamestnaný, ale doasne mimo prácu 3 nemanuálne pracujúci 3 nezamestnaný 5 manuálne pracujúci v ponohospodárstve 4 nepracujúci starobný dôchodca 7 nepracujúci starobný dôchodca 5 študent, ue, vojak základnej služby 6 ekonomicky neaktívny, žena v domácnosti 7 neschopný práce 9 neaplikovatené (diea do16 rokov, ak nezaradené, do kódu 5) Z rodinných útov je možné pozna informácie o pote lenov domácností, ich štruktúre poda ekonomickej aktivity, zamestnania, postavení referenta domácnosti. Rodinné úty podávajú široký a podrobný prehad o príjmoch domácností aj o výdavkovej štruktúre poda medzinárodnej klasifikácie COICOP, poda ktorej je možné všetky výdavky domácností rozleni do 1 výdavkových skupín. Z nasledujúcich tabuliek je zrejmá diferencovanos sledovaných ukazovateov v domácnostiach lenených poda ekonomickej aktivity.
93 Tabuka. Demografické a príjmové charakteristiky domácností poda skupín ekonomickej aktivity (v novom lenení platnom od roku 004) v priemere za mesiac v roku 006 EA Poet lenov domácnosti Poet nezaopatrených detí Hrubý príjem Sociálny príjem Príjmy z majetku Iné príjmy istý príjem 1 3,9 1, , ,90 90, , ,4 3,09 0,8 5 63, ,55 0, ,55 993,73 3,91 0, , ,84 15,77 18, ,91 4 1,8 0, , ,86 4,87 391, ,65 5,00 0, , ,00 0, , ,00 6,77 0, , ,57 17,61 746, ,9 7,46 0, , ,37 65, , ,50 9 1,00 0, , ,50 0,00 0, ,50 Zdroj: Vlastné spracovanie. Údaje rodinných útov, ŠÚ SR, 007. Tabuka 3. Objem priemerných mesaných výdavkov domácností poda skupín ekonomickej aktivity v roku 006 Potraviny a nealkoholické Alkohol a Odievanie Nábytok a Bývanie, voda, zariadenie EA nápoje tabak a obuv energia, palivá domácnosti Zdravie ,49 738, , , ,08 589, ,0 395, , ,05 394,85 676, ,97 590,59 684, ,64 39,16 58, ,33 406,34 61, ,73 741,86 714, ,5 116,50 37, ,00,60 630, ,60 61,45 58, ,39 391,11 409, ,37 594,50 735, ,8 787,88 691, ,5 54,00 05, ,00 161,30 368,50 pokraovanie tabuky EA Doprava Pošta a telekomunikácie Rekreácia a kultúra Vzdelanie Hotely a reštaurácie Ostatné tovary a služby 1 469, , ,60 6, ,64 36, ,83 97,46 971,44 90,91 986, , ,84 836,08 738,80 30,9 487,71 949, ,94 61,46 787,81 40,83 83,6 771, ,00 840,50 308,45 1,50 394,00 843, ,47 784, ,58 1,50 518, ,9 7 83,00 879, ,41 41,06 449,3 956, ,00 49,45 145,5 0,00 0,00 8,40 Zdroj: Vlastné spracovanie. Údaje rodinných útov, ŠÚ SR, Použitie logistickej regresie Pre analýzu domácností za rok 006 bolo k dispozícii 4701 pozorovaní o hospodárení domácností a ich demografických charakteristikách. Štruktúra sledovaných domácností poda ekonomickej aktivity je uvedená v tabuke 4. Pre vemi malú poetnos sme z analýzy vylúili skupiny, 5 a 9, iže celkovo 15 pozorovaní. Najpoetnejšiu skupinu 1- domácnosti pracujúcich - sme ponechali bezo zmien,
94 - 9 - skupiny 3, 6 a 7 sme pre analýzu zlúili, alej ich nazveme skupinou, kde referent domácnosti je nepracujúci, ale nie dôchodca (nepracujúce domácnosti) a vo výstupe v prílohe je táto skupina oznaená ako skupina 3. Poslednou sledovanou skupinou domácností sú dôchodcovské domácnosti (skupina 4). Referennou skupinou oproti ktorej sa predchádzajúce dve skupiny domácností porovnávali bola skupina 1 domácnosti pracujúcich. Tabuka 4. Štruktúra sledovaného súboru poda ekonomickej aktivity Skupina EA Poet pozorovaní Podiel (v %) Skupina EA Poet pozorovaní Podiel (v %) ,5 5 0,0 11 0, ,9 3 18,7 7 13, ,9 9 0,3 Celkom ,0 Do modelu boli najprv vybrané všetky demografické, príjmové a výdavkové charakteristiky, postupne však boli vylúené nevýznamné charakteristiky. Vysvetovanou premennou bola ekonomická aktivita domácnosti, štatisticky významnými vysvetujúcimi premennými demografické charakteristiky - poet lenov domácností a poet nezaopatrených detí, charakteristiky príjmu istý peažný príjem a sociálny príjem a výdavkové položky náklady na bývanie, dopravu, vzdelanie a zdravie. Na hladine významnosti 0,05 je model ako celok aj všetky uvedené vysvetujúce premenné štatisticky významné. Nagelkerkovo R = 0,735 vyjadruje dobrú kvalitu modelu, diskriminaná sila modelu je vysoká, model dobre klasifikoval 89,3 % prípadov z celkového potu domácností. V prípade pracujúcich domácností bolo dobre klasifikovaných 95,7 %, z dôchodcovských domácnosti bolo správne klasifikovaných 9,6 % prípadov a zostávajúca skupina domácností nepracujúcich osôb bola správne klasifikovaná len v 7,8 % prípadov (ale v tejto skupine domácností je aj najnižší poet pozorovaní len 6,3 % z celkového potu sledovaných domácností). Všetky výsledky využitia multinomickej logistickej regresie sú uvedené v prílohe a popísané v závere. 4. Záver Interpretáciou získaných parametrov modelu zisujeme, že v roku 006 pre slovenské domácnosti pracujúcich, nepracujúcich a dôchodcov platili nasledujúce vzahy: - ak sa zvýšil poet lenov domácnosti o 1 osobu, šanca, že domácnos je o nepracujúca vzrástla oproti tomu, že je pracujúca 1,54 krát o dôchodcovská oproti tomu, že je pracujúca poklesla 0,73 krát, - ak sa zvýšil poet nezaopatrených detí, pri nezmenených ostatných vysvetujúcich charakteristikách, šance, že ide o pracujúcu domácnos v oboch skupinách (nepracujúca i dôchodcovská) domácností poklesli (viac v skupine dôchodcovských domácností), - to isté platí aj pre istý príjem domácnosti, - ak sa zvýšil sociálny príjem domácnosti o 1 tis. Sk, šanca, že ide o nepracujúcu domácnos sa zvýšila 1,31 krát, že ide o dôchodcovskú domácnos 1,6 krát oproti pracujúcej domácnosti, - ak sa zvýšili výdavky na bývanie, dopravu aj na zdravie, šance, že domácnos je dôchodcovská alebo nepracujúca klesli oproti pracujúcej domácnosti, avšak v dôchodcovských domácnostiach bol pokles šance len vemi mierny, - zaujímavý je výsledok týkajúci sa výdavkov na vzdelanie pri zvýšení výdavkov na vzdelanie o 1000 Sk sa mení šanca, že domácnos je nepracujúca 0,653 krát (klesá)
95 ale šanca, že domácnos je dôchodcovská rastie oproti tomu, že domácnos je pracujúca 1,15 krát. V slovenských domácnostiach v roku 006 je možné považova za najvýznamnejšie premenné identifikujúce príslušnos ku skupine domácností poda ekonomickej aktivity (pracujúcich, nepracujúcich a dôchodcovských domácností) nasledujúce charakteristiky: poet lenov domácnosti, poet nezaopatrených detí, istý a sociálny príjem a z výdavkových položiek hlavne náklady na vzdelanie a na zdravie, iastone aj na bývanie a dopravu. 5. Literatúra [1] HEBÁK, P. A KOLEKTÍV Vícerozmrné statistické metody [3]. Praha: Informatorium, 005. ISBN [] PECÁKOVÁ, I Logistická regrese s vícekategoriální vysvtlovanou promnnou. In: Acta Oeconomica Pragensia. 007, ro. 15,. 1. Praha: Vysoká škola ekonomická, 007, s ISSN [3] EHÁKOVÁ, B Nebojte se logistické regrese. In: Sociologický asopis. 000, ro. 36,. 4. Praha: Sociologický asopis, 000 AV R, s ISSN [4] STANKOVIOVÁ, I., VOJTKOVÁ, M Viacrozmerné štatistické metódy s aplikáciami. Bratislava: Iura Edition, 007. ISBN [5] STANKOVIOVÁ, I Logistická regresia a jej využitie v ekonomickej praxi. In: Forum Statisticum Slovacum. 007, ro. III,. 1. Bratislava: Slovenská štatistická a demografická spolonos, 007, s ISSN [6] STANKOVIOVÁ, I Logistická regresia a jej využitie v ekonomickej praxi. In: Forum Statisticum Slovacum. 008, ro. IV,.. Bratislava: Slovenská štatistická a demografická spolonos, 008, s ISSN Adresa autora: Alena Kašáková, Ing., PhD. KKMI EF UMB Tajovského Banská Bystrica [email protected] Gabriela Nedelová, RNDr., PhD. KKMI EF UMB Tajovského Banská Bystrica [email protected] Príspevok vznikol s podporou grantu KEGA 3/514/07.
96 Prílohy: Model Fitting Information Goodness-of-Fit Model Model Fitting Criteria Likelihood Ratio Tests - Log Likelihood Chi- Square df Sig. Intercept Only 7634,383 Final 3307, ,59 16,000 Likelihood Ratio Tests Chi-Square df Sig. Pearson 1,74 E ,000 Deviance 3307, ,000 Classification Effect Model Fitting Criteria Likelihood Ratio Tests - Log Likelihood of Reduced Chi- Model Square df Sig. Intercept 3344,81 36,490,000 pocclen 3348,098 40,307,000 nezdet 3366,358 58,568,000 cptis 3698,13 390,4,000 socprtis 5384,94 077,15,000 byvtis 3317,599 9,808,007 doprtis 3314,637 6,846,033 vzdtis 3315,841 8,050,018 zdrtis 3317,859 10,069,007 Observed Predicted Percent Correct ,7% ,8% ,6% Overall Percentage 66,5%,7% 3,8% 89,3% Pseudo R-Square Cox and Snell,608 Nagelkerke,735 McFadden,533 EA a 3 4 Intercept pocclen nezdet cptis socprtis byvtis doprtis vzdtis zdrtis Intercept pocclen nezdet cptis socprtis byvtis doprtis vzdtis zdrtis a. The reference category is: 1. Parameter Estimates B Std. Error Wald df Sig. Exp(B) Lower Bound Upper Bound -1,175,195 36,7 1,000,430,109 15,691 1,000 1,538 1,43 1,903 -,55,13 17,613 1,000,576,445,745 -,138,01 17,943 1,000,871,851,89,7, ,165 1,000 1,31 1,73 1,35 -,087,03 7,407 1,006,916,861,976 -,19,066 3,848 1,050,879,773 1,000 -,47,330 1,671 1,196,653,34 1,46 -,345,13 7,866 1,005,708,557,901 -,66,163,650 1,104 95% Confidence Interval for Exp(B) -,319,108 8,661 1,003,77,588,899-1,149,160 51,501 1,000,317,3,434 -,174,011 49,00 1,000,840,8,858,48,017 88,309 1,000 1,619 1,567 1,673 -,006,019,089 1,766,994,958 1,03 -,01,011 1,151 1,83,988,967 1,010,137,054 6,503 1,011 1,147 1,03 1,75 -,10,056 3,330 1,068,903,809 1,008
97 Grilichesove konzistentné hranice parametrov Cobbovej-Douglasovej produknej funkcie stavebných podnikov Griliches consistent bounds of Cobb-Douglas production function parameters of construction companies Samuel Koróny 1 Abstract: The paper deals with application of Griliches consistent bounds of Cobb-Douglas production function parameters. Examined production function was estimated from absolute economic production indicators of Slovak construction joint stock and ltd. companies from the year 001 (value added, sum of assets and average number of employees). Keywords: Regression analysis, Errors in variables, Construction sector Kúové slová: Regresná analýza, Chyby v premenných, Stavebníctvo 1. Úvod Príspevok vone nadväzuje na Klepperove ohranienia regresných parametrov (Klepper 1984) aplikované na Cobbovu-Douglasovu produknú funkciu (alej CDPF) slovenských stavebných podnikov (Koróny 008). Grilichesov postup pre zistenie konzistentných ohraniení regresných parametrov je starší (Maddala 199 poda Griliches 1971) a vychádza z predpokladu znalosti podielu rozptylu chybovej zložky voi príslušnej premennej.. Dáta Pre zistenie konzistentných hraníc parametrov CDPF boli opä použité vybrané ukazovatele - pridaná hodnota (v mil. Sk) ako výstup, priemerný evidenný poet zamestnancov vo fyzických osobách a celkový kapitál (v mil. Sk) ako vstupy súkromných slovenských stavebných podnikov právnej formy a. s. a s. r. o. Údaje sú z výkazu ŠÚ SR Prod 3-04 za rok 001. Regresná analýza dát bola urobená v štatistickom systéme SPSS verzia Vzahy pre Grilichesove konzistentné hranice regresných parametrov Majme lineárny regresný model s dvomi nezávislými premennými v normalizovanom tvare y x x e 1 1, v ktorom všetky premenné sú merané s chybou. Nech pozorované premenné sú Y y v, X x u, X x u Za navzájom nekorelované považujeme chybové zložky u, u, v 1 a tiež nekorelované s premennými x1, x, y. Chybové zložky e a v sa dajú zahrnú do jednej zloženej chyby v premennej Y, preto var( e v). Nech cov( X1, X ). Rozptyly relatívnych chýb nezávislých premenných oznaíme 1 Samuel Koróny, Ústav vedy a výskumu UMB, Banská Bystrica
98 var( u ) var( u) var( u ), var( u). var( X ) var( X1) Regresná rovnica v pozorovaných premenných je kde Y X X w 1 1, w e v u u 1 1. Pre rozptyl závislej premennej potom platí var( Y ) 1. (1) Po úpravách dostaneme pravdepodobnostné limity ˆ 1, ˆ pre regresné parametre, 1 získané metódou najmenších štvorcov ˆ plim, 1 ˆ 1 1 plim. 1 () Na základe vzahu () a rozsahu predpokladaných hodnôt pre parametre relatívnej chyby 1, je potom možné dosta intervaly konzistentných odhadov 1,. Na základe toho sa dá urobi analýza citlivosti regresných parametrov na relatívnu vekos rozptylu chýb. 1/ 1, priom pre väšie, je väšie Vychýlenie odhadu je navyše zväšené faktorom aj vychýlenie. Multikolinearita teda zhoršuje odhady aj v tomto prípade. Pre hodnoty parametrov 1, sú však isté ohranienia, ktoré vyplývajú z toho, že musí plati podmienka (1 )(1 ) 0. (3) 1 Z nej vyplýva, že pre vyššie hodnoty (vysokú multikolinearitu medzi premennými X 1 a X ) nemôžeme vôbec uvažova niektoré hodnoty parametrov 1,. Pre získanie správnych hodnôt regresných parametrov musí by splnená ešte druhá podmienka kladnosti rozptylu celkovej chybovej zložky ( ) (4) Grilichesov postup je teda vhodný, ak máme uritú predstavu o vekosti chybovej zložky v premenných. Klepperov postup to nevyžaduje, ale jeho výsledkom sú väšie oblasti konzistencie.
99 Výsledky pre Grilichesove konzistentné hranice regresných parametrov Na základe Grilichesovho postupu je možné získa intervaly pre konzistentné hodnoty regresných parametrov CDPF pri uvažovaní rozsahov konkrétnych hodnôt relatívnej chyby v premenných. V tabuke 1 a grafe 1 sú uvedené výsledky. Uvažovali sme o hodnotách relatívneho rozptylu chýb v intervale od 0 po 0,5 s krokom 0,05. Pre stavebné podniky právnej formy s. r. o. pôvodné hodnoty parametrov CDPF bez uvažovania chýb v premenných sú ZAM = 0,694 a CK = 0,38. Na grafe 1 je to bod oznaený prieseníkom priamok. Parameter úinnosti pracovnej sily má minimálnu hodnotu ZAM = 0,47 pre ZAM = 0, CK = 0,5. Vtedy je parameter úinnosti celkového kapitálu maximálny a rovná sa CK = 0,648. Maximálnu hodnotu má parameter úinnosti pracovnej sily ZAM = 1,176 pre ZAM = 0,5; CK = 0. Úinnos celkového kapitálu je naopak minimálna a rovná sa CK = 0, Beta CK Beta ZAM Graf 1: Zobrazenie Grilichesových konzistentných oblastí regresných parametrov CDPF podnikov formy s. r. o. pre relatívne chyby premenných do 0,5 V tabuke 1 sú uvedené súradnice vrcholov obalu konvexnej množiny konzistentných parametrov CDPF stavebných podnikov právnej formy s. r. o. Tabuka 1: Hraniné hodnoty Grilichesových konzistentných regresných parametrov CDPF stavebných podnikov právnej formy s. r. o. ZAM CK ZAM CK
100 V tabuke a grafe sú uvedené výsledky pre stavebné podniky právnej formy a. s. Znova sme uvažovali o hodnotách relatívneho rozptylu chýb v intervale od 0 po 0,5 s krokom 0,05, ale mnoho ich pre väšie hodnoty chybovej zložky vypadlo, lebo nedávali konzistentné hodnoty regresných parametrov CDPF (nespali podmienku 3 alebo 4). Pre stavebné podniky právnej formy a. s. pôvodné hodnoty parametrov úinnosti CDPF bez uvažovania chýb sú ZAM = 0,79 a CK = 0,174. Minimálnu hodnotu má úinnos pracovnej sily ZAM = 0,657 pre ZAM = 0, CK = 0,45. Vtedy je úinnos celkového kapitálu maximálna a rovná sa CK = 0,337. Maximálnu hodnotu má úinnos pracovnej sily ZAM = 1,039 pre ZAM = 0,15; CK = 0. Vtedy je úinnos celkového kapitálu naopak minimálna a rovná sa CK = 0,018. Hodnota úinnosti celkového kapitálu je prakticky rovná nule, o ukazuje na nezrovnalosti v dostupných dátach. Možných miním je viac, vybrali sme daný prípad, pretože je v zhode s Klepperovým ohraniením Beta CK Beta ZAM Graf : Zobrazenie Grilichesových konzistentných oblastí regresných parametrov CDPF podnikov formy a. s. pre relatívne chyby premenných do 0,5 V tabuke sú prípady, ktoré ležia na hranici a tvoria vrcholy obal konvexnej množiny konzistentných parametrov CDPF stavebných podnikov právnej formy a. s. Tabuka : Hraniné hodnoty Grilichesových konzistentných regresných parametrov CDPF stavebných podnikov právnej formy a. s. ZAM CK ZAM CK
101 Na grafoch 1 a sú zobrazené oblasti konzistencie regresných parametrov úinnosti vstupných produkných faktorov priemerného evidenného potu zamestnancov a celkového úhrnu aktív CDPF stavebných podnikov. Pre orientáciu v nich je užitoné vedie, že ak rastie relatívna chyba danej premennej (produkného faktora), tak rastie aj konzistentná hodnota jej regresného parametra. Relatívna chyba priemerného evidenného potu zamestnancov CDPF rastie smerom zava doprava. Relatívna chyba celkového úhrnu aktív CDPF rastie smerom zdola nahor. Z grafu 1, ktorý zobrazuje situáciu v prípade stavebných podnikov právnej formy s. r. o. vyplýva uritá symetria hodnôt voi hodnote získanej metódou najmenších štvorcov. Pre stavebné podniky právnej formy a. s. (graf ) je zretená nesúmernos v hodnotách parametrov úinnosti Cobbovej-Douglasovej produknej funkcie. Úinnos celkového kapitálu (celkového úhrnu aktív) má nižšie hodnoty pre všetky kombinácie relatívnych chýb produkných faktorov. Výsledkom toho je, že mnoho hodnôt parametra úinnosti celkového úhrnu aktív Cobbovej-Douglasovej produknej funkcie je prakticky rovné nule. Pravdepodobne to ukazuje na alej nezisované nezrovnalosti vo vstupných údajoch. 5. Záver Grilichesov postup pre zistenie konzistentných ohraniení regresných parametrov je vhodný vtedy, ak máme aspo urité konkrétne informácie o vekosti chýb v nezávislých premenných. Jeho alšou výhodou je názorná geometrická interpretácia, ktorá sa samozrejme stráca pri použití viac ako dvoch nezávislých premenných. Autor dúfa, že takto upozorní na urité možnosti riešenia regresie s chybami v premenných. 6. Literatúra [1] GRILICHES, Z. RINGSTAD, V Economies of Scale and the Form of the Production Function. Amstredam : North-Holland, ISBN [] KLEPPER, S. LEAMER E.E Consistent Sets for Regressions with Errors in All Variables. In: Econometrica, vol.5, No. 1, pp [3] KORÓNY, S Klepperove konzistentné hranice pre parametre Cobbovej-Douglasovej produknej funkcie stavebných podnikov. In: Forum Statisticum Slovacum. Ro.3,.1, 007, s ISSN [4] MADDALA, G. S Introduction to Econometrics. London: Prentice-Hall, 199. ISBN Adresa autora: RNDr. Samuel Koróny Ústav vedy a výskumu UMB Cesta na amfiteáter Banská Bystrica [email protected]
102 Situation in University Educational System in the Czech Republic Bohdan Linda, Jana Kubanová Abstract: The main target of the paper is the university educational system analysis. Authors believe, that the contemporary system of both three-stage education, and system of financing negative influence level of education. Key words: number of graduates of high schools, number of students at universities, quality of graduates, students enrolled to universities This paper deals with quality of the university education and it's an attempt to document the tendency of its development. In advance we want to draw attention to reality, that none tests of the level of university education were provided, but speculations are performed both on the basis of personal experiences, and some experience transmitted by colleagues from other universities. Is generally known that the pedagogues systematically appeal decreasing quality of students. This is a problem of all kind of schools. We try to analyze, from statistical point of view, the reasons of this situation in the time horizon of post November period. Generally dominates the opinion, that if we want to grant certain education to more people, the lower is final level of this education. To be able to express this opinion, it is necessary to clarify at first the term to grant certain education". As long as we understand this term give education" (accurately to give any relevant certificate about graduation of studies), then this statement is true. However as far as we understand this term to give a possibility to obtain this education in the case, that the applicant is interested in knowledge", then the mentioned statement is insignificant. It is possible to reply that this isn't problem, if we during studies affect the unthrifty students. It would not be really problem, if wouldn t have existed a contemporary system of universities financing. These universities are funding on the basis of a number of students, who are registered in certain academic year. This financing system could bee accepted in case, when surplus of applicants. Have a look at the situation in the Czech Republic. It is evident, that the fundamental determining element for the number of applicants for university education is the number of inhabitants and their age structure. The figure number 1 shows the time series of a number of inhabitants from the year vith migr. without migr Figure 1: Development of mid-year population with and without migration
103 The upper line presents the absolute number of inhabitants, that systematically dropped till the year 004 and after this year the trend reversed. Unfortunately the optimistic growth, above all in the last years, is caused above all by migration. According to the statistical methodology all foreigners either with permanent residence or with visa over 90 days are included with into population. It is evident, that the great deals of foreigners come into the Czech Republic only to work, they haven't family members here and they can t be counted in the reproduction able population Figure. Development of number of births The lower line in the figure 1 presents the number of population purified from the migration. It hasn t so optimistic trend, above all when we remember, that from the year 004, when the fertility period of the Husaks children finishes and postponed parenting are probably realized in this period. The students who were born in the year 1989 enter at university now. The number of born children toboggans from the year 1991 till the year 1996 and then following five years keep approximately equivalently (see figure number ). It means that minimal by other 6 years the number of young people, that could attend the university, will naturally decline, and minimal by other five years will this number stagnate. From the other hand, let s look the situation of the number of students at the high schools. The figure number 3 presents the time series of the development of the number of public and private universities and the total number of faculties at both kinds of schools. The intense growth of faculties was registered in the first two past November years. At this time the number increased to 1 which presents approximately 30% growth All Faculties Privat /90 90/91 91/9 9/93 93/94 94/95 95/96 96/97 97/98 98/99 99/00 00/01 01/0 0/03 03/04 04/05 05/06 06/07 Figure 3. Number of public and private high schools and all faculties
104 The number of universities stagnated at the number 3 till the year 000, when started to raise the private universities. The whole growth can be ascribed to private universities, number 38 of them already predominate the number of public ones. More important is the number of university students. The development of this from the year 1993 is demonstrated in the figure 4. The numbers of students in bachelors, masters and doctoral study programs are also stated in the figure. The number of private universities students is stated summary, the number of master studies students was insignificant in past years. The educational programs, in which get on the high school alumni, are important for our further thinking. They are, except some few exceptions mainly bachelor educational programs, because majority of universities passed to the three-stage educational system from the year All PhD Privat Bachelors Magisters /95 95/96 96/97 97/98 98/99 99/00 00/01 01/0 0/03 03/04 04/05 05/06 06/07 Figure 4 The development of the number of students at universities totally and according to the study programmes. The potential of students, who enter for the first time university, create alumni of the high schools. There're stated the numbers of graduate students at the high schools with GCE examination and for confrontation even numbers of students, entering university in the figure 5. The graph of ingoing students to university provides the relevant information from the year 004 when finished the five-year master study at majority of schools. The number of entering bachelor students are determining for the numbers of students, who for the first time register at university.
105 middle bachelors masters all 89/90 90/91 91/9 9/93 93/94 94/95 95/96 96/97 97/98 98/99 99/00 00/01 01/0 0/03 03/04 04/05 05/06 06/07 Figure 5. Numbers of graduate students at high schools and number of students entering the universities. The considerable disproportion among number of graduate students at the high schools and number of student entering university is evident in the figure 6. To sketch the situation we introduce even the figure 6. The trend of the number of pupil at basic school and high school is shown basic all middle gymnasium SOŠ SOU /90 90/91 91/9 9/93 93/94 94/95 95/96 96/97 97/98 98/99 99/00 00/01 01/0 0/03 03/04 04/05 05/06 06/07 Figure 6. Numbers of pupils of basic and high schools We can see again any disproportion among these time series. At systematic shortage of pupils of the basic schools grows the number of high schools students.
106 Finally it is possible to claim, that if declines the number of pupils of the basic schools and grows the number of students at high schools and if the number of university students grows faster than at high schools, this all must express in the quality of graduates. The struggle for students started, unfortunately no resulted in quality production, but in demand reduction. The figure 7 compares fruitfulness of the university study applicants at entrance examinations at public and private universities. 100,0% 90,0% 80,0% public private 70,0% 60,0% 50,0% 40,0% 30,0% 0,0% 10,0% Figure 7. Fruitfulness of the university study applicants at entrance examinations at public and private universities. Very interesting is improvement of fruitfulness from the moment, when started to work the private schools. Fruitfulness increased at public universities from 45% to more than 60%. Fruitfulness at private schools was over 80%. We can believe, that the ministry should revalue the system of universities financing with regard to presented numbers. The system of three-stage education should be revaluated as well. It is acceptable only for some types of study programs, however certainly not for technical and economical programs. It is good idea to provide the university education to widest population; however it shouldn t decrease quality of education. Some kind of solution might be comeback to the parallel system of the three-year bachelor and five-year master study, mutually impenetrable. References [1] [] Addresses of authors: Jana Kubanová, doc., PaedDr, CSc. Studentská Pardubice [email protected] Bohdan Linda, doc., RNDr., CSc. Studentská Pardubice [email protected]
107 Korelácia komplementárnych a disjunktných javov Correlation of complementary and disjoint events Ján Luha Abstract: Article dealt with specific model correlation of complementary and disjoint events. Application is provided by results from population research with questions with nominal scales. Key words: complementary events, disjoint events, qualitative attribute, nominal scale, correlation of disjoint and complementary events, indicator variables. Kúové slová: komplementárne javy, disjunktné javy, kvalitatívny znak, nominálna škála, korelácia disjunktných a komplementárnych javov, indikátorové premenné. 1. Úvod V príspevku sa zaoberáme špecifickou situáciou korelácie elementárnych javov definovaných kvalitatívnym znakom. Pri skúmaní ich závislostí môžeme využi vyjadrenie pomocou indikátorových (nula/jedna) premenných. Na výpoet korelácie používame vtedy Pearsonov korelaný koeficient. V príspevku ukážeme zjednodušené vzorce na výpoet korelácií pre komplementárne a disjunktné javy a dôkaz o ich zápornej korelácii. Príspevok nadväzuje na prácu [9]Luha J.(008): Korelácie vnorených javov. FORUM STATISTICUM SLOVACUM 5/008. SŠDS Bratislava 008. ISSN Indikátorová premenná Z je definovaná: 1, ak skúmaný jav nastal, Z = { 0, ak skúmaný jav nenastal. Ak E(Z)=p, tak D(Z)=E(Z E(Z))=p(1-p). Ozname množinu všetkých skúmaných prvkov. Potom zrejme 1 Z je indikátorová premenná komplementárneho javu -Z. Disjunktné javy definujeme jednoducho pomocou príslušných podmnožín elementárnych javov skúmaného kvalitatívneho znaku. Uvažujme kvalitatívny znak Z s množinou hodnôt {1,,..., r}. Tento znak reprezentujeme pomocou r indikátorových premenných Z 1, Z,..., Z r, odpovedajúcich množinám rozkladu, ktoré kvôli zjednodušeniu ozname rovnakými symbolmi Z 1, Z,..., Z r, znaku Z, tým sú urené aj disjunktné javy urené kvalitatívnym znakom Z. Špeciálnym prípadom sú komplementárne javy v prípade ke r=.. Korelaný koeficient komplementárnych javov Majme kvalitatívny znak Z s dvojprvkovou množinou hodnôt. Tento môžeme vyjadri pomocou jednej indikátorovej premennej alebo pomocou dvoch komplementárnych indikátorových premenných. Najprv uvažujme množinové vyjadrenie: Z 1 a Z sú komplementárne, ak pre množinové vyjadrenie platí: Z 1 Z =, a Z 1 Z =, kde symbol reprezentuje prázdnu množinu a množinu všetkých skúmaných prvkov. Potom Z = Z 1.
108 Graficky zobrazíme komplementárne javy definované nominálnym znakom s dvojprvkovou množinou hodnôt pomocou odpovedajúcich množín: Z 1 Z Zrejme, pre indikátorové premenné dvojice komplementárnych javov, platí: Z = 1 Z 1. Využijeme vzah uverejnený v Luha J.(008). Možno ho nájs aj v ehák J., eháková B. (1986). Kvôli úplnosti uvádzame korelaný koeficient dvoch elementárnych javov: kde: (Z 1,Z )=E((Z 1 - EZ 1 )(Z EZ ))/ D ( Z1) D( Z ) = E(Z 1 Z ) E(Z 1 )E(Z )/ D ( Z1) D( Z ) = p 11 p 1 =p 1. p 11 p 1. p 1 =p.1 - p 11 p =p - p 1. - p.1 + p 11 1 p 1. p p.1 1 (p 11 -p 1..p.1 )/(p 1..p.1.p..p. )= =(p 11.p - p 1.p 1 )/(p 1..p.1.p..p. )= =(p 11 -p 1..p.1 )/(p 1..p.1.(1-p 1.).(1-p.1 ). Uvažujeme dvojicu komplementárnych javov Z 1, Z. Pre ich indikátorové premenné platí: Z 1 Z =0, a preto alej platí: Z 1 (1-Z )=Z 1 - Z 1 Z =Z 1, (1-Z 1 )Z =Z -Z 1 Z =Z a (1-Z 1 )(1-Z )=1-Z 1 -Z +Z 1 Z =1-Z 1 -Z =0, pretože pre komplementárne javy platí: Z =1-Z 1. Využijeme vyjadrenie kontingennej tabuky pomocou indikátorových premenných: Z 1 /Z Z -Z suma Z 1 Z 1 Z Z 1 (1-Z ) Z 1 -Z 1 (1-Z 1 )Z (1-Z 1 )(1-Z ) 1-Z 1 suma Z 1-Z 1 Potom pravdepodobnosti v políkach x tabuke dostaneme ako stredné hodnoty hore uvedených vzahov pre indikátorové premenné. Výsledok je v redukovanej tabuke: 0 p 1. p 1. p p 1. p p.1 1
109 Pre komplementárne javy ale platí p.1 =1 p 1.. Potom môžeme využi vyjadrenie: 0 p 1. p 1. p.1 0 p.1 p.1 p 1. 1 Hore zistené zjednodušenie vyplývajúce z vlastnosti komplementárnosti dvojice javov aplikujeme na všeobecný vzorec a dostávame koeficient korelácie komplementárnych javov: (Z 1,Z )=E(Z 1 Z ) E(Z 1 )E(Z )/ D ( Z1) D( Z ) = =(p 11 -p 1..p.1 )/(p 1..p.1.(1-p 1.).(1-p.1 )= = - p 1..p.1 /(p 1. p.1 p 1. p.1 )= -1. Korelaný koeficient komplementárnych javov je rovný 1. Uvedený výsledok je prirodzeným dôsledkom vzájomnej komplementárnosti dvoch javov. 3. Korelácie disjunktných javov urených kvalitatívnym znakom Pre množinové vyjadrenie disjunktných javov urených kvalitatívnym znakom s r prvkovou množinou hodnôt platí: Z i Z j = pre i j a Zi =. r i1 Resp. odpovedajúce grafické vyjadrenie: Z 1 Z Z r Uvažujeme r disjunktných javov Z 1, Z,..., Z r s pravdepodobnosami ich nastatia r i 1 p 1, p,..., p r. Zrejme platí p i >=0 a pi =1. Pre indikátorové premenné uvažovaných disjunktných javov platí: Z i Z j =0, pre pre i j, a preto alej platí: Z i (1-Z j )=Z i - Z i Z j =Z i, (1-Z i )Z j =Z j -Z i Z j =Z j a (1-Z i )(1-Z j )=1-Z i -Z j +Z i Z j =1-Z i -Z j. Využijeme vyjadrenie kontingennej tabuky pomocou indikátorových premenných: Z i /Z j Z j -Z j suma Z i /Z j Z j -Z j suma Z i Z i Z j Z i (1-Z j ) Z i Z i 0 Z i Z i -Z i (1-Z i )Z j (1-Z i )(1-Z j ) 1-Z i -Z i Z j 1-Z i -Z j 1-Z i
110 suma Z j 1-Z j 1 suma Z j 1-Z j 1 Potom pravdepodobnosti (alebo ich odhady) v políkach x tabuke dostaneme ako stredné hodnoty hore uvedených vzahov pre indikátorové premenné. Výsledok je v redukovanej tabuke: 0 p i p i p 1 =p j p =1 - p i -p j 1 p i p j 1 - p j 1 Pomocou zjednodušenia vyplývajúceho z vlastnosti disjunktnosti javov a dostaneme koeficient korelácie medzi disjunktnými javmi i a j: (Z i,z j )=E(Z i Z j ) E(Z i )E(Z j )/ D ( Zi) D( Zj) = =(p ij -p i p j /(p i p j (1-p i.(1-p j ) = = - p i p j /(p i p j (1-p i ) (1-p j ) = = - (p i p j /(1-p i ) (1-p j ). Ak oznaíme šancu javu Z i oproti komplementárnemu javu - Z i s i =p i /(1-p i ) a odpovedajúco aj pre jav Z j a ij =s i /s j pomer šancí (cross product ratio), tak (Z i,z j )= - s isj = - s j ij. Korelaný koeficient disjunktných javov je záporný. V priestore 0 < pi < p j <=1, pi + p j <=1 môžeme vypoíta priebeh hodnôt korelácie dvoch disjunktných javov. V tabuke uvádzame okrem vybraných hodnôt podielov aj príslušné šance, pomer šancí a koleraný koeficient. Priom hodnotu korelácie -1 dostávame v prípade pi + p j =1, teda ke ide o dvojicu komplementárnych javov. p i p j s i s j ji p i p j s i s j ji 0,1 0,1 0,111 0,111 1,000-0,01 0,3 0,6 0,49 1,500 3,500-0,643 0,1 0, 0,111 0,50,50-0,08 0,3 0,7 0,49,333 5,444-1,000 0,1 0,3 0,111 0,49 3,857-0,048 0,4 0,1 0,667 0,111 0,167-0,074 0,1 0,4 0,111 0,667 6,000-0,074 0,4 0, 0,667 0,50 0,375-0,167 0,1 0,5 0,111 1,000 9,000-0,111 0,4 0,3 0,667 0,49 0,643-0,86 0,1 0,6 0,111 1,500 13,500-0,167 0,4 0,4 0,667 0,667 1,000-0,444 0,1 0,7 0,111,333 1,000-0,59 0,4 0,5 0,667 1,000 1,500-0,667 0,1 0,8 0,111 4,000 36,000-0,444 0,4 0,6 0,667 1,500,50-1,000 0,1 0,9 0,111 9,000 81,000-1,000 0,5 0,1 1,000 0,111 0,111-0,111 0, 0,1 0,50 0,111 0,444-0,08 0,5 0, 1,000 0,50 0,50-0,50 0, 0, 0,50 0,50 1,000-0,063 0,5 0,3 1,000 0,49 0,49-0,49 0, 0,3 0,50 0,49 1,714-0,107 0,5 0,4 1,000 0,667 0,667-0,667 0, 0,4 0,50 0,667,667-0,167 0,5 0,5 1,000 1,000 1,000-1,000 0, 0,5 0,50 1,000 4,000-0,50 0,6 0,1 1,500 0,111 0,074-0,167 0, 0,6 0,50 1,500 6,000-0,375 0,6 0, 1,500 0,50 0,167-0,375 0, 0,7 0,50,333 9,333-0,583 0,6 0,3 1,500 0,49 0,86-0,643 0, 0,8 0,50 4,000 16,000-1,000 0,6 0,4 1,500 0,667 0,444-1,000 0,3 0,1 0,49 0,111 0,59-0,048 0,7 0,1,333 0,111 0,048-0,59 0,3 0, 0,49 0,50 0,583-0,107 0,7 0,,333 0,50 0,107-0,583 0,3 0,3 0,49 0,49 1,000-0,184 0,7 0,3,333 0,49 0,184-1,000 0,3 0,4 0,49 0,667 1,556-0,86 0,8 0,1 4,000 0,111 0,08-0,444 0,3 0,5 0,49 1,000,333-0,49 0,8 0, 4,000 0,50 0,063-1,000 0,9 0,1 9,000 0,111 0,01-1,000
111 Priebeh korelácie disjuntných javov možno ilustrova v grafe: 0,000-0,00-0,400 r -0,600-0,800-1,000 0,0 0, 0,4 pi 0,6 0,8 1,0 1,0 0,8 0,6 0,4 pj 0, 0,0 Uvedené ilustrácie nezachytávajú všetky obmedzenia kladené na disjunktné javy. Na komplexnejší pohad musíme uvažova disjunktné javy pri r > simultánne. r i 1 Priebeh korelácie r disjunktných v priestore p i > 0, p i 1 môžeme reprezentova r x r korelanou maticou. Kvôli úplnosti uvádzame aj korelácie dvojíc javov Z i,z i, ktorá je zrejme rovná 1. Z i /Z j Z 1 Z... Z j... Z r-1 Z r Z 1 1 (Z 1,Z r-1 )... (Z 1,Z j )... (Z 1,Z r-1 ) 1 Z (Z,Z 1 ) 1 (Z,Z j ) 1 (Z,Z r )... Z i (Z i,z 1 ) (Z i,z j ) (Z i,z r-1 ) (Z i,z r )... Z r-1 (Z r-1,z 1 ) (Z r-1,z j ) 1 (Z r-1,z r ) Z r (Z r,z 1 ) (Z r,z ) (Z r,z j ) (Z r,z r-1 ) 1
112 V políkach korelanej matice sú korelácie poítané pomocou vzahu (Z i,z j )= - s isj. Na ilustráciu uvádzame príklad priebehu korelácií, šancí a pomeru šancí pre vybrané hodnoty podielov pre r=3. p 1 p p 3 suma s 1 s s r 1 r 13 r 3 0,10 0,10 0,80 1 0,111 0,111 4,000 1,000 36,000 36,000-0,111-0,667-0,667 0,10 0,0 0,70 1 0,111 0,50,333,50 1,000 9,333-0,167-0,509-0,764 0,10 0,30 0,60 1 0,111 0,49 1,500 3,857 13,500 3,500-0,18-0,408-0,80 0,10 0,40 0,50 1 0,111 0,667 1,000 6,000 9,000 1,500-0,7-0,333-0,816 0,10 0,50 0,40 1 0,111 1,000 0,667 9,000 6,000 0,667-0,333-0,7-0,816 0,10 0,60 0,30 1 0,111 1,500 0,49 13,500 3,857 0,86-0,408-0,18-0,80 0,10 0,70 0,0 1 0,111,333 0,50 1,000,50 0,107-0,509-0,167-0,764 0,10 0,80 0,10 1 0,111 4,000 0,111 36,000 1,000 0,08-0,667-0,111-0,667 0,0 0,10 0,70 1 0,50 0,111,333 0,444 9,333 1,000-0,167-0,764-0,509 0,0 0,0 0,60 1 0,50 0,50 1,500 1,000 6,000 6,000-0,50-0,61-0,61 0,0 0,30 0,50 1 0,50 0,49 1,000 1,714 4,000,333-0,37-0,500-0,655 0,0 0,40 0,40 1 0,50 0,667 0,667,667,667 1,000-0,408-0,408-0,667 0,0 0,50 0,30 1 0,50 1,000 0,49 4,000 1,714 0,49-0,500-0,37-0,655 0,0 0,60 0,0 1 0,50 1,500 0,50 6,000 1,000 0,167-0,61-0,50-0,61 0,0 0,70 0,10 1 0,50,333 0,111 9,333 0,444 0,048-0,764-0,167-0,509 0,30 0,10 0,60 1 0,49 0,111 1,500 0,59 3,500 13,500-0,18-0,80-0,408 0,30 0,0 0,50 1 0,49 0,50 1,000 0,583,333 4,000-0,37-0,655-0,500 0,30 0,30 0,40 1 0,49 0,49 0,667 1,000 1,556 1,556-0,49-0,535-0,535 0,30 0,40 0,30 1 0,49 0,667 0,49 1,556 1,000 0,643-0,535-0,49-0,535 0,30 0,50 0,0 1 0,49 1,000 0,50,333 0,583 0,50-0,655-0,37-0,500 0,30 0,60 0,10 1 0,49 1,500 0,111 3,500 0,59 0,074-0,80-0,18-0,408 0,40 0,10 0,50 1 0,667 0,111 1,000 0,167 1,500 9,000-0,7-0,816-0,333 0,40 0,0 0,40 1 0,667 0,50 0,667 0,375 1,000,667-0,408-0,667-0,408 0,40 0,30 0,30 1 0,667 0,49 0,49 0,643 0,643 1,000-0,535-0,535-0,49 0,40 0,40 0,0 1 0,667 0,667 0,50 1,000 0,375 0,375-0,667-0,408-0,408 0,40 0,50 0,10 1 0,667 1,000 0,111 1,500 0,167 0,111-0,816-0,7-0,333 0,50 0,10 0,40 1 1,000 0,111 0,667 0,111 0,667 6,000-0,333-0,816-0,7 0,50 0,0 0,30 1 1,000 0,50 0,49 0,50 0,49 1,714-0,500-0,655-0,37 0,50 0,30 0,0 1 1,000 0,49 0,50 0,49 0,50 0,583-0,655-0,500-0,37 0,50 0,40 0,10 1 1,000 0,667 0,111 0,667 0,111 0,167-0,816-0,333-0,7 0,60 0,10 0,30 1 1,500 0,111 0,49 0,074 0,86 3,857-0,408-0,80-0,18 0,60 0,0 0,0 1 1,500 0,50 0,50 0,167 0,167 1,000-0,61-0,61-0,50 0,60 0,30 0,10 1 1,500 0,49 0,111 0,86 0,074 0,59-0,80-0,408-0,18 0,70 0,10 0,0 1,333 0,111 0,50 0,048 0,107,50-0,509-0,764-0,167 0,70 0,0 0,10 1,333 0,50 0,111 0,107 0,048 0,444-0,764-0,509-0,167 0,80 0,10 0,10 1 4,000 0,111 0,111 0,08 0,08 1,000-0,667-0,667-0,111 0,90 0,05 0,05 1 9,000 0,053 0,053 0,006 0,006 1,000-0,688-0,688-0, Príklad korelácie disjunktných javov Každý kvalitatívny znak s konenou množinou r hodnôt generuje r disjunktných javov. Predpokladáme nenulové pravdepodobnosti ich výskytu. Na ilustráciu využijeme umelý príklad, ktorý ale znane zodpovedá skutonosti. Ako nominálny znak uvažujme otázku, ktorá sa pravidelne opakuje pri výskumoch verejnej mienky a síce koho by ste volili vo vobách
113 do NR SR. Na ilustratívne úely sme zostrojili simulaný súbor, kde sa vyskytujú iba strany: KDH, S-HZDS, SDKÚ, SNS, SMER a strany nezúastnil by som sa a neviem. Frekvenná tabuka zo simulaného súboru dáva výsledky: Ktorú stranu by ste volili do NR SR? Valid Frequenc y Percent Valid Percent Cumulati ve Percent KDH 158 5,7 5,7 5,7 S-HZDS 153 5,5 5,5 11,3 SDKÚ 09 7,6 7,6 18,8 SNS 3 8,1 8,1 6,9 SMER ,8 30,8 57,7 SMK 179 6,5 6,5 64, nezúastnil by sa 50 18,8 18,8 83,0 neviem ,0 17,0 100,0 Total ,0 100,0 Skúmaný nominálny znak má v našom umelom príklade r=8 hodnôt a preto vytvoríme 8 indikátorových premenných. Ich názvy budú reprezentova hodnoty kvalitatívneho znaku a preto ich nazveme rovnako ako hodnoty znaku. Výsledky sú v korelanej matici: Correlations kdh hzds sdku sns smer smk nezucast neviem kdh hzds sdku sns smer smk nezucast neviem Pearson Correlation 1 -,060(**) -,070(**) -,073(**) -,164(**) -,065(**) -,119(**) -,111(**) Sig. (-tailed),00,000,000,000,001,000,000 N Pearson Correlation -,060(**) 1 -,069(**) -,07(**) -,16(**) -,064(**) -,117(**) -,110(**) Sig. (-tailed),00,000,000,000,001,000,000 N Pearson Correlation -,070(**) -,069(**) 1 -,085(**) -,191(**) -,075(**) -,138(**) -,19(**) Sig. (-tailed),000,000,000,000,000,000,000 N Pearson Correlation -,073(**) -,07(**) -,085(**) 1 -,198(**) -,078(**) -,143(**) -,134(**) Sig. (-tailed),000,000,000,000,000,000,000 N Pearson Correlation -,164(**) -,16(**) -,191(**) -,198(**) 1 -,176(**) -,31(**) -,30(**) Sig. (-tailed),000,000,000,000,000,000,000 N Pearson Correlation -,065(**) -,064(**) -,075(**) -,078(**) -,176(**) 1 -,17(**) -,119(**) Sig. (-tailed),001,001,000,000,000,000,000 N Pearson Correlation -,119(**) -,117(**) -,138(**) -,143(**) -,31(**) -,17(**) 1 -,18(**) Sig. (-tailed),000,000,000,000,000,000,000 N Pearson Correlation -,111(**) -,110(**) -,19(**) -,134(**) -,30(**) -,119(**) -,18(**) 1 Sig. (-tailed),000,000,000,000,000,000,000 N ** Correlation is significant at the 0.01 level (-tailed). Interpretáciou korelanej matice vzhadom ku meritu skúmaných javov sa v tomto príspevku nezaoberáme. Na doplnenie uvádzame kontingennú tabuku vybraného vzahu SMER s SDKÚ:
114 smer * sdku Crosstabulation smer Total Symmetric Measures 0 1 sdku Total Count % within smer 89,1% 10,9% 100,0% % within sdku 66,7% 100,0% 69,% Adjusted Residual -10,0 10,0 Count % within smer 100,0%,0% 100,0% % within sdku 33,3%,0% 30,8% Adjusted Residual 10,0-10,0 Count % within smer 9,4% 7,6% 100,0% % within sdku 100,0% 100,0% 100,0% Value Asymp. Std. Error(a) Approx. T(b) Approx. Sig. Nominal by Nominal Contingency Coefficient,188,000,000 Interval by Interval Pearson's R -,191,007-10,19,000(c),000 Ordinal by Ordinal Spearman Correlation -,191,007-10,19,000(c),000 N of Valid Cases 76 a Not assuming the null hypothesis. b Using the asymptotic standard error assuming the null hypothesis. c Based on normal approximation. Je zrejmé, že skúmané vzahy môžeme doplni analýzou kontingenných tabuliek. To ale nie je úelom tohoto lánku. Na doplnenie uvedieme ilustratívny dendogram. Ako mieru blízkosti sme zvolili Pearsonov korelaný koeficient. Exact Sig. * * * * * * * * * * * * * * * * * * * H I E R A R C H I C A L C L U S T E R A N A L Y S I S Dendrogram using Average Linkage (Between Groups) Rescaled Distance Cluster Combine C A S E Label Num kdh 1 hzds smk 6 sdku 3 sns 4 neviem 8 nezucast 7 smer 5 5. Záver Vlastnosti korelácií medzi disjunktnými a komplementárnymi javmi sú prirodzeným dôsledkom vlastnosti disjunktnosti, resp. v špeciálnom prípade ich komplementárnosti. Okrem vlastnosti zápornosti, môžeme uvedené vzahy využi pri špecifikácii modelových vzahov urených kvalitatívnym znakom. 6. Literatúra [1]Chajdiak, J.(003): Štatistika jednoducho. Statis Bratislava 003, ISBN X.
115 []Chajdiak J. (005): Štatistické úlohy a ich riešenie v Exceli. STATIS, Bratislava, ISBN [3]Kanderová, M. Úradníek, V.(007): Štatistika a pravdepodobnos pre ekonómov. 1. as. OZ Financ, Banská Bystrica 007, ISBN [4]Kanderová, M. Úradníek, V.(007): Štatistika a pravdepodobnos pre ekonómov.. as. OZ Financ, Banská Bystrica 007, ISBN [5]Luha J.(003): Skúmanie súboru kvalitatívnych dát. EKOMSTAT 003. SŠDS Bratislava 003. [6]Luha J.(003): Matematickoštatistické aspekty spracovania dotazníkových výskumov. Štatistické metódy vo vedecko-výskumnej práci 003, SŠDS, Bratislava 003. ISBN [7]Luha J.(005): Viacrozmerné štatistické metódy analýzy kvalitatívnych znakov. EKOMSTAT 005, Štatistické metódy v praxi.sšds Trenianske Teplice [8]Luha J.(007): Kvótový výber. FORUM STATISTICUM SLOVACUM 1/007. SŠDS Bratislava 007. ISSN [9]Luha J.(008): Korelácie vnorených javov. FORUM STATISTICUM SLOVACUM 5/008. SŠDS Bratislava 008. ISSN [10]Pecáková I.: Statistika v terénních przkumech. Proffessional Publishing, Praha 008. ISBN [11]ehák J., eháková B. (1986): Analýza kategorizovaných dat v sociologii. Academia Praha [1]ezanková A.(007): Analýza dat z dotazníkových šetení. Proffessional Publishing, Praha 007. ISBN [13]Stankoviová I., Vojtková M.(007): Viacrozmerné štatistické metódy s aplikáciami. IURA EDITION, Bratislava 007, ISBN Adresa autora: RNDr. Ján Luha, CSc. [email protected]
116 Grubbsov test a hypotézy o obrobenom povrchu Test of Grubbs and Hypotheses on the Cut Surface Anna Macurová, Dušan Macura Abstract: The paper deals with the analysis and use of date to solve problems. This paper is designed to equip technically oriented readers with the basic statistical skills they need to practice their professions. The hypothesis is presented with testing experimental process in the next text. Key words: Surface, Hypotheses, Testing of the Hypotheses. Kúové slová: Povrch, hypotézy, testovanie hypotéz. 1. Úvod Význam štatistiky v inžinierskej praxi z hadiska zvyšovania kvality výroby je nesporný. V každom reálnom výrobnom procese existuje variabilita hodnôt z rôznych hadísk. V modelovej situácii, za ktorú budeme považova experiment, vyhodnotíme získané hodnoty zriedkavejšie používaným kritériom, závery formulované v experimente budeme považova za hypotézy a pomocou vybraných štatistických metód budú navrhované výsledky experimentov. Je známe, že testovanie hypotéz je proces, v ktorom na základe výberových údajov odhadujeme s uritou pravdepodobnosou, i tvrdenie o niektorom z parametrov základného súboru je, alebo nie je pravdivé. Každá úloha testovania hypotéz je formulovaná tak, že proti sebe stoja dve hypotézy a to nulová hypotéza (asto jednoduchá), ktorú budeme oznaova a alternatívna hypotéza (najastejšie zložená) oznaovaná H. H 0 1. Test extrémnych hodnôt (Grubbsov test) Výskum obrobených povrchov patrí medzi základné problémy, ktorých riešenie zdokonauje teóriu výrobných technológií. Štatistika je súasou rozboru experimentov aj vo výrobných technológiách. V nasledujúcom konkrétnom experimente sa sústredíme na štatistické spracovanie vybraných údajov z hadiska extrémnej hodnoty v získanom súbore experimentálnych hodnôt. Drsnos obrobeného povrchu sa dá považova za náhodnú premennú s normálnym rozdelením, z normálneho rozdelenia N, N. Nech x, x, x je náhodný výber 1, 4,8 7,3 5,4 6, 7,1 5,1 9,8 (1) hodnôt drsnosti obrobeného povrchu (sústružením, v mikrometroch). Hodnota 9,8 vzbudila podozrenie, že je extrémne veká. Otestujeme túto hypotézu na hladine významnosti 0,05. Testujeme hypotézu proti H : x 9, max 8 nie je extrémne veká hodnota 0 H : x 9 max, 8 je extrémne veká hodnota () 1 Zo súboru hodnôt (1) vyplývajú hodnoty n 8, max 8 s x 1,656 do nasledujúcej testovacej štatistiky 8
117 Po výpote dostaneme T max,11. Ak xmax x n Tmax. (3) s n1 x n tak H 0 zamietame, xmax je extrémne veká hodnota, test, ktorú uríme zo štatistických tabuliek [1]. Pre 0, 05 Na základe vzahu (4) je Hypotézu hypotézu T max T, (4) 8 17 T, < T max, , T n je kritická hodnota pre Grubbsov je 8 17 T,. 0 05, H 0 z tvrdenia () na hladine významnosti 0, 05 zamietame a prijímame z (). Hodnota 9,8 je extrémne veká a môžeme ju zo súboru (1) vylúi. H 1 3. Testovanie experimentálnych hodnôt získaných dvoma spôsobmi 1 meraní najväšej nerovnosti obrobeného povrchu sa uskutonilo výpotom z diferenciálnej rovnice (premenné v nasledujúcej diferenciálnej rovnici zodpovedajú oznaovaniu príslušných odborných pojmov vo výrobných technológiách) frz 4Rz Rz f Rz 0, (5) drz Rz je nerovnos(drsnos) obrobeného povrchu, f je posuv nástroja, Rz, riešením (5) df je funkcia r f 0. 4 c c f Rz, c R, Získané hodnoty sú oznaené y i c 8 r je polomer hrotu nástroja, priom platí a novým digitálnym meracím prístrojom na meranie nerovnosti obrobeného povrchu (drsnosti) hodnoty oznaené z i. Zistíme, i je medzi získanými hodnotami podstatný rozdiel. Výsledky meraní sú nezávislé a zapíšeme ich do tabuky, zistené hodnoty sú párové, y i, z i, i 1,,,1. Urobíme rozdiely xi yi zi, i 1,,, 1, ktoré vyjadrujú vekos systematickej chyby. Tabuka 1: Hodnoty najväšej nerovnosti obrobeného povrchu y 8, i z 8, i 7 33,9 5 33,9 9 38, 5 38, 0 4,5 4,4 37,6 37,6 4 36,8 4 36,8 5 36,1 36, 1 35,1 1 35, 0 34,4 5 34,4 0 5,8 3 5,8 6 57,9 0 57,8 8 51,5 55,5 3 x -0,05-0,04 0,05 0,10-0,0-0,01-0,09-0,09 0,05-0,03 0,0-0,01 i Vypoítame výberové charakteristiky 1 x n n x i i1 n 1 0,01, s x xi nx 0, 057, n1 i1 y 40,7875, s 8, 975, z 40, y
118 Použijeme párový test. Ak medzi výsledkami získanými rôznymi prístrojmi nie je rozdiel, je 0. Testujeme hypotézu o strednej hodnote H proti H. 0 : 1 Testovacia štatistika nadobúda hodnotu x 0,01 0 T n s 0,057 x 1 : 1 1 0,6056. V štatistických tabukách nájdeme n t 11, 01 t []. 1 0, 05 Hypotézu H 0 na hladine významnosti 0, 05 nezamietame. Medzi hodnotami získanými výpotom a meracím prístrojom nie je podstatný rozdiel. 4. Záver Pri každom testovacom postupe sa dopúšame dvoch druhov chýb. Ak je H 0 platná, môžeme vplyvom náhody dosta výsledok, pri ktorom hodnota testovacej štatistiky T dostane do kritického oboru ( oboru zamietnutia) W. Poda vopred stanoveného testovacieho postupu zamietame H 0 a prijímame H1, ím sa dopustíme chyby 1. druhu. Pravdepodobnos chyby 1. druhu nazývame hladina významnosti testu a oznaujeme písmenom [3]. Ak je platná alternatívna hypotéza H 1, môžeme vplyvom náhody dosta výsledok, že hodnota testovacej štatistiky T sa dostane do oboru prijatia V. Na základe stanoveného testovacieho kritéria nezamietame H 0, ím sa dopustíme chyby. druhu, ktorá sa oznauje. Pri vopred stanovenej hodnote sa snažíme minimalizova. Optimalizácia hodnôt patriacich do oboru zamietnutia W nie je jednoduché, niekedy je vhodné uri tieto hodnoty ako extrémne hodnoty T. 5. Literatúra [1]MACUROVÁ, A. HREHOVÁ, S Základy štatistiky pre technikov. TU Košice, FVT Prešov, s. ISBN []MACURA, D Obyajné diferenciálne rovnice. 1. vyd. FHPV PU, Prešov, s. ISBN [3] POTOCKÝ, R. a kol Zbierka úloh z pravdepodobnosti a matematickej štatistiky. Alfa, Bratislava, S. ISBN [4]VASILKO, K.a kol., 1991.Technológia obrábania a montáže 1. vyd. Bratislava. Alfa, 1991, 494 s. Príspevok je zostavený v rámci riešenia projektu 1/4004/007. Adresa autora (-ov): Anna Macurová, PaedDr., PhD. FVT TU, Bayerova Prešov Dušan Macura, Mgr., PhD. PU FPHV Ul. 17. Novembra Prešov
119 Kointegraní analýza modelu inflace v eské republice Cointegration Analysis of the Inflation Model in the Czech Republic Jií Neubauer Abstract: The article deals with the question of modeling multidimensional non-stationary cointegrated processes. The multidimensional process is called cointegrated if there exists any linear combination of its one-dimensional components which is stationary. For instance this property can be found in some series of economic indices which are predominantly nonstationary. This contribution is focused on cointegration analysis of multidimensional time series of Czech macroeconomic indices and on verification of some relations describing inflation in the Czech Republic. Key words: vector autoregressive process, cointegration, inflation. Kúové slová: vektorový autoregresní proces, kointegrace, inflace. 1. Úvod Kointegraní analýza, jako metoda modelování vícerozmrných nestacionárních proces, nachází uplatnní pevážn v oblasti makroekonomických asových ad. Detailní popis této metody je možné najít napíklad v [Hamilton, 1994], [Johansen, 1995], [Lütkepohl, 007]. lánek je vnován kointegraní analýze tvrtletních makroekonomických ukazatel eské republiky a pomocí test kointegrace jsou ovovány nkteré vztahy popisující vývoj inflace. Základní model inflace vychází z lánku [Kim, 001]. Uvedeme nyní v krátkosti nkteré základní definice a nezbytná tvrzení. Definice 1. Nech t maticí. Stochastický proces Y splující i0 i t je n-rozmrný bílý šum s nulovou stední hodnotou a varianní t Y Y C t E t i 1 i ti jestliže C C 0 ( EY znaí stední hodnotu procesu Y ). Definice. O stochastickém procesu Y t t se nazývá I(0) proces, ekneme, že je integrovaný ádu d a znaíme jej I(d), d d = 1,,..., jestliže Y EY ) je I(0) proces ( je diferenní operátor, Y Y Y ). ( t t Definice 3. Vícerozmrný proces VAR(p), jestliže platí Y t Y Y t t t t1 nazveme n-rozmrným autoregresním procesem Y D pro t 1,, T, (1) 1 t1 Yt p t p t t pro dané poátení hodnoty Y, Y, kde je n-rozmrný bílý šum s normálním rozdlením N ( 0, ),, jsou matice koeficient (ádu n), je matice koeficient deterministického lenu p 1, 0 1 p D t, který mže obsahovat konstantu, lineární len, sezónní vlivy a další regresory, které jsou nestochastické. Matice je typu n s, matice Dt je typu s 1. Autoregresní proces VAR(p) definovaný rovnicí (1) je možné po jednoduchých úpravách zapsat ve tvaru p 1 t 1 i ti t t T i1 Y Y Y D pro t 1,,, () t t
120 p i 1 kde I, i. Tento tvar vyjádení autoregresního procesu se i p j i 1 j nazývá ECM ( error correction model ), používá se pro popis a analýzu kointegrovaných proces resp. asových ad. Hlavní myšlenku kointegrace ukážeme na jednorozmrných procesech typu I(1). ekneme, že procesy X a Y jsou kointegrované, jestliže existuje taková lineární kombinace ax t by t Definice 4. Nech t t, která je stacionární. Uvedeme nyní obecnou definici kointegrovaného procesu. Y t je n-rozmrný integrovaný proces ádu 1. Tento proces nazveme kointegrovaný s kointegraním vektorem ( R n, 0 ), jestliže pi vhodné volb poáteních hodnot je proces Y t stacionární. V pípad dvourozmrného procesu mže existovat pouze jeden kointegraní vektor. Pokud je, mohou existovat dva vektory, takové, že 1 Y i jsou stacionární n 1 a pitom jsou 1, lineárn nezávislé. Obecn mže existovat r n lineárn nezávislých kointegraních vektor. Jejich maximální poet budeme oznaovat jako ád (hodnost) kointegrace a vektorový prostor, který tyto vektory generují, jako kointegraní prostor.. Maximáln vrohodné odhady kointegraních vektor a testy kointegrace Grangerova vta (viz nap. [Johansen, 1995]) udává nutnou a postaující podmínku, aby autoregresní VAR(p) proces byl I(1) a kointegrovaný. Podle hodnosti matice v jeho ECM reprezentaci se definuje tzv. H (r) model procesu I(1). Definice 5. H (r) model procesu I(1) je definován jako model VAR( p) splující kde a jsou, n r matice. ECM reprezentace tohoto modelu má tvar Y t Y t p 1 i1 1 Y D pro t 1,, T, kde,,,, jsou parametry, na které nejsou kladena žádná omezení., 1 p1 Za pedpokladu platnosti hypotézy i t H (r) : i získáme maximáln vrohodný odhad parametru následujícím postupem (viz [Johansen, 1995], [Hamilton, 1994]). Nejprve vyešíme rovnici 1 1 S S S S pro vlastní ísla 1 1 n a vlastní vektory V ( v 1,, v n ), které jsou normalizovány vztahem V S V I. Kointegraní vztahy odhadneme z 11 ˆ ( v,, v ), 1 r maximalizovaná hodnota vrohodnostní funkce je dána vztahem L r / T max S 00 (1 i ) i1 t t t Y t. (3) 1 Konstrukce matic S, S je podrobn popsána v [Johansen, 1995] 00, 11
121 Test vrohodnostním pomrem ( LR-test ) Q ( H ( r) H ( n)) modelu H (r) v modelu H (n) dvou výraz (3) pro r a n, tedy Q( H ( r) H ( n)) T S S Po zlogaritmování obdržíme tzv. TRACE statistiku Statistika pro testování modelu r i1 n i1 n (1 i ). (1 ) ln Q( H ( r) H ( n)) T ln(1 ). (4) ir1 H (r) v H ( r1) (tzv. MAX statistika) je dána vztahem lnq( H( r) H( r1)) T ln(1 ). (5) r1 Pedpokládejme, že hodnost matice je rovna r. Asymptotické rozdlení statistik (4) a (5) závisí na existenci deterministického lenu v modelu. Saikkonen a Lütkepohl (viz Lütkepohl, 007) navrhli test kointegrace, založený na tom, že nejprve je v procesu odhadnut deterministický len D t, ten je odeten od pozorování a na vzniklý proces je použit Johansenv LR-test. Oba typy test budou použity pi kointegraní analýze. 3. Analýza modelu inflace pro eskou republiku Pi rozboru modelu inflace budeme vycházet z lánku [Kim, 001], který se zabývá analýzou inflace v Polsku. Pokusíme se daný model aplikovat na makroekonomické ukazatele eské republiky. V modelu vystupují následující veliiny (jedná se o tvrtletní hodnoty ): y t - reálný hrubý domácí produkt eské republiky m t - penžní agregát M eské republiky F p t - zahraniní mnová hladina (index spotebitelských cen EU) w t - nominální mzdy v eské republice D p t - domácí cenová hladina (index spotebitelských cen eské republiky) e t - smnný kurz (eské koruny a eura) Pozn.: Zdrojem dat jsou internetové stránky eské národní banky ( a EUROSTAT (epp.eurostat.ec.europa.eu), všechny uvedené asové ady jsou zlogaritmované. Ekonomická teorie rozlišuje ti druhy inflace: monetární, mzdovou a importovanou. Lze psát D F D D D p f ( p, m p, w p, e, y p ), t t t D D D kde mt p t je reálná penžní zásoba, wt p t jsou reálné mzdy a yt p t je reálný hrubý domácí produkt. Monetární inflace se objevuje v pípad, že rst penžní nabídky pevyšuje rst ekonomiky. Za pedpokladu homogenity reálných penz a reálného výstupu lze reálnou penžní zásobu vyjádit ve tvaru D D m p b ( y p ). (6) t t K mzdové inflaci dochází, když rst reálných mezd je vtší než úrove mezd, která odpovídá rstu produktivity dané zem. Pro reálné mzdy tedy mžeme psát t t t t t t i t i t Daná rovnice pedpokládá, že vliv nezamstnanosti na mzdy není významný (viz [Kim, 001]).
122 w p t D t a ( y Importovaná inflace je výsledkem nerovnosti cenových hladin jednotlivých národních ekonomik. Za platnosti parity kupní síly mžeme psát D F p e p. (8) Podrobnjší odvození rovnic lze nalézt v [Kim, 001]. t t t t p D t ). (7) 14 HDP 14.5 M CPI EU CPI CZ Platy Smnný kurz Obrázek 1:Pirozené logaritmy asových ad Pomocí test kointegrace nyní zkusíme ovit platnost daných vztah (6), (7) a (8) pro eskou republiku. Nejprve budeme analyzovat dané vztahy jednotliv a poté se pokusíme sestavit celkový model. D D Ozname nejprve Y1 ( mt pt, yt pt )'. Pomocí test jednotkových koen je možné ukázat, že jednotlivé složky této dvourozmrné asové ady jsou integrované ádu 1. Tuto adu je možné popsat pomocí modelu VAR(5) s konstantou a sezónní složkou. Pomocí zmínných test kointegrace ovíme, zda jsou tyto ady kointegrované. Tabulka 1 obsahuje hodnoty TRACE a MAX statistiky, dále test Saikkonena a Lütkepohla (S&L) s odpovídajícím p-hodnotami. Tabulka 1: Testy kointegrace monetární inflace r TRACE p-hodnota MAX p-hodnota S&L p-hodnota 0 1,033 0,0056 1,031 0,008 16,3 0, ,00 0,9630 0,00 0,00 0,00 0,9834 Nulovou hypotézu, že r 0 (neexistuje kointegrace) mžeme zamítnout, hypotézu, že r 1 již zamítnou nelze. Pedpokládejme tedy, že daná asová ada je kointegrovaná s jedním kointegraním vektorem, jehož odhad je ˆ (1; 0,78810)'. Nyní mžeme provést test lineární hypotézy o kointegraním vektoru R vec ( ) q, v našem pípad je R (1,1), 1, )' ( a q 0, který má asymptoticky rozdlení. Testová statistika (založená na vrohodnostním podílu) má hodnotu 1,886 s p-hodnotou 0,1696. Danou hypotézu tedy není
123 možné zamítnout, mžeme tedy pedpokládat, že vztah vyjadující monetární inflaci pro eskou republiku platí. D D Ozname nyní Y ( wt pt, yt pt )'. Testy jednotkových koen opt ukázaly, že složky integrované ádu 1, danou asovou adu lze popsat VAR(3) modelem s konstantou a sezónní složkou. Výsledky kointegraní analýzy jsou shrnuty v tabulce. Tabulka : Testy kointegrace mzdová inflace r TRACE p-hodnota MAX p-hodnota S&L p-hodnota 0 5,444 0,0009 5,119 0,0004 8,53 0, ,35 0,5686 0,35 0,5686 0,55 0,5157 I v tomto pípad mžeme pedpokládat existenci jednoho kointegraního vektoru, jehož odhad je ˆ (1; 0,9739)'. Provedeme-li stejný test jako v pípad monetární inflace, obdržíme hodnotu testové statistiky 0,57 s odpovídající p-hodnotou 0,6117, hypotézu tedy není možné zamítnou a opt je možné pedpokládat, že vztah popisující mzdovou inflaci platí. Pro test posledního vztahu popisující importovanou inflaci ozname D F Y3 ( pt, et pt )'. Složky jsou opt integrované, tuto dvourozmrnou asovou adu mžeme popsat pomocí modelu VAR(1) s konstantou. Výsledky test kointegrace jsou shrnuty v tabulce 3. Tabulka 3: Testy kointegrace importovaná inflace r TRACE p-hodnota MAX p-hodnota S&L p-hodnota 0 3,597 0, ,08 0, ,94 0, ,390 0,036 4,390 0,036 0,88 0,3983 Na hladin významnosti 0,05 nejsou výsledky test zcela jednoznané, na hladin významnosti 0,01 mžeme pedpokládat existenci jednoho kointegraního vektoru, jehož odhad je ˆ (1; 0,5771)'. Test lineární hypotézy o daném kointegraním vektoru má hodnotu,309 s odpovídající p-hodnotou 0,186. Ani v tomto pípad není možné hypotézu o platnosti vztahu (8) zamítnout. V následující ásti vytvoíme vtší celkový model. Ozname D F D D D Yt ( pt, et pt, wt pt, mt pt, yt pt )'. Tuto asovou adu, která má 5 složek, lze popsat pomocí modelu VAR(5) s konstantou a sezónní složkou. Výsledky test kointegrace shrnuje tabulka 4. Tabulka 4: Testy kointegrace celkový model r TRACE p-hodnota MAX p-hodnota S&L p-hodnota 0 37,31 0, ,15 0, ,6 0, ,16 0, ,814 0, ,6 0, ,350 0, ,671 0, ,9 0, ,679 0, ,633 0,159 15,19 0, ,046 0,0810 3,046 0,0810 6,48 0,019 Na hladin významnosti 0,05 nejsou výsledky zcela jednoznané, nicmén na hladin 0,01 mžeme pedpokládat existenci 3 kointegraních vektor. Na základ vztah (6), (7) a (8) by mla matice kointegraních vektor mít tvar
124 To je možné ovit pomocí již použitého testu lineární hypotézy. Testová statistika má hodnotu 3,404, odpovídající p-hodnota se blíží nule. Hypotézu o platnosti všech tí vztah popisující inflaci zamítáme. 4. Závr Jak vyplývá z jednotlivých výsledk statistické analýzy studovaných asových ad makroekonomických ukazatel, vztahy (6), (7) a (8) popisující monetární, mzdovou a importovanou inflaci nejsou zcela v souladu s hodnotami tchto ukazatel pro eskou republiku. Jsou-li tyto vztahy analyzovány oddlen, použité testy jejich platnost nevyvrátí. V celkovém modelu, jenž zahrnul všechny použité asové ady, byly sice identifikovány 3 kointegraní vektory, které mohou odpovídat njakým dlouhodobým ekonomickým vztahm, nicmén test zamítl, že by se mlo jednat práv uvedené rovnice. 5. Literatura [1] HAMILTON, J., D Time Series Analysis. Princeton: Princeton University Press, 1994, ISBN [] KIM, B. Y. Determinants of Inflation in Poland: A Structural Cointegration Approach. Bank of Finland. Institute for Economies in Transition, BOTFIT, 001. [3] JOHANSEN, S Likelihood-based Inference in Cointegrated Vector Auto-regressive Models. Oxford: Oxford University Press, 1995, ISBN [4] LÜTKEPOHL, H. New Introduction to Multiple Time Series Analysis. Berlin: Springer- Verlag, 007, ISBN Adresa autora: Mgr. Jií Neubauer, Ph.D. Katedra ekonomiky a managementu Univerzity obrany v Brn Kounicova Brno eská republika [email protected]
125 Faktory podnikatelského prostedí a jejich klasifikaní síla 1 Factors of entrepreneurial environment and their power of classification Jakub Odehnal, Marek Sedlaík, Jaroslav Michálek Abstract: The receiver operating characteristic curves (ROC) were used to compare the power of classification of the entrepreneurial environment factors. These factors were created as the result of the factor analysis. Variables were obtained from the set of database Regio of Statistical Office of the European Communities and describe 85 European NUTS regions represent 6 European countries (Czech Republic, Germany, Poland, Austria, Slovakia, Hungary). Key words: ROC curves, entrepreneurial environment, multivariate statistical methods Klíová slova: ROC kivky, podnikatelské prostedí, mnohorozmrné statistické metody 1. Úvod Tendence k dlouhodobému vyrovnávání socioekonomických rozdíl patí mezi základní priority evropské hospodáské politiky, zejména však mezi klíové cíle regionální politiky EU. Regiony EU prostednictvím podnikatelského prostedí vytváí podmínky pro vstup nových podnikatel, investor do regionu, jejichž podnikatelská innost generuje nová pracovní místa, snižuje nezamstnanost na regionálním trhu práce a vytváí tak podmínky pro regionální ekonomický rst a tím tak napluje základní cíle evropské hospodáské politiky. Kvalita podnikatelského prostedí regiony významn odlišuje, ímž vytváí specifické regionální podmínky pro podnikatele a napomáhá tak pi rozhodování o pístupu investic do jednotlivých region. Hodnocení podnikatelského prostedí vybraných region EU pak poskytuje informace o regionech využitelné pro subjekty hospodáské politiky na úrovni národní i regionální. Mezi významné projekty hodnotící podnikatelské prostedí jednotlivých zemí adíme zejména publikace Svtové Banky jako výstupy projektu Doing Business 9. Výsledky regionálního hodnocení podnikatelského prostedí vybraných region EU mžeme nalézt v 10 prezentujících meziregionální odlišnosti podnikatelského prostedí kraj R. Píspvek pedstavuje výsledky faktorového hodnocení 85 region EU charakterizujících 6 vybraných stát EU (R, Maarsko, Nmecko, Polsko, Slovensko, Rakousko). 1 promnných bylo prostednictvím faktorové analýzy redukováno do 4 faktor podnikatelského prostedí pomocí kterých byla vytvoena užitím mnohorozmrných metod regionální klasifikace. Významnost jednotlivých faktor pro klasifikaci byla posouzena pomocí ROC kivek a pomocí plochy pod ROC kivkou oznaovanou jako AUC (Area Under Curve).. Kvalita podnikatelského prostedí mena na úrovni vybraných stát EU Hodnocení podnikatelského prostedí u vybraných 6 stát EU vychází z výsledk šetení publikovaných v 9. Sledováním 10 zejména regulaních ukazatel (vznik a zánik podniku, udlování povolení, vynutitelnost plnní smluv, ochrana investor, registrace vlastnictví, získávání úvr, podmínky pijímání a propouštní pracovník, zahraniní 1 Píspvek vznikl za podpory výzkumného zámru MSM a VZ04-FEM-K101.
126 obchodování, platba daní) studie hodnotí zejména asovou a nákladovou náronost plnní sledovaného ukazatele v dané zemi. Z námi vybraných 6 zemí (R, Maarsko, Nmecko, Polsko, Slovensko, Rakousko) je na nejvyšším míst sestavovaného žebíku 9 Nmecko (0. místo), následováno Rakouskem (5. místo). Ze sledovaných zemí Visegradské tyky nejlepšího umístní dosahuje Slovensko (3. místo), dále Maarsko (45. místo), R (56. místo) a s odstupem Polsko (74. místo). V celkovém hodnocení je tedy dobe patrný rozdíl mezi tradiními zemmi EU a postavením stále ješt nových lenských zemí EU. Srovnáním dílích charakteristik u vybraných zemí mžeme pozorovat ukazatele, u kterých vybrané zem dosahují podobných hodnot a které ob skupiny zemí v celkovém poadí sbližují (obr. 1), ale i ukazatele, u kterých existují významné rozdíly, které dané zem výrazn rozlišují (obr. ). Rakousko 40 8 Rakousko Slovensko Nmecko 18 Slovensko Nmecko 196 Polsko 31 R 17 Polsko 418 R 930 Maarsko 16 Maarsko 340 Obrázek 1: asová náronost zahájení podnikání (dny) Obrázek : asová náronost plateb daní (hodin za rok) Podmínky zahájení podnikání hodnoceny potem kalendáních dn nutných k absolvování nutných administrativních záležitostí zobrazuje obrázek 1. Ze sledovaných zemích je nejnižší asová náronost zejmá u Maarska 16 dní, nejvyšší u Polska 31 dní. V pípad této dílí charakteristiky podnikatelského prostedí tak u vybraných zemí EU nepozorujeme významné rozdíly, které by výrazn odlišovaly tradiní zem EU zastoupené Nmeckem a Rakouskem od nových lenských zemí Visegradské tyky. V pípad charakteristiky platby daní (obrázek ), jejíž výše, administrativní a asová náronost pímo ovlivuje rozhodování podnikatele o realizaci podnikatelských aktivit v dané zemi, mžeme pozorovat nejvyšší hodnotu u R, kde je asová náronost pípravy a platby daní 930 hodin. Srovnáním s ostatními vybranými zemmi nejnižší asovou náronost platby daní pozorujeme v pípad Rakouska (170 hodin) a Nmecka (196 hodin). Mezironí srovnání umístní vybraných zemí v poadí dle kvality podnikatelského prostedí vypovídá o zmn podnikatelského prostedí, jehož rostoucí kvalita vedla v pípad Nmecka, Maarska a Slovenska ke zlepšení pozic v publikovaném poadí zemí. Opaný pípad nastal u Polska a R, kdy došlo ke zhoršení výsledné pozice ze 74. místa na 75. místo, respektive z 5. místa na 56. místo.
127 Faktory podnikatelského prostedí vybraných region a jejich klasifikace Regionální podnikatelské prostedí je charakterizováno pomocí faktor ovlivujících lokalizaci ekonomických aktivit v dané oblasti. Lokalizaní faktory tak regiony odlišují a tím poskytují informace o podnikatelském prostedí a jeho kvalit. Mezi hlavní lokalizaní faktory ovlivující investory ve volb vhodné lokality dle 1 adíme makroekonomickou a politickou stabilitu, dostatek kvalifikovaných pracovních sil, kvalitní infrastrukturu, blízkost vdecko výzkumné základny dále inovaní potenciál, situaci na regionálním trhu práce. Data pro faktorové hodnocení regionálního podnikatelského prostedí 85 region EU byla získána z Regional Statistics Yearbook 3 a databáze Regio 4. Výsledkem faktorové analýzy 7 jsou 4 faktory podnikatelské prostedí charakterizující vybrané regiony EU prostednictvím vypoteného skóre. Faktor kvality pracovních sil a inovací (1) Faktor trhu práce () Faktor ekonomické výkonnosti (3) Faktor infrastruktury (4) Regionální faktory podnikatelského prostedí jsou tvoeny z 1 promnných s pihlédnutím na významnost faktorových zátží u každé promnné. Faktor kvality pracovních sil a inovací je tak tvoen 9 promnnými: poet ICT patent na mil. obyvatel, poet biotechnologických patent na mil. obyvatel, zamstnanost v technologicky a vdecky nároných oborech, poet High-tech patent na mil. obyvatel, celkové výdaje na vdu a výzkum v regionech jako % HDP, procento zamstnaných výzkumných pracovník v regionu, zamstnanci vdy a výzkumu jako % pracovní síly, poskytování IT služeb v regionu, podíl pracovní síly s terciálním vzdláním na celkové pracovní cíle. Faktor trhu práce 5 promnnými: dlouhodobá nezamstnanost, celková zmna potu obyvatel, istá migrace, procentní vyjádení HDP na obyvatele k prmru EU, míra zamstnanosti v regionech, míra nezamstnanosti v regionech. Faktor ekonomické výkonnosti 5 promnnými: HDP na obyvatele v bžných cenách, píjem domácností, produktivita práce (HDP na zamstnance), produktivita služeb a Faktor infrastruktury promnnou charakterizující hustotu dopravních cest v regionech. Výsledky faktorové analýzy budou dále použity ke klasifikaci region pomocí shlukové analýzy. Mnohorozmrná klasifikace sledovaných region byla vytvoena užitím shlukové analýzy, 5, 7, kdy jako objekty byly zvoleny vybrané regiony EU a jako promnné vypotené faktorové skóre pro dílí faktory podnikatelského prostedí. Výsledky hierarchického shlukování (wardova metoda, druhá mocnina euklidovské vzdálenosti) zobrazené na obrázku 3 a mapou podle [7] na obr. 4 ukazují na pirozenou klasifikaci region EU do skupin odlišujících se podnikatelským prostedím a jeho kvalitou. První skupina je tvoena 16 regiony Polska s oznaením (pl11 pl63), 7 regiony R (cz0 cz08), 6 regiony Maarska (hu1 hu33) a 3 regiony Slovenska (sk0 sk04). Druhá skupina je tvoena 41 regiony Nmecka (de11 deg0), 9 regiony Rakouska (at11 at34), 1 regionem R (cz01), 1 regionem Slovenska (sk01) a 1 regionem Maarska (hu10). Výsledky klasifikace poslouží jako základ pro zjištní významnosti jednotlivých faktor podnikatelského prostedí pro danou klasifikaci. Zmínná významnost sledovaných faktor bude posuzována prostednictvím tvaru ROC kivek (nap. v [8]) a výpotu plochy AUC (nap. v [8]) umožující srovnání faktor podnikatelského prostedí dle kvality použitého klasifikaního kritéria. Vysoké schopnosti správné klasifikace objekt a tedy vysoké klasifikaní síle odpovídá tvar ROC kivky, kdy kivka nejprve strm roste a dále je tém konstantní (tj. odpovídající AUC se blíží k hodnot 1). Opané situaci, tedy nízké schopnosti klasifikace, odpovídá tvar ROC kivky blížící se diagonále.
128 Hladina spojení Wardova metoda pl51 pl6 pl4 pl pl5 pl34 pl3 pl31 pl43 pl33 pl61 pl11 pl41 pl1 pl1 sk04 pl63 sk03 sk0 cz08 hu31 cz06 hu33 hu3 hu3 cz07 cz04 hu1 cz05 hu cz03 cz0 at13 at33 at3 at34 at31 at at1 at1 deb de94 de93 def0 de6 at11 de7 deb1 de dee dee1 dee3 de80 ded1 deg0 de41 de50 ded ded3 de4 de91 de30 deco dea5 dea3 dea4 dea1 de7 de60 de73 de4 deb3 de9 dea de71 de14 de3 de13 de1 de1 de5 de11 sk01 hu10 cz01 klasifikované regiony Obrázek 3: Výsledek mnohorozmrné klasifikace vybraných region EU Obrázek 4: Mapové zobrazení výsledk klasifikace 4. Stanovení klasifikaní síly faktor podnikatelského prostedí pomocí ROC kivek ROC kivky odpovídající vytvoeným faktorm spoteme metodou EBBUCE (Estimate Based on the Best Unbiased CDF Estimate), kterou lze najít v [6]. Hodnoty AUC charakteristiky odpovídající výše uvedeným ROC kivkám jsou uvedeny v tabulce 1. AUC Faktor 1 0,764 Faktor 0,5937 Faktor 3 0,9846 Faktor 4 0,5741 Obrázek 5: Odhad ROC kivek faktor podnikatelské prostedí Tabulka 1: Hodnoty AUC charakteristiky vytvoených faktor
129 Mezi skupinami vybraných region tradiních zemí EU a sledovaných region zemí Visegradské tyky mžeme dle tvaru odhadnutých ROC kivek (viz obr. 4) usuzovat vysokou klasifikaní sílu zejména u faktoru ekonomické výkonnosti. Obdobn i odhadem plochy pod ROC kivkou (AUC) pozorujeme nejvyšší kvalitu klasifikaního kriteria v pípad faktoru 3 podnikatelského prostedí. Prokázána je tak výrazná odlišnost sledovaných skupin region zejména u charakteristik makroekonomického výstupu, které daný faktor sytí. Následující obrázek zobrazuje promnnou HDP na obyvatele v PPS jako promnnou faktoru ekonomické výkonnosti, která demonstruje zjištné rozdíly v ekonomické úrovni sledovaných region EU. Rozdíly tak mezi regiony jednotlivých zemí mžeme posuzovat prostednictvím maximální respektive minimální hodnoty ukazatele a pomocí mediánu. Medián Min-Max Slovensko sk04 Východné Slovensko sk01 Bratislavský kraj Polsko pl31 Lubelskie pl1 Mazowieckie Rakousko at11 Burgenland at13 Wien Maarsko hu3 Észak-Alföld hu10 Közép-Magyarország Nmecko dee1 Dessau de60 Hamburg R cz08 Moravskoslezsko cz01 Praha Obrázek 6: HDP na obyvatele v PPS, NUTS, % prmru EU Kvalita podnikatelského prostedí odrážející se v tomto ekonomickém ukazateli ukazuje na rozdílné úrovn regionálního podnikatelského prostedí u obou skupin sledovaných zemích. Vysoká úrove je zejména v oblastech tradiních prmyslových center a metropolitních region. Regionální hospodáská politika EU by tak mla být koncentrována zejména do problémových oblastí, jejichž regionální podnikatelské prostedí je oproti tradiním zemím EU mén vysplé, což se odráží v ekonomickém úrovni region a v životní úrovni obyvatel. Konvergenci region jako jeden z cíl regionální politiky je tak možno dosáhnout prostednictvím zlepšení podmínek pro podnikání a celkového zvýšení konkurenceschopnosti region. 5. Závr Píspvek pedstavuje použití ROC kivek ke zjištní klasifikaní síly faktor podnikatelské prostedí. Vybraných 85 region EU bylo prostednictvím zkonstruovaných faktor a užitím shlukové analýzy klasifikováno do dvou skupin odlišujících se kvalitou podnikatelského prostedí. První skupina region obsahuje regiony tradiních zemí EU v textu zastoupené Nmeckem a Rakouskem. Druhá skupina obsahuje regiony zemí Visegradské tyky s výjimkou metropolitních region Prahy, Bratislavy a Budapešt. Dle tvaru znázornných ROC kivek a odhadem plochy pod kivkou AUC je možné pozorovat nejvyšší odlišnosti mezi skupinami region a tedy nejvyšší klasifikaní sílu u faktoru ekonomické výkonnosti, který charakterizuje obecné ekonomické prostedí sledovaných region.
130 Literatúra [1] BLAŽEK, J., UHLÍ, D.: Teorie regionálního rozvoje. UK Praha, Nakladatelství Karolinum 00, ISBN [] HEBÁK, P.:Vícerozmrné statistické metody. Vyd. 1. Praha: Informatorium, s. [3] EUROPEAN COMISSION, REGIONAL YEARBOOK 007,Luxembourg: Office for Official Publications of the European Communities 007, ISBN EUROSTAT: Reginal statistics =PORTAL&screen=welcomeref&open=/&product=EU_MASTER_regions&depth=. [5] LUKASOVÁ, A., ŠARMANOVÁ, J. Metody shlukové analýzy. Vyd. 1. Praha: SNTL, s. [6] MICHÁLEK, J., SEDLACÍK, M., DOUDOVÁ, L.: A Comparison of Two Parametric ROC Curves Estimators in Binormal Model, 3rd International Conference Mathematical Methods in Economics 005, Hradec Králové, Czech Republic, [7] ODEHNAL, J., MICHÁLEK, J.: Hodnocení konkurenceschopnosti vybraných region EU, v recenzním ízení. [8] PEPE, M. S. The Statistical Evaluation of Medical Tests for Classification and Prediction. Oxford University Press, New York, 004. ISBN [9] SVTOVÁ BANKA: Doing Business in 008 Removing Obstracles to Growth. The World Bank, the International Finance Corporation and Oxford University Press copublication, Washington, 008 [10] VITURKA, M. a kol.: Regionální vyhodnocení kvality podnikatelského prostedí v R. 1.vyd. Brno : Masarykova univerzita, Ekonomicko-správní fakulta, s. ISBN Adresy autor: Ing. Jakub Odehnal KAMI Lipová 41a ESF MU Brno [email protected] Mgr. Marek Sedlaík, Ph.D. Katedra Ekonometrie Kounicova 65 Univerzita obrany Brno [email protected] Doc. RNDr. Jaroslav Michálek, CSc. Ústav matematiky Fakulta strojního inženýrství Vysoké uení technické v Brn Technická 896/, Brno [email protected]
131 Pokus o nájdenie spravodlivého dôchodkového systému An attempt to find the fair pension system Karol Pastor Abstract: The paper recalls the non-sustainability of the present pay-as-you-go pension system. In its present form it is unfair and decreases the birth rate, as well, because it overlooks the child-raising as an investment into the system. The solution can go in two directions: either increase the premium or to lower the parents financial contributions into the system. The paper suggests to increase the basic rate of contributions in 1 % of crude salaries and to deduct 3% for each raised child as a parental bonus. Key words: Pension system, Pay-as-you-go, Population ageing, Parental bonus, Reduction of contributions. Kúové slová: dôchodkový systém, priebežný pilier, populané starnutie, rodiovský bonus, zníženie odvodového zaaženia. 1. Úvod lánok vychádza z všeobecne známeho faktu, že totiž vaka populanému vývoju na Slovensku a celej Európe je priebežný dôchodkový systém v dnešnej podobe neudržatený. Ukážeme, že je neudržatený i po zavedení II. piliera, nespravodlivý a protipopulane pôsobiaci. Predložený lánok sa zaoberá ospravodlivením tohoto systému, t.j. hadá spôsob, ako nespravodlivý systém zmeni na spravodlivý.. Neudržatenos priebežného piliera Pod tlakom obáv z dôsledkov populaného starnutia sa u nás v posledných rokoch objavilo viacero prognóz populaného vývoja Slovenska. Vychádzajú z rôznych predpokladoch o plodnosti, migrácii a pod. Nebudeme posudzova, ktorý nich je najpravdepodobnejší. Dobrý dôchodkový systém by totiž aj tak nemal príliš závisie od populaného vývoja. Pre ilustráciu spomeme aspo prognózu Výskumného demografického centra z r. 004, publikovanú na internete [8]. Dobrým ukazovateom zmeny vekovej štruktúry populácie je napr. index starnutia, ktorý dáva do pomeru poreproduknú a predreproduknú zložku ([7], s. 76) a ktorý v pomeroch SR do budúcnosti vykazuje trvalý nárast pri všetkých prognózach. Z hadiska našej témy je však dôležitejší index ekonomickej závislosti starých udí (old age dependency ratio, napr. [7], s. 75). Možno ho definova rôzne. Pre ilustráciu, podiel potu osôb 65-roných a starších a osôb roných, ktorý poda údajov [8] bol v r. 005 iba 0,17, r. 05 bude 0,37 a roku 050 bude 0,56. To znamená, že kým r. 005 na jedného dôchodcu pripadalo 5,6 udí v produktívnom veku, r. 05 to bude iba,7 udí a r. 050 iba 1,8 udí. Ak sa nezmení výška odvodov, mali by dnešní pädesiatnici poíta iba s polovinými dôchodkami ako majú dnešní dôchodcovia, a dnešní absolventi VŠ iba s tretinovými (poítané v dnešných cenách). Dodajme, že kým pre rok 050 uvedené ísla sú hypotetické, lebo pôrodnos sa môže zmeni, ísla pre rok 05 sú už viac-menej isté. Všetci tí, ktorí r.05 budú ma 18 rokov a viac, sú už na svete. Uvedený výpoet je len orientaný, pretože z hadiska výšky dôchodkov v priebežnom pilieri je dôležitý poet pracujúcich, t.j. prispievateov do systému, a ten môže by odlišný. Závisí o.i. na dôchodkovom veku, zamestnanosti žien, pracujúcich dôchodcoch, na miere nezamestnanosti. Pri zamestnanosti 70 %, o zodpovedá odporúaniam EU [1], [], by pripadalo asi,6 prispievateov na jedného dôchodcu. Podobný podiel je v súasnosti na
132 Slovensku v ase, ke sa do systému odvádza 18 % z hrubej mzdy a dôchodky predstavujú 44 % priemernej hrubej mzdy, o znamená, že na jedného dôchodcu pripadá,45 prispievateov do systému. Ako možno vyíta napr. z Grafu 1 prevzatom z práce [4], to potrvá ešte asi 10 rokov. Potom sa však tento podiel (vaka starnutiu obyvatestva) radikálne zmení. Ak náš dôchodkový systém nezareaguje vas, aj pri optimistických variantoch by dnešní mladí mali ráta v I. pilieri iba s asi poloviným dôchodkom toho dnešného (alebo s dvojnásobnými odvodmi). Graf 1. Podiel prispievateov do Sociálnej poisovne na jedného dôchodcu v SR pre rôzny dôchodkový vek pri zachovaní súasných parametrov (plodnos, úmrtnos, zamestnanos). Zdroj [4]. 3. Nespravodlivý a protipopulaný dôchodkový systém Na obdobie života, ke sa lovek už nevládze sám uživi, sa možno pripravi dvomi spôsobmi: vychova deti, ktoré sa oho v zhode s prirodzeným zákonom postarajú, alebo naspori si peniaze, za ktoré si potom takúto starostlivos kúpi. Tieto dve riešenia si navzájom konkurujú. Výchova detí nielenže znižuje terajší a budúci pracovný príjem rodiov, ale aj ich budúci dôchodok. Súasný dôchodkový systém (a treba poveda, že I., II. aj III. pilier) sú výhodnejšie pre tých, ktorí nemajú deti. Inými slovami, súasný dôchodkový systém je protipopulaný, lebo motivuje radšej spori ako ma deti. Súasný populaný vývoj je potom už len logickým dôsledkom nastavených ekonomických podmienok. Nebudeme tu rozobera otázku II. piliera. Diverzifikuje riziko a prenáša as zodpovednosti za zabezpeenie v starobe na samotného obana, o je správne. Ak by sa vyriešila je miera štátnych záruk za úspory v DSS, tak nech príspevkovo definované povinné sporenie (II. pilier) zostane, nech je vlastníctvom sporitea a zostane zásluhové. Je správne oddeli zásluhové od solidárneho, príspevkovo definované od dávkovo definovaného. Pretože II. pilier je zásluhový, solidárnos by mala by vlastnosou I. piliera. Priebežný dôchodkový systém (I. pilier, PAYG, pay-as-you-go ) by mal ma charakter poistenia. Do I. piliera prispieva nielen ten, kto zarába (a odvádza peniaze), ale aj ten, kto dodáva
133 prispievateov, iže vychováva deti. Viacdetní rodiia teda do I. piliera prispievajú viac ako ostatní, no spravidla dostávajú dokonca menej ako ostatní. Bez zveliovania možno poveda, že tí, ktorí vychovávajú svoje deti, pracujú na bezdetných, iže súasný systém okráda viacdetných rodiov. Našastie, nespravodlivos, ktorú tento systém v sebe nesie, možno podstatne zredukova. 4. Možnosti ospravodlivenia dôchodkového systému Spôsobov, ako zmeni nespravodlivý dôchodkový systém na spravodlivejší, je viacero. Viacdetní rodiia by mali dostáva vyšší dôchodok, alebo menej prispieva, alebo oboje. Pravda, existujú aj pokusy kompenzova rodiom ich vklad do dôchodkového systému iným spôsobom. Prvú možnos ponúka zaujímavý a pomerne dobre rozpracovaný návrh V. Palka na zavedenie tzv. rodiovského piliera, poda ktorého výška vyplácaného dôchodku súvisí s potom vychovaných detí a to tak, že as odvodov pracujúceho dieaa by štát prevádzal priamo na úet jeho rodia [5], [6]. Do tejto kategórie patria aj tie riešenia, ktoré poítajú so skorším odchodom do dôchodku pre ženy poda potu vychovaných detí, alebo rôzne formy refundácie výdavkov na výchovu, ktoré siahajú do výšky rádovo 1 milión korún. Návrh, ktorý r. 004 rozpracovali Hyzl a kol. [3], je akousi kombináciou oboch prístupov. Autori navrhujú, aby dôchodok z I. piliera poberali len tí, ktorí vychovali aspo jedno diea. Poas výchovy detí neplatia príspevok do II. piliera. Ak majú dos detí, staí im to na slušný dôchodok. Najjednoduchší a administratívne nenároný sa zdá systém rodiovských bonusov pri odvodoch do I. piliera. Pracujúci, ktorý vychováva deti, má znížené odvody o uritú pevnú iastku alebo percentá z hrubej mzdy. Takýto systém platil pred pár rokmi aj na Slovensku. Vtedy to bolo o 0,5 % za každé vyživované diea, o je príliš málo. Po prvé, neodstrauje to nespravodlivos, len ju nepatrne znižuje, len na zalepenie oí. Po druhé, 0,5 % z hrubej mzdy je 100 korún, po zdanení 8, o je tak na pä pív. Aby to pôsobilo aspo trochu propopulane, musí to by cíti, musí by o závidie. Novší Brockov návrh (SME ) je 1%, o je tiež primálo, ale už trochu lepšie. Verejnos to ešte stále vníma ako zvýhodnenie rodiov, hoci ide iba o malé zmiernenie znevýhodnenia. Tento lánok uprednostuje riešenia, kde od potu detí nezávisí výška dôchodku, ale výška odvodov, teda tie, ktoré oban pocíti už teraz, nie až o 40 rokov. Ak odmena má motivova, musí by vidie už v tom ase, ke je ešte možné si ju zaslúži, nie až dodatone. Po druhé, treba taký bonus, ktorý cíti. Poda našich predbežných výpotov by to malo by aspo 5 % z hrubej mzdy za každé vyživované diea. Po tretie, pokia odmena ex post sa vzahuje len na pracujúce deti, je vemi slabo determinovaná, nezaruuje dostatonú predvídatenos, a má charakter skôr lotérie (mladý rodi nevie, koko z jeho (budúcich) detí sa dožije dospelosti, zostane na Slovensku, koko budú zarába, i neostanú pri deoch, nevie, kokokrát sa ešte bude meni dôchodkový systém). Výhodné je ma vea detí a málo vnukov. Po štvrté odmena ex post je administratívne nároná. Zisova po 50 rokoch, i niekto diea vychoval, alebo iba splodil (alebo ani to nie), najmä ak to bolo v cudzine, je takmer nemožné. o ak ho vychovával iba 5 rokov a potom odišiel od rodiny - koko má dosta? Ex post sa spravodlivé riešenie asi nájs nedá. Naproti tomu systém odvodových úav (dnes vychovávaš - dnes máš úavu) nevyžaduje prakticky žiadne nové administratívne úkony. Všetko o treba sa zisuje už pri daovom priznaní a je ahko overitené. Zostáva už len uri výšku spravodlivého rodiovského bonusu. 5. Orientaný výpoet výšky odvodového bonusu V tejto asti budeme vychádza z modelu, v ktorom sa výchova detí poíta ako investícia do priebežného I. piliera, o sa zohaduje nie pri urovaní výšky dôchodku, ale
134 odvodov. Zníženie odvodov (rodiovský bonus) nemá povahu refundácie nákladov na výchovu diea (rodiia nepredávajú svoje deti), ale je urené cenou dieaa pre dôchodkový systém. Výpoet výšky rodiovského bonusu nie je jednoznaný. Pre orientáciu môžeme vychádza z nasledovnej úvahy: Nech A a B sú dva takmer rovnaké štáty, ktoré sa líšia iba v tom, že v B je dvakrát vyššia pôrodnos ako v A. V oboch štátoch je príspevok do I. piliera rovnaký, 9 % hrubej mzdy. Nech v štáte A je tzv. stacionárna populácia - udí neubúda, ani nepribúda, istá miera reprodukcie je 1, o znamená že každý má priemerne,1 dieaa (pre jednoduchos alej poítajme s celými íslami, t.j. iba s dvomi demi). V štáte B je istá miera reprodukcie, o znamená, že za 40 rokov od nástupu do zamestnania do odchodu do penzie sa poet obyvateov zvýši asi 3 krát ( 40/5 = 1,6 = 3,03, kde 5 je džka generácie a 40 je džka pracovnej kariéry). Znamená to, že aj poet prispievateov je trikrát vyšší a erstvý dôchodca v štáte B môže poíta s 3-krát vyšším dôchodkom ako v štáte A. Je to akoby odmena za to, že miesto dvoch mal štyri deti. Teda aj obrátene, na to, aby rodi štyroch detí štáte B mal rovnaký dôchodok ako rodi dvoch detí štáte A, staí, aby prispieval tretinovým odvodom. Keže štvordetný rodi sa poas 40-ronej pracovnej kariéry stará priemerne o deti, jedno diea navyše by predstavovalo zníženie odvodov z 9% na 3%. Závery pre iné poty detí možno robi extrapoláciou. Pretože poet obyvateov jej nelineárnou funkciou istej miery reprodukcie, extrapolácie možno robi rôznym spôsobom. Možno tak napr. vyvodi, že bezdetný by mal prispieva sumou trikrát vyššou, t.j. 7 %, trojdetný sumou 1%, štvor- a viacdetný by neprispieval ni. Tak by to bolo aj motivané. Na druhej strane, takýto výsledok príliš revoluný, schematický (vyššie uvedené výpoty závisia od istej miery reprodukcie v štáte, nie od individuálnej plodnosti) a neúnosný z ekonomického i administratívneho hadiska. Viedol by k tomu, že bezdetní by chodili pracova do zahraniia. Výpoet je teda len orientaný, ukazuje však, že minulosti platný bonus 0,5 % za každé diea (alebo dnešný bonus 0 %) má aleko od spravodlivosti. Z uvedených dôvodov treba uprednostni nejaký únosný kompromis, napr. zníženie odvodov o 3 % za každé vyživované diea. To samozrejme povedie v výpadku príjmov v Sociálnej poisovni. Tá musí eli alším dvom problémom: schodku spôsobenom odchodom asti sporiteov do II. piliera a už spomínanému zníženiu potu prispievateov vaka demografickému starnutiu. Preto tak i tak najneskôr o 10 rokov bude treba odvody zvýši a celý systém dolaova poda konkrétnej situácie. Na záver uveme jeden konkrétny návrh. Odvody do II. piliera 9%, do I. piliera základná sadzba 1 % (neskôr možno i viac) a zníženie za každé vyživované diea o 3 % hrubej mzdy. V súasnosti na dôchodok prispieva do Sociálnej poisovne zamestnanec 4% a zamestnávate 14 % hrubej mzdy. Po úprave by prispieval zamestnanec 7 % a zamestnávate 14 %, zavy sa týkajú prednostne tej asti, ktorú odvádza zamestnanec. Úprava by mala vstúpi do platnosti v blízkej dobe, nie neskôr ako po r. 01, ke za podiel prispievateov na poberateov zane zhoršova. Možno ju kombinova so zvýšením dôchodkového veku (napr. na 65 rokov). Samozrejme, varianty a vylepšenia sú možné, prechodné opatrenia potrebné. V každom prípade, nech už sa ujme okovek, je potrebné, aby sa o probléme konene zaalo vážne diskutova. 6. Literatúra [1]EURÓPSKA KOMISIA 005. Zelená kniha Nová medzigeneraná solidarita ako odpove na demografické zmeny Oznámenie komisie KOM(005) 94. Brusel
135 []EURÓPSKA KOMISIA 006. Demografická budúcnos Európy - pretvorme výzvy na príležitos. Oznámenie komisie KOM(006) 571. Brusel [3]HYZL, J., RUSNOK, J., EZNÍEK, T., KULHAVÝ, M Penzijní reforma pro eskou republiku. Praha [4]MANIAKOVÁ, J Prognózy hospodárenia dôchodkového systému SR. Bakalárska práca. FMFI UK Bratislava 008. [5]PALKO, V Preo budeme vymiera? In: Impulz 3,.4, 007, s [6]PALKO, V., KRAJNIAK, M Ekonomika konzervatívnej solidarity. Pracovný text, Bratislava [7]VAO, B., JUROVÁ, D., MÉSZÁROS, J Základy demografie. OZ Sociálna práca, Bratislava 003. [8]VÝSKUMNÉ DEMOGRAFICKÉ CENTRUM 004. Prognóza obyvatestva SR do r Adresa autora: Doc. RNDr. Karol Pastor, CSc. KAMŠ FMFI UK Mlynská Dolina, Bratislava [email protected]
136 Stanovení vrcholu a dna hospodáského cyklu R pomocí neparametrického odhadu derivace trendu Through and Peak Determination of the CR Business Cycles using nonparametric estimat of the trend derivation Jitka Pomnková Abstract: Presented paper deals with through and peak determination of the CR business cycle using statistical detrending technique, namely nonparametric Gasser-Müller estimate. In the first step, analysis of time trend and expert estimate of potential turning points are done. Consequently, an estimate of the first derivation of given time series is done followed by turning points determination, i.e. throughs and peaks. Then, according to the result of the second derivation time trend estimate, analysis of potential turning point (trough or peak) are done. Finally, by comparison of obtained results, determination of troughs and peaks of the CR business cycle is concluded. Key words: business cycle, Gasser-Müller estimate, trough, peak Klíová slova hospodáský cyklus, Gasser-Müllerv odhad, dno, vrchol 1. Úvod Hrubý domácí produkt (HDP) je považován za základní ukazatel poskytující informace o ekonomické úrovni a výkonnosti zem. Zachycuje produkci vytvoenou výrobními faktory na území daného státu. Pi sledování vývoje HDP v ase jsou zejmé dv jeho základní charakteristiky, a to dlouhodob rostoucí úrove HDP a jeho krátkodobé fluktuace projevující se projevují cyklickým vývojem mezironích temp rstu. V dlouhém období se krátkodobé fluktuace ekonomické výkonnosti zdají být zanedbatelné. Ovlivují však významn každodenní rozhodování jednotlivých ekonomických subjekt a nositel hospodáské politiky. Fluktuace ekonomické aktivity obvykle nelze objasnit jedinou píinou, jde spíše o souhrn rzných vliv, a to exogenních i endogenních. Jak definují Dornbusch a Fischer (1994) hospodáský cyklus pedstavuje více nebo mén pravidelné stídání expanze a recese ekonomické aktivity kolem dráhy trendového rstu. Na vrcholu cyklu je ekonomická aktivita vzhledem k trendu vysoká, v sedle je dosaženo spodního bodu ekonomické aktivity. Hospodáské cykly jsou charakterizovány jako opakované sledy výrazných expanzí a recesí celkové ekonomické aktivity, které jsou ohranieny body zvratu. Recese je období mezi vrcholem a sedlem (dnem) aktivity a expanze je období mezi sedlem (dnem) a vrcholem. Recesi, resp. expanzi, charakterizuje významný pokles, rep. rst, úrovn agregátní ekonomické aktivity pesahující nkolik msíc. Celková doba mezi dvma vrcholy uruje délku cyklu, která se pohybuje mezi jedním rokem až více než deseti lety. Vrcholy a sedla cyklu jsou identifikovány podle bod zvratu spektra ukazatel (Kadeábková, 003). Podle Canovy (1999) mžeme provést dlení soudobých filtraní techniky na statistické a ekonomické. Mezi statistické techniky lze zaadit techniku prvních diferencí nebo eliminaci trendu pedpokládající pímou nepozorovatelnost trendové nebo cyklické složky, k jejíž identifikaci však používají rozdílné statistické pedpoklady. V pípad statistického pístupu pedpokládáme, že použitá data byla pedem sezónn oištna nebo, že sezónní a cyklická složka jsou považovány za jednu složku a že nepravidelné (vysokofrekvenní) fluktuace mají malý význam.
137 Pedkládaný píspvek se zabývá detekcí dna a vrcholu hospodáského cyklu pomocí statistické filtraní techniky, a to neparametrického jádrového odhadu. Zvoleným typem odhadu je konvoluní typ Gasser-Müllerova odhadu z dvodu možnosti odhadování i derivací trendu vývoje. Nejprve je odhadnut trendu vývoje, který je následován expertním odhadem potenciálních bod zvrat (dna a vrcholy). Poté je proveden odhad první derivace trendu vývoje a jsou stanoveny potenciální extrémy, tedy dna a vrcholy. Následn je odhadnuta druhé derivace trendu vývoje a analyzováno, zda potenciální extrémy jsou maxima (vrcholy) nebo minima (dna). Komparací dosažených výsledk jsou v závru konstatována období dna a vrcholu hospodáského cyklu R.. Metodika Nech jsou hodnoty x pevn voleny experimentátorem a hodnoty Y, které mohou být reálné nebo simulované, jsou závislé na hodnotách x. Regresní rovnice popisující vztah dvojice promnných (x i,y i ), i=1,...n mžeme zapsat jako Y i = m(x i ) + i, i=1,...,n s neznámou regresní funkcí m a chybou pozorování i, pro kterou platí E( i )=0, D( i )=, i=1,...,n. Myšlenka jádrového vyhlazování je najít vhodnou aproximaci m odhadu funkce m, piemž pedpokládáme ekvidistantní rozdlení bod plánu x i intervalu [0,1]. Pedpokládejme, že jsou nezáporná celá ísla, 0 < k. Obvykle, jádro K je kompaktn nesená reálná funkce splujících podmínku KS,k 0, kde S,k 0 je tída reálných funkcí: 1,1, 1,1 K Lip nosi( K) 0 0 j k, j 0 S 1, k j () x K( x) dx ( 1)! j 1 k 0 j k íkáme, že K je jádro ádu (, k). Hladkost jádrové funkce je vyjádena následovn. Ozname pro libovolné celé íslo 1 S 0 ( j) ( j) k K K S, k C [ 1,1], K K 0, j 0,1,..., 1. (3), Tato jádra nazýváme hladká jádra. Podrobnji viz Horová (00). n Obecn mžeme jádrová odhad zapsat m( x) SY W ( x; h) Y, kde W i (x;h) oznauje i 1 váhovou funkci. Váhové funkce, které lze zapsat do vyhlazovací matice S=(s ij )=( W i (x j ;h)), i,j=1,...,n, závisí na h,i,x a K. Poznamenejme, že h oznauje šíku vyhlazovacího okna a že vyhlazovací matice S nezávisí na Y. Gasser-Müllerv, tzv. konvoluní, typ jádrového odhadu funkce m je definován následovn m 1 h ( ) n ( x) Y i1 i 1 si si1 i x u K du. (4) h Body plánu x i [0,1], i=1,...,n, jsou vzestupn uspoádané a pro body s i, i=0,...,n platí s 0 =0, s i =(x i+1 +x i )/, i=1,...n-1 a s n =1. Pro prvky vyhlazovací matice S=(s ij )=( W i (x j ;h)), i,j=1,...,n, v bod plánu x j, s šíkou vyhlazovacího okna h pro Gasser-Müllerv odhad platí vztah 1 si x j u Wi x j h K du h s i h ( ; ). (5) 1 1 i
138 Výhodou využití Gasser-Mullerova odhadu je možnost odhadovat nejen funkci, ale také jejich derivací. Pro odhad optimální šíky vyhlazovacího okna je ožné použít metodu zobecnného kížového ovování. Pi odhadu funkce mžeme toto kritérium formulovat následovn: h arg min GCV ( ), (6) opt, GCV hh h kde H oznauje množinu, na které hledáme minimum zobecnné funkce kížového ovování. 1/(k1) 1/(k1) Zpravidla postaí H n [ ak n, bk n ] pro njaké 0 a k bk. Pro funkci GCV platí 1 n Yi mxi GCV ( h), (7) i 1 n 1 tr( S) / n kde tr(s) oznauje souet diagonálních prvk vyhlazovací matice definované výše. Odhad šíky vyhlazovacího okna v pípad odhadu první derivace funkce m získáme ze vztahu (1) 1 n 1 (1) (1) (1) CV ( h) 1 (, 1) ( ) i i m i i xi, (8) n1 (0) (0) (1) (0) (0) (1) (0) (0) (0) (0) kde xi xi, i Yi, xi ( xi 1 xi ) /, i ( i1 i ) /( xi 1 xi ), i 1,..., n (1) (1) (1) a m ( x ) je jádrový Gasser-Müllerv odhad v bod x i konstruovaný na datech ( i, i 1) i (x 1,Y 1 ),..., (x i-1,y i-1 ), (x i+,y i+ ),... (x n,y n ). íslo h (1), které minimalizuje CV (1) (h), je odhadem optimálního vyhlazovacího parametru pro odhad 1. derivace: (1) 0 h ( 1) arg min CV ( h), K S opt, CV hh 1, k, (9) n kde zpravidla H n [ 1/ n,]. Lze ukázat (Pomnková, 005), že platí 1/(k1) opt,cv 1/(k1) * ( 1)( k1) * opt,, k hopt,1, k pro * ( 1) k * hopt,, k hopt,0, k k pro, k sudé a h 3( k ), k liché. Postaí tedy urit odhad hodnoty h pro =0 (sudé) a =1 (liché) podle toho, zda poítáme odhad sudé nebo liché derivace funkce m. 3. Empirická ást Pro emipirickou analýzu byly zvoleny mezironí procentní zmny tvrtletních absolutních hodnot HDP eské republiky v konstantních cenách, sezónn oištné v období 1997/1 008/1. V dalším textu budou použité hodnoty oznaovány za HDP. Pro vstupní data byly provedeny neparametrické odhady a to vývoje trendu HDP (Obrázek 1), vývoje první derivace HDP (Obrázek ) a vývoje druhé derivace HDP (Obrázek 3). Pi konstrukci bylo využito optimalizace vyhlazovacího parametru šíky vyhlazovacího okna pomocí metody zobecnného kížového ovování a optimalizace výbru vhodné jádrové funkce (Pomnková, 005). Použité parametry uvádí následující tabulka. Tabuka 1:Parametry píslušné použitým neparametrickým odhadm. Odhadovaný trend Šíka vyhlazovacího okna Typ jádrové funkce Vývoj HDP h=0,056 1 S 0, Vývoj 1. derivace HDP h=0,067 1 S 1,3 Vývoj. derivace HDP h=0,767 1 S,4
139 Ped aplikací Gasser-Mülerova odhadu byla data testována na nezávislost Kendalovým testem náhodnosti, piemž nulová hypotéza o nezávislosti byla zamítnuta. Proto bylo pistoupeno k odhadu šíky vyhlazovacího okna i dalšími zpsoby (metody minimalizující AMSE, Härdle,1990), piemž zjištné výsledky lze považovat za shodné s výsledky zjištné metodou zobecnného kížového ovování. Lze se tedy domnívat, že pro odhady funkcí i derivací funkcí mžeme hodnoty šíek vyhlazovacího okna, jak je uvádí Tabulka. 1, považovat za vyhovující. Analýza dat probhla v následujících krocích. Nejprve byl proveden odhad vývoje HDP v eské republice pomocí Gasser-Mülerova odhadu a expertn odhadnuty možné okamžiky dna a vrcholu hospodáského cyklu. Ve druhém kroku byl proveden Gasser-Mülerv odhad první derivace vývoje HDP a stanoveny stacionární body. Tj. body, ve kterých je první derivace nulová, a tedy ve kterých lze oekávat extrém. V posledním kroku byl proveden Gasser-Mülerv odhad druhé derivace vývoje HDP a posouzeno, zda v nulových bodech první derivace lze oekávat nastává maximum nebo minimum q q q01 000q01 001q01 00q01 003q01 004q01 005q01 006q01 007q01 008q01 HDP odhad HDP dolní IS horní IS Obrázek 1: Gasser-Mülerv odhad vývoje HDP v R q q q01 000q01 001q01 00q01 003q01 004q01 005q01 006q01 007q01 008q01 odhad 1. derivace HDP dolní IS horní IS Obrázek : Gasser-Mülerv odhad 1. derivace vývoje HDP v R q q q01 000q01 001q01 00q01 003q01 004q01 005q01 006q01 007q01 008q01 odhad. derivace HDP dolní IS horní IS Obrázek 3: Gasser-Mülerv odhad. derivace vývoje HDP v R
140 , 1 0,8 0,6 0,4 0, 0-0, ,4-0,6 Obrázek 4: Rezidua po provedení Gasser-Mülerova odhadu vývoje HDP v R Na základ rozboru výsledk Gasser-Mülerova odhadu první derivace vývoje HDP a odpovídajícího intervalu spolehlivosti pro tento odhad (Obrázek 1) lze oekávat tyi možná obdob pro výskyt extrému: 1997/Q4 1998/Q1, 000/Q - 000/Q4, 00/Q1 00/Q a 006/Q1 006/Q3. Porovnáme-li zjištná období se skutenými hodnotami HDP, pak v prvním období dosahuje HDP hodnoty minima v 1997/Q4, maxima v 000/Q, minima v 00/Q1 nebo 00/Q (hodnoty HDP jsou v tchto obdobích stejné, menší než v pedchozích obdobích 001/Q4 a následujících obdobích v 00/Q3) a maxima v 006/Q3. Doplníme-li analýzu o výsledky Gasser-Mülerova odhadu druhé derivace vývoje HDP, vidíme, že ve stanovených obdobích nastává minimum v období 1997/Q4 1998/Q1, maximum v období 000/Q - 000/Q4, minimum v období 00/Q1 00/Q a maximum v období 006/Q1 006/Q3. Výsledky odhadu trendu vývoje HDP v eské republice a expertním odhadem stanovená minima (dna) a maxima (vrcholy) lze tedy pokládat za potvrzená odhadem první i druhé derivace vývoje HDP. Provedeme-li analýzu reziduí, pak na základ Box-Piercova testu založeném na prvních 15 autokorelacích nelze zamítnout nulovou hypotézu o náhodnosti reziduí (p-value = 0,8133>0,05). Z Obrázku 4. je patrné, že v krajních hodnotách dosahují rezidua vyšších hodnot, než v prbhu posuzovaného období. Toto lze piítat tzv. hraniním efektm, které se mohou vyskytnout v souvislosti s Gasser-Mülerovým odhadem. Korekcí hraniních efekt se však nebudeme zabývat, nebo v konkrétním pípad nemají hraniní efekty zásadní vliv na detekci minim a maxim vývoje trendové funkce v posuzovaném období. Potenciálním rizikem by sice mohl být hraniní efekt jádrového odhadu na poátku posuzovaného období, ale podíváme-li se na vývoj úvodních ty hodnot, vyvíjejí se klesajícím zpsobem, piemž odhad trendu vývoje dosahuje v pípad prvních dvou hodnot nižší úrovn. Lze se tedy domnívat, že korekce hraniního efektu v úvodu posuzovaného období by trendovou funkci upravila zvýšením hodnoty odhadu (Pomnková, 004). 4. Závr Pedkládaný píspvek se zabýval detekcí dna a vrcholu hospodáského rstu R v období 1997/1 008/1 pomocí neparametrického Gasser-Müllerova odhadu s využitím odhadu derivací. V prvním kroku byl odhadnut trendu vývoje hodpodáského cyklu a expertním odhadem byly stanoveny možné body zvratu - dna a vrcholy. Poté byl proveden odhad první derivace trendu vývoje a stanoveny potenciální extrémy - dna a vrcholy. Následn analýzou výsledk druhé derivace trendu vývoje bylo zkoumáno, zda potenciální extrémy jsou extrémy, a to maxima (vrcholy) nebo minima (dna). Komparací dosažených výsledk bylo zjištno, že pi použití neparametrického Gasser-Müllerova odhadu nastávají ve stanoveném období 1997/1 008/1 dv minima (dna) a dv maxima (vrcholy) ve vývoji ekonomiky R. Jmenovit, v období 1997/Q4 1998/Q1
141 minimum, v období 000/Q - 000/Q4 maximum, v období 00/Q1 00/Q minimum a v období 006/Q1 006/Q3 maximum. Pedkládaný píspvek vznikl za podpory výzkumného zámru eská ekonomika v procesech integrace a globalizace a vývoj agrárního sektoru a sektoru služeb v nových podmínkách evropského integrovaného trhu. 5. Literatura [1]CANOVA, F Does Detrending Matter for the Determination of the Reference Cycle nad Selection of Turniny Points?, The Economic Journal, Vol. 109, No. 45 (Jan., 1999), pp []DORNBUSCH, R., FISCHER, S Makroekonomie, šesté vydání, Praha SNP a Nadace Economics 1994, Praha, 1994, pp.60, ISBN [3]HÄRDLE, W Applied nonparametric regression. Cambridge University Press, Cambridge, 1990 [4]KADEÁBKOVÁ, A Základy makroekonomické analýzy, Linde, Praha, 003, 176 s., ISBN X [5]POMNKOVÁ, J Edge effects of the Gasser-Muller estimator. In Summer School Datastat03, Proceedings, Folia Fac.Sci.Nat.Univ.Masaryk.Brunensis,Mathematica 15, vyd. Brno: MU Brno, 004, s ISBN [6]HOROVÁ, I. 00. Optimization problems Connected with Kernel estimates, Signal processing, Communications and Computer Science. 00 by World Scientific and Engineering Socitey Press, pp [7]POMNKOVÁ, J Nkteré aspekty vyhlazování regresní funkce, PhD-thesis, Ostrava, 005. Adresa autora: Jitka Pomnková, Ph.D., RNDr. Ústav financí PEF MZLU v Brn Zemdlská l eská republika Brno [email protected]
142 Dopad finanních prostedk plynoucích z Evropské unie na ekonomiku eské republiky Impact of financial transfers from the European Union on the Czech Republic economy Jan Penosil, Jitka Pomnková Abstract: Membership of Czech Republic and other Central European states is a political, economical and social issue. Considerable inflows of money spend on pre-accession aid, structural policy and common agriculture policy are helping the structural changes in the transitional economy. Efficiency of usage of these sources is important due to possible influence of the system in financial aid in period and next financial period. Experience in new member states can help with more efficient allocation. Key words: Correlation analysis, European Union, Economic and Social Cohesion, Common Agriculture Policy, Pre-accession Aid Klíová slova: Korelaní analýza, Evropská unie, Politika ekonomické a sociální soudržnosti, Spolená zemdlská politika, Pedvstupní pomoc 1. Úvod Akoliv je lenství eské republiky i dalších stát stední a východní Evropy vnímáno veejností jako pomrn bezproblémový krok ukonený v roce 004 plynou novým lenským státm z lenství jak nkterá omezující pravidla, tak pomrn významné finanní toky. Jak pedvstupní pomoc (pevážn fondy PHARE, ISPA, SAPARD), tak i strukturální pomoc (ERDF, ESF) i fondy spolené zemdlské politiky (EAGGF, v novém období i EAFRD) spolen dosahují objemu procent HDP pijímajícího státu. Cílem tchto prostedk je napomoci dosáhnout cíle Spoleenství/Unie viz lánek Smlouvy o založení Evropských spoleenství (dále jen SES) lánek 1 Posláním Spoleenství je vytvoením spoleného trhu a hospodáské a mnové unie a provádním spolených politik nebo inností uvedených v láncích 3 a 4 podporovat harmonický, vyvážený a udržitelný rozvoj hospodáských inností, vysokou úrove zamstnanosti a sociální ochrany, rovné zacházení pro muže a ženy, trvalý a neinflaní rst, vysoký stupe konkurenceschopnosti a konvergence hospodáské výkonnosti, vysokou úrove ochrany a zlepšování kvality životního prostedí, zvyšování životní úrovn a kvality života, hospodáskou a sociální soudržnost a solidaritu mezi lenskými státy. Konkrétn smují jednotlivé nástroje k naplnní jejich vlastního cíle. U pedvstupní pomoci se jednalo o pomoc pi dosahování standardu Spoleenství primárn v oblasti ochrany životního prostedí, infrastruktury, rozvoje institucí a pípravy na politiky Spoleenství po plném zapojení se po vstupu. Cíle strukturální politiky je specifikován v lánku 158 SES HOSPODÁSKÁ A SOCIÁLNÍ SOUDRŽNOST lánek 158 (bývalý lánek 130a) 1 Citovaná ast smlouvy zvýraznna italikou
143 Spoleenství za úelem podpory harmonického vývoje rozvíjí a prosazuje svou innost vedoucí k posilování hospodáské a sociální soudržnosti. Spoleenství se pedevším zamí na snižování rozdíl mezi úrovní rozvoje rzných region a na snížení zaostalosti nejvíce znevýhodnných region nebo ostrov, vetn venkovských oblastí. Podobn i v pípad spolené zemdlské politiky lze citovat lánek 33 SES: 1. Cílem spolené zemdlské politiky je: lánek 33 (bývalý lánek 39) a) zvýšit produktivitu zemdlství podporou technického pokroku a zajišováním racionálního rozvoje zemdlské výroby a optimálního využití výrobních initel, zejména pracovní síly b) zajistit tak odpovídající životní úrove zemdlského obyvatelstva, a to zejména zvýšením individuálních píjm osob zamstnaných v zemdlství; c) stabilizovat trhy; d) zajistit plynulé zásobování; e) zajistit spotebitelm dodávky za rozumné ceny.. Pi vypracovávání spolené zemdlské politiky a zvláštních metod, které mže zahrnovat, se bude pihlížet: a) ke zvláštní povaze zemdlské innosti, vyplývající ze sociální struktury v zemdlství a ze strukturálních a pírodních rozdíl mezi rznými zemdlskými oblastmi; b) k nutnosti provádt vhodné úpravy postupn; c) ke skutenosti, že v lenských státech zemdlství pedstavuje odvtví, které je tsn spjato s celým hospodástvím. I pi letmém pehledu cíl jednotlivých nástroj je zejmé propojení s celkovým hospodáským rozvojem ekonomiky pijímající zem. Tento však není jediným cílem dále se snažíme o podporu dlouhodob udržitelného rozvoje, stabilizaci ekonomického rozvoje a rovnomrný rozvoje region, rovnost píležitostí atp. Pi urité míe zjednodušení však lze ekonomický rozvoj v lánku mený rstem HDP (ve stálých cenách) použít jako indikátor dopadu vynaložených prostedk. Pi rstu finanních transfer oekáváme, vzhledem k proklamovaným cílm, i rst HDP. Druhým ukazatelem využitým v lánku je míra nezamstnanosti. I tento ukazatel lze ve stedn a dlouhodobém horizontu využit k hodnocení dopadu vynaložených prostedk s rstem prostedk oekáváme stabilizaci, i dokonce pokles nezamstnanosti. Posledním uvažovaným ukazatelem je vývoj podílu zemdlství, rybáství a lesnictví na celkové pidané hodnot. Oekávaný vztah odpovídá dvma trendm ve vývoji sektoru ve starých lenských zemích snižování podíl na zamstnanosti v rámci celého hospodáství a obdobného rstu produktivity jako v ostatních sektorech. Celkový vztah je tedy stabilizace, i mírné oslabení sektoru v souvislosti s využitím prostedk na Spolenou zemdlskou politiku. 3 Pi vlastním hodnocení dopadu je vhodné uvažovat i možnost zpoždní pozitivního i negativního dopadu, nebo prostedky nemají psobit pouze jako fiskální stimul, ale napomoci i strukturální zmn. Zpoždní pravdpodobn nepesahuje nkolik tvrtletí/let (vzhledem k typickému dvouletému období pro realizaci projekt a jejich zptnému Krátkodobý vztah je vzhledem ke strukturálním zmnám složitjší. 3 Prostedky na SZP pravdpodobn umožují rychlejší transformaci sektoru a zpomalují negativní sociální dopad transformace.
144 proplácení). Nicmén vzhledem k dostupnosti dat (období 000 až 007 tvrtletní i roní údaje) není v tomto lánku se zpoždním uvažováno.. Metodika Analýzy dopadu finanních prostedk plynoucích z EU na ekonomiku eské republiky je provedena s využitím korelaní analýzy, a to výbrového korelaního koeficientu a výbrového parciálního korelaního koeficientu. Jako promnné jsou zvoleny hodnoty hrubého domácího produktu eské republiky (HDP ve stálých cenách), nezamstnanost (N), podíl primárního sektoru (PPS) a prostedky plynoucí z EU do eské republiky v Eurech (P). Podrobnji bude o charakteru dat pojednáno v empirické ásti píspvku. Zkoumaným obdobím je rozmezí let V souvislosti se stanoveným cílem byly formulovány následující slovní hypotézy: - Nárst finanních transfer z Evropské unie zvyšuje úrove HDP, - Nárst finanních prostedk z Evropské unie neposiluje rst nezamstnanosti (tj. nevýznamná nebo negativní korelace), - Nárst finanních prostedk z Evropské unie neposiluje podíl primárního sektoru na celkové pidané hodnot ekonomiky (tj. nevýznamná nebo negativní korelace). V první fázi bude využito výbrového korelaního koeficientu, který poukazuje na pímou nebo nepímou závislost. V další fázi bude využit výbrový parciální korelaní koeficient, který vypovídá o závislosti mezi dvma promnnými pi vylouení vlivu vybraných promnných (Hebák, J., Hustopecký, J., Malá, J.; 005 str. 154). Jak Hebák, J., Hustopecký, J., Malá, J. (005) uvádí, zkušenosti s používáním vícerozmrných statistických metod prkazn ukazují, že parciální korelaní koeficienty mohou být užitenými mírami síly lineární závislosti ve výše uvedeném smyslu i v pípadech, ve kterých výbrová data pocházejí z jiného než vícerozmrného rozložení. Dalším zpsobem výpotu je využití robustního odhadu korelaního koeficientu (HEBÁK, J., HUSTOPECKÝ, J., MALÁ, J.(005)). Výpoet tohoto koeficientu je však pomrn nároný a vzhledem k podprnému charakteru statistického zpracování údaj bylo prozatím od tohoto upuštno. Výbrový korelaní koeficient je vypoten na základ vztahu r YZ. X s XY r XY, s X 0, sy 0 s s. (1) X Pro výpoet výbrového parciálního korelaního koeficientu je využit vztah r R R R T 1 YZ Y. X Z. X T 1 T 1 RY. X R RY. XRZ. X R RZ. X, R Y. X Y r Y. X 1 r 1 X1X r X1X k, R r Y. X r 1 k X k X 1, (1) kde R regulární, Y, Z jsou náhodné veliiny, X = (X 1,..., X k ) je náhodný vektor a ryz, ryx, r i j k i X i X,, 1,.., j jsou píslušné výbrové korelaní koeficienty. Zjištné korelaní koeficienty budou testovány na statistickou významnost pomocí t-testu (Andl, 1978). 3. Empirická analýza Pro empirickou analýzy bylo využito hodnot hrubého domácího produktu eské republiky (HDP, mezironí zmna ve stálých cenách na obyvatele), nezamstnanosti (N, mezironí zmna vyjádena v lidech), podíl sektoru zemdlství, rybáství a lesnictví na
145 celkové pidané hodnot (PPS, mezironí zmna podílu sektoru na pidané hodnot) a prostedky plynoucí z Evropské unie do eské republiky (P, mezironí zmna platby z EU (v rámci transfer jsou uvažovány stropy na platby v rámci rozpotu EU v období položka pedvstupní pomoc, v období položky pokrývající strukturální fondy (ERDF, ESF), kohezní fond (CF), prostedky na Spolenou zemdlskou politiku i rozvoj venkova (ást záruní i rozvojová EAGGF v období , v období i EAFRD). V pípad HDP, N, PPS bylo využito tvrtletních a roních hodnot, v pípad P byly dostupné pouze roní hodnoty. Dosažitelným obdobím pro zvolené promnné bylo rozmezí let Zdrojem dat pro HDP, N, PPS byl eský statistický úad (eský statistický úad, 008). Pro finanní transfery data zveejovaná Evropskou komisí týkající se rozpotu EU (Evropská komise, 008). V první fázi byl proveden výpoet výbrových korelaních koeficient pro tvrtletní hodnoty HDP, N a PPS. Pro posouzení pípadného vlivu tetí promnné pi korelaci byly dále vypoteny výbrové parciální korelace a tak zjištna istá korelace mezi uvažovanými promnnými. Výsledné hodnoty uvádí tabulka 1, kde íslo v závorce (p-value) oznauje hladinu významnosti.. Tabulka 1: Výbrové korelaní koeficienty a parciální korelaní koeficienty(n=8) Výbrový korelaní koeficient Výbrový parciální korelaní koeficient HDP N PPS HDP N PPS HDP 1 1 N 0,55 (0,0035) 1 0, ,088 PPS (0,6490) -0,1389 (0,474) 1 0,191-0,185 1 Z uvedené tabulky vidíme, že HDP a nezamstnanost, mezi kterými nastává statisticky významná korelace, nejsou primárním sektorem nijak významn ovlivovány. Jak klasická tak parciální korelace vykazuji velmi blízkých hodnot. V pípad korelace mezi nezamstnaností a primárním sektorem, stejn jako HDP a primárním sektorem, se hodnoty parciální korelace ve vztahu ke klasické korelaci zvýšily, nikoliv však významným zpsobem. I v tomto pípad je proto budeme považovat za pibližn stejné. Mžeme íci, že vztah mezi HDP a PPS, stejn jako N a PPS vykazuje nekorelovanost. V následujícím kroku byl proveden výpoet pro roní hodnoty s pidáním promnné reprezentující prostedky plynoucí z EU (P). Vzhledem k faktu, že dostupné byly pouze roní hodnoty od roku 000, je posuzovaný soubor malý, n = 7 hodnot. Zjištné výsledky výbrové korelace a výbrové parciální korelace uvádí tabulka. Porovnáme-li vypotené hodnoty výbrové parciální korelace pro rozsah souboru n = 8 (tabulka 1) a n=7 (tabulka ), vidíme, že pestože je rozsah souboru výrazn menší, lze vypotené hodnoty korelací považovat za pibližn stejné. A tedy mžeme provést analýzu ve vztahu k prostedkm plynoucím z EU. Tabulka : Výbrové korelaní koeficienty a parciální korelaní koeficienty(n=7) Výbrový korelaní koeficient Výbrový parciální korelaní koeficient HDP N PPS P HDP N PPS P HDP 1 1 N 0,608 (0,1473) 1 0, PPS 0,0841 (0,8577) -0,070 (0,6560) 1 0,419-0,68 1 P -0,0044 (0,995) 0,1539 (0,7418) -0,5011 (0,50) 1 0,0075 0,0407-0,478 1 Pro zjednodušení znovu uvádíme slovní hypotézy formulované v souladu se stanoveným cílem:
146 Nárst finanních transfer z Evropské unie zvyšuje úrove HDP, - Nárst finanních prostedk z Evropské unie neposiluje rst nezamstnanosti (tj. nevýznamná nebo negativní korelace), - Nárst finanních prostedk z Evropské unie neposiluje podíl primárního sektoru na celkové pidané hodnot ekonomiky (tj. nevýznamná nebo negativní korelace). V pípad vzájemného vlivu mezi prostedky plynoucími z EU (P) a primárním sektorem (PPS) byla výbrovou korelací zjištna stední negativní závislost (r = -0,5011). Pi porovnání s výbrovou parciální korelací (r = -0,478) vidíme, že ani nezamstnanost ani HDP neovlivuje korelaci posuzovaných hodnot. Pestože je rozsah souboru malý, mžeme se domnívat, že detekovanou stední negativní závislost lze považovat za podporující naší teorii. V pípad vzájemného vztahu mezi prostedky plynoucími z EU (P) a nezamstnaností (N) byla analýzou detekována statistická nevýznamnost (r = 0,1539). Pokud provedeme oištní posuzovaných promnných o vliv HDP a PPS, pak istá korelace mezi P a N poklesne (r = 0,0407). Tento fakt plyne mimo jiné z hodnoty korelace mezi P a PPS, která byla výše identifikována jako stední negativní závislost. Ze zjištných výsledk tedy mžeme konstatovat, že istá korelace mezi prostedky plynoucími z EU a nezamstnaností je v posuzovaném období je nevýznamná. Na základ toho výsledku se proto autoi piklánjí k závru, že prostedky plynoucí z EU do R nemají zásadní vliv na nezamstnanost. Poznamenejme, že vzhledem k rozsahu datového souboru a k charakteru dat, kterými byly roní hodnoty, nebylo uvažováno žádné zpoždní. Poslední posuzovaný vzájemný vztah je mezi prostedky plynoucími z EU a HDP. Z výsledku výbrové korelace vyplývá, že tento vztah je statisticky nevýznamný (r = -0,0044). Vzhledem k faktu, že HDP významn koreluje s nezamstnaností (r = 0,608, tabulka ) a že tento fakt byl potvrzen i na tvrtletních hodnotách (r = 0,550, tabulka 1), budeme pihlížet k výsledku isté korelace, za kterou je považovaná výbrová parciální korelace mezi P a HDP oištná o vliv N a PPS. Ta ovšem také dosáhla statisticky nevýznamné hodnoty (r = 0,0075). Lze proto usuzovat, že mezi prostedky plynoucími z EU a HDP v R nebyla prokázána závislost. 4. Závr Provedená analýza prokázala nevýznamnou statistickou závislost mezi prostedky proudícími z Evropské unie vynakládanými na politiku hospodáské a sociální soudržnosti a spolenou zemdlskou politiku. Závr, který je v rozporu s hypotézou položenou na zaátku lánku. Korelace -0,0044 na hladin významnosti 0,995 poukazuje i pes velmi omezený zdroj dat na minimální dopad tchto prostedk na ekonomický rst. Toto dílí zjištní napovídá nedostatené efektivit pi využívání prostedk plynoucích z Evropské unie. Dvody pro tuto neefektivitu lze oekávat z nkolika dvod: a) sledování nkolika cíl b) nedostatený objem prostedk vynakládaných z rozpotu EU c) nedokonalá administrace prostedk d) píliš široké zacílení prostedk e) nedostatený tlak na snižování finanní náronosti projekt podporovaných z Evropské unie Ad a) Už v úvodu lánku byla zmínno vícecílové zamení prostedk poskytovaných z rozpotu EU. Akoliv cíle pokrývají krom ekonomického rozvoje i ochranu životního prostedí, i rovnost píležitostí jedná se, alespo z dlouhodobého pohledu, o souadné cíle. Dvodem neprokázání závislosti tedy mže být nedostatená délka zkoumané asové ady.
147 Ad b) Celkový objem transfer z evropské unie je ve srovnání s objemem HDP i státního rozpotu pomrn malý (objem HPD ve stálých cenách pro rok 007 je 993 mld. K versus 1,867 mld. Eur). Pesto je nutné si uvdomit povahu prostedk urených a už na investice, i spolufinancování rozvojových program dofinancovávaných z národní úrovn. Pi srovnání s prostedky státního rozpotu na isté investice dosahuje objem finanních prostedk z EU takka tetiny. Ad c) Vlastní administrace prostedk je stále více pedávaná národní (i regionální) administrativ. Lze oekávat, že s postupem asu se zlepšuje i úrove administrace prostedk. I v tomto bod je však nutné upozornit na píliš krátkou asovou adu. Tu se pozitivní dopad zlepšení administrace asi neprojeví. Ad d) Vlastní zacílení je ešeno na úrovni program. Tzv. princip programování zajišuje vyjednání rámcového cíle a mitelných indikátor s Evropskou komisí na poátku programu. Vlastní výbr projektu v souladu s cíli programu leží na národní administrativ. Vlastní hodnocení naplnní vztahu program-projekt leží mimo obsah tohoto lánku, pesto uritá míra flexibility je pi sedmiletém plánování nutná. Ad e) Finanní omezení celkové výše rozpotu v rámci ízení projekt dnes existují spíše technického rázu typicky tabulkové ukazatele ceny jednotlivých položek. Tu se projevují dv nectnosti souasného ízení vysoká averze k riziku a nepropojenost mezi cíly projektu a jejich finanní nároností. Souasná regulace uplatuje spíše tradiní ovené ešení oproti potenciáln riskantnjší variant. Je otázkou nakolik je ešitelné na úrovni veejných program silnjší zapojení motivaních prvk. Pro vlastní závrené hodnocení je nutné upozornit, že rozsah dat použitých v lánku je omezený a celková délka asové ady je pomrn krátká. Tato skutenost ovlivuje validitu jednotlivých tvrzení, bohužel nejsou v souasnosti dostupná data v delším asovém horizontu. 5. Literatúra [1] ANDL, J. Matematická statistika. Praha : SNTL/ALFA, [] HEBÁK, J, HUSTOPECKÝ, J, MALÁ, J. Vícerozmrné statistické metody (). Praha : Informatorium, s. ISBN [3] eský statistický úad. HRUBÝ DOMÁCÍ PRODUKT : ASOVÉ ADY UKAZATEL TVRTLETNÍCH ÚT [online]. [008] [cit ]. Dostupný z WWW: < [4] Evropská komise. EU budget Financial Report : Detailed data [online]. 008, June 6, 008 [cit ]. Dostupný z WWW: < [5] SMLOUVA O ZALOŽENÍ EVROPSKÉHO SPOLEENSTVÍ [online]. [00] [cit ]. Dostupný z WWW: < smlouva_o_es_nice.pdf>. Adresa autora (-ov): Jan Penosil, Ing., Mgr. Ústav financí PEF MZLU v Brn Zemdlská l eská republika Brno [email protected] Jitka Pomnková, Ph.D., RNDr. Ústav financí PEF MZLU v Brn Zemdlská l eská republika Brno [email protected]
148 Vybrané metody eliminace trendu a identifikace cyklické složky v makroekonomických asových adách Selected Detrending Techniques and Methods of Cyclical Component Identificaion in the Macroeconomic Time Series Petr Rozmahel Abstract: The aim of the paper is to describe and compare selected detrending techniques used in the analysis of classical and growth business cycles. The text focuses on the different characteristics in the output cyclical component series identified by the selected detrending techniques. First order differencing, Hodrick-Prescott filter and Baxter-King Band-Pass filters were used in the analysis. The results show the different volatility and autocorrelation in the output time series produced by the filters. Such differences may influence negatively the final results of the business cycles analysis. Key words: Business Cycle, Band-Pass Filter, Hodrick-Prescott Filter, First Order Differencing Klíové slova: hospodáský cyklus, pásmový filtr, Hodrick-Prescottv filtr, Logartmická diference prvního ádu. 1. Úvod Techniky eliminace trendu resp. identifikace cyklické složky (tzv. detrendovací i filtraní techniky) pedstavují v souasnosti neodmyslitelnou souást analýzy makroekonomických asových ad a zejména pak analýzy hospodáského cyklu. Jedná se zejména o problematiku datování hospodáského cyklu (tj. urení bod zvratu a jednotlivých fází cyklu) a dále o mení sladnosti hospodáských cykl, jež své uplatnní nachází nap. pi posuzování pipravenosti ekonomik kandidátských zemí na vstup do eurozóny. Ekonomická teorie rozlišuje mezi dvma základními pojetími technické identifikace hospodáského cyklu. Klasické cykly jsou vnímány jako cyklické stídání fází absolutního reálného poklesu a rstu zvoleného indikátoru aproximující hospodáský cyklus (Burns- Mitchell, 1946). Pojetí rstového hospodáského cyklu rozšíené zejména ve studiích obsahujících korelaní analýzu cykl prezentuje hospodáský cyklus jako cyklické fluktuace promnné (resp. cyklické složky asové ady) okolo svého trendu (Lucas, 1977). Cílem píspvku je popsat a porovnat vybrané detrendovací techniky používané v analýze klasických i rstových hospodáských cykl a poukázat na možné odlišnosti v generovaném výstupu cyklické složky promnné resp. identifikovaného cyklu, které pak mohou ovlivnit i konené výsledky procesu identifikace i mení sladnosti hospodáských cykl. Objektem porovnání jsou techniky logaritmické diference prvního ádu (FOD), Hodrick-Prescottv Filtr (HP) a pásmový filtr spektrální domény (BK_BP) v modifikaci dle Baxter-King (1999), které patí mezi nejastji užívané detrendovací techniky ve studiích obsahujících analýzu hospodáských cykl.. Popis vybraných detrendovacích technik a) Diference prvního ádu (FOD). Mezi nejužívanjší techniky eliminace trendu v makroekonomických asových adách paradoxn jak ve studiích klasického tak rstového cyklu patí diferencování asových ad, konkrétn diference prvního ádu (FOD) hodnot logaritm pvodní asové ady. Canova (1998, 1999) charakterizuje tuto techniku jako
149 vhodný filtr produkující stacionární asovou adu, za pedpokladu, že trendová komponenta pedstavuje proces prosté náhodné procházky a cyklická složka je stacionární, piemž tyto dv složky jsou nekorelované. Navíc se pedpokládá jednotkový koen ady y t, zcela díky systematické složce y t-1, pro: y t =y t-1 + t, (1) kde trend je definován jako g t =y t-1 a kde t = y t -y t-1. b) Hodrick Prescottv filtr. Optimální filtraní technikou umožující flexibiln extrahovat trend v asové ad, který se stochasticky vyvíjí v ase, se zdá být Hodrick- Prescottv filtr. Tato filtraní technika umožuje pizpsobit se preferencím výzkumníka dle pedpokladu o charakteru trendu a hospodáském cyklu. Spolu s možností extrahovat trend, který se stochasticky posunuje v ase, piemž je nekorelovaný s cyklickou komponentou umocnil jeho oblibu a široké využití zejména rozvoj literatury reálného hospodáského cyklu. K vyrovnání hodnot asové ady y t =g t +c t dochází prostednictvím ešení problému minimalizace druhé diference soutu tverc trendové komponenty g t. min T g t t1 T t1 c t T t1 g g g g > 0 t1 t t t1 () Míra hladkosti trendu je ovlivnna volitelným parametrem, který penalizuje nedostatenou hladkost trendu a reguluje tak výsledné fluktuace cyklické c t od trendu. S rstem se rozsah fluktuací kolem trendu zvyšuje a trend g t se tak stává hladším. V pípad, že, tedy že hodnota parametru se bude blížit nekonenu, stává se trend lineární pímkou. Pokud zvolíme =0, pak trendová složka a pvodní ada splynou, tj. y t =g t. Volba parametru je v literatue hospodáského cyklu pedmtem rozsáhlé diskuse. Dle práce Hodricka a Prescotta g (1980) je parametr roven, kde a jsou rozptyly zmn trendu a cyklu. S ohledem g c c na uvedenou podmínku autoi navrhují optimální hodnotu =1600 pro tvrtletní data. Nelson Plosser (198) navrhují hodnotu v intervalu [1/6;1] pro vtšinu zkoumaných makroekonomických asových ad. To implikuje, že vtšina variability, kterou Hodrick a Prescott pisuzují cyklické komponent, je dle Nelsona a Plossera ve skutenosti ástí trendu. c) Filtry spektrální (frekvenní) domény. Zatímco pedchozí techniky eliminace trendu resp. identifikace cyklu v asových adách pracují v tzv. asové domén, následující technika je založena na pojetí asových ad ve spektrální pop. frekvenní domén. Spektrální analýza asových ad je založena na transformaci asové ady na smsici sinusových a kosinusových kivek (na základ tzv. Fourierovy transformace) o rzných frekvencích a amplitudách. Metody spektrální analýzy umožují výzkumníkovi získat obraz o spektru asové ady tedy informaci o zastoupení jednotlivých frekvencí v asové ad. (Cipra, 1986) Fabio Canova (1998) ve svém diskusním lánku o hodnocení vlivu jednotlivých detrendovacích technik na kvalitu identifikace a urení hospodáského cyklu popisuje princip frekvenních filtr za pedpoklad, že cyklická a trendová složka asové ady jsou nezávislé a že trendová komponenta má nejvtší sílu v nízkých frekvencích spektra, piemž dále od nuly síla trendové složky klesá velmi rychle. Vstupní pedpoklad navíc nevyžaduje, aby trend asové ady y t =g t +c t + t byl definován jako deterministický i stochastický, nebo filtr pipouští zmny ve vývoji trendu v ase, pokud nejsou píliš asté. Trendová a následn i nepravidelná a cyklická složka mohou být v asové ad odhaleny pomocí následující procedury: a()f y ()=F g () (3)
150 kde a() je nízko-pásmový filtr (low pass), F y () a F g () jsou Fourierovy transformace 1 y t a g t. Polynom a(l) v asové domén vzniká inverzní Fourierovou transformací a() ve form l l sin sin 1 al (4) l kde 1 a jsou horní a dolní limity frekvenního pásma, kde systematická složka vykazuje veškerou svoji sílu. Odhad cyklické složky je potom (1-a(l))y t. Klíovým bodem procedury je vhodný výbr horních a dolních limit frekvenního pásma. Za pedpokladu, že hospodáský cyklus nepesahuje délky 30 tvrtletí, jsou stanoveny 1 =0 a =/15. Takto definovaný filtr identifikuje cykly s periodicitou ne vyšší než 30 tvrtletí, piemž vyšší frekvence jsou pisuzovány trendové komponent, která je takto z asové ady eliminována. Definovaný proces však stále ponechává píliš velké množství nežádoucí variability vysokých frekvencí, které nemusí nutn znamenat fluktuace pisuzované hospodáskému cyklu. Proto je dále vytvoen filtr s cílem eliminovat nepravidelnou složku t asové ady, která je identifikována s pedpokladem, že její nejvtší síla je ve vysokofrekvenním pásmu spektra s periodicitou nižší než 6 tvrtletí. Výsledná specifikace a 0, 15 3, propouští cyklické komponenty asové ady s nižší periodicitou než 30 tvrtletí a zárove vyšší periodicitou než 6 tvrtletí. Maximální délka takto identifikovaného cyklu je tedy necelých 8 let a minimální délka je 1,5 roku. Pravdpodobn nejrozšíenjší modifikací spektrálních filtraních technik s cílem identifikovat komponentu hospodáského cyklu v asové ad indikátoru agregátní ekonomické aktivity je v souasné literatue Baxter-Kingv pásmový filtr. Autoi Marianne Baxter a Robert King ve své lánku z roku 1999 vyvinuli pásmový filtr, který dle vstupních pedpoklad považují za nejlepší aproximaci ideálního pásmového filtru. Autoi kritizují ve své práci dosavadní detrendovací metody, které byly aplikovány s cílem generovat stacionární asovou adu, piemž nezohledují vstupní požadavky na statistické vlastnosti hospodáského cyklu. Rozšíení mechanické aplikace detrendovacích technik typu klouzavých prmr, odstranní lineárních i exponenciálních trend, FOD, HP filtr apod. pramenilo z opomenutí výchozí definice hospodáského cyklu. Autoi se snaží vyvinout ideální pásmový filtr, který povede k dekompozici asové ady dle vstupních dispozic výzkumníka. Výchozí zámr autor je založen na konstrukci lineárního filtru, který eliminuje nízkofrekvenní trendovou komponentu a nepravidelnou složku zahrnující naopak vysokofrekvenní fluktuace. Výsledkem je identifikovaná komponenta hospodáského cyklu. Vstupní podmínkou je zde pojetí hospodáského cyklu dle definice Burnse a Mitchella (1946), kteí definovali hospodáský cyklus jako fluktuace agregátní ekonomické aktivity národa ne kratší než 1,5 roku a ne delší než 8 let. Definování hospodáského cyklu vede ke konkrétnímu dvoustrannému klouzavému prmru (lineárnímu filtru), který získává podobu pásmového filtru (kombinace low pass a high pass filtr viz výše popsaná procedura dle Canovy) propouštjící komponenty asové ady s periodickými fluktuacemi mezi 6-3 tvrtletími, piemž odstrauje fluktuace o vyšší i nižší frekvenci. Jelikož takto definovaný filtr pracuje na bázi klouzavých prmr zkombinovaných s metodami spektrální analýzy, je nutno urit vhodnou délku klouzavého úhrnu K. Autoi zjišují že vhodnou délkou klouzavé ady je K=1, což vede k odíznutí 1 pozorování (o tvrtletní frekvenci) na zaátku i konci pvodní asové ady. Délka klouzavého úhrnu ovlivuje kvalitu výsledné dekompozice, piemž rst klouzavého úhrnu K vede k lepší aproximaci ideálního filtru, ale vtší ztrát dat. Uvedená vlastnost je problémem zejména u krátkých dostupných asových ad, což je pípad kandidátských zemí stední a východní Evropy pipravující se na vstup do eurozóny, nebo aplikace filtru vyžaduje odíznutí 6 let vstupní asové ady, což sníží vypovídací schopnost 1 K bližšímu zkoumání princip Fourierovy transformace lze odkázat nap. na Rektoryse (000)
151 nap. o namené podobnosti takto identifikovaných cykl srovnávaných zemí v transformaním resp. posttransformaním období. 3. Aplikace a srovnání vybraných detrendovacích technik Podobn jako v duchu studie Baxter King (1999) následující ást píspvku porovnává vybrané statistiky generovaného výstupu filtraních technik v souasnosti všeobecn užívaných k analýze hospodáských cykl: logaritmická diference prvního ádu (FOD), Hodrick-Prescottv filtr (HP, =1600) a vlastní Baxter-Kingv pásmový filtru BK_BP (6,3,1). Vstupní data analýzy tvoily makroekonomické asové ady prmyslové produkce (ve tvrtletních frekvencích) eské a slovenské ekonomiky v období S ohledem na zvolený klouzvý úhrn pásmového filtru (1 tvrtletí), je tíletý úhrn na každé stran asové ady oíznut. Zdrojem dat je finanní statistika mezinárodního mnového fondu (IFS IMF) /Q /Q4 1997/Q3 1998/Q 1999/Q1 1999/Q4 000/Q3 001/Q 00/Q1 00/Q4 003/Q3 004/Q FOD_CR HP_CR BPF_CR -6-8 Obrázek 1: Identifikace cyklu prmyslové produkce R v období ; zdroj: IMF, vlastní výpoty /Q /Q4 1997/Q3 1998/Q 1999/Q1 1999/Q4 000/Q3 001/Q 00/Q1 00/Q4 003/Q3 004/Q FOD_SR HP_SR BPF_SR -6-8 Obrázek : Identifikace cyklu prmyslové produkce SR v období ; zdroj: IMF, vlastní výpoty
152 Tabulka 1: Statistické charakteristiky cyklu prmyslové produkce R identifikované vybranými filtraními technikami; zdroj: vlastní výpoty Volatilita koeficient autokorelace Smr.odchylka FOD_CR,3804 0,0013 0,1384-0,1911 HP_CR,808 0,6574 0,36 0,0335 BPF_CR,5854 0,8687 0,5459 0,1590 Tabulka : Statistické charakteristiky cyklu prmyslové produkce SR identifikované vybranými filtraními techniami; zdroj: vlastní výpoty Volatilita koeficient autokorelace Smr.odchylka FOD_CR,687-0,3556-0,116-0,0894 HP_CR,546 0,911 0,857 0,7410 BPF_CR,148 0,7918 0,4543 0,1199 Ze srovnání volatility hospodáských cykl generovaných jednotlivými technikami vyplývá rozdíl mezi technikou FOD a HP a BK_BP filtry. Technika FOD vykazuje stabiln nízkou smrodatnou odchylku, piemž frekvence zmn jsou oproti relativn hladkým cyklm generovaným HP a BK_BP vyšší. Výsledkem je tedy asová ada s vyšší frekvencí bod zvratu, což je dsledkem faktu, že technika FOD pesouvá váhu a zvýrazuje vysokofrekvenní komponenty pvodní asové ady. HP pracuje jako high-pass filtr, což znamená, že ponechává v asové ad vysokofrekvenní volatilitu, která je BK_BP filtrem odstranna. HP produkuje jen mírn vyšší volatilitu v porovnání s BK_BP filtrem nebo makroekonomické asové ady typu HDP nemají mnoho síly ve vysokých frekvencích. Také závislost v rámci zkoumaných ad meena koeficientem aurokorelace je nižší pi použití techniky FOD. 4. Závr Obecn lze tedy konstatovat, že zkoumání vstupních makroekonomických asových ad pomocí technik HP a BK_BP filtr pináší podobný dojem o povaze hospodáského cyklu, i když míra podobnosti je závislá na volitelných parametrech v pípad HP a klouzavém úhrnu K u BK_BP. Technika FOD poskytuje odlišný pohled na základní charakteristiky hospodáských cykl. FOD produkuje asové ady s nižší volatilitou než BK_BP a HP, což je pímý následek faktu, že FOD snižuje váhu nízkých frekvencí oproti alternativním filtrm. Ze stejného dvodu FOD generuje asové ady, které vykazují mnohem nižší závislost (autokorelaci), než ostatní a také výsledná vzájemná korelace jednotlivých asových ad indikátor s HDP je daleko nižší. Uvedené výsledky jsou v souladu se studií Baxter-King (1999), kde autoi závrem konstatují, že techniky FOD podobn jako techniky odíznutí lineárního trendu nejsou vhodné pro analýzu hospodáských cykl. Nadazené jsou v tomto ohledu techniky HP a BK_BP filtru, piemž preferují BK pásmový filtr. Dvodem je diskuse o vlivu rozdílného stanovení parametru a rapidní zmna vah jednotlivých frekvencí na koncích asové ady pi použití HP filtru, což mže vést k podstatným zkreslením výsledných cyklických pozorování. BK_BP oproti tomu obsahuje mén bod, které by mohly být v tomto ohledu potenciálním terem kritiky a poskytuje bližší aproximaci ideálního filtru.
153 Výsledky analýzy poukazují na možný problematický bod pi analýze hospodáských cykl. Volba detrendovací techniky vetn souvisejících parametr (koeficient v pípad Hodrick-Prescottova fitru a délka klouzavého úhrnu K u pásmových filtr) mohou mít odlišný dopad na celkové výsledky nap. mení sladnosti hospodáských cykl i identifikace bod zvratu cyklu. 5. Literatúra [1]BAXTER, M., KING, R.G Measuring Business Cycles: Approximate Band-Pass Filters for Economic Time Series. In: Review of Economics and Statistics, vol. 81,..4, 1999, s []BURNS, A.F., MITCHELL, W.C Measuring Business Cycles: Vol. of Studies in Business Cycles. New York: NBER, [3]CANOVA, F Detrending and Business Cycle Facts. In: Journal of Monetary Economics, vol. 41, 1998, s [4]CANOVA, F Does Detrending Matter for the Determination of the Reference Cycle and the Selection of Turning points? In: Economic Journal, vol.109,. 45, 1999,p [5]CIPRA, T Analýza asových ad s aplikacemi v ekonomii. Praha: SNTL- Nakladatelství technické literatury/alfa [6]HODRICK, R., PRESCOTT, E.C Post-War U.S. Business Cycles. Pittsburgh PA: Carnegie Mellon University, Working Paper, [7]LUCAS, R.E. Understanding Business Cycles. In BRUNNER. K., MELTZER, A.H. (eds.): Stabilisation Domestic and International Economy. Carnegie-Rochester Conference Series on Public Policy 1977, vol. 5, s.7-9. [8]NELSON, C. R., PLOSSER, C. I Trends and Random Walks in Macroecnonomic Time Series: Some Evidence and Implications. In: Journal of Monetary Economics, vol. 10, 198, s [9]REKTORYS, K Pehled užité matematiky I. 7. vyd. Praha: Prometheus, 000, 70 s. ISBN lánek byl zpracován v rámci výzkumného projektu 40/08/P494 Posouzení procesu konvergence eské republiky a dalších kandidátských ekonomik k eurozon za finanní podpory Grantové agentury R. Adresa autora: Petr Rozmahel, Ing., Ph.D. Výzkumné centrum PEF MZLU v Brn Zemdlská 1 Brno [email protected]
154 Analýza odahlých údajov Analysis of Outliers Milan Terek 1 Abstract: The article deals with the analysis of the outliers. The definition of the finitesample breakdown point is given and compared for sample mean and median. Then the methods of the elimination of outliers by trimming and winsorizing is described and illustrated on examples. Finally the methods of the detection of outliers are given and illustrated. Key words: outlier, finite-sample breakdown, trimming, winsorizing, detection of outliers Kúové slová: odahlý údaj, bod prelomu koneného výberu, zastrihnutie, winsorizácia, detekcia odahlých údajov 1. Úvod Odahlé údaje sú neobvykle malé alebo neobvykle veké hodnoty. Ich zisovanie je asto vemi dôležité. Ak ich existenciu nezoberieme pri analýze údajov do úvahy, môžu výsledky analýzy strati výpovednú schopnos. Pokúsime sa to ilustrova na príklade. Opíšeme možnosti eliminácie odahlých údajov a niektoré možnosti ich detekcie. Postupy budeme ilustrova na príkladoch.. Citlivos výberového priemeru a mediánu na odahlé údaje Ak chceme kvantifikova citlivos napríklad výberového priemeru na odahlé údaje, možno využi tzv. bod prelomu koneného výberu (finite-sample breakdown point). Pre výberový priemer X, bod prelomu koneného výberu je najmenší podiel pozorovaní, ktorý spôsobuje, že hodnota výberového priemeru je neodôvodnene veká alebo malá. Inak, pre výberový priemer, bod prelomu koneného výberu je najmenší podiel z n pozorovaní, ktorý môže spôsobi stratu jeho výpovednej schopnosti. Jediné pozorovanie môže spôsobi, že hodnota výberového priemeru je neodôvodnene malá alebo veká, preto jeho bod prelomu je 1/n. Všimnime si teraz výberový medián X 1 / a jeho bod prelomu koneného výberu. Skoro polovica z n hodnôt môže by neodôvodnene veká alebo malá bez toho, že by hodnota mediánu bola neodôvodnene veká alebo malá. Bod prelomu pre výberový medián je približne 3 0,5. Výberový priemer a výberový medián sú z hadiska citlivosti na odahlé údaje, najviac rozdielne. Príklad 1. Náhodne sa vybralo 100 mužov. Odpovedali na otázku, koko rozliných partneriek by chceli v živote ma. Výsledky triedenia odpovedí sú v tabuke 1. 1 Tento príspevok vznikol s prispením grantovej agentúry VEGA v rámci projektu íslo 1/0437/08 Kvantitatívne metódy v stratégii šes sigma a projektu íslo 1/318/06 Zlepšovanie kvality produkcie strojárskych výrobkov pomocou štatistických metód. Pozri WILCOX, R. R.: Applying Contemporary Statistical Techniques. USA: Academic Press, 003, s Hodnota 0,5 je najväšia možná hodnota.
155 Tabuka 1: Želaný poet rozliných partneriek Poet partneriek Poet odpovedí Hodnota výberového priemeru je 85,9. Táto hodnota nemá prakticky žiadnu výpovednú schopnos, pretože 98 % hodnôt pozorovaní je menších ako táto hodnota. Hodnota výberového mediánu je 1, a urite lepšie charakterizuje typické želania vybratých mužov. V tomto príklade vidno, že výberový priemer je výrazne ovplyvnený jedinou odahlou hodnotou. Táto hodnota ale neovplyvnila výberový medián. 3. Možnosti eliminácie odahlých hodnôt Všimnime si pojem zastrihnutý priemer (trimmed mean) 4. Zastrihnutý priemer je vypoítaný z údajov, z ktorých bola vynechaný uritý podiel najväších a najmenších hodnôt. Špeciálnym prípadom zastrihnutého priemeru je výberový priemer, v ktorom neboli pri výpote vynechané žiadne údaje z pôvodného výberového súboru. Napríklad 10%-ný zastrihnutý priemer znamená, že 10% najmenších a 10% najväších hodnôt pozorovaní bolo pri výpote priemeru vynechaných. Nech je nejaká konštanta, 0 < 0,5, = 100 a g = ent n, kde znaka ent 5 znamená najväšie celé íslo menšie alebo rovné íslu n. Potom zastrihnutý priemer je priemer vypoítaný z hodnôt, z ktorých bolo g najmenších a g najväších hodnôt pozorovaní odstránených: x t, 1 xg 1 xg... x n g ng Príklad 1 pokraovanie 1. Vypoítame hodnotu 10%-ného a 0%-ného zastrihnutého priemeru z údajov v príklade 1. Výsledky sú takéto. Hodnota 10%-ného zastrihnutého priemeru x je t, 10 x = x x x t, = 3, Hodnota 0%-ného zastrihnutého priemeru x je t, 0 x 3,0 t,0 4 Poda WILCOX, R. R.: Applying Contemporary Statistical Techniques. USA: Academic Press, 003, s Poda STN ISO Veliiny a jednotky. 11. as: Matematické znaky používané vo fyzikálnych vedách a v technike. Bratislava: Slovenský ústav technickej normalizácie 1998.
156 Príklad ilustruje výrazné zlepšenie výpovednej schopnosti výberového priemeru. Zásadnou otázkou je, aký podiel údajov by sme mali odstrihnú. Skôr ako sa budeme venova tejto otázke, všimneme si alternatívny postup, ktorý sa nazýva winsorizácia (winsorizing). Winsorizovaný priemer je podobný ako zastrihnutý priemer, ale odstrihnuté údaje sa nahradia inými údajmi. Napríklad pri výpote 10%-ného winsorizovaného priemeru sa 10% najväších hodnôt neodstrihne, ale každá z nich sa nahradí najväšou hodnotou, ktorá by už nebola odstrihnutá pri výpote 10%-ného odstrihnutého priemeru. Podobne, 10% najmenších hodnôt sa neodstrihne, ale každá z nich sa nahradí najmenšou hodnotou, ktorá by už nebola odstrihnutá pri výpote 10%-ného odstrihnutého priemeru. Potom -winsorizovaný priemer sa vypoíta poda vzahu: x w, 1 g1x g x g... x n g g1x 1 1 n n g Príklad 1 pokraovanie. Vypoítame hodnotu 10%-ného a 0%-ného winsorizovaného priemeru z údajov v príklade 1. Výsledky sú takéto. Hodnota 10%-ného winsorizovaného priemeru x je w, 10 x = 11 x x... x 11 x w, = 4, Hodnota 0%-ného winsorizovaného priemeru x je w, 0 x = 4,01 w,0 4. Detekcia odahlých údajov Všimneme si stratégie detekcie odahlých údajov. Prvá stratégia je založená na výberovom priemere a výberovom rozptyle. Ke prijmeme predpoklad o normálnom rozdelení základného súboru, je obvyklé považova za odahlú hodnotu, ktorá je vzdialená od strednej hodnoty viac ako o,4 smerodajných odchýlok. Inak, hodnota x je považovaná za odahlú, ke x,4 Ke predpokladáme normálne rozdelenie základného súboru so strednou hodnotou a smerodajnou odchýlkou, pravdepodobnos, že hodnota bude považovaná za odahlú je 0,05. Strednú hodnotu a smerodajnú odchýlku väšinou nepoznáme a odhadujeme ich najastejšie pomocou výberového priemeru a výberovej smerodajnej odchýlky. Potom možno formulova takéto rozhodovacie pravidlo:
157 Hodnota x je považovaná za odahlú, ke x x s,4 (1) Príklad. Uvažujme o takýchto hodnotách 1, 1, 1, 1,,,,, 3, 3, 3, 3, 4, 4, 4, 4, 500 Hodnota výberového priemeru je x 31, 76, hodnota výberovej smerodajnej odchýlky je s = 10,67. Odhadneme vzdialenos hodnoty 500 od strednej hodnoty, meranej v smerodajných odchýlkach: 50031,76 10,67 3,88 V tomto prípade, poda uvedeného rozhodovacieho pravidla, hodnota 500 je odahlá hodnota. Príklad 3. Pridajme k údajom z príkladu ešte jednu hodnotu: Potom je súbor údajov takýto 1, 1, 1, 1,,,,, 3, 3, 3, 3, 4, 4, 4, 4, 500, 1000 Hodnota výberového priemeru je x 85, 56, hodnota výberovej smerodajnej odchýlky je s = 56,49. Odhadneme vzdialenos hodnoty 500 od strednej hodnoty, meranej v smerodajných odchýlkach: ,56 56,49 1,6 Poda uvedeného rozhodovacieho pravidla, hodnota 500 nie je odahlá, aj ke z jednoduchého porovnania hodnôt je zrejmé, že ide o odahlú hodnotu. Posledný príklad je ilustráciou problému, ktorý je známy ako maskovanie (masking). Odahlé hodnoty ovplyvujú výpoet výberového priemeru aj výberovej smerodajnej odchýlky, o môže na druhej strane maskova ich prítomnos, ke na ich detekciu využívame vzah (1) 6. Potrebujeme také rozhodovacie pravidlo na detekciu odahlých hodnôt, ktoré samotné nie je ovplyvnené odahlými hodnotami. Najprv si všimneme jednu charakteristiku variability, ktorá sa nazýva mediánová absolútna odchýlka (median absolute deviation) MAD. Na výpoet hodnoty MAD je 6 Pozri WILCOX, R. R.: Applying Contemporary Statistical Techniques. USA: Academic Press, 003, s. 77.
158 nevyhnutné najprv vypoíta hodnotu x1 / výberového mediánu X 1 /, potom vypoíta absolútne hodnoty odchýlok hodnôt od mediánu: x i x 1/ pre i = 1,,...n MAD je medián absolútnych hodnôt odchýlok hodnôt od mediánu. Možno ukáza, že ke máme náhodný výber z normálneho rozdelenia, potom MADN = MAD 0,6745 je dobrým bodovým odhadom smerodajnej odchýlky základného súboru 7. Vráme sa teraz k hadaniu rozhodovacieho pravidla na detekciu odahlých hodnôt, ktoré samotné nie je ovplyvnené odahlými hodnotami. Jednou z možností je takéto rozhodovacie pravidlo. Hodnota x je odahlá, ke x x 1 / MADN,4 () Príklad 3 pokraovanie 1. Posúme odahlos hodnoty 500 pomocou rozhodovacieho pravidla (). Hodnota výberového mediánu x 1 / = 3. Absolútne hodnoty odchýlok hodnôt od mediánu, usporiadané poda vekosti vzostupne sú: Potom MAD = 1 a MADN 1,48. Dosame za x, x 1 / 0, 0, 0, 0, 1, 1, 1, 1, 1, 1, 1, 1,,,,, 497, 997 a MADN do vzahu (). Dostaneme ,48 335,81,4 Poda rozhodovacieho pravidla (), hodnota 500 je odahlá. 7 Poda WILCOX, R. R.: Applying Contemporary Statistical Techniques. USA: Academic Press, 003, s. 73.
159 Literatúra 1GARAJ, I. JANIGA, I.: Jednostranné toleranné medze normálneho rozdelenia s neznámou strednou hodnotou a rozptylom. One sided tolerance limits of normal distribution with unknown mean and variability. Bratislava: STU, 005. KANTARDZIC, M.: Data Mining. Concepts, Models, Methods, and Algorithms. USA: J. Wiley and Sons, 003. ISBN LAROSE, D. T.: Data Mining. Methods and Models. USA, J. Wiley and Sons 006. ISBN TEREK, M.: Analýza rozhodovania. Bratislava: IURA EDITION, 007. ISBN TEREK, M. HRNIAROVÁ,.: Výberové skúmanie. Bratislava: Ekonóm 008. ISBN WILCOX, R. R.: Applying Contemporary Statistical Techniques. USA: Academic Press, 003. ISBN Adresa autora: Milan Terek, prof., Ing., PhD. Ekonomická univerzita Dolnozemská cesta Bratislava [email protected]
160 KLASIFIKANÍ METODY V AKUSTICKÉ EMISI - STATISTICKÝ PÍSTUP CLASSIFICATION METHODS IN ACOUSTIC EMISSION - STATISTICAL APPROACH Jan Tláskal, Václav Ks Abstract: We present a method and a real-time algorithm which allows us to classify acoustic emission (AE) signals into the finite number of groups which correspond with the physical nature of AE sources. We use spectral parameters and non-metric distances, both independent on the signal amplitudes. We would like to distinguish detected signals emitted by different suppressed acoustic emission sources in materials (for example long-distant micro defect, corrosion, etc.) and also to separate them from common noise. We produce sets of several types of experimental signals to verify the algorithm. The model, which estimates the underlying distribution of spectral parameters originated from the frame of multimodal probability density estimates, i.e. statistical model of distribution mixtures. Abstrakt: Prezentujeme metodu a algoritmus, který využitím statistických metod dokáže tídit signály akustické emise (AE) do skupin odpovídajícím fyzikální podstat zdroj (nap. microtrhliny, korozi, laminární posuny, apod.) a rozlišit emisní události zpsobené defektem v materiálu od rzných šum. Ke tídní používáme spektrální parametry a nemetrická zobrazení, které nezávisí na amplitud signálu. Model popisující rozdlení extrahovaných spektrálních parametr signál pochází z abstraktního statistického modelu distribuních smsí, používaného na odhady multimodálního rozložení pravdpodobnosti. Key words: Acoustic emission, Statistical methods, Distribution mixtures, EM algorithm Klíová slova: Akustická emise, Statistické metody, Distribuní smsi, EM algoritmus 1 Klasifikace v akustické emisi Pracujeme na algoritmu, který pomocí statistických metod dokáže tídit signály akustické emise (AE) do skupin odpovídajícím fyzikální podstat zdroj, respektive rozpoznat akustickou emisi zpsobenou vznikem defektu v materiálu od bžných šum. Nepokoušíme se píliš využívat informace o fyzikální píin vzniku akustické emise, zamujeme se na statistické metody tídní. Emisní událostí (EU) rozumíme záznam AE piezoelektrickým snímaem na disku poítae se vzorkovací frekvencí MHz. Samotný piezoelektrický sníma je bohužel citlivý na pomrn úzkém intervalu frekvencí, nkteré frekvence potlauje pomrn výrazn. Navíc každé dva snímae, tebaže stejného typu, se ve svých spektrálních vlasnostech liší, což je zpsobeno samotnou složitostí výrobní technologie. Díky deformaci signálu snímaem a mnohonásobným odrazm v mící soustav nelze z teoretické znalosti šíení elastického vlnní uinit jednoznaný závr o tom, o jakou EU se jedná a statistický pístup ke klasifikaci je nevyhnutelný. Záznam emisní události probíhá tak, že mící aparatura kontinuáln sleduje dní na snímai a jakmile píchozí signál pesáhne danou prahovou hodnotu, pístroj se ve svém bufferu vrátí o 0,5 ms zpt a uloží na pevný disk 6 ms (tzn ísel) dlouhý záznam. Pro klasifikaci používáme ješt kratší ást EU délky T obsahující pouze nábh signálu bez deformujících odraz a interferencí. Namíme dostaten velkou trénovací množinu EU. Z každé emisní události vybereme D parametr a poté mezi nimi hledáme shluky. Nov píchozí signál pak zaadíme do toho z natrénovaných shluk, ke kterému bude mít nejvtší pravdpodobnost píslušnosti.
161 Klasifikaci signálu AE jsme v podstat pevedli na úlohu shlukové analýzy. Po hodnotách parametr budeme vyžadovat, aby v rámci jednoho typu signálu nemly píliš velký rozptyl a aby tvoily pokud možno co nejvíce vzájemn oddlené shluky. Nepodaí-li se nám rozlišit dva zdroje AE, dojdeme k závru, že vinu nese bud' nesprávná volba parametr, nebo že zdroje budí pro nás fyzikáln nerozlišitelnou AE. Výbr spektrálních parametr Pi klasifikaci se nejlépe osvdily parametry ze spektra EU, které zachycují polohu vysokých amplitud ve spektru signálu vzhledem k frekvencím. Jesliže oznaíme t jako asový index emisní události, pak pomocí diskrétní fourierovy transformace dostaneme každou EU ve z t form kombinace harmonických složek s komplexními koeficienty, z t = T1 f =1 Z f e ift/ T, Z f t{0,, T1}. Absolutní hodnotu Z f nazýváme amplitudou harmonické složky. Kdybychom indexu f chtli dát fyzikální smysl frekvence v KHz, museli bychom ho vynásobit lenem KHz KHz V textu ztotožujeme pojmy spektrum a amplitudy spektra, fáze pro nás nejsou nijak významné. Spektrum následn pro naše úely klasifikace normujeme na jedniku a vypoteme pro každý signál následující spektrální parametry [1]: Parametr 0,33 Kvantil: Zavedeme v souladu s analogií z teorie pravdpodobnosti parametr -kvantil Q F = min{ F{0, T1} Z }, (0,1). Parametr W : Parametr W je druhým parametrem, který zachycuje polohu významných amplitud spektra ve smyslu frekvence kde W = arg T 1 min l[0, T1] f =0 Z f = 1 T f =0 l f f ( Z f 1 =. T 1 Z f f = 0 T Z f ), (1) () Poznamenejme v této souvislosti, že bžn díve užívané pímé parametry ze signálu AE, napíklad Risetime (doba od poátku emisní události tzn. prvního pekonání šumového prahu do nabytí maxima EU) nebo County (poty pekmit rzn nastavených prahových hladin) se pro klasifikaci zdroj AE neosvdily. Vystedovaný pentest: Motivací je zavést jakýsi referenní signál pro danou fyzikální soustavu. Pentest se zdá být logickou volbou, nebo je standardn používaným budiem AE s charakteristickým tvarem spektra. V soustav vybudíme a zachytíme N emisních událostí délky T vybuzených pentesty na stejném míst. Ozname Z,, i{0,, N1}, f {0,, T1}, f-tou složku spektra i- tého pentestu, i f diskrétní fourierovu transformaci a ~ inverzní fourierovu transformaci.
162 Vystedovaným pentestem nazveme vektor P T R, P ~ 1 N T1 N 1 = Zi, f f =0 i=0 Zavedeme-li njakou formu vzdálenosti mezi spektrem P a spektry ostatních EU, získáváme další funkní spektrální parametr k již zavedeným parametrm Q 0.33 a W. Klasické metriky selhávají v porovnávání rozdíl a spolených rys mezi spektry EU, proto používáme symetrizovanou verzi tzv. blendované Hellingerovy divergence [,3], která je dána vztahem D H 1 f f f f f =0 T 1 Z, P = 4 ( Z ( P )) ( Z ( P )). Na obrázku 1 uvádíme porovnání separace hodnot vzdáleností vystedovaného pentestu od prvk trénovací množiny pomocí kvadratické odchylky a Hellingerovi -divergence pro ti typy experimentáln namených sad signál akustické emise.. Obrázek 1: Separace tí typ AE pomocí kvadratické odchylky a Hellingerovi -divergence 3 Distribuní smsi Jak bylo již reeno, vybíráme z emisní události nkolik parametr, mezi nimiž hledáme shluky. Bžné metody shlukové analýzy nám nevyhovují, protože tíhnou k vytváení kruhových shluk. Díváme se na vypotené parametry jako na realizace náhodné veliiny X s multimodálním rozložením pravdpodobnosti, jejíž rozdlení odhadujeme pomocí modelu normální distribuní smsi [4]. Definice: Distribuní smsí (DS) budeme rozumt každou konvexní kombinaci p x ) = j p j ( x ), (3) ( j jm
163 j = 1, jm kde M = (1,, M ) je indexová množina složek smsi, p ( x ) jsou jednoduché hustoty pravdpodobnosti urené vektorem a dále jsou váhy, pípadn frekvenní funkce výskytu komponenty distribuní smsi. Distribuní sms zahrnuje komponenty obecn rzných typ. V technické praxi se pevážn používá sms komponent parametrických rozdlení stejného typu, v našem pípad to bude sms normálních rozdlení. Odhadování rozdlení distribuní smsi se redukuje na odhad skupiny parametr (,,,,, ). Komponenta p x ) má tvar = 1 M 1 M ( j 1 1 p ) T -1 ( x j ) = exp( ( x D j C / 1/ j ( x j ( ) j )). (4) Parametr C j R DD má tvar (, C ), kde D1 j R znaí vektor stedních hodnoty a j j = j j je kovarianí matice, xr D1 jsou vybrané parametry signálu. Parametry smsi odhadujeme maximáln vrohodným odhadem. Maximáln vrohodný odhad získáme iteraní metodou známou jako EM algoritmus, který konverguje k lokálnímu maximu vrohodnostní funkce [5]. Tvoí-li data pouhým okem dostaten oddlené shluky, je v podstat lhostejné jakou metodu pro urení píslušností do shluk použijeme, všechny dosáhnou uspokojivého výsledku. Zcelá jiná situace nastává pokud jsou shluky blízko u sebe, ásten se pekrývají, mají rznou velikost nebo data obsahují výrazné zneištní (tzv. outliery). Proložit shluky smsí normálních hustot pravdpodobnosti a tuto hustotu použít následn pro tídní je výhodné, pokud body v jednotlivých shlucích nemají rovnomrné rozložení a tvoí pibližn elipsoidy. Takovému rozložení dat odpovídá mnoho úloh v pírod vetn té naší. Další výhodou modelu DS je robustnost vi zništní a díky EM algoritmu i pímoará implementace maximáln vrohodného odhadu. 4 Clustering pomocí distribuních smsí Nech vzorek ( x 1,, x N ) pochází z populace s pedem známým potem M oddlených shluk. Tato data budeme považovat za realizaci distribuní smsi o M komponentách. Ke každému x i, i (1,, N), pedepíšeme píslušnost yi, yi (1,, M ) ke k-té komponent smsi pímým vztahem: y arg max p ( x ). i = k k i k km (5)
164 Obrázek : Metoda DS použitá na pekrývající se data Na obrázku vlevo bylo vyneseno 300 hodnot X = ( Q0.33, W ). Data jsou legitimní, pocházejí z laboratorního mení 3 rzných typ akustických signál na tenké plechové desce. Nabízíme srovnání výsledk jednoho prbhu EM algoritmu a nejlepšího výsledku metody nejbližšího souseda se 100 náhodnými inicializacemi. Na obrázku 3 je zobrazen graf odhadnuté hustoty distribuní smsi mající maximální vrohodnost, která byla využita pro obarvení shluk v obrázku. Obrázek 3: Graf hustoty distribuní smsi 5 Literatura [1] TLÁSKAL, J. 007.Statistické metody klasifikace signál, Výzkumná zpráva, Katedra matematiky
165 FJFI VUT Praha. [] KS, V., 003. Blended -divergences with examples, In. Kybernetika, vol.39/1, s [3] KS, V., Morales D. and Vajda I., 008. Extensions of the Parametric Families of Divergences Used in Statistical Inference, In: Kybernetika, s [4] MCLACHLAN G., PEEL D., 001. Finite Mixture Models. New York: J.Wiley & Sons, Scientific, Technical and Medical Division. [5] BISHOP, CH.,M., 006. Pattern Recognition and Machine Learning, New York, Springer. Jan Tláskal a Ing. Václav Ks, PhD. - KM FJFI VUT Praha, Trojanova 13, Praha.
166 Opravitené systémy s meniacim sa potom zamietnutých dávok Repairable systems with changing failure rate Božena Viktorínová Abstract: The article deals with the discovering number of failures per day in the repairable systems and fix of average number of failures per system by means of model NHPP (Nonhomogenous Poisson process with Weibull intensity (1)) and by means of relationship (4). Key words: Weibull intensity, repairable system, failure rate Kúové slová: Weibullova intenzita, opravitený systém, zamietnutá dávka 1. Úvod Pri kontrole kvality výrobkov ktorá prebieha niekoko dní je zaujímavé zisti poet vadných výrobkov pripadajúcich na jeden de v opravitených systémoch a stanovi priemerný poet vadných výrobkov na jeden systém a to pomocou modelu NHPP (Nehomogénny Poissonov proces s Weibullovou intenzitou) (1), a pomocou vzahu (4). lánok sa zaoberá touto problematikou, ktorá je popísaná v 1.. Popis uvedenej problematiky Nazvime systémami dávky (množiny produktov) ktoré prichádzajú ku kontrole a v ktorých sa môžu vyskytnú nezhodné produkty. Tieto systémy (každý jeden) sa kontrolujú rôzne dlhý as (niekoko dní). Všetky systémy sa však zanú kontrolova od toho istého da a kontrola systémov prebieha súbežne. Ak sa v systéme nájde nezhodný produkt, tento sa opraví alebo nahradí dobrým a systém sa znovu skontroluje. Preto hovoríme o opravitených systémoch. Ak predpokladáme, že s rastúcim potom dní kontroly systémov poet zistených nezhodných produktov pripadajúci na jeden de klesá, na popis tohto javu môžeme použi NHPP model,ktorý môžeme vyjadri nasledovne: b1 r t. b. t (1) kde a b sú neznáme parametre, ktoré pre tento prípad boli odhadnuté metódou podmienenej maximálnej vierohodnosti 1 : b = K = K q1 N q q1 i1 K q1 K q1 N q T ln X N q q T b kde K je celkový poet testovaných systémov ( u nás K = 0) q je poradie (íslo) systému (1,,...K) Tento príspevok vznikol s prispením grantovej agentúry VEGA, v rámci projektu íslo 1/0437/08: Kvantitatívne metódy v stratégii šes sigma q iq () (3)
167 N je poet zamietnutých produktov v uritom testovacom ase, ktoré sa vyskytujú v q- q tom systéme T q je džka trvania testu q-teho systému X iq je as v ktorom sa vyskytol i-ty nezhodný produkt v q-tom systéme ln je prirodzený logaritmus V našom príspevku budeme rieši dva problémy. 1. Pomocou rovnice (1) odhadneme poet zamietnutí (alebo poet nezhodných produktov ) pripadajúci na jeden de. A uríme aj priemerný poet zamietnutí pripadajúci na jeden systém a to pomocou vzahu n c zamietnutí / systém (4) K kde K je poet systémov a n je poet zamietnutí. Na lepšiu ilustráciu vyššie uvedenej problematiky uvedieme príklad. 3. Príklad Vychádzajme z nasledujúcej tabuky udajov Tabuka 1: Vstupné údaje príkladu íslo systému as, za ktorý sa Poet zamietnutí Džka trvania testu v systéme q q vyskytol nezhodný v systéme q T (dni) q produkt v systéme N q X iq (dni) ; ; 7; ; ; 6; ; 1; nevyskytol / nevyskytol / nevyskytol / nevyskytol / nevyskytol / 46 0 nevyskytol / 31 Znázornime si zistené skutonosti z Tab.1 v nasledujúcom obrázku:
168 Obrázok 1: asový výskyt zistení i-teho nezhodného produktu v q-tom systéme Body na úsekách rovnobežných s osou x-ovou sú hodnoty z. stpca Tab.1 alej vypoítajme odhady parametrov a b z rovníc () a (3) a Tab.1: b = ln ln... ln = (6) Oakávaný poet zamietnutí na jeden de potom vypoítame tak, že do rovnice (1) dosadíme (5) a (6): r 0,54 1 0, 46 t 0,15.0,54. t 0,081. t Pre rôzne hodnoty t (u nás v Tab.1 sú oznaené ako X (5) (7) ) ktoré usporiadame poda vekosti od najmenšej (0.3) po najväšiu (4), vypoítame r(t). Hodnoty funkcie r(t) sú uvedené v 3.stpci Tab.. Funkciu r(t) nazveme funkciou intenzity. Napríklad ak as za ktorý sa vyskytol nezhodný produkt bol X iq (= t ) desa dní, potom poda (7): 0,46 r(10) = 0, = 0,08 nezhodných / de Znázornime si tieto výpoty graficky na Obr.: iq Obrázok : Funkcia intenzity
169 Pre rôzne hodnoty t (. stpec Tab.) vypoítame hodnoty funkcie intenzity r(t), ktoré sa nachádzajú v 3. stpci Tab..: Tabuka : Tabuka pomocných výpotov Poet zamietnutí X iq (= t) r(t) ( y) n dni n log K X log 10 iq 10 n (= log 10 y) y teoretické K /0= /0=0, /0= /0= /0= /0= Prudký pokles funkcie intenzity r(t) znamená (Obr.), že ím neskôr sa vyskytnú nezhodné produkty, tým poet zamietnutí na jeden de klesá. Tak napríklad, ak zo zaiatku bol poet zamietnutí / de, po desiatich doch poklesol poet zamietnutí na 0.08 / de.. Aby sme zistili priemerný poet zamietnutí pripadajúcich na jeden systém, budeme poíta rovnicu (4) pre K = 0 (je poet systémov v našom príklade) a n = 1,,..., o je kumulatívny poet zamietnutí v 0-tich systémoch. Podiely typu (4) zapíšeme do 4. stpca Tab.,aby sme zbytone nezväšovali rozsah nášho príspevku. Napríklad, ak zistíme celkovo 8 zamietnutí, potom poda (4) bude: 8 / 0 = 0.4 zamietnutí na systém. Hodnota 0.4 sa nachádza 4. stpci Tab.( pre n = 8) a tomu zodpovedá džka trvania kontroly X iq ( = t) = 6 dní, ktorá sa nachádza v.stpci Tab.. Vynesme si tieto výpoty do grafu v bodoch t, s logaritmickou x-ovou a y-ovou stupnicou a to preto, lebo ak by sme tieto body vyniesli do lineárnej stupnice, teoretická krivka preložená cez tieto empirické body by bola síce priamka, ale s vekou odchýlkou od empirických hodnôt na zaiatku a na konci grafu. Preto teoretickou funkciou ktorá lepšie vystihuje zistený trend je funkcia b y a. x (8) s ktorou budeme pracova.
170 Na os x-ovú budeme vynáša hodnoty. stpca Tab. a na os y-ovú hodnoty zo 4.stpca Tab.. Obrázok 3:Priemerný poet nezhodných produktov pripadajúcich na systém Ak chceme preloži priamku cez empirické body na Obr.3, rovnicu (8) musíme zlogaritmova log10 y log10 a b.log10. x (9) A teda zlogaritmujeme aj hodnoty v. a 4. stpci Tab.. Rovnica (9) je rovnicou priamky, ktorej koeficienty log 10 a a b sme odhadli metódou najmenších štvorcov: log10 y log10.x (10) Dosadiac do rovnice (10) piaty stpec Tab., dostaneme teoretické hodnoty log 10 y (6.st.Tab.). Ak tieto hodnoty odlogaritmujeme, dostaneme teoretické hodnoty y, uvedené v 7.st.Tab.. Napríklad pre 1.íslo z Tab. by bolo: log y = (-0.53)= = Z toho y teoretické = 1/ 10 = Pre 6. íslo z Tab.: log 10 y = (0.477)= , z oho y teoretické = 1/ 10 = Keže priamka je urená dvomi bodmi, staí do Obr.3 vynies v bode t= 0.3 hodnotu a v bode t=3 hodnotu 0.31 a priamku máme cez empirické údaje preloženú. Z Obr.3 môžeme skonštatova, že so zvyšujúcim sa potom dní kontroly priemerný poet zamietnutí pripadajúci na jeden systém stúpa. Je to prirodzené, pretože systém je kontrolovaný vzhadom na kvalitu dôkladnejšie. 4. Záver V lánku sme sa zaoberali zaujímavou kontrolou kvality produktov poda 1 a to vzhadom na džku trvania kontroly rôznych systémov, ktorá môže by ubovone dlhá (vyjadrená v doch).zvyajne sa kontroluje poet náhodne vybratých produktov z uritej pevne stanovenej dávky. V tomto prípade ale kontrolujeme paralelne niekoko systémov a to každý systém poas nie rovnakého potu dní. Zistili sme, že pri takomto type kontroly 1. poet zistených nezhodných produktov pripadajúci na jeden de s pribúdajúcim asom kontroly klesá a., že s pribúdajúcim potom dní kontroly priemerný poet nezhodných produktov pripadajúci na jeden systém rastie.
171 Literatúra 1 Forrest,W., Breyfogle,III.: Implementing six sigma, John Wiley&sons, inc., Toronto 003, ISBN , str Adresa autora Božena Viktorínová, Mgr.CSc. Dolnozemská Bratislava Ekonomická univerzita, FHI, KŠ [email protected]
172 Interval spoahlivosti pre odhad potu nezhodných produktov v opravitených systémoch Confidence interval for estimation the number of defect products in repairable systems Abstract: * Božena Viktorínová The article deals with the construction of confidence intervals (according to ) for estimation the number of defect products in series of control systems. This control is border each only through time and so i tis possible to assume that the control systems will not have the same size. At the same time it is not speaking about 100% control. If in the control system occurs one defect product, this product is being replaced with a good product and the system is returned back into the control and so the systems are repairable systems. Key words: Confidence intervals, defect product, tested systems, repairable systems 1 Kúové slová: Interval spoahlivosti, nezhodný produkt, testovanie systémov, opravitený systém 1. Úvod Definujme si pojem systém ako množinu prvkov, ktoré prichádzajú ku kontrole, a ak sa kontrolou zistí nezhodný produkt, tento je nahradený dobrým a systém sa vráti spä ku kontrole. Systémy sú kontrolované v rovnako dlhých asových intervaloch (napr. každý po 1000 hodín).ak sa poas 1000 hodín vyskytne 1 nezhodný produkt, potom za 1 hodinu je to 0,001 (1/1000=0,001) nezhodných produktov. Predstavme si, že takýchto systémov budeme ma n, a každý sa bude kontrolova 1000 hodín. Teda bude sa jedna o asovo ohraniené testy. Potom kumulovaný as, ktorý venujeme kontrole bude T = n hodín. Ozname písmenom r poet zistených nezhodných produktov za as T. Chceme zisti, aký bude poet nezhodných produktov v n kontrolovaných systémoch vyrobených produktov, iže aké bude. Toto množstvo môžeme iba odhadnú, nakoko nejde o 100%-nú kontrolu produktov, a to pomocou intervalu spoahlivosti, ktorý je daný jeho dolnou a hornou hranicou ( poda, str.577). 1. Metodika výpotu intervalu spoahlivosti pre odhad potu nezhodných produktov v n systémoch, ak jednotlivé systémy (dávky) prichádzajúce ku kontrole sú opravitené: r;(1c ) / r;(1c ) / T T (1) * Tento príspevok vznikol s prispením grantovej agentúry VEGA, v rámci projektu íslo 1/0437/08: Kvantitatívne metódy v stratégii šes sigma
173 kde T c r je kumulatívny poet hodín poas ktorých testujeme všetky systémy je chí kvadrát hodnota z tabuky G, kde r a r+ je poet stupov vonosti je zvolená pravdepodobnos s akou je interval spoahlivosti urený je poet zistených nezhodných produktov poas T hodín testu Tabuka 1: Kumulatívne Tab.G = Tab.1 uverejnená v. rozdelenie Pre výpoet intervalu spoahlivosti môžeme zvoli aj alternatívny postup, ktorý nám dá rovnaký výsledok ako v prípade použitia rovnice (1): Ar ;(1c ) / Br;(1 c) / () T T priom A a B sú faktory zistené z tabuky K,pre r zistených nezhodných produktov vo všetkých n kontrolovaných systémoch za as T, c je zvolená pravdepodobnos s akou je interval spoahlivosti urený Tabuka : Faktory Poissonovho rozdelenia TABLE K Poisson Distribution Factors Decimal Confidence Level Poisson Distribution Confidence Factors B Number of Failures (r) (c) l Deci
174 Number of Failures (r) Poisson Distribution Confidence Factors A Applications of Table K Total test time: T = B rx /p 0 for pp 0 where p 0 is a failure rate criterion, r is allowed number of test failures, and c is a confidential factor. Confidential interval statements (time-terminated test); p B rx /T p A rx / T Examples: 1 failure test for a 0,0001 failures/hour criterion (i.e., 10,513/10,000) 95 % confidence test: Total test time = 47,440 hr (i.e., 4744/0,001) 5 failures in a total or 10,000 hours 95 % confident: p 0, failures/hour (i.e., 10,513/10,000) 95 % confident: p 0, failures/hour (i.e., 1.970/10,000) 90 % confidence: 0, p 0, mal Conf. Leve l (c) Príklad 1 : Majme 10 systémov (o ich rozsahu sa nehovorí) o ktorých vieme, že každý jeden je kontrolovaný 1000 hodín. Kumulatívny as kontroly (testu) teda bude T = = hodín. Zistili sme, že poas hodín testu sa vyskytlo r = 9 nezhodných produktov. Máme nájs 90%-ný interval spoahlivosti pre poet nezhodných produktov v n týchto kontrolovaných systémoch. Riešenie 1 : Zistené skutonosti dosame do rovnice (1):.9;(10,9) / (.9);(10,9) / Ak 9,39 a 0 31, 41 sú hodnoty nájdené v Tab.G, potom z oho 18;0,95 ;0,05 9,39 31,41, , , Teda môžeme poveda, že v 10 systémoch, ktoré sme kontrolovali hodín, sa s 90%- nou pravdepodobnosou môže vyskytnú od 4,695 do 15,705 kusov nezhodných produktov, priom my sme ich našli 9. Riešenie : Ten istý výsledok dostaneme, ak hodnoty z príkladu 1 dosadíme do rovnice (): A9;(1 0,9) / B9;(1 0,9) / Ak A = 4,695 a B = 15,705 sú hodnoty nájdené v Tab.K, potom 9;0,95 9;0, 95 4,695 15,705, z oho 0, , Komentár k výsledku je ten istý, ako v riešení 1.
175 Záver Konštrukcia vyššie uvedených intervalov spoahlivosti ( (1) a ()) je zaujímavá tým, že neuvažuje rozsah kontrolovaného výberu, z ktorého sa potom usudzuje na celý základný súbor, ale berie do úvahy poet zistených nezhodných produktov (výrobkov) r v n systémoch, z ktorých každý podlieha asovo ohranienej kontrole (testu). Teoreticky je teda možné, že kontrolované systémy majú rôzny rozsah. Z (1) a () sme teda schopní uri ubovoný (90%, 95%, 99%-ný) interval spoahlivosti, t.j. dolnú a hornú hranicu predpokladaného potu nezhodných produktov v n systémoch, ktoré nepodliehajú 100%-nej kontrole. 4. Literatúra 1 Forrest, W., Breyfogle,III.: Implementing six sigma, John Wiley&sons, inc., Toronto, 003, ISBN , str Viktorínová, B.: Sekvenný test pre opravitené systémy v závislosti na ase; Zborník konferencie: Nitrianske štatistické dni, SŠDS, Nitra, FSS 4/008, júl 008, ISSN Adresa autora Božena Viktorínová, Mgr., CSc. Dolnozemská Bratislava Ekonomická univerzita, FHI, KŠ [email protected]
176 Z histórie FERNSTATov From the history of FERNSTATs Jozef Chajdiak, Ján Luha, Vladimír Úradníek 1. Úvod V príspevku uvádzame okolnosti vzniku FERNSTATu a strune základné informácie o prvých 5 roníkov tejto medzinárodnej konferencie aplikovanej štatistiky.. Vnik FERNSTATu Myšlienku organizova konferenciu FernStat s tematickou orientáciou na aplikovanú štatistiku vyslovil poas panelovej diskusie, konanej v rámci 13. roníka Medzinárodného semináru Výpotová štatistika. decembra 003 vo veerných hodinách nemenovaný spoluautor tohoto príspevku (V. Ú.) v úzkom kruhu, ktorý tvorili autori tohoto príspevku (J.Ch., J.L., V.Ú.). Prvotná myšlienka bola zaznamenaná do PC alšieho nemenovaného (J. L.) na podnet tretieho nemenovaného (J. Ch.). Tak sa myšlienka zachovala a postupne bola rozpracovaná koncepcia konferencie, ako aj význam skratky FernStat: Medzinárodná konferencia aplikovanej štatistiky (Financie, Ekonomika, Riadenie, Názory). Okrem aplikovanej štatistiky boli stanovené aj tematické okruhy širšieho rámca, ktoré sa za prvých 5 roníkov zatia nemenili: Tematické okruhy konferencie pre rok 004 boli: Aplikovaná štatistika, Demografická štatistika, Matematická štatistika a Štatistické riadenie kvality. Konferenciu organizuje Slovenská štatistická a demografická spolonos v spolupráci s UMB Banská Bystrica v rokoch 004 a 005 s Fakultou financií a po jej zlúení s Ekonomickou fakultou je partnerskou organizáciou Ekonomická fakulta UMB v Banskej Bystrici. Na pôde Slovenskej štatistickej a demografickej spolonosti sa snažíme o rozvoj teórie a aplikácií štatistických metód. Dôležitým aspektom je tiež popularizácia štatistiky a poukazovanie na jej vážnos a tiež presadzovanie vážnosti tejto vednej disciplíny. Taktiež je snaha aktivizova aj aktivity štatistickej mládeže a umožova im úas a prezentáciu na našich odborných akciách. Spoluautor (J.L.) tohto príspevku už dávno zistil, že ke sa sám nepochváli, tak sa pochvaly asi ažko doká a preto pri každej príležitosti poukazuje na to, že je autorom nielen znaku Slovenskej štatistickej a demografickej spolonosti, ale v rámci snahy robi vážne veci veselo, objavil aj Zákon troch fernetov, v stratke zákon TRIeF, alebo 3F. So znakom Spolonosti sa stretávame na každom podujatí, nachádza sa aj na stránke O ZÁKONE TRIeF, alebo 3F zasvätení vedia a bližšie sa o om možno dozvedie na spoloenskej asti každej odbornej akcie SŠDS. Nuž a novší objav definuje skratku KAFE nie je to ale ten mok, o sa zvykne pi cez prestávku, ale Karpatský fernet.
177 Obrázok 1 a Hotel Lesák, Tajov a foto z rokovania konferencie
178 Chronológia FERNSTATov Spomedzi piatich doterajších roníkov konferencie FernStat patrí osobitné miesto druhému roníku konferencie. Uvedený roník vstupuje do histórie SŠDS prvým íslom nového vedeckého asopisu Slovenskej štatistickej a demografickej spolonosti FORUM STATISTICUM SLOVACUM (FSS 1/005, ISSN ), ktoré obsahovo bolo naplnené príspevkami konferencie FERNSTAT 005. Naviac ponúc týmto roníkom sa zaviedla tradícia konania konferencie vždy prvý štvrtok a piatok v októbri. Miesto konania konferencie je stabilné: Tajov pri Banskej Bystrici, Hotel Lesák. Poas doterajších roníkov konferencie FernStat sa s menšími obmenami vytvoril viac-menej stabilný organizaný a programový výbor v zložení V. Úradníek predseda, M. Kanderová tajomník, J. Chajdiak, J. Luha, R. Gavliak, S. Koróny (v prvých dvoch roníkoch). Pri organizovaní konferencie aktívne participovali aj niektorí alší lenovia SŠDS, ako aj študenti UMB v Banskej Bystrici. Prehad dátumov konania jednotlivých roníkov konferencie, potu príspevkov publikovaných z príslušného roníka, ako aj celkový poet autorov týchto príspevkov uvádza tabuka 1. Tabuka 1 Chronológia FernStatov Dátum konania Poet príspevkov Poet autorov príspevkov FernStat mája FernStat októbra FernStat októbra FernStat októbra FernStat októbra Prame: Vlastné spracovanie 4. Záver Medzinárodná konferencia FERNSTAT už za krátku päronú históriu dokázala svoju užitonos. Stala sa prostriedkom na stretávanie odborníkov a umožuje publikova hodnotné príspevky a tak rozširuje publikané možnosti širokému okruhu odborníkov. Ambíciou usporiadateov konferencie je rozšírenie FernStatu aj o regionálnu prehliadku prác mladých aplikovaných štatistikov, z ktorých najlepší by sa kvalifikovali na Prehliadku prác mladých štatistikov a demografov, ktorá sa každorone koná v decembri v rámci Medzinárodného semináru Výpotová štatistika.
179 Literatúra [1]FernStat004 Zborník príspevkov zo slovenskej konferencie aplikovanej štatistiky. Tajov, mája 004. Bratislava : SŠDS, s. ISBN []FORUM STATISTICUM SLOVACUM 1/005. SŠDS, 005. ISSN [3]FORUM STATISTICUM SLOVACUM 4/006. SŠDS, 006. ISSN [4]FORUM STATISTICUM SLOVACUM 4/007. SŠDS, 007. ISSN [5]FORUM STATISTICUM SLOVACUM 6/008. SŠDS, 008. ISSN Adresa autora (-ov): Ing. Vladimír Úradníek, PhD. [email protected] RNDr. Ján Luha, CSc. [email protected] Doc. Ing. Jozef Chajdiak, CSc. [email protected]
180 OBSAH Úvod 1 Boa Martin Approaches to volatility estimation based on historical data Boa Martin Kanderová Mária Boháová Hana, Heckenbergerová Jana, Jindrová Pavla, Overovanie efektívnosti trhového portfólia v priestore meanvariance: model CAPM Branch structure of employment in particular regions of the Czech Republic ief Rastislav Vývoj rozvodovosti na Slovensku Durník Eduard, Kamenický Jií Fiala Tomáš Hajduová Zuzana, Liptáková Erika, Závadský Cyril Hanousková Jitka, Ks Václav Horníková Adriana Hrehová Stella Hrniarová ubica, Terek Milan Chajdiak Jozef, Suchánek Maroš Regionální demografie v SÚ - prezentace a analytické využívání Analýza rstu stední délky života v R metodou klouzavé 31 lineární regrese Aplikácia metódy QFD v hutníckej výrobe 36 Asymptotické vlastnosti odhad s minimální Kolmogorovskou vzdáleností Štatistické riadenie kvality Taguchiho návrhy experimentov v SAS-e Možnosti využitia MS Excel pri operatívnom sledovaní kvality výrobného procesu Štatistické riadenie kvality. Analýza spôsobilosti procesu 57 Štatistické porovnanie zhody analyzovaného a referenného súboru Janiga Ivan Štatistická regulácia v plniacom procese 67 Kaerová Eva Nezamstnanost cizinc v eské republice podle vzdlání 74 Kalina Jan Robust GMM estimation 78 Kapounek Svatopluk Stabilita poptávky po penzích v eské republice 84 Kašáková Alena, Nedelová Gabriela Koróny Samuel Linda Bohdan, Kubanová Jana Diferenciácia slovenských domácností vyplývajúca z ekonomickej aktivity Grilichesove konzistentné hranice parametrov Cobbovej- Douglasovej produknej funkcie stavebných podnikov Situation in University Educational System in the Czech Republic Luha Ján Korelácia komplementárnych a disjunktných javov 105 Macurová Anna, Macura Dušan Grubbsov test a hypotézy o obrobenom povrchu 114 Neubauer Jií Kointegraní analýza modelu inflace v eské republice 117 Odehnal Jakub, Michálek Jaroslav, Sedlaík Marek Faktory podnikatelského prostedí a jejich klasifikaní síla 13
181 Pastor Karol Pokus o nájdenie spravodlivého dôchodkového systému 19 Pomnková Jitka Stanovení vrcholu a dna hospodáského cyklu R pomocí neparametrického odhadu derivace trendu 134 Penosil Jan, Dopad finanních prostedk plynoucích z Evropské unie na Pomnková Jitka ekonomiku eské republiky 140 Rozmahel Petr Vybrané metody eliminace trendu a identifikace cyklické složky v makroekonomických asových adách 146 Terek Milan Analýza odahlých údajov 15 Tláskal Jan, Klasifikaní metody v akustické emisi statický pístup Ks Václav 158 Viktorínová Božena Opravitené systémy s meniacim sa potom zamietnutých dávok 164 Viktorínová Božena Interval spoahlivosti pre odhad potu nezhodných produktov v opravitených systémoch 170 Chajdiak Jozef, Luha Z histórie FERNSTATov Ján, Úradníek 174 Vladimír
182 CONTENS Introduction 1 Boa Martin Approaches to volatility estimation based on historical data Boa Martin Kanderová Mária Boháová Hana, Heckenbergerová Jana, Jindrová Pavla, Overovanie efektívnosti trhového portfólia v priestore meanvariance: model CAPM Branch structure of employment in particular regions of the Czech Republic ief Rastislav Divorce Rate Progress in Slovakia from 1997 to Durník Eduard, Kamenický Jií Fiala Tomáš Hajduová Zuzana, Liptáková Erika, Závadský Cyril Hanousková Jitka, Ks Václav Horníková Adriana Hrehová Stella Hrniarová ubica, Terek Milan Chajdiak Jozef, Suchánek Maroš Regionální demografie v SÚ - prezentace a analytické využívání The analysis of the growths of the life expectation in the Czech 31 Republic by the method of moving linear regression Applikation of method QFD in metallurgical production 36 Asymptotic properties of Minimum Kolmogorov distance density estimators Statistical Quality Control Taguchi Design of Experiments within SAS Possibilities of using MS Excel to operative control of 53 manufacturing process quality Statistical Quality Control. Process Capability Analysis 57 Statistical comparison deuces to analyse and reference file 63 Janiga Ivan Statistical control in filling process 67 Kaerová Eva Unemployment of Foreigners in the Czech Republic 74 Kalina Jan Robust GMM estimation 78 Kapounek Svatopluk Stabilita poptávky po penzích v eské republice 84 Kašáková Alena, Differentiation of Slovak Households Followed from the 90 Nedelová Gabriela Activity Status Koróny Samuel Griliches consistent bounds of Cobb-Douglas production function parameters of construction companies Linda Bohdan, Situation in University Educational System in the Czech 100 Kubanová Jana Republic Luha Ján Correlation of complementary and disjoint events 105 Macurová Anna, Macura Dušan Neubauer Jií Odehnal Jakub, Michálek Jaroslav, Sedlaík Marek Test of Grubbs and Hypotheses on the Cut Surface 114 Cointegration Analysis of the Inflation Model in the Czech Republic Factors of entrepreneurial environment and their power of classification
183 Pastor Karol An attempt to find the fair pension system 19 Pomnková Jitka Through and Peak Determination of the CR Business Cycles 134 using nonparametric estimat of the trend derivation Penosil Jan, Impact of financial transfers from the European Union on the 140 Pomnková Jitka Czech Republic economy Rozmahel Petr Selected Detrending Techniques and Methods of Cyclical Component Identificaion in the Macroeconomic Time Series 146 Terek Milan Analysis of Outliers 15 Tláskal Jan, Ks Classification methods in acoustic emission statistical Václav approach 158 Viktorínová Božena Repairable systems with changing failure rate 164 Viktorínová Božena Confidence interval for estimation the number of defect products in repairable systems 170 Chajdiak Jozef, Luha From the history of FERNSTATs Ján, Úradníek 174 Vladimír
184 Pokyny pre autorov Jednotlivé čísla vedeckého časopisu FORUM STATISTICUM SLOVACUM sú prevažne tematicky zamerané zhodne s tematickým zameraním akcií SŠDS. Príspevky v elektronickej podobe prijíma zástupca redakčnej rady na elektronickej adrese uvedenej v pozvánke na konkrétne odborné podujatie Slovenskej štatistickej a demografickej spoločnosti. Názov word-súboru uvádzajte a posielajte v tvare: priezvisko_nazovakcie.doc Forma: Príspevky písané výlučne len v textovom editore MS WORD, verzia 6 a vyššia do verzie 003, písmo Times New Roman CE 1, riadkovanie jednoduché (1), formát strany A4, všetky okraje,5 cm, strany nečíslovať. Tabuľky a grafy v čierno-bielom prevedení zaradiť priamo do textu článku a označiť podľa šablony. Bibliografické odkazy uvádzať v súlade s normou STN ISO 690 a v súlade s medzinárodnými štandardami. Citácie s poradovým číslom z bibliografického zoznamu uvádzať priamo v texte. Rozsah: Maximálny rozsah príspevku je 6 strán. Príspevky sú recenzované. Redakčná rada zabezpečí posúdenie príspevku členom redakčnej rady alebo externým oponentom. Štruktúra príspevku: (Pri písaní príspevku využite elektronickú šablónu: v časti Vedecký časopis, Pokyny pre autorov.) Názov príspevku v slovenskom jazyku (štýl Názov: Time New Roman 14, Bold, centrovať) Názov príspevku v anglickom jazyku (štýl Názov: Time New Roman 14, Bold, centrovať) Vynechať riadok Meno1 Priezvisko1, Meno Priezvisko (štýl normálny: Time New Roman 1, centrovať) Vynechať riadok Abstract: Text abstraktu v anglickom jazyku, max. 10 riadkov (štýl normálny: Time New Roman 1). Vynechať riadok Key words: Kľúčové slová v anglickom jazyku, max. riadky (štýl normálny: Time New Roman 1). Vynechať riadok Kľúčové slová: Kľúčové slová v jazyku v akom je napísaný príspevok, max. riadky (štýl normálny: Time New Roman 1). Vynechať riadok Vlastný text príspevku v členení: 1. Úvod (štýl Nadpis 1: Time New Roman 1, bold, zarovnať vľavo, číslovať). Názov časti 1 (štýl Nadpis 1: Time New Roman 1, bold, zarovnať vľavo, číslovať) 3. Názov časti Záver (štýl Nadpis 1: Time New Roman 1, bold, zarovnať vľavo, číslovať) Vlastný text jednotlivý častí je písaný štýlom Normal: písmo Time New Roman 1, prvý riadok odseku je odsadený vždy na 1 cm, odsek je zarovnaný s pevným okrajom. Riadky medzi časťami nevynechávajte. 5. Literatúra (štýl Nadpis 1: Time New Roman 1, bold, zarovnať vľavo, číslovať) [1] Písať podľa normy STN ISO 690 [] GRANGER, C.W. NEWBOLD, P Spurious Regression in Econometrics. In: Journal of Econometrics, č., 1974, s Adresa autora (-ov) (štýl Nadpis 1: Time New Roman 1, bold, zarovnať vľavo, adresy vpísať do tabuľky bez orámovania s potrebným počtom stĺpcov a s 1 riadkom): Meno1 Priezvisko1, tituly1 Ulica Mesto1 [email protected] Meno Priezvisko, tituly Ulica Mesto [email protected]
185 FORUM STATISTICUM SLOVACUM vedecký časopis Slovenskej štatistickej a demografickej spoločnosti Vydavateľ Slovenská štatistická a demografická spoločnosť Miletičova Bratislava 4 Slovenská republika Redakcia Miletičova Bratislava 4 Slovenská republika Fax 0/ [email protected] [email protected] Registráciu vykonalo Ministerstvo kultúry Slovenskej republiky Registračné číslo 3416/005 Tematická skupina B1 Dátum registrácie Objednávky Slovenská štatistická a demografická spoločnosť Miletičova 3, Bratislava 4 Slovenská republika IČO: Číslo účtu: /0900 ISSN Redakčná rada RNDr. Peter Mach predseda Doc. Ing. Jozef Chajdiak, CSc. šéfredaktor RNDr. Ján Luha, CSc. tajomník členovia: Ing. Mikuláš Cár, CSc. Ing. Ján Cuper Ing. Pavel Fľak, DrSc. Ing. Edita Holičková Doc. RNDr. Ivan Janiga, CSc. Ing. Anna Janusová RNDr. PaedDr. Stanislav Katina, PhD. Prof. RNDr. Jozef Komorník, DrSc. RNDr. Samuel Koróny Doc. Ing. Milan Kovačka, CSc. Doc. RNDr. Bohdan Linda, CSc. Prof. RNDr. Jozef Mládek, DrSc. Doc. RNDr. Oľga Nánásiová, CSc. Doc. RNDr. Karol Pastor, CSc. Prof. RNDr. Rastislav Potocký, CSc. Doc. RNDr. Viliam Páleník, PhD. Ing. Iveta Stankovičová, PhD. Doc. RNDr. Beata Stehlíková, CSc. Prof. RNDr. Michal Tkáč, CSc. Ing. Vladimír Úradníček, PhD. Ing. Boris Vaňo Doc. MUDr Anna Volná, CSc., MBA. Ing. Mária Vojtková, PhD. Prof. RNDr. Gejza Wimmer, DrSc. Mgr. Milan Žirko Ročník IV. Číslo 6/008 Cena výtlačku 500 SKK / 0 EUR Ročné predplatné 1500 SKK / 60 EUR
Charles University, Faculty of Mathematics and Physics, Prague, Czech Republic.
WDS'09 Proceedings of Contributed Papers, Part I, 148 153, 2009. ISBN 978-80-7378-101-9 MATFYZPRESS Volatility Modelling L. Jarešová Charles University, Faculty of Mathematics and Physics, Prague, Czech
RESEARCH PAPERS FACULTY OF MATERIALS SCIENCE AND TECHNOLOGY IN TRNAVA SLOVAK UNIVERSITY OF TECHNOLOGY IN BRATISLAVA
RESEARCH PAPERS FACULTY OF MATERIALS SCIENCE AND TECHNOLOGY IN TRNAVA SLOVAK UNIVERSITY OF TECHNOLOGY IN BRATISLAVA 2012 Special Number THE IMPORTANCE OF HUMAN RESOURCE PLANNING IN INDUSTRIAL ENTERPRISES
Black-Scholes-Merton approach merits and shortcomings
Black-Scholes-Merton approach merits and shortcomings Emilia Matei 1005056 EC372 Term Paper. Topic 3 1. Introduction The Black-Scholes and Merton method of modelling derivatives prices was first introduced
Maximum likelihood estimation of mean reverting processes
Maximum likelihood estimation of mean reverting processes José Carlos García Franco Onward, Inc. [email protected] Abstract Mean reverting processes are frequently used models in real options. For
CHAPTER 2 Estimating Probabilities
CHAPTER 2 Estimating Probabilities Machine Learning Copyright c 2016. Tom M. Mitchell. All rights reserved. *DRAFT OF January 24, 2016* *PLEASE DO NOT DISTRIBUTE WITHOUT AUTHOR S PERMISSION* This is a
The Black-Scholes Formula
FIN-40008 FINANCIAL INSTRUMENTS SPRING 2008 The Black-Scholes Formula These notes examine the Black-Scholes formula for European options. The Black-Scholes formula are complex as they are based on the
A Basic Introduction to the Methodology Used to Determine a Discount Rate
A Basic Introduction to the Methodology Used to Determine a Discount Rate By Dubravka Tosic, Ph.D. The term discount rate is one of the most fundamental, widely used terms in finance and economics. Whether
How Many Days Equal A Year? Non-trivial on the Mean-Variance Model
How Many Days Equal A Year? Non-trivial on the Mean-Variance Model George L. Ye, Dr. Sobey School of Business Saint Mary s University Halifax, Nova Scotia, Canada Christine Panasian, Dr. Sobey School of
Review of Basic Options Concepts and Terminology
Review of Basic Options Concepts and Terminology March 24, 2005 1 Introduction The purchase of an options contract gives the buyer the right to buy call options contract or sell put options contract some
EC824. Financial Economics and Asset Pricing 2013/14
EC824 Financial Economics and Asset Pricing 2013/14 SCHOOL OF ECONOMICS EC824 Financial Economics and Asset Pricing Staff Module convenor Office Keynes B1.02 Dr Katsuyuki Shibayama Email [email protected]
A Review of Cross Sectional Regression for Financial Data You should already know this material from previous study
A Review of Cross Sectional Regression for Financial Data You should already know this material from previous study But I will offer a review, with a focus on issues which arise in finance 1 TYPES OF FINANCIAL
THE ROLE OF MARKETING IN MULTINATIONAL SUBSIDIARIES: STANDARDIZATION VERSUS LOCALIZATION
THE ROLE OF MARKETING IN MULTINATIONAL SUBSIDIARIES: STANDARDIZATION VERSUS LOCALIZATION Miroslav Karlíãek, Zuzana Chytková, Nikola Hofiej, Hana Mohelská, Jakub Fischer Introduction In the international
Chapter 13 Composition of the Market Portfolio 1. Capital markets in Flatland exhibit trade in four securities, the stocks X, Y and Z,
Chapter 13 Composition of the arket Portfolio 1. Capital markets in Flatland exhibit trade in four securities, the stocks X, Y and Z, and a riskless government security. Evaluated at current prices in
Hedging Illiquid FX Options: An Empirical Analysis of Alternative Hedging Strategies
Hedging Illiquid FX Options: An Empirical Analysis of Alternative Hedging Strategies Drazen Pesjak Supervised by A.A. Tsvetkov 1, D. Posthuma 2 and S.A. Borovkova 3 MSc. Thesis Finance HONOURS TRACK Quantitative
FINANCIAL ECONOMICS OPTION PRICING
OPTION PRICING Options are contingency contracts that specify payoffs if stock prices reach specified levels. A call option is the right to buy a stock at a specified price, X, called the strike price.
The Valuation of Currency Options
The Valuation of Currency Options Nahum Biger and John Hull Both Nahum Biger and John Hull are Associate Professors of Finance in the Faculty of Administrative Studies, York University, Canada. Introduction
CAPM, Arbitrage, and Linear Factor Models
CAPM, Arbitrage, and Linear Factor Models CAPM, Arbitrage, Linear Factor Models 1/ 41 Introduction We now assume all investors actually choose mean-variance e cient portfolios. By equating these investors
Marketing Mix Modelling and Big Data P. M Cain
1) Introduction Marketing Mix Modelling and Big Data P. M Cain Big data is generally defined in terms of the volume and variety of structured and unstructured information. Whereas structured data is stored
A SNOWBALL CURRENCY OPTION
J. KSIAM Vol.15, No.1, 31 41, 011 A SNOWBALL CURRENCY OPTION GYOOCHEOL SHIM 1 1 GRADUATE DEPARTMENT OF FINANCIAL ENGINEERING, AJOU UNIVERSITY, SOUTH KOREA E-mail address: [email protected] ABSTRACT. I introduce
Module 3: Correlation and Covariance
Using Statistical Data to Make Decisions Module 3: Correlation and Covariance Tom Ilvento Dr. Mugdim Pašiƒ University of Delaware Sarajevo Graduate School of Business O ften our interest in data analysis
Journal of Financial and Economic Practice
Analyzing Investment Data Using Conditional Probabilities: The Implications for Investment Forecasts, Stock Option Pricing, Risk Premia, and CAPM Beta Calculations By Richard R. Joss, Ph.D. Resource Actuary,
Jorge Cruz Lopez - Bus 316: Derivative Securities. Week 11. The Black-Scholes Model: Hull, Ch. 13.
Week 11 The Black-Scholes Model: Hull, Ch. 13. 1 The Black-Scholes Model Objective: To show how the Black-Scholes formula is derived and how it can be used to value options. 2 The Black-Scholes Model 1.
Betting on Volatility: A Delta Hedging Approach. Liang Zhong
Betting on Volatility: A Delta Hedging Approach Liang Zhong Department of Mathematics, KTH, Stockholm, Sweden April, 211 Abstract In the financial market, investors prefer to estimate the stock price
Constructing Portfolios of Constant-Maturity Fixed- Income ETFs
Constructing Portfolios of Constant-Maturity Fixed- Income ETFs Newfound Research LLC December 2013 For more information about Newfound Research call us at +1-617-531-9773, visit us at www.thinknewfound.com
On Black-Scholes Equation, Black- Scholes Formula and Binary Option Price
On Black-Scholes Equation, Black- Scholes Formula and Binary Option Price Abstract: Chi Gao 12/15/2013 I. Black-Scholes Equation is derived using two methods: (1) risk-neutral measure; (2) - hedge. II.
Black Scholes Merton Approach To Modelling Financial Derivatives Prices Tomas Sinkariovas 0802869. Words: 3441
Black Scholes Merton Approach To Modelling Financial Derivatives Prices Tomas Sinkariovas 0802869 Words: 3441 1 1. Introduction In this paper I present Black, Scholes (1973) and Merton (1973) (BSM) general
The Use of Event Studies in Finance and Economics. Fall 2001. Gerald P. Dwyer, Jr.
The Use of Event Studies in Finance and Economics University of Rome at Tor Vergata Fall 2001 Gerald P. Dwyer, Jr. Any views are the author s and not necessarily those of the Federal Reserve Bank of Atlanta
ING (L) Société d Investissement à Capital Variable 3, rue Jean Piret, L-2350 Luxembourg R.C.S.: Luxembourg B č. 44.873 (ďalej ako spoločnosť )
ING (L) Société d Investissement à Capital Variable 3, rue Jean Piret, L-2350 Luxembourg R.C.S.: Luxembourg B č. 44.873 (ďalej ako spoločnosť ) Oznam pre akcionárov 1) Správna rada spoločnosti rozhodla
Valuing Stock Options: The Black-Scholes-Merton Model. Chapter 13
Valuing Stock Options: The Black-Scholes-Merton Model Chapter 13 Fundamentals of Futures and Options Markets, 8th Ed, Ch 13, Copyright John C. Hull 2013 1 The Black-Scholes-Merton Random Walk Assumption
Understanding the Impact of Weights Constraints in Portfolio Theory
Understanding the Impact of Weights Constraints in Portfolio Theory Thierry Roncalli Research & Development Lyxor Asset Management, Paris [email protected] January 2010 Abstract In this article,
ENGINEERING ECONOMICS AND FINANCE
CHAPTER Risk Analysis in Engineering and Economics ENGINEERING ECONOMICS AND FINANCE A. J. Clark School of Engineering Department of Civil and Environmental Engineering 6a CHAPMAN HALL/CRC Risk Analysis
LOGNORMAL MODEL FOR STOCK PRICES
LOGNORMAL MODEL FOR STOCK PRICES MICHAEL J. SHARPE MATHEMATICS DEPARTMENT, UCSD 1. INTRODUCTION What follows is a simple but important model that will be the basis for a later study of stock prices as
Sledovanie čiary Projekt MRBT
VYSOKÉ UČENÍ TECHNIC KÉ V BRNĚ BRNO UNIVERSITY OF T ECHNOLOGY FAKULTA ELEKTROTECHNIKY A KOMUNIKAČNÍCH TECHNO LOGIÍ ÚSTAV AUTOMATIZA CE A MĚŘÍCÍ TECHNIKY FACULTY OF ELECTRICAL ENGINEERING AND COMUNICATION
MISSING DATA TECHNIQUES WITH SAS. IDRE Statistical Consulting Group
MISSING DATA TECHNIQUES WITH SAS IDRE Statistical Consulting Group ROAD MAP FOR TODAY To discuss: 1. Commonly used techniques for handling missing data, focusing on multiple imputation 2. Issues that could
Black swans, market timing and the Dow
Applied Economics Letters, 2009, 16, 1117 1121 Black swans, market timing and the Dow Javier Estrada IESE Business School, Av Pearson 21, 08034 Barcelona, Spain E-mail: [email protected] Do investors in
TEACHING AGGREGATE PLANNING IN AN OPERATIONS MANAGEMENT COURSE
TEACHING AGGREGATE PLANNING IN AN OPERATIONS MANAGEMENT COURSE Johnny C. Ho, Turner College of Business, Columbus State University, Columbus, GA 31907 David Ang, School of Business, Auburn University Montgomery,
1 Solving LPs: The Simplex Algorithm of George Dantzig
Solving LPs: The Simplex Algorithm of George Dantzig. Simplex Pivoting: Dictionary Format We illustrate a general solution procedure, called the simplex algorithm, by implementing it on a very simple example.
TABLE OF CONTENTS. A. Put-Call Parity 1 B. Comparing Options with Respect to Style, Maturity, and Strike 13
TABLE OF CONTENTS 1. McDonald 9: "Parity and Other Option Relationships" A. Put-Call Parity 1 B. Comparing Options with Respect to Style, Maturity, and Strike 13 2. McDonald 10: "Binomial Option Pricing:
Review of Fundamental Mathematics
Review of Fundamental Mathematics As explained in the Preface and in Chapter 1 of your textbook, managerial economics applies microeconomic theory to business decision making. The decision-making tools
Vanna-Volga Method for Foreign Exchange Implied Volatility Smile. Copyright Changwei Xiong 2011. January 2011. last update: Nov 27, 2013
Vanna-Volga Method for Foreign Exchange Implied Volatility Smile Copyright Changwei Xiong 011 January 011 last update: Nov 7, 01 TABLE OF CONTENTS TABLE OF CONTENTS...1 1. Trading Strategies of Vanilla
CFA Examination PORTFOLIO MANAGEMENT Page 1 of 6
PORTFOLIO MANAGEMENT A. INTRODUCTION RETURN AS A RANDOM VARIABLE E(R) = the return around which the probability distribution is centered: the expected value or mean of the probability distribution of possible
A Coefficient of Variation for Skewed and Heavy-Tailed Insurance Losses. Michael R. Powers[ 1 ] Temple University and Tsinghua University
A Coefficient of Variation for Skewed and Heavy-Tailed Insurance Losses Michael R. Powers[ ] Temple University and Tsinghua University Thomas Y. Powers Yale University [June 2009] Abstract We propose a
The Behavior of Bonds and Interest Rates. An Impossible Bond Pricing Model. 780 w Interest Rate Models
780 w Interest Rate Models The Behavior of Bonds and Interest Rates Before discussing how a bond market-maker would delta-hedge, we first need to specify how bonds behave. Suppose we try to model a zero-coupon
Investment Statistics: Definitions & Formulas
Investment Statistics: Definitions & Formulas The following are brief descriptions and formulas for the various statistics and calculations available within the ease Analytics system. Unless stated otherwise,
On the Efficiency of Competitive Stock Markets Where Traders Have Diverse Information
Finance 400 A. Penati - G. Pennacchi Notes on On the Efficiency of Competitive Stock Markets Where Traders Have Diverse Information by Sanford Grossman This model shows how the heterogeneous information
Microeconomics Sept. 16, 2010 NOTES ON CALCULUS AND UTILITY FUNCTIONS
DUSP 11.203 Frank Levy Microeconomics Sept. 16, 2010 NOTES ON CALCULUS AND UTILITY FUNCTIONS These notes have three purposes: 1) To explain why some simple calculus formulae are useful in understanding
Chapter 9. The Valuation of Common Stock. 1.The Expected Return (Copied from Unit02, slide 36)
Readings Chapters 9 and 10 Chapter 9. The Valuation of Common Stock 1. The investor s expected return 2. Valuation as the Present Value (PV) of dividends and the growth of dividends 3. The investor s required
How can we discover stocks that will
Algorithmic Trading Strategy Based On Massive Data Mining Haoming Li, Zhijun Yang and Tianlun Li Stanford University Abstract We believe that there is useful information hiding behind the noisy and massive
Asymmetry and the Cost of Capital
Asymmetry and the Cost of Capital Javier García Sánchez, IAE Business School Lorenzo Preve, IAE Business School Virginia Sarria Allende, IAE Business School Abstract The expected cost of capital is a crucial
Simple linear regression
Simple linear regression Introduction Simple linear regression is a statistical method for obtaining a formula to predict values of one variable from another where there is a causal relationship between
Bias in the Estimation of Mean Reversion in Continuous-Time Lévy Processes
Bias in the Estimation of Mean Reversion in Continuous-Time Lévy Processes Yong Bao a, Aman Ullah b, Yun Wang c, and Jun Yu d a Purdue University, IN, USA b University of California, Riverside, CA, USA
Enhancing the SNR of the Fiber Optic Rotation Sensor using the LMS Algorithm
1 Enhancing the SNR of the Fiber Optic Rotation Sensor using the LMS Algorithm Hani Mehrpouyan, Student Member, IEEE, Department of Electrical and Computer Engineering Queen s University, Kingston, Ontario,
Valuation of the Minimum Guaranteed Return Embedded in Life Insurance Products
Financial Institutions Center Valuation of the Minimum Guaranteed Return Embedded in Life Insurance Products by Knut K. Aase Svein-Arne Persson 96-20 THE WHARTON FINANCIAL INSTITUTIONS CENTER The Wharton
APPLICATION OF LINEAR REGRESSION MODEL FOR POISSON DISTRIBUTION IN FORECASTING
APPLICATION OF LINEAR REGRESSION MODEL FOR POISSON DISTRIBUTION IN FORECASTING Sulaimon Mutiu O. Department of Statistics & Mathematics Moshood Abiola Polytechnic, Abeokuta, Ogun State, Nigeria. Abstract
An introduction to Value-at-Risk Learning Curve September 2003
An introduction to Value-at-Risk Learning Curve September 2003 Value-at-Risk The introduction of Value-at-Risk (VaR) as an accepted methodology for quantifying market risk is part of the evolution of risk
The Capital Asset Pricing Model (CAPM)
Prof. Alex Shapiro Lecture Notes 9 The Capital Asset Pricing Model (CAPM) I. Readings and Suggested Practice Problems II. III. IV. Introduction: from Assumptions to Implications The Market Portfolio Assumptions
2. Linear regression with multiple regressors
2. Linear regression with multiple regressors Aim of this section: Introduction of the multiple regression model OLS estimation in multiple regression Measures-of-fit in multiple regression Assumptions
Overview of Violations of the Basic Assumptions in the Classical Normal Linear Regression Model
Overview of Violations of the Basic Assumptions in the Classical Normal Linear Regression Model 1 September 004 A. Introduction and assumptions The classical normal linear regression model can be written
Graph 1 - Correlation Stats. Correlation (%)
Investing Without Market Risk Prof. Luis Seco Department of Mathematics, University of Toronto Sigma Analysis and Management Inc. In 1983, John Lintner presented his famous results on the role of managed
This paper is not to be removed from the Examination Halls
~~FN3023 ZB d0 This paper is not to be removed from the Examination Halls UNIVERSITY OF LONDON FN3023 ZB BSc degrees and Diplomas for Graduates in Economics, Management, Finance and the Social Sciences,
CALCULATIONS & STATISTICS
CALCULATIONS & STATISTICS CALCULATION OF SCORES Conversion of 1-5 scale to 0-100 scores When you look at your report, you will notice that the scores are reported on a 0-100 scale, even though respondents
PORUCHY A OBNOVA OBALOVÝCH KONŠTRUKCIÍ BUDOV - Podbanské 2012
PORUCHY A OBNOVA OBALOVÝCH KONŠTRUKCIÍ BUDOV Podbanské 2012 CIEĽ A ZAMERANIE KONFERENCIE : Cieľom konferencie je poskytnúť priestor pre prezentovanie nových a aktuálnych výsledkov vedeckej a výskumnej
FORUM STATISTICUM SLOVACUM
6/2007 FORUM STATISTICUM SLOVACUM I S SN 1 3 3 6-7 4 2 0 7 6 9 7 7 1 3 3 6 7 4 2 0 0 1 Slovenská štatistická a demografická spoločnosť Miletičova 3, 824 67 Bratislava www.ssds.sk Naše najbližšie akcie:
APPLICATION OF ANALYTIC HIERARCHY PROCESS METHOD IN THE EVALUATION OF MANAGERS OF INDUSTRIAL ENTERPRISES IN SLOVAKIA
Trendy v podnikání, 5(3) 28-35 The Author(s) 2015 ISSN 1805-0603 Publisher: UWB in Pilsen http://www.fek.zcu.cz/tvp/ APPLICATION OF ANALYTIC HIERARCHY PROCESS METHOD IN THE EVALUATION OF MANAGERS OF INDUSTRIAL
When to Refinance Mortgage Loans in a Stochastic Interest Rate Environment
When to Refinance Mortgage Loans in a Stochastic Interest Rate Environment Siwei Gan, Jin Zheng, Xiaoxia Feng, and Dejun Xie Abstract Refinancing refers to the replacement of an existing debt obligation
Using simulation to calculate the NPV of a project
Using simulation to calculate the NPV of a project Marius Holtan Onward Inc. 5/31/2002 Monte Carlo simulation is fast becoming the technology of choice for evaluating and analyzing assets, be it pure financial
Assessing Credit Risk for a Ghanaian Bank Using the Black- Scholes Model
Assessing Credit Risk for a Ghanaian Bank Using the Black- Scholes Model VK Dedu 1, FT Oduro 2 1,2 Department of Mathematics, Kwame Nkrumah University of Science and Technology, Kumasi, Ghana. Abstract
I.e., the return per dollar from investing in the shares from time 0 to time 1,
XVII. SECURITY PRICING AND SECURITY ANALYSIS IN AN EFFICIENT MARKET Consider the following somewhat simplified description of a typical analyst-investor's actions in making an investment decision. First,
A Robustness Simulation Method of Project Schedule based on the Monte Carlo Method
Send Orders for Reprints to [email protected] 254 The Open Cybernetics & Systemics Journal, 2014, 8, 254-258 Open Access A Robustness Simulation Method of Project Schedule based on the Monte Carlo
Solutions of Linear Equations in One Variable
2. Solutions of Linear Equations in One Variable 2. OBJECTIVES. Identify a linear equation 2. Combine like terms to solve an equation We begin this chapter by considering one of the most important tools
Oscillatory Reduction in Option Pricing Formula Using Shifted Poisson and Linear Approximation
EPJ Web of Conferences 68, 0 00 06 (2014) DOI: 10.1051/ epjconf/ 20146800006 C Owned by the authors, published by EDP Sciences, 2014 Oscillatory Reduction in Option Pricing Formula Using Shifted Poisson
by Maria Heiden, Berenberg Bank
Dynamic hedging of equity price risk with an equity protect overlay: reduce losses and exploit opportunities by Maria Heiden, Berenberg Bank As part of the distortions on the international stock markets
RESEARCH PAPERS FACULTY OF MATERIALS SCIENCE AND TECHNOLOGY IN TRNAVA SLOVAK UNIVERSITY OF TECHNOLOGY IN BRATISLAVA
RESEARCH PAPERS FACULTY OF MATERIALS SCIENCE AND TECHNOLOGY IN TRNAVA SLOVAK UNIVERSITY OF TECHNOLOGY IN BRATISLAVA 2012 Special Number FINANCIAL AND TAX MANAGEMENT IN SMALL AND MEDIUM SIZED INDUSTRIAL
Understanding the market
Understanding the market Technical Analysis Approach: part I Xiaoguang Wang President, Purdue Quantitative Finance Club PhD Candidate, Department of Statistics Purdue University [email protected] Outline
Models of Risk and Return
Models of Risk and Return Aswath Damodaran Aswath Damodaran 1 First Principles Invest in projects that yield a return greater than the minimum acceptable hurdle rate. The hurdle rate should be higher for
Kozmické poasie a energetické astice v kozme
Kozmické poasie a energetické astice v kozme De otvorených dverí, Košice 26.11.2008 Ústav experimentálnej fyziky SAV Košice Oddelenie kozmickej fyziky Karel Kudela [email protected] o je kozmické
Geometric Brownian Motion, Option Pricing, and Simulation: Some Spreadsheet-Based Exercises in Financial Modeling
Spreadsheets in Education (ejsie) Volume 5 Issue 3 Article 4 November 01 Geometric Brownian Motion, Option Pricing, and Simulation: Some Spreadsheet-Based Exercises in Financial Modeling Kevin D. Brewer
Chapter 4 One Dimensional Kinematics
Chapter 4 One Dimensional Kinematics 41 Introduction 1 4 Position, Time Interval, Displacement 41 Position 4 Time Interval 43 Displacement 43 Velocity 3 431 Average Velocity 3 433 Instantaneous Velocity
第 9 讲 : 股 票 期 权 定 价 : B-S 模 型 Valuing Stock Options: The Black-Scholes Model
1 第 9 讲 : 股 票 期 权 定 价 : B-S 模 型 Valuing Stock Options: The Black-Scholes Model Outline 有 关 股 价 的 假 设 The B-S Model 隐 性 波 动 性 Implied Volatility 红 利 与 期 权 定 价 Dividends and Option Pricing 美 式 期 权 定 价 American
ŠTUDIJNÝ ODBOR PRIEMYSELNÉ INŽINIERSTVO NA VYSOKÝCH ŠKOLÁCH FIELD OF STUDY INDUSTRIAL ENGINEERING AT SCHOOLS OF HIGHER EDUCATION
ŠTUDIJNÝ ODBOR PRIEMYSELNÉ INŽINIERSTVO NA VYSOKÝCH ŠKOLÁCH FIELD OF STUDY INDUSTRIAL ENGINEERING AT SCHOOLS OF HIGHER EDUCATION Renáta TURISOVÁ Stela BESLEROVÁ Abstract This paper deals with the field
Monotonicity Hints. Abstract
Monotonicity Hints Joseph Sill Computation and Neural Systems program California Institute of Technology email: [email protected] Yaser S. Abu-Mostafa EE and CS Deptartments California Institute of Technology
Lecture 1: Asset Allocation
Lecture 1: Asset Allocation Investments FIN460-Papanikolaou Asset Allocation I 1/ 62 Overview 1. Introduction 2. Investor s Risk Tolerance 3. Allocating Capital Between a Risky and riskless asset 4. Allocating
Enhancing the Teaching of Statistics: Portfolio Theory, an Application of Statistics in Finance
Page 1 of 11 Enhancing the Teaching of Statistics: Portfolio Theory, an Application of Statistics in Finance Nicolas Christou University of California, Los Angeles Journal of Statistics Education Volume
ADJUSTED INVENTORY MANAGEMENT SYSTEM OF LEVELS OF STRATEGIC GOODS DIFFERENTIATED BY USING THE ABC METHOD
The International Journal of TRANSPORT &LOGISTICS Medzinárodný časopis DOPRAVA A LOGISTIKA ISSN 1451-107X ADJUSTED INVENTORY MANAGEMENT SYSTEM OF LEVELS OF STRATEGIC GOODS DIFFERENTIATED BY USING THE ABC
Volatility Index: VIX vs. GVIX
I. II. III. IV. Volatility Index: VIX vs. GVIX "Does VIX Truly Measure Return Volatility?" by Victor Chow, Wanjun Jiang, and Jingrui Li (214) An Ex-ante (forward-looking) approach based on Market Price
How to Value Employee Stock Options
John Hull and Alan White One of the arguments often used against expensing employee stock options is that calculating their fair value at the time they are granted is very difficult. This article presents
Introduction to Hypothesis Testing
I. Terms, Concepts. Introduction to Hypothesis Testing A. In general, we do not know the true value of population parameters - they must be estimated. However, we do have hypotheses about what the true
Product Mix as a Framing Exercise: The Role of Cost Allocation. Anil Arya The Ohio State University. Jonathan Glover Carnegie Mellon University
Product Mix as a Framing Exercise: The Role of Cost Allocation Anil Arya The Ohio State University Jonathan Glover Carnegie Mellon University Richard Young The Ohio State University December 1999 Product
Four Derivations of the Black Scholes PDE by Fabrice Douglas Rouah www.frouah.com www.volopta.com
Four Derivations of the Black Scholes PDE by Fabrice Douglas Rouah www.frouah.com www.volopta.com In this Note we derive the Black Scholes PDE for an option V, given by @t + 1 + rs @S2 @S We derive the
There are 6 base years in China GDP estimation history. The base year of 1952-1956
Improvement in Real GDP Estimation by Production Approach Zhang Dongyou 1. Summarize As GDP estimation at current price, production approach for China GDP estimation at constant price which based on National
Management of agricultural production in the conditions of information society
Management of agricultural production in the conditions of information society Riadenie poľnohospodárskej výroby v podmienkach informačnej spoločnosti A. LÁTEČKOVÁ, M. KUČERA Slovak University of Agriculture,
Article from: Risk Management. June 2009 Issue 16
Article from: Risk Management June 2009 Issue 16 CHAIRSPERSON S Risk quantification CORNER Structural Credit Risk Modeling: Merton and Beyond By Yu Wang The past two years have seen global financial markets
How To Price A Call Option
Now by Itô s formula But Mu f and u g in Ū. Hence τ θ u(x) =E( Mu(X) ds + u(x(τ θ))) 0 τ θ u(x) E( f(x) ds + g(x(τ θ))) = J x (θ). 0 But since u(x) =J x (θ ), we consequently have u(x) =J x (θ ) = min
LOGISTIC REGRESSION ANALYSIS
LOGISTIC REGRESSION ANALYSIS C. Mitchell Dayton Department of Measurement, Statistics & Evaluation Room 1230D Benjamin Building University of Maryland September 1992 1. Introduction and Model Logistic
