Ciência e Agrotecnologia (Apr 2003)
Definição do tamanho amostral usando simulação Monte Carlo para o teste de normalidade baseado em assimetria e curtose: I. Abordagem univariada Definition of the sample size by using Monte Carlo simulation for the normality test based on skewness and kurtosis coefficients: I. Univariate approach
Abstract
Uma forma alternativa para verificar suposição de normalidade dos dados, refere-se à aplicação de testes baseados nos coeficiente de assimetria e curtose. Realizou-se este trabalho com o objetivo de determinar um tamanho amostral ótimo para as estatísticas univariadas (Z1 e Z2) e multivariadas (K1 e K2) que, neste caso, foram consideradas como univariadas, com base em simulação. As estatísticas Z1 e K1 estão associados às medidas de simetria e K2 e K2 às de curtose. Foram geradas diferentes funções de densidade de probabilidade univariadas, via método de Monte Carlo, com a finalidade de avaliar o erro tipo I e o poder do teste. As simulações foram feitas adotando-se os níveis de probabilidade de 5% e 1%. O critério de avaliação, no caso univariado, foi o da comparação das taxas de poder estimadas com o valor das taxas de poder empírico obtidas pelo teste de Shapiro & Wilk (1965). Pelos resultados, verificou-se que as estatísticas Z1 e Z2 possuem aproximação assintótica normal para n>25, com α =5% e podem ser recomendadas para uso rotineiro no caso univariado para testar a hipótese de normalidade dos dados; as estatísticas K1 e K2 possuem aproximações assintóticas melhores que Z1e Z2 para um menor valor do nível nominal de significância, sendo recomendadas para n>25 e n>100, respectivamente, garantindo-se o controle da taxa de erro tipo I e um alto poder. No caso de distribuições com simetria próxima de zero e não-normais, as estatísticas baseadas em desvios de simetria apresentam maior poder do que a estatística W de Shapiro-Wilk. Finalmente, pode-se concluir que a estatística de assimetria, em geral, é mais poderosa do que à de curtose, mas os testes da hipótese nula de normalidade devem considerar tanto os testes de desvios de simetria como os de curtose conjuntamente.An alternative form to verify assumption of data normality is concerned with the application of the tests based on skewness and kurtosis coefficients. The objective of this work was to determine an optimum sample size for the univariate (Z1 and Z2) and multivariate (K1 and K2) statistics on basis of simulation. The Z1 and Z2 statistics are related to the skewness and the Z1 and Z2 are related to the kurtosis. Different univariate probability density functions were generated, by Monte Carlo simulation method with a view to calculating the type I error rates and the power of the test. The simulations were done by adopting the probability level of 5% and 1%. The evaluation criterion in the univariate case was that of the comparison of the rates obtained through the value of the rates of empirical power obtained by Shapiro & Wilk (1965) test. By considering the univariate case, it was found that the Z1e Z2 statistics possess normal asymptotic approximation for n>25 and α=5% can be recommended for routine use in the univariate case. The K1 and K2 statistics possess approximation asymptotic better than Z1 and Z2 for a lower value of the nominal value of significance, recommended for n>25 and n>100, respectively, warranting the compromise with the control of the type I error rate and elevated power. In the case of symmetry distributions with efficient of skewness close to zero and non-normal, the statistics based on skewness deviations present higher power than Shapiro - Wilk's W statistics. It is concluded that the skewness statistic in general, is more powerful than that of kurtosis, but the tests of the null hypothesis of normality must take into account both the tests of skewness deviations and those of kurtosis jointly.
Keywords