Ciência e Agrotecnologia (Feb 2003)
Definição do tamanho amostral usando simulação Monte Carlo para o teste de normalidade baseado em assimetria e curtose. II.: abordagem multivariada Sample size definition using Monte Carlo simulation for the normality test based on skewness and kurtosis. II.: multivariate approach
Abstract
Realizou-se este trabalho com o objetivo de determinar um tamanho amostral ótimo para as estatísticas univariadas de assimetria e curtose (z1 e z2) que, neste caso, foram adaptadas para o caso multivariado, e as estatísticas multivariadas de assimetria e curtose (k1 e k2) com base em simulação. Foram geradas diferentes funções densidade probabilidade multivariadas via método de Monte Carlo para avaliar a taxa de erro tipo I e o poder do teste para os valores nominais de 5% e 1%. Foram avaliadas as situações com p=2, 3, 4 e 5 variáveis, com diferentes estruturas de correlação. Para o caso multivariado, as diferentes estruturas de correlação não afetaram o poder e a taxa de erro tipo I dos testes; a estatística k2 é adequada para uso a partir de n> 50 para valores nominais de significância de 5% ou 1%; a estatística k2 é assintoticamente adequada para os testes de desvios de curtose para n> 100, independentemente dos valores nominais da significância. Pode-se concluir que as estatísticas de assimetria, em geral, são mais poderosas do que as de curtose, mas os testes da hipótese nula de normalidade multivariada devem considerar tanto os testes de desvios de assimetria como os de curtose conjuntamente, como sugerido no caso univariado.This work aimed to determine optimum sample size for the univariate skewness and kurtosis statistics (z1 and z2) adapted to multivariate situation and for the multivariate skewness and kurtosis statistics (k1 and k2) statistics based on simulation. Different probability density functions, univariate and multivariate, were generated by Monte Carlo simulation method to evaluate the type I error rates and the power of the tests. The simulations were done adopting the nominal significance level of 5% and 1%. Situations with p=2, 3, 4 and 5 variables with different correlation structures were evaluated in the case of multivariate distributions. The results showed that k1 statistics is adequate for n> 50, at nominal levels of significance of 5 or 1%; different correlation structured do not affect the power and the type I error rates, the k2 statistics is asymptotically appropriate for kurtosis deviation tests for n> 100, independently of the nominal values of the significance. The skewness statistics, in general, were shown to be more powerful than those of kurtosis, however, the null hypothesis tests of normality must consider both tests jointly, as suggested in the univariate case.
Keywords