Joint f test in stata forex
Estou tentando fazer um teste F sobre o significado conjunto de efeitos fixos (variáveis dummy individuais específicas) em uma regressão OLS de dados de painel (em R), no entanto, não encontrei uma maneira de conseguir isso por um grande número de efeitos fixos . Idealmente, eu usaria uma função no pacote plm, no entanto, não encontrei nada que especifique especificamente esse teste. Isso é algo que o Stata faz automaticamente ao usar o comando xtreg, fe. Em Stata, os resultados se parecem com isto: Novamente, estou tentando reproduzir o resultado Stata em R para um grande número de variáveis falsas, talvez especificadas por fator (us. state) usando lm () ou modelo fe usando plm (). Aqui está um exemplo reproduzível: o que é equivalente ao seguinte dentro da regressão usando o pacote plm. Assim, o teste seria o teste de que todas as variáveis dummy do estado são conjuntamente diferentes de zero (conjuntamente significativo). Esta é uma restrição linear no modelo irrestrito (reg1 e reg1.fe acima). Este teste F é melhor explicado no documento a seguir (ver slides 5-7). Aqui está uma das minhas fracas tentativas de criar uma matriz R para o teste F com hipótese nula: Rb q onde b é a matriz de coeficientes (beta hat) e q é um vetor de zeros. Isso não funciona E, eu espero que haja uma abordagem simplificada para testar a significância conjunta de todas as variáveis dummy de efeito fixo. Primeiro, gostaria de sugerir que sua pergunta poderia ser melhorada por (1) fornecendo um exemplo reprodutível e (2) descrevendo o teste preciso ao qual você se refere ao dizer F teste. Um link para o Stata docs talvez F seja a distribuição, então pode haver um teste de gazillion chamado teste F. Se o seu interesse substantivo reside na determinação de se o modelo de efeitos fixos se adequa aos dados significativamente melhor que o OLS sem efeitos fixos, você sempre pode usar um teste de razão de verossimilhança. Tenho certeza de que existem muitas implementações em R, mas a fornecida pelo pacote lmtest é bastante conveniente. Heres um exemplo usando um conjunto de dados distribuído com o pacote plm (você parece ter instalado isso, então deve ser fácil de tentar). Eu acho que a função pFtest () do plm39s pode fazer o que você deseja (veja a resposta editada). O resultado não é exatamente o mesmo que a saída do Stata, provavelmente devido ao fato de que o primeiro parâmetro da distribuição F é diferente. Mas quando eu coloco ambos os modelos individualmente com lm (), obtenho graus de liberdade de 543 e 498 (diferença de 45), então R parece estar aqui. Veja se você obtém os mesmos graus de liberdade na Stata quando se encaixa no pool e nos modelos individualmente. O problema com software fechado como o Stata é que nunca saberemos exatamente como eles calculam o teste F. Ndash Vincent 30 de maio 11 às 3:50 Eu realmente não acho que este teste seja útil. Em vez de estimar o que você chama de efeito fixo (Ill chamar modelo de não-agrupamento), por que não um modelo hierárquico O modelo hierárquico (ou modelo de agrupamento parcial) permitirá que suas estimativas diminuam para o significado comum para os estados, mas sem impor Eles sejam iguais. Mais importante, se você precisar avaliar quanto estados variam, você precisará usar a variância estimada entre estado e intra-estado. Se a variância entre o estado for baixa (perto de zero), você não está ganhando muito usando um modelo hierárquico e as interceptações são aproximadamente iguais. Se a variância for muito grande (no limite, quando vai para o infinito), o modelo hierárquico adiciona pouco e você pode executar um modelo separado para cada estado. Você pode estimar um modelo hierárquico em R com o pacote lme4. Usando seus dados: o desvio padrão estimado da intercepção por estados é 4.39 e o desvio padrão por indivíduo é 4.19. Uma maneira realmente boa de encontrar periodicidade em qualquer série regular de dados é inspecionar seu espectro de poder depois de remover qualquer tendência geral. (Isso se dá bem à triagem automática quando a potência total é normalizada para um valor padrão, como a unidade.) A remoção da tendência preliminar (e a diferenciação opcional para remover a correlação em série) é essencial para evitar períodos de confusão com outros comportamentos. O espectro de potência é a discreta transformada de Fourier da função de autocovariância de uma versão adequadamente suavizada da série original. Se você pensa na série temporal como amostragem de uma forma de onda física, você pode calcular quanto da potência total das ondas é carregada dentro de cada freqüência. O espectro de potência (ou periodograma) traça a potência versus a freqüência. Os padrões cíclicos (isto é, repetitivos ou sazonais) aparecerão como picos grandes localizados em suas freqüências. Por exemplo, considere esta série de tempo (simulada) de resíduos de uma medida diária tomada por um ano (365 valores). Os valores flutuam em torno de 0 sem tendências evidentes, mostrando que todas as tendências importantes foram removidas. A flutuação parece aleatória: nenhuma periodicidade é aparente. Este é outro gráfico dos mesmos dados, desenhado para nos ajudar a ver possíveis padrões periódicos. Se você parece muito difícil, você pode discernir um padrão ruidoso, mas repetitivo, que ocorre 11 a 12 vezes. As sequências longish de valores acima-zero e abaixo de zero, pelo menos, sugerem alguma autocorrelação positiva, mostrando que esta série não é completamente aleatória. É o período, mostrado para freqüências até 91 (um quarto do comprimento total da série). Foi construído com uma janela Welch e normalizado para a área da unidade (para todo o periodograma, não apenas a parte mostrada aqui). O poder parece um ruído branco (pequenas flutuações aleatórias) mais dois pontos proeminentes. Eles são difíceis de perder, não são maiores. O maior ocorre em um período de 12 e o menor em um período de 52. Esse método detectou um ciclo mensal e um ciclo semanal nesses dados. Isso é realmente tudo aí. Para automatizar a detecção de ciclos (sazonalidade), basta escanear o periodograma (que é uma lista de valores) para máximos locais relativamente grandes. É hora de revelar como esses dados foram criados. Os valores são gerados a partir de uma soma de duas ondas de seno, uma com freqüência 12 (de amplitude quadrada 34) e outra com freqüência 52 (de amplitude quadrada 14). Estes são os pontos detectados pelos pontos no período. Sua soma é mostrada como a curva preta grossa. Iid O ruído normal da variância 2 foi então adicionado, como mostrado pelas barras cinza claro que se estendem da curva preta para os pontos vermelhos. Este ruído introduziu os movimentos de baixo nível na parte inferior do periodograma, o que de outra forma seria apenas um plano 0. Totalmente dois terços da variação total nos valores não é periódico e aleatório, o que é muito ruidoso: é por isso que é Tão difícil de distinguir a periodicidade apenas olhando os pontos. No entanto (em parte porque há tantos dados) encontrar as freqüências com o periodograma é fácil e o resultado é claro. Instruções e bons conselhos para periodogramas de computação aparecem no site das Receitas Numéricas: procure a seção sobre estimativa do espectro de potência usando a FFT. R possui código para estimativa de periodograma. Essas ilustrações foram criadas no Mathematica 8, o periodograma foi calculado com sua função de Fourier. Respondido no dia 28 de setembro às 16h38. O pressuposto da remoção de qualquer tendência geral do Aquiles Heel, pois pode haver muitas tendências temporais, muitas mudanças de nível, todas as quais foram excluídas no seu exemplo. A idéia de que as séries de entrada são de natureza determinística voa no Face da possível presença de estrutura ARIMA sazonal e regular. Os valores inusitados não tratados de uma única vez distorcerão qualquer esquema de identificação baseado em periodograma devido a um viés descendente para as estimativas de periodograma que não significam. Se os efeitos semanais e mensais mudaram em algum momento do passado, o procedimento baseado em periodograma falharia ndash IrishStat Sep 29 11 às 0:06 Irlandês Eu acho que seu comentário pode exagerar um pouco. É primordial procurar e tratar quotUnusual One-Time Valuesquot (também conhecido como outliers), portanto, isso apenas explica que enfatizar que alguns estimadores de séries temporais podem ser sensíveis a outliers. Diminutiva na natureza, representa erroneamente as ideias básicas: ninguém supõe que exista determinismo (como evidenciado pela enorme quantidade de ruído na simulação). A simulação incorpora um sinal periódico definido como um modelo - sempre aproximado na realidade - apenas para ilustrar a conexão entre periodograma e sazonalidade. (Continuação.) Ndash whuber 9830 29 de setembro 11 às 16:41 Sim, as mudanças na sazonalidade podem obscurecer o periodograma (e o acf, etc.), especialmente mudanças na freqüência (improvável) ou na fase (possível). As referências na minha publicação fornecem uma solução para lidar com isso: eles recomendam usar uma janela em movimento para a estimativa de periodograma. É uma arte para isso, e claramente há armadilhas, de modo que muitas análises de séries de tempo se beneficiarão de um tratamento especializado, como você defende. Mas a pergunta pergunta se existem outros métodos para detectar sazonalidade e, sem dúvida, o periodograma é uma opção estatisticamente poderosa, computacionalmente eficiente e facilmente interpretável. Ndash whuber 9830 29 de setembro 11 às 16:46 No meu mundo, usar sinescosines são efeitos quantitativos muito semelhantes aos indicadores do mês do ano. Ajustar qualquer modelo pré-especificado restringe os valores ajustados a um padrão especificado pelo usuário, muitas vezes sub-padrão. Os dados devem ser citados como ajudando o software de computador avançado a analisar efetivamente entre entradas fixas e estocásticas n. b. Eu me refiro a ARIMA atrasa estruturas como quotdrivers estocástico ou adaptativo à medida que os valores ajustados se ajustam às mudanças na história da série. Na minha opinião, a utilização do período de quotoversellsquot simples modelagem estatística ndash IrishStat 29 de setembro 11 às 17:44 whuber Repetir o mesmo pode não ser útil. No entanto, também pode ser bom corrigir o parágrafo abaixo do periodograma para dizer que as espinhas estão localizadas em uma quantidade de frequência de 12 e 52 vezes por ano, e não quotperiod ofquot. Reparar a trama também para dizer quotfrequencyquot em vez de quotperiodquot pode ser bom também se você acha que isso não é muito irritante. Ndash Celelibi 11 de outubro 16 às 15:29 A sazonalidade pode e muitas vezes muda ao longo do tempo, portanto, as medidas de resumo podem ser bastante inadequadas para detectar a estrutura. É preciso testar a transitoriedade nos coeficientes de ARIMA e, muitas vezes, mudar os dummies sazonais. Por exemplo, em um horizonte de 10 anos, pode ter ocorrido o efeito de junho nos primeiros k anos, mas nos últimos 10 k anos, há evidências de um efeito em junho. Um simples efeito composto de junho pode não ser significante, pois o efeito não foi constante ao longo do tempo. De forma semelhante, um componente ARIMA sazonal também pode ter mudado. Deve-se ter cuidado para incluir mudanças no nível local e tendências do tempo local, garantindo que a variância dos erros permaneceu constante ao longo do tempo. Não se deve avaliar transformações como quadrados mínimos GLSweighted ou transformações de energia como raízes logsquare, etc. nos dados originais, mas nos erros de um modelo tentativo. Os pressupostos gaussianos não têm nada a ver com os dados observados, mas todos com os erros do modelo. Isto é devido aos fundamentos dos testes estatísticos que utilizam a proporção de uma variável do qui-quadrado não central para uma variável do qui-quadrado central. Se você quisesse publicar uma série de exemplos do seu mundo, ficaria feliz em fornecer a você e à lista uma análise detalhada que levaria à detecção da estrutura sazonal. Respondeu 27 de setembro às 18h36 A resposta de Charlies é boa, e é aí que o Id começa. Se você não quiser usar gráficos ACF, você poderia criar variáveis dummy k-1 para os períodos de tempo K presentes. Então você pode ver se as variáveis dummy são significativas em uma regressão com as variáveis dummy (e provavelmente um termo de tendência). Se o seu dado for trimestral: o Q2 do manequim é 1 se este for o segundo trimestre, senão 0 qummy Q3 é 1 se este for o terceiro trimestre, caso contrário, o Q4 do manequim é 1 se este for o quarto trimestre, senão 0 Nota, o quarto trimestre é o Caso base (todos os 3 manequins zero) Você também pode verificar a decomposição de séries temporais no Minitab - muitas vezes chamado de decomposição clássica. No final, você pode querer usar algo mais moderno, mas este é um lugar simples para começar. Respondeu 27 de setembro 11 às 18:53 Eu sou um pouco novo para R, mas minha compreensão da função ACF é que, se a linha vertical vai acima da linha tracejada superior ou abaixo da linha tracejada inferior, há alguma autoregressão (incluindo sazonalidade) . Tente criar um vetor de sine respondeu Sep 27 11 às 15:47 Ajustando sinescosinas etc pode ser útil para algumas séries físicas elétricas, mas você deve estar ciente de MSB. Especificação do modelo Bias. Ndash IrishStat Sep 28 11 às 14:31 Autoregression não implica sazonalidade. Ndash Jens 22 nov 13 às 12:32 Sua resposta 2017 Stack Exchange, Inc
Comments
Post a Comment