Eu vejo o seguinte como um exercício de programação, ao invés de uma maneira estatisticamente fundamentada de fazer as coisas. Basicamente, eu gosto de executar N regressões logísticas com uma variável preditor e, em seguida, para cada variável, armazene o nome da variável com seu valor qui-quadrado. Depois que todas as previsões são feitas, eu quero mostrar cada variável de preditor ordenada por chi-quadrado do mais alto para o mais baixo. Até agora eu tenho o seguinte: como eu classificaria cada variável pelo qui-quadrado retornado na última linha e depois exibiria a lista de variáveis com o seu chi-quadrado ordenado desde o qui-quadrado mais alto ao mais baixo chi-quadrado. Para ser claro, Se as seguintes variantes resultaram do acima: então eu gostaria de obter algo como o seguinte: Existe uma suposição no meu método de que o número de variáveis que está sendo usado não é maior que o número de observações. Se isso estivesse errado, haveria algum ponto em usar um arquivo externo, mas presumivelmente a modelagem wouldn39t então funcionaria. Caso contrário, não posso ver nenhum ponto em usar outro arquivo. Há alguma estranheza em ter variáveis não alinhadas com outras pessoas. Poderia haver alguma atração em usar gsort para evitar a estranheza de negar os resultados do qui-quadrado e negá-los novamente após o ordenamento. (Classificar primeiro o menor) ndash Nick Cox 20 de abril 13 às 8: 15Bem respeito ao Instituto de Pesquisa e Educação Digital Stata Class Notes Contando de n para N Introdução A Stata possui duas variáveis incorporadas chamadas n e N. N é a notação Stata para o número de observação atual. N é 1 na primeira observação, 2 no segundo, 3 no terceiro, e assim por diante. N é a notação de Stata para o número total de observações. Vamos ver como n e N funcionam. Como você pode ver, o ID da variável contém o número de observação que corre de 1 a 7 e nt é o número total de observações, que é 7. Contar com o uso de n e N em conjunto com o comando by pode produzir alguns resultados muito úteis. Claro, para usar o comando por nós, primeiro devemos classificar nossos dados na variável por. Agora n1 é o número de observação dentro de cada grupo e n2 é o número total de observações para cada grupo. Para listar a pontuação mais baixa para cada grupo, use o seguinte: Para listar a pontuação mais alta para cada grupo, use o seguinte: Outro uso de n Permite usar n para descobrir se há números de identificação duplicados nos seguintes dados: As observações 6 e 7 têm os mesmos números de identificação e valores de pontuação diferentes. Encontrando Duplicados Agora, use N para encontrar observações duplicadas. Neste exemplo, classificamos as observações por todas as variáveis. Em seguida, usamos toda a variável na instrução by e configuramos n igual ao número total de observações que são idênticas. Finalmente, listamos as observações para as quais N é maior que 1, identificando as observações duplicadas. Se você tem muitas variáveis no conjunto de dados, pode demorar muito tempo para digitá-las duas vezes. Podemos fazer uso do curinga para indicar que desejamos usar todas as variáveis. Além disso, nas versões mais recentes do Stata podemos combinar classificar e em uma única declaração. Abaixo está uma versão simplificada do código que renderá exatamente os mesmos resultados acima. O conteúdo deste site não deve ser interpretado como um endosso de qualquer site, livro ou produto de software específico da Universidade da Califórnia.
No comments:
Post a Comment