Saturday, 11 November 2017

Renomeando muitas variáveis no stata forex


Em Stata, eu tenho um conjunto de variáveis ​​que começam com pkg. Em seu estado atual, suas terminações são numéricas: pkg1, pkg2, pkg3, pkg4, etc. Preciso mudar todas essas variáveis ​​para as seqüências de caracteres: pkgmz, pkggmz, pkgsp, pkgsptc, etc. Eu tenho uma coluna dessas seqüências de caracteres que Posso designar como uma lista local, por exemplo: minha pergunta é como eu altero os terminais numéricos para os terminais de seqüência de caracteres. O meu adivinho no código segue. O . Indica onde estou perplexo: me pergunto se seria melhor utilizar o comando regexr (), mas não consigo pensar em uma maneira de incluí-lo. Aprecie qualquer ajuda. Pediu 3 de dezembro 12 às 2:03 Não há necessidade de invocar expressões regulares. Você tem os novos sufixos, o prefixo pkg é sempre o mesmo, então o trabalho de extração repetidamente é desnecessário. O coração do problema é andar de bicicleta ao longo de duas listas ao mesmo tempo. Aqui está uma maneira de consertar seu código. Note também renomear no Stata 12 pode lidar com este regexr () é uma função, não um comando uma discussão mais geral em stata-journalsjpdf. htmlarticlenumpr0009 (um pouco desactualizado, mas relevante na questão principal) você tem uma cotação demais Marcas no seu comando de renomeação, por isso não funcionaria. Respondeu Dec 3 12 às 7:21 Nick Cox Você mencionou que o comando renomear no Stata 12 pode lidar com isso. É possível fazê-lo em um único comando de renomeiro, publiquei uma resposta com algumas opções usando o novo comando, mas não consegui descobrir se era possível usar uma única chamada. Ndash Michael A 18 de junho 15 às 22:26 Michael A É possível fazê-lo com um comando, mas a única resposta que me ocorre não é atraente. Renomear (pkg1-pkg9) (pkgmz pkggmz pkgsp pkgsptc pkgmil pkgcof pkgsuk pkgtea pkgric) Ainda assim, continua a ser verdade que as pessoas passarão minutos tentando pensar um truque inteligente quando os nomes poderiam ter sido digitados em segundos. Ndash Nick Cox 19 de junho 15 às 11:00 Aqui está outra maneira de fazê-lo. Tokenize coloca palavras separadas em macros numeradas 1. A referência aninhada j é tratada apenas na álgebra elementar: avalie primeiro a referência macro interna. Ben perguntou em um comentário sobre os contadores de incremento realizados em macros locais. Statas macros locais são, em geral, para segurar cordas, caracteres de cadeia podem ser numéricos, portanto, manter números é um caso especial, mas naturalmente muito útil. Esta discussão sozinha mostrou vários exemplos. Isso ajuda a manter essa história em mente. Uma sintaxe de longa data é baseada nos formulários O primeiro formulário copia para macname enquanto o segundo formulário é avaliado antes de atribuir os resultados ao macname. A maneira principal de incrementar contadores foi para várias versões agora é permitida. No entanto, embora permitido não funcionará como você pode esperar, embora o que aconteça seja consistente com a primeira sintaxe para macros. Então, se isso parece um pouco estranho dado o seu histórico, isso é compreensível, mas as macros locais foram destinadas ao processamento de cordas, e não à aritmética. A Mata é muito mais popular neste aspecto. Eu escrevi um tutorial sobre loops e macros em Cox, N. J. 2002. Como enfrentar listas com força. Stata Journal 2 (2): 202-222 que é acessível a todos em As of Stata 12, renomear pode lidar com este caso de várias maneiras. Este método cria uma nova nova coleção de macro contendo nomes de variáveis ​​pkgmz pkggmz pkgsp pkgsptc pkgmil pkgcof pkgsuk pkgtea pkgric. Em seguida, usa renomear para renomear variáveis ​​seguindo o padrão pkgltdigitsgt para os nomes especificados em newcroplist. Os números que seguem o pkg não precisam ser consecutivos. Um segundo método usa a nova função de renomeação duas vezes como antes, isso não requer números consecutivos nos nomes originais. O primeiro comando muda as variáveis ​​do padrão pkgltdigitsgt para os nomes especificados em croplist. O segundo comando adiciona o prefixo pkg aos novos nomes de variáveis. Em ambos os casos e, em geral, ao usar o comando renomear (denominado grupo renomeado na documentação Statas), o número de nomes de variáveis ​​antigas deve corresponder ao número de novos nomes de variáveis, portanto, certifique-se de que o número de variáveis ​​combinadas com pkg corresponde O número de novos nomes especificados em croplist. Respondeu 18 de junho 15 às 22:20 Sua resposta 2017 Stack Exchange, IncPara perguntas rápidas, envie um email para dataprinceton. edu. Não há appts. Necessário durante horas walk-in. Nota: o laboratório DSS está aberto enquanto o Firestone estiver aberto, sem compromissos necessários para usar os computadores do laboratório para sua própria análise. Dados, conjuntos de dados e variáveis ​​Gerenciamento de dados Configurando o diretório de trabalho, arquivo de log, abrindo um arquivo de dados Stata, sistema de codificação de cores Stata, renomeando, recodificando e criando novas variáveis, droping cases, excluindo variáveis, mesclagem, anexos, freqüências, crosstabulations e estatísticas descritivas, clique aqui Arquivos de dados Um conjunto de dados é apenas um arquivo em que as linhas representam observações e as colunas representam variáveis. Por exemplo, uma observação pode ser um carro, e as variáveis ​​seriam informações sobre o carro, como a marca, o comprimento, o preço e a relação de transmissão: se os dados já estiverem no formato de arquivo proprietário da Statas, ele terá o Extensão dta. Por exemplo mydata. dta. Os dados neste formato podem ser lidos diretamente no Stata com o comando de uso. Se a Stata lhe fornecer a mensagem de erro quando você tenta abrir um arquivo de dados, veja aqui para obter informações sobre como solucionar o problema. A Stata pode ler conjuntos de dados em vários formatos de texto, bem como no formato proprietário Statas. Muitas vezes, você começará com dados em formato de texto, lê-lo em Stata e salvá-lo no formato Stata. Você também pode encontrar dados em vários outros formatos. Por exemplo, os dados de determinados arquivos de dados geralmente são formatados para o pacote estatístico SPSS. Um programa chamado DBMSCopy. Disponível no laboratório DSS, bem como em máquinas Windows nos clusters públicos da OIT, pode converter dados do SPSS e de muitos outros formatos para o formato Stata de forma rápida e fácil. Um formato de texto comum é o arquivo delimitado. Os arquivos delimitados são mais comumente delimitados por tabulações ou vírgulas. Isso significa apenas que as variáveis ​​em cada observação são inseridas uma após a outra em uma linha e separadas por guias ou vírgulas, enquanto as observações são separadas por retornos rígidos. O exemplo acima é realmente como um arquivo de texto delimitado por vírgulas seria exibido se aberto no Word. A sintaxe de comando para ler em um arquivo delimitado por tabulação ou vírgula é: onde o nome do arquivo é o nome do arquivo que contém os dados delimitados por tabulações ou vírgulas. A planilha é usada frequentemente para ler planilhas salvas como arquivos csv (delimitados por vírgulas) de um pacote como o Excel. Tenha em atenção que uma folha de cálculo precisa ser colocada de forma amigável com Stata antes que a Stata possa lê-la adequadamente. A falta de fazê-lo pode causar dores de cabeça. Para obter mais detalhes, consulte Há dois comandos que não sejam inspeção - infiltrar e infixar - que lê outros tipos de arquivos de texto menos comuns. Se você tiver dados delimitados por espaço, dados de largura fixa, ou encontrar um dicionário de dados Stata. Veja Você pode usar o comando Stata save para salvar um arquivo no formato Stata: onde filename é o nome do seu arquivo Stata. Por exemplo: salvará um arquivo Stata chamado myfile. dta. Este arquivo pode ser lido no Stata com o comando de uso. Observe que a extensão de arquivo. dta é anexada automaticamente aos arquivos Stata. Você não precisa incluir a extensão do arquivo nos comandos de uso ou salvar. Se você já possui um arquivo Stata chamado myfile. dta e deseja salvar uma versão atualizada do arquivo com o mesmo nome, use o comando Stata save com a opção de substituição, como em: where filename é o nome do arquivo que deseja Para substituir, por exemplo, Para salvar uma versão atualizada do arquivo ativo, você pode simplesmente digitar: Este comando destruirá a versão anterior do seu arquivo, então use a opção de substituição somente se tiver certeza de que não precisará da versão anterior do seu arquivo. Não há como recuperar seu arquivo original, uma vez que outro arquivo escreveu sobre ele. Valores faltantes Às vezes, uma variável está faltando para algumas observações. (Missing significa que não há valor - a pessoa não respondeu a pergunta da pesquisa, ou os dados não podem ser adquiridos por algum outro motivo.) No Stata, os valores em falta nas variáveis ​​numéricas são representados por um período (.). As observações com valores em falta são deixadas fora das tabelas produzidas pela aba, e também são deixadas fora das regressões. Eles aparecem como períodos no navegador de dados stata e são representados por períodos em comandos. Os valores das seqüências de caracteres ausentes aparecem como células em branco no navegador e são representados nos comandos por duas alianças duplas sem nada entre eles (). O que queremos dizer, representado nos comandos, terá mais sentido um pouco mais tarde. Lembre-se de que, se você estiver salvando dados do Excel, os valores em falta devem ter sido deixados em branco para a Stata reconhecê-los como ausentes. Tipos de variáveis ​​de stata Existem dois tipos de variáveis ​​em Stata: numérico e seqüência de caracteres. Um terceiro tipo, data, é realmente um tipo especial de numérico, como veremos. As variáveis ​​numéricas são simples - elas contêm números. As variáveis ​​de string contêm texto que pode conter qualquer caractere no teclado: letras, números e caracteres especiais. Em auto3, make é uma variável de string - todas as outras são numéricas. Podemos fazer cálculos numéricos e análise estatística em variáveis ​​numéricas - não podemos usar variáveis ​​de string. As variáveis ​​de string geralmente são usadas como identificadores para a observação. Uma das variáveis ​​numéricas, data, pretende representar uma data - dizemos que era a data em que os dados sobre cada carro foram coletados. Em Stata, as datas são números que representam o número de dias desde 1º de janeiro de 1960. Representar datas como números dessa maneira nos permite fazer cálculos sobre eles, como medir o tempo entre duas datas. Mas parece estranho, e a Stata tem uma maneira simples de tornar as variáveis ​​de datas parecidas com as datas: (O comando de formato tem outros usos, que você pode ver digitando o formato de ajuda.) Você pode usar o comando di juntamente com a função d () Para exibir o valor do Stata de qualquer data: para obter mais informações sobre como o Stata lida com datas e dados de tempo, consulte Dados da Série de Tempo em Convenções de Nomenclatura de Variáveis ​​Stata. As regras para nomear variáveis ​​em Stata são simples: Stata é sensível a maiúsculas e minúsculas, então usando tudo mais baixo Letras maiúsculas em nomes variáveis ​​é uma boa idéia. Eles não podem conter mais de 32 caracteres. Eles podem conter letras, números ou sublinhados (). Espaços ou outros caracteres especiais (como ,,, etc.) não são permitidos. O primeiro caractere deve ser uma letra ou um sublinhado, e não um número. Iniciando nomes de variáveis ​​com underscores é uma idéia muito ruim, já que as variáveis ​​incorporadas do Statas começam com um sublinhado. Renomeando Variáveis ​​Alterar um nome de variáveis ​​em Stata é fácil com o comando rename: copie 2007 The Trustees of Princeton University. Todos os direitos reservados. Dataprinceton. edu NOTA: A informação é para a Universidade de Princeton. Sinta-se livre para usar a documentação, mas não podemos responder perguntas fora de Princeton Esta página foi atualizada pela última vez em:

No comments:

Post a Comment