Antes do começar a fazer qualquer análise estatística é importante que o banco de dados esteja adequadamente formatado, isto é, os dados devem estar devidamente organizados e identificados. Para tanto, o SPSS é dividido em duas abas:
cada linha deve identificar um único caso / sujeito;
cada coluna uma variável (pergunta do questionário).
Nunca utilize símbolos como “-“, “.”, ">", "<" e ”/” no lugar de uma informação.
A primeira coluna (Name) apresenta o nome da variável. Dê dois cliques para redigitar.
Para nomear uma variável utilize 8 dígitos no máximo e não utilize espaço em branco, nem os símbolos “-“, “.” e ”/”. O SPSS também não permite que o nome de uma variável comece com um número.
A segunda coluna (Type) define o tipo de variável. Clique na célula a ser alterada e em seguida em "..." para selecionar a melhor opção;
Para cada variável deve constar a opção "Numeric" se os dados da variável forem numéricos, "String" se for alfa-numérica (texto) ou a opção que melhor se enquadrar. Preferencialmente, use sempre a modalidade "Numeric", inclusive para variáveis categóricas, criando-se um código para as categorias.
A terceira coluna (Width) define o número máximo de caracteres que podem ser digitados. Clique na célula para alterar;
A quarta coluna (Decimals) define o número de casas decimais a serem apresentadas. Clique na célula para alterar;
Mesmo que o número de casas decimais esteja definido em 2, por exemplo, o SPSS irá utilizar nos cálculos todas as casas decimais disponíveis.
Na quinta coluna (Label) é possível digitar um nome mais completo, uma expressão ou uma observação para a variável. Dê dois cliques para redigitar.
Na sexta coluna (Values) é possível identificar as categorias codificadas. Clique na célula a ser alterada e em seguida em "...", uma nova janela será aberta: Value Labels;
É conveniente registrar no banco de dados os nomes das categorias de variáveis categóricas. Por exemplo, para a variável sexo os códigos poderiam ser: 0 - masculino e 1 - feminino (conforme apresentado ao lado).
Na sétima coluna (Missing) é possível definir as respostas que não se deseja incluir nas análises como, por exemplo, códigos para falta de respostas ou perguntas que não se aplicam. Clique na célula a ser alterada e em seguida em "...", uma nova janela será aberta: Missing Values;
A oitava coluna (Columns) define a largura da coluna onde se encontra a variável na aba Data View;
A nona coluna (Align) define o alinhamento da coluna onde se encontra a variável na aba Data View;
Por fim, mas não menos importante, na décima coluna (Measure), deve-se definir adequadamente o tipo de variável, onde deve consta "Scale" para as variáveis quantitativas e "Nominal" ou "Ordinal" para as variáveis categóricas.
A correta definição do tipo de variável é de extrema importância, pois além de influenciar na tomada de decisão das opções de análise pode também ser o motivo de erros na realização das mesmas.
Janela "Values Labels"
Para a variável SEXO, por exemplo:
Em Value, digite "0";
Em Label digite "masculino";
Clique em ADD;
Repita os passos anterior para outra(s) categoria(s).
Clique em OK.
Janela "Missing Values"
Escolha uma das três opções:
Não definir nenhum valor para missing
Definir até três valores específicos para missing
Definir um intervalo de valores a serem considerados como missing
Type: Numeric;
Width: 2 (ou seja, possui dois caracteres no máximo);
Decimals: 0 (não possui casas decimais);
Labels: idade do paciente (em anos);
Value: não se aplica em variáveis quantitativas;
Missing: o missing será representado por caselas vazias;
Measure: Scale.
Type: Numeric;
Width: 1 (ou seja, possui somente um caracteres no máximo);
Decimals: 0 (não possui casas decimais);
Labels: sexo de nascimento do paciente;
Value: sexo (0=masculino; 1=feminino);
Missing: o missing será representado por caselas vazias;
Measure: Nominal.