“The goal is to turn data into information, and information into insight.”
Carly Fiorina

1 Instruções

Para realização desta atividade será preciso estar conectado à internet para que possa importar os dados.

As respostas para estes exercícios estão disponíveis aqui.

2 Exercícios

Exercício 1: Comece importando a base de dados sobre rendimento escolar “school.sav” (SPSS) do diretório data ou diretamente do endereço web:

https://github.com/danielmarcelino/Datasets/raw/master/Hox2000/school.sav

2.1 Explorando atributos de dados com rótulos (labelled data frame)

Exercício 2: Explore os atributos das seguintes variáveis:

  • SCORE

  • PUPILSEX

  • PUPILSES

Exercício 3: Crie uma variável PUPILSEX2 que seja uma cópia da variável PUPILSEX. Para tornar a interpretação dos resultados a seguir mais intuitiva, você precisará recodificar a variável criada para fator, atribuíndo também os seguintes labels: c(“Feminino”, “Masculino”).

2.2 Estimativas agregadas por grupos

Exercício 4: Produza estatísticas descritivas da variável SCORE por sexo e PUPILSEX2). Vamos olhar as médias e os desvios padronizados.

  • Como você poderia produzir o mesmo resultado usando a função tapply()?

Exercício 5: Produza algumas estatísticas descritivas da variável SCORE para cada NSE–nível socioeconômico (PUPILSES) e sexo (PUPILSEX2). Vamos gerar médias e desvios padronizados.

  • Como você poderia produzir o mesmo resultado usando a função tapply()?

Exercício 6: Usando a função cut() ou ifelse(), gere uma variável chamada SEScat, agregando PUPILSES em 3 categorias: menor ou igual a 2, 3 e 4, e maior ou igual a 5. Apresente uma tabela dos resultados.

Exercício 7: Apague do objeto de dados as variáveis PUPILSEX2 e SEScat.