O INEP disponibiliza bom acervo de bases de dados sobre educação, dentre elas: Saeb, Enem, Enade, Censo da Educação Superior e Censo Escolar.
As bases vêm acompanhadas de dicionário de campos, manuais e arquivos (inputs) que facilitam acesso por meio de SAS ou SPSS. Ambos podem ser visualizados como texto e podem ajudar a organizar os campos em complemento às informações do dicionário e notas técnicas, mesmo que o usuário não tenha SAS ou SPSS (abri esses inputs com bloco de noas para verificar tipos de dados dos campos).
No Censo Escolar 2015, encontrei no arquivo "Leia-me", que vem no download da base, um bom conjunto de dicas para acesso às bases em R (recomendações para o uso do package ffbase).
No Censo Escolar 2015, encontrei no arquivo "Leia-me", que vem no download da base, um bom conjunto de dicas para acesso às bases em R (recomendações para o uso do package ffbase).
Nos mais de 150 campos de microdados do Enem, é possível, por exemplo, encontrar as respostas dadas para cada prova, se foi solicitada cadeira para canhoto, se a redação foi anulada por ferir direitos humanos ou por fugir do tema. Já nos microdados do Censo Escolar - onde há dados sobre cada turma, docente e aluno - é possível contar número de computadores por escola, quadras cobertas, água encanada, sala de leitura ou quantos alunos vão à escola de bicicleta.
Na imagem ao lado, as pastas do arquivo de microdados do Enem 2015. O arquivo .csv contido na pasta "Dados" chega à quase 6GB depois de descompactado. Os outros arquivos (Censo, Saeb, etc) seguem padrão parecido.Alguns links para acesso:
http://portal.inep.gov.br/web/guest/dados
http://portal.inep.gov.br/microdados
SQL para criação de tabela com dados dos alunos do 9ºEF do Saeb 2015 (por hora, campos tipo varchar):
CREATE TABLE saeb2015_alunos9ef (ID_PROVA_BRASIL VARCHAR(4),ID_REGIAO VARCHAR(1),ID_UF VARCHAR(2),ID_MUNICIPIO6
VARCHAR(7),ID_AREA VARCHAR(1),ID_ESCOLA6 VARCHAR(8),ID_DEPENDENCIA_ADM VARCHAR(1),ID_LOCALIZACAO VARCHAR(1),ID_TURMA VARCHAR(6),ID_TURNO VARCHAR(1),ID_SERIE VARCHAR(1),ID_ALUNO VARCHAR(8),IN_SITUACAO_CENSO VARCHAR(1),IN_PREENCHIMENTO_PROVA VARCHAR(1),ID_CADERNO VARCHAR(6),ID_BLOCO_1 VARCHAR(1),ID_BLOCO_2 VARCHAR(1),TX_RESP_BLOCO_1_LP2 VARCHAR(13),TX_RESP_BLOCO_2_LP2 VARCHAR(13),TX_RESP_BLOCO_1_MT2 VARCHAR(13),TX_RESP_BLOCO_2_MT2 VARCHAR(13),IN_PROFICIENCIA VARCHAR(1),IN_PROVA_BRASIL VARCHAR(1),ESTRATO_ANEB VARCHAR(14),PESO_ALUNO_LP VARCHAR(20), PESO_ALUNO_MT VARCHAR(20), PROFICIENCIA_LP VARCHAR(18),DESVIO_PADRAO_LP VARCHAR(18),PROFICIENCIA_LP_SAEB double(30,20), DESVIO_PADRAO_LP_SAEB VARCHAR(18),PROFICIENCIA_MT VARCHAR(18),DESVIO_PADRAO_MT VARCHAR(18),PROFICIENCIA_MT_SAEB double(30,20), DESVIO_PADRAO_MT_SAEB varchar(18),IN_PREENCHIMENTO_QUESTIONARIO VARCHAR(1),TX_RESP_Q001 VARCHAR(1),TX_RESP_Q002 VARCHAR(1),TX_RESP_Q003 VARCHAR(1),TX_RESP_Q004 VARCHAR(1),TX_RESP_Q005 VARCHAR(1),TX_RESP_Q006 VARCHAR(1),TX_RESP_Q007 VARCHAR(1),TX_RESP_Q008 VARCHAR(1),TX_RESP_Q009 VARCHAR(1),TX_RESP_Q010 VARCHAR(1),TX_RESP_Q011 VARCHAR(1),TX_RESP_Q012 VARCHAR(1),TX_RESP_Q013 VARCHAR(1),TX_RESP_Q014 VARCHAR(1),TX_RESP_Q015 VARCHAR(1),TX_RESP_Q016 VARCHAR(1),TX_RESP_Q017 VARCHAR(1),TX_RESP_Q018 VARCHAR(1),TX_RESP_Q019 VARCHAR(1),TX_RESP_Q020 VARCHAR(1),TX_RESP_Q021 VARCHAR(1),TX_RESP_Q022 VARCHAR(1),TX_RESP_Q023 VARCHAR(1),TX_RESP_Q024 VARCHAR(1),TX_RESP_Q025 VARCHAR(1),TX_RESP_Q026 VARCHAR(1),TX_RESP_Q027 VARCHAR(1),TX_RESP_Q028 VARCHAR(1),TX_RESP_Q029 VARCHAR(1),TX_RESP_Q030 VARCHAR(1),TX_RESP_Q031 VARCHAR(1),TX_RESP_Q032 VARCHAR(1),TX_RESP_Q033 VARCHAR(1),TX_RESP_Q034 VARCHAR(1),TX_RESP_Q035 VARCHAR(1),TX_RESP_Q036 VARCHAR(1),TX_RESP_Q037 VARCHAR(1),TX_RESP_Q038 VARCHAR(1),TX_RESP_Q039 VARCHAR(1),TX_RESP_Q040 VARCHAR(1),TX_RESP_Q041 VARCHAR(1),TX_RESP_Q042 VARCHAR(1),TX_RESP_Q043 VARCHAR(1),TX_RESP_Q044 VARCHAR(1),TX_RESP_Q045 VARCHAR(1),TX_RESP_Q046 VARCHAR(1),TX_RESP_Q047 VARCHAR(1),TX_RESP_Q048 VARCHAR(1),TX_RESP_Q049 VARCHAR(1),TX_RESP_Q050 VARCHAR(1),TX_RESP_Q051 VARCHAR(1),TX_RESP_Q052 VARCHAR(1),TX_RESP_Q053 VARCHAR(1),TX_RESP_Q054 VARCHAR(1),TX_RESP_Q055 VARCHAR(1),TX_RESP_Q056 VARCHAR(1),TX_RESP_Q057 VARCHAR(1));

Nenhum comentário:
Postar um comentário