top of page
Education

Slides & Tutorials

(Material in Portuguese)

Slides das aulas

Tutoriais em R

Os tutoriais estão disponíveis em ambos MarkdownGoogle Colab:

O arquivo ZIP inclui os seguintes tutoriais em Markdown:

  • Tutorial 1. Introdução ao R

  • Tutorial 2. Regressões

  • Tutorial 3. Florestas Aleatórias

  • Tutorial 4. Redes Neurais Artificiais

  • Tutorial 5. Support Vector Machines (SVM)

  • Tutorial 6. Validação de Modelos

Você pode acessar os tutoriais no Google Colab por meio dos links abaixo:

Dados de desmatamento

Este conjunto de dados foi construído para fazer parte dos tutoriais de aprendizado de máquina. Ele é focado no desmatamento de 2004 na Amazônia brasileira, medido ao nível municipal, e em fatores socioeconômicos e biofísicos relacionados. O conjunto inclui 808 municípios e 31 variáveis. A descrição das variáveis é apresentada abaixo:

​

  1. codigo : ID único do município

  2. state : sigla do estado onde o município está localizado

  3. def_annMB : desmatamento em 2004 baseado nos dados do MapBiomas (km2)

  4. area_km2 : tamanho do município (km2)

  5. PAs : área municipal coberta por áreas protegidas (1000 km2)

  6. env_fine_cancel : soma das multas ambientais canceladas (R$)

  7. env_fine : soma das multas ambientais aplicadas (R$)

  8. env_fine_paid : soma das multas ambientais pagas (R$)

  9. dist_ports : distância euclidiana até os principais portos

  10. dist_manaus : distância euclidiana até o porto de Manaus

  11. dist_parana : distância euclidiana até o porto do Paraná

  12. dist_arc : distância euclidiana da região do Arco do Desmatamento

  13. dist_capital : distância euclidiana até as capitais estaduais

  14. dist_seat : distância euclidiana até as sedes municipais

  15. incra_ha : cobertura de assentamentos do INCRA (ha)

  16. incra_family : número de famílias em assentamentos do INCRA

  17. incra_cap : capacidade dos assentamentos do INCRA em termos de famílias

  18. gdp : produto interno bruto (R$)

  19. gdp_agr : produto interno bruto do setor agropecuário (R$)

  20. pop : contagem populacional

  21. suitability_soy : índice de aptidão para a produção de soja (0 a 1)

  22. suitability_pas : índice de aptidão para pastagens (0 a 1)

  23. soil : qualidade do solo, variando de 1 (pobre) a 5 (excelente)

  24. flo2000 : cobertura florestal em 2000 (km2)

  25. road_density : densidade rodoviária (km/km2)

  26. road_hway_density : densidade de rodovias principais (km/km2)

  27. road_hway_km : extensão de rodovias principais (km)

  28. road_km : road density (km2)

  29. mayor_party : alinhamento político do partido do prefeito (esquerda/centro/direita)

  30. gov_party : alinhamento político do partido do governador (esquerda/centro/direita)

  31. def_category : dummy indicando os 25% dos municípios com maior desmatamento em 2004 (categórica)​​​​​

Exemplos úteis de scripts em R

Para associar e copiar uma variável do dataframe d2 para d1 por meio de um identificador comum, ID:

​

d1$variable <- d2[match(with(d1, ID), with(d2, ID)),]$variable

​​​

Para computar uma estatística específica por categoria (soma anual, neste exemplo):

​

library(plyr)

annual_sum <- ddply(.data = d1, .(year), .fun = summarise, total = sum(variable))
 

bottom of page