top of page
Education

Slides & Tutorials

(Material in Portuguese)

Slides das aulas

Tutoriais em R

Os tutoriais estão disponíveis em ambos MarkdownGoogle Colab:

O arquivo ZIP inclui os seguintes tutoriais em Markdown:

  • Tutorial 1. Introdução ao R

  • Tutorial 2. Regressões

  • Tutorial 3. Florestas Aleatórias

  • Tutorial 4.A Redes Neurais (com Torch)

  • Tutorial 4.B Redes Neurais (com Keras)

  • Tutorial 5. Support Vector Machines (SVM)

  • Tutorial 6. Validação de Modelos

Você pode acessar os tutoriais no Google Colab por meio dos links abaixo (note que o Tutorial 4.A utiliza pacotes que atualmente não são compatíveis com o Google Colab):

Dados de desmatamento

Este conjunto de dados foi construído para fazer parte dos tutoriais de aprendizado de máquina. Ele é focado no desmatamento de 2004 na Amazônia brasileira, medido ao nível municipal, e em fatores socioeconômicos e biofísicos relacionados. O conjunto inclui 808 municípios e 31 variáveis. A descrição das variáveis é apresentada abaixo (em inglês):

​

  1. codigo : unique municipality ID

  2. state : state acronym where the municipality is located

  3. def_annMB : deforestation in 2004 based on the MapBiomas data (km2)

  4. area_km2 : size of the municipality (km2)

  5. PAs : municial area covered by protected areas (1000 km2)

  6. env_fine_cancel : sum of environmental fines cancelled (R$)

  7. env_fine : sum of environmental fines issued (R$)

  8. env_fine_paid : sum of environmental fines issued (R$)

  9. dist_ports : Euclidean distance to major ports

  10. dist_manaus : Euclidean distance to the Manus port

  11. dist_parana : Euclidean distance to the Paraná port

  12. dist_arc : Euclidean distance from the Arc of Deforestation region

  13. dist_capital : Euclidean distance to state capitals

  14. dist_seat : Euclidean distance to municipal seats

  15. incra_ha : INCRA settlement cover (ha)

  16. incra_family : number of families in INCRA settlements

  17. incra_cap : INCRA settlement capacity in terms of families

  18. gdp : gross domestic product (R$)

  19. gdp_agr : gross domestic product from the agricultural sector (R$)

  20. pop : population count

  21. suitability_soy : suitability index for soybean production (0 to 1)

  22. suitability_pas : suitability index for pasture (0 to 1)

  23. soil : soil quality, ranging from 1 (poor) to 5 (excellent)

  24. flo2000 : forest cover in 2000 (km2)

  25. road_density : road density (km/km2)

  26. road_hway_density : road density (km/km2)

  27. road_hway_km : road density (km2)

  28. road_km : road density (km2)

  29. mayor_party : mayor party political alignment (left/center/right)

  30. gov_party : governor party political alignment (left/center/right)

  31. def_category : dummy indicating the top 25% municipalities with the highest deforestation in 2004​​​​​

Exemplos úteis de scripts em R

Para associar e copiar uma variável do dataframe d2 para d1 por meio de um identificador comum, ID:

​

d1$variable <- d2[match(with(d1, ID), with(d2, ID)),]$variable

​​​

Para computar uma estatística específica por categoria (soma anual, neste exemplo):

​

library(plyr)

annual_sum <- ddply(.data = d1, .(year), .fun = summarise, total = sum(variable))
 

bottom of page