
Slides & Tutorials
(Material in Portuguese)
Slides das aulas
Tutoriais em R
Os tutoriais estão disponíveis em ambos Markdown e Google Colab:
O arquivo ZIP inclui os seguintes tutoriais em Markdown:
-
Tutorial 1. Introdução ao R
-
Tutorial 2. Regressões
-
Tutorial 3. Florestas Aleatórias
-
Tutorial 4.A Redes Neurais (com Torch)
-
Tutorial 4.B Redes Neurais (com Keras)
-
Tutorial 5. Support Vector Machines (SVM)
-
Tutorial 6. Validação de Modelos
Você pode acessar os tutoriais no Google Colab por meio dos links abaixo (note que o Tutorial 4.A utiliza pacotes que atualmente não são compatíveis com o Google Colab):
Dados de desmatamento
Este conjunto de dados foi construído para fazer parte dos tutoriais de aprendizado de máquina. Ele é focado no desmatamento de 2004 na Amazônia brasileira, medido ao nível municipal, e em fatores socioeconômicos e biofísicos relacionados. O conjunto inclui 808 municípios e 31 variáveis. A descrição das variáveis é apresentada abaixo (em inglês):
ā
-
codigo : unique municipality ID
-
state : state acronym where the municipality is located
-
def_annMB : deforestation in 2004 based on the MapBiomas data (km2)
-
area_km2 : size of the municipality (km2)
-
PAs : municial area covered by protected areas (1000 km2)
-
env_fine_cancel : sum of environmental fines cancelled (R$)
-
env_fine : sum of environmental fines issued (R$)
-
env_fine_paid : sum of environmental fines issued (R$)
-
dist_ports : Euclidean distance to major ports
-
dist_manaus : Euclidean distance to the Manus port
-
dist_parana : Euclidean distance to the Paraná port
-
dist_arc : Euclidean distance from the Arc of Deforestation region
-
dist_capital : Euclidean distance to state capitals
-
dist_seat : Euclidean distance to municipal seats
-
incra_ha : INCRA settlement cover (ha)
-
incra_family : number of families in INCRA settlements
-
incra_cap : INCRA settlement capacity in terms of families
-
gdp : gross domestic product (R$)
-
gdp_agr : gross domestic product from the agricultural sector (R$)
-
pop : population count
-
suitability_soy : suitability index for soybean production (0 to 1)
-
suitability_pas : suitability index for pasture (0 to 1)
-
soil : soil quality, ranging from 1 (poor) to 5 (excellent)
-
flo2000 : forest cover in 2000 (km2)
-
road_density : road density (km/km2)
-
road_hway_density : road density (km/km2)
-
road_hway_km : road density (km2)
-
road_km : road density (km2)
-
mayor_party : mayor party political alignment (left/center/right)
-
gov_party : governor party political alignment (left/center/right)
-
def_category : dummy indicating the top 25% municipalities with the highest deforestation in 2004āāāāā
Exemplos úteis de scripts em R
Para associar e copiar uma variável do dataframe d2 para d1 por meio de um identificador comum, ID:
ā
d1$variable <- d2[match(with(d1, ID), with(d2, ID)),]$variable
āāā
Para computar uma estatística específica por categoria (soma anual, neste exemplo):
ā
library(plyr)
annual_sum <- ddply(.data = d1, .(year), .fun = summarise, total = sum(variable))