
Slides & Tutorials
(Material in Portuguese)
Slides das aulas
Tutoriais em R
Os tutoriais estão disponíveis em ambos Markdown e Google Colab:
O arquivo ZIP inclui os seguintes tutoriais em Markdown:
-
Tutorial 1. Introdução ao R
-
Tutorial 2. Regressões
-
Tutorial 3. Florestas Aleatórias
-
Tutorial 4. Redes Neurais Artificiais
-
Tutorial 5. Support Vector Machines (SVM)
-
Tutorial 6. Validação de Modelos
Você pode acessar os tutoriais no Google Colab por meio dos links abaixo:
Dados de desmatamento
Este conjunto de dados foi construído para fazer parte dos tutoriais de aprendizado de máquina. Ele é focado no desmatamento de 2004 na Amazônia brasileira, medido ao nível municipal, e em fatores socioeconômicos e biofísicos relacionados. O conjunto inclui 808 municípios e 31 variáveis. A descrição das variáveis é apresentada abaixo:
ā
-
codigo : ID único do município
-
state : sigla do estado onde o município está localizado
-
def_annMB : desmatamento em 2004 baseado nos dados do MapBiomas (km2)
-
area_km2 : tamanho do município (km2)
-
PAs : área municipal coberta por áreas protegidas (1000 km2)
-
env_fine_cancel : soma das multas ambientais canceladas (R$)
-
env_fine : soma das multas ambientais aplicadas (R$)
-
env_fine_paid : soma das multas ambientais pagas (R$)
-
dist_ports : distância euclidiana até os principais portos
-
dist_manaus : distância euclidiana até o porto de Manaus
-
dist_parana : distância euclidiana até o porto do Paraná
-
dist_arc : distância euclidiana da região do Arco do Desmatamento
-
dist_capital : distância euclidiana até as capitais estaduais
-
dist_seat : distância euclidiana até as sedes municipais
-
incra_ha : cobertura de assentamentos do INCRA (ha)
-
incra_family : número de famílias em assentamentos do INCRA
-
incra_cap : capacidade dos assentamentos do INCRA em termos de famílias
-
gdp : produto interno bruto (R$)
-
gdp_agr : produto interno bruto do setor agropecuário (R$)
-
pop : contagem populacional
-
suitability_soy : índice de aptidão para a produção de soja (0 a 1)
-
suitability_pas : índice de aptidão para pastagens (0 a 1)
-
soil : qualidade do solo, variando de 1 (pobre) a 5 (excelente)
-
flo2000 : cobertura florestal em 2000 (km2)
-
road_density : densidade rodoviária (km/km2)
-
road_hway_density : densidade de rodovias principais (km/km2)
-
road_hway_km : extensão de rodovias principais (km)
-
road_km : road density (km2)
-
mayor_party : alinhamento político do partido do prefeito (esquerda/centro/direita)
-
gov_party : alinhamento político do partido do governador (esquerda/centro/direita)
-
def_category : dummy indicando os 25% dos municípios com maior desmatamento em 2004 (categórica)āāāāā
Exemplos úteis de scripts em R
Para associar e copiar uma variável do dataframe d2 para d1 por meio de um identificador comum, ID:
ā
d1$variable <- d2[match(with(d1, ID), with(d2, ID)),]$variable
āāā
Para computar uma estatística específica por categoria (soma anual, neste exemplo):
ā
library(plyr)
annual_sum <- ddply(.data = d1, .(year), .fun = summarise, total = sum(variable))