Estudo monitora desmatamento e identifica espécies vegetais com uso de inteligência artificial
Método LLP-Co aprende padrões visuais e agrupa grandes volumes de dados de maneira automática com aplicação na identificação de áreas desmatadas e de características da biodiversidade vegetal das áreas de floresta

Aplicar imagens de satélite e inteligência artificial para determinar os níveis de desmatamento e os detalhes da biodiversidade da Floresta Amazônica: esse projeto arrojado está em desenvolvimento pelo professor Dário Oliveira, da Escola de Matemática Aplicada da Fundação Getulio Vargas (FGV EMAp) e pelos seus orientandos. A pesquisa utiliza uma metodologia desenvolvida pelo docente durante sua estadia na Universidade de Wisconsin-Madison (EUA) e premiada no VIII Simpósio de Pesquisa e Inovação da FGV, em que culturas agrícolas são automaticamente classificadas por um sistema de aprendizado de máquina, que usa imagens de satélite nesse mapeamento.
Trata-se da ferramenta Learning from Label Proportions with Prototypical Contrastive Clustering (LLP-Co), que organiza grandes conjuntos de dados capturados por drones e satélites, que conseguem sobrevoar a floresta e coletar dados em grande escala, inclusive em áreas de cobertura vegetal mais densa. Esses dados são organizados, identificados (rotulados) e classificados pelo sistema, que tem a capacidade de aprender sozinho a partir da supervisão e validação dos pesquisadores.

O LLP-Co consegue “aprender” quais tipos de cultivo aparecem em cada pedaço da imagem – mesmo sem ter instruções detalhadas de qual pedaço é qual cultura | Fonte: Reprodução/ La Rosa; Oliveira; Ghamisi, 2022.
Como o modelo funciona?
O LLP-Co reconhece padrões considerando características variadas, como cores e dados históricos da região observada e usa o chamado aprendizado contrastivo baseado em protótipos, no qual as imagens são processadas e divididas em "conjuntos" (bags) de pequenos blocos de pixels e agrupadas em clusters (agrupamentos ou conjuntos de elementos que compartilham características semelhantes) sem necessidade de rotulação individual das amostras .
O método do LLP-Co, segundo a pesquisa, demonstrou-se superior a abordagens tradicionais de aprendizado não supervisionado, como o Swapping Assignments Between Views (SwAV). Classificar imagens coletadas por meio de sensoriamento remoto é uma tarefa que demanda muito tempo e esforço e esse trabalho humano é consideravelmente reduzido com a aplicação de sistemas como o desenvolvido no estudo.
As aplicações do sistema no monitoramento florestal permitem uma maior acurácia no acompanhamento do avanço do desmatamento, possibilitando uma gestão de políticas públicas mais eficazes. Além disso, a identificação e classificação das espécies vegetais podem revelar detalhes surpreendentes da biodiversidade local, abrindo novos flancos de pesquisas voltadas para a preservação ambiental.
Versatilidade de aplicações
Os estudos do professor Dário Oliveira estão no estado da arte da Ciência de Dados. Em parcerias internacionais, trabalhos voltados para disciplinas de áreas variadas do saber foram publicados em periódicos respeitados pela comunidade científica. No campo das Ciências Sociais, Oliveira participou de um estudo que buscou compreender a relação entre indicadores socioeconômicos a partir de imagens de satélite processadas por inteligência artificial. Os resultados permitem aplicações na melhoria do planejamento urbano, no monitoramento da desigualdade social e na elaboração de políticas públicas mais eficazes para o desenvolvimento das comunidades.
Outro estudo examina a relação entre a expansão urbana e o land surface temperature (LST) – aumento da temperatura da superfície. Utilizando séries temporais de LST extraídas de imagens de satélite, os autores aplicam métodos de clusterização (categorização) para identificar padrões espaço-temporais em três cidades: Calcutá (Índia), São Paulo (Brasil) e Munique (Alemanha). Os resultados indicaram que o crescimento urbano contribui significativamente para o aumento da LST, especialmente em áreas periféricas recém-urbanizadas. Além disso, ele mostra que a migração do centro de massa da LST ao longo do tempo reflete a direção da expansão urbana.

Aplicação de como os modelos de aprendizagem profunda podem prever resultados socioeconômicos relacionados às condições ambientais locais | Foto: Reprodução/ Obadic et al., 2024.
Dário Oliveira também participou de uma pesquisa que propôs um novo método para melhorar a síntese de dados climáticos extremos usando autoencoders variacionais (VAEs). Os VAEs foram treinados para aprender padrões climáticos a partir de dados históricos de precipitação, permitindo prever ou gerar novos cenários climáticos. Os resultados indicam que a técnica pode ser aplicada para aprimorar modelos de previsão climática e análise de riscos ambientais. Essa técnica ajudou a corrigir o viés dos modelos tradicionais, garantindo que eventos raros não fossem subestimados ou ignorados. Essa abordagem pode ser usada em outras áreas, como previsão de desastres naturais, monitoramento climático e planejamento urbano.
O trabalho do professor Dário Oliveira e de sua equipe na FGV EMAp representa um avanço significativo no uso de inteligência artificial junto a técnicas de sensoriamento remoto para a análise de dados complexos. A versatilidade do método permite sua aplicação em diferentes áreas do conhecimento, ampliando as possibilidades de uso de dados geoespaciais para compreender fenômenos urbanos, climáticos e socioeconômicos.
Com isso, a FGV EMAp auxilia na combinação entre ciência de dados e sustentabilidade, que é fortalecida, apontando caminhos inovadores para o monitoramento ambiental e para a tomada de decisões estratégicas na gestão dos recursos naturais.
Leia também