Pesquisadores criam algoritmo que realiza classificação agrícola por meio de imagens de satélite
Estudo da FGV EMAp utiliza, pela primeira vez, uma abordagem com proporções globais para classificar culturas agrícolas por agrupamento auto-supervisionado
Pesquisadores da Escola de Matemática Aplicada da Fundação Getulio Vargas (FGV EMAp) desenvolveram uma abordagem inédita para classificar cultivos agrícolas por meio do sensoriamento remoto (imagens de satélite), com o mínimo esforço humano possível.
À frente deste estudo, o pesquisador Dário Oliveira explica que classificar imagens por meio do sensoriamento remoto é uma tarefa demorada e que requer grande esforço, especialmente quando se leva em consideração o tamanho do Brasil, com climas diferentes espalhados pelas cinco regiões, que torna inviável fazer o mapeamento de forma manual.
“Com apenas uma única imagem de satélite pode não ser possível identificar o tipo de plantação, por isso é necessário o trabalho de um profissional para olhar uma sequência de imagens e fazer a identificação se apoiando no ciclo fenológico do cultivo agrícola. Com o novo método de aprendizado de máquina que criamos, o sistema é capaz de realizar essa identificação sem o esforço humano, por meio do agrupamento dos similares”, explicou Oliveira, ao destacar que esta é a primeira vez que uma abordagem usando proporções globais para a classificação de culturas por agrupamento auto-supervisionado foi proposta na literatura.
Dados de cultivo agrícola
O professor aprofunda como o sistema utiliza os dados do Instituto Brasileiro de Geografia e Estatística (IBGE) para organizar e classificar as imagens de satélite:
“Observamos o ciclo fenológico da plantação, ou seja, o ciclo de crescimento da vegetação através de uma sequência de imagens de satélite, e utilizamos técnicas de aprendizado de máquina para ensinar o sistema a reconhecer e diferenciar o que é a plantação de algodão e o que é a de milho, por exemplo”, disse Oliveira.
Entretanto, diante da variação climática no Brasil, o pesquisador afirma que um modelo de aprendizado de máquina treinado para o contexto do Rio Grande do Sul, não vai funcionar na Bahia, porque o padrão de crescimento da plantação é potencialmente diferente.
“Este cenário exige que um indivíduo identifique manualmente esses pontos, mas o nosso sistema permite identificar com precisão os tipos de cultivo agrícola de determinada região a partir de proporções de cultivo previamente estabelecidas”, ressaltou.
Os dados do IBGE forneceram ao novo sistema criado informações acerca da proporção de cultivo estimados, a partir de informações como sementes cultivadas e comercializadas por região, além de dados históricos e a proporção do que foi cultivado em anos anteriores.
Os experimentos para testar a eficácia deste novo método foram conduzidos com dois conjuntos de dados, extraídos de imagens de satélite, de diferentes regiões agrícolas do país: Campo Verde (MT) e Luís Eduardo Magalhães (BA). Na primeira região, a soja foi o principal tipo de cultura com base em dados de outubro de 2015 a julho 2016, sendo substituída por algodão e milho nos meses seguintes. Na Bahia não houve um conjunto de dados uniformes, sendo soja, milho, algodão e milheto os principais tipos de cultura cultivados entre junho de 2017 e junho de 2018.
“O nosso modelo utiliza as proporções estimadas pelos dados do IBGE para ‘aprender’ qual é o cultivo agrícola em cada ponto nas imagens de satélite, através da técnica conhecida como agrupamento profundo com protótipos, que agrupa plantações com padrões similares, e separa plantações com padrões diferentes em outros grupos diferentes”, explicou o pesquisador. Ele também declara que os resultados dos experimentos indicaram 90% de precisão para os principais tipos de cultura, em um cenário real, com acesso às proporções exatas dos tipos de cultura para um determinado conjunto de dados.
Impacto no setor agrícola
Tendo em vista que as ferramentas de inteligência artificial, a exemplo do aprendizado de máquina, podem dar suporte a tomadas de decisão na esfera política, empresarial e muitas outras, Oliveira acredita que o método pode dar suporte à tomada de decisões que envolvem a identificação de cultivos agrícolas, como estimativa de safra, financiamento e seguro rurais, entre outras iniciativas de interesse do governo e da iniciativa privada na área de plantio.
“A principal dificuldade de se monitorar em nível local áreas de cultivo agrícola reside atualmente na impossibilidade de se analisar um volume tão grande de dados em um país do tamanho do Brasil. Acreditamos que esse método possa ajudar a dar escala para essa análise de dados e ajudar a mobilizar as atividades que dependem desse monitoramento contínuo e detalhado das propriedades de cultivo agrícola no país”, concluiu.
Para ler o estudo na íntegra, clique aqui.
Para saber mais sobre a FGV EMAp, clique aqui.
Leia também