Desafio 1 da Maratona Behind the Code

Postado em 15 de agosto de 2020

Nesse post irei colocar algumas informações e comentários a respeito do desafio 1 da Maratona Behind the Code da IBM de 2020.

Esse primeiro desafio foi lançado no dia 15 de agosto às 10:00 da manhã e as primeiras avaliações serão divulgadas na quarta-feira pelo e-mail.

A Cocamar foi a empresa responsável por idealizar o problema e as informações a respeito deste estão disponíveis no seguinte link do github.

Sobre a Cocamar: essa empresa começou suas operações focada no auxílio de produres de café porém atualmente atende uma variedade maior de culturas (soja, milho, trigo, café e laranja).

Observação: O título da segunda seção do README do github é Desafio de Negócio, será que os desafios posteriores serão focados em outras áreas fora do mercado, por exemplo Desafio Acadêmico?

Seguindo a leitura do README no github é citado o objetivo do desafio:

Criar uma ferramenta rápida e automatizada de identificação das pragas mais comuns que atingem a lavoura de soja, implementando técnicas computacionais de reconhecimento visual.

Como a Maratona está sendo desenvolvida pela IBM eles sugerem a utilização do serviço de reconhecimento de imagens da própria empresa, o IBM Watson Visual Recognition.

O serviço IBM Watson Visual Recognition, pelo que consta na documentação, usa algoritmos de deep learning para analisar imagens, cenas, objetos e outros conteúdos para gerar um modelo que será usado para classificar outras imagens. A resposta desse módulo inclui palavras-chave que fornecem informações sobre a correlação entre o conteúdo analisado e algum dos objetos do modelo.

Para utilizar essa ferramenta devemos definir uma base de imagens que serão usadas para treinar o algoritmo.

Observação: No texto é mencionado que os participantes podem manipular as imagens da base previamente afim de melhorar a acurácia de classificação do modelo do Watson, porém não ensinam a fazer isso.

Pragas que o sistema deve reconhecer

Para facilitar o desafio, o sistema que será implementado deve reconhecer apenas as quatro principais pragas que atingem a lavoura de soja, sendo elas:

Lagarta da soja
Percevejo marrom
Percevejo pequeno
Percevejo verde

A primeira parte do desafio é buscar imagens dessas pragas para criar um modelo de reconhecimento visual capaz de classificar corretamente as imagens posteriores.

Resumo das tarefas

O resumo das tarefas segundo o próprio README é:

Instanciar o IBM Watson Visual Recognition na IBM Cloud, que é a ferramenta responsável por reconhecer as imagens, classificando-as e detectando objetos;
Instanciar o Watson Studio (Cloud Pak for Data as a Service) na IBM Cloud, que é uma interface gráfica para os procedimentos que estão sendo realizados, tornando mais intuitivo e agradável o processo de configuração;
Instanciar o Cloud Object Storage na IBM Cloud, que funciona como um HD onde podemos armazenar arquivos que serão usados para criação dos modelos;
Buscar por imagens que representam as classes especificadas: lagarta, percevejo_marrom, percevejo_pequeno e percevejo_verde;
Treinar o modelo;
Subir a aplicação de submissão;
Acessar a aplicação de submissão e submeter sua solução.

Algumas dicas

Para o modelo ficar bom é necessário fornecer imagens de qualidade. Não necessariamente devemos enviar 1000 imagens de cada praga, porém é recomendado fornecer imagens com algumas características e quantidades específicas.

Segundo o instrutor, um valor recomendado de imagens com qualidade é 50 para cada classe que deverá ser identificada.

Uma imagem de qualidade deve apresentar pouco ruído, ou seja, o objeto que será identificado deve estar em destaque na imagem, evitando outros detalhes ao redor.

É importante enviar também um conjunto de imagens relacionadas a alguns insetos parecidos com as pragas que desejamos detectar porém que se caracterizariam como falsos positivos. Nesse caso o conjunto de imagens terá o nome de Negative, por exemplo, joaninhas, borboletas, etc. Além disso, o modelo deve ser treinado com uma quantidade idêntica de imagens positivas e negativas.

Certifique-se de que os segundos planos em suas imagens de treinamento sejam comparáveis ao que você espera classificar.

Por exemplo, se estiver treinando o classificador "tigre", seu classificador poderá ser menos preciso se você treinar somente com imagens de tigres em um zoológico capturadas por um telefone celular, mas analisar imagens que foram capturadas no meio selvagem por fotógrafos profissionais.

Avaliação

O sistema testará o reconhecimento das quatro classes citadas acima, ou seja, seu classificador deve reconhecer as classes lagarta, percevejo_marrom, percevejo_pequeno e percevejo_verde. A pontuação é baseada em quantas imagens o modelo reconheceu corretamente e na certeza que ele tem nesse reconhecimento.

O autor do README ainda recomenda testar bastante o modelo e utilizar imagens de qualidade como exemplo, sem muito ruído e com foco no que deve ser reconhecido.

Especificações técnicas

Para a resolução do desafio, você irá utilizar o serviço de Visual Recognition no plano Lite. Nesse plano existe um limite de 1000 eventos por mês, em que cada evento corresponde, por exemplo, a classificação de uma imagem. Portanto, tome cuidado ao usar muitas imagens e treinar muitas vezes para não extrapolar o limite do plano, o que invalidaria seu modelo para submissão. Deixe uma margem de pelo menos 100 eventos para que seu modelo possa ser avaliado com sucesso.

Exemplo: Um usuário extrapola o limite do plano Lite criando 4 classes com 250 imagens cada e treinando o modelo, pois 4*250 = 1000.

Estratégia adotada

Bom, baseado no que foi descrito acima, a minha estratégia vai ser:

Coletar um conjunto de imagens de boa qualidade, sem ruído, das pragas em suas fases de vida, contendo pelo menos 10 imagens de cada fase;
Coletar um conjunto de imagens relacionadas a alguns outros tipos de insetos que podem ser encontrados numa lavoura e que poderiam gerar falsos positivos, e salvar no conjunto de Negatives;

Imagem do fluxograma da estratégia adotada

Quando terminar de fazer isso volto aqui e atualizo o post. É isso.