Monitoramento POP - Retorno do Rodrigo pós reunião
- Sobre os dados, acho muito importante vocês terem também informações geoespaciais (latitudade, longitude) do histórico de chamados, sem isso acho que fica difícil avançar. Os dados de data hora tb são muito relevantes, mas esses já estão no dataset.
- Considero esse mais um problema de clusterização do que de classificação. Até daria pra fazer com classificação só que aí o modelo não conseguiria fazer a predição correta de cenários que ele ainda não viu, então penso que o melhor seria clusterização ou se quiserem criar um sistema mais robusto, uma combinação dos dois.
- No mundo da clusterização (aprendizado não supervisionado), acho que vocês podem pesquisar algoritmos como DBSCAN (bom para dados geoespaciais) e Agglomerative Hierarchical Clustering.
- Choosing the Right Geospatial Clustering Algorithm for Your Business Need [1]
- Como novas conexões podem ser criadas ao longo do tempo, existem algumas formas de lidar com o aparecimento de novos clusters sem precisar ficar retreinando o modelo, é o que chamam de Incremental Clustering.
- What is Incremental Clustering (activeloop.ai) [2]
- O que é Incremental Clustering (Agrupamento Incremental) em Inteligência Artificial? - Glossário de Automação [3]
- Agora para conseguir agrupar os cenários em que temos chamados distantes geograficamente mas que são relacionados ao mesmo problema raiz eu acho que vocês vão precisar ter aquelas topologias em um formato que um algoritmo de ML consiga entender, uma saída pode ser o uso de grafo, que é muito usado em problemas de redes sociais. Nesse caso seria uma combinação das features existentes + lat/long + topologia.
- Graph Clustering Methods in Data Mining - GeeksforGeeks [4]
- GitHub - yueliu1999/Awesome-Deep-Graph-Clustering: Awesome Deep Graph Clustering is a collection of SOTA, novel deep graph clustering methods (papers, codes, and datasets). [5]