Glossário IA
O dicionário completo da Inteligência Artificial
DBSCAN (Density-Based Spatial Clustering of Applications with Noise)
Algoritmo de agrupamento não supervisionado que agrupa pontos densamente povoados, marcando pontos isolados em regiões de baixa densidade como anomalias ou ruído.
LOF (Local Outlier Factor)
Método de detecção de anomalias que mede o desvio da densidade local de um ponto em relação aos seus vizinhos, identificando outliers como pontos com uma densidade significativamente menor.
Epsilon (ε) no DBSCAN
Parâmetro de distância que define o raio da vizinhança em torno de um ponto para determinar se ele pertence a uma região densa, crucial para a sensibilidade do algoritmo.
MinPts no DBSCAN
Parâmetro de limiar que indica o número mínimo de pontos necessários na vizinhança epsilon para que um ponto seja considerado um ponto central (core point).
Ponto Central (Core Point)
Ponto que possui pelo menos MinPts vizinhos em seu raio epsilon, servindo como semente para a formação de um cluster denso no DBSCAN.
K-distância
Distância entre um ponto e seu k-ésimo vizinho mais próximo, usada como base para calcular a densidade local no algoritmo LOF.
Distância de Alcance (Reachability Distance)
Distância de alcance utilizada no LOF, definida como o máximo da k-distância do vizinho e da distância real entre dois pontos, para estabilizar as medidas de densidade.
Densidade de Alcance Local (Local Reachability Density - LRD)
Inverso da média da distância de alcance de k de um ponto em relação aos seus vizinhos, quantificando a densidade local em torno desse ponto no algoritmo LOF.
Fator Anormal Local (Local Outlier Factor - LOF)
Razão da densidade local alcançável de um ponto para a densidade média de seus vizinhos, onde uma pontuação superior a 1 indica uma probabilidade de ser um outlier.
OPTICS (Ordering Points To Identify the Clustering Structure)
Algoritmo de densidade que estende o DBSCAN e cria uma ordem de pontos representando a estrutura de densidade, permitindo a extração de clusters em diferentes resoluções sem um parâmetro epsilon fixo.
Grafo de Acessibilidade (Reachability Graph)
Representação visual da k-distância de acessibilidade para cada ponto, gerada pelo OPTICS para identificar vales de densidade correspondentes aos clusters.
Condensação da Árvore de Clusters (Cluster Tree Condensation)
Processo no HDBSCAN que simplifica a árvore hierárquica de clusters, fundindo clusters que não são persistentes em diferentes escalas de densidade.
Pontuação de Anomalia Baseada na Densidade
Métrica quantitativa que avalia o grau de isolamento de um ponto com base na densidade de sua vizinhança, usada para classificar a severidade das anomalias detectadas.
Método do Vizinho Mais Próximo Baseado na Densidade (Density-Based Nearest Neighbor)
Abordagem de detecção de anomalias onde um ponto é considerado um outlier se a distância para seu vizinho mais próximo for significativamente maior do que a distância média dos outros pontos.
Subamostragem Baseada na Densidade (Density-Based Subsampling)
Técnica de pré-processamento que reduz o tamanho do conjunto de dados, preservando preferencialmente os pontos de regiões de baixa densidade, melhorando a eficiência da detecção de anomalias.
Isolation Forest vs. Densidade
Distinção conceitual onde Isolation Forest identifica anomalias pela sua facilidade de isolamento no espaço de features, enquanto os métodos baseados na densidade as identificam pela sua baixa concentração espacial.