Glosario IA
El diccionario completo de la Inteligencia Artificial
Red Neuronal Convolucional (CNN)
Arquitectura de deep learning especializada en el procesamiento de datos en malla como las imágenes, utilizando capas de convolución, pooling y capas completamente conectadas para aprender jerarquías de características.
Filtro (o Kernel)
Pequeña matriz de pesos aprendibles que se desliza sobre la entrada de una capa de convolución para detectar patrones específicos como bordes, texturas o formas.
Campo Receptivo (Receptive Field)
Región de la imagen de entrada que influye en una neurona particular en una capa dada, aumentando de tamaño a medida que se avanza en las capas profundas de la red.
Detección de Objetos
Tarea que consiste en localizar e identificar uno o más objetos en una imagen, generalmente dibujando cajas delimitadoras (bounding boxes) alrededor de ellos y asociándoles una clase.
Arquitectura Codificador-Decodificador (Encoder-Decoder)
Estructura de red compuesta por un camino de codificación que reduce la dimensionalidad espacial para capturar el contexto, y un camino de decodificación que la aumenta para producir una salida del mismo tamaño que la entrada, utilizada para la segmentación.
Red Neuronal de Cápsulas (CapsNet)
Alternativa a las CNN que organiza las neuronas en 'cápsulas' para preservar la jerarquía espacial de las características, buscando gestionar mejor las variaciones de pose y rotaciones de objetos.
Visión por Computadora Geométrica
Rama de la visión por computadora que se enfoca en la inferencia de propiedades 3D y estructuras a partir de imágenes 2D, incluyendo tareas como la reconstrucción 3D y la estimación de pose de la cámara.
Transformador de Visión (Vision Transformer - ViT)
Arquitectura que aplica el mecanismo de atención de los transformadores, originalmente diseñado para el NLP, a secuencias de parches de imágenes, rivalizando con las CNN en tareas de clasificación.