Глоссарий ИИ
Полный словарь искусственного интеллекта
FT-Трансформер
Архитектура Трансформера, адаптированная для табличных данных, сочетающая кодирование признаков и механизмы внимания для моделирования взаимодействий между переменными.
Токенизация признаков
Процесс преобразования числовых и категориальных признаков во входные токены для архитектур Трансформера, сохраняя их семантическую природу.
Числовое вложение
Техника проецирования непрерывных переменных в векторное пространство фиксированной размерности через слои многослойного перцептрона.
Категориальное вложение
Векторное представление изученных дискретных переменных, где каждая категория отображается на вложение фиксированной размерности.
Поэлементная линейная модуляция
Механизм модуляции, при котором входные признаки управляют преобразованиями, применяемыми к промежуточным представлениям.
Предварительная обработка табличных данных
Конвейер преобразований, специфичный для структурированных данных, включая нормализацию, кодирование one-hot и обработку пропущенных значений.
Размерность вложения токена
Размер векторного пространства, в которое проецируется каждый токенизированный признак, критический параметр архитектуры.
Моделирование взаимодействий признаков
Способность FT-Трансформера автоматически захватывать нелинейные взаимодействия между признаками через механизм внимания.
Архитектура табличного трансформера
Специфическая адаптация архитектуры трансформера для эффективной обработки табличных данных с токенизацией признаков.
Объединение токенов CLS
Стратегия агрегации, использующая токен CLS для создания глобального представления выборки для задачи классификации.
Последовательность токенов признаков
Упорядоченная последовательность токенов, представляющих признаки табличной выборки, используемая в качестве входа для трансформера.
Дискретизация числовых признаков
Опциональная техника дискретизации непрерывных переменных перед токенизацией для улучшения представления.