Мультимодальные трансформеры
Кросс-модальное выравнивание
Цель обучения, направленная на семантическое выравнивание представлений разных модальностей в общем пространстве, позволяющее устанавливать соответствие между визуальными и языковыми концепциями.
← Назад