ভিশন ট্রান্সফরমার্স (ViT)
টোকেন লেবেলিং
একটি প্রশিক্ষণ কৌশল যেখানে প্রতিটি প্যাচের জন্য একটি তত্ত্বাবধায়ক লেবেল দেওয়া হয় একটি ছবির জন্য একটি মাত্র লেবেলের পরিবর্তে, মডেলকে আরও সমৃদ্ধ এবং স্থানীয় উপস্থাপনা শিখতে বাধ্য করে।
← ফিরে যান