এআই গ্লসারি
কৃত্রিম বুদ্ধিমত্তার সম্পূর্ণ অভিধান
টিম গেম থিওরি
সহযোগী মাল্টি-এজেন্ট লার্নিংয়ের জন্য তাত্ত্বিক কাঠামো যেখানে এজেন্টরা একটি সাধারণ লক্ষ্য অর্জনের জন্য একটি দল গঠন করে, ভাগ করা পুরস্কার ব্যবস্থা এবং অন্তর্নিহিত সমন্বয় প্রক্রিয়ার সাথে।
ক্রেডিট অ্যাসাইনমেন্ট
মাল্টি-এজেন্ট লার্নিংয়ের মৌলিক সমস্যা যা দলের সামগ্রিক ফলাফলের জন্য প্রতিটি এজেন্টের নিজস্ব অবদানের সঠিকভাবে পুরস্কার বা দোষ নির্ধারণ করে।
মাল্টি-এজেন্ট ইমিটেশন লার্নিং
একটি পদ্ধতি যেখানে এজেন্টরা অন্যান্য এজেন্টদের (বিশেষজ্ঞ বা সহকর্মী) আচরণ পর্যবেক্ষণ ও অনুকরণ করে শেখে, ব্যয়বহুল এক্সপ্লোরেশন সহ জটিল পরিবেশে শেখার গতি বাড়ানোর জন্য ব্যবহৃত হয়।
মাল্টি-এজেন্ট ফেডারেটেড লার্নিং
একটি বিকেন্দ্রীকৃত পদ্ধতি যেখানে এজেন্টরা তাদের নিজস্ব ডেটাতে স্থানীয় মডেল প্রশিক্ষণ দেয় এবং কাঁচা ডেটা শেয়ার না করেই একটি গ্লোবাল মডেল তৈরি করতে পর্যায়ক্রমে প্যারামিটার আপডেট শেয়ার করে।
মিশ্র পলিসি
মাল্টি-এজেন্ট লার্নিংয়ে কৌশল যেখানে প্রতিটি এজেন্ট পরিবেশের অবস্থা এবং অন্যান্য এজেন্টদের কর্মের উপর নির্ভর করে পরিবর্তনশীল সম্ভাবনার সাথে আচরণের মিশ্রণ (পিছনে ধাওয়া করা, এড়িয়ে চলা, সহযোগী) গ্রহণ করতে পারে।
আংশিক পর্যবেক্ষণ সহ শেখা
একটি প্যারাডাইম যেখানে প্রতিটি এজেন্টের শুধুমাত্র পরিবেশের গ্লোবাল স্টেটের একটি অংশে অ্যাক্সেস থাকে, সিদ্ধান্ত গ্রহণের জন্য পর্যাপ্ত বোঝাপড়া পুনর্গঠনের জন্য অনুমান এবং যোগাযোগের কৌশল প্রয়োজন।
মাল্টি-এজেন্ট গ্রাফ নিউরাল নেটওয়ার্ক
ডিপ লার্নিং আর্কিটেকচার যেখানে এজেন্টদের একটি গতিশীল গ্রাফে নোড হিসেবে মডেল করা হয়, এজেন্টদের মধ্যে সম্পর্ক এবং নির্ভরতা ক্যাপচার করে এমন উপস্থাপনা শেখার অনুমতি দেয়।
মেটা-গেম লার্নিং
একটি কৌশল যেখানে এজেন্টরা অন্যান্য এজেন্টদের পরিবর্তনশীল কৌশলগুলির দ্রুত অভিযোজনের মাধ্যমে শেখা শেখে, যেমন একটি মেটা-গেমে যেখানে অভিযোজন ক্ষমতা নিজেই অপ্টিমাইজ করার একটি দক্ষতা হয়ে ওঠে।
মাল্টি-এজেন্ট শিখনে অভিসারী স্থিতিশীলতা
এটি এমন একটি বৈশিষ্ট্য যা নিশ্চিত করে যে ক্রমাগত মিথস্ক্রিয়া সত্ত্বেও এজেন্টদের নীতিসমূহ একটি স্থিতিশীল ভারসাম্যের দিকে অভিসৃত হয়, যা মোতায়েনকৃত মাল্টি-এজেন্ট সিস্টেমের নির্ভরযোগ্যতার জন্য একটি অপরিহার্য শর্ত।