এআই গ্লসারি
কৃত্রিম বুদ্ধিমত্তার সম্পূর্ণ অভিধান
এনসেম্বল মডেল
সাধারণীকরণ ত্রুটি হ্রাস এবং পূর্বাভাস সমন্বয়ের জন্য একই সাথে একাধিক পূর্বাভাস মডেল প্রশিক্ষণের পদ্ধতি। এই কৌশলটি শক্তিশীলতা উন্নত করে এবং রিইনফোর্সমেন্ট লার্নিং সিস্টেমে এপিস্টেমিক অনিশ্চয়তা অনুমান করতে সক্ষম করে।
এনসেম্বল বুটস্ট্র্যাপ
বিভিন্ন প্রশিক্ষণ ডেটাসেট তৈরি করতে প্রতিস্থাপন সহ নমুনা পদ্ধতি, যা পূর্বাভাসের পরিবর্তনশীলতা ক্যাপচার করতে বিভিন্ন উপসেটে একাধিক মডেল প্রশিক্ষণের অনুমতি দেয়। মডেল-ভিত্তিক RL-এ অনিশ্চয়তা অনুমানের জন্য বিশেষভাবে কার্যকর।
এনসেম্বল পূর্বাভাস
একটি এনসেম্বল গঠনকারী একাধিক মডেলের পূর্বাভাস সমষ্টিগত করার কৌশল, সাধারণত গড় বা ভোটের মাধ্যমে, আরও স্থিতিশীল এবং সঠিক চূড়ান্ত পূর্বাভাস পাওয়ার জন্য। পৃথক পূর্বাভাসের মধ্যে প্রকরণ মডেলের অনিশ্চয়তা পরিমাপ করে।
সিদ্ধান্তের শক্তিশীলতা
সিদ্ধান্তের আত্মবিশ্বাস মূল্যায়ন করতে এনসেম্বল ব্যবহার করে মডেল অনিশ্চয়তা এবং পরিবেশের পরিবর্তনের মুখে গ্রহণযোগ্য কর্মক্ষমতা বজায় রাখার একটি এজেন্টের ক্ষমতা। বাস্তব পরিবেশে RL এজেন্ট মোতায়েনের জন্য গুরুত্বপূর্ণ।
এনসেম্বল গড়
সমষ্টিগত পদ্ধতি যেখানে চূড়ান্ত পূর্বাভাস হল এনসেম্বলের প্রতিটি মডেলের পৃথক পূর্বাভাসের গড়, পক্ষপাত এবং প্রকরণ হ্রাস করার পাশাপাশি অনিশ্চয়তার একটি প্রাকৃতিক পরিমাপ প্রদান করে। RL-এ আধুনিক এনসেম্বল পদ্ধতির ভিত্তি।
অনিশ্চয়তা ওজন
এনসেম্বল দ্বারা অনুমানিত অনিশ্চয়তা ব্যবহার করে সিদ্ধান্তের ওজন নির্ধারণের কৌশল, শোষণের সময় আরও নিশ্চিত পূর্বাভাস সহ কর্মকে অগ্রাধিকার দেয় এবং উচ্চ অনিশ্চয়তা সহ অঞ্চলগুলি অন্বেষণ করে। RL-এ অন্বেষণ-শোষণ ভারসাম্য উন্নত করে।
অনিশ্চয়তা-নির্দেশিত অন্বেষণ
এনসেম্বল থেকে অনিশ্চয়তা পরিমাপ ব্যবহার করে এজেন্টকে কম পরিচিত অবস্থার দিকে নির্দেশিত করার অন্বেষণ নীতি, মডেল শেখার উন্নতির জন্য তথ্য সংগ্রহ অপ্টিমাইজ করে। কৌতূহল-ভিত্তিক অন্বেষণ পদ্ধতির জন্য কার্যকর বিকল্প।
আনুমানিক বেইজিয়ান
মডেল প্যারামিটারের পোস্টেরিয়র বন্টন অনুমান করতে নিউরাল নেটওয়ার্কের এনসেম্বল ব্যবহার করে সঠিক বেইজিয়ান অনুমানের আনুমানিক। RL-এ অনিশ্চয়তা পরিমাপের জন্য ব্যবহারিক সম্ভাব্য ব্যাখ্যা প্রদান করে।
এলোমেলো অনিশ্চয়তা
প্রক্রিয়ার অন্তর্নিহিত অনিশ্চয়তা, যা অসীম ডেটা থাকলেও অপরিবর্তনীয়, পরিবেশ বা পর্যবেক্ষণে স্টোকাস্টিক নয়েজের ফলে সৃষ্ট। আধুনিক কোয়ান্টিফিকেশন পদ্ধতিতে এপিস্টেমিক অনিশ্চয়তা থেকে পৃথকীকৃত।
এনসেম্বল ভ্যারিয়েন্স
একটি এনসেম্বলের বিভিন্ন মডেলের মধ্যে পূর্বাভাসের বিচ্ছুরণ পরিমাপক মেট্রিক, মডেল-ভিত্তিক RL সিস্টেমে এপিস্টেমিক অনিশ্চয়তার জন্য সরাসরি প্রক্সি হিসেবে কাজ করে। স্টেট স্পেসের কম অন্বেষণকৃত অঞ্চলে বেশি হয়।
পোস্টেরিয়র প্রেডিক্টিভ ডিস্ট্রিবিউশন
ভবিষ্যতের স্টেট বা রিওয়ার্ডের উপর সম্পূর্ণ ডিস্ট্রিবিউশন যা মডেল প্যারামিটারের অনিশ্চয়তা এবং প্রক্রিয়া নয়েজ উভয়ই অন্তর্ভুক্ত করে, অনুশীলনে এনসেম্বল পূর্বাভাস দ্বারা আনুমানিক। RL-এ রোবাস্ট প্ল্যানিংয়ের জন্য মৌলিক।
স্যাম্পলিং দক্ষতা
একটি অ্যালগরিদমের ন্যূনতম পরিবেশের সাথে ইন্টারঅ্যাকশনের মাধ্যমে শেখার ক্ষমতার পরিমাপ, এনসেম্বল দ্বারা উন্নত যা কার্যকর জ্ঞান স্থানান্তর এবং টার্গেটেড এক্সপ্লোরেশন সক্ষম করে। ডেটা-ব্যয়বহুল RL অ্যাপ্লিকেশনের জন্য সমালোচনামূলক।
এনসেম্বল জেনারালাইজেশন
এনসেম্বল পদ্ধতির অদেখা স্টেটে ভালোভাবে জেনারালাইজ করার ক্ষমতা, একাধিক আংশিকভাবে সঠিক মডেলের জ্ঞান একত্রিত করে, ওভারফিটিং হ্রাস করে এবং ডিস্ট্রিবিউশন ভ্যারিয়েশনে রোবাস্টনেস উন্নত করে।
এনসেম্বল হাইপারপ্যারামিটার
এনসেম্বল কনফিগারেশন নিয়ন্ত্রণকারী প্যারামিটার, যার মধ্যে মডেলের সংখ্যা, বুটস্ট্র্যাপ রেট, অ্যাগ্রিগেশন পদ্ধতি এবং ডাইভারসিফিকেশন কৌশল অন্তর্ভুক্ত। পারফরম্যান্স এবং কম্পিউটেশনাল কমপ্লেক্সিটির মধ্যে ট্রেড-অফ অপ্টিমাইজ করার জন্য গুরুত্বপূর্ণ।