এআই গ্লসারি
কৃত্রিম বুদ্ধিমত্তার সম্পূর্ণ অভিধান
মাল্টি-স্টেপ ট্র্যাজেক্টরি প্রেডিকশন
একটি কৌশল যা বাস্তবায়নের আগে দীর্ঘমেয়াদী পরিণতি মূল্যায়নের জন্য একাধিক সময় ধাপে ভবিষ্যত অবস্থার একটি ধারাবাহিক ক্রম পূর্বাভাস দেয়।
মন্টে কার্লো সার্চ ট্রি
একটি গাছের মতো অনুসন্ধান অ্যালগরিদম যা একটি প্রদত্ত অবস্থা থেকে সম্ভাব্য ভবিষ্যত ট্র্যাজেক্টরি মূল্যায়নের জন্য এলোমেলো সিমুলেশন ব্যবহার করে, কর্ম নির্বাচন অপ্টিমাইজ করে।
অ্যান্টিসিপেটরি প্ল্যানিং
বাস্তব পরিবেশের সাথে কোন ইন্টারঅ্যাকশন ছাড়াই সর্বোত্তম নীতি নির্বাচনের জন্য শেখা মডেল ব্যবহার করে ভবিষ্যত কর্মের ক্রমিক মূল্যায়নের প্রক্রিয়া।
এনভায়রনমেন্টাল ডাইনামিক্স মডেল
এজেন্টের কর্মের পরিণতি সঠিকভাবে পূর্বাভাস দেওয়ার জন্য পরিবেশের ভৌত নিয়ম এবং অবস্থার পরিবর্তন ক্যাপচার করতে প্রশিক্ষিত নিউরাল নেটওয়ার্ক।
মডেল ইমাজিনেশন
শারীরিক ইন্টারঅ্যাকশন ছাড়াই তার অভ্যন্তরীণ পরিবেশ মডেল ব্যবহার করে মানসিকভাবে বিকল্প পরিস্থিতি এবং ট্র্যাজেক্টরি তৈরি করার সিস্টেমের ক্ষমতা।
অ্যান্টিসিপেটরি রোলআউট
প্রত্যাশিত ক্রমিক পুরস্কার মূল্যায়নের জন্য শেখা মডেল ব্যবহার করে প্রাথমিক অবস্থা থেকে কর্মের একটি সম্পূর্ণ ক্রম সিমুলেশন।
ভার্চুয়াল ট্রায়াল লার্নিং
একটি প্যারাডাইম যেখানে এজেন্ট প্রধানত পরিবেশের সাথে সরাসরি ইন্টারঅ্যাকশনের পরিবর্তে তার অভ্যন্তরীণ মডেলে সিমুলেটেড অভিজ্ঞতার মাধ্যমে উন্নতি করে।
জেনারেটিভ ট্র্যাজেক্টরি মডেল
ডিপ লার্নিং আর্কিটেকচার যা একটি নির্ণায়ক পূর্বাভাসের পরিবর্তে সম্ভাব্য ট্র্যাজেক্টরির বন্টন তৈরি করে, পরিবেশের স্টোকাস্টিক প্রকৃতি ক্যাপচার করে।
সিমুলেশন এক্সপ্লোরেশন
একটি অনুসন্ধান কৌশল যেখানে এজেন্ট বাস্তবে পরীক্ষা করার আগে তার মডেলে ব্যাপকভাবে দৃশ্যকল্প সিমুলেট করে নতুন নীতিসমূহ আবিষ্কার করে।
স্টেট-অ্যাকশন প্রেডিকশন
একটি মডেল যা বর্তমান অবস্থা s(t) এবং কর্ম a(t) এর ভিত্তিতে সরাসরি পরবর্তী অবস্থা s(t+1) পূর্বাভাস দেয়, যা মৌলিক ট্রানজিশন সমীকরণ গঠন করে।
কাল্পনিক অভিজ্ঞতা বাফার
একটি ডেটা স্ট্রাকচার যা প্রশিক্ষণের জন্য মডেল দ্বারা উৎপন্ন সিমুলেটেড ট্র্যাজেক্টরি সংরক্ষণ করে, পরিবেশে সংগৃহীত বাস্তব অভিজ্ঞতাকে পরিপূরক করে।
গ্লোবাল মডেল লার্নিং
একটি পদ্ধতি যেখানে একটি একক মডেল পরিবেশের সম্পূর্ণ গতিবিদ্যা শেখে, সমস্ত কাজ এবং নীতির মধ্যে ভাগ করা হয় উন্নত সাধারণীকরণের জন্য।
ট্র্যাজেক্টরি প্রেডিকশন নেটওয়ার্ক
একটি বিশেষায়িত নিউরাল আর্কিটেকচার যা ভবিষ্যত অবস্থার ক্রম পূর্বাভাসে বিশেষজ্ঞ, প্রায়শই টেম্পোরাল নির্ভরতা ক্যাপচার করার জন্য RNN বা ট্রান্সফরমার ভিত্তিক।
মডেল ভ্যালিডেশন
সিমুলেটেড ট্র্যাজেক্টরির নির্ভরতা নিশ্চিত করার জন্য হেল্ড-আউট ডেটায় মডেলের ভবিষ্যদ্বাণীমূলক নির্ভুলতা মূল্যায়নের পদ্ধতিগত প্রক্রিয়া।
কাউন্টারফ্যাকচুয়াল জেনারেশন
একটি কৌশল যা বিভিন্ন সিদ্ধান্তের প্রভাব বোঝার এবং মডেলের কার্যকারণ বোঝার উন্নতির জন্য হাইপোথেটিক্যাল বিকল্প ট্র্যাজেক্টরি তৈরি করে।