Friday, December 11, 2015

एजेंट और परिवेश ( Agent and Environment)

  एजेंट  और परिवेश (Agent and Environment)

कृत्रिम बुद्धिमत्ता, एजेंट (Agent) और उसके परिवेश (Environment) से मिलकर बनी होती है. एजेंट अपने परिवेश में काम करता है. एक परिवेश (Environment) में अनेक एजेंट (Agent) सम्मिलित हो सकते हैं.

एजेंट (Agent) और परिवेश (Environment) क्या हैं?

एक एजेंट (Agent)  कुछ भी हो सकता है जो अपने परिवेश (Environment) को sensor (ज्ञानेंद्री) की मदद से समझता है और उस परिवेश में effectors (प्रेरक) की मदद से काम करता है.
·         एक मानव एजेंट (human agent) में संवेदी के रुप में आँख, कान, नाक, जीभ, और त्वचा होती हैं जो की sensor (ज्ञानेंद्री)  के समान में काम करती है, और अन्य अंग जैसे कि हाथ, पैर, मुंह effectors (प्रेरक) की तरह व्यवहार करते है.
·         एक रोबोटिक एजेंट कैमरा और इंफ्रारेड रेंज फाइंडर को सेंसर की तरह से उपयोग करता है और भिन्न मोटर और एक्टुएटर को एफ्फेक्टोर की तरह से प्रयोग करता है.
·         एक सॉफ्टवेर एजेंट के पास प्रोग्राम के रुप में इनकोडिंग बिट स्ट्रिंग्स (encoded bit strings) होते हैं जो निर्देश देते हैं.
)

एजेंट शब्दावली

एजेंट की कार्यक्षमता (Performance Measure) यह एक मापदंड है, जो निर्धारित करता है की एजेंट कितना सफल है.
एजेंट का व्यवहार (Behavior of Agent) यह वह कार्रवाई हैं जो एक एजेंट दिए गए निर्देशों के अनुक्रम में करता है.
प्रतिबोध (Percept) – यह एजेंट द्वार किसी दिए गए पल को लेकर अवधारणा बनाना है.
प्रतिबोध क्रम (Percept Sequence) – यह उन सभी चीजों का वृतांत है जिनको लेकर एजेंट ने अब तक अवधारणा बनाई है. 
एजेंट फंक्शन (Agent Function) – यह एजेंट द्वारा किसी प्रतिबोध क्रम से उसके द्वारा कार्यवाही किए जाने तक का प्रति चित्रण है.
तर्क शक्ति (Rationality)- तर्क शक्ति से मतलब उस अवस्था से है जिसमें तर्क करने, संवेदी होने और निर्णय लेने की अच्छी समझ हो.
तर्क शक्ति का संबंध संभावित कृत्यों और उसके परिणामों से भी है जिसे एजेंट ने सुझाया है. उचित व उपयोगी सूचनाओं को प्राप्त करने के लिए किसी कृत्य को करना तर्क शक्ति का महत्वपूर्ण हिस्सा है.

आदर्श तर्कसंगत एजेंट Ideal Rational Agent

एक आदर्श तर्कसंगत एजेंट वह होता है, जो कि उन संभावित कृत्यों को करने के सक्षम होता है जो कि प्रदर्शन क्षमता का निम्न के आधार पर अधिकतम प्रदर्शन कर सके-
·         प्रतिबोध क्रम (percept sequence)
·         तैयार ज्ञानधार (built-in knowledge base)
किसी एजेंट की तर्क शक्ति निम्न चार अवयवों पर निर्भर करती है-
·         प्रदर्शन क्षमता (performance measures), जो की सफलता के अंश का निर्धारण करती है.
·         एजेंट का अब तक का प्रतिबोध क्रम (Percept Sequence).
·         एजेंट को परिवेश के बारे में पूर्व ज्ञान (prior knowledge about the environment).
·         वह कृत्य (actions)  जो एजेंट कर सकता है.
एक तर्कसंगत एजेंट हमेशा सही कृत्य करता है, जहां सही कृत्यों के करने से मतलब एजेंट द्वारा कृत्यों को प्रतिबोध के क्रम में उस तरह से करने से है जो अधिकतम सफलता दिला सके. वह समस्या जिसका एक एजेंट समाधान करता है उसका विश्लेषण PEAS, प्रदर्शन क्षमता (performance measure), वातावरण (environment), एक्टुएटर (actuator) और सेंसर (sensors) से होता है.

इंटेलीजेंट एजेंट की संरचना

किसी एजेंट की संरचना को निम्न प्रकार से देखा जाता है
एजेंट= आर्किटेक्चर + एजेंट प्रोग्राम (Agent = Architecture + Agent Program)
आर्किटेक्चर (Architecture) = वह मशीनरी जिस पर एजेंट कार्यवाही निष्पादित करता है. 
एजेंट प्रोग्राम (Agent Program) = एजेंट फंक्सन का कार्यान्वयन.

Simple Reflex Agents

·         वह केवल वर्तमान प्रतिबोध (current percept) के आधार पर कार्रवाई करते हैं.
·         यदि सही निर्णय वर्तमान प्रतिबोध के आधार पर ही किया जाता है, वह तर्कसंगत होते हैं.
·         उनका वातावरण (environment) पूरी तरह से प्रत्यक्ष (observable) होता है.
Condition-Action Rule – यह वह नियम है जो किसी कार्यवाही की अवस्था (स्थिति) का प्रति चित्रण करता है.

Model Based Reflex Agents

वह अपने कार्यों को करने के लिए सांसारिक प्रतिरूपों (Model) का उपयोग करते हैं और वह आंतरिक अवस्था  (internal state) को बनाए रखते हैं.
Model − वह ज्ञान (knowledge) कैसे चीजें वास्तविक संसार में होती हैं.
Internal State – वर्तमान स्थिति का प्रतिनिधित्व जो कि पिछली अवस्था पर निर्भर कर सकता है.
किसी अवस्था (state) का अद्यतन (Update) निम्न सूचना को चाहता है-   
·         कैसे परिवेश सम्मिलित है. (How the world evolves)
·         कैसे एजेंट का कृत्य परिवेश को प्रभावित करता है. (How the agent’s actions affect the world)

Goal Based Agents

यह अपने actions को उस क्रम में निर्धारित करते हैं जिससे की वह लक्ष्य (goals) को प्राप्त कर सकें. लक्ष्य आधारित अवधारणा Reflex आधारित धारणा से ज्यादा लचीली होती है, क्योंकि तब ज्ञान (knowledge) निर्णय को लेने में मदद करता है और बदलाव की अनुमति देता है.
Goal (लक्ष्य) यह चाहे जाने वाली स्थिति का विवरण है.

Utility Based Agents

यह कृत्यों (actions) का चयन प्रत्येक अवस्था (state) की प्राथमिकता/ उपयोगिता (preference/utility) के आधार पर करते हैं. लक्ष्य (Goal) अप्रभावी होते हैं जब -
·         वहां विवादित लक्ष्य (conflicting goals) होते हैं जिनमें से कुछ ही को पाया जा सकता है.
·         लक्ष्यों की प्राप्ति में अनिश्चितता होती है और आप लक्ष्य सफलता की दर पर ज्यादा जोर देते हैं उसकी सार्थकता की जगह.

परिवेश का स्वभाव (Nature of Environments)

कुछ प्रोग्राम पूरी तरह से कृत्रिम परिवेश में काम करते हैं जोकि कीबोर्ड, डाटा बेस, कंप्यूटर फाइल सिस्टम और स्क्रिन पर character आउटपुट पर निर्भर होते हैं.
इसके विपरीत कुछ सॉफ्टवेयर एजेंट (सॉफ्टवेयर रोबोट) बहुत ही वास्तविक वातावरण में काम करते हैं. सिम्युलेटर (simulator) का बहुत ही जटिल वातावरण होता है जो कि वास्तविक वातावरण के काफी समान होता है. यहां सॉफ्टवेयर एजेंट को काफी सारी निर्णयों को वास्तविक समय (real time) में लेकर कार्यवाहियों को करना होता है. यहां रियल टाईम साफ्टवेयर हैं जो कि ग्राहक के online व्यवहार को जानकर उसकी चाहना के अनुरूप उत्पाद प्रस्तुत करते हैं या सुझाव देते हैं जो कि वास्तविक के साथ ही कृत्रिम परिवेश में भी काम करते हैं.
सबसे  प्रसिद्ध आर्टिफिशल परिवेश है Turing Test environment है, जिसमें एक वास्तविक और दूसरे कृत्रिम एजेंट का परीक्षण समान आधार पर किया जाता है. यह बहुत ही चुनौती भरा environment है क्योंकि सॉफ्टवेयर एजेंट के लिए आदमी की तरह से काम करना काफी कठिन होता है.

Turing Test

किसी भी प्रणाली के बुद्धिमत्ता पूर्ण व्यवहार (intelligent behavior) की माप Turing Test से की जा सकती है.
दो व्यक्ति और एक मशीन जिनका परीक्षण करना है वह परीक्षण में हिस्सा लेती हैं. इन दो व्यक्तियों में से, एक परीक्षक का काम करता है. प्रत्येक भिन्न कमरों में बैठते हैं.  परीक्षक इससे अनभिज्ञ होता है की कौन मशीन है और कौन मानव है. वह कंप्यूटर पर टाइप करके प्रश्न करता है, और उसे दोनों Intelligence (बुद्धिमत्ता)  को भेजता है, जिसके जवाब में उसे टाइप की हुई प्रतिक्रिया मिलती है.
इस परीक्षण का लक्ष्य परीक्षक को बेवकूफ बनाना होता है. यदि परीक्षक मशीन की प्रक्रिया को जानने में असफल रहता है, तब मशीन को intelligent कहा जाता है.

परिवेश के प्रकार (Types of Environment)

असतत/ सतत (Discrete / Continuous) यदि यहां भिन्न-भिन्न, स्पष्टतः परिभाषित, environment की अवस्था (states) होती हैं, तब environment को असतत (discrete) कहते हैं (उदाहरण के लिए, शतरंज); अन्यथा वह सतत (continuous) कहलाता है  (उदाहरण के लिए, कार का चलाना).
प्रत्यक्ष/ आंशिक प्रत्यक्ष (Observable / Partially Observable) – यदि समय के हर बिंदु पर environment की पूर्ण अवस्था का निर्धारण किया जा सकता है तो वह प्रत्यक्ष है; अन्यथा वह केवल आंशिक प्रत्यक्ष  है.
स्थिर/ गतिमान (Static / Dynamic) – यदि environment में बदलाव नहीं होता है जब की एजेंट कार्यरत है, तब वह स्थिर (static); अन्यथा वह गतिमान (dynamic) है.
एकल एजेंट/ बहुविध एजेंट (Single agent / Multiple agents) – किसी वातावरण में एक या अनेक एजेंट एक की प्रकार के या भिन्न प्रकार के हो सकते हैं.
गम्य/ अगम्य (Accessible / Inaccessible) यदि एजेंट के संवेदी तंत्र (sensory apparatus) की पहुंच environment की सभी अवस्था में होती है तब गम्य परिवेश अन्यथा अगम्य.
निश्चयात्मक/ गैर-निश्चयात्मक (Deterministic / Non-deterministic) – यदि environment की अगली अवस्था का पूर्ण निर्धारण वर्तमान अवस्था से और एजेंट के कृत्यों से किया जा सकता है, तब environment  deterministic; अन्यथा वह non-deterministic है.

प्रासंगिक/ गैर-प्रासंगिक (Episodic / Non-episodic) – प्रासंगिक वातावरण में प्रत्येक प्रकरण जो किस एजेंट को समाहित करता है वह उसे समझता है और फिर कार्यवाही करता है. किसी कार्यवाही की गुणवत्ता प्रकरण पर निर्भर करती है. अगला प्रकरण पिछले प्रकरणों की कार्यवाही पर निर्भर नहीं करता है. Episodic environments ज्यादा सरल होते हैं क्योंकि एजेंट को अगले प्रकरण के लिए नहीं सोचना होता है. 

No comments: