माइक्रोसॉफ़्ट के एआई ने सही एमएस पीएसी-मैन स्कोर अर्जित किया

गेटी इमेज के माध्यम से डेनवर पोस्ट

कुछ कार्य बहुत जटिल हैं, सभी को एक साथ निपटाने के लिए बहुत बारीक हैं, जैसे अटारी 2600 पर Ms. Pac-Man के सभी 256 स्तरों को हराकर 999,990 का पूर्ण स्कोर अर्जित करना। यही कारण है कि माइक्रोसॉफ्ट ने अपने एआई को एक बार में इसे चालू करने के लिए प्रशिक्षित करने की कोशिश भी नहीं की। इसके बजाय, कंपनी ने, जैसा कि बुधवार को घोषणा की, इस स्मारकीय चुनौती को छोटे, छोटे आकार के टुकड़ों में विभाजित किया और एक टीम के रूप में इसे पूरा करने के लिए 150 AI के एक हाइवमाइंड को प्रशिक्षित किया।

एक कनाडाई एआई फर्म मालुबा द्वारा विकसित, जिसे माइक्रोसॉफ्ट ने हाल ही में हासिल किया है, एआई सिस्टम अपनी रणनीति विकसित करने के लिए सुदृढीकरण सीखने पर निर्भर करता है। सुदृढीकरण सीखना एक एआई प्रशिक्षण तकनीक है जिसमें एल्गोरिथ्म को अधिक कुशल परिणामों का उपयोग करने के लिए पुरस्कृत किया जाता है और पहले देखे गए परिणामों के आधार पर कम प्रभावी का उपयोग करने से मना किया जाता है। विचार यह है कि, पर्याप्त समय और प्रयास के साथ, सिस्टम अंततः अपने आप ही यह पता लगा लेगा कि कार्रवाई का सबसे अच्छा तरीका क्या होगा। यह वही तकनीक है जिसका इस्तेमाल गूगल दुनिया के गो चैंपियन को मात देने के लिए करता था।



लेकिन पर्याप्त रूप से जटिल कार्यों के साथ, एक सरल सुदृढीकरण सीखने की प्रणाली बहुत धीमी है - शेक्सपियर के संपूर्ण कार्यों को पुन: प्रस्तुत करने वाले टाइपराइटर पर बंदरों को सोचें। इसलिए, मलूबा टीम ने कार्य को छोटे उप-कार्यों में विभाजित किया, जैसे भूतों से बचना या भूलभुलैया के भीतर एक विशिष्ट गोली तक पहुंचना, और प्रत्येक को 150 समानांतर तंत्रिका नेटवर्क में से एक का पता लगाने के लिए दिया। टीम ने तब झुंड के कार्यों को निर्देशित करने और खेल को हराने के अपने सामान्य लक्ष्य को प्राप्त करने में मदद करने के लिए नेटवर्क के उस सरणी के शीर्ष पर एक मास्टर एआई स्थापित किया।

मास्टर एआई किसी दिए गए परिदृश्य में प्रत्येक उप-एआई की प्रतिक्रिया लेता है, उनका वजन करता है और फिर समूह के लिए निर्णय लेता है। यही है, भले ही आधे उप-एआई कह रहे हों कि 'ठीक है, उस गोली को ले आओ', लेकिन कुछ कह रहे हैं 'नहीं, नहीं, उस हॉल के नीचे एक भूत है' मास्टर एआई न मरने के लिए टाल देगा पेलेट-गेटर्स के बजाय आकस्मिक। टीम ने अपनी अनूठी प्रणाली को हाइब्रिड रिवार्ड आर्किटेक्चर करार दिया है।

गेमप्ले के परिणाम अपने लिए बोलते हैं लेकिन कंपनी इस सफलता का लाभ उठाकर भविष्य के एआई सिस्टम को तेज, अधिक विश्वसनीय और अधिक आत्मनिर्भर बनाने की उम्मीद करती है। जैसा कि माइक्रोसॉफ्ट ब्लॉग बताता है, इस तकनीक का उपयोग बिक्री टीम द्वारा यह पता लगाने के लिए किया जा सकता है कि पूरे सप्ताह या दिन में किसी भी समय किन ग्राहकों को सबसे अधिक ध्यान देने की आवश्यकता है। इसे प्राकृतिक भाषा पहचान प्रणाली में सुधार के लिए भी नियोजित किया जा सकता है। लेकिन आइए देखें कि यह कोनामी कोड का उपयोग किए बिना कॉन्ट्रा को हरा देता है।

अनुशंसित कहानियां

नई ऑडी ए8 खुद को पार्क करने के लिए एआई का उपयोग करती है

अपनी खुद की कार क्यों पार्क करें जब कृत्रिम बुद्धिमत्ता यह पता लगा सकती है कि यह आपके लिए कैसे किया जाए?

नासा का मार्स 2020 कॉन्सेप्ट स्पेस बैटमैन के लिए एकदम सही है

नासा ने कैनेडी स्पेस सेंटर में फ्यूचरिस्टिक मार्स 2020 रोवर कॉन्सेप्ट का खुलासा किया है।

Google होम ने DIY मरम्मत के लिए शीर्ष अंक अर्जित किए

स्मार्ट डिवाइस ने प्रतिद्वंद्वी अमेज़न इको को पछाड़ते हुए 10 में से आठ का औसत स्कोर किया।

इसके बजाय Google का उपयोग करने के लिए एमएस वर्ड में बिंग के साथ खोज कैसे बदलें

माइक्रोसॉफ्ट वर्ड के संदर्भ मेनू में एक मेनू आइटम है जिसे ज्यादातर लोगों ने देखा है लेकिन इसका उपयोग नहीं करते हैं - बिंग का उपयोग करके चयन की खोज करने की क्षमता। आप इसके बजाय Google के माध्यम से खोज करने के लिए इसे बदलकर इस सुविधा को और भी उपयोगी बना सकते हैं।