एथलेटिक आंदोलनों के लिए प्रशिक्षण रोबोट
क्या रोबोट एथलीटों की तरह आगे बढ़ सकते हैं?एक नया प्रशिक्षण मॉडल उन्हें खेल चालों को दोहराने में मदद करता है, लेकिन परिणाम प्रगति और अप्रत्याशित चुनौतियों दोनों को दिखाते हैं।
एनवीडिया के दो सहयोगियों के साथ कार्नेगी मेलन विश्वविद्यालय के एआई और रोबोटिक्स शोधकर्ताओं की एक टीम ने मानव एथलीटों की तरह आगे बढ़ने के लिए रोबोट को प्रशिक्षित करने के लिए एक नया मॉडल बनाया है।टीम ने देखा कि अधिकांश रोबोट प्रशिक्षण लोकोमोशन पर ध्यान केंद्रित करता है, जिससे रोबोट होते हैं जो कुशलता से लेकिन तरलता या एथलेटिकवाद के बिना चलते हैं।इसे संबोधित करने के लिए, उन्होंने पूरे शरीर के प्रशिक्षण की खोज की।उन्होंने पाया कि मौजूदा मॉडल में अनुकूलन क्षमता का अभाव था और बहुत सारे मापदंडों पर भरोसा किया, जिससे रोबोट आंदोलनों को सतर्क कर दिया गया।इसने उन्हें एक नया दो-चरण प्रशिक्षण ढांचा विकसित करने के लिए प्रेरित किया।
पहला चरण पूरे शरीर के मानव गति वीडियो का विश्लेषण करने के लिए एआई मॉड्यूल को प्रशिक्षित करता है, मोशन ट्रैकिंग का उपयोग करके रोबोट की क्षमताओं को फिट करने के लिए प्रमुख आंदोलनों को समायोजित करता है।दूसरा चरण वीडियो में मानव आंदोलन के बीच की खाई को पाटने के लिए वास्तविक दुनिया के डेटा को इकट्ठा करता है और रोबोट शारीरिक रूप से कैसे आगे बढ़ सकते हैं।इस प्रक्रिया ने एक रूपरेखा को संरेखित सिमुलेशन और वास्तविक भौतिकी (ASAP) कहा।
ASAP ढांचे में चार चरण होते हैं।सबसे पहले, मोशन ट्रैकिंग प्री-ट्रेनिंग और वास्तविक प्रक्षेपवक्र संग्रह में मानव वीडियो से मानवीय गति को फिर से शामिल करना शामिल है।वास्तविक दुनिया के आंदोलन प्रक्षेपवक्रों को उत्पन्न करने के लिए कई गति ट्रैकिंग नीतियों को पूर्व-प्रशिक्षित किया जाता है।अगला, डेल्टा एक्शन मॉडल प्रशिक्षण वास्तविक दुनिया के रोलआउट डेटा का उपयोग करके किया जाता है।यह कदम मॉडल की सटीकता में सुधार करते हुए, नकली राज्य और वास्तविक वास्तविक दुनिया की स्थिति के बीच विसंगति को कम करता है।
पॉलिसी फाइन-ट्यूनिंग स्टेज में, डेल्टा एक्शन मॉडल जमे हुए है और वास्तविक दुनिया के भौतिकी के साथ बेहतर संरेखित करने के लिए सिम्युलेटर में एकीकृत है।पूर्व-प्रशिक्षित मोशन ट्रैकिंग नीति तब अधिक सटीकता के लिए ठीक-ठाक है।अंत में, वास्तविक दुनिया की तैनाती में, डेल्टा एक्शन मॉडल पर भरोसा किए बिना, ठीक-ठीक ट्यून की गई नीति को वास्तविक दुनिया में सीधे लागू किया जाता है, यह सुनिश्चित करना कि रोबोट स्वतंत्र रूप से अपने प्रशिक्षित आंदोलनों का प्रदर्शन कर सकता है।
ढांचे का परीक्षण करने के लिए, शोधकर्ताओं ने प्रतिष्ठित खेल चालों को दोहराने के लिए एक रोबोट को प्रशिक्षित किया।इसने कोबे ब्रायंट के फेडवे कूद शॉट, लेब्रोन जेम्स के साइलेंसर मूव, और क्रिस्टियानो रोनाल्डो के एसआईयू लीप के साथ मिड-एयर स्पिन के साथ प्रदर्शन किया।प्रत्येक आंदोलन दर्ज किया गया था।
रोबोट के आंदोलन स्पष्ट रूप से प्रसिद्ध खेल चालों से मिलते-जुलते हैं, जो पूर्ण शरीर की गति में प्रगति को उजागर करते हैं।हालांकि, यह भी स्पष्ट है कि एक पेशेवर एथलीट के लिए एक रोबोट को गलत होने से पहले बहुत अधिक काम की आवश्यकता है।