घरसमाचारएआई-ऑप्टिमाइज़्ड स्टोरेज आर्किटेक्चर

एआई-ऑप्टिमाइज़्ड स्टोरेज आर्किटेक्चर

एआई सिस्टम को बड़े पैमाने पर संदर्भ मेमोरी और मल्टी-टर्न रीजनिंग को संभालने में मदद करने के लिए डिज़ाइन किया गया अगली पीढ़ी का स्टोरेज इंफ्रास्ट्रक्चर बड़े पैमाने पर अनुमान वर्कलोड का समर्थन करने के तरीके को दोबारा आकार देने के लिए तैयार है।



एनवीआईडीआईए द्वारा एआई-उन्मुख भंडारण प्रौद्योगिकी का एक नया वर्ग उभरा है जो आधुनिक एआई वर्कलोड में सबसे कठिन चुनौतियों में से एक से निपटता है: अनुमान के दौरान बड़ी मात्रा में संदर्भ डेटा को कुशलतापूर्वक प्रबंधित करना और साझा करना।एआई की विशिष्ट जरूरतों के बजाय सामान्य गणना के लिए बनाए गए पारंपरिक भंडारण और मेमोरी पदानुक्रम को बनाए रखने के लिए संघर्ष करना पड़ता है क्योंकि मॉडल मल्टी-एजेंट, मल्टी-टर्न रीजनिंग सिस्टम में विकसित होते हैं जिन्हें लगातार, बड़ी क्षमता वाली संदर्भ मेमोरी की आवश्यकता होती है।

विकास का मूल एक विशेष डेटा प्रोसेसर है जो नव घोषित एआई-नेटिव स्टोरेज आर्किटेक्चर को रेखांकित करता है, जो जीपीयू मेमोरी का विस्तार करता है और उच्च बैंडविड्थ और पूर्वानुमानित विलंबता के साथ क्लस्टर में कुंजी-मूल्य (केवी) अनुमान कैश साझा करता है।यह परिवर्तन एआई के एकल त्वरित प्रसंस्करण से निरंतर, लंबे-संदर्भ तर्क में परिवर्तन से प्रेरित है, जहां प्रतिक्रिया और सटीकता के लिए बड़ी साझा मेमोरी आवश्यक है।

प्रमुख विशेषताएं हैं:

लंबे-संदर्भ अनुमान के लिए क्लस्टर-स्केल कुंजी-मूल्य कैश क्षमता के साथ जीपीयू मेमोरी का विस्तार करता है।
पारंपरिक भंडारण की तुलना में 5× तक अधिक टोकन-प्रति-सेकंड थ्रूपुट।
हार्डवेयर-त्वरित केवी कैश प्लेसमेंट मेटाडेटा ओवरहेड और डेटा गति को कम करता है।
उच्च-प्रदर्शन ईथरनेट के माध्यम से नोड्स में संदर्भ का कुशल साझाकरण।
पारंपरिक भंडारण आर्किटेक्चर की तुलना में 5× तक बेहतर बिजली दक्षता।
प्रमुख भंडारण और सिस्टम विक्रेताओं सहित उद्योग भागीदार पहले से ही सहायक प्लेटफार्मों का निर्माण कर रहे हैं, 2026 की दूसरी छमाही में उपलब्धता की योजना बना रहे हैं। प्रारंभिक बेंचमार्क और अनुमान अनुमानित कार्यभार के लिए महत्वपूर्ण प्रदर्शन और दक्षता लाभ को उजागर करते हैं जो तेजी से संदर्भ पहुंच और साझाकरण पर निर्भर करते हैं।कच्चे प्रदर्शन से परे, नया बुनियादी ढांचा स्केलेबिलिटी और ऊर्जा दक्षता को संबोधित करता है, दो बाधाएं जो एआई वर्कलोड बढ़ने के कारण डेटा केंद्रों को परेशान करती हैं।होस्ट सीपीयू से स्टोरेज सेवाओं को अलग करके और कुंजी-मूल्य कैश डेटा के हार्डवेयर-त्वरित प्लेसमेंट को सक्षम करके, आर्किटेक्चर समान लोड के तहत पारंपरिक स्टोरेज सिस्टम की तुलना में प्रति सेकंड संसाधित टोकन और पावर दक्षता में पांच गुना सुधार का वादा करता है।

यह डिज़ाइन उच्च-प्रदर्शन नेटवर्किंग, मेमोरी और स्टोरेज फ़ंक्शंस के बीच सख्त एकीकरण लाता है, कम-विलंबता, सर्वरों में रिमोट डायरेक्ट मेमोरी एक्सेस प्रदान करने के लिए उन्नत ईथरनेट फैब्रिक का लाभ उठाता है।परिणाम एक ऐसी नींव है जो विकसित हो रहे अनुमान प्रतिमानों के साथ बेहतर ढंग से संरेखित होती है जहां स्मृति दृढ़ता और क्रॉस-नोड संदर्भ साझाकरण महत्वपूर्ण हैं।जैसे-जैसे एआई बुनियादी ढांचा विकसित होता है, यह भंडारण स्तर अगली पीढ़ी की एआई सेवाओं के लिए एक प्रमुख प्रवर्तक बन सकता है, जो बड़े पैमाने पर अधिक जटिल तर्क कार्यों का समर्थन करते हुए विलंबता और ऊर्जा लागत को कम करता है।