Hacker News

एमडीएसटी इंजन: वेबजीपीयू/डब्ल्यूएएसएम के साथ ब्राउज़र में जीजीयूएफ मॉडल चलाएं

एमडीएसटी इंजन: वेबजीपीयू/डब्ल्यूएएसएम के साथ ब्राउज़र में जीजीयूएफ मॉडल चलाएं यह अन्वेषण एमडीएसटी में गहराई से उतरता है, इसके महत्व और स्थिति की जांच करता है - मेवेज़ बिजनेस ओएस।

1 मिनट पढ़ा

Mewayz Team

Editorial Team

Hacker News

एमडीएसटी इंजन: वेबजीपीयू/डब्ल्यूएएसएम के साथ ब्राउज़र में जीजीयूएफ मॉडल चलाएं

एमडीएसटी इंजन एक उभरता हुआ रनटाइम है जो डेवलपर्स और व्यवसायों को वेबजीपीयू और वेबअसेंबली (डब्ल्यूएएसएम) का उपयोग करके सीधे ब्राउज़र के अंदर जीजीयूएफ-प्रारूप वाले बड़े भाषा मॉडल निष्पादित करने में सक्षम बनाता है, जिससे एक समर्पित सर्वर या क्लाउड जीपीयू की आवश्यकता समाप्त हो जाती है। पूरी तरह से क्लाइंट-साइड एआई अनुमान की ओर यह बदलाव वेब अनुप्रयोगों में बुद्धिमान सुविधाओं को कैसे वितरित किया जाता है, इसके नियमों को फिर से लिख रहा है, जिससे निजी, कम-विलंबता एआई को आधुनिक ब्राउज़र वाले किसी भी व्यक्ति के लिए सुलभ बनाया जा सकता है।

एमडीएसटी इंजन वास्तव में क्या है और यह क्यों मायने रखता है?

एमडीएसटी इंजन एक ब्राउज़र-नेटिव एआई अनुमान ढांचा है जिसे परिमाणित जीजीयूएफ मॉडल को लोड करने और चलाने के लिए डिज़ाइन किया गया है - वही प्रारूप जिसे llama.cpp जैसी परियोजनाओं द्वारा लोकप्रिय बनाया गया है - सीधे वेब संदर्भ में। क्लाउड एंडपॉइंट के माध्यम से प्रत्येक एआई अनुरोध को रूट करने के बजाय, एमडीएसटी जीपीयू-त्वरित गणना के लिए ब्राउज़र के वेबजीपीयू एपीआई और निकट-मूल सीपीयू फ़ॉलबैक प्रदर्शन के लिए वेबअसेंबली का उपयोग करके उपयोगकर्ता के स्वयं के हार्डवेयर पर मॉडल अनुमान निष्पादित करता है।

यह कई कारणों से अत्यधिक मायने रखता है। सबसे पहले, यह सर्वर-साइड अनुमान में निहित राउंड-ट्रिप विलंबता को हटा देता है। दूसरा, यह संवेदनशील उपयोगकर्ता डेटा को पूरी तरह से डिवाइस पर रखता है, जो उद्यम और उपभोक्ता अनुप्रयोगों के लिए एक महत्वपूर्ण गोपनीयता लाभ है। तीसरा, यह उन व्यवसायों के लिए बुनियादी ढांचे की लागत को नाटकीय रूप से कम कर देता है जो अन्यथा प्रति एपीआई कॉल का भुगतान करते हैं या अपने स्वयं के जीपीयू क्लस्टर बनाए रखते हैं।

"ब्राउज़र में एआई अनुमान चलाना अब अवधारणा का प्रमाण नहीं है - यह एक उत्पादन-व्यवहार्य आर्किटेक्चर है जो विकेन्द्रीकृत उपयोगकर्ता हार्डवेयर के लिए केंद्रीकृत क्लाउड लागत का व्यापार करता है, जो मूल रूप से बदलता है कि एआई-संचालित अनुप्रयोगों का कम्प्यूटेशनल बोझ कौन वहन करता है।"

WebGPU और WASM इन-ब्राउज़र AI को कैसे संभव बनाते हैं?

💡 DID YOU KNOW?

Mewayz replaces 8+ business tools in one platform

CRM · Invoicing · HR · Projects · Booking · eCommerce · POS · Analytics. Free forever plan available.

निःशुल्क प्रारंभ करें →

एमडीएसटी इंजन के तकनीकी आधारों को समझने के लिए इसके द्वारा उपयोग किए जाने वाले दो मुख्य ब्राउज़र प्राइमेटिव्स पर एक संक्षिप्त नज़र डालने की आवश्यकता है। WebGPU, WebGL का उत्तराधिकारी है, जो सीधे JavaScript और WGSL शेडर कोड से निम्न-स्तरीय GPU एक्सेस प्रदान करता है। अपने पूर्ववर्ती के विपरीत, वेबजीपीयू कंप्यूट शेडर्स का समर्थन करता है, जो मैट्रिक्स गुणन संचालन के वर्कहॉर्स हैं जो एलएलएम अनुमान पर हावी हैं। इसका मतलब है कि एमडीएसटी अत्यधिक समानांतर तरीके से जीपीयू में टेंसर ऑपरेशंस को भेज सकता है, जिससे थ्रूपुट प्राप्त होता है जो पहले ब्राउज़र सैंडबॉक्स के अंदर असंभव था।

WebAssembly इंजन के मुख्य रनटाइम लॉजिक के लिए फ़ॉलबैक और संकलन लक्ष्य के रूप में कार्य करता है। WebGPU समर्थन की कमी वाले उपकरणों के लिए - पुराने ब्राउज़र, कुछ मोबाइल वातावरण, या हेडलेस परीक्षण संदर्भ - WASM एक निष्पादक, पोर्टेबल निष्पादन परत प्रदान करता है जो मानक जावास्क्रिप्ट से कहीं अधिक गति पर संकलित C++ या रस्ट कोड चलाता है। साथ में, WebGPU और WASM एक स्तरीय निष्पादन रणनीति बनाते हैं: उपलब्ध होने पर GPU-प्रथम, उपलब्ध न होने पर CPU-वाया-WASM।

जीजीयूएफ मॉडल क्या हैं और वह प्रारूप इस दृष्टिकोण का केंद्र क्यों है?

जीजीयूएफ (जीपीटी-जेनरेटेड यूनिफाइड फॉर्मेट) एक बाइनरी फाइल फॉर्मेट है जो मॉडल वेट, टोकननाइजर डेटा और मेटाडेटा को एक पोर्टेबल आर्टिफैक्ट में पैकेज करता है। मूल रूप से llama.cpp में कुशल लोडिंग का समर्थन करने के लिए डिज़ाइन किया गया, GGUF क्वांटाइज़्ड ओपन-वेट मॉडल के लिए वास्तविक मानक बन गया क्योंकि यह कई क्वांटिज़ेशन स्तरों का समर्थन करता है - 2-बिट से 8-बिट तक - डेवलपर्स को मॉडल आकार, मेमोरी फ़ुटप्रिंट और आउटपुट गुणवत्ता के बीच ट्रेड-ऑफ चुनने की अनुमति देता है।

ब्राउज़र-आधारित अनुमान के लिए, परिमाणीकरण वैकल्पिक नहीं है—यह आवश्यक है। पूर्ण-परिशुद्धता 7बी पैरामीटर मॉडल के लिए लगभग 14 जीबी मेमोरी की आवश्यकता होती है। Q4 परिमाणीकरण पर, वही मॉडल लगभग 4 जीबी तक सिकुड़ जाता है, और Q2 पर यह 2 जीबी से नीचे गिर सकता है। जीजीयूएफ के लिए एमडीएसटी इंजन के समर्थन का मतलब है कि डेवलपर्स बिना किसी अतिरिक्त रूपांतरण कदम के पहले से ही परिमाणित मॉडल के विशाल पारिस्थितिकी तंत्र का सीधे उपयोग कर सकते हैं, जिससे एकीकरण की बाधा नाटकीय रूप से कम हो जाएगी।

ब्राउज़र में GGUF मॉडल चलाने वाले व्यवसायों के लिए वास्तविक दुनिया में उपयोग के मामले क्या हैं?

इन-ब्राउज़र GGUF अनुमान के व्यावहारिक अनुप्रयोग लगभग हर उद्योग में फैले हुए हैं। इस दृष्टिकोण को अपनाने वाले व्यवसाय उन क्षमताओं को अनलॉक करते हैं जो पहले थीं

All Your Business Tools in One Place

Stop juggling multiple apps. Mewayz combines 207 tools for just $19/month — from inventory to HR, booking to analytics. No credit card required to start.

Try Mewayz Free →

Try Mewayz Free

All-in-one platform for CRM, invoicing, projects, HR & more. No credit card required.

Start managing your business smarter today

Join 30,000+ businesses. Free forever plan · No credit card required.

क्या यह उपयोगी पाया गया? इसे शेयर करें।

Ready to put this into practice?

Join 30,000+ businesses using Mewayz. Free forever plan — no credit card required.

मुफ़्त ट्रायल शुरू करें →

कार्रवाई करने के लिए तैयार हैं?

आज ही अपना मुफ़्त Mewayz ट्रायल शुरू करें

ऑल-इन-वन व्यवसाय प्लेटफॉर्म। क्रेडिट कार्ड की आवश्यकता नहीं।

निःशुल्क प्रारंभ करें →

14-day free trial · No credit card · Cancel anytime