Hacker News

מנוע MDST: הפעל דגמי GGUF בדפדפן עם WebGPU/WASM

מנוע MDST: הפעל דגמי GGUF בדפדפן עם WebGPU/WASM חקירה זו מתעמקת ב-mdst, בוחנת את המשמעות והפו - Mewayz Business OS.

4 דקות קריאה

Mewayz Team

Editorial Team

Hacker News

מנוע MDST: הפעל דגמי GGUF בדפדפן עם WebGPU/WASM

מנוע MDST הוא זמן ריצה מתפתח המאפשר למפתחים ועסקים לבצע דגמי שפה גדולים בפורמט GGUF ישירות בתוך הדפדפן באמצעות WebGPU ו-WebAssembly (WASM), ומבטל את הצורך בשרת ייעודי או GPU בענן. המעבר הזה לכיוון מלא של הסקת AI בצד הלקוח משכתב את הכללים של האופן שבו תכונות אינטליגנטיות מועברות ביישומי אינטרנט, מה שהופך AI פרטי עם אחזור נמוך לנגיש לכל מי שיש לו דפדפן מודרני.

מהו בדיוק מנוע MDST ולמה זה משנה?

MDST Engine הוא מסגרת מסקנות בינה מלאכותית מקורית בדפדפן שנועדה לטעון ולהריץ מודלים של GGUF כמותיים - אותו פורמט שפופולרי על ידי פרויקטים כמו llama.cpp - ישירות בהקשר אינטרנטי. במקום לנתב כל בקשת בינה מלאכותית דרך נקודת קצה בענן, MDST מבצע הסקת מודל על החומרה של המשתמש עצמו באמצעות WebGPU API של הדפדפן לחישוב מואץ של GPU ו-WebAssembly לביצועי חילופין כמעט מקוריים של CPU.

זה חשוב מאוד מכמה סיבות. ראשית, הוא מסיר את ההשהיה הלוך ושוב הטבועה בהסקת צד השרת. שנית, הוא שומר נתוני משתמשים רגישים במלואם במכשיר, וזה יתרון פרטיות קריטי עבור יישומים ארגוניים וצרכנים כאחד. שלישית, זה מפחית באופן דרמטי את עלויות התשתית לעסקים שאחרת היו משלמים על כל קריאת API או מתחזקים אשכולות GPU משלהם.

"הרצת הסקת AI בדפדפן היא כבר לא קוריוז של הוכחה למושג - זו ארכיטקטורה ברת-קיימא שמחליפה עלויות ענן ריכוזיות עבור חומרת משתמש מבוזרת, ומשנה מהותית את מי שנושא בנטל החישובי של יישומים המונעים בינה מלאכותית".

כיצד WebGPU ו-WASM מאפשרים AI בתוך הדפדפן?

הבנת היסודות הטכניים של MDST Engine דורשת מבט קצר על שני פרימיטיביות הליבה של הדפדפן שהוא ממנף. WebGPU הוא היורש של WebGL, המספק גישה ל-GPU ברמה נמוכה ישירות מקוד JavaScript ו-WGSL shader. בניגוד לקודמו, WebGPU תומך בהצללות מחשוב, שהם סוסי העבודה של פעולות כפל מטריצה ​​השולטות בהסקת LLM. המשמעות היא ש-MDST יכול לשלוח פעולות טנזור ל-GPU בצורה מקבילה ביותר, ולהשיג תפוקה שקודם לכן הייתה בלתי אפשרית בתוך ארגז חול של דפדפן.

WebAssembly משמשת כיעד החזרה וקומפילציה ללוגיקת זמן הריצה הליבה של המנוע. עבור מכשירים חסרי תמיכה ב-WebGPU - דפדפנים ישנים יותר, סביבות ניידות מסוימות או הקשרי בדיקה חסרי ראש - WASM מספקת שכבת ביצוע ניידת בעלת ביצועים המריצים קוד C++ או Rust במהירויות העולות בהרבה על JavaScript הסטנדרטי. יחד, WebGPU ו-WASM יוצרים אסטרטגיית ביצוע מדורגת: GPU-first כאשר זמין, CPU-via-WASM כאשר לא.

💡 DID YOU KNOW?

Mewayz replaces 8+ business tools in one platform

CRM · Invoicing · HR · Projects · Booking · eCommerce · POS · Analytics. Free forever plan available.

התחל בחינם →

מהם דגמי GGUF ומדוע פורמט זה מרכזי בגישה זו?

GGUF (פורמט מאוחד שנוצר על ידי GPT) הוא פורמט קובץ בינארי שאורז משקלי מודל, נתוני טוקנייזר ומטא נתונים לתוך חפץ נייד אחד. תוכנן במקור לתמוך בטעינה יעילה ב-llama.cpp, GGUF הפך לסטנדרט דה פקטו עבור מודלים עם משקל פתוח כמותי מכיוון שהוא תומך ברמות קוונטיזציה מרובות - מ-2 סיביות ל-8 סיביות - מה שמאפשר למפתחים לבחור את ההחלפה בין גודל הדגם, טביעת הרגל של הזיכרון ואיכות הפלט.

להסקת הסקה מבוססת דפדפן, קוונטיזציה אינה אופציונלית - היא חיונית. מודל פרמטר 7B דיוק מלא דורש בערך 14 GB של זיכרון. ב-Q4, אותו דגם מתכווץ לכ-4 GB, וב-Q2 הוא יכול לרדת מתחת ל-2 GB. התמיכה של MDST Engine ב-GGUF פירושה שמפתחים יכולים להשתמש ישירות במערכת האקולוגית המסיבית של מודלים שכבר קוונטים ללא כל שלב המרה נוסף, מה שמוריד באופן דרמטי את המחסום לאינטגרציה.

מהם מקרי השימוש בעולם האמיתי לעסקים המריצים דגמי GGUF בדפדפן?

היישומים המעשיים של מסקנות GGUF בדפדפן משתרעים על כמעט כל ענף אנכי. עסקים המאמצים גישה זו פותחים יכולות שקודם לכן היו חוסמות עלות

Frequently Asked Questions

Does running a GGUF model in the browser require users to download large files?

Yes, GGUF model files must be downloaded to the browser before inference begins, but modern implementations use progressive streaming and browser cache APIs to make this a one-time operation. After the initial download, the model is cached locally and subsequent sessions load near-instantly. Smaller quantized variants—Q4 or Q2—can be kept under 2–4 GB, which is practical for users with broadband connections.

Is WebGPU broadly supported across browsers and devices in 2026?

WebGPU has reached stable status in Chrome and Edge, with Firefox support shipping progressively through 2025 and into 2026. On mobile, support varies by device and OS version, but the WASM fallback in engines like MDST ensures functionality is preserved even when GPU acceleration is unavailable. Desktop environments with dedicated or integrated GPUs represent the optimal target for production deployments today.

How does in-browser inference compare to cloud API inference in terms of speed?

For smaller quantized models on modern consumer hardware, browser-based inference can achieve throughput of 10–30 tokens per second, which is comparable to mid-tier cloud API response speeds without the network round-trip latency. The first-token latency is often faster than cloud endpoints under load, since there is no queuing. Larger models and lower-end devices will naturally see reduced throughput, making model selection and quantization level the primary performance dials available to developers.


The convergence of WebGPU, WebAssembly, and the GGUF model ecosystem is creating a genuine inflection point for how AI capabilities are delivered inside web applications. Businesses that move early to integrate client-side inference frameworks like MDST Engine will gain a durable competitive advantage—lower operating costs, stronger privacy guarantees, and AI features that work anywhere, on any connection.

If you are building or scaling a business and want access to a platform engineered for exactly this kind of forward-looking operational efficiency, start your Mewayz journey at app.mewayz.com. With 207 integrated modules and plans from $19 per month, Mewayz gives your team the infrastructure to operate smarter—today and as AI capabilities continue to evolve.

Try Mewayz Free

All-in-one platform for CRM, invoicing, projects, HR & more. No credit card required.

Start managing your business smarter today

Join 30,000+ businesses. Free forever plan · No credit card required.

מצאתם את זה שימושי? שתף אותו.

Ready to put this into practice?

Join 30,000+ businesses using Mewayz. Free forever plan — no credit card required.

Start Free Trial →

Ready to take action?

התחל את ניסיון החינם של Mewayz היום

פלטפורמה עסקית All-in-one. אין צורך בכרטיס אשראי.

התחל בחינם →

14-day free trial · No credit card · Cancel anytime