Hacker News

MDST Engine: รันโมเดล GGUF ในเบราว์เซอร์ด้วย WebGPU/WASM

MDST Engine: รันโมเดล GGUF ในเบราว์เซอร์ด้วย WebGPU/WASM การสำรวจนี้จะเจาะลึก mdst โดยตรวจสอบความสำคัญและ po — Mewayz Business OS

1 นาทีอ่าน

Mewayz Team

Editorial Team

Hacker News

กลไก MDST: เรียกใช้โมเดล GGUF ในเบราว์เซอร์ด้วย WebGPU/WASM

MDST Engine เป็นรันไทม์ที่เกิดขึ้นใหม่ที่ช่วยให้นักพัฒนาและธุรกิจสามารถรันโมเดลภาษาขนาดใหญ่ในรูปแบบ GGUF ได้โดยตรงภายในเบราว์เซอร์โดยใช้ WebGPU และ WebAssembly (WASM) โดยไม่จำเป็นต้องใช้เซิร์ฟเวอร์เฉพาะหรือ GPU บนคลาวด์ การเปลี่ยนแปลงไปสู่การอนุมาน AI ฝั่งไคลเอ็นต์โดยสมบูรณ์กำลังเขียนกฎใหม่เกี่ยวกับวิธีการนำเสนอฟีเจอร์อัจฉริยะในเว็บแอปพลิเคชัน ทำให้ทุกคนสามารถเข้าถึง AI ส่วนตัวที่มีเวลาแฝงต่ำได้ด้วยเบราว์เซอร์สมัยใหม่

MDST Engine คืออะไรกันแน่ และเหตุใดจึงมีความสำคัญ?

MDST Engine เป็นเฟรมเวิร์กการอนุมาน AI แบบเนทีฟของเบราว์เซอร์ที่ออกแบบมาเพื่อโหลดและรันโมเดล GGUF เชิงปริมาณ ซึ่งเป็นรูปแบบเดียวกับที่โปรเจ็กต์ยอดนิยม เช่น llama.cpp เป็นที่นิยมโดยตรงภายในบริบทของเว็บ แทนที่จะกำหนดเส้นทางคำขอ AI ทุกรายการผ่านจุดสิ้นสุดบนคลาวด์ MDST ดำเนินการอนุมานโมเดลบนฮาร์ดแวร์ของผู้ใช้เองโดยใช้ WebGPU API ของเบราว์เซอร์สำหรับการคำนวณที่เร่งด้วย GPU และ WebAssembly สำหรับประสิทธิภาพทางเลือกของ CPU ที่ใกล้เคียงเนทีฟ

สิ่งนี้มีความสำคัญอย่างมากด้วยเหตุผลหลายประการ ขั้นแรก จะลบเวลาแฝงแบบไปกลับที่มีอยู่ในการอนุมานฝั่งเซิร์ฟเวอร์ ประการที่สอง จะเก็บข้อมูลที่ละเอียดอ่อนของผู้ใช้ไว้ในอุปกรณ์อย่างสมบูรณ์ ซึ่งเป็นข้อได้เปรียบด้านความเป็นส่วนตัวที่สำคัญสำหรับแอปพลิเคชันระดับองค์กรและผู้บริโภค ประการที่สาม ช่วยลดต้นทุนโครงสร้างพื้นฐานได้อย่างมากสำหรับธุรกิจที่ต้องจ่ายเงินต่อการเรียก API หรือบำรุงรักษาคลัสเตอร์ GPU ของตนเอง

“การเรียกใช้การอนุมาน AI ในเบราว์เซอร์ไม่ใช่ข้อพิสูจน์แนวคิดอีกต่อไป แต่เป็นสถาปัตยกรรมที่ใช้งานจริงได้ซึ่งแลกเปลี่ยนต้นทุนคลาวด์แบบรวมศูนย์สำหรับฮาร์ดแวร์ผู้ใช้แบบกระจายอำนาจ ซึ่งเปลี่ยนแปลงพื้นฐานว่าใครเป็นผู้แบกรับภาระในการคำนวณของแอปพลิเคชันที่ขับเคลื่อนด้วย AI”

WebGPU และ WASM ทำให้ AI ในเบราว์เซอร์เป็นไปได้อย่างไร

💡 คุณรู้หรือไม่?

Mewayz ทดแทนเครื่องมือธุรกิจ 8+ รายการในแพลตฟอร์มเดียว

CRM · การออกใบแจ้งหนี้ · HR · โปรเจกต์ · การจอง · อีคอมเมิร์ซ · POS · การวิเคราะห์ แผนฟรีใช้ได้ตลอดไป

เริ่มฟรี →

การทำความเข้าใจพื้นฐานทางเทคนิคของ MDST Engine จำเป็นต้องดูคร่าวๆ เกี่ยวกับเบราว์เซอร์หลักสองตัวที่มันใช้ประโยชน์ WebGPU เป็นผู้สืบทอดต่อจาก WebGL โดยให้การเข้าถึง GPU ระดับต่ำได้โดยตรงจาก JavaScript และโค้ดเชเดอร์ WGSL WebGPU ต่างจากรุ่นก่อนตรงที่สนับสนุนเชเดอร์การคำนวณ ซึ่งเป็นส่วนสำคัญของการดำเนินการคูณเมทริกซ์ที่ครอบงำการอนุมาน LLM ซึ่งหมายความว่า MDST สามารถส่งการทำงานของเทนเซอร์ไปยัง GPU ในลักษณะที่ขนานกันอย่างมาก เพื่อให้ได้ปริมาณงานที่ไม่เคยทำได้มาก่อนภายในแซนด์บ็อกซ์ของเบราว์เซอร์

WebAssembly ทำหน้าที่เป็นทางเลือกสำรองและเป้าหมายการคอมไพล์สำหรับตรรกะรันไทม์หลักของกลไก สำหรับอุปกรณ์ที่ขาดการสนับสนุน WebGPU เช่น เบราว์เซอร์รุ่นเก่า สภาพแวดล้อมแบบเคลื่อนที่บางอย่าง หรือบริบทการทดสอบแบบไม่มีส่วนหัว WASM มอบเลเยอร์การดำเนินการแบบพกพาที่มีประสิทธิภาพซึ่งเรียกใช้โค้ด C++ หรือ Rust ที่คอมไพล์แล้วด้วยความเร็วสูงกว่า JavaScript มาตรฐานมาก WebGPU และ WASM ร่วมกันสร้างกลยุทธ์การดำเนินการแบบลำดับชั้น: ใช้ GPU ก่อนเมื่อพร้อมใช้งาน ใช้ CPU ผ่าน WASM เมื่อไม่มี

โมเดล GGUF คืออะไร และเหตุใดรูปแบบดังกล่าวจึงเป็นศูนย์กลางของแนวทางนี้

GGUF (GPT-Generated Unified Format) เป็นรูปแบบไฟล์ไบนารีที่รวมน้ำหนักโมเดล ข้อมูลโทเค็น และข้อมูลเมตาไว้ในสิ่งประดิษฐ์แบบพกพาชิ้นเดียว เดิมทีออกแบบมาเพื่อรองรับการโหลดที่มีประสิทธิภาพใน llama.cpp GGUF กลายเป็นมาตรฐานโดยพฤตินัยสำหรับโมเดล Open-Weight แบบเชิงปริมาณ เนื่องจากรองรับระดับ Quantization หลายระดับ ตั้งแต่ 2 บิตไปจนถึง 8 บิต ทำให้นักพัฒนาสามารถเลือกการแลกเปลี่ยนระหว่างขนาดโมเดล ขนาดหน่วยความจำ และคุณภาพเอาต์พุตได้

สำหรับการอนุมานโดยใช้เบราว์เซอร์ การหาปริมาณไม่ใช่ทางเลือก แต่เป็นสิ่งจำเป็น โมเดลพารามิเตอร์ 7B ที่มีความแม่นยำสูงต้องใช้หน่วยความจำประมาณ 14 GB ที่การหาปริมาณในไตรมาสที่ 4 โมเดลเดียวกันนั้นจะลดลงเหลือประมาณ 4 GB และในไตรมาสที่ 2 อาจลดลงต่ำกว่า 2 GB การสนับสนุน GGUF ของ MDST Engine หมายความว่านักพัฒนาสามารถใช้ระบบนิเวศขนาดใหญ่ของโมเดลที่มีการกำหนดปริมาณแล้วได้โดยตรง โดยไม่ต้องมีขั้นตอนการแปลงเพิ่มเติม ซึ่งช่วยลดอุปสรรคในการบูรณาการได้อย่างมาก

กรณีการใช้งานจริงสำหรับธุรกิจที่ใช้โมเดล GGUF ในเบราว์เซอร์มีอะไรบ้าง

การใช้งานจริงของการอนุมาน GGUF ในเบราว์เซอร์ครอบคลุมเกือบทุกประเภทอุตสาหกรรม ธุรกิจที่นำแนวทางนี้มาใช้จะปลดล็อกความสามารถที่เคยมีมาก่อน

Streamline Your Business with Mewayz

Mewayz brings 207 business modules into one platform — CRM, invoicing, project management, and more. Join 138,000+ users who simplified their workflow.

Start Free Today →

ลองใช้ Mewayz ฟรี

แพลตฟอร์มแบบออล-อิน-วันสำหรับ CRM, การออกใบแจ้งหนี้, โครงการ, HR และอื่นๆ ไม่ต้องใช้บัตรเครดิต

เริ่มจัดการธุรกิจของคุณอย่างชาญฉลาดวันนี้

เข้าร่วมธุรกิจ 30,000+ ราย แผนฟรีตลอดไป · ไม่ต้องใช้บัตรเครดิต

พบว่าสิ่งนี้มีประโยชน์หรือไม่? แบ่งปันมัน

พร้อมนำไปปฏิบัติแล้วหรือยัง?

เข้าร่วมธุรกิจ 30,000+ รายที่ใช้ Mewayz แผนฟรีตลอดไป — ไม่ต้องใช้บัตรเครดิต

เริ่มต้นทดลองใช้ฟรี →

พร้อมที่จะลงมือทำหรือยัง?

เริ่มต้นทดลองใช้ Mewayz ฟรีวันนี้

แพลตฟอร์มธุรกิจแบบครบวงจร ไม่ต้องใช้บัตรเครดิต

เริ่มฟรี →

ทดลองใช้ฟรี 14 วัน · ไม่ต้องใช้บัตรเครดิต · ยกเลิกได้ทุกเมื่อ