Google เปิดตัว DiffusionGemma โมเดลภาษาเปิดน้ำหนักใช้เทคน…

ที่มาภาพ: The Register

AI14 มิถุนายน 2569 เวลา 01:30อ่าน 7 นาทีThe Register

Google เปิดตัว DiffusionGemma โมเดลภาษาเปิดน้ำหนักใช้เทคน…

⚡ สรุป 30 วิ

Google เปิดตัวโมเดลภาษา DiffusionGemma ที่ใช้เทคนิค diffusion จากโมเดลสร้างภาพ ทำให้การสร้างข้อความเร็วขึ้นหลายเท่าโดยใช้หน่วยความจำเพียง 18 GB. โมเดล…

Google เปิดตัวโมเดลภาษาแบบเปิดน้ำหนักใหม่ที่ชื่อ DiffusionGemma ซึ่งนำเทคนิคจากโมเดลสร้างภาพมาปรับใช้กับการสร้างข้อความ ทำให้ความเร็วการประมวลผลเพิ่มขึ้นหลายเท่าบนฮาร์ดแวร์ผู้บริโภคที่มีข้อจำกัดของทรัพยากร โมเดลนี้สามารถดาวน์โหลดและรันได้ด้วยหน่วยความจำ 18 GB ของ DRAM หรือ VRAM เท่านั้น

Overview

โมเดล DiffusionGemma เป็นส่วนหนึ่งของตระกูลโมเดลเปิดน้ำหนักของ Google ที่ออกแบบมาเพื่อทำงานบนเครื่องส่วนบุคคล ทีม DeepMind ของ Google เปิดเผยว่าโมเดลนี้มี 26 billion‑parameter และใช้สถาปัตยกรรม **Mixture‑of‑Experts (MoE) ซึ่งแตกต่างจากโมเดลภาษาแบบดั้งเดิมที่ทำงานแบบออโต้รีเกรสซีฟ การสร้างข้อความของ DiffusionGemma จะทำการสร้างชุดโทเคนทั้งหมดของย่อหน้าในครั้งเดียวคล้ายกระบวนการของโมเดล diffusion ที่สร้างภาพจากการลบสัญญาณรบกวนหลายขั้นตอน

โดยโมเดลนี้ไม่ได้มุ่งเน้นเป็น LLM ขนาดใหญ่ตามแบบทั่วไป แต่ใกล้เคียงกับโมเดลภาพเช่น Stable Diffusion หรือ Flux มากกว่า การทำงานโดยวาง “ผืนผ้าใบ” ของโทเคนแบบสุ่มแล้วค่อย ๆ ปรับให้เป็นผลลัพธ์ที่ต้องการ ทำให้กระบวนการส่วนใหญ่เปลี่ยนเป็นการคำนวณ (compute‑bound) มากกว่าการดึงข้อมูลจากหน่วยความจำ (memory‑bandwidth bound)

Technical Approach

เทคนิค diffusion ที่นำมาใช้ใน DiffusionGemma ทำให้การสร้างข้อความไม่ต้องรอการประมวลผลต่อเนื่องของโทเคนแต่ละตัว ซึ่งเป็นข้อจำกัดสำคัญของโมเดลออโต้รีเกรสซีฟแบบดั้งเดิม การสร้างโทเคนหลาย ๆ ตัวพร้อมกันทำให้การใช้หน่วยประมวลผลกราฟิก (GPU) มีประสิทธิภาพสูงกว่าเดิมโดยเฉพาะบนกราฟิกการ์ดระดับไฮเอนด์ที่มักมีพลังการประมวลผลเหลือเฟือ

โมเดลนี้ถูกออกแบบให้ทำงานได้บนเครื่องที่มี 18 GB ของหน่วยความจำ ซึ่งถือว่าต่ำกว่าข้อกำหนดของหลาย LLM ขนาดใหญ่ในตลาด การที่โมเดลทำงานเป็นงานคำนวณมากกว่าการดึงข้อมูลทำให้ข้อจำกัดด้านแบนด์วิดท์ของหน่วยความจำไม่เป็นอุปสรรคสำคัญอีกต่อไป

Performance & Benchmarks

Google ระบุว่า DiffusionGemma มีความเร็วในการสร้างข้อความดีกว่าโมเดล LLM ขนาด 12 B ที่เปิดใช้เทคนิค speculative decode อยู่ 2.25 เท่า และเมื่อรันบน Nvidia H100 เพียงเครื่องเดียว ความเร็วเพิ่มขึ้นใกล้ 4 เท่า เมื่อเทียบกับ Gemma 4 26B‑A4B อย่างไรก็ตาม ในการทดสอบเกณฑ์ GPQA‑Diamond โมเดลนี้ยังทำคะแนนได้แค่ระดับเดียวกับ Gemma 4 12B ซึ่งแสดงว่าประสิทธิภาพด้านคุณภาพยังไม่เหนือกว่าโมเดลที่มีขนาดเล็กกว่า

ก่อนหน้า Google เคยทดลองโมเดลเช่น DREAM หรือ Mercury 2 ที่ให้ความเร็วสูงแต่คะแนนการทดสอบโดยรวมต่ำกว่าโมเดลเดียวกันในขนาดเดียวกัน DiffusionGemma ดูเหมือนจะยังคงมีช่องว่างเดียวกัน – ความเร็วเป็นจุดแข็งหลัก ส่วนคุณภาพอาจต้องพัฒนาเพิ่มเติม

  • ขนาดโมเดล: 26 billion‑parameter MoE
  • ความต้องการหน่วยความจำ: 18 GB DRAM/VRAM
  • ความเร็วเพิ่ม: 2.25 × (เมื่อเทียบกับ 12 B LLM) / ~4 × (เมื่อเทียบกับ Gemma 4 26B‑A4B บน H100)
  • ประสิทธิภาพเบนช์มาร์ค: อยู่หลัง Gemma 4 12B ใน GPQA‑Diamond

Availability & Ecosystem

Google ปล่อย DiffusionGemma ในรูปแบบโมเดลทดลอง (experimental) ภายใต้สัญญาอนุญาต Apache 2.0 ที่ค่อนข้างเปิดกว้าง โมเดลนี้สามารถดาวน์โหลดได้จากแหล่งเก็บโมเดลยอดนิยมเช่น Hugging Face พร้อมกับการสนับสนุนจากเครื่องยนต์การสรุปผล (inference engines) ที่เป็นที่ยอมรับ ได้แก่ vLLM, MLX, และ HF Transformers ส่วนการสนับสนุนจาก Llama.cpp ก็กำลังอยู่ในขั้นตอนการพัฒนา

การเปิดตัวในลักษณะนี้สอดคล้องกับแนวโน้มของ Google ที่ต้องการกระตุ้นการใช้โมเดลบนอุปกรณ์ท้องถิ่น เพื่อลดค่าใช้จ่ายในการประมวลผลบนคลาวด์ ตัวอย่างเช่น Google ได้ปล่อย LLM เล็ก ๆ ไปกับเว็บเบราว์เซอร์ Chrome ตั้งแต่เดือนพฤษภาคมที่ผ่านมา ซึ่งเป็นส่วนหนึ่งของกลยุทธ์ลดภาระคลาวด์โดยใช้เทคโนโลยีบนอุปกรณ์ผู้ใช้

Implications

การนำเทคนิค diffusion มาใช้ในงานสร้างข้อความอาจเป็นจุดเริ่มต้นของการเปลี่ยนแปลงรูปแบบการพัฒนาโมเดลภาษาในอนาคต หากสามารถปรับปรุงคุณภาพให้สอดคล้องกับความเร็วที่เพิ่มขึ้น โมเดลแบบนี้จะทำให้ผู้ใช้ทั่วไปและนักพัฒนาสามารถรันแอปพลิเคชัน AI บนเครื่องส่วนบุคคลได้อย่างมีประสิทธิภาพ ลดการพึ่งพาเซิร์ฟเวอร์คลาวด์และค่าใช้จ่ายที่เกี่ยวข้อง

อย่างไรก็ตาม คำวิจารณ์จากการทดสอบเบนช์มาร์คยังชี้ให้เห็นว่าความแม่นยำและความเข้าใจเชิงลึกของ DiffusionGemma ยังตามไม่ไหวกับโมเดลที่มุ่งเน้นคุณภาพเป็นหลัก ดังนั้นในระยะสั้นอาจเห็นการใช้งานที่จำกัดเฉพาะงานที่ต้องการความเร็วสูงเป็นหลัก เช่น การสรุปข้อความแบบเร็ว ๆ หรือการสร้างข้อความร่างเบื้องต้น ก่อนที่จะพัฒนาต่อยอดให้ครอบคลุมการใช้งานที่ซับซ้อนมากขึ้น

Summary

Google เปิดตัว DiffusionGemma โมเดลภาษา 26 billion‑parameter ที่ใช้เทคนิค diffusion เพื่อเพิ่มความเร็วในการสร้างข้อความหลายเท่า บนเครื่องผู้ใช้ที่มี 18 GB หน่วยความจำ โมเดลนี้เป็นโครงการเปิดน้ำหนักที่พร้อมให้ดาวน์โหลดและสนับสนุนโดยเครื่องยนต์ inference หลักหลายตัว แม้จะเร็วกว่าโมเดลเดิม แต่ยังต้องพัฒนาคุณภาพเพื่อให้เป็นทางเลือกที่สมบูรณ์สำหรับการใช้งานทั่วไป.

แชร์บทความนี้:

ชอบบทความแบบนี้?

สมัคร AI Automate Weekly Newsletter — รับเคล็ดลับ AI + how-to ใหม่
ทุกสัปดาห์ตรงถึง inbox ฟรี ไม่มีสแปม

แหล่งข่าวต้นฉบับ

ชื่อต้นฉบับ
Google's new open-weights model brings image-generation tricks to AI text generation
ผู้เขียน
Unknown
แหล่ง
The Register
วันที่เผยแพร่
12 มิถุนายน 2569 เวลา 01:31

Related

บทความที่เกี่ยวข้อง

iOS 27 เปิดแอป Siri สแตนด์อโลนบนหน้าจอหลักของ iPhoneAI
16 มิถุนายน 2569 เวลา 05:00

iOS 27 เปิดแอป Siri สแตนด์อโลนบนหน้าจอหลักของ iPhone

iOS 27 เปิดตัวแอป Siri แยกเป็นสแตนด์อโลนบนหน้าจอหลักของ iPhone ทำให้ผู้ใช้เรียกใช้บริการ AI ได้โดยตรงจากไอคอนเดียว…

9to5Mac8 นาที
ใช้ NotebookLM ของ Google กับ Claude ของ Anthropic แปลงข้…AI
16 มิถุนายน 2569 เวลา 03:30

ใช้ NotebookLM ของ Google กับ Claude ของ Anthropic แปลงข้…

ผู้เขียนทดลองใช้ NotebookLM ของ Google ร่วมกับ Claude ของ Anthropic เพื่อสรุปข้อมูลและแปลงเป็นขั้นตอนปฏิบัติ ลดเวลาการอ่านและจดโน้ตหลายชั่วโมง

XDA Developers6 นาที
ทดสอบอัปเดตใหญ่ของ NotebookLM 3 รายการและการยกเลิกฟีเจอร์…AI
15 มิถุนายน 2569 เวลา 21:30

ทดสอบอัปเดตใหญ่ของ NotebookLM 3 รายการและการยกเลิกฟีเจอร์…

NotebookLM ยังคงเป็น AI ช่วยวิจัยยอดนิยม ด้วยอัปเดต UI การสรุปแม่นยำขึ้นและความเร็วในการจัดการข้อมูล การยกเลิกฟีเจอร์เสียงแม้เงียบแต่เปลี่ยนวิธีใช้มาก

XDA Developers6 นาที
เกมอินดี้ต้องสร้าง Prototype ให้ดี มิใช่พึ่ง AI เพื่อรับเ…AI
15 มิถุนายน 2569 เวลา 17:00

เกมอินดี้ต้องสร้าง Prototype ให้ดี มิใช่พึ่ง AI เพื่อรับเ…

การสร้าง prototype เป็นขั้นตอนสำคัญเพื่อให้ผู้จัดพิมพ์พิจารณาการลงทุน แต่การใช้ AI อย่างเร่งรีบอาจทำให้เกมสูญเสียเอกลักษณ์และความน่าเชื่อถือ ตามที่ผู้แทนจาก…

Rock Paper Shotgun7 นาที
คัดลอกลิงก์แล้ว!