Google เปิดฟีเจอร์ Avatar ของ Gemini ให้สมาชิกพรีเมียมสร้…

ที่มาภาพ: Android Authority

AI5 มิถุนายน 2569 เวลา 12:00อ่าน 6 นาทีAndroid Authority

Google เปิดฟีเจอร์ Avatar ของ Gemini ให้สมาชิกพรีเมียมสร้…

⚡ สรุป 30 วิ

Google เปิดให้บริการฟีเจอร์ Avatar ของ Gemini‑Omni แก่สมาชิกพรีเมียม ซึ่งผู้ใช้สามารถอัปโหลดภาพและเสียงเพื่อสร้างโคลนดิจิทัลที่พูดและเคลื่อนไหวได้ ระบบใส่…

Google เปิดให้ฟีเจอร์ Avatar ของ Gemini‑Omni ขยายการให้บริการแก่สมาชิกแบบชำระเงินในแอป Gemini อย่างเป็นทางการ — ผู้ใช้สามารถสร้าง “โคลน” ดิจิทัลที่พูดและเคลื่อนไหวตามเสียงและใบหน้าตัวเองได้โดยอัตโนมัติ

Overview

Gemini เป็นชุดโมเดล AI ของ Google ที่พัฒนาโดยใช้ Omni model ซึ่งเป็นการรวมความสามารถหลายด้านเข้าด้วยกัน ทั้งการประมวลผลภาพและเสียงในเวลาเดียวกัน ฟีเจอร์ Avatar ที่เพิ่งเปิดตัวในเดือนที่ผ่านมา ให้ผู้ใช้สร้างตัวแทนดิจิทัลที่ดูเหมือนตนเองโดยอิงจากภาพถ่ายและการบันทึกเสียงของผู้ใช้เอง การทำงานของระบบเป็นแบบ “generative” ทำให้วิดีโอที่ได้มีลักษณะเป็นการพูดคุยแบบเรียลไทม์และเคลื่อนไหวตามอารมณ์ของเสียงที่ป้อนเข้าไป

แม้ว่า Gemini จะถูกออกแบบให้เป็นเครื่องมือสนับสนุนการสร้างคอนเทนต์และการสื่อสารในหลายรูปแบบ ฟีเจอร์ Avatar กลายเป็นจุดสนใจหลักเพราะความสามารถในการทำให้ผู้ใช้ “เป็นตัวเอง” บนแพลตฟอร์มดิจิทัลโดยไม่มีการถ่ายทำวิดีโอจริง ซึ่งอาจเปลี่ยนแปลงวิธีการผลิตสื่อส่วนบุคคลในอนาคต

How It Works

กระบวนการสร้าง Avatar เริ่มจากผู้ใช้ต้องอัปโหลดภาพใบหน้าที่ชัดเจนและบันทึกเสียงพูดตามคำแนะนำของแอป ระบบจะใช้ Omni model วิเคราะห์ข้อมูลเหล่านั้นเพื่อสร้างโมเดล 3 มิติของใบหน้าและเชื่อมต่อกับลักษณะเสียงของผู้ใช้ เมื่อเสร็จแล้วผู้ใช้สามารถพิมพ์ข้อความหรือพูดเพื่อให้ Avatar ทำการพูดออกมาในวิดีโอที่สร้างโดยอัตโนมัติ

การสร้างวิดีโอแต่ละครั้งจะมีการฝัง SynthID watermark ที่มองไม่เห็นด้วยตาเปล่า ซึ่งเป็นมาตรการของ Google เพื่อระบุว่าเนื้อหานั้นเป็นการสร้างโดย AI การฝังรหัสนี้ช่วยให้ผู้ตรวจสอบหรือแพลตฟอร์มอื่นสามารถตรวจจับและจัดการกับคอนเทนต์ที่อาจก่อให้เกิดการเข้าใจผิดหรือการใช้ในทางที่ไม่เหมาะสมได้

Availability & Requirements

การเปิดให้บริการ Avatar ในปัจจุบันจำกัดอยู่ที่สมาชิกที่สมัครใช้บริการแบบชำระเงินของแอป Gemini เท่านั้น โดยมีเงื่อนไขพื้นฐานดังต่อไปนี้

  • ต้องเป็นผู้ใช้ที่อายุ อย่างน้อย 18 ปี ตามนโยบายของ Google
  • ต้องสมัครใช้บริการ Gemini Premium หรือระดับสมาชิกที่ให้สิทธิ์การเข้าถึงฟีเจอร์ขั้นสูง
  • ต้องใช้แอป Gemini เวอร์ชันล่าสุดบนอุปกรณ์ที่รองรับการประมวลผลภาพและเสียง

Google ยังระบุว่าจะค่อยขยายการให้บริการให้ครอบคลุมผู้ใช้ระดับพื้นฐานในช่วงหลายเดือนข้างหน้า หากมีการตอบรับที่ดีและไม่มีปัญหาด้านความเป็นส่วนตัวหรือการใช้งานที่ผิดพลาด

Privacy & Ethical Concerns

แม้ว่าเทคโนโลยี Avatar จะเปิดโอกาสใหม่ในการสร้างคอนเทนต์ส่วนบุคคล แต่ก็ทำให้เกิดคำถามด้านความเป็นส่วนตัวและจริยธรรมอย่างชัดเจน การใช้ใบหน้าและเสียงของผู้ใช้เพื่อสร้างคลอนดิจิทัลอาจทำให้ข้อมูลชีวภาพถูกเก็บไว้ในระบบคลาวด์ของ Google ซึ่งอาจเป็นเป้าหมายของการโจมตีหรือการใช้งานโดยไม่ได้รับอนุญาต

Google พยายามบรรเทาความกังวลนี้ด้วยการฝัง SynthID watermark ที่ช่วยให้วิดีโอที่สร้างโดย AI สามารถแยกแยะได้จากวิดีโอที่ถ่ายทำจริง นอกจากนี้ยังมีการแจ้งเตือนผู้ใช้ให้ตรวจสอบและยืนยันการใช้ข้อมูลส่วนบุคคลก่อนทำการสร้าง Avatar อย่างไรก็ตาม ผู้สังเกตการณ์ด้านความปลอดภัยดิจิทัลยังคงเตือนว่าการเผยแพร่ Avatar ไปยังสื่อสาธารณะอาจทำให้เกิดการหลอกลวงหรือการปลอมแปลงตัวตนได้ง่ายขึ้น

Market Impact

การเปิดตัว Avatar อย่างกว้างขวางอาจเป็นสัญญาณบ่งชี้ถึงการเปลี่ยนแปลงในอุตสาหกรรมคอนเทนต์ดิจิทัล การใช้ AI สร้างตัวแทนเสมือนจริงอาจทำให้ครีเอเตอร์, นักการตลาด และผู้ผลิตสื่อสามารถลดต้นทุนการผลิตวิดีโอและเพิ่มความเร็วในการสร้างสรรค์คอนเทนต์ได้อย่างมีประสิทธิภาพ

ในมุมของการแข่งขัน ฟีเจอร์นี้ทำให้ Google แข่งกับแพลตฟอร์ม AI อื่น ๆ เช่น Meta’s LLaVA หรือ OpenAI’s Sora ที่กำลังพัฒนาเทคโนโลยีคล้ายคลึงกัน การที่ Google นำ Omni model มาใช้เป็นจุดเด่นในการประมวลผลหลายรูปแบบพร้อมกันอาจช่วยให้ Gemini ยังคงความได้เปรียบด้านความแม่นยำและความเป็นธรรมชาติของ Avatar

อย่างไรก็ตาม ความสำเร็จของฟีเจอร์นี้จะขึ้นกับการยอมรับของผู้ใช้และการจัดการความเสี่ยงด้านความเป็นส่วนตัว หากผู้ใช้รู้สึกว่าการใช้ Avatar มีความปลอดภัยและเป็นประโยชน์จริง ๆ การรับสมัครสมาชิกแบบชำระเงินอาจเพิ่มขึ้นอย่างต่อเนื่อง

Summary

Google ได้ขยายการให้บริการฟีเจอร์ Avatar ของ Gemini‑Omni ให้กับสมาชิกชำระเงินในแอป Gemini อย่างเป็นทางการ ผู้ใช้สามารถสร้างคลอนดิจิทัลที่พูดและเคลื่อนไหวตามเสียงและใบหน้าตัวเองได้โดยมี SynthID watermark ปกป้องความโปร่งใส การเปิดตัวนี้อาจส่งผลต่อรูปแบบการสร้างคอนเทนต์และการแข่งขันในตลาด AI อย่างต่อเนื่อง.

แชร์บทความนี้:

ชอบบทความแบบนี้?

สมัคร AI Automate Weekly Newsletter — รับเคล็ดลับ AI + how-to ใหม่
ทุกสัปดาห์ตรงถึง inbox ฟรี ไม่มีสแปม

แหล่งข่าวต้นฉบับ

ชื่อต้นฉบับ
Google’s wild Gemini tool that creates a talking, moving AI clone of you is now rolling out widely
ผู้เขียน
Adamya Sharma
แหล่ง
Android Authority
วันที่เผยแพร่
3 มิถุนายน 2569 เวลา 12:25

Related

บทความที่เกี่ยวข้อง

iOS 27 เปิดแอป Siri สแตนด์อโลนบนหน้าจอหลักของ iPhoneAI
16 มิถุนายน 2569 เวลา 05:00

iOS 27 เปิดแอป Siri สแตนด์อโลนบนหน้าจอหลักของ iPhone

iOS 27 เปิดตัวแอป Siri แยกเป็นสแตนด์อโลนบนหน้าจอหลักของ iPhone ทำให้ผู้ใช้เรียกใช้บริการ AI ได้โดยตรงจากไอคอนเดียว…

9to5Mac8 นาที
ใช้ NotebookLM ของ Google กับ Claude ของ Anthropic แปลงข้…AI
16 มิถุนายน 2569 เวลา 03:30

ใช้ NotebookLM ของ Google กับ Claude ของ Anthropic แปลงข้…

ผู้เขียนทดลองใช้ NotebookLM ของ Google ร่วมกับ Claude ของ Anthropic เพื่อสรุปข้อมูลและแปลงเป็นขั้นตอนปฏิบัติ ลดเวลาการอ่านและจดโน้ตหลายชั่วโมง

XDA Developers6 นาที
ทดสอบอัปเดตใหญ่ของ NotebookLM 3 รายการและการยกเลิกฟีเจอร์…AI
15 มิถุนายน 2569 เวลา 21:30

ทดสอบอัปเดตใหญ่ของ NotebookLM 3 รายการและการยกเลิกฟีเจอร์…

NotebookLM ยังคงเป็น AI ช่วยวิจัยยอดนิยม ด้วยอัปเดต UI การสรุปแม่นยำขึ้นและความเร็วในการจัดการข้อมูล การยกเลิกฟีเจอร์เสียงแม้เงียบแต่เปลี่ยนวิธีใช้มาก

XDA Developers6 นาที
เกมอินดี้ต้องสร้าง Prototype ให้ดี มิใช่พึ่ง AI เพื่อรับเ…AI
15 มิถุนายน 2569 เวลา 17:00

เกมอินดี้ต้องสร้าง Prototype ให้ดี มิใช่พึ่ง AI เพื่อรับเ…

การสร้าง prototype เป็นขั้นตอนสำคัญเพื่อให้ผู้จัดพิมพ์พิจารณาการลงทุน แต่การใช้ AI อย่างเร่งรีบอาจทำให้เกมสูญเสียเอกลักษณ์และความน่าเชื่อถือ ตามที่ผู้แทนจาก…

Rock Paper Shotgun7 นาที
คัดลอกลิงก์แล้ว!