NVIDIA เปิดตัวโมเดลรุ่นล่าสุดที่สามารถแปลงข้อความเป็นวิดีโอความละเอียดสูงได้

แบไต๋

21 เมษายน 2566 ( 16:00 )

ล่าสุดทางทีมวิจัย NVIDIA ได้เปิดตัวโมเดลรุ่นใหม่ล่าสุดที่มีความสามารถในการแปลงชุดข้อความเป็นวิดีโอความละเอียดสูงที่มีชื่อว่า Latent Diffusion Model (LDM)

Latent Diffusion Model เป็นโมเดลรูปแบบการจำลองกระจายรูปแบบใหม่ที่ช่วยให้ผู้ใช้สามารถป้อนชุดข้อความ และให้โมเดลสร้างวิดีโอตามข้อความที่มีความยาว 113 เฟรมบนความละเอียด 1280 X 2048 พิกเซล และแสดงผล 24 เฟรมได้

เบื้องหลังการทำงานของโมเดลตัวนี้คือ เมื่อทำการทดลองโมเดล LDM สำหรับการสร้างวิดีโอจะใช้ทรัพยากรของเครื่องที่สูง ต่อมานักวิจัยก็ได้ปรับใช้โมเดลนี้ในพื้นที่แฝงที่มีมิติต่ำ และสามารถสร้างรูปภาพความละเอียดสูงได้ พร้อมกับใช้ทรัพยากรของเครื่องที่น้อยลง หลังจากนั้นก็ได้ปรับปรุงให้โมเดลตัวนี้ใช้สำหรับงานสร้างวิดีโอความละเอียดสูงได้เช่นกัน

Text prompt: “A teddy bear is playing the electric guitar, high definition, 4k.”

อนาคตของการผลิตวิดีโอ และภาพยนตร์คงเป็นเรื่องที่ง่ายมาก ๆ อย่างไม่น่าเชื่อ เมื่อเทคโนโลยี AI ในตอนนี้มันก้าวหน้าอย่างว่องไว ลองนึกภาพจินตนาการดูสิว่า เพียงแค่พิมพ์คำบรรยายของฉากในแต่ละฉาก และให้ AI สร้างวิดีโอ หรือภาพยนตร์ออกมา นี่คงไม่ใช่เรื่องไกลเกินความเป็นจริง และอาจจะเข้ามาปฏิวัติวงการสร้างวิดีโอแบบเดิม ๆ ก็เป็นไปได้

ที่มา : NVIDIA Research

Tag

#ข่าววงการไอที

ยอดนิยมในตอนนี้

แท็กยอดนิยม

#tnntechreports #techreports #ข่าวไอที #ข่าวเทคโนโลยี #ข่าวมือถือ #สมาร์ทโฟน #มือถือรุ่นใหม่#TNN Tech #iQOO Neo 10 5G #tnntech

NVIDIA เปิดตัวโมเดลรุ่นล่าสุดที่สามารถแปลงข้อความเป็นวิดีโอความละเอียดสูงได้

Tag

ยอดนิยมในตอนนี้

แท็กยอดนิยม

ข่าวที่เกี่ยวข้อง

11 เหตุผลที่ Google เสนอใช้ ChromeOS Flex แทน Windows 10 – ตกลงใช้ในองค์กรฟรีจริงหรือไม่ รองรับเครื่องเก่าได้แค่ไหน?

พีซีที่ใช้ซีพียูที่ไม่รองรับ POPCNT จะไม่ได้ไปต่อ Windows 11 24H2

AWS เตรียมเปิด Region Server ในประเทศไทย พร้อมประกาศแผนอื่น ๆ ในปี 2024 !

เปิดตัว NVIDIA GeForce RTX 40 SUPER พร้อมราคาไทยอย่างเป็นทางการ

ตามมาติด ๆ Copilot บน iOS ให้ผู้ใช้ iPhone iPad ได้ดาวน์โหลดแล้ว

Samsung Internet โปรแกรม Browser จากซัมซุงมาบน Windows PC แล้ว

Microsoft จะเพิ่มปุ่มรีเฟรชสำหรับ Wi-Fi ให้ Windows 11

ระบบแปลโค้ดแอป x86 มาทำงานบน Windows on ARM อย่างไร ?

งานวิจัยชี้ การเล่นเกมไม่ได้นำไปสู่พฤติกรรมด้านความรุนแรงในเยาวชน

beartai รับรางวัลอินฟลูเอนเซอร์ยอดเยี่ยม HOFS AWARDS 2023 จากประเทศสิงคโปร์

ซัพพลายเออร์ Apple จากญี่ปุ่น เปิดโรงงานใหม่ในจังหวัดลำพูน เพิ่มการผลิต MLCC

ใครอัปรูปขึ้นอัลบั้มเยอะมีร้อง LINE ชี้ชัด อัปรูปได้สูงสุด 1000 ภาพ/อัลบั้ม