ตู้เพลงของ OpenAI คืออะไร?

Tu Phelng Khxng Openai Khux Xari



Jukebox ของ OpenAI เป็นโครงข่ายประสาทเทียมที่สามารถสร้างเนื้อเพลงและดนตรีในสไตล์ต่างๆ รวมถึงประเภทต่างๆ นอกจากนี้ยังสามารถรีมิกซ์เพลงที่มีอยู่หรือสร้างใหม่ตั้งแต่เริ่มต้น ตู้เพลงขับเคลื่อนด้วยโมเดลทรานส์ฟอร์เมอร์สขนาดใหญ่ที่ได้รับการฝึกฝนเกี่ยวกับเพลงและเนื้อเพลงหลายล้านเพลงจากเว็บ

โพสต์นี้จะอธิบายเนื้อหาดังต่อไปนี้:

Jukebox ของ OpenAI คืออะไร

Jukebox เป็นระบบการเรียนรู้เชิงลึกที่สามารถสร้างเพลงตั้งแต่เริ่มต้น โดยป้อนข้อมูลบางอย่าง เช่น เนื้อเพลง แนวเพลง ศิลปิน หรืออารมณ์ Jukebox ใช้ชุดข้อมูลขนาดใหญ่กว่า 1.2 ล้านเพลงจากแหล่งต่างๆ เช่น Spotify, YouTube และไฟล์ MIDI เพื่อเรียนรู้รูปแบบและคุณสมบัติของเพลง









Jukebox ของ OpenAI ทำงานอย่างไร

Jukebox ประกอบด้วยส่วนประกอบหลัก 3 ส่วน ได้แก่ ตัวเข้ารหัส VQ-VAE ตัวถอดรหัสหม้อแปลง และตัวอัปแซมเพลอร์



ตัวเข้ารหัส VQ-VAE

ตัวเข้ารหัส VQ-VAE มีหน้าที่ในการบีบอัดเสียงดิบให้อยู่ในมิติที่ต่ำกว่า ซึ่งรักษาข้อมูลสำคัญของเพลงไว้ ตัวเข้ารหัสใช้เทคนิคที่เรียกว่า vector quantization (VQ) เพื่อแมปแต่ละส่วนของเสียงเข้ากับหนึ่งใน 2048 โทเค็น





ตัวถอดรหัสหม้อแปลง

จากนั้นโทเค็นเหล่านี้จะถูกป้อนเข้าไปในตัวถอดรหัสหม้อแปลง ซึ่งเป็นโครงข่ายประสาทเทียมที่สามารถสร้างลำดับของโทเค็นตามอินพุตและความรู้ทางดนตรีที่เรียนรู้ ตัวถอดรหัสสามารถสร้างโทเค็นที่สอดคล้องกับเนื้อเพลง ทำนอง ความกลมกลืน จังหวะ เสียงต่ำ และลักษณะทางดนตรีอื่นๆ

ผู้สุ่มตัวอย่าง

ตัวอัปแซมเพลอร์เป็นองค์ประกอบสุดท้ายที่แปลงโทเค็นที่สร้างขึ้นกลับเป็นเสียงคุณภาพสูง ตัวอัปแซมเพลอร์ใช้ VQ-VAE อื่นเพื่อสร้างเสียงใหม่จากโทเค็นในขณะที่เพิ่มรายละเอียดและความแตกต่างที่ขาดหายไปในการแสดงมิติล่าง ตัวอัปแซมเพลอร์ยังสามารถใช้ข้อมูลเพิ่มเติม เช่น การฝังประเภทหรือศิลปินเพื่อปรับแต่งเอาต์พุตและทำให้ได้เสียงที่สมจริงและหลากหลายยิ่งขึ้น



จะใช้ Jukebox ของ OpenAI ได้อย่างไร

หากต้องการใช้ Jukebox คุณต้องมีสิทธิ์เข้าถึง GPU ที่มีประสิทธิภาพหรือบริการคลาวด์คอมพิวติ้งที่สามารถเรียกใช้รหัส Jukebox ได้ คุณสามารถดูสคริปต์และคำแนะนำในการติดตั้งและเรียกใช้ Jukebox ได้ GitHub . คุณยังสามารถดูตัวอย่างเพลงที่สร้างโดย Jukebox ได้ที่ ซาวนด์คลาวด์ ด้านล่าง:

ในการสร้างเพลงของคุณเองด้วย Jukebox คุณต้องระบุพารามิเตอร์อินพุตบางอย่าง เช่น เนื้อเพลง ประเภท ศิลปิน หรืออารมณ์ คุณยังสามารถระบุอุณหภูมิการสุ่มตัวอย่าง ซึ่งจะควบคุมว่าเอาต์พุตจะสุ่มและสร้างสรรค์เพียงใด

อุณหภูมิที่สูงขึ้นหมายถึงความหลากหลายและความแปลกใหม่ที่มากขึ้น ในขณะที่อุณหภูมิที่ต่ำกว่าหมายถึงการเชื่อมโยงกันและความคล้ายคลึงกันมากขึ้นกับอินพุต คุณยังสามารถเลือกระดับคุณภาพและความซับซ้อนของเอาต์พุตได้ ตั้งแต่ 5b (สูงสุด) ถึง 1b (ต่ำสุด) ระดับที่สูงขึ้นหมายถึงความเที่ยงตรงและรายละเอียดที่มากขึ้น แต่เวลาและทรัพยากรในการคำนวณก็มากขึ้นด้วย

เมื่อคุณตั้งค่าพารามิเตอร์อินพุตของคุณแล้ว คุณสามารถรันรหัส Jukebox และรอให้มันสร้างเพลงของคุณ ขึ้นอยู่กับการตั้งค่าและฮาร์ดแวร์ของคุณ การดำเนินการนี้อาจใช้เวลาตั้งแต่นาทีถึงชั่วโมงหรือหลายวัน ติดตามความคืบหน้าและฟังตัวอย่างกลางไปพร้อมกัน เมื่อสร้างเสร็จแล้ว คุณสามารถดาวน์โหลดเพลงของคุณเป็นไฟล์ MP3 และเพลิดเพลินกับผลงานเพลงชิ้นเอกของคุณได้

คุณสมบัติของตู้เพลง

ตู้เพลงสามารถใช้เพื่อวัตถุประสงค์ต่างๆ เช่น:

  • การสร้างเพลงต้นฉบับสำหรับการใช้งานส่วนตัวหรือเชิงพาณิชย์
  • รีมิกซ์หรือสุ่มตัวอย่างเพลงที่มีอยู่
  • สร้างเพลงสำหรับอารมณ์ ธีม หรือโอกาสเฉพาะ
  • สำรวจแนวเพลงและสไตล์ต่างๆ
  • สนุกและมีความคิดสร้างสรรค์

บทสรุป

Jukebox เป็นเครื่องมือที่น่าทึ่งที่สามารถช่วยคุณสร้างเพลงต้นฉบับและหลากหลายโดยใช้ความพยายามเพียงเล็กน้อย คุณสามารถใช้มันเพื่อทดลองกับแนวเพลงและสไตล์ต่างๆ เพื่อรีมิกซ์เพลงหรือศิลปินที่มีอยู่ หรือเพื่อแสดงอารมณ์และความคิดของคุณเองผ่านดนตรี ตู้เพลงไม่สมบูรณ์แบบแม้ว่า บางครั้งอาจทำให้เกิดข้อบกพร่อง ข้อผิดพลาด หรือผลลัพธ์ที่ไร้สาระ