بنت ByteDance نموذج Seed Audio كمحرك توليد صوت من نوع مختلف تمامًا. إنه ليس مجرد محرك تحويل نص إلى كلام. ينتج Seed Audio 1.0 كلامًا طبيعيًا تعبيريًا ومشاهد صوتية، بما في ذلك الدراما الإذاعية والسرد والحوار والمناظر الصوتية الغنية، من نص واحد.
هو متاح الآن في أداة Text-to-Sound في Kolbo.
ما يفعله Seed Audio 1.0
كلام طبيعي تعبيري. يبدو الناتج كشخص حقيقي يتحدث بقصد، وليس قارئًا اصطناعيًا يمر عبر الكلمات. التنغيم والإيقاع والتشديد تظهر دون ضبط يدوي.
أصوات مضبوطة مسبقًا. مكتبة من الأصوات المتمايزة مدرجة مع النموذج. اختر الصوت الذي يناسب مشروعك.
استنساخ الصوت من مقطع مرجعي. قدم ما يصل إلى 3 عينات صوتية قصيرة وسيتعلم Seed Audio خصائص صوت المتحدث الفريدة، ثم يولد كلامًا جديدًا بذلك الصوت. بدون تدريب، بدون طابور رفع: النسخة نشطة فورًا.
دعم الصور المرجعية. أرفق صورة إلى جانب موجهك وسيأخذ توليد الصوت السياق المرئي بعين الاعتبار.
تحكم دقيق. اضبط السرعة والحجم والطبقة كمعاملات مستقلة.
كيفية البدء
Seed Audio موجود بالفعل في مساحة عملك في Kolbo.
- افتح أدوات الصوت من لوحة التحكم
- اختر Text to Sound
- في محدد النموذج، اختر Seed Audio
- اكتب نصك، اختر صوتًا، وأنشئ
لاستنساخ الصوت، ارفع من 1 إلى 3 عينات صوتية قصيرة في القسم المرجعي وسيطابق النموذج صوت المتحدث.
Seed Audio 1.0 متاح الآن في مساحة عملك في Kolbo.
جرب Seed Audio 1.0زوهار المؤسس، Kolbo.AI


