نموذج جديد

نص، صورة، فيديو، صوت - يأخذ Gemini Omni Flash أي مُدخَل ويحوّله إلى فيديو. متوفر الآن في أداة Elements.

Gemini Omni Flash - إنشاء فيديو متعدد الوسائط، الآن على Kolbo.AI

أعلنت Google عن Gemini Omni Flash في مؤتمر I/O 2026، وهو الآن مُدمَج بالكامل في Kolbo.AI. هذا هو أول نموذج في عائلة Omni - والسبب الذي يجعله يتميّز عن كل نموذج فيديو آخر متاح حالياً بسيط: فهو يقبل أي مزيج من المُدخَلات تقدّمه له، ويفهم فعلاً ما تعنيه جميعها معاً.

نص. صورة. فيديو. صوت. كلها في آن واحد، وكلها في عملية الإنشاء نفسها.

ما هو Gemini Omni Flash؟

تعمل معظم نماذج الفيديو القائمة على الذكاء الاصطناعي مع نوع أو نوعين من المُدخَلات. تكتب موجِّهاً، أو ترفع صورة، فيُنتج النموذج شيئاً يرتبط ارتباطاً غامضاً بما قدّمته له. وغالباً ما يكون المنطق الذي يربط مُدخَلك بالمُخرَج مبهماً - تبدو النتائج عشوائية حتى عندما تبدو جيدة.

صُمِّم Gemini Omni Flash بشكل مختلف. إنه نموذج متعدد الوسائط حقيقي، أي أنه يعالج النص والصورة والفيديو والصوت كفهمٍ موحَّد لما تطلبه. اسم "Omni" ليس مجرد علامة تجارية - بل يعكس بنية النموذج نفسها. ودرجة "Flash" تعني أنه يقدّم هذه القدرة بسرعة عالية.

وهو متوفر في Kolbo.AI داخل أداة Elements، في وضع image-to-video.

أربعة أنواع من المُدخَلات، نموذج واحد

النص: مباشر، دقيق، دون الحاجة لهندسة الموجِّهات

يمكنك توجيه عملية الإنشاء بأكملها من وصفٍ مكتوب. يتمتّع Gemini Omni Flash بمعرفة قوية بالعالم الواقعي، لذا لست بحاجة لشرح الفيزياء أو التشريح أو المنطق السردي - فالنموذج يفهمها بالفعل. صِف مشهداً فيُنتج مشهداً يتصرّف كما ينبغي لذلك المشهد أن يتصرّف.

اكتب "مصوّر شوارع يسير عبر سوق ماطر عند الغسق" فتحصل على انعكاسات مبلّلة على الرصيف، وضجيج محيطٍ طبيعي داخل الحركة، ومشية تبدو متمهّلة. يملأ النموذج ما لم تقله لأنه يفهم ما قصدته.

الصورة: تصوّرك البصري، يدبّ فيه الحياة

أدخِل صورة ثابتة وصِف كيف ينبغي للمشهد أن يتحرّك. تتحوّل لقطة منتج إلى كشفٍ دوّار. ويتحوّل بورتريه إلى لحظة دقيقة، تتنفّس وتنبض بالتعبير. وتتحوّل رسمة تخطيطية إلى تسلسلٍ متحرّك.

لا يكتفي النموذج بإضافة حركة إلى إطار - بل يفسّر الصورة من حيث العمق المكاني واتجاه الإضاءة والعلاقات بين العناصر، ثم يحرّكها بأسلوب يحترم كل ذلك. والنتيجة تتحرّك وكأن الصورة قُصِد لها دائماً أن تتحرّك.

الفيديو: تابِع أو أعِد المزج أو حوِّل

ارفع مقطع فيديو موجوداً كمرجع. يمكن لـ Gemini Omni Flash استخدامه كمرجعٍ للحركة، أو كأساسٍ أسلوبي، أو كمشهدٍ يكمله. صِف التغييرات التي تريدها - أو ما تريد الحفاظ عليه - ويتولّى النموذج عملية التحويل.

هنا يصبح التحسين التفاعلي قوياً. أنشئ نسخة أولى، ثم صِف ما هو قريب من المطلوب لكنه ليس صحيحاً تماماً، وكرّر العملية. أنت لا تعيد بناء الموجِّه من الصفر في كل مرة. يحتفظ النموذج بالسياق بين الخطوات، لذا تتراكم التعديلات بدلاً من أن تبدأ من جديد.

الصوت: أداء ينتقل إلى داخل الفيديو

أرفِق مقطعاً صوتياً - صوتك أنت، أو صوت شخصية، أو أداءً مرجعياً - فيقرؤه النموذج كتوجيه. ينعكس التعبير والإيقاع والنبرة العاطفية من الصوت في المُخرَج البصري. يمكن لشخصية على الشاشة أن تبدو مرتبطة بالصوت الذي منحته إياها، لا مجرّد متزامنة معه شفوياً.

بالنسبة لفيديوهات المُقدِّم، أو المقاطع القصيرة ذات الشخصيات، أو أي محتوى يهمّ فيه حضور المتحدّث، فإن هذا يغيّر ما يمكن لإنشاء الفيديو بالذكاء الاصطناعي أن يُنتجه.

التحرير التفاعلي: حسِّن خطوة بخطوة

من الأمور التي تجعل Gemini Omni Flash مختلفاً حقاً على أرض الواقع هو طريقة عمل التكرار.

معظم سير عمل إنشاء الفيديو يتم بضربة واحدة. تكتب موجِّهاً، تُنشئ، تُقيّم، تعيد كتابة الموجِّه، تُنشئ مجدداً. كل عملية إنشاء مستقلة. وما تعلّمته من العملية السابقة لا ينتقل تلقائياً.

يدعم Gemini Omni Flash التحسين التفاعلي. أنشئ مقطعاً، ثم صِف ما تريد تعديله - احتفظ بالحركة وغيّر الإضاءة؛ احتفظ بالشخصية وبدّل البيئة؛ مدِّد اللحظة بمقدارٍ بسيط. يحتفظ النموذج بسياق ما كان ناجحاً بالفعل ويطبّق التعديل دون أن يفقده.

بالنسبة للمبدعين الذين يصلون إلى النتيجة عبر التكرار بدلاً من وصف المُخرَج النهائي مسبقاً، فإن هذا سير عملٍ أسرع بشكل ملموس.

منطق العالم الواقعي مدمج في صميمه

معرفة النموذج بالفيزياء والأحياء والبنية السردية والسياق الثقافي ليست طبقة منفصلة - بل هي جزء من طريقة تفسير النموذج للمُدخَلات. شمعة مشتعلة ترتجف في اتجاه تيارات الهواء. حشد يتفاعل مع شيءٍ ما قبل أن يحدث ذلك الشيء. تعبير الشخصية يطابق المستوى العاطفي للمشهد.

هذا ما يفصل المُخرَجات التي تبدو مقصودة عن المُخرَجات التي تبدو صحيحة تقنياً لكنها تبدو في غير محلّها. يقلّص Gemini Omni Flash هذه الفجوة بشكل كبير.

الأفاتارات الرقمية وفيديو المُقدِّم

يتمتّع Gemini Omni Flash بدعمٍ قوي لإنشاء محتوى بأسلوب المُقدِّم والأفاتار الرقمي. أرفِق صوتاً، وقدّم مرجعاً من صورة أو فيديو لمظهر الشخصية، وصِف الأداء. يبقى الصوت والتعبير والحركة على الشاشة مترابطين - ويُقرأ المُخرَج كأداءٍ متماسك لا كأجزاء مخيطة معاً.

بالنسبة لفيديوهات المنتجات، أو الفيديوهات التوضيحية، أو محتوى وسائل التواصل، أو أي صيغة يقود فيها الحضور البشري السرد، فإن هذه قدرة مباشرة وعملية.

أين تجده

Gemini Omni Flash متوفر الآن. افتح أداة Elements في مساحة عملك على Kolbo، وانتقل إلى وضع image-to-video، واختر Gemini Omni Flash من قائمة اختيار النماذج.

دون أي إعداد إضافي. أرصدتك تعمل كالمعتاد.

Gemini Omni Flash متوفر الآن في مساحة عملك على Kolbo.

جرّب Gemini Omni Flash →

مع أطيب التحيات، زوهار المؤسس، Kolbo.AI

Gemini Omni Flash متوفر الآن على Kolbo.AI: أنشئ فيديو من أي مُدخَل

ما هو Gemini Omni Flash؟

أربعة أنواع من المُدخَلات، نموذج واحد

النص: مباشر، دقيق، دون الحاجة لهندسة الموجِّهات

الصورة: تصوّرك البصري، يدبّ فيه الحياة

الفيديو: تابِع أو أعِد المزج أو حوِّل

الصوت: أداء ينتقل إلى داخل الفيديو

التحرير التفاعلي: حسِّن خطوة بخطوة

منطق العالم الواقعي مدمج في صميمه

الأفاتارات الرقمية وفيديو المُقدِّم

أين تجده

Tags

Related Posts

Gemini Omni يحصل على تحرير الفيديو - حرر أي فيديو بنص مكتوب

HappyHorse 1.1 متاح الآن في Kolbo - نموذج فيديو Alibaba المحسّن مع صوت مدمج

LTX 2.3 Quality متاح الآن في Kolbo - فيديو سينمائي حتى 4K مع صوت مدمج

We value your privacy