Skip to content
Announcements

Gemini Omni Flash متوفر الآن على Kolbo.AI: أنشئ فيديو من أي مُدخَل

نموذج Gemini Omni Flash من Google أصبح متاحاً الآن في أداة Elements على Kolbo.AI. أدخِل نصاً أو صورة أو مقطع فيديو أو صوتك — واحصل على فيديو منطقي بالفعل. إنه أول نموذج في عائلة Omni، مُصمَّم لإنشاء فيديو متعدد الوسائط وتفاعلي.

By Zohar - Kolbo.AI Team
Gemini Omni Flash multimodal video generation on Kolbo.AI
نموذج جديد
نص، صورة، فيديو، صوت - يأخذ Gemini Omni Flash أي مُدخَل ويحوّله إلى فيديو. متوفر الآن في أداة Elements.

Gemini Omni Flash — إنشاء فيديو متعدد الوسائط، الآن على Kolbo.AI

أعلنت Google عن Gemini Omni Flash في مؤتمر I/O 2026، وهو الآن مُدمَج بالكامل في Kolbo.AI. هذا هو أول نموذج في عائلة Omni — والسبب الذي يجعله يتميّز عن كل نموذج فيديو آخر متاح حالياً بسيط: فهو يقبل أي مزيج من المُدخَلات تقدّمه له، ويفهم فعلاً ما تعنيه جميعها معاً.

نص. صورة. فيديو. صوت. كلها في آن واحد، وكلها في عملية الإنشاء نفسها.

ما هو Gemini Omni Flash؟

تعمل معظم نماذج الفيديو القائمة على الذكاء الاصطناعي مع نوع أو نوعين من المُدخَلات. تكتب موجِّهاً، أو ترفع صورة، فيُنتج النموذج شيئاً يرتبط ارتباطاً غامضاً بما قدّمته له. وغالباً ما يكون المنطق الذي يربط مُدخَلك بالمُخرَج مبهماً — تبدو النتائج عشوائية حتى عندما تبدو جيدة.

صُمِّم Gemini Omni Flash بشكل مختلف. إنه نموذج متعدد الوسائط حقيقي، أي أنه يعالج النص والصورة والفيديو والصوت كفهمٍ موحَّد لما تطلبه. اسم "Omni" ليس مجرد علامة تجارية — بل يعكس بنية النموذج نفسها. ودرجة "Flash" تعني أنه يقدّم هذه القدرة بسرعة عالية.

وهو متوفر في Kolbo.AI داخل أداة Elements، في وضع image-to-video.

أربعة أنواع من المُدخَلات، نموذج واحد

النص: مباشر، دقيق، دون الحاجة لهندسة الموجِّهات

يمكنك توجيه عملية الإنشاء بأكملها من وصفٍ مكتوب. يتمتّع Gemini Omni Flash بمعرفة قوية بالعالم الواقعي، لذا لست بحاجة لشرح الفيزياء أو التشريح أو المنطق السردي — فالنموذج يفهمها بالفعل. صِف مشهداً فيُنتج مشهداً يتصرّف كما ينبغي لذلك المشهد أن يتصرّف.

اكتب "مصوّر شوارع يسير عبر سوق ماطر عند الغسق" فتحصل على انعكاسات مبلّلة على الرصيف، وضجيج محيطٍ طبيعي داخل الحركة، ومشية تبدو متمهّلة. يملأ النموذج ما لم تقله لأنه يفهم ما قصدته.

الصورة: تصوّرك البصري، يدبّ فيه الحياة

أدخِل صورة ثابتة وصِف كيف ينبغي للمشهد أن يتحرّك. تتحوّل لقطة منتج إلى كشفٍ دوّار. ويتحوّل بورتريه إلى لحظة دقيقة، تتنفّس وتنبض بالتعبير. وتتحوّل رسمة تخطيطية إلى تسلسلٍ متحرّك.

لا يكتفي النموذج بإضافة حركة إلى إطار — بل يفسّر الصورة من حيث العمق المكاني واتجاه الإضاءة والعلاقات بين العناصر، ثم يحرّكها بأسلوب يحترم كل ذلك. والنتيجة تتحرّك وكأن الصورة قُصِد لها دائماً أن تتحرّك.

الفيديو: تابِع أو أعِد المزج أو حوِّل

ارفع مقطع فيديو موجوداً كمرجع. يمكن لـ Gemini Omni Flash استخدامه كمرجعٍ للحركة، أو كأساسٍ أسلوبي، أو كمشهدٍ يكمله. صِف التغييرات التي تريدها — أو ما تريد الحفاظ عليه — ويتولّى النموذج عملية التحويل.

هنا يصبح التحسين التفاعلي قوياً. أنشئ نسخة أولى، ثم صِف ما هو قريب من المطلوب لكنه ليس صحيحاً تماماً، وكرّر العملية. أنت لا تعيد بناء الموجِّه من الصفر في كل مرة. يحتفظ النموذج بالسياق بين الخطوات، لذا تتراكم التعديلات بدلاً من أن تبدأ من جديد.

الصوت: أداء ينتقل إلى داخل الفيديو

أرفِق مقطعاً صوتياً — صوتك أنت، أو صوت شخصية، أو أداءً مرجعياً — فيقرؤه النموذج كتوجيه. ينعكس التعبير والإيقاع والنبرة العاطفية من الصوت في المُخرَج البصري. يمكن لشخصية على الشاشة أن تبدو مرتبطة بالصوت الذي منحته إياها، لا مجرّد متزامنة معه شفوياً.

بالنسبة لفيديوهات المُقدِّم، أو المقاطع القصيرة ذات الشخصيات، أو أي محتوى يهمّ فيه حضور المتحدّث، فإن هذا يغيّر ما يمكن لإنشاء الفيديو بالذكاء الاصطناعي أن يُنتجه.

التحرير التفاعلي: حسِّن خطوة بخطوة

من الأمور التي تجعل Gemini Omni Flash مختلفاً حقاً على أرض الواقع هو طريقة عمل التكرار.

معظم سير عمل إنشاء الفيديو يتم بضربة واحدة. تكتب موجِّهاً، تُنشئ، تُقيّم، تعيد كتابة الموجِّه، تُنشئ مجدداً. كل عملية إنشاء مستقلة. وما تعلّمته من العملية السابقة لا ينتقل تلقائياً.

يدعم Gemini Omni Flash التحسين التفاعلي. أنشئ مقطعاً، ثم صِف ما تريد تعديله — احتفظ بالحركة وغيّر الإضاءة؛ احتفظ بالشخصية وبدّل البيئة؛ مدِّد اللحظة بمقدارٍ بسيط. يحتفظ النموذج بسياق ما كان ناجحاً بالفعل ويطبّق التعديل دون أن يفقده.

بالنسبة للمبدعين الذين يصلون إلى النتيجة عبر التكرار بدلاً من وصف المُخرَج النهائي مسبقاً، فإن هذا سير عملٍ أسرع بشكل ملموس.

منطق العالم الواقعي مدمج في صميمه

معرفة النموذج بالفيزياء والأحياء والبنية السردية والسياق الثقافي ليست طبقة منفصلة — بل هي جزء من طريقة تفسير النموذج للمُدخَلات. شمعة مشتعلة ترتجف في اتجاه تيارات الهواء. حشد يتفاعل مع شيءٍ ما قبل أن يحدث ذلك الشيء. تعبير الشخصية يطابق المستوى العاطفي للمشهد.

هذا ما يفصل المُخرَجات التي تبدو مقصودة عن المُخرَجات التي تبدو صحيحة تقنياً لكنها تبدو في غير محلّها. يقلّص Gemini Omni Flash هذه الفجوة بشكل كبير.

الأفاتارات الرقمية وفيديو المُقدِّم

يتمتّع Gemini Omni Flash بدعمٍ قوي لإنشاء محتوى بأسلوب المُقدِّم والأفاتار الرقمي. أرفِق صوتاً، وقدّم مرجعاً من صورة أو فيديو لمظهر الشخصية، وصِف الأداء. يبقى الصوت والتعبير والحركة على الشاشة مترابطين — ويُقرأ المُخرَج كأداءٍ متماسك لا كأجزاء مخيطة معاً.

بالنسبة لفيديوهات المنتجات، أو الفيديوهات التوضيحية، أو محتوى وسائل التواصل، أو أي صيغة يقود فيها الحضور البشري السرد، فإن هذه قدرة مباشرة وعملية.

أين تجده

Gemini Omni Flash متوفر الآن. افتح أداة Elements في مساحة عملك على Kolbo، وانتقل إلى وضع image-to-video، واختر Gemini Omni Flash من قائمة اختيار النماذج.

دون أي إعداد إضافي. أرصدتك تعمل كالمعتاد.


Gemini Omni Flash متوفر الآن في مساحة عملك على Kolbo.

جرّب Gemini Omni Flash →

مع أطيب التحيات، زوهار المؤسس، Kolbo.AI

Tags

geminigooglevideonew-modelmultimodalelementsimage-to-videotext-to-video

Related Posts

Seedance 2 متاح الآن في Kolbo — أفضل نموذج فيديو من ByteDance حتى الآن

Seedance 2 متاح الآن في Kolbo — أفضل نموذج فيديو من ByteDance حتى الآن

تم دمج Seedance 2 بالكامل في Kolbo.AI. يقدّم أحدث نموذج فيديو من ByteDance حركة أكثر وضوحًا، والتزامًا أقوى بالوصف، ومخرجات أكثر سينمائية عبر جميع أدوات الفيديو.

Read more
تحديث مايو 2026: أربعة نماذج جديدة + استوديو أكثر ذكاءً

تحديث مايو 2026: أربعة نماذج جديدة + استوديو أكثر ذكاءً

Grok Imagine Quality للصور السينمائية وفائقة الواقعية. Gemini Omni Video الذي يثبّت أصوات شخصيات محددة في النتيجة. 30 صوتًا جديدًا من Gemini TTS مع أكثر من 40 لهجة ومُحدِّد لتوجيه الصوت. بالإضافة إلى نظام تقدّم التوليد المُعاد تصميمه، ووضع المسح في أداة Inpaint، وعيّنات فيديو وصوت مرجعية لـ Visual DNA.

Read more
GPT Image 2 متوفر الآن في Kolbo: تفكير منطقي ودقة 4K ونصوص شبه مثالية

GPT Image 2 متوفر الآن في Kolbo: تفكير منطقي ودقة 4K ونصوص شبه مثالية

أقوى نموذج صور أطلقته OpenAI على الإطلاق أصبح متاحًا الآن في Kolbo.AI. حطّم GPT Image 2 لوحة صدارة Image Arena بفارق 242 نقطة عند إطلاقه — مع إخراج بدقة 4K ودقة نصوص تبلغ نحو 99% وتعبئة داخلية بلا أقنعة ومرجعية متعددة الصور. أنشئ وعدّل ونفّذ التعبئة الداخلية بدقة 4096×4096 من مساحة عملك مباشرة.

Read more

    We value your privacy

    We use cookies and similar technologies to improve your experience, analyze site traffic, and personalize content. You can choose which types of cookies to accept.