مقدمة: سباق الإبداع المحتدم في عصر الذكاء الاصطناعي
يشهد عالم الذكاء الاصطناعي التوليدي تطورًا متسارعًا يكاد لا يصدق، خاصة في مجال تحويل النصوص إلى صور فنية مذهلة. في قلب هذا السباق المحموم، تبرز منصة “ميدجورني” (Midjourney) كواحدة من أبرز اللاعبين، معروفة بقدرتها على إنتاج صور ذات جمالية فريدة وجودة عالية. ومؤخرًا، في خطوة أثارت حماس مجتمع المبدعين والمطورين، أعلنت ميدجورني عن إطلاق الإصدار السابع (V7) من نموذجها، وذلك بعد ما يقرب من عام على آخر تحديث رئيسي لها. يأتي هذا الإعلان في وقت تتزايد فيه حدة المنافسة، خصوصًا مع التحديثات المستمرة من عمالقة مثل OpenAI ونموذجها DALL-E المدمج أحيانًا في ChatGPT. فما الذي يحمله V7 من جديد؟ وكيف سيغير قواعد اللعبة في ساحة توليد الصور بالذكاء الاصطناعي؟ وهل هو حقًا رد ميدجورني على التقدم الذي تحرزه النماذج المنافسة؟ يستكشف هذا المقال تفاصيل إطلاق V7، ميزاته الجديدة، تأثيره المتوقع على المبدعين، وموقعه في المشهد التنافسي المتطور.
صعود ميدجورني: ريادة فنية في عالم الذكاء الاصطناعي
منذ تأسيسها في عام 2022 على يد ديفيد هولز (David Holz)، الذي شارك أيضًا في تأسيس شركة Leap Motion، نحتت ميدجورني لنفسها مكانة مرموقة في عالم الذكاء الاصطناعي التوليدي. على عكس العديد من الشركات الناشئة في هذا المجال، تميزت ميدجورني بعدم اعتمادها على تمويل خارجي ضخم، محققة نجاحًا ماليًا لافتًا، حيث تشير التقارير إلى أنها كانت في طريقها لتحقيق إيرادات تقارب 200 مليون دولار في أواخر عام 2023.
يكمن سر نجاح ميدجورني في تركيزها الشديد على الجودة الجمالية للصور المولدة. فبينما تتجه بعض النماذج الأخرى نحو الواقعية المطلقة أو فهم الأوامر المعقدة بدقة، تميزت ميدجورني بأسلوبها الفني الخاص، الذي غالبًا ما يوصف بأنه حالم، سينمائي، ومفصل بشكل غني. هذا “المظهر المميز” لميدجورني (Midjourney look) جذب شريحة واسعة من الفنانين والمصممين والمبدعين الذين وجدوا في المنصة أداة قوية لتحويل أفكارهم إلى لوحات بصرية آسرة.
عملت ميدجورني بشكل أساسي عبر منصة ديسكورد (Discord)، مما خلق مجتمعًا نشطًا وتفاعليًا يتبادل فيه المستخدمون الخبرات والأعمال الفنية. ومع تطورها، أطلقت واجهة ويب خاصة بها، مما سهل الوصول إليها لشريحة أوسع. الإصدارات السابقة مثل V5 و V6 و V6.1 جلبت تحسينات تدريجية في فهم الأوامر، التناسق، وجودة التفاصيل، لكن V7 يمثل قفزة نوعية حقيقية، مبنية على أسس جديدة كليًا.
الكشف عن V7: بنية جديدة وميزات تغير قواعد اللعبة
في بداية أبريل 2025، وبعد فترة من الترقب، أعلنت ميدجورني رسميًا عن بدء مرحلة الاختبار الأولي (Alpha) للإصدار V7. وصف ديفيد هولز، الرئيس التنفيذي، هذا الإصدار بأنه يعتمد على “بنية مختلفة تمامًا” عن سابقيه، مما يترجم إلى تحسينات جوهرية وملموسة.
أحد أبرز التطورات في V7 هو الفهم المحسن للأوامر النصية (Prompts). أصبح النموذج “أكثر ذكاءً” في تفسير الأوصاف التي يقدمها المستخدمون، حتى لو كانت أطول وأكثر تفصيلاً. هذا يعني أن النتائج أصبحت أقرب بشكل ملحوظ لرؤية المستخدم الأصلية، مما يقلل الحاجة إلى التجربة والخطأ المتكررين للوصول إلى الصورة المرغوبة.
ترافق هذا مع قفزة نوعية في جودة الصورة. يتحدث المستخدمون الأوائل وفريق ميدجورني عن “أنسجة جميلة” (beautiful textures) وتفاصيل أغنى وأكثر دقة. الأهم من ذلك، يعالج V7 إحدى نقاط الضعف المزمنة في نماذج توليد الصور السابقة: تحسين التناسق والواقعية في تصوير الأجسام، وخاصة الأيدي. لطالما كانت الأيدي المشوهة أو غير الطبيعية علامة مميزة للصور المولدة بالذكاء الاصطناعي، ويبدو أن V7 يخطو خطوة كبيرة نحو التغلب على هذا التحدي، بالإضافة إلى تحسين تناسق تفاصيل العناصر المختلفة داخل الصورة.
لم تتوقف التحسينات عند الجودة فقط، بل شملت سرعة التوليد أيضًا. تشير التقديرات الأولية إلى أن V7 أسرع بنسبة 20-30% تقريبًا من الإصدار السابق V6.1، مع الحفاظ على أداء أكثر استقرارًا حتى في أوقات الذروة على الخوادم. هذه السرعة المتزايدة، جنبًا إلى جنب مع الجودة المحسنة، تعني دورة إبداعية أسرع وأكثر كفاءة للمستخدمين.
وضع المسودة والتخصيص: تسريع الإبداع وتجربة فريدة
يقدم V7 ميزتين رئيسيتين تهدفان إلى تغيير طريقة تفاعل المستخدمين مع عملية توليد الصور: “وضع المسودة” (Draft Mode) وتفعيل “التخصيص” (Personalization) بشكل افتراضي.
وضع المسودة (Draft Mode): وُصف بأنه “أفضل طريقة على الإطلاق لتكرار الأفكار”. يعمل هذا الوضع بسرعة تزيد بحوالي 10 مرات عن الوضع القياسي، وبتكلفة تبلغ نصف تكلفة مهمة V6 العادية (من حيث استخدام موارد الحوسبة المخصصة للمشتركين). الصور الناتجة في هذا الوضع تكون أقل جودة وتفصيلاً، لكنها تحافظ على تناسق سلوكي وجمالي مع النتائج النهائية. الفكرة هي تمكين المستخدمين من تجربة العديد من الأفكار والاختلافات بسرعة فائقة وبتكلفة منخفضة. إذا أعجبت المستخدم مسودة معينة، يمكنه بنقرة واحدة “تحسينها” (enhance) أو “تغييرها” (vary) ليتم إعادة توليدها بالجودة الكاملة. المثير للاهتمام أيضًا هو إمكانية استخدام الأوامر الصوتية في وضع المسودة، مما يتيح للمستخدمين “التفكير بصوت عالٍ” وترك الأفكار تتدفق بسلاسة أكبر.
التخصيص الافتراضي (Default Personalization): في خطوة لافتة، أصبح V7 هو أول إصدار من ميدجورني يتم فيه تفعيل ميزة التخصيص بشكل افتراضي. كانت هذه الميزة اختيارية في السابق وتساعد النموذج على فهم التفضيلات الجمالية والبصرية للمستخدم الفردي. لاستخدام V7، يجب على المستخدمين أولاً إكمال عملية إعداد ملف التخصيص الخاص بهم عن طريق تقييم حوالي 200 زوج من الصور التي أنشأها مستخدمون آخرون (عملية تستغرق حوالي 5-6 دقائق). بمجرد الانتهاء، يتم “ضبط” النموذج ليتوافق بشكل أفضل مع ذوق المستخدم، مما قد يتجاوز “المظهر القياسي” لميدجورني وينتج صورًا أكثر توافقًا مع رؤية المستخدم الشخصية. يمثل هذا تحولًا نحو أدوات ذكاء اصطناعي أكثر تكيفًا وتخصيصًا.
يتوفر V7 حاليًا في وضعين رئيسيين: Turbo (أسرع وأعلى جودة ولكن أكثر تكلفة) و Relax (أبطأ وأقل تكلفة). ومن المتوقع إطلاق وضع قياسي قريبًا. بينما تعمل الميزات الأساسية مثل الأوامر النصية، نسب العرض إلى الارتفاع (–ar)، ومراجع الأسلوب (–sref) مع V7، فإن بعض الوظائف الأخرى مثل تكبير الدقة (Upscaling) وإعادة التركيب (Retexturing) لا تزال تستخدم نماذج V6.1 مؤقتًا، مع وعود بتحديثها لـ V7 خلال الشهرين المقبلين.
ساحة المنافسة: V7 في مواجهة DALL-E ونماذج OpenAI
يأتي إطلاق Midjourney V7 في وقت حاسم تتزايد فيه حدة المنافسة في سوق توليد الصور بالذكاء الاصطناعي. قبل أسبوع واحد فقط من إطلاق V7، أحدثت OpenAI ضجة بتحديث لقدرات توليد الصور في ChatGPT، والذي انتشر بسرعة لقدرته على محاكاة أسلوب استوديو جيبلي (Studio Ghibli) الشهير.
كيف يتموضع V7 في هذا المشهد؟ يبدو أن ميدجورني تواصل التركيز على نقاط قوتها الأساسية: الجودة الجمالية الفائقة والتحكم الدقيق. التحسينات في فهم النصوص، جودة الأنسجة، وتناسق الأجسام تهدف إلى إنتاج صور يصعب تمييزها عن الأعمال الفنية البشرية الاحترافية. كما أن ميزة التخصيص الافتراضي تمنح المستخدمين قدرة أكبر على توجيه النموذج نحو أسلوبهم المفضل، بعيدًا عن أي تحيز جمالي قياسي قد يكون لدى النموذج. وضع المسودة السريع يعزز أيضًا تجربة المستخدم من خلال السماح بالتجريب السريع للأفكار.
في المقابل، تتميز نماذج OpenAI مثل DALL-E 3 بقوتها في فهم الأوامر المعقدة والطويلة بدقة، وقدرتها على توليد نصوص مقروءة داخل الصور بشكل أفضل نسبيًا (وهي نقطة ضعف تاريخية لميدجورني، على الرغم من التحسينات المستمرة)، بالإضافة إلى سهولة الوصول والتكامل عبر منصات مثل ChatGPT وواجهات برمجة التطبيقات (APIs).
لا يمكن اعتبار V7 ردًا مباشرًا على ميزة محاكاة أسلوب جيبلي في ChatGPT، فميدجورني لطالما كانت قادرة على محاكاة أنماط فنية متنوعة. لكن إطلاق V7 بهذه التحسينات الكبيرة بعد فترة وجيزة من تحديث OpenAI يشير بوضوح إلى أن ميدجورني عازمة على الحفاظ على ريادتها في مجال جودة الصورة والابتكار الجمالي. المنافسة الآن تدور حول محاور متعددة: الدقة الواقعية، الجمالية الفنية، فهم الأوامر، سرعة التوليد، سهولة الاستخدام، القدرة على التخصيص، والتكامل مع سير العمل الإبداعي. V7 يعزز موقف ميدجورني بشكل كبير في عدة محاور منها، خاصة الجمالية والتخصيص وسرعة التجريب (عبر وضع المسودة).
التأثير على المبدعين والمستقبل: ما بعد V7
يمثل Midjourney V7 أكثر من مجرد تحديث؛ إنه أداة تمكينية جديدة للمبدعين في مختلف المجالات. الفنانون والمصممون يمكنهم الآن تحقيق رؤاهم بدقة أكبر وجودة أعلى، مع تقليل الوقت المستغرق في تعديل الأوامر ومعالجة العيوب مثل الأيدي المشوهة. وضع المسودة يفتح الباب أمام استكشاف أوسع للأفكار الأولية وتطوير المفاهيم بسرعة غير مسبوقة. يمكن للمسوقين ومنشئي المحتوى الاستفادة من الصور عالية الجودة والأكثر تناسقًا لإنشاء مواد بصرية جذابة وفريدة.
ومع ذلك، تثير هذه التطورات أيضًا تساؤلات حول مستقبل المهن الإبداعية وتحديات حقوق النشر. فبينما توفر هذه الأدوات إمكانيات هائلة، فإنها تطمس الخطوط الفاصلة بين الإبداع البشري والتوليد الآلي. تواجه ميدجورني، مثل غيرها من شركات الذكاء الاصطناعي التوليدي، دعاوى قضائية تزعم أن نماذجها تم تدريبها على بيانات محمية بحقوق الطبع والنشر دون إذن، وهي قضايا قد يكون لها تأثير كبير على مستقبل هذه التقنيات.
بالنظر إلى المستقبل، لا يبدو أن ميدجورني ستتوقف عند V7. فقد أعلنت الشركة مؤخرًا عن تشكيل فريق للأجهزة (Hardware) للعمل على مشاريع غير معلنة، وتواصل تدريب نماذج لتوليد الفيديو والأجسام ثلاثية الأبعاد (3D). هذا يشير إلى طموح أوسع لتوسيع قدراتها إلى ما وراء الصور الثابتة، ودخول مجالات جديدة في الإنتاج الإعلامي والترفيهي.
يشير إطلاق V7 إلى أن وتيرة الابتكار في مجال الذكاء الاصطناعي التوليدي لن تتباطأ قريبًا. نتوقع رؤية نماذج أكثر قوة، وفهمًا للسياق، وقدرة على التفاعل بطرق جديدة، مما سيستمر في إعادة تشكيل الصناعات الإبداعية وطريقة تفاعلنا مع المحتوى الرقمي.
خلاصة: V7 خطوة عملاقة نحو مستقبل الإبداع المعزز بالذكاء الاصطناعي
يعد إطلاق Midjourney V7 علامة فارقة في رحلة تطور أدوات توليد الصور بالذكاء الاصطناعي. بفضل بنيته الجديدة، وفهمه المحسن للأوامر، وجودة الصورة الاستثنائية، وميزاته المبتكرة مثل وضع المسودة والتخصيص الافتراضي، يضع V7 معيارًا جديدًا لما يمكن تحقيقه في هذا المجال. إنه ليس مجرد تحديث، بل هو إعادة تصور لتجربة المستخدم، تهدف إلى تسريع العملية الإبداعية وتمكين المستخدمين من تحقيق نتائج أقرب إلى رؤيتهم الفنية.
في ساحة المنافسة المحتدمة، يعزز V7 مكانة ميدجورني كقوة رائدة في الجمالية الفنية وجودة المخرجات، مقدمًا بديلاً قويًا ومتميزًا لنماذج مثل DALL-E. بينما تستمر التحديات القانونية والأخلاقية في الظهور، فإن التطور التكنولوجي يمضي قدمًا بلا هوادة. يمثل V7 شهادة على الإمكانيات المذهلة للذكاء الاصطناعي في تعزيز الإبداع البشري، ويفتح الباب أمام مستقبل تتداخل فيه الخوارزميات والخيال لإنتاج أعمال فنية لم تكن ممكنة من قبل. يبقى أن نرى كيف سيستقبل مجتمع المبدعين هذا الإصدار الجديد وكيف ستواصل ميدجورني تطويره في الأشهر القادمة، لكن المؤكد أن V7 قد أحدث بالفعل موجات كبيرة في محيط الذكاء الاصطناعي التوليدي.
أسئلة شائعة (FAQs)
س1: متى تم إطلاق Midjourney V7 رسميًا؟
ج1: بدأ الإطلاق التدريجي لمرحلة الاختبار الأولي (Alpha) لـ Midjourney V7 حوالي 3-4 أبريل 2025.
س2: ما هي أبرز التحسينات في Midjourney V7 مقارنة بالإصدارات السابقة؟
ج2: تشمل التحسينات الرئيسية فهمًا أفضل للأوامر النصية، جودة صور أعلى (خاصة في الأنسجة)، تناسقًا أفضل للأجسام والأيدي، وسرعة توليد أعلى، بالإضافة إلى ميزة التخصيص المفعلة افتراضيًا.
س3: ما هو “وضع المسودة” (Draft Mode) في V7؟
ج3: هو وضع سريع جدًا (أسرع 10 مرات) ومنخفض التكلفة (نصف تكلفة V6) لتوليد مسودات أولية للأفكار بجودة أقل، ويمكن تحسينها لاحقًا بنقرة واحدة. يدعم أيضًا الأوامر الصوتية.
س4: هل أحتاج إلى فعل شيء خاص لاستخدام V7؟
ج4: نعم، يجب أولاً إكمال عملية إعداد “ملف التخصيص” عن طريق تقييم حوالي 200 زوج من الصور. بعد ذلك، يمكن تفعيله عبر إعدادات الموقع أو بإضافة –v 7 للأمر.
س5: كيف يقارن Midjourney V7 بنماذج مثل DALL-E 3؟
ج5: يركز V7 بشكل أكبر على الجودة الجمالية الفائقة، الأنسجة الغنية، والتحكم في الأسلوب عبر التخصيص. بينما قد تتفوق نماذج مثل DALL-E 3 في فهم الأوامر المعقدة جدًا، توليد النصوص داخل الصور، وسهولة التكامل مع منصات أخرى مثل ChatGPT.
المصادر (Sources)
- Midjourney Official Documentation – Version: https://docs.midjourney.com/hc/en-us/articles/32199405667853-Version
- AIbase – Midjourney V7 Officially Released: https://www.aibase.com/news/16858
- Xpert.Digital – Can Midjourney V7 outdo Google and Openai?: https://xpert.digital/en/midjourney-v7/
- Tom’s Guide – Midjourney V7 has arrived: https://www.tomsguide.com/ai/midjourney-version-7
- ZDNET – I love MidJourney’s latest AI image generator, but there’s just one catch: https://www.zdnet.com/article/i-love-midjourneys-latest-ai-image-generator-but-theres-just-one-catch/ )
- Wandb / TechCrunch – Midjourney V7: A New GPT-4o image generation competitor?: https://wandb.ai/byyoung3/ml-news/reports/Midjourney-V7-A-New-GPT-4o-image-generation-competitor—VmlldzoxMjEyODUyMA