صمم بوسترات احترافية ونماذج واجهات المستخدم مع LongCat-Image. النموذج مفتوح المصدر اللي يتقن النصوص ثنائية اللغة والتعديلات المعقدة.
لم يتم العثور على سجل سابق
فشل في الإنشاء
صورة LongCat هو نموذج قوي ومبتكر لتحويل النص إلى صورة، بعدد معلمات يصل إلى 6 مليارات (6B)، تم تطويره من قبل Meituan. صُمم النموذج ليكون حلقة الوصل بين النماذج الاحتكارية الضخمة والحلول مفتوحة المصدر الفعالة، حيث يتخصص في عرض النصوص بجودة عالية واتباع التعليمات بدقة كبيرة.
المُعطى | الوصف |
|---|---|
المطور | Meituan |
التكلفة | 30 رصيد لكل صورة |
السرعة | سريعة (<15 ثانية) |
عرض النص | يدعم الصينية والإنجليزية بشكل أصلي (بدقة عالية) |
الأسلوب البصري | واقعي، تجاري، بتصميم نظيف |
أقصى دقّة | 1K |
تتميز صورة LongCat بأنها تقدم معمارية كثيفة بعدد معلمات يبلغ 6 مليارات، متخطية موضة النماذج ذات الأعداد الهائلة من المعاملات. تم تحسين النموذج ليمنحك سرعة استجابة أعلى واستهلاك أقل للذاكرة مقارنة بنماذج مثل SDXL أو Flux، وكل ذلك دون المساومة على جودة الصورة المطلوبة للمهام التجارية.
يعتمد النموذج على مقسم كلمات خاص واستراتيجية تعليم متدرجة لحل مشكلة ظهور النصوص بشكل غير مفهوم. هذا يجعله يتفوق بوضوح على النماذج مفتوحة المصدر الخفيفة جدًا مثل z-image؛ فبالرغم من شهرة z-image في صغر حجمه، إلا أن جودته في عرض النصوص ضعيفة، وغالبًا ما ينتج عنها نصوص مشوشة أو رموز غير مقروءة.
تضم المنظومة LongCat-Image-Edit، وهي نسخة مصممة خصيصًا لتعديل الصور بدقة. بإمكان المستخدمين تعديل الصور الحالية باستخدام تعليمات بلغة طبيعية، مع الحفاظ بشكل صارم على هوية وتكوين العنصر الأصلي في الصورة.
للحصول على أفضل النتائج مع صورة LongCat، خاصة عند توليد النصوص، يرجى اتباع تعليمات التنسيق التالية:
محفز النص: يجب دائمًا وضع أي نص ترغب في إنشائه بين علامتي اقتباس مزدوجتين "".
خاطئ: لافتة مكتوب عليها Open
صحيح: لافتة نيون مكتوب عليها "Open"
البنية: [وصف العنصر]، [الأسلوب/الإضاءة]، [مطلب النص]
مثال 1 (إعلانات):
صورة احترافية لزجاجة عصير على حامل، يحيط بها برتقال ودفقة ماء، نص على الملصق مكتوب عليه "Fresh"، دقّة 8k، إضاءة سينمائية.
مثال 2 (ثنائي اللغة):
بوستر تقليدي للسنة الصينية الجديدة، خلفية حمراء مع نقوش ذهبية، نص خط كبير في الوسط مكتوب عليه "龙年大吉"، بأسلوب رسومي متجهي.
أصول التجارة الإلكترونية والتسويق اصنع بنرات وصور منتجات احترافية جاهزة للنشر. تتميز صورة LongCat بقدرتها على وضع أسماء العلامات التجارية والشعارات بشكل مباشر على التغليف أو اليافطات بشكل واقعي، مما يقلل كثيرًا الحاجة لاستخدام برامج تعديل الصور الخارجية لإضافة النصوص.
نمذجة واجهات المستخدم (UI) يمكن للمصممين إنشاء واجهات تطبيقات الجوال أو رؤوس مواقع الإنترنت مع نصوص بديلة واضحة، ما يساعد في تصور تخطيطات متكاملة وسريعة يراها العميل بشكل قريب جدًا من المنتج النهائي.
تعديل العناصر بدقة من خلال إمكانيات التحرير، يمكن للمبدعين تغيير تفاصيل محددة في الصورة – مثل تغيير ملابس عارض أو توقيت الإضاءة – بدون التأثير على بقية مكونات الصورة أو تشويهها.
Somake تتخطى حاجز العتاد. صورة LongCat تتطلب موارد GPU قوية للتشغيل محليًا؛ مع Somake يمكنك الوصول للنموذج مباشرة عبر البنية السحابية المحسّنة لدينا، وتوليد الصور في ثوانٍ وبدون أي تجهيزات مسبقة.
نوفر تكامل صورة LongCat في مسار عمل احترافي بالكامل. تمكّنك Somake من الانتقال بسهولة بين أنماط التوليد والتحرير، وتوفر أدوات لتحسين جودة النتائج وتكبيرها، مما يجعل الطريق من الفكرة إلى الأصل النهائي سلس وسريع.
تعتمد Somake على قوة LongCat في دعم اللغات لتلبية احتياجات الفرق الدولية. سواء كنت تستهدف الأسواق الغربية أو جمهور آسيا والمحيط الهادئ، يضمن التكامل الخاص بنا أن تكون محتوياتك البصرية دقيقة لغويًا وملائمة ثقافيًا.
نعم. تم إطلاق النموذج بترخيص Apache 2.0، والذي عادة يتيح استخدامه تجاريًا. يُرجى مراجعة شروط الترخيص الكاملة على Somake للتحقق من جميع تفاصيل الاستخدام المسموح به.
LongCat أسرع وأكثر كفاءة بفضل حجمه الصغير (6B). بينما قد تمنحك Midjourney طابعًا فنيًا وتجريديًا أكثر، إلا أن LongCat يتفوّق في الدقة للاستخدامات التجارية، وخصوصًا في عرض النصوص واتباع التعليمات البنيوية المعقدة.
تأكد من وضع النص المطلوب داخل علامات اقتباس مزدوجة "" في التلميح الخاص بك. هذه الحركة هي ما يجعل النموذج يفعّل آلية عرض النصوص بشكل دقيق.
النموذج مرن لكنه يعمل بأفضل أداء مع نسب الأبعاد القياسية (1:1، 3:4، 4:3، 16:9) بدقّة تقريبًا 1024x1024 أو أعلى. لنتائج ملائمة للطباعة، ننصح بالتوليد بهذا الحجم واستخدام أداة تكبير الصور المدمجة في Somake.