جوجل تطلق Gemini Embedding 2 لفهم النصوص والصور والفيديو معاً - ملتقى الشفاء الإسلامي

 

اخر عشرة مواضيع :         مائة من عظماء أمة الإسلام غيروا مجرى التاريخ (اخر مشاركة : ابوالوليد المسلم - عددالردود : 60 - عددالزوار : 39272 )           »          شريحة Neuralink تعيد القدرة على الكلام لمرضى التصلب الجانبى الضمورى (اخر مشاركة : ابوالوليد المسلم - عددالردود : 0 - عددالزوار : 40 )           »          إنثروبيك تعزز الـ AI.. كل ما تحتاج معرفته عن الوضع الآلى فى Claude Code (اخر مشاركة : ابوالوليد المسلم - عددالردود : 0 - عددالزوار : 30 )           »          أول تسريب لآيباد 2026.. نفس التصميم القديم مع تحسينات داخلية (اخر مشاركة : ابوالوليد المسلم - عددالردود : 0 - عددالزوار : 31 )           »          واتساب يفاجئ مستخدمى آيفون.. حسابان فى جهاز واحد وميزات ذكاء اصطناعى جديدة (اخر مشاركة : ابوالوليد المسلم - عددالردود : 0 - عددالزوار : 33 )           »          5 أعراض للإدمان الرقمى أبرزها اضطرابات النوم والقلق وتراجع الأداء الدراسى (اخر مشاركة : ابوالوليد المسلم - عددالردود : 0 - عددالزوار : 33 )           »          ذكاء اصطناعى أخف.. كيف تجعل Mini وNano تجربة أسرع وأذكى؟ (اخر مشاركة : ابوالوليد المسلم - عددالردود : 0 - عددالزوار : 34 )           »          آبل تُدخل الإعلانات إلى خرائطها لأول مرة.. تجربة جديدة تبدأ هذا الصيف (اخر مشاركة : ابوالوليد المسلم - عددالردود : 0 - عددالزوار : 37 )           »          مركز التحكم فى Apple.. تجربة ذكية تُعيد تعريف استخدام iPhone (اخر مشاركة : ابوالوليد المسلم - عددالردود : 0 - عددالزوار : 32 )           »          Apple تطلق Playlists فى التحديث الجديد و8 إيموجي جديدة لمستخدمي iPhone (اخر مشاركة : ابوالوليد المسلم - عددالردود : 0 - عددالزوار : 33 )           »         

العودة   ملتقى الشفاء الإسلامي > قسم الصوتيات والمرئيات والبرامج > ملتقى البرامج والانترنات والجرافيكس > قسم الفوتوشوب
التسجيل التعليمـــات التقويم

قسم الفوتوشوب كل مايخص برنامج الفوتوشوب بالإضافه الى الدروس المشروحه للتصاميم والفلاتر والبرامج المرادفه

إضافة رد
 
أدوات الموضوع انواع عرض الموضوع
  #1  
قديم 25-05-2026, 05:07 PM
الصورة الرمزية ابوالوليد المسلم
ابوالوليد المسلم ابوالوليد المسلم غير متصل
قلم ذهبي مميز
 
تاريخ التسجيل: Feb 2019
مكان الإقامة: مصر
الجنس :
المشاركات: 176,856
الدولة : Egypt
افتراضي جوجل تطلق Gemini Embedding 2 لفهم النصوص والصور والفيديو معاً

جوجل تطلق Gemini Embedding 2 لفهم النصوص والصور والفيديو معاً



كتبت رنا أمين

جوجل تطلق Gemini Embedding 2 لفهم النصوص


أعلنت شركة Google عن إطلاق أول نموذج تضمين متعدد الوسائط بالكامل يحمل اسم Gemini Embedding 2، وهو نموذج ذكاء اصطناعي جديد قادر على تحليل النصوص والصور والصوت والفيديو داخل نظام موحد لفهم البيانات.
وأوضحت الشركة أن النموذج الجديد يقوم بربط هذه الأنواع المختلفة من المحتوى داخل مساحة تضمين واحدة، ما يسمح للذكاء الاصطناعي بفهم المفاهيم سواء ظهرت في شكل كلمات مكتوبة أو صوت مسموع أو صورة أو حتى مقطع فيديو.
وتؤكد الشركة، التي تتخذ من مدينة Mountain View مقراً لها، أن هذه التقنية ستجعل من السهل على نماذج اللغة الكبيرة فهم المعلومات بطريقة أكثر تكاملاً، كما ستساعدها على تنفيذ مهام أكثر تعقيداً مقارنة بالأنظمة السابقة.
أول نموذج تضمين متعدد الوسائط من جوجل

في تدوينة رسمية على مدونتها، كشفت Google تفاصيل النموذج الجديد، موضحة أنه يمثل الجيل التالي من نماذج التضمين التي طورتها الشركة، ويُعد Gemini Embedding 2 خليفة لنموذج التضمين السابق الذي كان يركز على النصوص فقط وتم إطلاقه العام الماضي، لكنه الآن قادر على فهم المعاني والسياق الدلالي عبر أكثر من 100 لغة مختلفة.
كما أصبح النموذج متاحاً حالياً في مرحلة المعاينة العامة من خلال واجهة البرمجة الخاصة بمنصة Gemini API وكذلك عبر منصة الذكاء الاصطناعي السحابية Vertex AI.
كيف تتعامل نماذج الذكاء الاصطناعي مع البيانات

عادةً ما تستخدم نماذج الذكاء الاصطناعي أنظمة منفصلة للتعامل مع أنواع البيانات المختلفة. فالنصوص يتم تخزينها ومعالجتها في نظام خاص، بينما تُحفظ الصور في نظام آخر، وكذلك الحال بالنسبة لمقاطع الفيديو والملفات الصوتية.
وعندما يطلب المستخدم معلومات معينة، يبدأ النموذج في البحث داخل النظام المرتبط بنوع الملف المطلوب فقط، فعلى سبيل المثال، غالباً ما تتعامل نماذج اللغة الكبيرة مع كلمة “قطة” داخل مستند نصي بشكل مختلف تماماً عن ظهور قطة داخل مقطع فيديو أو صورة، ويزيد الأمر تعقيداً أن طرق استخراج المعلومات تختلف من نوع محتوى إلى آخر.
نظام موحد لمعالجة جميع أنواع المحتوى

يهدف Gemini Embedding 2 إلى حل هذه المشكلة من خلال تقديم بنية جديدة تعتمد على مساحة تضمين موحدة يمكنها التعامل مع جميع أنواع البيانات، فبدلاً من استخدام أنظمة متعددة، يستطيع النموذج التعامل مع النصوص والصور والفيديو والصوت داخل نظام واحد فقط.
ويعني ذلك أن النموذج يمكنه تحليل مستند يحتوي على نصوص وصور في الوقت نفسه، بطريقة تشبه إلى حد كبير الطريقة التي يفهم بها البشر المعلومات من مصادر متعددة في آن واحد، وتقول Google إن هذه البنية الجديدة تساعد على تبسيط الأنظمة التقنية المعقدة وتحسين أداء العديد من التطبيقات المعتمدة على الذكاء الاصطناعي.
تطبيقات واسعة للنموذج الجديد

وبحسب جوجل، يمكن استخدام Gemini Embedding 2 في مجموعة واسعة من التطبيقات المتقدمة، ومن بين هذه الاستخدامات تقنيات Retrieval-Augmented Generation المعروفة اختصاراً باسم RAG، والتي تساعد نماذج الذكاء الاصطناعي على توليد إجابات أكثر دقة من خلال الاستفادة من مصادر خارجية.
كما يمكن استخدام النموذج في تحسين البحث الدلالي داخل قواعد البيانات، وتحليل المشاعر داخل النصوص، إضافة إلى تنظيم البيانات وتجميعها داخل مجموعات متشابهة.
قدرات تقنية متقدمة للنموذج

يأتي Gemini Embedding 2 بعدد من القدرات التقنية المتقدمة التي تسمح له بالتعامل مع أنواع مختلفة من البيانات، فعلى مستوى النصوص، يمتلك النموذج نافذة سياق تصل إلى 8192 رمز إدخال، ما يسمح له بمعالجة كميات كبيرة من المحتوى النصي في الطلب الواحد.
كما يستطيع النموذج تحليل ما يصل إلى ست صور في الطلب الواحد بصيغ PNG وJPEG، أما بالنسبة للفيديو، فيمكنه معالجة مقاطع تصل مدتها إلى 120 ثانية بصيغ MP4 وMOV، ويتميز النموذج أيضاً بقدرته على معالجة البيانات الصوتية بشكل مباشر دون الحاجة إلى تحويلها أولاً إلى نص مكتوب، وهي ميزة تساهم في تسريع عملية تحليل الصوت، إضافة إلى ذلك، يستطيع النموذج تضمين ملفات PDF يصل طولها إلى ست صفحات.




__________________
سُئل الإمام الداراني رحمه الله
ما أعظم عمل يتقرّب به العبد إلى الله؟
فبكى رحمه الله ثم قال :
أن ينظر الله إلى قلبك فيرى أنك لا تريد من الدنيا والآخرة إلا هو
سبحـــــــــــــــانه و تعـــــــــــالى.

رد مع اقتباس
إضافة رد


الذين يشاهدون محتوى الموضوع الآن : 1 ( الأعضاء 0 والزوار 1)
 

تعليمات المشاركة
لا تستطيع إضافة مواضيع جديدة
لا تستطيع الرد على المواضيع
لا تستطيع إرفاق ملفات
لا تستطيع تعديل مشاركاتك

BB code is متاحة
كود [IMG] متاحة
كود HTML معطلة

الانتقال السريع


 


الاحد 20 من مارس 2011 , الساعة الان 01:21:21 صباحاً.

Powered by vBulletin V3.8.5. Copyright © 2005 - 2013, By Ali Madkour

[حجم الصفحة الأصلي: 48.49 كيلو بايت... الحجم بعد الضغط 46.82 كيلو بايت... تم توفير 1.67 كيلو بايت...بمعدل (3.45%)]