→ العودة إلى المدونة
Enterprise AI

إصدارات Google I/O 2026 للذكاء الاصطناعي: استراتيجية المؤسسات لـ Gemini 3.5 و Omni والوكلاء المستقلين

قدم مؤتمر Google I/O 2026 نماذج Gemini 3.5، و Gemini Omni متعدد الوسائط، وأنظمة موجهة للمهام مثل Universal Cart. يقدم هذا التحليل إطار عمل لتطبيق المؤسسات للانتقال إلى سير عمل الذكاء الاصطناعي المستقل.

بقلم Hamza Diaz
20 مايو 202610 دقيقة قراءة57 مشاهدة

الأساس: تفكيك Gemini 3.5 و Gemini Omni

أرست إصدارات Google I/O 2026 للذكاء الاصطناعي مسارًا جديدًا للبنية التحتية للذكاء الاصطناعي للمؤسسات. تركزت الإعلانات حول نموذجين أساسيين متميزين ولكنهما متكاملان: Gemini 3.5 و Gemini Omni. تتجاوز هذه النماذج الكفاءة المحادثية وتركز على التنفيذ والسرعة والاستدلال العميق متعدد الوسائط. بالنسبة لقادة التكنولوجيا، يعد فهم الفروق المعمارية بين هذه النماذج هو الخطوة الأولى في تحسين البنية التحتية للذكاء الاصطناعي للمؤسسات.

الفروق المعمارية بين 3.5 و Omni

يمثل Gemini 3.5 قفزة تكرارية ولكنها مهمة للغاية في قدرات الاستدلال وكفاءة نافذة السياق. تم تصميمه لمعالجة مستودعات النصوص والتعليمات البرمجية الضخمة بسرعة عالية، مما يجعله المحرك المثالي لاستخراج البيانات المعقدة وسير العمل التحليلي.

في المقابل، يقدم Gemini Omni بنية متعددة الوسائط أصلية مبنية من الألف إلى الياء. بدلاً من ربط نماذج منفصلة لمعالجة الصوت والفيديو والنص، يعالج Omni هذه المدخلات في وقت واحد ضمن شبكة عصبية واحدة. يقلل هذا التكامل الأصلي من زمن الاستجابة المرتبط عادةً بالنماذج المتسلسلة ويقلل من فقدان المعلومات أثناء ترجمة الوسائط. على سبيل المثال، يمكن أن تتضمن حالة استخدام افتراضية تطبيقًا يستوعب بث فيديو مباشر لخط إنتاج ويحلل في الوقت نفسه التوقيعات الصوتية للآلات، مع مقارنة كلا التدفقين بدليل صيانة نصي في الوقت الفعلي.

التنقل بين الميزات المطلقة والمعاينات القادمة قريبًا

يعد جزءًا أساسيًا من أي استراتيجية للمؤسسات هو التمييز بين ما هو متاح اليوم وما يتطلب تخطيطًا طويل الأجل. بينما يمكن الوصول إلى بعض القدرات الأساسية لـ Gemini 3.5 عبر Google Cloud Vertex AI، لا تزال العديد من الميزات المتقدمة لـ Gemini Omni في معاينة المطورين.

يجب أن تبدأ فرق هندسة المؤسسات اختبار بيئة الاختبار المعزولة (sandbox testing) باستخدام واجهات برمجة تطبيقات Gemini 3.5 المتاحة لبناء مسارات بيانات قوية. وفي الوقت نفسه، يجب عليهم إعداد أنظمتهم للتوافر العام لـ Omni في نهاية المطاف من خلال التأكد من فهرسة وتخزين أصول البيانات غير النصية، مثل سجلات الصوت وأرشيفات الفيديو، بشكل صحيح. يعد الاعتماد على أرقام المعايير غير الموثوقة لنماذج المعاينة خطأً شائعًا. بدلاً من ذلك، يجب أن تركز المؤسسات على التحسينات النوعية في تكامل سير العمل وجاهزية البيانات.

واجهات جديدة: تطبيق Gemini Spark وسير العمل متعدد الوسائط

مع تزايد قدرات النماذج الأساسية، يجب أن تتطور الواجهات التي يتفاعل المستخدمون من خلالها معها. لم تعد نافذة الدردشة الخطية كافية للمهام المؤسسية المعقدة والمتعددة الخطوات.

إعادة تعريف لوحة المؤسسات باستخدام Spark

يمثل الإعلان عن تطبيق Gemini Spark تحولًا نحو مساحة عمل ذكاء اصطناعي مكانية وتعاونية. Spark ليس مجرد واجهة دردشة آلية. إنه لوحة ديناميكية حيث يمكن للمستخدمين تجميع النصوص والتعليمات البرمجية التي تم إنشاؤها وتصورات البيانات والمدخلات متعددة الوسائط في مشروع واحد متماسك.

تسمح هذه البيئة للفرق بالحفاظ على الحالة والسياق عبر المهام طويلة الأمد. بدلاً من بدء سلسلة محادثات جديدة لكل استعلام، يمكن للمستخدمين التفاعل مع مساحة عمل مستمرة تتذكر التكرارات والتعديلات السابقة. يتوافق هذا النهج مع الحاجة إلى تعاون مستمر وواعٍ بالسياق للذكاء الاصطناعي في البيئات المهنية.

هيكلة سير عمل الإنشاء متعدد الوسائط للفرق

يسهل تكامل Gemini Spark سير عمل الإنشاء متعدد الوسائط المنظم عبر فرق وظيفية مختلفة. لنفترض أن قسم تسويق افتراضي يطلق منتجًا جديدًا. يمكن للفريق استخدام Spark لإنشاء النص الأولي، وتوليد أفكار للأصول المرئية، وصياغة كود HTML للصفحة المقصودة ضمن مساحة عمل موحدة.

يمكن لفرق الهندسة والعمليات الاستفادة بالمثل. يمكن أن يتضمن سير عمل افتراضي للاستجابة للحوادث لصق سجلات النظام ورسوم بيانية لأداء الخادم وتقارير الأخطاء في Spark، مما يسمح للذكاء الاصطناعي بتحليل أنواع البيانات المتباينة في وقت واحد واقتراح نص برمجي للمعالجة. ينتقل التحول من المطالبات المعاملاتية لمرة واحدة إلى بيئات إنشاء مستمرة وذات حالة.

الويب الوكيلي: وكلاء المعلومات، الملخص اليومي، و Universal Cart

ربما تركز الإعلانات الأكثر إزعاجًا من Google I/O 2026 على التحول من استرجاع البحث إلى الإجراءات المستقلة. ينتقل الويب إلى نظام بيئي وكيلي حيث تنفذ أنظمة الذكاء الاصطناعي المهام نيابة عن المستخدم.

من الاسترجاع إلى الإجراء: الوكلاء في البحث

يمثل وكلاء معلومات Google ونظرات عامة Google AI Overviews (AIO) المحسّنة تطورًا أساسيًا لمحرك البحث. بدلاً من إرجاع قائمة روابط للمستخدم للنقر عليها وقراءتها، يمكن لوكلاء المعلومات تنفيذ مهام بحث متعددة الخطوات. يقومون بتجميع النتائج عبر مصادر متعددة وتقديم إجابة شاملة. تتطلب هذه القدرة من المؤسسات اعتماد مكدس رؤية البحث بالذكاء الاصطناعي قوي لضمان أن بياناتها وخدماتها الخاصة قابلة للقراءة لهؤلاء الوكلاء المستقلين.

الملخص اليومي: التوليف السياقي

توضح ميزة Daily Brief قوة التوليف السياقي. من خلال تنظيم وتلخيص المعلومات المخصصة، فإنها توضح كيف يمكن للذكاء الاصطناعي تقديم قيمة بشكل استباقي دون الحاجة إلى مطالبة صريحة. يمكن لأنظمة إدارة المعرفة في المؤسسات أن تتعلم من هذا النموذج من خلال الانتقال من مستودعات المستندات السلبية إلى أنظمة ذكاء استباقية تدفع التحديثات الداخلية ذات الصلة إلى الموظفين بناءً على مشاريعهم وأدوارهم الحالية.

Universal Cart ومستقبل وكلاء التسوق بالذكاء الاصطناعي

بالنسبة لمؤسسات B2B و B2C، يمثل Universal Cart وصعود وكلاء التسوق بالذكاء الاصطناعي تحولًا هيكليًا في السوق. يسمح Universal Cart للمستخدمين بإكمال المعاملات عبر منصات مختلفة بسلاسة من خلال تفاعلات الذكاء الاصطناعي.

هذا يعني أن وكلاء الذكاء الاصطناعي سيتخذون بشكل متزايد قرارات الشراء أو ينفذون سير عمل المشتريات بناءً على معايير محددة مسبقًا. للمشاركة في هذه التجارة من وكيل إلى وكيل، يجب على المؤسسات الكشف عن بيانات منتجات منظمة للغاية وقابلة للقراءة آليًا وواجهات برمجة تطبيقات المعاملات. الشركات التي تفشل في إعداد بنيتها التحتية لـ مكدس التجارة الوكيلية تخاطر بأن تصبح غير مرئية لهؤلاء المشترين الآليين.

إطار عمل Optijara 'لجاهزية الوكلاء' للنشر

للتنقل بأمان في الانتقال إلى سير العمل الوكيلي، تحتاج المؤسسات إلى منهجية منظمة. يوفر إطار عمل Optijara 'لجاهزية الوكلاء' للنشر نهجًا مرحليًا لتطبيق قدرات الذكاء الاصطناعي المستقلة.

تقييم قابلية تنفيذ مسار بياناتك

قبل منح وكيل الذكاء الاصطناعي امتيازات التنفيذ، يجب على المؤسسة تقييم قابلية تنفيذ مسار بياناتها.

يتطلب الإطار تقييمًا صارمًا عبر ثلاث طبقات:

  1. تنقية البيانات: التأكد من أن جميع بحيرات ومستودعات البيانات خالية من معلومات التعريف الشخصية (PII) والشذوذات غير المهيكلة التي قد تربك وكيلًا مستقلاً أو تفسد مسارات التوليد المعزز بالاسترجاع (RAG).
  2. نضج نظام واجهات برمجة التطبيقات (API): التحقق من أن واجهات برمجة التطبيقات الداخلية والخارجية موثقة، ومتحكم بها بالإصدار، ويمكن الوصول إليها عبر مصادقة آمنة قائمة على الرمز المميز.
  3. تعريف نطاق التنفيذ: تحديد واضح لحدود ما يُسمح للوكيل بفعله، ورسم خرائط للمهام للقراءة فقط مقابل عمليات القراءة والكتابة.

إذا كانت واجهات برمجة التطبيقات الأساسية هشة أو كانت البيانات غير منظمة، فإن نشر الوكلاء الموجهين نحو الإجراءات سيؤدي فقط إلى أتمتة الفشل على نطاق واسع. يجب على الفرق تطبيق بوابة واجهة برمجة تطبيقات الذكاء الاصطناعي لإدارة هذه الحركة المرورية المعقدة بأمان.

استراتيجية النشر المرحلي

يفرض إطار عمل Optijara استراتيجية نشر مرحلية صارمة للتخفيف من المخاطر:

  1. اختبار بيئة الاختبار المعزولة (Sandbox Testing): تعمل الوكلاء في بيئات معزولة وغير إنتاجية ببيانات اصطناعية للتحقق من المنطق وتفاعلات واجهة برمجة التطبيقات.
  2. التنفيذ المقيد: يتم نشر الوكلاء في بيئة الإنتاج ولكن يقتصرون على مهام القراءة فقط أو الصياغة الداخلية، مما يتطلب موافقة بشرية لأي إجراء خارجي.
  3. الاستقلالية الخاضعة للإشراف: يمكن للوكلاء تنفيذ إجراءات منخفضة المخاطر وقابلة للعكس تلقائيًا، ولكن القرارات عالية المخاطر تتطلب مراجعة بشرية.
  4. التفويض الكامل: فقط بعد إثبات موثوقية مستمرة، يتم منح الوكلاء الاستقلالية على سير العمل المعقدة والمتعددة الخطوات مع وجود سجل تدقيق شامل.

حقائق التنفيذ: تحذيرات وما تخطئ فيه الفرق

على الرغم من الإمكانات التحويلية لإصدارات Google I/O 2026، فإن تطبيق الأنظمة المستقلة يقدم تحديات تشغيلية كبيرة.

خطر التنفيذ المهلوس

عندما تهلوس نماذج اللغة الكبيرة في واجهة الدردشة، تكون النتيجة نصًا غير صحيح. عندما يهذي نظام وكيلي، يمكن أن يؤدي ذلك إلى تنفيذ مهلوس. يحدث هذا عندما يحاول وكيل استدعاء نقطة نهاية واجهة برمجة تطبيقات غير موجودة، أو ينفذ أمرًا بمعلمات غير صحيحة، أو يسيء تفسير حالة النظام ويتخذ إجراءً مدمرًا. يتطلب منع ذلك التحقق الصارم من المخطط وبروتوكولات التراجع الحتمية.

قدم ذاكرة التخزين المؤقت وحدود معدل واجهة برمجة التطبيقات

يعمل الوكلاء بسرعة الآلة، مما قد يكشف بسرعة عن قيود البنية التحتية القديمة. يصبح قدم ذاكرة التخزين المؤقت مشكلة حرجة عندما يتخذ الوكيل قرارات بناءً على بيانات مخزون أو تسعير قديمة. علاوة على ذلك، يمكن أن تولد سير عمل الوكلاء المتعددين غير المتزامنة ارتفاعات هائلة في طلبات واجهة برمجة التطبيقات، مما يؤدي إلى التقييد وتدهور الخدمة إذا لم يتم إنشاء آليات مناسبة لتحديد المعدل والانتظار.

المبالغة في تقدير الموثوقية الذاتية الحالية

من الأخطاء الشائعة المبالغة في تقدير الموثوقية الحالية للأنظمة المستقلة ونشرها دون إشراف كافٍ. غالبًا ما تتعامل الفرق مع وكلاء الذكاء الاصطناعي على أنهم مكافئون للبشر، بافتراض أنهم يمتلكون الحس السليم. في الواقع، يكون الوكلاء هشين عند مواجهة حالات حافة غير مغطاة صراحةً في تدريبهم أو قيود المطالبة. الاعتماد على وكيل للعمليات الحيوية دون مفتاح تجاوز يدوي هو عيب معماري. يجب أن يظل التركيز على المقايضات الهندسية القياسية، مع إعطاء الأولوية للنضج التشغيلي على جاذبية الأتمتة الكاملة.

قائمة التحقق من وكيل الإجراءات وخطة قياس المؤسسات

لضمان نشر ناجح، يجب على المؤسسات الانتقال من التخطيط النظري إلى التنفيذ والقياس التقني الصارم.

قائمة التحقق الفنية قبل النشر

قبل السماح للوكيل بالتفاعل مع أنظمة الإنتاج، يجب على فرق الهندسة إكمال قائمة تحقق فنية شاملة:

  1. تحديد نطاق التنفيذ الدقيق وشروط الحدود لكل وكيل.
  2. إنشاء تسجيل صارم وغير قابل للتغيير لجميع استدعاءات واجهة برمجة التطبيقات المدعومة بالذكاء الاصطناعي.
  3. إعداد بوابات واجهة برمجة تطبيقات الذكاء الاصطناعي الآمنة للتعامل مع توجيه الرموز المميزة وتنقية معلومات التعريف الشخصية (PII).
  4. تحديد عتبات خطأ صريحة تؤدي تلقائيًا إلى تعليق الوكيل.
  5. تنفيذ "مفتاح إيقاف" يلغي فورًا وصول الوكيل إلى جميع واجهات برمجة التطبيقات للقراءة والكتابة.

تجاوز مقاييس الغرور في عائد الاستثمار للذكاء الاصطناعي

يتطلب قياس تأثير الوكلاء المستقلين تجاوز مقاييس الغرور العامة مثل "الوقت الموفر" أو "عدد المطالبات التي تم إنشاؤها". هذه المقاييس لا تعكس قيمة الأعمال.

بدلاً من ذلك، يجب على المؤسسات التركيز على النتائج القابلة للتحقق. يجب أن تتتبع خطة القياس القوية معدل إكمال المهام المؤتمتة بنجاح، وتحديدًا قياس عدد المرات التي يكمل فيها الوكيل سير عمل دون تدخل بشري. يجب على المؤسسات أيضًا مراقبة تكرار التدخل وزمن استجابة تنفيذ واجهة برمجة التطبيقات. الهدف النهائي هو ربط هذه المقاييس الفنية مباشرة بأهداف العمل، مما يضمن أن استثمارات الذكاء الاصطناعي تدفع كفاءة تشغيلية قابلة للقياس.

النقاط الرئيسية

  • 1تعالج بنية Gemini Omni الأصلية متعددة الوسائط الصوت والفيديو والنص في وقت واحد، مما يقلل من زمن الاستجابة مقارنة بالنماذج المتسلسلة.
  • 2ينقل تطبيق Gemini Spark تفاعل الذكاء الاصطناعي للمؤسسات من الدردشة الخطية إلى مساحات عمل مستمرة وذات حالة وتعاونية.
  • 3تشير وكلاء معلومات Google إلى انتقال من استرجاع البحث إلى تنفيذ المهام المستقلة ومتعددة الخطوات.
  • 4يتطلب Universal Cart ووكلاء التسوق بالذكاء الاصطناعي من الشركات الكشف عن بيانات وواجهات برمجة تطبيقات منظمة وقابلة للقراءة آليًا للبقاء مرئية.
  • 5يفرض إطار عمل Optijara 'لجاهزية الوكلاء' للنشر تنقية صارمة للبيانات واستراتيجية نشر مرحلية.
  • 6يعد التنفيذ المهلوس وقدم ذاكرة التخزين المؤقت لواجهة برمجة التطبيقات من المخاطر الحرجة عند نشر الوكلاء المستقلين في بيئة الإنتاج.
  • 7يجب أن يتحول قياس عائد الاستثمار للذكاء الاصطناعي من مقاييس الغرور مثل الوقت الموفر إلى نتائج قابلة للتحقق مثل معدلات إكمال المهام المؤتمتة.

الخلاصة

أشارت الإعلانات في Google I/O 2026 إلى نهاية حاسمة للذكاء الاصطناعي كمساعد سلبي وبداية للذكاء الاصطناعي كمشارك نشط ومستقل في سير عمل المؤسسات. مع توسع قدرات Gemini 3.5 و Gemini Omni في المجالات متعددة الوسائط والوكيلية، يجب على المؤسسات تحويل تركيزها من هندسة المطالبات إلى هندسة الأنظمة. يتطلب صعود Universal Cart ووكلاء المعلومات ومساحات العمل المستمرة مثل Gemini Spark بنية تحتية رقمية منظمة بدقة وتعتمد على واجهة برمجة التطبيقات أولاً. ستحصل المؤسسات التي تنفذ بنجاح إطار عمل جاهزية الوكلاء وتحدث مسارات بياناتها اليوم على ميزة هيكلية، بالانتقال من توليد النصوص إلى تنفيذ المهام الآمن والقابل للتحقق. لبدء تقييم البنية التحتية لبياناتك ورسم خريطة الانتقال إلى تنفيذ المهام الآمن، استشر فريق Optijara الاستشاري للذكاء الاصطناعي.

الأسئلة الشائعة

ما الفرق بين Gemini 3.5 و Gemini Omni؟

يمثل Gemini 3.5 قفزة تكرارية في قدرات الاستدلال ونافذة السياق، بينما يقدم Gemini Omni بنية متعددة الوسائط أصلية مصممة من الألف إلى الياء لمعالجة الصوت والفيديو والنص في وقت واحد دون ربط نماذج منفصلة.

كيف يغير تطبيق Gemini Spark سير عمل المؤسسات؟

ينقل تطبيق Gemini Spark واجهة الذكاء الاصطناعي من نافذة دردشة خطية إلى مساحة عمل ديناميكية ومتعددة الوسائط حيث يمكن للفرق التعاون في إنشاء وتحرير وتكرار المشاريع المعقدة عبر النصوص والتعليمات البرمجية والوسائط.

ما هي وكلاء معلومات Google في البحث؟

يمثل وكلاء المعلومات تحولًا من استرجاع البحث التقليدي إلى تنفيذ المهام، قادرين على البحث في الاستعلامات المعقدة، وتجميع النتائج، وتنفيذ سير عمل متعدد الخطوات مباشرة نيابة عن المستخدم.

كيف يؤثر وكلاء التسوق بالذكاء الاصطناعي و Universal Cart على مؤسسات B2B؟

يقوم Universal Cart ووكلاء التسوق بأتمتة عملية الشراء والمعاملات. بالنسبة لمؤسسات B2B، يتطلب هذا واجهات برمجة تطبيقات للمنتجات والتسعير منظمة وقابلة للقراءة آليًا لضمان الرؤية لوكلاء الشراء المستقلين.

هل ميزات الذكاء الاصطناعي في Google I/O 2026 متاحة للنشر الفوري في المؤسسات؟

يختلف التوفر؛ فبينما يمكن الوصول إلى بعض تحديثات Gemini الأساسية عبر Vertex AI، يتم طرح الميزات الوكيلية المتقدمة و Universal Cart على مراحل، وغالبًا ما تبدأ في معاينة المطورين.

المصادر

شارك هذا المقال

Hamza Diaz

بقلم

Hamza Diaz

حمزة دياز هو مؤسس Optijara، حيث يبني وكلاء ذكاء اصطناعي عمليين، وأنظمة أتمتة، وسير عمل Copilot للشركات الخدمية. يكتب عن تشغيل الذكاء الاصطناعي، واستراتيجية الوكلاء، والتطبيق الواقعي للفرق التي تريد أنظمة مفيدة بدلًا من الضجيج.