جوجل قادرة علي تدريب الذكاء الاصطناعي للبحث باستخدام محتوى weh حتى بعد إلغاء الاشتراك

جوجل

شهد نائب رئيس المنتجات في شركة جوجل أمام المحكمة يوم الجمعة أن الشركة قادرة على تدريب منتجات الذكاء الاصطناعي الخاصة بالبحث، مثل AI Overviews، على المحتوى عبر الويب حتى عندما يختار الناشرون عدم الاشتراك في تدريب منتجات الذكاء الاصطناعي الخاصة بشركة جوجل.

يعود ذلك إلى أن ضوابط جوجل التي تُمكّن الناشرين من إلغاء تدريب الذكاء الاصطناعي لا تشمل سوى أعمال مختبر جوجل ديب مايند للذكاء الاصطناعي التابع للشركة، وليس أي مؤسسة أخرى في الشركة، وفقًا لإيلي كولينز، نائب رئيس جوجل ديب مايند.

سألت ديانا أغيلار، محامية في وزارة العدل: “بمجرد استخدام نموذج جيميني للذكاء الاصطناعي، يصبح بإمكان مؤسسة البحث التدريب على البيانات التي ألغاها الناشرون من التدريب، أليس كذلك؟”.

أجابت كولينز: “صحيح – للاستخدام في البحث”.

تُلخّص جوجل إجابات استعلامات البحث باستخدام الذكاء الاصطناعي في أعلى النتائج، مما قد يُؤدي إلى عزوف المستخدمين عن النقر على مواقع إلكترونية مستقلة للحصول على إجابات، وهو اتجاه يُضرّ بإيراداتهم، وفقًا لناشري المواقع الإلكترونية. وتستخدم جوجل بيانات من هذه المواقع نفسها لتوليد المعلومات التي تُمكّن من الحصول على إجابات الذكاء الاصطناعي.

استدعت جوجل كولينز للإدلاء بشهادته في محاكمة استمرت ثلاثة أسابيع في محكمة اتحادية بواشنطن، لتحديد كيفية استعادة جوجل للمنافسة في مجال البحث الإلكتروني.

في العام الماضي، حكم قاضي المحكمة الجزئية الأمريكية، أميت ميهتا، بأن عملاق التكنولوجيا احتكر سوق البحث بشكل غير قانوني، ويدرس الآن مجموعة من التغييرات التي اقترحتها جهات إنفاذ قوانين مكافحة الاحتكار لمعالجة سيطرته.

تحث وزارة العدل الأمريكية المحكمة على إجبار جوجل على بيع متصفح كروم واسع الانتشار ومشاركة البيانات الرئيسية التي تستخدمها لتوليد نتائج البحث.

كما تطلب الوكالة من القاضي ميهتا منع جوجل من دفع رسوم لتكون محرك البحث الافتراضي على التطبيقات والأجهزة الأخرى – وهو تقييد سيمتد ليشمل عروض الذكاء الاصطناعي الخاصة بها، بما في ذلك جيميني، التي تزعم الحكومة أنها استفادت من هيمنة الشركة غير القانونية في مجال البحث.

سأل أغيلار، محامي وزارة العدل الأمريكية، كولينز عما إذا كان يعرف مقدار البيانات الإضافية التي يمكن لمحرك بحث جوجل الوصول إليها، بخلاف المحتوى الذي درّبت عليه جوجل ديب مايند نماذج الذكاء الاصطناعي الخاصة بها. عندما أجاب كولينز بأنه لا يعرف، قدم أغيلار وثيقة من 26 أغسطس/آب 2024 بعنوان “Search GenAI <> Gemini v3”.

وفقًا لتلك الوثيقة، أزالت جوجل 80 مليارًا من أصل 160 مليار “رمز” – مقتطفات من المحتوى – بعد تصفية المواد التي اختار الناشرون عدم السماح لجوجل باستخدامها لتدريب ذكائها الاصطناعي.

كما أدرجت الوثيقة “بيانات جلسات البحث”، أو البيانات التي جُمعت خلال فترة زمنية تفاعل فيها المستخدم مع بحث جوجل، بالإضافة إلى مقاطع فيديو يوتيوب، كبيانات يمكن أن تُعزز نماذج الذكاء الاصطناعي في جوجل.

بعد الاطلاع على الوثيقة، طلب ميهتا من كولينز توضيحًا. “من أصل 160 مليار رمز، 50% منها تُحذف من قِبل الناشرين الذين يختارون عدم الاشتراك؟”

“هذا صحيح”، أجاب كولينز.

لاحقًا، سعى محامي جوجل لإثبات أن هيمنة شركة التكنولوجيا على البحث لم تمنع شركات الذكاء الاصطناعي الأخرى من التنافس بشراسة لتوفير نتائج دقيقة وآنية ضمن خدمات روبوتات الدردشة الخاصة بها.

على سبيل المثال، إذا طلب مستخدم من روبوت دردشة ذكي نتائج مباريات رياضية، شهد كولينز أن الروبوت سيُجيب على الأرجح بالإجابة الصحيحة لأن الشركة المُصنّعة للروبوت لديها اتفاقية تجارية مع مُزوّد ​​نتائج المباريات الرياضية – ولن يحتاج إلى الاعتماد على فهرس ويب.

لكن جوجل استكشفت كيفية تحسين نماذج الذكاء الاصطناعي الخاصة بها بشكل كبير باستخدام البيانات التي جمعتها بالفعل على مدار سنوات من تشغيل محرك البحث الأكثر شعبية في العالم، وفقًا لما أظهرته الشهادات.

في مرحلة أخرى من الاستجواب المتبادل لكولينز، عرض محامي وزارة العدل أغيلار على نائب رئيس جوجل وثيقة إحاطة موجهة إلى ديميس هاسابيس، الرئيس التنفيذي لشركة جوجل ديب مايند.

في تعليق له، فكّر هاسابيس في تدريب نموذج ذكاء اصطناعي مجهول من جوجل باستخدام ثروة من بيانات البحث – بما في ذلك تصنيفات البحث – لمعرفة مدى تحسن نموذج الذكاء الاصطناعي باستخدام البيانات، مقارنةً بنموذج لم يتم تدريبه عليها.

سأل أغيلار كولينز: “هل بنت جوجل نموذجًا باستخدام بيانات البحث؟”.

“ليس على حد علمي،” أجاب.

“لكن على الأقل، رأى السيد هاسابيس أنه سيكون من المثير للاهتمام النظر فيه؟” ألحّت عليه.

قال كولينز: “نعم” .