-->
ابتيكنو ابتيكنو

تحديث جوجل 2021 : تخطط Google لتحسين عمليات البحث على الويب باستخدام الذكاء الاصطناعي متعدد الوسائط 2022

 تحديث جوجل 2021 : تخطط Google لتحسين عمليات البحث على الويب باستخدام الذكاء الاصطناعي متعدد الوسائط. خلال حدث تم بثه مباشرةً اليوم ، قامت Google بتفصيل الطرق التي تستخدم بها تقنيات الذكاء الاصطناعي - وتحديداً خوارزمية تعلم الآلة تسمى النموذج الموحد متعدد المهام (MUM) - لتحسين تجارب البحث على الويب عبر اللغات والأجهزة المختلفة.


تحديث جوجل 2021 : تخطط Google لتحسين عمليات البحث على الويب باستخدام الذكاء الاصطناعي متعدد الوسائط 2022


تحديث جوجل 2022/2021  


 بدءًا من أوائل العام المقبل ، ستكتسب Google Lens ، وهي تقنية التعرف على الصور الخاصة بالشركة ، القدرة على العثور على أشياء مثل الملابس بناءً على الصور والأوصاف عالية المستوى. في نفس الوقت تقريبًا ، سيبدأ مستخدمو بحث Google في رؤية قائمة منظمة AI بالأشياء التي يجب أن يعرفوها حول مواضيع معينة ، مثل مواد طلاء الأكريليك. سيرون أيضًا اقتراحات لتحسين عمليات البحث أو توسيعها استنادًا إلى الموضوع المعني ، بالإضافة إلى الموضوعات ذات الصلة في مقاطع الفيديو التي تم اكتشافها من خلال البحث.


الترقيات هي ثمرة جهد متعدد السنوات في Google لتحسين فهم "البحث" و "العدسة" لكيفية ارتباط اللغة بالعناصر المرئية من الويب. وفقًا لـ Google VP of Search Pandu Nayak ، يمكن لـ MUM ، الذي قدمته Google بالتفصيل في مؤتمر للمطورين في يونيو الماضي ، المساعدة بشكل أفضل في توصيل المستخدمين بالشركات من خلال إبراز المنتجات والمراجعات وتحسين "جميع أنواع" فهم اللغة ، سواء على مستوى خدمة العملاء أو في بيئة بحثية.


1 - تقنية MUM


"تكمن قوة MUM في قدرتها على فهم المعلومات على مستوى واسع. قال ناياك في مقابلة عبر الهاتف ، إنه متعدد الوسائط جوهريًا - أي يمكنه التعامل مع النصوص والصور ومقاطع الفيديو كلها في نفس الوقت. "إنه يحمل الوعد بأنه يمكننا طرح استعلامات معقدة للغاية وتقسيمها إلى مجموعة من المكونات الأبسط ، حيث يمكنك الحصول على نتائج لطلبات البحث المختلفة والأبسط ثم تجميعها معًا لفهم ما تريده حقًا."


تُجري Google الكثير من الاختبارات في البحث لضبط النتائج التي يراها المستخدمون في النهاية. في عام 2020 - وهو العام الذي أطلقت فيه الشركة أكثر من 3600 ميزة جديدة - أجرت أكثر من 17500 تجربة مرورية وأكثر من 383600 عملية تدقيق للجودة ، كما يقول ناياك.

ومع ذلك ، نظرًا للطبيعة المعقدة للغة ، تظهر المشكلات. على سبيل المثال ، أدى البحث عن "صالح وحيد للأطفال" منذ عدة سنوات - "وحيد" الذي يشير إلى السمكة ، في هذه الحالة - إلى ظهور صفحات ويب تقارن أحذية الأطفال.



في عام 2019 ، شرعت Google في معالجة مشكلة الغموض اللغوي باستخدام تقنية تسمى تمثيلات التشفير ثنائية الاتجاه من المحولات ، أو BERT. بناءً على بحث الشركة في بنية نموذج Transformer ، يفرض BERT النماذج على النظر في سياق الكلمة من خلال النظر إلى الكلمات التي تأتي قبلها وبعدها.


يعود تاريخ Transformer إلى عام 2017 ، وقد أصبح التصميم المعماري المفضل لمهام اللغة الطبيعية ، مما يدل على القدرة على تلخيص المستندات ، والترجمة بين اللغات ، وتحليل التسلسلات البيولوجية. وفقًا لـ Google ، ساعدت BERT Search Search في فهم 10٪ من طلبات البحث في الولايات المتحدة باللغة الإنجليزية بشكل أفضل - وخاصة عمليات البحث الأطول والمحادثة حيث تكون حروف الجر مثل "for" و "to" مهمة جدًا للمعنى.


على سبيل المثال ، لن تفهم خوارزمية البحث السابقة في Google أن عبارة "المسافر البرازيلي 2019 إلى الولايات المتحدة الأمريكية بحاجة إلى تأشيرة" تتعلق بسفر برازيلي إلى الولايات المتحدة وليس العكس. باستخدام BERT ، الذي يدرك أهمية كلمة "إلى" في السياق ، يوفر بحث Google نتائج أكثر صلة بطلب البحث.


قال ناياك: "بدأ بيرت في التعامل مع بعض الدقة والفوارق الدقيقة في اللغة ، الأمر الذي كان مثيرًا للغاية ، لأن اللغة مليئة بالفوارق الدقيقة والبراعة".


لكن BERT لها حدودها ، وهذا هو السبب في أن الباحثين في قسم الذكاء الاصطناعي في Google طوروا خليفة في MUM. MUM أكبر بحوالي 1000 مرة من BERT ويتم تدريبها على مجموعة بيانات من المستندات من الويب ، مع تصفية محتوى مثل الصور والنصوص الصريحة والبغيضة والمسيئة والمضللة. إنه قادر على الإجابة على الاستفسارات بـ 75 لغة بما في ذلك أسئلة مثل "أريد أن أتنزه سيرًا على الأقدام إلى جبل فوجي في الخريف المقبل - ما الذي يجب أن أفعله للاستعداد؟" وإدراك أن هذا "الاستعداد" يمكن أن يشمل أشياء مثل تدريب اللياقة البدنية وكذلك الطقس.


يمكن لـ MUM أيضًا الاعتماد على السياق والمزيد في المنعطفات في الصور والحوار. إعطاء صورة لأحذية التنزه والسؤال "هل يمكنني استخدام هذا لرفع جبل فوجي؟" يمكن لـ MUM فهم محتوى الصورة والهدف من وراء الاستعلام ، مما يتيح للسائل معرفة أن أحذية المشي لمسافات طويلة ستكون مناسبة وتوجيههم نحو درس في مدونة Mount Fuji.


ساعدت MUM ، التي يمكنها نقل المعرفة بين اللغات ولا تحتاج إلى تعليم صريح حول كيفية إكمال مهام محددة ، مهندسي Google على تحديد أكثر من 800 اسم مختلف لـ COVID-19 بأكثر من 50 لغة. مع أمثلة قليلة فقط لأسماء اللقاحات الرسمية ، تمكنت MUM من العثور على اختلافات بين اللغات في ثوانٍ مقارنة بالأسابيع التي قد يستغرقها فريق بشري.


وأوضح ناياك أن "MUM تمنحك التعميم من اللغات التي تحتوي على الكثير من البيانات إلى لغات مثل الهندية وما إلى ذلك ، مع القليل من البيانات في المجموعة".


2 - بحث متعدد الوسائط


بعد البرامج التجريبية الداخلية في عام 2020 لمعرفة أنواع الاستعلامات التي قد تتمكن MUM من حلها ، صرحت Google بأنها توسع MUM إلى زوايا أخرى من البحث.


قريبًا ، ستسمح MUM للمستخدمين بالتقاط صورة لكائن باستخدام Lens - على سبيل المثال ، قميص - والبحث في الويب عن كائن آخر - على سبيل المثال ، الجوارب - بنمط مماثل. ستعمل MUM أيضًا على تمكين Lens لتحديد كائن غير مألوف للباحث ، مثل العجلة المسننة الخلفية للدراجة ، وإرجاع نتائج البحث وفقًا لطلب البحث. على سبيل المثال ، بالنظر إلى صورة العجلة المسننة والاستعلام ، "كيف يمكنني إصلاح هذا الشيء" ، ستعرض MUM إرشادات حول كيفية إصلاح العجلة المسننة بالدراجة.


قال ناياك: "يمكن أن تفهم MUM أن ما تبحث عنه هو تقنيات للإصلاح وما هي هذه الآلية". "هذا هو نوع الشيء الذي تعد به العدسة متعددة النماذج ، ونتوقع إطلاق هذا في وقت ما في وقت مبكر من العام المقبل."


بالإضافة إلى ذلك ، كشفت Google عن "وضع العدسة" لنظام iOS للمستخدمين في الولايات المتحدة ، والذي يضيف زرًا جديدًا في تطبيق Google لجعل جميع الصور على صفحة ويب قابلة للبحث من خلال Lens. الجديد أيضًا هو Lens في Chrome ، والمتوفر في الأشهر المقبلة عالميًا ، والذي سيتيح للمستخدمين تحديد الصور ومقاطع الفيديو والنص على موقع ويب باستخدام Lens لمشاهدة نتائج البحث في علامة التبويب نفسها دون مغادرة الصفحة التي يتواجدون فيها.


في البحث ، ستعمل MUM على تشغيل ثلاث ميزات جديدة: أشياء يجب معرفتها ، وتحسينها وتوسيعها ، وموضوعات ذات صلة في مقاطع الفيديو. تأخذ "الأشياء التي يجب معرفتها" استعلامًا واسعًا ، مثل "لوحات أكريليك" ، وتسلط الضوء على موارد الويب مثل الإرشادات خطوة بخطوة وأنماط الرسم. يؤدي خيار Refine & Broaden إلى العثور على موضوعات أضيق أو عامة تتعلق بطلب بحث ، مثل "أنماط الرسم" أو "الرسامين المشهورين". أما بالنسبة إلى "الموضوعات ذات الصلة في مقاطع الفيديو" ، فيختار الموضوعات في مقاطع الفيديو ، مثل "مواد الرسم بالأكريليك" و "تقنيات الأكريليك" ، بناءً على المحتوى الصوتي والنص والمرئي لمقاطع الفيديو هذه.


قال ناياك: "لدى MUM سلسلة كاملة من التطبيقات المحددة ، وقد بدأوا في التأثير على العديد من منتجاتنا".


3 - التحيزات المحتملة


تظهر مجموعة متزايدة من الأبحاث أن النماذج متعددة الوسائط معرضة لنفس أنواع التحيزات مثل نماذج اللغة والرؤية الحاسوبية. غالبًا ما يمنع تنوع الأسئلة والمفاهيم المتضمنة في مهام مثل الإجابة عن الأسئلة المرئية - بالإضافة إلى نقص البيانات عالية الجودة - النماذج من التعلم إلى "العقل" ، مما يؤدي بهم إلى إجراء تخمينات مستنيرة من خلال الاعتماد على إحصائيات مجموعة البيانات. على سبيل المثال ، في إحدى الدراسات التي تضمنت 7 نماذج متعددة الوسائط و 3 تقنيات لتقليل التحيز ، وجد المؤلفون المشاركون أن النماذج فشلت في معالجة الأسئلة التي تتضمن مفاهيم غير متكررة ، مما يشير إلى وجود عمل يتعين القيام به في هذا المجال.


"النماذج [متعددة الوسائط] ، التي يتم تدريبها على نطاق واسع ، تؤدي إلى قدرات ناشئة ، مما يجعل من الصعب فهم ماهية تحيزاتها وأنماط فشلها. ومع ذلك ، فإن الحوافز التجارية هي لنشر هذه التكنولوجيا في المجتمع ككل ، "قال بيرسي ليانغ ، عضو هيئة التدريس بجامعة ستانفورد وأستاذ علوم الكمبيوتر.


لا شك في أنه يتطلع إلى تجنب إنشاء سلسلة من الدعاية السلبية ، ويزعم Google أنه قد بذل الكثير من الجهد للتخفيف من التحيزات في MUM - بشكل أساسي من خلال تدريب النموذج على بيانات "عالية الجودة" وحث البشر على تقييم نتائج بحث MUM. قال ناياك: "نستخدم [عملية] تقييم للبحث عن مشاكل التحيز في أي مجموعة من التطبيقات التي نطلقها". "عندما نطلق أشياء يحتمل أن تكون محفوفة بالمخاطر ، فإننا نقطع شوطا إضافيا لنكون أكثر حذرا."


التعليقات



إذا أعجبك محتوى مدونتنا نتمنى البقاء على تواصل دائم ، فقط قم بإدخال بريدك الإلكتروني للإشتراك في بريد المدونة السريع ليصلك جديد المدونة أولاً بأول ، كما يمكنك إرسال رساله بالضغط على الزر المجاور ...

إتصل بنا

جميع الحقوق محفوظة

ابتيكنو

2020