OpenAI تحول ChatGPT إلى وكيل ينجز المهام manshetat

OpenAI تحول ChatGPT إلى وكيل ينجز المهام manshetat في متابعة لأحدث التطورات، نعرض لكم تفاصيل هذا الخبر الهام الذي يشغل الرأي العام في الوقت الحالي. مع تطور الأحداث، نوافيكم بكل ما هو جديد في هذا السياق، ونقدم لكم نظرة شاملة عن أهم النقاط التي يجب أن تعرفها. تابع معنا التفاصيل الكاملة لهذا الخبر.
أطلقت شركة OpenAI ميزة جديدة تحت اسم ChatGPT Agent، تمثل نقلة نوعية في تطوير نماذج الذكاء الاصطناعي، إذ أصبح بإمكان ChatGPT التفكير والتصرف باستخدام جهازه الحاسوبي الافتراضي، لتنفيذ مهام كاملة نيابة عن المستخدم، بداية من التحليل والبحث، وصولاً إلى التفاعل مع مواقع الإنترنت وإنتاج نتائج قابلة للتعديل مثل عروض الشرائح، وجداول البيانات.
وبحسب بيان رسمي، أصبح بالإمكان توجيه أوامر متقدمة لـChatGPT، مثل: “راجع تقويمي وأعدّ لي ملخصاً لاجتماعات العملاء القادمة بناءً على آخر الأخبار”، أو “خطط واشترِ مكونات لتحضير وجبة إفطار يابانية لأربعة أشخاص”، أو حتى “حلل 3 منافسين واصنع عرض شرائح تقديمي”.
في كل تلك المهام، يستطيع النموذج استخدام أدوات متعددة كالمتصفح البصري للويب، والمتصفح النصي، وواجهة طرفية لكتابة الأكواد (Terminal)، والوصول المباشر إلى الواجهات البرمجية للتطبيقات (API)، كما يمكنه أن يطلب من المستخدم تسجيل الدخول بشكل آمن عند الحاجة ليتحكم بنفسه في إتمام المهام.
وتقوم المنظومة الجديدة على ما وصفته الشركة بـ”نظام وكيل موحد” يجمع بين ثلاث ركائز رئيسية وهي خدمة “Operator” المتخصصة في التفاعل مع المواقع الإلكترونية، وقوة “البحث العميق Deep Research” في تحليل وتلخيص المعلومات، وروبوت الدردشة الشهير ChatGPT.
من خلال الدمج بين الخدمات الثلاث، سيمكن للميزة الجديدة أن تنتقل بسلاسة بين مراحل التفكير والتنفيذ، لتنفيذ المهام التي يوكلها إليها المستخدم من البداية حتى النهاية، بناءً على تعليماته بدقة.
وتشدد OpenAI على أن المستخدم يظل دائماً متحكماً في سير العمل، إذ لا يتخذ ChatGPT أي قرار أو فعل ذا تبعات حقيقية دون إذن صريح من المستخدم، والذي يمكنه إيقاف العمل أو تولّي التحكم أو تغيير المهام في أي لحظة.
وتتوفر ميزة ChatGPT Agent الجديدة لمستخدمي خطط Pro وPlus وTeam، ويمكن تفعيلها من قائمة الأدوات في أي محادثة عبر خيار “وضع الوكيل” Agent Mode.
وتُشير الشركة إلى أن هذه الخطوة تمثل البداية فقط، إذ سيتم توسيع القدرات وتحسين الأداء بمرور الوقت.
دمجت الشركة مزايا “Operator”، و”البحث العميق” داخل النموذج الجديد، بعد أن تبيّن أن الكثير من استفسارات المستخدمين كان يمكن تلبيتها بكفاءة أعلى من خلال دمج الإمكانات، فميزة Operator كانت قادرة على التصفح والنقر والكتابة عبر الإنترنت، بينما “البحث العميق” قدّم تحليلات معمّقة وتقارير دقيقة، لكن كل منهما كان محدوداً في التعامل مع مهام الآخر.
من خلال هذه التكاملات، بات بإمكان ChatGPT الآن التفاعل مع المواقع الإلكترونية بذكاء، تصفّح المحتوى، وتطبيق عوامل تصفية، وتحقيق نتائج أدق وأكثر كفاءة، كما يمكن للمحادثة مع النموذج أن تبدأ بسؤال بسيط وتتحول بسلاسة إلى تنفيذ فعلي للمهام ضمن السياق نفسه.
وجرى تزويد ChatGPT Agent بمجموعة متكاملة من الأدوات، تشمل: متصفح بصري للتفاعل مع المواقع عبر واجهة رسومية، ومتصفح نصي للاستفسارات البسيطة، وواجهة طرفية لتنفيذ الأوامر البرمجية، إلى جانب وصول مباشر إلى واجهات التطبيقات مثل Gmail وGitHub، ويمكن للمستخدم أيضاً السماح للنموذج بتسجيل الدخول إلى المواقع، ما يوسّع من نطاق البحث والتنفيذ.
وتعمل هذه الأدوات جميعاً من خلال جهاز افتراضي يحافظ على سياق المهمة، حتى عند استخدام أدوات متعددة في آنٍ واحد. فعلى سبيل المثال، يمكن للنموذج فتح صفحة باستخدام المتصفح النصي، وتحميل ملف، وتعديل الملف، ثم عرض النتائج مجدداً في المتصفح البصري.
وفي الختام، تتابع مانشيتات عن كثب تطورات هذا الحدث وتوافيكم بكل جديد فور حدوثه. لا يزال الوضع في مرحلة التغيير، وسيتم تحديث المعلومات حالما تتوفر تفاصيل إضافية. تابعونا على مانشيتات لمزيد من الأخبار والتفاصيل الهامة.