تطلق X خوارزمية توصيات جديدة، تُعطي الأولوية لسلوكيات المستخدم على الإعجابات

المؤلف الأصلي: ديفيد، تيدشون تكفلو

في بعد ظهر 20 يناير، أصدرت X خوارزمية التوصية الجديدة كمشروع مفتوح المصدر.

الرد الذي قدمه ماسك كان مثيرًا للاهتمام: "نحن نعلم أن الخوارزمية غبية وتحتاج إلى تعديلات كبيرة، ولكن على الأقل يمكنك أن ترى أننا نصارع لتحسينها في الوقت الفعلي. لا تجرؤ منصات التواصل الاجتماعي الأخرى على فعل ذلك."

هذا القول له معنيان.أولًا، الاعتراف بأن الخوارزمية بها مشكلة، وثانيًا، استخدام "الشفافية" كمزايدة.

هذا هو خوارزمية X المفتوحة المصدر للمرة الثانية. لم تتم تحديث إصدار الكود من عام 2023 لمدة 3 سنوات، وتم فصله بالفعل عن النظام الفعلي. في هذه المرة تم إعادة كتابته بالكامل، وتم تغيير النموذج الأساسي من التعلم الآلي التقليدي إلى Grok transformer، وبحسب ما ذكرته المصادر الرسمية فإن هذا "يُزيل تمامًا هندسة السمات اليدوية".

في الماضي، كان يتعين على المُهندسين ضبط معلمات الخوارزمية يدويًا، أما الآن، فيُستخدم الذكاء الاصطناعي مباشرةً لتحليل سجل تفاعلاتك لتحديد ما إذا كان سيتم توصيل محتواك أم لا.

يعني ذلك للمبدعين المحتوى أن علم التنجيم القديم مثل "في أي وقت يجب نشر المنشورات" و"ما العلامات التي تساعد على زيادة عدد المتابعين" قد يفقد فعاليته.

كما تصفحنا المستودعات المفتوحة المصدر على Github، ووجدنا بمساعدة الذكاء الاصطناعي أن هناك بالفعل بعض المنطق الثابت المخفي في الكود يستحق التفتيش.

تغيير منطق الخوارزمية: من التحديد اليدوي إلى اتخاذ القرارات تلقائيًا بواسطة الذكاء الاصطناعي

ابدأ بوضوح بذكر الفرق بين الإصدار الجديد والقديم، وإلا ستكون المناقشة لاحقًا مربكة.

في عام 2023، كانت النسخة التي نشرتها تويتر بشكل مفتوح المصدر تُسمى Heavy Ranker، وفي جوهرها كانت تعلم آلي تقليدي. كان على المهندسين تعريف مئات "السمات" يدويًا: هل التغريدة تحتوي على صورة، كم عدد متابعي الناشر، كم عمر التغريدة من الآن، هل تحتوي التغريدة على رابط...إلخ.

ثم تعطي كل ميزة وزنًا، وتقوم بإجراء التعديلات المختلفة لمعرفة أي تجميع يكون أكثر فاعلية.

النسخة المفتوحة المصدر هذه المرة تُسمى Phoenix، وهي ذات بنية مختلفة تمامًا، ويمكنك فهمها كخوارزمية تعتمد بشكل أكبر على النماذج الكبيرة لذكاء الآلة، والتركيز فيها هو استخدام نموذج transformer الخاص بـ Grok، وهو من نفس فئة التكنولوجيا المستخدمة في ChatGPT وClaude.

يتم ذكر ذلك بشكل مباشر في وثيقة README الرسمية: "لقد أزلنا كل ميزة تم إنشاؤها يدويًا."

تم تجريد جميع قواعد استخراج سمات المحتوى اليدوية التقليدية، واحدة تلو الأخرى.

الآن، ما الذي يعتمد عليه هذا الخوارزم في تحديد جودة المحتوى؟

الإجابة تعتمد عليك أنتتسلسل الأفعالأي شيء قمت بوضع إعجاب له في الماضي، من قمت بالرد عليه، أي المواضيع التي قمت بالبقاء عليها أكثر من دقيقتين، أي الأنواع التي قمت بحظر حساباتها. تُدخل Phoenix هذه السلوكيات إلى نموذج transformer، وتسمح للنموذج بتعلم الأنماط وتحليلها بشكل مستقل.

على سبيل المثال: يشبه الخوارزمية القديمة جدول تقييم يُكتب يدويًا، حيث يُحسب كل عنصر بمجرد وضع علامة اختيار له نقاطًا؛

الخوارزمية الجديدة تشبه ذكاء اصطناعي تابع لكل سجل تصفحك،اعمل تخمينًا مباشرًاماذا تريد أن تراه في الثانية التالية.

يعني ذلك شيئين للمبدعين:

أولاً، تقلّصت قيمة المراجع لبعض الحيل السابقة مثل "أفضل أوقات النشر" و"الوسوم الذهبية" وغيرها.بما أن النموذج لم يعد ينظر إلى هذه الميزات الثابتة، فإنه ينظر إلى تفضيلات كل مستخدم الشخصية.

الثاني، هل يمكن نشر محتواك أم لا يعتمد بشكل متزايد على "رد فعل الأشخاص الذين يرون محتواك".تم تحديد هذا التفاعل كـ 15 تنبؤًا بالسلوك، وسنناقشها بالتفصيل في الفصل التالي.

خوارزمية تتنبأ بـ 15 رد فعل لك

بعد أن تحصل فينكس على منشور يُنتظر التوصية به، ستتنبأ بـ 15 سلوكًا محتملًا قد يقوم بها المستخدم الحالي عند رؤيته لهذا المحتوى:

السلوك الإيجابيمثل الإعجاب، الرد، إعادة النشر، إعادة النشر بالاقتباس، النقر على المنشور، النقر على الصفحة الرئيسية للمُنشئ، مشاهدة أكثر من نصف الفيديو، فتح الصور، المشاركة، البقاء لفترة زمنية معينة، متابعة المُنشئ
السلوكيات السلبيةمثل النقر على "ليس مهتمًا"، وحظر الكاتب، و silencing الكاتب، والتبليغ

كل سلوك يتوافق مع احتمال تنبؤ. على سبيل المثال، يحدد النموذج أن لديك احتمال 60% لإعجابك بهذا المنشور، واحتمال 5% لحظر هذا الكاتب، وهكذا.

ثم تقوم الخوارزمية بعملية بسيطة: تضرب هذه الاحتمالات في أوزانها المقابلة، وتجمع النتائج، فتنتج درجةً إجماليةً واحدةً.

يبدو الشكل هكذا:

النتيجة النهائية = Σ (الوزن × P(الإجراء))

تُعطى الأوزان الموجبة للسلوكيات الإيجابية، وتُعطى الأوزان السلبية للسلوكيات السلبية.

المنشورات ذات التقييم الأعلى تظهر في الأعلى، والمنخفضة تهبط إلى الأسفل.

ببساطة، الخروج من الصيغة يُعنى بـ:

الآن، جودة محتوى ما لا تُحدد فعليًا بناءً على جودة المحتوى نفسه (بالطبع الشروط الأساسية للانتشار هي القرابلية و公益性)؛ بل تُحدد بشكل أكبر بناءً على "الرد الذي سيحفزك هذا المحتوى على إظهاره". لا يهتم الخوارزم بجودة المنشور نفسه، بل يهتم فقط بسلوكياتك أنت.

باستخدام هذا المنطق، في الظروف القصوى، قد تحصل مشاركة بسيطة ولكنها تثير الردود والاستفزاز على درجة أعلى من مشاركة عالية الجودة ولكن لا تتفاعل معها أيدي الآخرين. قد تكون هذه هي منطقية النظام الأساسي.

ومع ذلك، لم تُعلن النسخة الجديدة المفتوحة المصدر عن قيم محددة للوزن السلوكية، لكنها كانت معلنة في نسخة عام 2023.

المراجعات القديمة: تقرير واحد = 738 إعجابًا

يمكننا الآن تحليل مجموعة البيانات من عام 2023، وهي قديمة بالفعل، لكنها ستساعدك على فهم الفرق في "القيمة" التي يراها الخوارزم في سلوك مختلف.

في 5 أبريل 2023، نشرت X بالفعل مجموعة من بيانات الأوزان على GitHub بشكل علني.

الرقم مباشرةً:

ترجمة أكثر مباشرة:

مصدر البيانات: الإصدار القديم مستودع GitHub twitter/the-algorithm-ml، اضغط للحصول على الخوارزمية الأصلية

بعض الأرقام تستحق الانتباه.

أولًا، إعجابات "الإعجاب" تكاد تكون بلا قيمة. وزنها 0.5 فقط، وهو أقل قيمة من بين جميع السلوكيات الإيجابية. من منظور الخوارزمية، فإن قيمة الإعجاب تقريبًا تساوي الصفر.

ثانيًا، التفاعل في المحادثة هو ما يُعدّ نقدًا قويًّا. وزن "ردك ثم رد الكاتب عليك" هو 75، أي 150 مرة أكثر من إعجاب. ما يريده الخوارزمية رؤيته أكثر هو المحادثة المتبادلة وليس الإعجاب الأحادي.

الثالث، تكاليف الملاحظات السلبية مرتفعة للغاية. يتطلب تعويض تقييد حسابك أو تجاهله (-74) 148 إعجابًا. ويحتاج التبليغ (-369) إلى 738 إعجابًا. كما أن هذه النقاط السلبية تراكمية في نقاط سمعة حسابك، مما يؤثر على توزيع جميع المشاركات المستقبلية.

الرابع، إن وزن نسبة مشاهدة الفيديو بالكامل منخفض بشكل مبالغ فيه. إنها 0.005 فقط، ويمكن تجاهلها تقريبًا. وهذا يتناقض بشكل حاد مع تيك توك وTikTok، حيث يُعتبر معدل مشاهدة الفيديوهات بالكامل مؤشرًا أساسيًا على هذين المنصتين.

كما ورد في الوثيقة الرسمية نفسها: "يمكن تعديل الأوزان الدقيقة في الملف في أي وقت... ومنذ ذلك الحين، قمنا بتعديل الأوزان بشكل دوري لتحسين مؤشرات الأداء على منصتنا."

يمكن تعديل الأوزان في أي وقت، وقد تم تعديلها بالفعل.

النسخة الجديدة لم تُعلن القيم المحددة، ولكن الإطار المنطقي المذكور في ملف README هو نفسه: إضافة نقاط إيجابية، خصم نقاط سلبية، وحساب المجموع المرجح.

قد تتغير الأرقام المحددة، لكن علاقات المدى لا تزال على الأرجح كما هي. أن ترد على تعليق شخص ما أكثر فائدة من حصولك على 100 إعجاب. أن يجعلك أحدهم ترغب بحذفه من قائمة المتابعة أسوأ من أن لا يتفاعل أحد معك.

بعد معرفتنا بجميع هذه الأمور، ما الذي يمكننا القيام به كمبدعين؟

بعد فحص الشيفرات الجديدة والقديمة الخاصة بخوارزميات تويتر، يمكن استخلاص بعض الاستنتاجات العملية التالية:

1. الرد على معلقك. إن "رد الكاتب على معلق" هو العنصر الأعلى تقييماً في جدول الأوزان (+75)، وهو أعلى بمئة وخمسين مرة من إعجاب المستخدم أحادي الجانب. لم يُطلب منك طلب التعليقات، بل إذا قام أحدهم بالتعليق، فاردّ عليه. حتى لو أجبت بعبارة "شكرًا"، فسيُسجل ذلك في الخوارزمية.

2. لا تسمح للآخرين بالانسحاب. يحتاج تعويض تأثير سلبي لمرة واحدة من الحظر إلى 148 إعجاب. إن المحتوى الجدلية بالفعل يثير التفاعل بسهولة، ولكن إذا كان شكل التفاعل هو "هذا الشخص مزعج حقًا، يجب حظره"، فسيتضرر مؤشر مصداقية حسابك باستمرار، مما يؤثر على توزيع جميع المشاركات اللاحقة. إن الجدلية تُعد سيفًا ذا حدين، فكّ السيف أولًا من نفسك قبل أن تقطع الآخرين.

3. روابط المواقع الخارجية توضع في قسم التعليقات.الخوارزمية لا تريد إخراج المستخدمين إلى خارج الموقع. سيتم تقليل ترتيب المحتوى الذي يحتوي على روابط.، وهذا ما صرح به موسك بنفسه. إذا كنت ترغب في التوجيه، فاكتب المحتوى في النص الرئيسي، وضَع الرابط في التعليق الأول.

4. لا تملأ الشاشة. تحتوي النسخة الجديدة من الشفرة على "Author Diversity Scorer"، وهو يُقلل من وزن المشاركات التي تظهر بشكل متتالٍ من نفس الكاتب. الغرض منه هو جعل تغذية المستخدم أكثر تنوعًا، والنتيجة الجانبية هي أن نشر عشرة مشاركات متتالية لا يُنتج نفس التأثير مثل نشر مشاركة واحدة مميزة.

6. لم يعد هناك "أفضل وقت لوضع تدوينة". كانت الخوارزمية القديمة تحتوي على ميزة اصطناعية تُسمى "وقت النشر"، لكنها أُزيلت فجأة في الإصدار الجديد. Phoenix يركز فقط على سلوك المستخدم، ولا يهتم بوقت نشر المنشور. أصبحت النصائح التي تقول إن "أفضل وقت لنشر المنشور هو الساعة الثالثة بعد الظهر يوم الثلاثاء" أقل قيمة تدريجيًا.

ما سبق هو ما يمكن قراءته من مستوى الشفرة.

بالإضافة إلى ذلك، هناك بعض العوامل الإضافية والخصومات التي تأتي من الوثائق العامة لـ X، ولا توجد في المستودع المفتوح المصدر في هذه المرة: على سبيل المثال، يُمنح محتوى معتمد بعلامة زرقاء إضافات معينة، بينما يُخفض تأثير الكلمات المكتوبة بالحروف الكبيرة فقط، كما أن المحتوى الحساس يؤدي إلى تقليل معدل الوصول بنسبة 80%. نظرًا لعدم كشف هذه القواعد بشكل مفتوح المصدر، فلن نتوسع في تفاصيلها.

بشكل عام، فإن ما تم فتح مصدره هذه المرة كان عمليًا جدًا.

الهيكل الكامل للنظام، والمنطق المستخدم في استدعاء المحتوى المرشح، وخطوات الترتيب والتقييم، وتنفيذ مختلف المرشّحات. تتكوّن الأكواد بشكل أساسي من لغتي Rust و Python، وهي مُنظمة بشكل جيد، ويُعد ملف README مُفصلاً أكثر من مشاريع تجارية كثيرة.

لكن بعض العناصر المهمة لم تُعرض.

1. لم تُعلن معلمات الأوزان. يُذكر في الكود فقط "زيادة النقاط للسلوكيات الإيجابية وخصم النقاط للسلوكيات السلبية"، لكن لم يُذكر عدد نقاط الإعجاب المكتسبة أو عدد نقاط الحظر المخصومة. في الإصدار الخاص بعام 2023 على الأقل تم الإعلان عن الأرقام، بينما في هذه المرة تم إعطاء إطار صيغة فقط.

2. لم تُعلن أوزان النموذج. Phoenix يستخدم Grok transformer، ولكن لم يتم نشر معلمات النموذج نفسه. يمكنك رؤية الطريقة التي يتم بها استدعاء النموذج، ولكنك لا ترى الطريقة التي يتم بها حسابه داخليًا.

3. لم تُنشر بيانات التدريب. لم يتم ذكر أي شيء عن البيانات التي تم تدريب النموذج عليها، وكيفية أخذ عينات من سلوك المستخدمين، أو كيفية بناء العينات الإيجابية والسالبة.

على سبيل المثال، يشبه هذا الانفتاح المفتوح المصدر إخبارك بـ "نحن نستخدم المتوسط المرجح لحساب الدرجة الإجمالية"، ولكن دون إخبارك بأوزان المرجحات؛ وإخبارك بـ "نحن نستخدم نموذج transformer لتنبؤ احتمالات السلوك"، ولكن دون إخبارك بمظهر ما داخل نموذج transformer.

من الناحية المقارنة، لم تُعلن تيك توك وانستجرام حتى عن هذه الأمور. بالفعل، كمية المعلومات التي كشفتها إكس هذه المرة أكبر من تلك المتاحة على المنصات الرئيسية الأخرى. لكنها ما زالت بعيدة عن "الشفافية الكاملة".

هذا لا يعني أن مفتوح المصدر ليس له قيمة. بالنسبة للمؤلفين والباحثين، من الأفضل دائمًا أن يروا الكود بدلًا من عدم رؤيته.