Ibinuka ni X ang Bagong Algorithm ng Rekomendasyon, Pinapahalagahan ang mga Kilos ng User kaysa sa Mga Like

Nagawa: David, Deep Tide TechFlow

Noong hapon ng Pebrero 20, inilabas ng X ang bagong bersyon ng kanilang rekomendasyon na algoritmo.

Ang kahanga-hangang reply ni Musk: "Alam namin na ang algorithm ay mali, at kailangan pa itong malaki, ngunit makikita mo ang aming pag-akyat sa pagpapabuti nito. Hindi nagawa ng iba pang mga social platform ito."

larawan

May dalawang kahulugan ito.Una ay pagkilala na mayroong isyu sa algoritmo at pangalawa, paggamit ng "transparency" bilang isang pangunahing katangian.

Ito ang pangalawang beses na inilabas ng X ang kanilang algorithm. Ang bersyon ng code noong 2023 ay hindi na-update ng tatlong taon at nawala na ito sa aktwal na system. Ito ay ganap na nire-rewrite, at ang pangunahing modelo ay nagmula sa tradisyonal na machine learning papunta sa Grok transformer, at ayon sa opisyales, ito ay "ganap na inalis ang manual na feature engineering."

Ang dating mga algorithm ay nakasalalay sa mga engineer para i-adjust ang mga parameter nang manu-mano, ngayon ay pinapayagan ng AI na tingnan ang iyong interactive history upang pumili kung ipapakita o hindi ang iyong nilalaman.

Ito ay nangangahulugan para sa mga tagapag-imbento ng nilalaman na ang dating "mga panloob na katanungan" kung "Ano ang pinakamahusay na oras upang mag-post" at "Anong mga tag ang dapat i-attach para makakuha ng higit pang mga tagasunod" ay maaaring hindi na epektibo.

Nagpanginanoon kami sa open source na repository sa Github at nakita namin ang ilang mga hard-coded na logic sa code na mayroon talagang puno ng mga aral.

Pinalit na logic: mula sa manwal hanggang sa awtomatikong pagpapasya ng AI

Pwede mong unaan ang pagkakaiba ng mga bersyon upang hindi magulo ang mga sumusunod na talakayan.

Noong 2023, ang bersyon ng Twitter na open source ay tinatawag na Heavy Ranker, at ang tunay nitong anyo ay tradisyonal na machine learning. Kailangan ng mga engineer na mag-define ng daan-daang "mga katangian" nang manu-mano: mayroon bang imahe sa post, ilang mga tagasunod ang nagsusumite, gaano kalayo ang oras ng pag-post mula sa kasalukuyan, mayroon bang link sa post...

Pagkatapos ay i-assign ng bawat katangian ng isang timbang, at subukan ang iba't ibang kombinasyon upang tingnan kung alin ang pinakamahusay.

Ang pangalawang bersyon na ito ay tinatawag na Phoenix, mayroon itong ganap na iba't-ibang arkitektura, maaari mong isipin ito bilang isang mas nakasalalay sa AI na algoritmo ng malalaking modelo, ang pangunahing bahagi ay gumagamit ng transformer model ng Grok, at ito ay gumagamit ng parehong teknolohiya na ginagamit ng ChatGPT at Claude.

Nasulat ito ng direkta sa opisyal na README: "Nakasalansan na namin ang bawat isang kamay na in-engineered na tampok."

Nagawa na ang lahat ng mga dating patakaran na nakasalalay sa kamay upang makuha ang mga katangian ng nilalaman.

Ngayon, ano ang batayan ng algorithm para masabi kung ano ang magandang nilalaman?

Ang sagot ay depende sa iyo.Sunduan ng GalawAng mga bagay na binigyan mo ng like noon, kanino ka sumagot, anong mga post ang binasa mo nang higit sa dalawang minuto, at anong uri ng account ang sinilip mo. Ang Phoenix ay nagpapadala ng lahat ng mga gawaing ito sa transformer, at pinapayagan ang modelo na mag-aral ng mga patakaran at magawa ang kanyang sariling konklusyon.

larawan

Halimbawa: Ang lumang algoritmo ay parang isang listahan ng puntos na ginawa ng isang tao, kung saan bawat bagay ay may tsek at may puntos;

Ang bagong algorithm ay tulad ng isang AI na nakakapanood ng lahat ng iyong mga karanasan sa pag-surf sa web,Hulaan mo na langAno ang susunod mong nais tingnan.

Ito ay nangangahulugan ng dalawang bagay para sa mga nagsisimula:

Una, ang mga dating tip tulad ng "pinakamahusay na oras upang magpost" at "gintong mga hashtag" ay may mas mababang halaga ng reperensya na ngayon.Ang model ay hindi na umaasa sa mga partikular na tampok na ito, kundi sa mga personal na paborito ng bawat user.

Ikaduha, ang posibilidad na mailabas ang iyong nilalaman ay lalong nakasalalay sa "paano maririnig ng mga tao ang iyong nilalaman".Ito ay binilang sa 15 mga pangyayari at inilalarawan sa susunod na kabanata.

Nagpapakita ang algoritmo ng 15 reaksyon na maaari mong gawin

Sangkapan ni Phoenix ang isang post na dapat irekomenda, inaasahan niya ang 15 posibleng kilos na gagawin ng kasalukuyang user sa panoorin ang nilalaman:

Positibong pag-uugaliHalimbawa: pahalagahan, sumagot, i-forward, i-forward na may quotation, i-click ang post, i-click ang profile ng may-akda, tingnan ang kalahati o higit pa ng isang video, i-unfold ang imahe, ibahagi, manatili nang mahigit sa isang tiyak na oras, sundan ang may-akda
Mga negatibong ugaliHalimbawa: Pindutin ang "Hindi ako interesado", Blokehin ang may-akda, I-silence ang may-akda, Iulat

Ang bawat kilos ay may kaakmaang probabilidad ng pagpapasiya. Halimbawa, ang modelo ay nagsusukol na may 60% na posibilidad kang mag-like sa post na ito, 5% na posibilidad kang mag-block sa may-akda, atbp.

Pagkatapos nyan, ginagawa ng algorithm ang isang simpleng bagay: pinaparami nito ang mga probabilidad sa kanilang mga timbang, inaayos, at binubuo upang makakuha ng isang kabuuang puntos.

larawan

Ang formula ay ganito:

Huling puntos = Σ ( timbang × P(gawa) )

Ang mga positibong kilos ay may positibong timbang, at ang mga negatibong kilos ay may negatibong timbang.

Ang mga post na may mataas na total score ay nasa itaas, habang ang mga may mababang score ay bumabagsak pababa.

Sa labas ng formula, nangangahulugan ito ng:

Ngayon, ang isang nilalaman ay maganda o hindi, talagang hindi na ito depende kung gaano kaganda ang nilalaman mismo (anggaman ang antas ng pagbasa at ang pagiging mapagkikinabangan ay ang pundasyon ng pag-iipon); kundi higit na depende ito sa "Ano ang gagawin mong reaksyon dahil sa nilalaman na ito". Hindi naisip ng algorismong kahusayan ng post mismo, kundi ang iyong mga kilos lamang ang kanyang pinagmumulan.

Sa ganitong paraan ng pag-iisip, sa isang ekstremo, isang post na walang hiya ngunit nagawa mong hindi maiwasang sumagot o mag-comment ay maaaring makakuha ng mas mataas na puntos kaysa sa isang post na may kalidad ngunit walang interaksyon. Maaaring ganito ang ugat ng lohika ng system na ito.

Ang mga algorithm ng bagong open source version ay hindi pa inilabas ang mga eksaktong halaga ng behavior weight, subalit inilabas na ito noong 2023.

Mga Lumang Sanggunian: Isang Ulat = 738 mga Paborito

Susunod, maaari naming tingnan ang data noong 23 taon na ang nakalipas, bagaman ito ay lumang data, ngunit makakatulong ito sa iyo na maintindihan kung gaano kakaiba ang "halaga" ng iba't ibang mga kilos sa tingin ng algoritmo.

Noong Abril 5, 2023, talagang inilabas ng X ang isang hanay ng mga timbang sa GitHub.

Diretso sa mga numero:

larawan

Ito ay isang literal na salin:

Pinagmulan ng Data: Lumang bersyon Ang GitHub twitter/the-algorithm-ml repository, I-click upang tingnan ang orihinal na algorithm

May ilang mga numero na nagpapakita ng isang malaking bagay.

Una, ang mga puso ay halos walang halaga. Ang timbang lamang ay 0.5, ang pinakamababa sa lahat ng positibong pagkilos. Sa mata ng algoritmo, ang halaga ng isang puso ay halos zero.

Ikalo-2, ang pakikipag-ugnayan at pakikipag-usap ang tunay na mahalagang bagay. Ang porsyento ng "Sagot mo, sumagot naman ang may-akda" ay 75, na 150 beses na higit sa pagtutugon. Ang pinaka-nais ng algorithm ay hindi ang isang direksyon ng pagtutugon, kundi ang usapan na palitan.

Ikatlo, ang mga negatibong feedback ay may mataas na gastos. Ang isang Block o Mute (-74) ay kailangan ng 148 na mga puso upang mapawi. Ang isang Ulat (-369) ay kailangan ng 738 na mga puso. At ang mga negatibong puntos na ito ay kumukuha sa iyong account na kredibilidad, na nakakaapekto sa lahat ng iyong mga post.

Fourth, ang abiso ng video ay sobrang mababa. Ang 0.005 lang, halos hindi na dapat isaalang-alang. Ito ay bumubuo ng malinaw na kontraste sa Douyin at TikTok, kung saan ang rate ng kumpletong panonood ay ang pangunahing sukatan.

Nagsulat ang opisyales sa parehong dokumento: "Maaaring i-adjust ang eksaktong mga timbang sa file kahit anumang oras... Mula noon, paulit-ulit nating i-adjust ang mga ito upang mapabuti ang mga sukatan ng platform."

Madali silang i-adjust sa anumang oras at talagang ginawa na.

Ang bagong bersyon ay hindi inilabas ang eksaktong mga halaga, ngunit ang logical framework na nakasulat sa README ay pareho: positibong pagdaragdag ng puntos, negatibong pagbawas ng puntos, at weighted sum.

Maaaring nagbago ang mga eksaktong numero, ngunit ang ugnayan ng dami ay tila pa rin umiiral. Ang pagtugon sa mga komento ng iba ay mas kapaki-pakinabang kaysa sa pagkuha ng 100 na puso. Ang paggawa ng isang tao na nais mong i-block ka ay mas masama kaysa sa walang pakikipag-ugnayan.

Anuman man-alam na ini, ano ang ating mahahawa bilang mga nagsisimula?

I-examine ang code ng bagong at lumang algoritmo ng Twitter, at kumuha ng ilang mga konklusyon na maaaring gawin.

1. Sumagot sa iyong mga nagsasalita. Sa pagsusuri ng mga puntos, ang "mga tugon ng may-akda sa mga komento" ay may pinakamataas na puntos (+75), na 150 beses mas mataas kaysa sa isang simpleng pindot ng "like" ng isang user. Hindi ito nangangahulugan na kailangan mong humingi ng mga komento, kundi kapag may komento na, kailangan mong tumugon. Kahit isang simpleng "salamat", tataas ang iyong puntos sa algorithm.

2. Huwag mong pahintulutan ang mga tao na mag-isip ng paglisan. Ang isang negatibong epekto ng pag-block ay kailangang labanan ng 148 na mga pabor. Ang mga kumikitang nilalaman ay talagang madaling magawa ng interaksyon, ngunit kung ang paraan ng interaksyon ay "Napapagod ako nito tao, block", ang iyong account na kredibilidad puntos ay patuloy na masisira, na nakakaapekto sa lahat ng iyong mga post na paghahatid. Ang kontrobersyal na trapiko ay isang doble-hugis na espada, bago mo saktan ang iba, saktan muna ang iyon.

3. Ilagay ang mga panlabas na link sa seksyon ng mga komento.Nag-uugugaw ang algoritmo nga magdala han mga user ha gawas han site. An mga link ha sulod han teksto nahibaro hin pagkahimo hin pagkahimo hin pagkahimo hin pagkahimo hin pagkahimo hin pagkahimo hin pagkahimo hin pagkahimo hin pagkahimo hin pagkahIto ay personal na sinabi ni Musk. Kung nais mong idirekta ang trapiko, isulat ang nilalaman sa pangunahing bahagi ng iyong post at ilagay ang link sa unang komento.

4. Huwag mong i-scroll paibaba. May-ari ang bagong bersyon ng code ng isang Author Diversity Scorer, na nagbibigay ng mas mababa na antas ng kapangyarihan sa mga post na patuloy na lumalabas mula sa parehong may-akda. Ang layunin nito ay gawing mas malawak ang feed ng user, at ang epekto nito ay hindi ka gaanong mabuti kung i-post mo ang sampung bagay nang magkakasunod kaysa sa isang mahusay na post.

6. Wala nang pinakamahusay na oras para magpost. Ang dating bersyon ng algorithm ay mayroon isang artipisyal na tampok na "oras ng paglalathala", ngunit ang bagong bersyon ay biglaan nang inalis ito. Ang Phoenix ay tingin lamang sa sequence ng mga kilos ng user, hindi kung anong oras ipinapalabas ang post. Ang mga "strategy" na nagsasabing "ang pinakamahusay na oras para mag-post ay noong 3:00 ng hapon ng araw ng Biyernes" ay nagiging mas kaunti ang halaga ng pagsusuri.

Ang mga ito ay mula sa code level.

May ilang karagdagang mga puntos na idadagdag o babawasan ay galing sa opisyales na dokumentasyon ng X at hindi kasali sa repository na ginawa ng open source: mayroong karagdagang puntos para sa Blue Checkmark, mayroon diskwento para sa lahat ng maliliit na letra, at ang sensitibong nilalaman ay nag-trigger ng 80% na pagbawas sa antas ng pag-access. Dahil hindi ito open source, hindi ko ito papaliwanagin pa.

Kabuuan la, angay naka-iskedyul an mga butang.

Angklaon na arkitektura ng sistema, logic para i-recall ang mga candidate content, proseso ng pag-sort at pagsusuri, at implementasyon ng iba't ibang mga filter. Ang code ay pangunahing ginawa gamit ang Rust at Python, may malinaw na istruktura, at ang README ay mas detalyado kaysa sa maraming komersyal na proyekto.

Pero may ilang mga pangunahing bagay na hindi inilabas.

1. Ang mga parameter ng timbang ay hindi pa inilabas. Nagawa lang sa code ang "dagdag puntos para sa positibong pag-uugali, bawas puntos para sa negatibong pag-uugali," pero walang sinabi kung ilang puntos ang idadagdag para sa isang like, o ilang puntos ang babawasin para sa isang block. Ang bersyon noong 2023 ay kahit papano inilabas na ang mga numero, pero ito'y binigay lang ang formula.

2. Ang mga timbang ng modelo ay hindi pa inilabas. Ginagamit ng Phoenix ang Grok transformer, subalit hindi inilalagay ang mga parameter ng modelo mismo. Maaari mong makita kung paano tinatawag ang modelo, subalit hindi mo makikita kung paano ito kinakalkula nang panloob.

3. Ang data ng pagsasanay ay hindi pa ikinabibilang. Wala silang nagsabi ano ang data na ginamit para i-train ang modelo, paano kinokolekta ang mga kilos ng user, at paano inaayos ang mga positibo at negatibong sample.

Halimbawa, ang pagbubukas ng code sa pagkakataong ito ay parang sinasabi sa iyo na "Ginagamit namin ang weighted sum upang makalkula ang kabuuang puntos," ngunit hindi mo alam kung ano ang mga timbang; sinasabi sa iyo na "Ginagamit namin ang transformer upang masukat ang posibilidad ng mga kilos," ngunit hindi mo alam kung ano ang nasa loob ng transformer.

Kung ikukumpara naman pabalat, hindi pa rin naglabas ng mga ito ang TikTok at Instagram. Ang dami ng impormasyon na inilabas ng X na nasa ilalim ng open source, talagang mas marami kumpara sa iba pang pangunahing platform. Ngunit mayro pa ring layo hanggang sa "kumpletong transpormasyon".

Hindi ito nangangahulugan na walang halaga ang open source. Para sa mga nagsisimula at mananaliksik, mas mabuti pa ang makita ang code kaysa hindi.