Dietro l'algoritmo di LinkedIn

DATA

21/05/2020

AGGIORNATO

29/05/2026

Come funziona l'algoritmo di Linkedin? Il social network più diffuso in ambito business ha un algoritmo che sfrutta hardware e software per creare l'indicizzazione e il posizionamento dei contenuti. Ecco come funziona veramente.

Premessa: conoscere le basi dell'informatica per comprendere gli algoritmi.

Nel panorama digitale operano due categorie distinte di algoritmi: quelli procedurali/astratti (che definiscono i processi logici) e quelli informatici (codice eseguibile puro) deputati alla gestione strategica di utenti, gruppi e contenuti secondo regole prestabilite e dinamiche.

Decifrare l'algoritmo di un social network significa penetrare i meccanismi e i sistemi che ne costituiscono l'architettura fondamentale: essenzialmente, comprendere il modo in cui la piattaforma "ragiona" e opera le proprie scelte.

In questo articolo analizzeremo gli aspetti tecnici cruciali, sia hardware che software, che permettono a motori di ricerca e social network di indicizzare, classificare e posizionare strategicamente i contenuti nell'ecosistema digitale.

La padronanza di queste dinamiche tecnologiche consente di ottimizzare significativamente gli aspetti relativi alla SEO per quanto riguarda:

ranking delle ricerche
posizionamento dei contenuti

LinkedIn, al pari di qualsiasi altra realtà digitale contemporanea, fonda il proprio modello di business sull'innovazione tecnologica.

Decodificare l'architettura tecnologica di queste piattaforme permette di identificare con maggiore precisione, attraverso il reverse engineering dei risultati, le strategie tecniche e di marketing più efficaci per ottimizzare il posizionamento di contenuti e profili.

Sebbene utilizzeremo LinkedIn come caso studio principale, le informazioni e i principi esposti si rivelano universalmente applicabili a qualsiasi social network o motore di ricerca del panorama digitale.

Nella prima sezione dell'articolo esamineremo i concetti tecnici fondamentali, fornendo per ciascuno una spiegazione dettagliata e contestualizzata.

LinkedIn può essere concettualizzato come un motore di ricerca specializzato nel mondo professionale, un social network verticale o una piattaforma digitale di nuova generazione 3.0.

Indipendentemente dalla classificazione che scegliamo di adottare, LinkedIn rappresenta fondamentalmente un sistema informatico complesso, al pari di ecosistemi digitali come Facebook o Google: un'architettura integrata di funzioni software sviluppate su infrastrutture hardware specifiche, progettate per eseguire processi aziendali determinati e strategici.

Uno di questi processi cruciali si basa su procedure che, per convenzione contemporanea, vengono identificate come algoritmi.

Sotto l'interfaccia user-friendly di LinkedIn opera quindi un ecosistema articolato di sistemi interconnessi, sia software che hardware.

Questi sistemi dialogano e interagiscono sinergicamente per determinare il posizionamento dei contenuti, e l'algoritmo responsabile del ranking non è altro che un equilibrio dinamico tra molteplici fattori che influenzano direttamente la rilevanza percepita di un contenuto.

Non è quindi corretto concepire un algoritmo come una semplice "funzione" matematica isolata che posiziona automaticamente contenuti e profili.

In questo contesto specifico, l'algoritmo deve essere interpretato piuttosto come un sistema complesso e multidimensionale nel quale coesistono e operano simultaneamente diverse funzioni specializzate per il posizionamento, la classificazione e la distribuzione dei contenuti.

Che cos'è realmente LinkedIn e su cosa si basa

L'architettura fondamentale di LinkedIn si articola attorno a tre componenti essenziali, integrati da ulteriori sistemi di supporto specializzati:

Il web server distribuito su cluster dotato di file system dedicato e ottimizzato per eseguire operazioni computazionali in "parallelo" ad alta efficienza.

Considerando che LinkedIn gestisce centinaia di milioni di utenti attivi globalmente, l'infrastruttura deve garantire capacità di elaborazione che permettano al sistema di scrivere, organizzare e indicizzare i contenuti nel minor tempo possibile, rendendoli immediatamente disponibili su scala planetaria in modalità "real-time".

L'ecosistema LinkedIn si estende attraverso molteplici nodi geografici e data center strategicamente distribuiti, ciascuno ospitante cluster specializzati-dove per cluster si intende, in termini semplificati, un raggruppamento coordinato di server che operano come unità funzionale integrata.

Il sistema, tuttavia, nella sua concezione architetturale complessiva, interpreta questa rete di macchine geograficamente distribuite come un'unica entità logica e operativa. Questa configurazione rappresenta quello che tecnicamente definiamo come un vero e proprio ecosistema cloud scalabile e resiliente.

Cluster su MongoDB — Qui un esempio di un cluster su MongoDB, un database che viene spesso utilizzato per creare servizi come i social network

A titolo di esempio possiamo vedere un software utilizzato per i BigData che si occupa di gestire enormi quantità di dati su più macchine dislocate su rete globale.

Hadoop

Riassumendo:

Un web server costituisce l'host dell'applicazione e distribuisce file e contenuti agli utenti seguendo regole specifiche implementate attraverso programmi dedicati e ottimizzati.

Un cluster rappresenta un raggruppamento strategico di server progettato per distribuire e salvaguardare i dati su molteplici macchine, garantendo efficienza operativa, velocità di accesso, stabilità sistemica e ridondanza dei dati. Questi cluster interconnessi formano una rete infrastrutturale globale che definiamo tecnicamente cloud computing. Un ecosistema cloud di cluster viene impiegato, ad esempio, per l'archiviazione e la gestione ottimizzata dei database relazionali e non-relazionali.
Un file system rappresenta una tecnologia specializzata per la scrittura e l'organizzazione dei dati nei server, massimizzando le performance operative e garantendo l'integrità informativa. Nel contesto specifico di LinkedIn, il file system è ingegnerizzato e ottimizzato per la manipolazione efficiente dei contenuti attraverso le operazioni CRUD (creazione, lettura, modifica e cancellazione).

La velocità nelle operazioni di ricerca, quindi, non dipende primariamente da sofisticati algoritmi di ranking. Si tratta fondamentalmente di una questione infrastrutturale e architetturale: utilizzando gli strumenti tecnologici appropriati e ottimizzandoli per un funzionamento sinergico e coordinato, si ottengono performance superiori e tempi di risposta ottimali.

Mappatura dei dati e strutture ad albero via software

Java, ad esempio, rappresenta uno dei molteplici linguaggi di programmazione enterprise impiegati per interrogare i server e restituire risultati elaborati in modalità real-time con prestazioni ottimali.

iIntroduzione Apache Hadoop.

Attraverso l'implementazione Java, possiamo osservare concretamente come sia possibile eseguire operazioni di Map-Reduce sui dataset per l'elaborazione dei risultati.

Il Map-Reduce costituisce un paradigma computazionale che consente di creare una "mappa" completa dei dati disponibili e successivamente "ridurla" a sottoinsiemi essenziali che corrispondano a specifiche richieste di ricerca.

Esempio Pratico di Map-Reduce

Map iniziale: L'intero ecosistema di contenuti pubblicati su LinkedIn costituisce il dataset completo di riferimento, rappresentando la mappa dati globale della piattaforma.
Primo Reduce: I contenuti associati a un profilo utente specifico rappresentano una riduzione mirata rispetto alla totalità dei post generati dall'intera community LinkedIn.
Secondo Reduce: Un singolo contenuto specifico costituisce un'ulteriore riduzione granulare focalizzata esclusivamente sui materiali pubblicati da quell'utente particolare.

Semplificazione del Processo Computazionale

Map = universo completo di tutti i contenuti di tutti gli utenti attivi su LinkedIn.
Reduce = subset filtrato e ottimizzato di tutti i contenuti di un singolo profilo utente.
Nuovo Reduce = identificazione puntuale e precisa del singolo contenuto target dell'utente selezionato.

Questo paradigma metodologico consente di rendere estremamente granulari, scalabili e performanti le operazioni di ricerca e indicizzazione, ottimizzando significativamente i tempi di risposta del sistema e massimizzando la precisione dei risultati restituiti.

Anche in questo contesto tecnico specifico, il tanto dibattuto "algoritmo di LinkedIn" non implementa procedure straordinariamente complesse dal punto di vista computazionale, basandosi piuttosto su principi consolidati di elaborazione distribuita dei dati.

Database

Base di dati a oggetto

Che cos'è MongoDB

Base di dati a grafo

Database a chiave-valore

Twitter, ad esempio, utilizza Cassandra per collegare i post agli account

Cassandra su Wikipedia

Altri Sistemi Software

L'ecosistema LinkedIn si avvale di strumenti software aggiuntivi per ottimizzare il flusso dati e le performance complessive della piattaforma:

Sistemi di bilanciamento del carico e gestione del traffico: quando un nodo server raggiunge soglie critiche di utilizzo, una porzione del carico computazionale viene redistribuita automaticamente su altri nodi disponibili. Questo meccanismo di smistamento intelligente opera autonomamente per garantire efficienza operativa e continuità del servizio.
Server proxy specializzati, ovvero soluzioni hardware/software che gestiscono componenti specifici di LinkedIn esternamente all'applicazione principale, alleggerendo il core system e ottimizzando le risorse.
Sistemi di cache avanzati per la memorizzazione statica ottimizzata di contenuti dinamici. Questi dati vengono gestiti attraverso database specializzati chiave-valore che collegano specifici contenuti (come i post) ai relativi assets (allegati, immagini, media).

Alcuni strumenti tecnologici che implementano queste operazioni includono:

Memcached

Redis

Redis rappresenta una soluzione software utilizzata da numerosi provider come servizio complementare per ottimizzare la velocità di caricamento dei contenuti su piattaforme sviluppate con WordPress e altre tecnologie.

Esempio di implementazione: Redis integrato con WordPress.

Nelle homepage di questi software è possibile consultare documentazione tecnica che illustra il funzionamento concettuale di base di ciascuna soluzione.

Questi strumenti vengono integrati strategicamente con i sistemi primari per svolgere funzioni specifiche:

Accelerazione delle performance del sistema complessivo
Minimizzazione del consumo di risorse hardware e computazionali
Miglioramento dell'usability e dell'esperienza utente
Valorizzazione dei contenuti in termini di engagement (maggiori operazioni eseguibili in tempi ridotti, incrementando la reattività della piattaforma)

Visibilità dei Post su LinkedIn

Considerando l'architettura sopra descritta, la visibilità di un contenuto e l'engagement che genera si fondano su questa infrastruttura tecnologica, che rimane sempre completamente indipendente dalla presenza di algoritmi complessi.

Perché questa indipendenza? L'architettura descritta consentirebbe teoricamente di sviluppare una replica funzionalmente identica a LinkedIn, con le medesime caratteristiche, tipologie di interazioni e qualità dei risultati.

Non una versione simile: funzionalmente identica.

Le variazioni osservate nella visibilità dei contenuti dipendono primariamente dal volume di interazioni genuine (condivisioni, click, commenti) e da ulteriori fattori tecnici analizzati di seguito.

Gli unici parametri considerati nel calcolo della reach sono quelli ufficialmente forniti da LinkedIn. Un approccio diretto per identificare quali campi influenzino effettivamente la portata organica consiste nel consultare la documentazione ufficiale delle statistiche nella sezione developer di LinkedIn.

{
  "paging": {
    "count": 10,
    "start": 0
  },
  "elements": [
    {
      "totalShareStatistics": {
        "uniqueImpressionsCount": 9327,
        "clickCount": 109276,
        "engagement": 0.007549471334119487,
        "likeCount": 52,
        "commentCount": 70,
        "shareCount": 0,
        "commentMentionsCount": 0,
        "impressionCount": 14490816,
        "shareMentionsCount": 2
      },
      "organizationalEntity": "urn:li:organization:2414183"
    }
  ]
}

Come evidenziato nell'esempio precedente, esiste il parametro engagement che viene calcolato utilizzando le interazioni contenute nell'oggetto elements della struttura dati.

Gli algoritmi, nell'accezione comune del termine, rappresentano un concetto distinto dall'infrastruttura tecnologica sottostante, e nelle prossime sezioni comprenderemo le ragioni di questa distinzione fondamentale.

Non è quindi tecnicamente corretto riferirsi all'"algoritmo di LinkedIn" quando si analizzano aspetti puramente funzionali del sistema che non comportano l'elaborazione di parametri-utente specifici (actions) per distribuire contenuti targetizzati.

Dinamiche di Interazione su LinkedIn

Quando viene eseguita un'action specifica (condivisione, click, commento, etc.), il contenuto viene automaticamente riproposto nel feed agli utenti appartenenti alla rete di chi ha generato quella particolare interazione.

Questo processo opera in relazione alla finestra temporale di riferimento e ad ulteriori fattori intrinseci di visibilità del post. Si tratta di un meccanismo che ho definito "a visibilità inversa".

I programmatori definiscono questi meccanismi "funzioni", mentre l'utente medio identifica l'insieme di queste funzioni come "algoritmo".
Nicola Del Ben

Considerando questo framework concettuale, procediamo nell'analisi.

Ipotizziamo che nel feed di un utente compaia un contenuto che non viene visualizzato nell'intervallo temporale in cui gli slot dedicati ai post devono essere riproposti all'utente target.

La notificazione avviene attraverso un sistema di segnalazione specifica per ciascun utente, tracciata mediante un URN univoco per ogni action su singolo contenuto. In assenza di interazioni, il post prosegue nella timeline e può essere recuperato esclusivamente attraverso la navigazione retrospettiva del feed.

Questo implica che tutti gli utenti della nostra rete e quelli delle rispettive cerchie devono essere attivi in quel preciso momento temporale (durante l'action) e visualizzare quella specifica porzione di stream (lo slot dei contenuti).

Sostanzialmente, se un utente della nostra rete non interagisce con un post, diminuiscono le probabilità che questo ci venga mostrato, poiché LinkedIn distribuisce sia i contenuti dei collegamenti diretti sia quelli segnalati dagli utenti di primo livello attraverso specifiche actions.

Per questa ragione la visibilità dei contenuti segue una logica inversa: non dipende esclusivamente dalle nostre azioni, ma anche dai comportamenti degli altri utenti della nostra rete professionale.

Inoltre, se i nostri collegamenti pubblicano numerosi contenuti durante la nostra assenza dalla piattaforma per diversi giorni, avremo minori probabilità di visualizzare i post più recenti, poiché LinkedIn dovrebbe riproporre negli slot disponibili un volume maggiore di contenuti.

Il principio è intuitivo: pubblicare 100 contenuti quotidiani non genera maggiori visualizzazioni. Al contrario, non solo tecnicamente non incrementa il traffico, ma dal punto di vista delle dinamiche sociali può risultare controproducente, saturando la rete con un volume eccessivo di contenuti provenienti dal medesimo profilo. Per questo motivo LinkedIn implementa filtri temporali nella distribuzione dei contenuti.

Con quale frequenza vengono riproposti contenuti pubblicati 6 mesi o un anno fa? Raramente, e principalmente quando un utente collegato alla nostra rete li seleziona. Osserviamo quindi che LinkedIn prioritizza sistematicamente i contenuti più recenti in relazione alle actions del target di riferimento.

Affermare l'esistenza di un algoritmo che modifica questo comportamento organico non è tecnicamente accurato, almeno per quanto concerne il funzionamento di LinkedIn.

Dal punto di vista tecnico, non esistono evidenze concrete dell'implementazione di algoritmi che modifichino l'autorevolezza intrinseca di un contenuto. Tutti i contenuti che sostengono questa tesi risultano privi di fondamento scientifico (aggiornamento: 12/08/2020).

Considerando inoltre i migliaia di esempi di contenuti privi di valore professionale che ricevono migliaia di interazioni positive (contenuti virali o di intrattenimento), l'ipotesi algoritmica risulta ancora meno plausibile.

Dal punto di vista etico, questo implicherebbe che LinkedIn manipoli le informazioni secondo criteri arbitrari, compromettendo la qualità e l'omogeneità del sistema descritto in favore della credibilità, reale o presunta, di influencer, divulgatori o professionisti con seguito consolidato.

LinkedIn ripropone ciclicamente i contenuti nel caso fossero "sfuggiti" alla visualizzazione iniziale, ma non può farlo sistematicamente per ogni contenuto di ogni collegamento. In base a come utilizziamo effettivamente la piattaforma, vengono riproposti contenuti correlati alle nostre interazioni pregresse (actions).

Filtraggio dei dati tramite oggetti

Il sistema organizza i contenuti in un "database a oggetti" dove ogni elemento può essere indicizzato e catalogato. LinkedIn utilizza queste informazioni strutturate nei filtri di ricerca della piattaforma.

Il meccanismo di ricerca dei contenuti si basa su una tecnologia chiamata "faceted search" (ricerca sfaccettata).

Per approfondire: faceted search su Wikipedia

Esempio pratico: implementazione di faceted search in MongoDB.

MongoDB, utilizzato qui come esempio, archivia le proprietà dei post in un formato diverso rispetto ai database tradizionali (quelli relazionali, come quelli che fanno funzionare blog WordPress, tanto per intenderci).

I database tradizionali salvano i dati come in un foglio Excel, usando tabelle con righe e colonne. I database a oggetti, invece, organizzano i dati con una struttura ad albero, all'interno di un oggetto che rappresenta uno specifico utente.

Ecco una schermata che mostra come funziona la faceted search su LinkedIn:

Anche in questo caso esistono diversi "esperti" che dichiarano di conoscere "l'algoritmo di LinkedIn" grazie alla loro capacità di posizionarsi nelle prime posizioni dei risultati di ricerca.

Vediamo come stanno realmente le cose e perché non esiste alcuna "formula segreta" per ottenere questi risultati.

I risultati si ottengono in modo piuttosto semplice: più un utente utilizza determinate parole chiave nel suo profilo e nei suoi contenuti, maggiore sarà la probabilità che appaia tra i primi risultati quando qualcuno cerca quelle parole.

Niente di algoritmico quindi: si tratta semplicemente di densità delle parole chiave. Più una parola è presente in un determinato profilo o contenuto, maggiore è la probabilità che venga restituita da un sistema di ricerca basato su faceted search.

È il database stesso che assegna la rilevanza, non un misterioso algoritmo di LinkedIn.

Questa tecnologia presenta vantaggi e svantaggi specifici.

È possibile combinare entrambe le tecnologie (database relazionali e a oggetti) per ottenere risultati più sofisticati e simulare operazioni MapReduce con livelli di astrazione superiori rispetto a quelli offerti da un singolo database.

LinkedIn utilizza inoltre database chiave/valore per funzionalità aggiuntive.

Questo aspetto si può comprendere osservando la differenza tra la velocità di caricamento della home e quella di un post che ha molti elementi collegati (commenti e like), i quali sono a loro volta connessi al singolo oggetto principale (il post e il relativo utente).

In termini semplici: un post è un oggetto del database. Lo stesso vale per un utente.

Ogni oggetto contiene elementi specifici (come i like e i commenti di quel post). Anche questi elementi sono oggetti, ovvero "componenti figli" di oggetti principali (i profili utente).

Un oggetto ad albero

Ogni oggetto ha delle proprietà espresse come chiave/valore in un oggetto JS.

http://www.json.org/json-it.html

profilo_utente:{
  post_1:{
    titolo: "Come funziona LinkedIn",
    testo: "In questo post parleremo di..."
  },
  post_2:{
    titolo: "Come funziona un algoritmo",
    testo: "Oggi parleremo di..."
  }
}

Post_1 e post_2 sono oggetti "foglia" dell'oggetto ramo denominato "profilo_utente". "Testo" e "titolo" sono chiavi. Dopo i ":" ci sono i valori.

Ora che abbiamo stabilito un contesto tecnico di base, possiamo affrontare l'argomento successivo: perché molti utenti percepiscono che su LinkedIn esista un algoritmo che privilegia il testo rispetto alle immagini.

Cosa accade quando scriviamo su LinkedIn

Quando inseriamo del testo, stiamo salvando una proprietà-oggetto testuale (come un file .txt) all'interno di un database, che utilizza algoritmi standard per cercare quel testo e collegarlo ad altri oggetti correlati.

Possiamo definire questo algoritmo così:

riconoscimento del testo per prossimità con indice di scostamento arbitrario dei caratteri
Nicola Del Ben

Vediamo con un esempio semplice cosa significa.

Se scriviamo "maglionne" (con due "n"), il database tramite il suo algoritmo interno trova "maglione" perché applica uno scostamento arbitrario di un carattere, rimuovendo una "n" dalla parola cercata.

È possibile configurare il database per modificare sia il tipo di scostamento che la precisione di ricerca all'interno della stringa testuale.

Non si tratta di una funzione speciale di LinkedIn. Non è un algoritmo proprietario di LinkedIn. Sono funzionalità già integrate nei software che LinkedIn utilizza, come i database. Non c'è nulla di misterioso o "da decifrare".

Questi sistemi si basano su quella che viene chiamata tecnicamente full-text multifields.

Questo è un algoritmo embedded (incorporato) del database e non appartiene a LinkedIn.

È disponibile per chiunque, anche per test e sperimentazioni (io stesso lo utilizzo da anni, trasferendo dati da MySQL a MongoDB in PHP/JavaScript).

Google, ad esempio, usa la stessa tecnologia per il ranking delle pagine web basato su semantica, prossimità, contesto e almeno un centinaio di altri fattori conosciuti.

Google ha però sviluppato un algoritmo aggiuntivo per elaborare ulteriormente i risultati del database, basandosi principalmente sulle preferenze dell'utente. Quando siamo loggati e facciamo ricerche, comunichiamo implicitamente a Google i nostri interessi, come avviene su Facebook.

Questo algoritmo si chiama PageRank (che sembra sia stato sostituito da sistemi più avanzati, pronti per l'integrazione dell'IA). Anche qui, il funzionamento resta riservato, ma test e analisi suggeriscono che funzioni effettivamente così.

Questo precedente storico non deve confondere gli utenti LinkedIn perché LinkedIn non è Google: i due sistemi operano in modo completamente diverso, anche nell'eventuale implementazione di algoritmi di ranking.

Basta notare che la posizione dei post su LinkedIn dipende dagli utenti mentre su Google, pur essendo legata a una ricerca (che è sempre un oggetto), varia in base ad altri fattori ma principalmente alla pertinenza del contenuto.

Su Google, una pagina può essere in prima posizione oggi e scomparire domani se il contenuto non è più rilevante per quello che cercano gli utenti.

Questo su LinkedIn non succede perché i risultati scorrono in una timeline e vengono riproposti: non sono posizionati staticamente secondo un algoritmo di ranking. Questo è già un chiaro indicatore dell'assenza di algoritmi complessi.

Il feed funziona come un diario: non è una classifica. I post hanno un punteggio, questo sì, ma che non ha alcuna relazione con la qualità delle ricerche, cioè con la pertinenza tra ricerca e risultato.

Non a caso, tra i post più cliccati su LinkedIn troviamo spesso contenuti con gattini glitterati o altri contenuti virali.

Perché il testo è importante ma non è sottoposto ad algoritmo

Se scrivo in un commento "ciao", avrò salvato dentro il database a oggetti di LinkedIn una cosa di questo tipo:

comment = ciao

(dove "ciao" è il valore salvato e "comment" è la sua chiave che funge da contenitore del valore).

Più parole formano un file JSON, descritto prima: una struttura ad albero salvata come oggetto in formato JSON.

Se salvo invece un'immagine dentro LinkedIn, il database di LinkedIn salverà solamente il percorso dell'immagine.

esempio:

img = `https://www.linkedin.com/blabla/img/nome_file.jpg`

Da qui si deduce che la ricerca full-text multifields con valori di prossimità non può essere applicata perché manca l'elemento da parametrizzare: il testo.

La funzione tuttavia collega i due oggetti (testo e immagine), ma questo non prova che esista un algoritmo, tantomeno prova che questo algoritmo, ove esistesse, provocherebbe una diminuzione del traffico su quel post in presenza di un'immagine contestuale.

LinkedIn salva nel database testi e percorsi alle immagini, non le immagini vere e proprie.
Nicola Del Ben

Ovviamente non può essere ricercata un'immagine usando delle parole se questa non è collegata a qualcos'altro (appunto il testo) o se l'immagine non è mappata da caratteri aggiuntivi e descrittivi (tag alt e description, didascalie, metadati EXIF, descrittori XML ecc.).

https://support.google.com/webmasters/answer/114016?hl=it

https://it.wikipedia.org/wiki/Meta_tag

https://it.wikipedia.org/wiki/Exchangeable_image_file_format

https://it.wikipedia.org/wiki/XML

Facebook (alias Meta), per esempio, adotta un algoritmo che legge il testo nelle immagini. LinkedIn non ha questa tecnologia.

LinkedIn ha invece una tecnologia per leggere le parole all'interno dell'audio dei video come (per primo) ho dimostrato in un reverse engineering del 22 ottobre 2019.

E su Google? A tutt'oggi, ci sono esperimenti che non confermano al 100% che Google utilizzi tale tecnica (effettuando dei test ho constatato che il testo non viene indicizzato o trovato all'interno un'immagine).

È stato rimosso? Lo usano solo per fare dei test interni? Sarebbe un argomento da approfondire.

Anche Instagram utilizza un sistema del genere ma qui ci sono le prove:

Analizzando il codice di un mio post si nota che Instagram ha estratto automaticamente le parole presenti nell'immagine e le ha utilizzate per collegare internamente quel testo a quell'immagine specifica.

Per questo motivo ho sottolineato che è superficiale, se non scorretto, parlare di "algoritmo" riguardo a LinkedIn quando le funzioni standard della piattaforma integrano già sistemi nativi di collegamento, indicizzazione e ranking delle parole chiave che permettono di migliorare la visibilità di un post attraverso la business logic del sistema.

Non esistono trucchi segreti o funzioni nascoste da scoprire per capire come funziona "l'algoritmo" di LinkedIn.

Nella maggior parte dei casi si tratta di funzioni specifiche che svolgono compiti specifici. Nel loro insieme permettono di ottenere risultati migliori per determinati obiettivi mirati. Ma non si può parlare di un vero "algoritmo che aumenta la visibilità dei post".

La Parte Logica in cui un Algoritmo ha Senso

Considerando che la business logic di LinkedIn si basa sulla raccolta precisa delle informazioni e sul loro collegamento (non algoritmico), sorge spontanea una domanda: LinkedIn riesce a offrire tutti i suoi servizi utilizzando solo software di terze parti?

Certamente no.

Se dobbiamo identificare un vero algoritmo-cioè una logica di business avanzata che modella matematicamente o funzionalmente determinati processi relativi ai contenuti-possiamo individuarla chiaramente nei servizi LinkedIn Premium.

Per offrire annunci mirati e servizi personalizzati, LinkedIn deve comprendere le preferenze dell'utente non solo attraverso i contenuti che pubblica, ma anche analizzando i suoi comportamenti sulla piattaforma.

Un algoritmo esiste effettivamente nella parte commerciale di LinkedIn perché è necessario creare connessioni intelligenti tra dati collegati (oggetti del database).

Come spiegato in precedenza, esistono diversi metodi, anche piuttosto sofisticati, per definire un target utilizzando le impostazioni e i filtri di targeting pubblicitario disponibili.

Gli inserzionisti possono costruire campagne su target specifici e proporre soluzioni basate sui comportamenti degli utenti (contenuti testuali, immagini, video, interazioni, connessioni professionali, etc.).

Questo offre la garanzia algoritmica che il target sia profilato, ma questa garanzia viene offerta come servizio all'inserzionista, non all'utente che usa la versione free della piattaforma.
Nicola Del Ben

Specifico inoltre che la "garanzia algoritmica" non implica necessariamente garanzia di risultato, perché un algoritmo è una funzione che tiene conto di un numero finito di passaggi quindi maggiore è il grado di espressività dell'algoritmo e maggiori sono le probabilità che i risultati siano pertinenti rispetto a una o più regole impostate a monte.

Il punto è che questi aspetti si possono valutare solo a posteriori, cioè dopo aver acquistato un servizio premium.

In un profilo standard (non premium) dobbiamo fare questo lavoro di "affinamento" a mano: siamo noi che dobbiamo impostare i parametri di ricerca più appropriati per capire quale sia il nostro target.

LinkedIn non fa automaticamente targeting rispetto alle nostre esigenze semplicemente perché non le conosce.

La penetrazione dei nostri annunci, ad esempio, è resa possibile grazie alla possibilità del sistema di rimettere nello slot gli stessi annunci rispettando un budget. In LinkedIn ogni target è una cerchia perché il sistema delle cerchie è basato, come abbiamo visto, su database a grafo (prevalentemente Neo4J).

Qui un approfondimento su LinkedIn e Neo4J.

LinkedIn non ci collega al nostro utente ideale. Siamo noi che dobbiamo (se non facciamo advertising) fare marketing e crearci una web reputation tramite contenuti e azioni. LinkedIn permette "solo" di strutturare il profilo, ma non fa preferenze per nessuno.

In sostanza il risultato che raggiungiamo dipende esclusivamente dalla nostra capacità di bilanciare sapientemente aspetti di marketing e di advertising.

Non ci sono trucchi o segreti: tutto si comprende con la conoscenza tecnica dell'infrastruttura.
Nicola Del Ben

Un vero algoritmo

Cos'è quindi un algoritmo?

Senza reinventare la ruota possiamo vedere un semplice algoritmo che mette in ordine crescente una serie di numeri casuali.

Questo è un esempio molto semplice di un vero algoritmo: una funzione che, data una serie di elementi, crea un risultato basato sugli stessi elementi ordinandoli rispetto a una regola generale.

Considerazioni sul contesto

È sorprendente constatare come molti utenti che si qualificano come professionisti del web marketing si spingano ad affermare teorie che vanno oltre l'evidenza tecnica, sostenendo che LinkedIn manipoli arbitrariamente i contenuti in base al formato, alla lunghezza o all'autorevolezza dell'utente.

Questo alone di mistero sugli aspetti "esoterici" dell'algoritmo di LinkedIn che numerosi "esperti" inseriscono nelle loro analisi non ha alcun fondamento tecnico-scientifico.

Metodologia di ricerca

Su cosa ho basato il mio studio del sistema LinkedIn?

Centinaia di ore di ricerca dedicata e risorse investite
Centinaia di test sperimentali (inclusi A/B test simmetrici e asimmetrici)
Misurazione sistematica di centinaia di variabili e aspetti tecnici
Analisi approfondita di migliaia di profili e relative interazioni
Monitoraggio delle fasce orarie e dei pattern di click, organizzati secondo la teoria degli insiemi con proprietà parametrizzabili in formato JSON
Sviluppo di funzioni PHP per simulare virtualmente aspetti specifici di LinkedIn e calcolare l'impatto medio delle actions (like, commenti, condivisioni) sull'engagement, bilanciato dalle cerchie esterne identificate nella ricerca avanzata
Creazione di script PHP per rimuovere collegamenti che hanno rimosso il follow, al fine di ottimizzare l'engagement
Analisi quantitativa e qualitativa dei contenuti testuali: struttura semantica, contesto argomentativo, categorizzazioni tematiche e relative correlazioni (tecniche, informatiche, sociologiche, comunicative)
Centinaia di altri aspetti interconnessi attraverso formule personalizzate sviluppate per questa ricerca specifica

Fare web marketing è intuito, conoscenza e creatività.
Nicola Del Ben

Proporre "l'ottimizzazione delle parole chiave per LinkedIn" come soluzione ai problemi di visibilità è un approccio tecnicamente inconsistente. Il parallelo con la SEO per siti web non è casuale: lo stesso modello concettuale - spesso superato anche nel contesto originario - è stato trasportato nei social network senza adattamento né verifica empirica. Assolutamente no, non si tratta di un argomento off-topic: questo fenomeno si manifesta oggi nel web marketing basato sui social con la stessa struttura di sempre. Diverso contesto, stesse argomentazioni, identici limiti pratici.

Competenza dichiarata e competenza reale

Non è semplice distinguere chi conosce a fondo uno strumento da chi semplicemente lo utilizza con continuità. La familiarità con una piattaforma - inclusa LinkedIn - è esperienza d'uso, non competenza tecnica. Questa è esperienza, non professionalità. E tantomeno competenza.

Senza una base metodologica solida, anche conoscenze teoriche di marketing consolidate rischiano di rimanere sterili. L'autorevolezza percepita viene spesso costruita su argomenti del tipo:

"Lei non sa chi sono io"
Dell'esperienza trentennale fantomatica
Del "ma i nostri clienti sono felici"
"I nostri numeri parlano per noi"
"Noi abbiamo 10/20/3000/un miliardo di dipendenti"
"300 miliardi di follower"
"700 fantastilioni di like"

Noi, noi, noi e ancora noi.

Questi argomenti - fondati sulla visibilità e sui volumi aggregati - non hanno alcuna correlazione diretta con la capacità di produrre risultati misurabili, né con la comprensione tecnica del sistema che si propone di analizzare. L'equivoco nasce dalla scatola magica costruita attorno a un algoritmo presentato come "complicatissimo" e "segreto", quando invece molti dei suoi comportamenti sono documentabili e misurabili.

Ricezione della ricerca e dinamiche di autorevolezza

Ho pubblicato una parte dei miei studi con l'obiettivo di offrire agli addetti ai lavori una lettura più approfondita di uno strumento effettivamente potente come LinkedIn. Scomodando l'ovvio.

Su un campione di 1000 utenti, le risposte si sono distribuite in questo modo:

30% avverso (di cui il 20% del totale avversamente diretto alla mia persona)
70% non avverso

Ho osservato che una parte dei commenti critici non era orientata al confronto tecnico, ma alla delegittimazione dell'interlocutore come strategia per rafforzare la propria posizione. Si tratta di una dinamica riconoscibile e misurabile, che nulla ha a che fare con il merito dei contenuti. Questione di onestà intellettuale, dunque.

Va chiarito un punto: queste pubblicazioni non hanno alcuna finalità competitiva verso chi opera nel settore del marketing e della consulenza LinkedIn. I campi di attività sono distinti. Se un cliente potesse valutare il reale ritorno di una campagna da €10.000 rispetto al suo costo effettivo, avrebbe semplicemente più strumenti per decidere consapevolmente - non si tratta di invadere il campo di nessuno.

Nel corso dell'analisi ho identificato un pattern ricorrente: alcuni utenti adottano strategie di persuasione sistematiche - quello che definisco social hacking disetico - per espandere artificialmente la propria rete. L'obiettivo è entrare in contatto con "le cerchie delle cerchie delle cerchie" per accrescere in modo artificioso la propria popolarità, facendo leva sulla percezione - diffusa tra gli utenti meno esperti - che il numero di follower sia un indicatore diretto di competenza.

Ho quindi progressivamente rimosso i collegamenti con utenti che adottavano queste condotte. Vale la pena sottolineare che chi segnala contenuti problematici o interagisce con certi post può essere oggetto di blocco proprio da determinate categorie di utenti - una risposta che in sé rivela la natura delle dinamiche descritte.

Domanda algoritmica: chi sostiene che l'algoritmo di LinkedIn "premi la qualità" dovrebbe chiedersi se questo sistema sia in grado di distinguere interazioni genuine da quelle costruite artificialmente. Semplicemente non può farlo: questo è il problema del web, oggi.

Dal punto di vista delle connessioni opero in modo selettivo: questo è il "mio" algoritmo. Una scelta metodologica che ho documentato su LinkedIn già nel 2017/2018.

Bisogna intendere e immaginare l'algoritmo come un setup di cosa facciamo nel social.
Nicola Del Ben

Ho costruito la rete con un criterio diverso, stringendo collegamenti con persone di settori eterogenei:

Di tutte le età
Da tutti i luoghi d'Italia
Senza cercare di scavalcare ruoli e nicchie
Senza sfruttare leve persuasive incentrate sulla presunta "conoscenza dell'algoritmo di LinkedIn"

Considerazioni sull'ecosistema informativo

Credo con fermezza che non esista un algoritmo che stia portando LinkedIn verso una "nuova dimensione" occulta, nonostante abbia sempre cercato di confutare questa posizione applicando il principio del dubbio metodico:

una mente scientifica è una mente che dubita
Albert Einstein

La piattaforma è molto equa e nei miei anni di analisi non ho rilevato sbilanciamenti sistematici a favore di utenti specifici. A LinkedIn questo va riconosciuto.

Il problema non è la piattaforma. È il contesto in cui vengono elaborate e condivise le informazioni tecniche su di essa: un ecosistema in cui le decisioni vengono spesso prese sulla base di percezioni soggettive piuttosto che di dati misurabili. Tra le fonti più frequenti di questa disinformazione:

"Ho la sensazione che..."
"Mi pare..."
"Credo che..."
"Ho fatto un paio di test e..."
"Il mio amico esperto mi ha detto che..."
"Ma il massimo esperto di LinkedIn mi ha detto..."
"Eppure quando metto il testo succede che..."
"La mia agenzia mi ha detto che..."

E cose simili.

Non è per polemica che ho descritto queste dinamiche, ma per fornire il quadro in cui si muove chiunque voglia fare ricerca applicata in questo campo - un contesto che genera disinformazione difficile da contrastare con i soli dati.

Ciò che più danneggia la R&D non è l'errore sistemico, che può essere implicito, bensì il contesto in cui questa si trova a dover essere illustrata, dimostrata ed infine condivisa.
Nicola Del Ben

Le interazioni ricevute nel tempo - anche quelle più critiche - hanno contribuito ad approfondire la comprensione del sistema. Ho potuto verificare che l'Italia non è un paese così uniformato dal pensiero unico come si crede: esistono prospettive diverse e approcci originali che potrebbero integrarsi produttivamente. Resta però una tendenza all'apparire e a raccogliere engagement superficiale, più che a costruire collaborazioni concrete orientate al business.

Anche questo aspetto impatta significativamente sulla visibilità dei contenuti: utilizzo del linguaggio e dinamiche di interazione...

Riassunto

La maggior parte di quello che certi "esperti di LinkedIn" definiscono algoritmo non è affatto un algoritmo, ma semplici funzioni standard del sistema.
La velocità delle ricerche dipende dall'ottimizzazione del database, non da algoritmi specifici di posizionamento.
LinkedIn non possiede un algoritmo che decide strategicamente chi e cosa posizionare. Utilizza filtri per eliminare contenuti che violano le norme d'uso (chiaramente specificate nei termini di servizio della piattaforma).
La visibilità di un contenuto dipende da funzioni standard del sistema informatico. Nessun algoritmo specifico oscura arbitrariamente i contenuti in condizioni normali di utilizzo.
È una falsità affermare che LinkedIn premi automaticamente l'autorevolezza di un post attraverso meccanismi algoritmici.
È falso sostenere che per posizionarsi nei primi risultati sia necessario conoscere segreti algoritmici. Il posizionamento dipende principalmente dalla densità semantica delle parole e dai contesti di interazione. Questo non rappresenta un "algoritmo di LinkedIn", ma parametri standard utilizzati dai database per restituire risultati pertinenti.
La SEO su LinkedIn non è paragonabile al posizionamento su Google. Si basa esclusivamente su azioni concrete, terminologie utilizzate nel profilo e nei contenuti. Punto.
È una falsità che i contenuti testuali abbiano reach superiore rispetto a immagini o video per ragioni algoritmiche. Ho documentato come il testo presente nei contenuti video influenzi effettivamente il posizionamento, ma non per motivi "algoritmici".
I veri algoritmi proprietari di LinkedIn sono dedicati al loro core business: correlazioni tra profili utente e targeting pubblicitario. Anche questi si basano su collegamenti logici tra azioni, network di contatti e semantica delle parole.

Nulla di "algoritmico" quindi.

La pipeline di sviluppo di 1micron

SEO audio/video su LinkedIn