Algoritmo di LinkedIn

Algoritmo di LinkedIn e dei social network in generale
DATA
21/05/2020
AGGIORNATO
11/08/2025
Come funziona l'algoritmo di Linkedin? Il social network più diffuso in ambito business ha un algoritmo che sfrutta hardware e software per creare l'indicizzazione e il posizionamento dei contenuti. Ecco cosa c'è dentro veramente.

Nota dell'autore: Questo studio non è pensato per chiunque, bensì per me e per quella parte che ha un "peso silenzioso". Ci sono diversi professionisti che, indirettamente, mi hanno formato facendo divulgazione. A questa parte del web devo molto.

Premessa: conoscere le basi dell'informatica per comprendere gli algoritmi.

Nel panorama digitale operano due categorie distinte di algoritmi: quelli procedurali/astratti (che definiscono i processi logici) e quelli informatici (codice eseguibile puro) deputati alla gestione strategica di utenti, gruppi e contenuti secondo regole prestabilite e dinamiche.

Decifrare l'algoritmo di un social network significa penetrare i meccanismi e i sistemi che ne costituiscono l'architettura fondamentale: essenzialmente, comprendere il modo in cui la piattaforma "ragiona" e opera le proprie scelte.

In questo articolo analizzeremo gli aspetti tecnici cruciali, sia hardware che software, che permettono a motori di ricerca e social network di indicizzare, classificare e posizionare strategicamente i contenuti nell'ecosistema digitale.

La padronanza di queste dinamiche tecnologiche consente di ottimizzare significativamente gli aspetti relativi alla SEO per quanto riguarda:

  1. ranking delle ricerche
  2. posizionamento dei contenuti

LinkedIn, al pari di qualsiasi altra realtà digitale contemporanea, fonda il proprio modello di business sull'innovazione tecnologica.

Decodificare l'architettura tecnologica di queste piattaforme permette di identificare con maggiore precisione, attraverso il reverse engineering dei risultati, le strategie tecniche e di marketing più efficaci per ottimizzare il posizionamento di contenuti e profili.

Sebbene utilizzeremo LinkedIn come caso studio principale, le informazioni e i principi esposti si rivelano universalmente applicabili a qualsiasi social network o motore di ricerca del panorama digitale.

Nella prima sezione dell'articolo esamineremo i concetti tecnici fondamentali, fornendo per ciascuno una spiegazione dettagliata e contestualizzata.

Social e motori di ricerca sono dei software

LinkedIn può essere concettualizzato come un motore di ricerca specializzato nel mondo professionale, un social network verticale o una piattaforma digitale di nuova generazione 3.0.

Indipendentemente dalla classificazione che scegliamo di adottare, LinkedIn rappresenta fondamentalmente un sistema informatico complesso, al pari di ecosistemi digitali come Facebook o Google: un'architettura integrata di funzioni software sviluppate su infrastrutture hardware specifiche, progettate per eseguire processi aziendali determinati e strategici.

Uno di questi processi cruciali si basa su procedure che, per convenzione contemporanea, vengono identificate come algoritmi.

Sotto l'interfaccia user-friendly di LinkedIn opera quindi un ecosistema articolato di sistemi interconnessi, sia software che hardware.

Questi sistemi dialogano e interagiscono sinergicamente per determinare il posizionamento dei contenuti, e l'algoritmo responsabile del ranking non è altro che un equilibrio dinamico tra molteplici fattori che influenzano direttamente la rilevanza percepita di un contenuto.

Non è quindi corretto concepire un algoritmo come una semplice "funzione" matematica isolata che posiziona automaticamente contenuti e profili.

In questo contesto specifico, l'algoritmo deve essere interpretato piuttosto come un sistema complesso e multidimensionale nel quale coesistono e operano simultaneamente diverse funzioni specializzate per il posizionamento, la classificazione e la distribuzione dei contenuti.

Che cos'è realmente LinkedIn e su cosa si basa

L'architettura fondamentale di LinkedIn si articola attorno a tre componenti essenziali, integrati da ulteriori sistemi di supporto specializzati:

Il web server distribuito su cluster dotato di file system dedicato e ottimizzato per eseguire operazioni computazionali in "parallelo" ad alta efficienza.

Considerando che LinkedIn gestisce centinaia di milioni di utenti attivi globalmente, l'infrastruttura deve garantire capacità di elaborazione che permettano al sistema di scrivere, organizzare e indicizzare i contenuti nel minor tempo possibile, rendendoli immediatamente disponibili su scala planetaria in modalità "real-time".

L'ecosistema LinkedIn si estende attraverso molteplici nodi geografici e data center strategicamente distribuiti, ciascuno ospitante cluster specializzati—dove per cluster si intende, in termini semplificati, un raggruppamento coordinato di server che operano come unità funzionale integrata.

Il sistema, tuttavia, nella sua concezione architetturale complessiva, interpreta questa rete di macchine geograficamente distribuite come un'unica entità logica e operativa. Questa configurazione rappresenta quello che tecnicamente definiamo come un vero e proprio ecosistema cloud scalabile e resiliente.

Cluster su MongoDB
Qui un esempio di un cluster su MongoDB, un database che viene spesso utilizzato per creare servizi come i social network

A titolo di esempio possiamo vedere un software utilizzato per i BigData che si occupa di gestire enormi quantità di dati su più macchine dislocate su rete globale.

Hadoop

Riassumendo:

Un web server costituisce l'host dell'applicazione e distribuisce file e contenuti agli utenti seguendo regole specifiche implementate attraverso programmi dedicati e ottimizzati.

  1. Un cluster rappresenta un raggruppamento strategico di server progettato per distribuire e salvaguardare i dati su molteplici macchine, garantendo efficienza operativa, velocità di accesso, stabilità sistemica e ridondanza dei dati. Questi cluster interconnessi formano una rete infrastrutturale globale che definiamo tecnicamente cloud computing. Un ecosistema cloud di cluster viene impiegato, ad esempio, per l'archiviazione e la gestione ottimizzata dei database relazionali e non-relazionali.
  2. Un file system rappresenta una tecnologia specializzata per la scrittura e l'organizzazione dei dati nei server, massimizzando le performance operative e garantendo l'integrità informativa. Nel contesto specifico di LinkedIn, il file system è ingegnerizzato e ottimizzato per la manipolazione efficiente dei contenuti attraverso le operazioni CRUD (creazione, lettura, modifica e cancellazione).

La velocità nelle operazioni di ricerca, quindi, non dipende primariamente da sofisticati algoritmi di ranking. Si tratta fondamentalmente di una questione infrastrutturale e architetturale: utilizzando gli strumenti tecnologici appropriati e ottimizzandoli per un funzionamento sinergico e coordinato, si ottengono performance superiori e tempi di risposta ottimali.

Mappatura dei dati e strutture ad albero via software

Java, ad esempio, rappresenta uno dei molteplici linguaggi di programmazione enterprise impiegati per interrogare i server e restituire risultati elaborati in modalità real-time con prestazioni ottimali.

introducing apache hadoop for developers

Attraverso l'implementazione Java, possiamo osservare concretamente come sia possibile eseguire operazioni di Map-Reduce sui dataset per l'elaborazione dei risultati.

Il Map-Reduce costituisce un paradigma computazionale che consente di creare una "mappa" completa dei dati disponibili e successivamente "ridurla" a sottoinsiemi essenziali che corrispondano a specifiche richieste di ricerca.

Esempio Pratico di Map-Reduce

  1. Map iniziale: L'intero ecosistema di contenuti pubblicati su LinkedIn costituisce il dataset completo di riferimento, rappresentando la mappa dati globale della piattaforma.
  2. Primo Reduce: I contenuti associati a un profilo utente specifico rappresentano una riduzione mirata rispetto alla totalità dei post generati dall'intera community LinkedIn.
  3. Secondo Reduce: Un singolo contenuto specifico costituisce un'ulteriore riduzione granulare focalizzata esclusivamente sui materiali pubblicati da quell'utente particolare.

Semplificazione del Processo Computazionale

  • Map = universo completo di tutti i contenuti di tutti gli utenti attivi su LinkedIn.
  • Reduce = subset filtrato e ottimizzato di tutti i contenuti di un singolo profilo utente.
  • Nuovo Reduce = identificazione puntuale e precisa del singolo contenuto target dell'utente selezionato.

Questo paradigma metodologico consente di rendere estremamente granulari, scalabili e performanti le operazioni di ricerca e indicizzazione, ottimizzando significativamente i tempi di risposta del sistema e massimizzando la precisione dei risultati restituiti.

Anche in questo contesto tecnico specifico, il tanto dibattuto "algoritmo di LinkedIn" non implementa procedure straordinariamente complesse dal punto di vista computazionale, basandosi piuttosto su principi consolidati di elaborazione distribuita dei dati.

Database

Base di dati a oggetto

Che cos'è MongoDB

Base di dati a grafo

Base di dati a grafo

Database a chiave-valore

Twitter, ad esempio, utilizza Cassandra per collegare i post agli account

Cassandra su Wikipedia

Altri Sistemi Software

L'ecosistema LinkedIn si avvale di strumenti software aggiuntivi per ottimizzare il flusso dati e le performance complessive della piattaforma:

  1. Sistemi di bilanciamento del carico e gestione del traffico: quando un nodo server raggiunge soglie critiche di utilizzo, una porzione del carico computazionale viene redistribuita automaticamente su altri nodi disponibili. Questo meccanismo di smistamento intelligente opera autonomamente per garantire efficienza operativa e continuità del servizio.
  2. Server proxy specializzati, ovvero soluzioni hardware/software che gestiscono componenti specifici di LinkedIn esternamente all'applicazione principale, alleggerendo il core system e ottimizzando le risorse.
  3. Sistemi di cache avanzati per la memorizzazione statica ottimizzata di contenuti dinamici. Questi dati vengono gestiti attraverso database specializzati chiave-valore che collegano specifici contenuti (come i post) ai relativi assets (allegati, immagini, media).

Alcuni strumenti tecnologici che implementano queste operazioni includono:

Memcached

Redis

Redis rappresenta una soluzione software utilizzata da numerosi provider come servizio complementare per ottimizzare la velocità di caricamento dei contenuti su piattaforme sviluppate con WordPress e altre tecnologie.

Esempio di implementazione: Redis integrato con WordPress.

Nelle homepage di questi software è possibile consultare documentazione tecnica che illustra il funzionamento concettuale di base di ciascuna soluzione.

Questi strumenti vengono integrati strategicamente con i sistemi primari per svolgere funzioni specifiche:

  • Accelerazione delle performance del sistema complessivo
  • Minimizzazione del consumo di risorse hardware e computazionali
  • Miglioramento dell'usability e dell'esperienza utente
  • Valorizzazione dei contenuti in termini di engagement (maggiori operazioni eseguibili in tempi ridotti, incrementando la reattività della piattaforma)

Visibilità dei Post su LinkedIn

Considerando l'architettura sopra descritta, la visibilità di un contenuto e l'engagement che genera si fondano su questa infrastruttura tecnologica, che rimane sempre completamente indipendente dalla presenza di algoritmi complessi.

Perché questa indipendenza? L'architettura descritta consentirebbe teoricamente di sviluppare una replica funzionalmente identica a LinkedIn, con le medesime caratteristiche, tipologie di interazioni e qualità dei risultati.

Non una versione simile: funzionalmente identica.

Le variazioni osservate nella visibilità dei contenuti dipendono primariamente dal volume di interazioni genuine (condivisioni, click, commenti) e da ulteriori fattori tecnici analizzati di seguito.

Gli unici parametri considerati nel calcolo della reach sono quelli ufficialmente forniti da LinkedIn. Un approccio diretto per identificare quali campi influenzino effettivamente la portata organica consiste nel consultare la documentazione ufficiale delle statistiche nella sezione developer di LinkedIn.

{
  "paging": {
    "count": 10,
    "start": 0
  },
  "elements": [
    {
      "totalShareStatistics": {
        "uniqueImpressionsCount": 9327,
        "clickCount": 109276,
        "engagement": 0.007549471334119487,
        "likeCount": 52,
        "commentCount": 70,
        "shareCount": 0,
        "commentMentionsCount": 0,
        "impressionCount": 14490816,
        "shareMentionsCount": 2
      },
      "organizationalEntity": "urn:li:organization:2414183"
    }
  ]
}

Come evidenziato nell'esempio precedente, esiste il parametro engagement che viene calcolato utilizzando le interazioni contenute nell'oggetto elements della struttura dati.

Gli algoritmi, nell'accezione comune del termine, rappresentano un concetto distinto dall'infrastruttura tecnologica sottostante, e nelle prossime sezioni comprenderemo le ragioni di questa distinzione fondamentale.

Non è quindi tecnicamente corretto riferirsi all'"algoritmo di LinkedIn" quando si analizzano aspetti puramente funzionali del sistema che non comportano l'elaborazione di parametri-utente specifici (actions) per distribuire contenuti targetizzati.

Dinamiche di Interazione su LinkedIn

Quando viene eseguita un'action specifica (condivisione, click, commento, etc.), il contenuto viene automaticamente riproposto nel feed agli utenti appartenenti alla rete di chi ha generato quella particolare interazione.

Questo processo opera in relazione alla finestra temporale di riferimento e ad ulteriori fattori intrinseci di visibilità del post. Si tratta di un meccanismo che ho definito "a visibilità inversa".

I programmatori definiscono questi meccanismi "funzioni", mentre l'utente medio identifica l'insieme di queste funzioni come "algoritmo".

Considerando questo framework concettuale, procediamo nell'analisi.

Ipotizziamo che nel feed di un utente compaia un contenuto che non viene visualizzato nell'intervallo temporale in cui gli slot dedicati ai post devono essere riproposti all'utente target.

La notificazione avviene attraverso un sistema di segnalazione specifica per ciascun utente, tracciata mediante un URN univoco per ogni action su singolo contenuto. In assenza di interazioni, il post prosegue nella timeline e può essere recuperato esclusivamente attraverso la navigazione retrospettiva del feed.

Questo implica che tutti gli utenti della nostra rete e quelli delle rispettive cerchie devono essere attivi in quel preciso momento temporale (durante l'action) e visualizzare quella specifica porzione di stream (lo slot dei contenuti).

Sostanzialmente, se un utente della nostra rete non interagisce con un post, diminuiscono le probabilità che questo ci venga mostrato, poiché LinkedIn distribuisce sia i contenuti dei collegamenti diretti sia quelli segnalati dagli utenti di primo livello attraverso specifiche actions.

Per questa ragione la visibilità dei contenuti segue una logica inversa: non dipende esclusivamente dalle nostre azioni, ma anche dai comportamenti degli altri utenti della nostra rete professionale.

Inoltre, se i nostri collegamenti pubblicano numerosi contenuti durante la nostra assenza dalla piattaforma per diversi giorni, avremo minori probabilità di visualizzare i post più recenti, poiché LinkedIn dovrebbe riproporre negli slot disponibili un volume maggiore di contenuti.

Il principio è intuitivo: pubblicare 100 contenuti quotidiani non genera maggiori visualizzazioni. Al contrario, non solo tecnicamente non incrementa il traffico, ma dal punto di vista delle dinamiche sociali può risultare controproducente, saturando la rete con un volume eccessivo di contenuti provenienti dal medesimo profilo. Per questo motivo LinkedIn implementa filtri temporali nella distribuzione dei contenuti.

Con quale frequenza vengono riproposti contenuti pubblicati 6 mesi o un anno fa? Raramente, e principalmente quando un utente collegato alla nostra rete li seleziona. Osserviamo quindi che LinkedIn prioritizza sistematicamente i contenuti più recenti in relazione alle actions del target di riferimento.

Affermare l'esistenza di un algoritmo che modifica questo comportamento organico non è tecnicamente accurato, almeno per quanto concerne il funzionamento di LinkedIn.

Dal punto di vista tecnico, non esistono evidenze concrete dell'implementazione di algoritmi che modifichino l'autorevolezza intrinseca di un contenuto. Tutti i contenuti che sostengono questa tesi risultano privi di fondamento scientifico (aggiornamento: 12/08/2020).

Considerando inoltre i migliaia di esempi di contenuti privi di valore professionale che ricevono migliaia di interazioni positive (contenuti virali o di intrattenimento), l'ipotesi algoritmica risulta ancora meno plausibile.

Dal punto di vista etico, questo implicherebbe che LinkedIn manipoli le informazioni secondo criteri arbitrari, compromettendo la qualità e l'omogeneità del sistema descritto in favore della credibilità, reale o presunta, di influencer, divulgatori o professionisti con seguito consolidato.

LinkedIn ripropone ciclicamente i contenuti nel caso fossero "sfuggiti" alla visualizzazione iniziale, ma non può farlo sistematicamente per ogni contenuto di ogni collegamento. In base a come utilizziamo effettivamente la piattaforma, vengono riproposti contenuti correlati alle nostre interazioni pregresse (actions).

Filtraggio dei dati tramite oggetti

Il sistema organizza i contenuti in un "database a oggetti" dove ogni elemento può essere indicizzato e catalogato. LinkedIn utilizza queste informazioni strutturate nei filtri di ricerca della piattaforma.

Il meccanismo di ricerca dei contenuti si basa su una tecnologia chiamata "faceted search" (ricerca sfaccettata).

Per approfondire: faceted search su Wikipedia

Esempio pratico: implementazione di faceted search in MongoDB.

MongoDB, utilizzato qui come esempio, archivia le proprietà dei post in un formato diverso rispetto ai database tradizionali (quelli relazionali, come quelli che fanno funzionare blog WordPress, tanto per intenderci).

I database tradizionali salvano i dati come in un foglio Excel, usando tabelle con righe e colonne. I database a oggetti, invece, organizzano i dati con una struttura ad albero, all'interno di un oggetto che rappresenta uno specifico utente.

Ecco una schermata che mostra come funziona la faceted search su LinkedIn:

LinkedIn faceted search

Anche in questo caso esistono diversi "esperti" che dichiarano di conoscere "l'algoritmo di LinkedIn" grazie alla loro capacità di posizionarsi nelle prime posizioni dei risultati di ricerca.

Vediamo come stanno realmente le cose e perché non esiste alcuna "formula segreta" per ottenere questi risultati.

I risultati si ottengono in modo piuttosto semplice: più un utente utilizza determinate parole chiave nel suo profilo e nei suoi contenuti, maggiore sarà la probabilità che appaia tra i primi risultati quando qualcuno cerca quelle parole.

Niente di algoritmico quindi: si tratta semplicemente di densità delle parole chiave. Più una parola è presente in un determinato profilo o contenuto, maggiore è la probabilità che venga restituita da un sistema di ricerca basato su faceted search.

È il database stesso che assegna la rilevanza, non un misterioso algoritmo di LinkedIn.

Questa tecnologia presenta vantaggi e svantaggi specifici.

È possibile combinare entrambe le tecnologie (database relazionali e a oggetti) per ottenere risultati più sofisticati e simulare operazioni MapReduce con livelli di astrazione superiori rispetto a quelli offerti da un singolo database.

LinkedIn utilizza inoltre database chiave/valore per funzionalità aggiuntive.

Questo aspetto si può comprendere osservando la differenza tra la velocità di caricamento della home e quella di un post che ha molti elementi collegati (commenti e like), i quali sono a loro volta connessi al singolo oggetto principale (il post e il relativo utente).

In termini semplici: un post è un oggetto del database. Lo stesso vale per un utente.

Ogni oggetto contiene elementi specifici (come i like e i commenti di quel post). Anche questi elementi sono oggetti, ovvero "componenti figli" di oggetti principali (i profili utente).

Un oggetto ad albero

Ogni oggetto ha delle proprietà espresse come chiave/valore in un oggetto JS.

http://www.json.org/json-it.html

profilo_utente:{
  post_1:{
    titolo: "Come funziona LinkedIn",
    testo: "In questo post parleremo di..."
  },
  post_2:{
    titolo: "Come funziona un algoritmo",
    testo: "Oggi parleremo di..."
  }
}

Post_1 e post_2 sono oggetti "foglia" dell'oggetto ramo denominato "profilo_utente". "Testo" e "titolo" sono chiavi. Dopo i ":" ci sono i valori.

Ora che abbiamo stabilito un contesto tecnico di base, possiamo affrontare l'argomento successivo: perché molti utenti percepiscono che su LinkedIn esista un algoritmo che privilegia il testo rispetto alle immagini.

Cosa accade quando scriviamo su LinkedIn

Quando inseriamo del testo, stiamo salvando una proprietà-oggetto testuale (come un file .txt) all'interno di un database, che utilizza algoritmi standard per cercare quel testo e collegarlo ad altri oggetti correlati.

Possiamo definire questo algoritmo così:

riconoscimento del testo per prossimità con indice di scostamento arbitrario dei caratteri

Vediamo con un esempio semplice cosa significa.

Se scriviamo "maglionne" (con due "n"), il database tramite il suo algoritmo interno trova "maglione" perché applica uno scostamento arbitrario di un carattere, rimuovendo una "n" dalla parola cercata.

È possibile configurare il database per modificare sia il tipo di scostamento che la precisione di ricerca all'interno della stringa testuale.

Non si tratta di una funzione speciale di LinkedIn. Non è un algoritmo proprietario di LinkedIn. Sono funzionalità già integrate nei software che LinkedIn utilizza, come i database. Non c'è nulla di misterioso o "da decifrare".

Questi sistemi si basano su quella che viene chiamata tecnicamente full-text multifields.

Questo è un algoritmo embedded (incorporato) del database e non appartiene a LinkedIn.

È disponibile per chiunque, anche per test e sperimentazioni (io stesso lo utilizzo da anni, trasferendo dati da MySQL a MongoDB in PHP/JavaScript).

Google, ad esempio, usa la stessa tecnologia per il ranking delle pagine web basato su semantica, prossimità, contesto e almeno un centinaio di altri fattori conosciuti.

Google ha però sviluppato un algoritmo aggiuntivo per elaborare ulteriormente i risultati del database, basandosi principalmente sulle preferenze dell'utente. Quando siamo loggati e facciamo ricerche, comunichiamo implicitamente a Google i nostri interessi, come avviene su Facebook.

Questo algoritmo si chiama PageRank (che sembra sia stato sostituito da sistemi più avanzati, pronti per l'integrazione dell'IA). Anche qui, il funzionamento resta riservato, ma test e analisi suggeriscono che funzioni effettivamente così.

Questo precedente storico non deve confondere gli utenti LinkedIn perché LinkedIn non è Google: i due sistemi operano in modo completamente diverso, anche nell'eventuale implementazione di algoritmi di ranking.

Basta notare che la posizione dei post su LinkedIn dipende dagli utenti mentre su Google, pur essendo legata a una ricerca (che è sempre un oggetto), varia in base ad altri fattori ma principalmente alla pertinenza del contenuto.

Su Google, una pagina può essere in prima posizione oggi e scomparire domani se il contenuto non è più rilevante per quello che cercano gli utenti.

Questo su LinkedIn non succede perché i risultati scorrono in una timeline e vengono riproposti: non sono posizionati staticamente secondo un algoritmo di ranking. Questo è già un chiaro indicatore dell'assenza di algoritmi complessi.

Il feed funziona come un diario: non è una classifica. I post hanno un punteggio, questo sì, ma che non ha alcuna relazione con la qualità delle ricerche, cioè con la pertinenza tra ricerca e risultato.

Non a caso, tra i post più cliccati su LinkedIn troviamo spesso contenuti con gattini glitterati o altri contenuti virali.

gattini SEO LinkedIn engagement

Perché il testo è importante ma non è sottoposto ad algoritmo

Se scrivo in un commento "ciao", avrò salvato dentro il database a oggetti di LinkedIn una cosa di questo tipo:

comment = ciao

(dove "ciao" è il valore salvato e "comment" è la sua chiave che funge da contenitore del valore).

Più parole formano un file JSON, descritto prima: una struttura ad albero salvata come oggetto in formato JSON.

Se salvo invece un'immagine dentro LinkedIn, il database di LinkedIn salverà solamente il percorso dell'immagine.

esempio:

img = `https://www.linkedin.com/blabla/img/nome_file.jpg`

Da qui si deduce che la ricerca full-text multifields con valori di prossimità non può essere applicata perché manca l'elemento da parametrizzare: il testo.

La funzione tuttavia collega i due oggetti (testo e immagine), ma questo non prova che esista un algoritmo, tantomeno prova che questo algoritmo, ove esistesse, provocherebbe una diminuzione del traffico su quel post in presenza di un'immagine contestuale.

LinkedIn salva nel database testi e percorsi alle immagini, non le immagini vere e proprie.

Ovviamente non può essere ricercata un'immagine usando delle parole se questa non è collegata a qualcos'altro (appunto il testo) o se l'immagine non è mappata da caratteri aggiuntivi e descrittivi (tag alt e description, didascalie, metadati EXIF, descrittori XML ecc.).

https://support.google.com/webmasters/answer/114016?hl=it

https://it.wikipedia.org/wiki/Meta_tag

https://it.wikipedia.org/wiki/Exchangeable_image_file_format

https://it.wikipedia.org/wiki/XML

Facebook (alias Meta), per esempio, adotta un algoritmo che legge il testo nelle immagini. LinkedIn non ha questa tecnologia.

LinkedIn ha invece una tecnologia per leggere le parole all'interno dell'audio dei video come (per primo) ho dimostrato in un reverse engineering del 22 ottobre 2019.

E su Google? A tutt'oggi, ci sono esperimenti che non confermano al 100% che Google utilizzi tale tecnica (effettuando dei test ho constatato che il testo non viene indicizzato o trovato all'interno un'immagine).

È stato rimosso? Lo usano solo per fare dei test interni? Sarebbe un argomento da approfondire.

Anche Instagram utilizza un sistema del genere ma qui ci sono le prove:

Instagram legge il testo nelle immagini

Analizzando il codice di un mio post si nota che Instagram ha estratto automaticamente le parole presenti nell'immagine e le ha utilizzate per collegare internamente quel testo a quell'immagine specifica.

Per questo motivo ho sottolineato che è superficiale, se non scorretto, parlare di "algoritmo" riguardo a LinkedIn quando le funzioni standard della piattaforma integrano già sistemi nativi di collegamento, indicizzazione e ranking delle parole chiave che permettono di migliorare la visibilità di un post attraverso la business logic del sistema.

Non esistono trucchi segreti o funzioni nascoste da scoprire per capire come funziona "l'algoritmo" di LinkedIn.

Nella maggior parte dei casi si tratta di funzioni specifiche che svolgono compiti specifici. Nel loro insieme permettono di ottenere risultati migliori per determinati obiettivi mirati. Ma non si può parlare di un vero "algoritmo che aumenta la visibilità dei post".

La Parte Logica in cui un Algoritmo ha Senso

Considerando che la business logic di LinkedIn si basa sulla raccolta precisa delle informazioni e sul loro collegamento (non algoritmico), sorge spontanea una domanda: LinkedIn riesce a offrire tutti i suoi servizi utilizzando solo software di terze parti?

Certamente no.

Se dobbiamo identificare un vero algoritmo—cioè una logica di business avanzata che modella matematicamente o funzionalmente determinati processi relativi ai contenuti—possiamo individuarla chiaramente nei servizi LinkedIn Premium.

Per offrire annunci mirati e servizi personalizzati, LinkedIn deve comprendere le preferenze dell'utente non solo attraverso i contenuti che pubblica, ma anche analizzando i suoi comportamenti sulla piattaforma.

Un algoritmo esiste effettivamente nella parte commerciale di LinkedIn perché è necessario creare connessioni intelligenti tra dati collegati (oggetti del database).

Come spiegato in precedenza, esistono diversi metodi, anche piuttosto sofisticati, per definire un target utilizzando le impostazioni e i filtri di targeting pubblicitario disponibili.

Gli inserzionisti possono costruire campagne su target specifici e proporre soluzioni basate sui comportamenti degli utenti (contenuti testuali, immagini, video, interazioni, connessioni professionali, etc.).

Questo offre la garanzia algoritmica che il target sia profilato, ma questa garanzia viene offerta come servizio all'inserzionista, non all'utente che usa la versione free della piattaforma.

Specifico inoltre che la "garanzia algoritmica" non implica necessariamente garanzia di risultato, perché un algoritmo è una funzione che tiene conto di un numero finito di passaggi quindi maggiore è il grado di espressività dell'algoritmo e maggiori sono le probabilità che i risultati siano pertinenti rispetto a una o più regole impostate a monte.

Il punto è che questi aspetti si possono valutare solo a posteriori, cioè dopo aver acquistato un servizio premium.

In un profilo standard (non premium) dobbiamo fare questo lavoro di "affinamento" a mano: siamo noi che dobbiamo impostare i parametri di ricerca più appropriati per capire quale sia il nostro target.

LinkedIn non fa automaticamente targeting rispetto alle nostre esigenze semplicemente perché non le conosce.

La penetrazione dei nostri annunci, ad esempio, è resa possibile grazie alla possibilità del sistema di rimettere nello slot gli stessi annunci rispettando un budget. In LinkedIn ogni target è una cerchia perché il sistema delle cerchie è basato, come abbiamo visto, su database a grafo (prevalentemente Neo4J).

Qui un approfondimento su LinkedIn e Neo4J.

LinkedIn non ci collega al nostro utente ideale. Siamo noi che dobbiamo (se non facciamo advertising) fare marketing e crearci una web reputation tramite contenuti e azioni. LinkedIn permette "solo" di strutturare il profilo, ma non fa preferenze per nessuno.

In sostanza il risultato che raggiungiamo dipende esclusivamente dalla nostra capacità di bilanciare sapientemente aspetti di marketing e di advertising.

Non ci sono trucchi o segreti: tutto si comprende con la conoscenza tecnica dell'infrastruttura.

Un vero algoritmo

Cos'è quindi un algoritmo?

Senza reinventare la ruota possiamo vedere un semplice algoritmo che mette in ordine crescente una serie di numeri casuali.

Questo è un esempio molto semplice di un vero algoritmo: una funzione che, data una serie di elementi, crea un risultato basato sugli stessi elementi ordinandoli rispetto a una regola generale.

Considerazioni sul contesto

È sorprendente constatare come molti utenti che si qualificano come professionisti del web marketing si spingano ad affermare teorie che vanno oltre l'evidenza tecnica, sostenendo che LinkedIn manipoli arbitrariamente i contenuti in base al formato, alla lunghezza o all'autorevolezza dell'utente.

Questo alone di mistero sugli aspetti "esoterici" dell'algoritmo di LinkedIn che numerosi "esperti" inseriscono nelle loro analisi non ha alcun fondamento tecnico-scientifico.

Metodologia di ricerca

Su cosa ho basato il mio studio del sistema LinkedIn?

  • Centinaia di ore di ricerca dedicata e risorse investite
  • Centinaia di test sperimentali (inclusi A/B test simmetrici e asimmetrici)
  • Misurazione sistematica di centinaia di variabili e aspetti tecnici
  • Analisi approfondita di migliaia di profili e relative interazioni
  • Monitoraggio delle fasce orarie e dei pattern di click, organizzati secondo la teoria degli insiemi con proprietà parametrizzabili in formato JSON
  • Sviluppo di funzioni PHP per simulare virtualmente aspetti specifici di LinkedIn e calcolare l'impatto medio delle actions (like, commenti, condivisioni) sull'engagement, bilanciato dalle cerchie esterne identificate nella ricerca avanzata
  • Creazione di script PHP per rimuovere collegamenti che hanno rimosso il follow, al fine di ottimizzare l'engagement
  • Analisi quantitativa e qualitativa dei contenuti testuali: struttura semantica, contesto argomentativo, categorizzazioni tematiche e relative correlazioni (tecniche, informatiche, sociologiche, comunicative)
  • Centinaia di altri aspetti interconnessi attraverso formule personalizzate sviluppate per questa ricerca specifica
Fare web marketing è intuito, conoscenza e creatività.

La fuffa delle keywords: quando il marketing diventa inganno

Vendere keywords e "ottimizzare parole chiave per LinkedIn" è roba da quinta elementare, spacciata per strumento professionale che risolve problemi di visibilità.

Fa specie leggere di offerte e servizi del genere, vedere imprese che buttano soldi rivolgendosi ad autoproclamate autorità, eccellenze, esperti e guru che "vendono le migliori keywords per il tuo website".

Dal web ai social: stesso copione, nuova scena

Ma perché parlo di keywords relativamente ai siti web? Sono off-topic? Assolutamente no.

Ne parlo perché questo fenomeno ora avviene nei social network e nel web marketing basato sui social. Diverso contesto, stesse parole, identica fuffa.

L'illusione dell'expertise

Non è stato facile fare questo lavoro e dedicarci anni, ma ho ritenuto opportuno farlo perché credo che una persona non si possa definire esperta di qualcosa semplicemente perché "la sa usare" o perché ha dimestichezza con uno strumento in concessione d'uso.

Questa è esperienza, non professionalità. E tantomeno competenza.

Il cocktail tossico della falsa autorevolezza

Unendo questo aspetto a "profonde conoscenze di marketing Kotler-Oriented" (che, come tutti, ho studiato anch'io) - tutta teoria, pure scarsa e niente pratica - vengono fuori gli esperti che spiattellano la filosofia del:

  • "Lei non sa chi sono io"
  • Dell'esperienza trentennale fantomatica
  • Del "ma i nostri clienti sono felici"
  • "I nostri numeri parlano per noi"
  • "Noi abbiamo 10/20/3000/un miliardo di dipendenti"
  • "300 miliardi di follower"
  • "700 fantastilioni di like"

Noi, noi, noi e ancora noi.

La scatola magica per gonzi

Tutte argomentazioni fallaci basate sulla fuffa per vendere fuffa-SEO nei social, nascondendosi dietro l'inganno di una presunta conoscenza di un "complicatissimo" quanto "segreto" algoritmo.

Il famoso trucco della scatola magica per i gonzi.

Quando la ricerca incontra la realtà

Ho pensato di esporre una piccola parte dei miei studi in campo web marketing e informatico. Avevo creduto, ingenuamente e a torto, che la mia indagine sarebbe stata utile agli addetti ai lavori per avere una conoscenza più approfondita di un mezzo potentissimo quale LinkedIn effettivamente è.

Scomodando l'ovvio.

I numeri della delusione

Con mio relativo rammarico mi sono accorto che non è così - o meglio, lo è stato solo nel 70% dei casi, in base alle mie misurazioni su un campione di 1000 utenti.

Quello che ho raccolto, pubblicando solo un'infinitesima parte delle mie analisi corredate da spiegazioni ampie e semplificate, è stato un atteggiamento:

  • 30% avverso (di cui il 20% del totale avversamente diretto alla mia persona)
  • 70% non avverso

Il tutto per il semplice fatto che ho smontato negli anni la fuffa, sempre in buona fede e con educazione.

L'arte del discredito

Per contro ho letto moltissimi commenti e interventi altrui spesso creati ad arte al solo scopo di screditare gli altri per dare valore a chi li ha scritti.

Questione di onestà intellettuale, dunque.

La scomodità della verità

Posso capire che alle tiny-celebrities del web questo possa apparire scomodo e fastidioso. Se un cliente sapesse che una campagna da €10.000 alcune volte ne vale forse meno di €1.000...

Potrei capirlo ancora di più se volessi utilizzare queste pubblicazioni come leva di marketing per invadere il campo di questi "esperti", dal punto di vista della loro visibilità, professionalità e potenziale clientela.

Cosa che non è: siamo su campi totalmente diversi, quindi non può esserci alcuna invasione.

La realtà dei collegamenti LinkedIn e il social hacking disetico

Negli anni ho quindi rimosso il collegamento con utenti che tentavano strategie manipolatorie verso altri iscritti (non solo verso di me). Durante l'analisi ho scoperto che molti utilizzavano bieche strategie di persuasione - quello che definisco social hacking disetico - con un unico obiettivo:

Entrare in contatto con "le cerchie delle cerchie delle cerchie" per accrescere in modo artificioso la propria popolarità.

L'utente medio ritiene, ingenuamente, che gli esperti siano quelli con più follower.

Questi collegamenti artificiosi vengono poi utilizzati in modo piuttosto fantasioso: fare i detrattori con una base di gonzi al seguito che li sostengano.

La domanda che smonta il castello

Domanda algoritmica per tutti quegli "esperti" che parlano di "algoritmi che premiano la qualità":

Pensate che il fantomatico algoritmo di LinkedIn sia intervenuto per "premiare la qualità" di queste interazioni farlocche?

Semplicemente non può farlo: questo è il problema del web, oggi.

Dal terzo mondo del web: la mia selezione

Dal punto di vista delle connessioni sono alla periferia, o meglio nel terzo mondo del web.

Ma faccio anche "selezione", come specificato prima: questo è il "mio" algoritmo. Una tecnica che ho spiegato su LinkedIn già nel 2017/2018.

Bisogna intendere e immaginare l'algoritmo come un setup di cosa facciamo nel social.

Le conseguenze della verità

Ho spesso condiviso segnalazioni sulla fuffa più palese. Quando a mia volta ho segnalato o messo like, sono stato alcune volte bannato proprio da determinate categorie...

Una strategia diversa

Ho quindi stretto collegamenti con persone diverse dal mio settore:

  • Di tutte le età
  • Da tutti i luoghi d'Italia
  • Senza cercare di scavalcare ruoli e nicchie
  • Senza sfruttare leve persuasive incentrate sulla presunta "conoscenza dell'algoritmo di LinkedIn"

La domanda fondamentale

Personalmente non so se esiste un algoritmo che ci stia portando in una "nuova dimensione" su LinkedIn.

Credo con fermezza che non sia così, nonostante abbia sempre cercato di sconfessarmi utilizzando il principio einsteiniano:

una mente scientifica è una mente che dubita
Albert Einstein

Quello che ho sempre scritto nei vari post è che la piattaforma è molto equa e non ho mai notato sbilanciamenti immeritati verso alcuni utenti specifici. A LinkedIn questo bisogna darne atto.

Per un informatico o marketer, visto quanto sopra espresso, è difficile affrontare temi lavorativi relativi a questo settore se negli anni si sono create condizioni di percezione della realtà, diffuse tra le imprese e gli addetti ai lavori, basate su:

  • "Ho la sensazione che..."
  • "Mi pare..."
  • "Credo che..."
  • "Ho fatto un paio di test e..."
  • "Il mio amico esperto mi ha detto che..."
  • "Ma il massimo esperto di LinkedIn mi ha detto..."
  • "Eppure quando metto il testo succede che..."
  • "La mia agenzia mi ha detto che..."

E cose simili.

Perché ho scritto tutte queste cose? Non certo per polemica, ma per spiegare concretamente lo scenario in cui vengono diffuse le informazioni tecniche, creando disinformazione.

Infatti:

Ciò che più danneggia la R&D non è l'errore sistemico, che può essere implicito, bensì il contesto in cui questa si trova a dover essere illustrata, dimostrata ed infine condivisa.

Nel bene e nel male, le interazioni mi hanno permesso di approfondire questo sistema. Anche dai commenti più crudi ricevuti (e a volte anche offensivi) ho potuto constatare che l'Italia non è un paese così uniformato dal pensiero unico come si crede.

Ci sono molte teste diverse e tante buone idee là fuori che si potrebbero mescolare in modo proficuo. Tuttavia, non posso sottrarmi dal riconoscere che la tendenza all'apparire e al ricevere engagement superficiale sui social sia preponderante rispetto alla reale ricerca di collaborazioni concrete per fare business, magari su scala globale.

Anche questo aspetto impatta significativamente sulla visibilità dei contenuti: utilizzo del linguaggio e dinamiche di interazione...

Riassunto

  1. La maggior parte di quello che certi "esperti di LinkedIn" definiscono algoritmo non è affatto un algoritmo, ma semplici funzioni standard del sistema.
  2. La velocità delle ricerche dipende dall'ottimizzazione del database, non da algoritmi specifici di posizionamento.
  3. LinkedIn non possiede un algoritmo che decide strategicamente chi e cosa posizionare. Utilizza filtri per eliminare contenuti che violano le norme d'uso (chiaramente specificate nei termini di servizio della piattaforma).
  4. La visibilità di un contenuto dipende da funzioni standard del sistema informatico. Nessun algoritmo specifico oscura arbitrariamente i contenuti in condizioni normali di utilizzo.
  5. È una falsità affermare che LinkedIn premi automaticamente l'autorevolezza di un post attraverso meccanismi algoritmici.
  6. È falso sostenere che per posizionarsi nei primi risultati sia necessario conoscere segreti algoritmici. Il posizionamento dipende principalmente dalla densità semantica delle parole e dai contesti di interazione. Questo non rappresenta un "algoritmo di LinkedIn", ma parametri standard utilizzati dai database per restituire risultati pertinenti.
  7. La SEO su LinkedIn non è paragonabile al posizionamento su Google. Si basa esclusivamente su azioni concrete, terminologie utilizzate nel profilo e nei contenuti. Punto.
  8. È una falsità che i contenuti testuali abbiano reach superiore rispetto a immagini o video per ragioni algoritmiche. Ho documentato come il testo presente nei contenuti video influenzi effettivamente il posizionamento, ma non per motivi "algoritmici".
  9. I veri algoritmi proprietari di LinkedIn sono dedicati al loro core business: correlazioni tra profili utente e targeting pubblicitario. Anche questi si basano su collegamenti logici tra azioni, network di contatti e semantica delle parole.

Nulla di "algoritmico" quindi.

Ricevi via email strategie efficaci di marketing per il tuo business