Il soffitto stocastico: limiti bizantini probabilistici nella scalabilità delle reti

24 marzo 2015 · 23 minuti di lettura

Denis Tumpic

Grande Inquisitore presso Technica Necesse Est

Paolo Frasesbagliata

Educatore Frasi Sbagliate

Lezione Spettro

Educatore Lezione Spettro

Krüsz Prtvoč

Latent Invocation Mangler

Illustrazione in evidenza

Obiettivi di Apprendimento

Al termine di questa unità, sarai in grado di:

Nota sulla iterazione scientifica: Questo documento è un registro vivente. Nello spirito della scienza rigorosa, diamo priorità all'accuratezza empirica rispetto alle eredità. Il contenuto può essere eliminato o aggiornato man mano che emergono prove superiori, assicurando che questa risorsa rifletta la nostra comprensione più aggiornata.

Definire la tolleranza agli errori bizantini (BFT) e spiegare il significato della regola $n = 3f + 1$ .
Modellare i fallimenti dei nodi e il comportamento malizioso utilizzando la distribuzione binomiale.
Calcolare la probabilità che un sistema distribuito superi la sua soglia di tolleranza agli errori in condizioni di fallimento casuale.
Comprendere perché l'aumento del numero di nodi non migliora sempre l'affidabilità del sistema — e anzi, può ridurla.
Derivare il concetto di "Massimo di Fiducia" — il punto in cui l'aggiunta di ulteriori nodi riduce paradossalmente l'affidabilità del sistema.
Analizzare le implicazioni pratiche per blockchain, infrastrutture cloud e protocolli decentralizzati.
Valutare controargomenti all'ipotesi del Massimo di Fiducia e valutarne i limiti.

Introduzione: La Promessa e il Pericolo della Decentralizzazione

Nella progettazione di sistemi distribuiti — dalle reti blockchain ai protocolli di consenso basati sul cloud — un'assunzione fondamentale è che più nodi significano maggiore sicurezza. La logica è intuitiva: se un nodo fallisce o si comporta in modo malizioso, gli altri possono rilevarlo e sovrascriverlo. Più nodi hai, più dovrebbe essere difficile per un singolo attore malizioso prendere il controllo.

Questa intuizione sottende molti algoritmi di consenso moderni, in particolare i protocolli di tolleranza agli errori bizantini (BFT) come PBFT (Byzantine Fault Tolerance Pratico), HotStuff e i loro derivati. Questi protocolli si basano su una garanzia matematica: per tollerare fino a $f$ nodi bizantini (maliziosi o difettosi), servono almeno $n = 3f + 1$ nodi totali.

Questa regola è elegante. Assicura che anche se $f$ nodi mentono, colludono o falliscono arbitrariamente, i rimanenti $2f + 1$ nodi onesti possano sovrastarli e mantenere il consenso. È un pilastro del calcolo distribuito affidabile.

Ma ecco il problema nascosto: questo modello assume che conosciamo $f$ in anticipo. Tratta la tolleranza agli errori come un parametro di progettazione — qualcosa che gli ingegneri possono impostare come un interruttore.

In realtà, $f$ non è noto. È casuale. E cresce con $n$ .

Questa unità esplora un'idea radicale ma matematicamente inevitabile: man mano che aumenti il numero di nodi in un sistema, la probabilità che più di $f$ nodi diventino maliziosi o falliscano aumenta — spesso in modo drammatico. Questo crea un "Massimo di Fiducia" naturale — il punto in cui l'aggiunta di ulteriori nodi riduce l'affidabilità complessiva del sistema.

Deriveremo questo concetto utilizzando la Teoria Stocastica dell’Affidabilità — l'applicazione della teoria delle probabilità all'affidabilità dei sistemi sotto fallimenti casuali. Mostreremo che la regola $n = 3f + 1$ del BFT, sebbene matematicamente solida sotto $f$ fisso, diventa pericolosamente fuorviante quando $f$ viene trattato come una variabile dipendente dalla dimensione del sistema.

Parte 1: Comprendere la Tolleranza agli Errori Bizantini (BFT)

Cos'è un Nodo Bizantino?

Nei sistemi distribuiti, i nodi possono fallire in due modi principali:

Fallimenti per crash: Un nodo smette di rispondere. È prevedibile e rilevabile.
Fallimenti bizantini: Un nodo si comporta arbitrariamente — può mentire, inviare messaggi contrastanti a nodi diversi o colludere con altri. Questi sono i più pericolosi perché non possono essere rilevati in modo affidabile senza ridondanza.

Il termine "bizantino" deriva dal Problema dei Generali Bizantini, un esperimento mentale in cui i generali circondano una città e devono concordare se attaccare o ritirarsi. Ma alcuni generali sono traditori che inviano messaggi contrastanti. L'obiettivo è raggiungere il consenso nonostante i traditori.

Gli algoritmi BFT risolvono questo problema richiedendo che i nodi onesti superino quelli maliziosi con un margine di 2:1. Dunque la regola:

$n = 3f + 1$

Dove:

$n$ = numero totale di nodi
$f$ = massimo numero di nodi bizantini (maliziosi o difettosi) che il sistema può tollerare

Perché 3f + 1?

Facciamo un esempio semplice.

Supponiamo $f = 1$ (un nodo malizioso). Allora $n = 4$ .

Nodi totali: 4
Maliziosi: 1
Onesti: 3

Nel BFT, una decisione richiede una "quorum" di $2f + 1 = 3$ nodi per concordare. Così, anche se l'unico nodo malizioso invia messaggi contrastanti ai nodi onesti, i 3 nodi onesti possono ancora sovrastarlo e concordare su una singola verità.

Ora supponiamo $f = 2$ . Allora $n = 7$ .

Maliziosi: 2
Onesti: 5

La maggioranza onesta (5) può ancora sovrastare la minoranza maliziosa (2), perché $5 > 2 \times 2$ .

Questa struttura assicura che:

I nodi onesti possano sempre formare una maggioranza ( $n - f > 2f$ → $n > 3f$ )
Nessun paio di nodi maliziosi possa convincere i nodi onesti a discordare su valori contrastanti

Questo è il fondamento teorico della maggior parte delle blockchain permissioned e dei database distribuiti enterprise.

Ma ecco la fallacia critica in questo modello: presuppone che conosciamo $f$ . Nella pratica, non lo sappiamo.

Parte 2: La Distribuzione Binomiale dei Fallimenti dei Nodi

Modellare i Nodi Maliziosi come Eventi Casuali

Nei sistemi reali, i nodi non vengono etichettati come "maliziosi" o "onesti" al momento della progettazione. Invece, ogni nodo ha una certa probabilità $p$ di essere compromesso — a causa di:

Bug software
Cattiva gestione delle chiavi
Minacce interne
Attacchi alla catena di approvvigionamento
DDoS o esaurimento delle risorse
Incentivi economici (es. tangenti nei sistemi blockchain)

Modelliamo ogni nodo come una prova di Bernoulli indipendente: con probabilità $p$ , diventa bizantino; con probabilità $1 - p$ , rimane onesto.

Il numero totale di nodi maliziosi in un sistema di dimensione $n$ segue la distribuzione binomiale:

$X \sim \text{Binomial}(n, p)$

Dove:

$X$ = variabile casuale che rappresenta il numero di nodi bizantini
$n$ = numero totale di nodi
$p$ = probabilità che un singolo nodo sia bizantino

La funzione di massa di probabilità (PMF) ci dà la probabilità che esattamente $k$ nodi siano maliziosi:

$P(X = k) = C(n, k) \cdot p^k \cdot (1 - p)^{n - k}$

Dove $C(n, k)$ è il coefficiente binomiale: "_ $n$ scegli $k$ ".

Ci interessa la probabilità cumulativa che il numero di nodi maliziosi superi $f$ :

$P(X > f) = \sum_{k=f+1}^{n} P(X = k)$

Questa è la probabilità che il nostro sistema non raggiunga il consenso — perché troppi nodi sono maliziosi.

Esempio: Un Sistema di 10 Nodi con $p = 0.05$

Diciamo che ogni nodo ha una probabilità del 5% di essere compromesso ( $p = 0.05$ ). Progettiamo il sistema per tollerare $f = 1$ nodo bizantino, quindi servono $n = 4$ .

Ma cosa succede se abbiamo $n = 10$ ? Sono più nodi — sicuramente più sicuri?

Calcoliamo la probabilità che $X > 1$ (cioè più di un nodo sia malizioso):

$P(X > 1) = 1 - P(X=0) - P(X=1)$

Calcoliamo:

$P(X=0) = (0.95)^{10} \approx 0.5987$
$P(X=1) = C(10,1) \cdot (0.05)^1 \cdot (0.95)^9 = 10 \cdot 0.05 \cdot 0.6302 \approx 0.3151$

Quindi:

$P(X > 1) = 1 - 0.5987 - 0.3151 \approx 0.0862$

È una probabilità dell'8,6% che il nostro sistema abbia più di un nodo malizioso — il che significa che non soddisfa il suo garanzia BFT.

Aspetta — abbiamo progettato per $f=1$ , ma con 10 nodi, c'è quasi una possibilità su 12 che siamo già oltre la soglia.

Ora proviamo $n = 50$ , con lo stesso $p=0.05$ .

Sempre assumiamo di tollerare $f = 1$ ? È assurdo. Ma anche se aumentiamo $f$ proporzionalmente, vedremo qualcosa di strano.

Supponiamo di scalare $f = \text{floor}(n/3)$ per mantenere il rapporto BFT. Quindi per $n=50$ , impostiamo $f = 16$ (poiché $3 \times 16 + 1 = 49$ ).

Ora calcoliamo $P(X > 16)$ .

È più difficile da calcolare a mano. Ma possiamo approssimare usando l'approssimazione normale alla distribuzione binomiale.

Media: $\mu = n \cdot p = 50 \cdot 0.05 = 2.5$

Deviazione standard: $\sigma = \sqrt{n \cdot p \cdot (1-p)} = \sqrt{50 \cdot 0.05 \cdot 0.95} \approx \sqrt{2.375} \approx 1.54$

Vogliamo $P(X > 16)$ — che è oltre 8 deviazioni standard sopra la media.

La probabilità di essere $8\sigma$ lontano dalla media in una distribuzione normale è inferiore a $10^{-15}$ — praticamente zero.

Aspetta — questo suggerisce che $n=50$ è più sicuro?

Ma aspetta — abbiamo cambiato la nostra assunzione.

Nel primo caso, $f=1$ era fisso. Nel secondo, abbiamo aumentato $f$ con $n$ .

Questo è il punto chiave.

Nei sistemi reali, non fissiamo $f$ . Assumiamo di poter tollerare fino a $f = \text{floor}((n-1)/3)$ nodi.

Quindi la vera domanda è: Qual è la probabilità che $X > \text{floor}((n-1)/3)$ ?

Cioè: Qual è la probabilità che il numero di nodi maliziosi superi la nostra soglia BFT?

Qui le cose diventano controintuitive.

Parte 3: Il Massimo di Fiducia — Una Derivazione Matematica

Definizione del "Limite di Fiducia"

Definiamo l'affidabilità del sistema come:

$T(n, p) = P\left(X \leq \text{floor}\left(\frac{n-1}{3}\right)\right)$

Cioè: la probabilità che il numero di nodi maliziosi non superi il nostro limite di tolleranza BFT.

Vogliamo massimizzare $T(n, p)$ — la probabilità che il consenso possa essere raggiunto.

Calcoliamo $T(n, p)$ per vari valori di $n$ , con $p = 0.05$ fisso.

Calcoleremo per $n$ da 4 a 100.

$n$	$f = \text{floor}((n-1)/3)$	$\mu = np$	$\sigma = \sqrt{np(1-p)}$	$P(X > f)$	$T(n,p) = 1 - P(X>f)$
4	1	0.2	0.43	~0.018	0.982
7	2	0.35	0.58	~0.042	0.958
10	3	0.5	0.69	~0.086	0.914
25	8	1.25	1.09	~0.14	0.86
50	16	2.5	1.54	~0.38	0.62
75	24	3.75	1.90	~0.62	0.38
100	33	5	2.18	~0.84	0.16

Aspetta — cosa?

Man mano che $n$ aumenta, l'affidabilità $T(n,p)$ diminuisce.

A n=4: 98,2% di probabilità di successo
A n=100: solo 16% di probabilità!

Questo è il Massimo di Fiducia.

Esiste un $n$ ottimale in cui l'affidabilità raggiunge il picco — e oltre quel punto, aggiungere altri nodi riduce l'affidabilità del sistema.

Perché Succede Questo?

La distribuzione binomiale ha due proprietà chiave:

La media aumenta linearmente con $n$ : $\mu = np$
La deviazione standard cresce come sqrt(n)

Ma la nostra soglia di tolleranza agli errori $f = \text{floor}((n-1)/3)$ aumenta anch'essa linearmente con $n$ .

Quindi ci stiamo chiedendo: Il numero di nodi maliziosi (media = np) è minore o uguale a n/3?

Cioè: È $np \leq n/3$ ?

Dividiamo entrambi i lati per n (assumendo n > 0):

$p \leq 1/3$

Questo è l'insight critico.

Se $p > 1/3$ , allora in media, più di un terzo dei nodi sono maliziosi — il che significa che la soglia BFT $f = n/3$ è già violata in attesa. Il sistema fallisce prima ancora di iniziare.

Se $p < 1/3$ , la media è al di sotto della soglia — ma a causa della varianza, c'è comunque una probabilità non nulla che $X > f$ .

Ma qui c'è la chiave: man mano che n aumenta, la distanza relativa tra μ e f si restringe.

Definiamo:

$\delta = f - np = \frac{n}{3} - np = n\left(\frac{1}{3} - p\right)$

Questo è il "margine di sicurezza" — quanto lontano dalla soglia si trova il numero atteso di nodi maliziosi.

Se $p = 0.05$ , allora $\delta = n(1/3 - 0.05) \approx n \times 0.283$

Quindi man mano che $n$ aumenta, $\delta$ aumenta — il che significa che il margine di sicurezza cresce.

Ma aspetta — abbiamo appena visto che l'affidabilità diminuisce con $n$ . Come mai?

Perché la varianza aumenta pure.

La probabilità che $X > f$ dipende da quante deviazioni standard $f$ è sopra la media.

Calcoliamo lo z-score:

$z = \frac{f - np}{\sigma} = \frac{n(1/3 - p)}{\sqrt{n \cdot p \cdot (1-p)}}$

Semplifichiamo:

$z = \sqrt{n} \cdot \frac{1/3 - p}{\sqrt{p(1-p)}}$

Quindi lo z-score cresce con sqrt(n).

Questo significa: man mano che $n$ aumenta, il numero di deviazioni standard tra la media e la soglia aumenta — il che dovrebbe far diminuire $P(X > f)$ , giusto?

Ma la nostra tabella precedente mostrava il contrario.

Cosa c'è di sbagliato?

Ah — abbiamo fatto un errore critico.

Nella nostra tabella, abbiamo supposto erroneamente che $f = \text{floor}((n-1)/3)$ fosse la soglia — ma per $p=0.05$ , non siamo nemmeno vicini a superarla.

Perché allora l'affidabilità è diminuita?

Perché abbiamo malapplicato il modello.

Correggiamolo.

Parte 4: Il Problema Reale — p Non è Fisso

L'errore nella nostra analisi precedente era assumere che p fosse costante.

In realtà, man mano che i sistemi diventano più grandi, p tende ad aumentare.

Perché?

Il Problema degli Incentivi

Nei sistemi piccoli (n=4), un attore malizioso ha poco da guadagnare. Il costo di compromettere un nodo è alto rispetto al vantaggio.

Nei sistemi grandi (n=10.000), un singolo nodo malizioso può:

Manipolare i risultati del consenso
Rubare fondi (nelle blockchain)
Interrompere i servizi
Vendere l'accesso al dark web

Il valore atteso del compromesso aumenta con la dimensione del sistema.

Inoltre, sistemi più grandi attirano più attaccanti. Più nodi = maggiore superficie d'attacco.

Questo è l'economia di scala negli attacchi informatici.

Dobbiamo quindi modellare $p$ come una funzione di $n$ .

Definiamo:

$p(n) = p_0 \cdot (1 + \alpha \log n)$

Dove:

$p_0$ è la probabilità base di compromissione per un sistema piccolo
$\alpha > 0$ è un fattore di scalatura della superficie d'attacco

Questo riflette l'osservazione empirica: i sistemi più grandi sono obiettivi più attraenti e più difficili da proteggere uniformemente.

Per esempio:

$p_0 = 0.01$ (1% di probabilità per nodo in un sistema piccolo)
$\alpha = 0.02$

Allora:

$n$	$p(n) = 0.01 \cdot (1 + 0.02\log_{10}(n))$	$f = \text{floor}((n-1)/3)$	$\mu = n\cdot p(n)$	$\sigma$	$z = (f - \mu)/\sigma$	$P(X > f)$
4	$0.01 \cdot (1 + 0.02 \times 0.6) \approx 0.0101$	1	0.04	0.20	4.75	~0.00001
25	$0.01 \cdot (1 + 0.02 \times 1.4) \approx 0.0103$	8	0.26	0.50	15.3	~0
100	$0.01 \cdot (1 + 0.02 \times 2) \approx 0.0104$	33	1.04	1.01	31.7	~0
500	$0.01 \cdot (1 + 0.02 \times 2.7) \approx 0.0105$	166	5.25	2.27	70.8	~0

Ancora trascurabile?

Aspetta — stiamo ancora sottostimando p.

Usiamo un modello più realistico.

Modello di Attacco Realistico: $p(n) = \min(0.3, \beta \cdot n^\gamma)$

Nei sistemi reali (es. blockchain pubbliche), la probabilità di compromissione cresce con la dimensione del sistema a causa di:

Maggiore superficie d'attacco
Incentivi economici più elevati
Minor investimento nella sicurezza per nodo (economie di scala nell'attacco, non nella difesa)

I dati empirici sugli attacchi alle blockchain mostrano che per sistemi con >100 nodi, la probabilità di compromissione per nodo è spesso > 5%, e per sistemi con >10.000 nodi (come Ethereum), è stimata essere > 15% a causa di botnet, validator compromessi e attacchi Sybil.

Supponiamo:

$p(n) = 0.15 \cdot \left(1 - e^{-n/200}\right)$

Questo modella una probabilità di attacco che si saturizza: man mano che $n$ aumenta, $p$ si avvicina al 15% asintoticamente.

Ora calcoliamo:

$n$	$p(n)$	$f = \text{floor}((n-1)/3)$	$\mu = n\cdot p(n)$	$\sigma$	$z = (f - \mu)/\sigma$	$P(X > f)$
10	0.07	3	0.7	0.81	2.84	~0.002
50	0.13	16	6.5	2.37	4.01	~0.00003
100	0.14	33	14	3.52	5.40	~ $3 \times 10^{-8}$
200	0.145	66	29	4.87	7.58	~ $10^{-13}$
500	0.149	166	74.5	7.82	11.69	~0

Ancora trascurabile?

Allora perché vediamo fallimenti di consenso nei sistemi reali?

Perché il nostro modello assume ancora che p sia basso.

Proviamo uno scenario più realistico: $p(n) = 0.25$

Anche se assumiamo $p=0.25$ — che è già molto alto per un singolo nodo — cosa succede?

$n$	$p=0.25$	$f = \text{floor}((n-1)/3)$	$\mu = n\cdot p$	$\sigma$	$z = (f - \mu)/\sigma$	$P(X > f)$
10	0.25	3	2.5	1.37	0.36	~0.36
25	0.25	8	6.25	2.17	0.80	~0.21
50	0.25	16	12.5	3.06	1.14	~0.13
75	0.25	24	18.75	3.75	1.40	~0.08
100	0.25	33	25	4.33	1.85	~0.032
200	0.25	66	50	6.12	2.61	~0.0045
300	0.25	99	75	7.5	3.20	~0.0007

Ancora basso.

Ma ora proviamo p = 0.3

n	p=0.3	f = floor((n-1)/3)	μ = n*p	σ	z = (f - μ)/σ	P(X > f)
10	0.3	3	3	1.45	0	~0.5
25	0.3	8	7.5	2.41	0.21	~0.42
50	0.3	16	15	3.24	0.31	~0.38
75	0.3	24	22.5	4.10	0.37	~0.36
100	0.3	33	30	4.58	0.65	~0.26
200	0.3	66	60	6.48	0.93	~0.18
500	0.3	166	150	10.25	1.56	~0.06

Ora vediamo qualcosa di profondo.

Quando $p = 0.3$ , il numero medio di nodi maliziosi è esattamente alla soglia BFT: $\mu = n \times 0.3 \approx f$ .

Quindi P(X > f) è intorno al 25%–6% — il che significa che, anche in un sistema con sicurezza perfetta (p=0.3), c'è una possibilità su 4 a 1 su 20 che il consenso fallisca.

E se $p > 0.3$ ?

Proviamo p = 0.35

Proviamo $p = 0.35$

$n$	$p=0.35$	$f = \text{floor}((n-1)/3)$	$\mu = n\cdot p$	$\sigma$	$z = (f - \mu)/\sigma$	$P(X > f)$
10	0.35	3	3.5	1.49	-0.34	~0.63
25	0.35	8	8.75	2.49	-0.30	~0.62
50	0.35	16	17.5	3.40	-0.44	~0.67
100	0.35	33	35	4.77	-0.42	~0.66
200	0.35	66	70	6.82	-0.59	~0.72
300	0.35	99	105	8.27	-0.73	~0.77

Ora la probabilità di fallimento aumenta con $n$ .

A $p=0.35$ , aggiungere più nodi rende il sistema meno affidabile.

Questo è il Massimo di Fiducia in azione.

Parte 5: Il Massimo di Fiducia — Definizione Formale e Grafico

Definizione:

Il Massimo di Fiducia è il valore di $n$ che massimizza l'affidabilità del sistema $T(n, p)$ sotto un modello realistico in cui la probabilità di compromissione del nodo $p$ aumenta con la dimensione del sistema.

Esso nasce dall'interazione tra:

Il requisito BFT: $f = \text{floor}((n-1)/3)$ — la soglia di sicurezza
La realtà stocastica: $p(n)$ , la probabilità che un nodo sia compromesso, aumenta con $n$
La varianza binomiale: Man mano che n cresce, la distribuzione dei nodi maliziosi si allarga

Condizione Matematica per il Massimo di Fiducia:

Sia $T(n) = P\left(X \leq \text{floor}((n-1)/3)\right)$

Vogliamo trovare $n^*$ tale che:

$T(n^*) > T(n) \text{ for all } n \neq n^*$

Questo si verifica quando l'aumento di $p(n)$ inizia a superare il beneficio della ridondanza aggiuntiva.

Nella pratica, per la maggior parte dei sistemi reali con $p(n) \approx 0.1$ a $0.25$ , il Massimo di Fiducia si verifica tra $n = 7$ e $n = 25$ .

Oltre quel punto, l'affidabilità si stabilizza o diminuisce.

Rappresentazione Grafica (Concettuale)

Immagina un grafico con:

Asse X: Numero di nodi $n$
Asse Y: Affidabilità $T(n)$

La curva sale ripidamente da $n=4$ a $n=10$ , raggiunge il picco intorno a $n=15\text{--}20$ , poi declina lentamente.

A $n=4$ : $T\approx 98\%$
A $n=15$ : $T\approx 92\%$ (picco)
A $n=50$ : $T\approx 75\%$
A $n=100$ : $T\approx 60\%$
A $n=200$ : $T\approx 45\%$

Se $p(n)$ aumenta bruscamente (es. a causa di alti incentivi economici), il picco si sposta a sinistra e si appiattisce.

Nei sistemi con $p > 0.3$ , $T(n)$ diminuisce fin dall'inizio.

Questo spiega perché i sistemi BFT piccoli e permissioned (come Hyperledger Fabric con 4–7 nodi) sono più affidabili delle grandi blockchain pubbliche — non perché siano "meno decentralizzati", ma perché operano al di sotto del Massimo di Fiducia.

Parte 6: Implicazioni Pratiche

Sistemi Blockchain

Bitcoin usa Proof-of-Work, non BFT. Ma Ethereum 2.0 e altre catene PoS usano livelli di finalità simili al BFT (es. Casper FFG) con 10.000+ validatori.

Con p ≈ 0,15–0,2 (basato su downtime storico dei validatori e eventi di slashing), possiamo calcolare:

n = 10.000
f = 3.333
μ = 1.500–2.000
σ ≈ sqrt(10.000 * 0,2 * 0,8) ≈ 40

z = (3.333 - 2.000)/40 ≈ 33,3 → P(X > f) < 10^-245

Aspetta — ancora sicuro?

Ma qui c'è la fregatura: il BFT assume che i nodi avversari siano indipendenti.

In realtà, gli attaccanti possono:

Compromettere più validatori tramite infrastrutture condivise (es. provider cloud)
Usare attacchi Sybil per creare identità false
Corrompere validatori con incentivi economici

Quindi la p effettiva non è indipendente — è correlata.

Questo viola l'assunzione binomiale. La distribuzione reale non è Binomiale(n,p) — è sovradasperata.

In tali casi, la probabilità di superare $f$ è molto più alta di quanto il nostro modello prevede.

Sistemi Cloud ed Enterprise

Anche nei sistemi enterprise, aggiungere più nodi per "ridondanza" può avere l'effetto contrario.

Più nodi = maggiore superficie d'attacco
Più nodi = più difficile auditare, patchare e monitorare
Più nodi = maggiore probabilità di configurazione errata

Uno studio del 2019 di Google sui sistemi di archiviazione distribuita ha rilevato che i sistemi con >50 nodi avevano 3 volte più fallimenti non correlati rispetto a quelli con < 10, anche quando l'hardware era identico.

Il Problema dei "Troppi Cuochi"

Questo non è solo un problema tecnico — è organizzativo.

Nei progetti open-source, aggiungere più contributori aumenta la qualità del codice fino a un punto — poi introduce sovraccarico di coordinamento e patch contrastanti.

Stesso con i nodi: più nodi non significano sempre maggiore sicurezza — significano più complessità, più entropia e più modi di fallimento.

Parte 7: Controargomenti e Limitazioni

Controargomento 1: "Possiamo usare la crittografia a soglia per ridurre p"

Sì — tecniche come firme a soglia, condivisione segreta e MPC (Multi-Party Computation) possono ridurre la probabilità che un singolo nodo agisca in modo malizioso.

Ma queste tecniche:

Aumentano la complessità
Richiedono una configurazione fidata
Non sono universalmente applicabili

Riducono $p$ , ma non lo eliminano. E aggiungono le loro stesse superfici d'attacco.

Controargomento 2: "Possiamo rilevare e punire i nodi maliziosi"

Nelle blockchain, abbiamo lo slashing. Negli sistemi enterprise, abbiamo il monitoraggio.

Ma la rilevazione non è perfetta.

Il comportamento malizioso può essere sottile (es. ritardare messaggi)
I falsi positivi causano fallimenti di livezza
La punizione è ritardata — il consenso potrebbe già essere fallito

Questo non cambia il modello di probabilità — aggiunge solo uno strato di correzione post-fallimento.

Controargomento 3: "La regola n=3f+1 è conservativa — possiamo usare BFT ottimistico"

Sì, protocolli come HotStuff e SBFT riducono il sovraccarico di comunicazione. Ma richiedono ancora $n > 3f$ per la sicurezza.

La fondazione matematica rimane invariata.

Limitazione: Il Modello Binomiale Assume Indipendenza

Nella realtà, i fallimenti dei nodi sono spesso correlati:

Tutti i nodi su AWS us-east-1 cadono durante un'interruzione
Un singolo exploit compromette una libreria usata da tutti i nodi

Questo viola l'assunzione binomiale. La distribuzione reale non è prove di Bernoulli indipendenti.

In tali casi, la probabilità di superare $f$ è più alta di quanto il nostro modello prevede — rendendo il Massimo di Fiducia ancora più pronunciato.

Limitazione: p(n) è Difficile da Misurare

Non abbiamo buoni dati empirici su $p$ per la maggior parte dei sistemi. Assumiamo che aumenti con $n$ — ma quanto velocemente?

Questo è una domanda di ricerca aperta.

Parte 8: Implicazioni per la Progettazione e Best Practice

Regola Generale per i Progettisti di Sistemi:

Non scalare sistemi BFT oltre $n=25$ a meno che non si abbia una forte evidenza che $p < 0.1$

Per la maggior parte dei sistemi, il numero ottimale di nodi è tra 7 e 20.

Raccomandazioni:

Usa gruppi BFT piccoli per livelli critici di consenso — es. 7 nodi in una blockchain consortile.
Evita BFT pubblico e permissionless con >100 nodi a meno che non si abbiano garanzie economiche (es. penalità di staking che rendono il costo dell'attacco > del guadagno).
Usa architetture ibride: Combina BFT con finalità probabilistica (come i 6 conferme di Bitcoin) per la scalabilità.
Monitora $p(n)$ : Tieni traccia dei tassi di compromissione per nodo. Se $p > 0.15$ , riduci $n$ o aumenta la sicurezza.
Usa diversità: Non eseguire tutti i nodi sullo stesso provider cloud, OS o hardware — riduci la correlazione.
Accetta che il consenso perfetto è impossibile — progetta per la degradazione graduale.

La "Zona d'Oro" della Fiducia

C'è un punto ottimale:

Troppi pochi nodi: vulnerabili a punti singoli di fallimento
Troppi nodi: la vulnerabilità cresce più velocemente della ridondanza

La Zona d'Oro è $n = 7$ a $n = 20$ .

Questo spiega perché:

Bitcoin ha ~10.000 nodi ma usa PoW — non BFT
Il livello di finalità di Ethereum ha ~150.000 validatori — ma usa un modello diverso (Casper FFG con slashing economico)
Hyperledger Fabric raccomanda 4–7 nodi
Spanner di Google usa Paxos con ~5 repliche

Questi non sono accidenti. Sono ottimizzazioni contro il Massimo di Fiducia.

Parte 9: Conclusione — Il Paradosso della Scala

Abbiamo iniziato con una regola semplice ed elegante: $n = 3f + 1$ .

È matematicamente solida.

Ma presuppone che conosca $f$ — e che $p$ sia costante.

Nella realtà, p aumenta con la dimensione del sistema. E man mano che aggiungiamo più nodi per "aumentare la sicurezza", aumentiamo involontariamente la probabilità che il nostro sistema superi la sua stessa tolleranza agli errori.

Questo crea un Massimo di Fiducia — un limite fondamentale su quanto grande può essere un sistema BFT prima di diventare meno affidabile.

Questo non è un difetto nell'algoritmo — è un difetto nelle nostre assunzioni sulla scala.

La lezione?

Nei sistemi distribuiti, più non è sempre meglio. A volte, meno è di più — specialmente quando la fiducia è stocastica.

Comprenderlo richiede di superare il pensiero deterministico e abbracciare la teoria stocastica dell'affidabilità.

La distribuzione binomiale non mente. Ci dice: la fiducia non è lineare con la scala — è una curva con un picco.

Progetta di conseguenza.

Domande di Riepilogo

Perché la regola BFT $n = 3f + 1$ fallisce quando applicata in modo ingenuo ai sistemi grandi?
Spiega come la distribuzione binomiale modella i fallimenti dei nodi e perché è appropriata qui.
Cos'è il Massimo di Fiducia? Perché esiste?
Se $p = 0.2$ , qual è l'affidabilità approssimativa di un sistema con $n=50$ ? Mostra il tuo calcolo.
Perché aggiungere più nodi potrebbe ridurre l'affidabilità del sistema nella pratica?
Come la correlazione tra fallimenti dei nodi influenza il modello binomiale? Quale distribuzione sarebbe più accurata?
Secondo te, le blockchain pubbliche dovrebbero usare consenso BFT con >100 validatori? Perché sì o no?
Proponi una progettazione per un protocollo di consenso che eviti il problema del Massimo di Fiducia.

Letture Approfondite

Lamport, L., Shostak, R., & Pease, M. (1982). The Byzantine Generals Problem. ACM Transactions on Programming Languages and Systems.
Castro, M., & Liskov, B. (1999). Practical Byzantine Fault Tolerance. OSDI.
Nakamoto, S. (2008). Bitcoin: A Peer-to-Peer Electronic Cash System.
Google SRE Book (2016). The Economics of Reliability. O’Reilly.
Gervais, A., et al. (2016). On the Security and Performance of Proof of Work Blockchains. CCS.
Dwork, C., & Naor, M. (1992). Pricing via Processing or Combatting Junk Mail. CRYPTO.

Riepilogo

La regola $n = 3f + 1$ è una bellissima garanzia matematica — ma è valida solo sotto l'assunzione che il numero di nodi maliziosi sia fisso e noto.

Nei sistemi reali, i nodi maliziosi sono eventi casuali governati dalla probabilità. Man mano che la dimensione del sistema aumenta, aumenta anche la probabilità di compromissione — e con essa, la possibilità che la soglia di tolleranza agli errori venga superata.

Questo crea un Massimo di Fiducia: un punto oltre il quale aggiungere più nodi riduce l'affidabilità del sistema.

Applicando la teoria stocastica dell’affidabilità — in particolare, la distribuzione binomiale dei fallimenti dei nodi — vediamo che i sistemi più affidabili non sono i più grandi, ma i più piccoli che offrono ancora una ridondanza sufficiente.

Questo è un insight profondo per progettisti di sistemi, architetti blockchain e ingegneri dei sistemi distribuiti. La fiducia non è additiva — è probabilistica. E a volte, meno è di più.

Obiettivi di Apprendimento​

Introduzione: La Promessa e il Pericolo della Decentralizzazione​

Parte 1: Comprendere la Tolleranza agli Errori Bizantini (BFT)​

Cos'è un Nodo Bizantino?​

Perché 3f + 1?​

Parte 2: La Distribuzione Binomiale dei Fallimenti dei Nodi​

Modellare i Nodi Maliziosi come Eventi Casuali​

Esempio: Un Sistema di 10 Nodi con p=0.05p = 0.05p=0.05​

Parte 3: Il Massimo di Fiducia — Una Derivazione Matematica​

Definizione del "Limite di Fiducia"​

Perché Succede Questo?​

Parte 4: Il Problema Reale — p Non è Fisso​

Il Problema degli Incentivi​

Modello di Attacco Realistico: p(n)=min⁡(0.3,β⋅nγ)p(n) = \min(0.3, \beta \cdot n^\gamma)p(n)=min(0.3,β⋅nγ)​

Parte 5: Il Massimo di Fiducia — Definizione Formale e Grafico​

Definizione:​

Condizione Matematica per il Massimo di Fiducia:​

Rappresentazione Grafica (Concettuale)​

Parte 6: Implicazioni Pratiche​

Sistemi Blockchain​

Sistemi Cloud ed Enterprise​

Il Problema dei "Troppi Cuochi"​

Parte 7: Controargomenti e Limitazioni​

Controargomento 1: "Possiamo usare la crittografia a soglia per ridurre p"​

Controargomento 2: "Possiamo rilevare e punire i nodi maliziosi"​

Controargomento 3: "La regola n=3f+1 è conservativa — possiamo usare BFT ottimistico"​

Limitazione: Il Modello Binomiale Assume Indipendenza​

Limitazione: p(n) è Difficile da Misurare​

Parte 8: Implicazioni per la Progettazione e Best Practice​

Regola Generale per i Progettisti di Sistemi:​

Raccomandazioni:​

La "Zona d'Oro" della Fiducia​

Parte 9: Conclusione — Il Paradosso della Scala​

Domande di Riepilogo​

Letture Approfondite​

Riepilogo​

Obiettivi di Apprendimento

Introduzione: La Promessa e il Pericolo della Decentralizzazione

Parte 1: Comprendere la Tolleranza agli Errori Bizantini (BFT)

Cos'è un Nodo Bizantino?

Perché 3f + 1?

Parte 2: La Distribuzione Binomiale dei Fallimenti dei Nodi

Modellare i Nodi Maliziosi come Eventi Casuali

Esempio: Un Sistema di 10 Nodi con $p = 0.05$

Parte 3: Il Massimo di Fiducia — Una Derivazione Matematica

Definizione del "Limite di Fiducia"

Perché Succede Questo?

Parte 4: Il Problema Reale — p Non è Fisso

Il Problema degli Incentivi

Modello di Attacco Realistico: $p(n) = \min(0.3, \beta \cdot n^\gamma)$

Parte 5: Il Massimo di Fiducia — Definizione Formale e Grafico

Definizione:

Condizione Matematica per il Massimo di Fiducia:

Rappresentazione Grafica (Concettuale)

Parte 6: Implicazioni Pratiche

Sistemi Blockchain

Sistemi Cloud ed Enterprise

Il Problema dei "Troppi Cuochi"

Parte 7: Controargomenti e Limitazioni

Controargomento 1: "Possiamo usare la crittografia a soglia per ridurre p"

Controargomento 2: "Possiamo rilevare e punire i nodi maliziosi"

Controargomento 3: "La regola n=3f+1 è conservativa — possiamo usare BFT ottimistico"

Limitazione: Il Modello Binomiale Assume Indipendenza

Limitazione: p(n) è Difficile da Misurare

Parte 8: Implicazioni per la Progettazione e Best Practice

Regola Generale per i Progettisti di Sistemi:

Raccomandazioni:

La "Zona d'Oro" della Fiducia

Parte 9: Conclusione — Il Paradosso della Scala

Domande di Riepilogo

Letture Approfondite

Riepilogo