Informazioni sugli intervalli di confidenza per il vaccino Biontech / Pfizer Covid-19 calcolati con rStudio

pexels-photo-3952238.jpeg
Photo by cottonbro on Pexels.com

Probabilmente, molti di voi hanno letto le notizie positive dal comunicato stampa Biontech / Pfizer del 9 novembre:

“Il vaccino è risultato essere più del 90% efficace nel prevenire COVID-19 nei partecipanti senza evidenza di precedente infezione da SARS-CoV-2 nella prima analisi di efficacia ad interim”

Non essendo un biostatistico, ero curioso di sapere come viene misurata esattamente l’efficacia del vaccino. Inoltre, come appare l’intervallo di confidenza? Fortunatamente, Biontech e Pfizer hanno anche pubblicato un piano di studio dettagliato.

L’efficacia del vaccino campione può essere definita come:

dove $ n_v $ e $ n_p $ sono il numero di soggetti che hanno ricevuto rispettivamente un vaccino Covid-19 e un placebo, mentre $ c_v $ e $ c_p $ sono il rispettivo numero di soggetti che si sono ammalati della malattia Covid-19. IRR sta per rapporto del tasso di incidenza e misura il rapporto tra la quota di soggetti vaccinati che hanno ricevuto Covid-19 e la quota nel gruppo placebo.

Il comunicato stampa affermava che finora 38955 soggetti avevano ricevuto le due dosi di vaccino o placebo e 94 soggetti si erano ammalati di Covid-19.
Inoltre, lo studio ha affermava che lo stesso numero di soggetti era stato assegnato al gruppo di trattamento e controllo e supponiamo che anche nei 38955 soggetti analizzati fino ad ora il rapporto sia pressoché uguale. Un’efficacia di almeno il 90% implica poi che dei 94 soggetti con Covid-19 al massimo 8 avrebbero potuto essere vaccinati.

Il codice seguente calcola l’IRR e l’efficacia del vaccino presumendo che effettivamente 8 soggetti vaccinati abbiano ricevuto Covid-19.

n = 38955 # number of subjects
nv = round(n/2) # vaccinated
np = n-nv # got placebo

# number of covid cases
cv = 8
cp = 94-cv

# percentage of subjects in control group
# who got Covid-19
round(100*cp/np,2)

## [1] 0.44

# percentage of vaccinated subjects
# who got Covid-19
round(100*cv/nv,2)

## [1] 0.04

# incidence rate ratio in % in sample
IRR = (cv/nv)/(cp/np)
round(IRR*100,1)

## [1] 9.3

# vaccine efficacy in % in sample
VE = 1-IRR
round(VE*100,1)

## [1] 90.7

Supponiamo per il momento che questi dati provengano da un esperimento finito. Potremmo quindi calcolare un intervallo di confidenza approssimativo del 95% per l’efficacia del vaccino, ad es. utilizzando la seguente formula descritta in Hightower et. al. 1988

arv = cv/nv
arp = cp/np

# CI for IRR
ci.lower = exp(log(IRR) - 1.96 * sqrt((1-arv)/cv + (1-arp)/cp)) 
ci.upper = exp(log(IRR) + 1.96 * sqrt((1-arv)/cv + (1-arp)/cp)) 

IRR.ci = c(ci.lower, ci.upper)
round(100*IRR.ci,1)

## [1]  4.5 19.2

VE.ci = rev(1-IRR.ci)
round(100*VE.ci,1)

## [1] 80.8 95.5

Ciò significa che saremmo confidenti al 95% che il vaccino riduca il rischio di contrarre il Covid-19 tra l‘80,8% e il 95,5%. Per quanto ho capito la funzione Binomiale nel pacchetto gsDesign permette un calcolo più preciso dell’intervallo di confidenza:

library(gsDesign)
IRR.ci = ciBinomial(cv,cp,nv,np,scale = "RR")
VE.ci = rev(1-IRR.ci)
round(100*VE.ci,1)

##   upper lower
## 1  81.1  95.4

Dato che si afferma solo che il vaccino è efficace per oltre il 90%, il numero di casi di Covoid-19 potrebbe anche essere stato inferiore a 8 soggetti.

La soglia utile per una dichiarazione alla stampa sarebbe probabilmente almeno il 95% di efficacia, che sarebbe superata se solo 4 soggetti vaccinati avessero Covid-19. Quindi sembra anche ragionevole che solo 5 soggetti vaccinati avessero Covid-19. Ciò produrrebbe la seguente efficacia del vaccino e intervallo di confidenza:

cv = 5; cp = 94-cv
VE = 1-(cv/nv)/(cp/np)
round(VE*100,1)

## [1] 94.4

IRR.ci = ciBinomial(cv,cp,nv,np,scale = "RR")
VE.ci = rev(1-IRR.ci)
round(100*VE.ci,1)

##   upper lower
## 1  86.6  97.7

Sembra anche meglio.

Tuttavia, questi intervalli di confidenza presuppongono un esperimento finito e non adattivo. Ma le valutazioni intermedie vengono attivate quando il numero di casi di Covid-19 tra i soggetti supera determinate soglie. Il comunicato stampa afferma:

“Dopo aver discusso con la FDA, le società hanno recentemente deciso di abbandonare l’analisi ad interim di 32 casi e di condurre la prima analisi ad interim su un minimo di 62 casi. Alla conclusione di tali discussioni, il numero di casi valutabili ha raggiunto 94 e il DMC ha eseguito la sua prima analisi su tutti i casi. “

“Lo studio sta continuando a iscriversi e dovrebbe continuare attraverso l’analisi finale quando si saranno accumulati un totale di 164 casi confermati di COVID-19”.

Non sono un esperto, ma è possibile che il calcolo dell’intervallo di confidenza non sia valido per tali regole adattive in cui la valutazione è attivata dal numero di casi di malattia.

Biontech e Pfizer affermano infatti che valuteranno la precisione dell’efficacia stimata del vaccino utilizzando un framework bayesiano con una particolare distribuzione a priori descritta a p. 102-103 del loro piano di studi. Ahimè, so molto poco dell’analisi bayesiana, quindi mi astengo dal calcolare la distribuzione a posteriori visti i dati a disposizione.

Ma anche in assenza dell’analisi bayesiana a tutti gli effetti, i numeri sembrano dare buone notizie.

CGT

Biblio e Link

https://www.pfizer.com/news/press-release/press-release-detail/pfizer-and-biontech-announce-vaccine-candidate-against

https://pfe-pfizercom-d8-prod.s3.amazonaws.com/2020-09/C4591001_Clinical_Protocol.pdf

https://apps.who.int/iris/bitstream/handle/10665/264550/PMC2491112.pdf

https://cran.r-project.org/web/packages/gsDesign/index.html

Lascia un commento

Questo sito usa Akismet per ridurre lo spam. Scopri come i tuoi dati vengono elaborati.

%d blogger hanno fatto clic su Mi Piace per questo: