Condividi:        

Estrazione di dati da foglio complesso tra due date

Vuoi potenziare i tuoi documenti Word? Non sai come si fa una macro in Excel? Devi creare una presentazione in PowerPoint?
Oppure sei passato a OpenOffice e non sei sicuro di come lavorare al meglio?

Moderatori: Anthony47, Flash30005

Estrazione di dati da foglio complesso tra due date

Postdi mastermind73 » 27/06/10 01:46

Salve a tutti, ho un quesito e cercherò di essere chiaro.

Ho un database molto complesso con tutta una serie di riferimenti di referti medici e dati clinci.
In questo foglio di excel ho, in sostanza, un campo "A" che contiene il cognome e nome del paziente.
Successivamente in tutti gli altri campi (b, c, d, ecc.) ci sono dei dati clinici specifici.
In un campo X ho la data in cui la persona ha subito un intervento
Nel campo Y ho la data in cui la persona è deceduta.

Quello che devo fare è riuscire ad estrarre, da un elenco di migliaia di files, solo le persone che sono sopravvissute meno
tra 0 e 3 mesi, quelle sopravvissute tre 3 e sei mesi, tra 6 e 12 mesi, tra 12 e 24 mesi, tra 24 e 48 mesi e oltre i 48 mesi.

Ovviamente posso calcolare quanti giorni intercorrono fra la data del campo X e quella del campo Y.

Ma come posso sapere quante unità sono presenti in quei determinati intervalli?

A me interessa sapere solo il numero di pazienti che corrispondono ai vari campi.

Attenzione a due dati particolari.....

1. un paziente trapiantato 3 mesi fa (ovvero - 3 mesi dalla data odierna) potrebbe non essere ancora morto è possibile sapere chi sono e quanti sono quelli non ancora deceduti? (ovviamente non hanno alcuna data nel campo Y (data di decesso).

2. è evidente che il numero di pazienti che sopravvivono tra 0 e 3 mesi sarà altissimo (quasi tutti) mentre nel corso degli anni i decessi aumentano.

Ai dati ricavati, (quindi al numero di persone sopravvissute nei vari intervalli), saranno successivamente applicate le formula Kaplan per la curva di sopravvivenza.

Ma senza una formula di estrazione capace di "contare" quanti pazienti sono presenti nel determinato periodo non riesco ad andare oltre.

Spero di essere stato chiaro.
eventuali richieste di specifiche via mail mastermind.73@live.it

Grazie, Guido.
mastermind73
Newbie
 
Post: 3
Iscritto il: 27/06/10 01:35

Sponsor
 

Re: Estrazione di dati da foglio complesso tra due date

Postdi tutamimetica » 27/06/10 08:49

tutamimetica
Utente Senior
 
Post: 209
Iscritto il: 10/06/08 17:25

Re: Estrazione di dati da foglio complesso tra due date

Postdi mastermind73 » 27/06/10 19:32

Scusa ma credo di avere problemi col forum. Mi butta fuori, non so se spedisce i messaggi....

Ripeto.... i tipi di dati sono i seguenti:

A B C D E
NOME PAZIENTE; DATA TRAPIANTO ; DATA MORTE o FINE FUNZIONE ORGANO ; ALTRI CAMPI ; ALTRI CAMPI

PINO ; 12/09/1990 ; 12 /12/1990 ; BLA BLA ; BLA BLA
PAOLO ; 24/03/1996 ; 07/08/2003 ; " ; "
GINO ; 23/09/2009 ; (nessuna perchè ancora vivo) ; " ; "
MARIO ; 29/05/2010 ; (nessuna perchè ancora vivo) ; " ; "
LUCA ; 12/06/2010 ; 14/06/2010(vivo ma problemi organo) ; " ; "

Per meglio precisare.
1. Quello che mi interessa è la sopravvivenza dell'organo, non quella del paziente. Quindi se il sig. LUCA è ancora vivo ma l'organo è espiantato viene considerato come 1 fallimento. Quindi quel valore non si considera piu'.

2. i dati da verificare devono rispondere a questo quesito:

L'organo di quanti pazienti è sopravvissuto tra 0 e 3 mesi?
L'organo di quanti pazienti è sopravvissuto tra 3 e 6 mesi?
ecc.

Lo 0 e 3 mesi non è riferito ad oggi, bensì tra la data 0 (ovvero data di trapianto) e la data 3 mesi ovvero la data 3 mesi successiva a quella del trapianto. e così via per tutti i valori. Il riferimento 0 è sempre quello di data inizio trapianto e la data di espianto, morte o cessazione organo in genere è la data da tenere in considerazione per calcolare la durata della sopravvivenza.

Ovviamente da notare è che ..... praticamente TUTTI gli organi saranno sopravvissuti tra 0 e 3 mesi. (quindi 5 nel nostro caso).

E che un organo che sopravvive 3 anni sarà presente tra 0 e 3 mesi, tra 3 e 6 mesi, tra 6 e 12, tra 12 e 24 e tra 24 e 48. Ma non sarà presente tra 48 e 60. E nemmeno tra 60 e oltre.

Un organo che sopravvive 1 anno sarà presente tra 0 e 3 mesi, tra 3 e 6 mesi, tra 6 e 12 mesi, ma non tra 12 e 24 (12 mesi + 1 gg.) e non nei successivi intervalli.

Quindi il valore 0 - 3 mesi conterrà tutti i trapianti fatti.
Da 3 a 6 mesi se ne perderanno alcuni (ovviamente pochi)
Da 6 a 12 mesi se ne perderanno di piu', ecc. ecc.

Da tenere in considerazione anche gli anni bisestili, i mesi non da 30 gg, ecc.

Forse ora sono stato piu' chiaro.

Dal conteggio fatto da lei (o da te) .... risultavano solo 2 totali tra 0 e 3 mesi mentre la base di dati era di 4 quindi dovevano esserci 4 totali.

La curva di sopravvivenza secondo kaplan meyer (di cui ho già un excel) prende in considerazione i dati partendo dal 100% di sopravvivenza a 0 mesi (totale trapianti a 0 mesi) per poi ridursi progressivamente a scalini (in funzione dei vari decessi o interruzioni) e segna con dei PUNTI sulla curva le eventuali interruzioni "anomale".

Queste ultime sono, ad esempio, non morti ma espianti per motivi fisiologici (che comunque per noi fanno sempre parte della categoria interruzioni organo) e tengono anche in considerazione, per ben chiarire, anche gli organi trapiantati di recente.... ovvero quelli che pur essendo funzionanti non possono essere presenti perchè la data odierna riduce la durata dell'organo (ad esempio se è stato trapiantato 3 mesi fa non sarà più presente tra 6 e 12 mesi e così via).

Per qualsiasi ulteriore chiarimento: berardinelli@visionidigitali.it

Mi piace molto la divisione totali, vivi, morti. La sommatoria deve sempre tornare, ovviamente.
Non ho capito il discorso ABCA nelle colonne E F G del suo schema.



Grazie dello sforzo.
mastermind73
Newbie
 
Post: 3
Iscritto il: 27/06/10 01:35

Re: Estrazione di dati da foglio complesso tra due date

Postdi mastermind73 » 27/06/10 19:32

Scusa ma credo di avere problemi col forum. Mi butta fuori, non so se spedisce i messaggi....

Ripeto.... i tipi di dati sono i seguenti:

A B C D E
NOME PAZIENTE; DATA TRAPIANTO ; DATA MORTE o FINE FUNZIONE ORGANO ; ALTRI CAMPI ; ALTRI CAMPI

PINO ; 12/09/1990 ; 12 /12/1990 ; BLA BLA ; BLA BLA
PAOLO ; 24/03/1996 ; 07/08/2003 ; " ; "
GINO ; 23/09/2009 ; (nessuna perchè ancora vivo) ; " ; "
MARIO ; 29/05/2010 ; (nessuna perchè ancora vivo) ; " ; "
LUCA ; 12/06/2010 ; 14/06/2010(vivo ma problemi organo) ; " ; "

Per meglio precisare.
1. Quello che mi interessa è la sopravvivenza dell'organo, non quella del paziente. Quindi se il sig. LUCA è ancora vivo ma l'organo è espiantato viene considerato come 1 fallimento. Quindi quel valore non si considera piu'.

2. i dati da verificare devono rispondere a questo quesito:

L'organo di quanti pazienti è sopravvissuto tra 0 e 3 mesi?
L'organo di quanti pazienti è sopravvissuto tra 3 e 6 mesi?
ecc.

Lo 0 e 3 mesi non è riferito ad oggi, bensì tra la data 0 (ovvero data di trapianto) e la data 3 mesi ovvero la data 3 mesi successiva a quella del trapianto. e così via per tutti i valori. Il riferimento 0 è sempre quello di data inizio trapianto e la data di espianto, morte o cessazione organo in genere è la data da tenere in considerazione per calcolare la durata della sopravvivenza.

Ovviamente da notare è che ..... praticamente TUTTI gli organi saranno sopravvissuti tra 0 e 3 mesi. (quindi 5 nel nostro caso).

E che un organo che sopravvive 3 anni sarà presente tra 0 e 3 mesi, tra 3 e 6 mesi, tra 6 e 12, tra 12 e 24 e tra 24 e 48. Ma non sarà presente tra 48 e 60. E nemmeno tra 60 e oltre.

Un organo che sopravvive 1 anno sarà presente tra 0 e 3 mesi, tra 3 e 6 mesi, tra 6 e 12 mesi, ma non tra 12 e 24 (12 mesi + 1 gg.) e non nei successivi intervalli.

Quindi il valore 0 - 3 mesi conterrà tutti i trapianti fatti.
Da 3 a 6 mesi se ne perderanno alcuni (ovviamente pochi)
Da 6 a 12 mesi se ne perderanno di piu', ecc. ecc.

Da tenere in considerazione anche gli anni bisestili, i mesi non da 30 gg, ecc.

Forse ora sono stato piu' chiaro.

Dal conteggio fatto da lei (o da te) .... risultavano solo 2 totali tra 0 e 3 mesi mentre la base di dati era di 4 quindi dovevano esserci 4 totali.

La curva di sopravvivenza secondo kaplan meyer (di cui ho già un excel) prende in considerazione i dati partendo dal 100% di sopravvivenza a 0 mesi (totale trapianti a 0 mesi) per poi ridursi progressivamente a scalini (in funzione dei vari decessi o interruzioni) e segna con dei PUNTI sulla curva le eventuali interruzioni "anomale".

Queste ultime sono, ad esempio, non morti ma espianti per motivi fisiologici (che comunque per noi fanno sempre parte della categoria interruzioni organo) e tengono anche in considerazione, per ben chiarire, anche gli organi trapiantati di recente.... ovvero quelli che pur essendo funzionanti non possono essere presenti perchè la data odierna riduce la durata dell'organo (ad esempio se è stato trapiantato 3 mesi fa non sarà più presente tra 6 e 12 mesi e così via).

Per qualsiasi ulteriore chiarimento: berardinelli@visionidigitali.it

Mi piace molto la divisione totali, vivi, morti. La sommatoria deve sempre tornare, ovviamente.
Non ho capito il discorso ABCA nelle colonne E F G del suo schema.



Grazie dello sforzo.
mastermind73
Newbie
 
Post: 3
Iscritto il: 27/06/10 01:35

Re: Estrazione di dati da foglio complesso tra due date

Postdi Anthony47 » 27/06/10 23:49

Apprezzo il tentativo di spiegarci il metodo Kaplan–Meier per l' analisi della sopravvivenza, ma forse usciamo dai nostri confini naturali.
Nel modello che ti ha proposto, tutamimetica ha mostrato come si possono usare colonne di appoggio per eseguire i calcoli in modo semplice ed efficace; allo scopo ha usato una tabella sul foglio Parametri con cui, in modo flessibile, si puo' modellare la catalogazione di un fenomeno.

Dalla tua descrizione mi pare pero' che il problema sia ulteriormente semplificabile, in quanto e' sufficiente calcolare in una colonna libera la differenza in mesi tra le date in col B e col C e poi dovrai contare quanti eventi hanno una durata "uguale o superiore a 3 mesi", "uguale o superiore a 6 mesi" etc a tuo piacere.

Per il calcolo della differenza in mesi tra la data in B2 e quella in C2:
Codice: Seleziona tutto
=DATA.DIFF(B2;C2;"m")

Visto che spesso "purtroppo a complicare i calcoli" manca la data di morte, io credo che sia sufficiente usare "Oggi" come data alternativa; quindi la formula in C2 diventa
Codice: Seleziona tutto
=DATA.DIFF(B2;MAX(OGGI();C2);"m")
La formula puo' essere poi copiata nelle celle sottostanti.
Se questo ragionamento non ti quadra allora dovresti spiegare tu la logica con cui trattare queste righe.
Poi per calcolare quanti eventi superano la durata di 3 mesi, se ad esempio i mesi sono calcolati in col H, userai
Codice: Seleziona tutto
=CONTA.SE(H:H;">=3")
Ti lascio immaginare la formula dei 6 mesi, 12 mesi, etc.

Ciao
Avatar utente
Anthony47
Moderatore
 
Post: 19221
Iscritto il: 21/03/06 16:03
Località: Ivrea

Re: Estrazione di dati da foglio complesso tra due date

Postdi Karistotele » 02/07/10 13:01

Se ho ben capito tu vuoi costruire una curva di sopravvivenza tenendo conto come fattore di rischio il trapianto di un organo. Per come hai posto il problema, è difficile che qualcuno arrivi a darti la soluzione adeguata poiché tu conosci l’analisi di Kaplan-Meier ma chi ti risponde pensa solo ad una “differenza date”.

In quest’ottica la risposta di Anthony è formalmente corretta ma lo induci a sbagliare poiché nonostante spieghi che ti interessa la “sopravvivenza” dell’organo e non il decesso, in mancanza di una data in quel campo l’impianto di Anthony è totalmente sbagliato. Oltretutto vorrei che tu spiegassi dove hai inserito la formula di Kaplan. Quanto dura il periodo dell’osservazione, come fai a aver già a priori calcolato sia gli eventi sia i censurati, etc…

Insomma tu hai lo scopo di costruire una curva di sopravvivenza ma mio avviso sbagli l’impostazione del foglio dati, la data di morte non può coincidere , per esempio, con l’espianto dell’organo, dovresti naturalmente avere anche una cella per i censurati (ad esempio il paziente viene trasferito).

In conclusione dicci chiaramente come è strutturata la tabella dati ( a parte i dati clinici) e se nella stessa o il altro foglio hai inserito Kaplan e come l’hai inserito e quali fattori hai considerato. La tua domanda è parziale e fuorviante poiché in questo caso si deve partire dallo scopo (formula di Kaplan) per poi aiutare excel ad aiutarti. Il processo non può essere induttivo ma necessariamente deduttivo.

C’è un grande errore oggettivo di comunicazione e il tuo assordante silenzio lo conferma.
Ripresenta il discorso al contrario … anzi all’opposto.
.K
Avatar utente
Karistotele
Utente Junior
 
Post: 45
Iscritto il: 01/05/10 06:28
Località: PADOVA

Re: Estrazione di dati da foglio complesso tra due date

Postdi Anthony47 » 02/07/10 23:49

Ciao karistotele e benvenuto nel forum.
Se ho ben capito tu vuoi costruire una curva di sopravvivenza tenendo conto come fattore di rischio il trapianto di un organo. . . . . . ma chi ti risponde pensa solo ad una “differenza date”.
Confermo che ho risposto ragionando sulla differenza di date e ignorando totalmente il metodo Kaplan–Meier per l' analisi della sopravvivenza, che e' fuori dei miei confini naturali (non dei tuoi, lo so); d' altra parte su questo, il calcolo della differenza tra date, metteva l' accento il nostro utente.
In quest’ottica la risposta di Anthony è formalmente corretta ma lo induci a sbagliare poiché nonostante spieghi che ti interessa la “sopravvivenza” dell’organo e non il decesso, in mancanza di una data in quel campo l’impianto di Anthony è totalmente sbagliato
Beh, metto sempre in conto di non afferrare completamente il problema, ma in questo caso mi pare che e' una esagerazione decretare che l’impianto sia totalmente sbagliato; comunque condivido che solo "un Santo" poteva dare all' utente la soluzione adeguata...

Peccato che mastermind non si sia fatto piu' sentire, comunque non e' mai troppo tardi.

Ciao.
Avatar utente
Anthony47
Moderatore
 
Post: 19221
Iscritto il: 21/03/06 16:03
Località: Ivrea


Torna a Applicazioni Office Windows


Topic correlati a "Estrazione di dati da foglio complesso tra due date":


Chi c’è in linea

Visitano il forum: Nessuno e 62 ospiti