Scarica Eurs validator

E’ possibile scaricare gratuitamente il validatore eCTD richiesto da EMA e da molte altre agenzie Europee.

(Compila la form di Extedo)

Knowledge Materiali introduttivi Documenti Text Searchable (OCR)
Documenti Text Searchable (OCR)

La carta o l’equivalente scansione digitale rappresenta ancora una componente importante della documentazione da usare nella sottomissione dei dossier.
Seppure le diverse agenzie evidenzino chiaramente la preferenza per i documenti pdf di tipo testo nelle loro guideline/specifiche, spesso è necessario utilizzare documenti disponibili solo in forma cartacea.

In questo caso la richiesta delle agenzie è quella di rendere il documento “searchable” attraverso l’uso del Optical Character Recognition (OCR).

Come esempi delle diverse guideline relative a submission elettroniche (per cui non valide solo per le submission in formato eCTD) si riportano:
Guidance for Industry on Providing Regulatory Information in Electronic Format: Non-eCTD electronic Submissions (NeeS) Version 1.4 - January 2008 (in particolare vedere ANNEX 1)

Special Mail 5: Frequently Asked Questions (version 2) – 21 December 2007. In particolare vedere Annex D - Guidance on Text Searchable Documents for MHRA Submissions.

Riconoscere il testo mediante OCR non è un’operazione complessa usando le apposite funzionalità di Adobe Acrobat Standard o Professional.

Si tratta comunque di un’operazione piuttosto pesante che, nel caso di file di grandi dimensioni (per esempio qualche report clinico di qualche migliaio di pagine), può bloccare il proprio PC (o renderlo scarsamente utilizzabile) per un periodo piuttosto lungo.

Per questo motivo, l’ideale è impostare il proprio scanner in modo che l'OCR venga effettuato durante la scansione del documento ed archiviare il documento solo dopo avere verificato che sia ricercabile.

Nel caso poi si debba fare OCR di un elevato numero di documenti scansionati già esistenti, può essere utile eseguire un programma che in sequenza effettui l’OCR di questi documenti in modalità "unattended" (tipicamente a fine giornata). A tal proposito Adobe Acrobat mette a disposizione una funzionalità chiamata “Elaborazione batch” o “Sequenze Batch” che serve esattamente a questo tipo di esigenza.

Prossimamente pubblicheremo il dettaglio di come realizzare una sequenza batch con Acrobat per realizzare l'OCR di più documenti.
 

Per approfondire

eCTD: la qualità del dossier (2)

In passato abbiamo dato qualche spunto su alcuni aspetti relativi alla qualità del dossier in un articolo specifico. Come avevamo previsto, le agenzie iniziano a richiedere un sempre maggiore rispetto delle specifiche.

Ad esempio l'agenzia Svedese prima di caricare i dossier eCTD utilizza l'EURS Validator, validatore richiesto da EMEA per controllare in automatico gli eCTD EU Validation Criteria 2.1 (ben 45 controlli su ogni file). Questi check di validazione verificano, fra l'altro, la versione dei file pdf e la presenza di link "rotti", indicandoli come problemi di priority B (non bloccanti). L'agenzia Svedese però considera la versione pdf diversa da 1.4 come un errore di priority A e conseguente il rifiuto della submission.

Leggi tutto...

Articoli correlati