Cosa fa questo strumento
Questo divisore prende un singolo PDF ed estrae esattamente le pagine che chiedi, come nuovi file. Trascina un PDF, scrivi uno o più intervalli (1-3, 5, 7-9), e decidi se ogni intervallo diventa il proprio download o se l'intero lotto si fonde in un singolo output. Non c'è passaggio di upload: il PDF sorgente viene letto in memoria, sezionato con pdf-lib, e i file risultanti sono salvati tramite il flusso di download browser normale. TaskKit non vede mai il file.
Quando usarlo
- Tirare fuori un singolo capitolo o sezione da un lungo libro o report PDF in modo che il destinatario non riceva l'intero tomo.
- Separare una scansione multi-up (un PDF che contiene diversi documenti) in un PDF per documento.
- Ritagliare una fattura o un contratto da un fascicolo combinato di fine mese per archiviazione o inoltro.
- Produrre un handout redacted selezionando solo le pagine safe da condividere.
- Dividere una submission grande per stare sotto il limite di dimensione di upload di un portale che non accetta il tuo PDF completo.
Come funziona
Il campo intervalli accetta voci separate da virgole. Ogni voce è o una singola pagina (5) o un intervallo con trattino (7-9); gli spazi attorno alle virgole e ai trattini sono ignorati. Il parser valida ogni voce contro il numero di pagine sorgente prima che venga costruito qualsiasi output — sintassi non valida o valori fuori range emergono come un singolo errore leggibile invece che un file scritto a metà.
Per ogni intervallo, viene creato un nuovo PDFDocument e le pagine corrispondenti vengono estratte con copyPages, che preserva font embedded, immagini, annotazioni e campi modulo. Il risultato è serializzato con save() e scaricato con un nome generato come source-pages-1-3.pdf o source-page-5.pdf. Poiché Chrome a volte blocca un tab che spara troppi eventi di download in successione, i download sono distanziati di ~150 ms in modo che la coda sia sempre onorata.
Con Combina tutti gli intervalli in un solo PDF attivato, la stessa selezione viene concatenata in un singolo output (source-extracted.pdf). L'ordine segue l'ordine degli intervalli che hai scritto, non l'ordine di pagina originale — quindi 5, 1-3 produce un PDF che inizia con la pagina 5.
Note
I PDF cifrati sono supportati? Parzialmente. I PDF « password di apertura » standard di solito si caricano (pdf-lib è permissivo); i PDF con cifratura del contenuto o DRM possono fallire il parse. Se il file fallisce il caricamento, il pannello mostra un errore e niente viene scritto.
Perché i download sono distanziati? I browser sopprimono euristicamente i tab che emettono molti download sequenziali, trattandoli come comportamento drive-by. Un piccolo gap setTimeout tra ogni a.click() mantiene la raffica sotto la soglia restando istantanea per un umano.
I riferimenti di pagina sono preservati? I link interni che puntano dentro l'intervallo tenuto continuano a funzionare. I link che puntano a una pagina che non ce l'ha fatta diventano ancore morte — pdf-lib non inventa un sostituto. Lo stesso si applica al sommario, che viene rigenerato solo per le pagine sopravvissute.
Posso riordinare le pagine? Sì — l'output segue l'ordine degli intervalli che elenchi. 5, 1-3, 7 produce un output che inizia alla pagina 5, poi 1, 2, 3, e finisce alla pagina 7. È il modo più semplice di usare il divisore come strumento di riordino rapido di pagine quando combinato con il toggle « PDF singolo ».
Strumenti correlati
- Unione PDF — combina PDF nell'altra direzione
- PDF in immagini — quando vuoi PNG/JPEG invece di PDF
- Generatore di hash — fai l'impronta degli output prima di inoltrarli