Home Hardware Networking Programmazione Software Domanda Sistemi
Conoscenza Informatica >> software >> Portable Document Format >> .

Come estrarre il testo da un documento PDF

Può essere molto frustrante per cercare di estrarre il testo da un file PDF per l'uso in un'altra applicazione . Non è raro per la grafica per ottenere nel modo o per il layout del documento per rendere difficile per il test da trasferire in frasi significative . Anche se non è impossibile estrarre il testo con un approccio di copia - e -incolla , può richiedere molto tempo e non consente per il testo del file PDF da esportare in un formato diverso. Ci sono , tuttavia, alcuni modi per estrarre il testo da un file PDF. Cose che ti serviranno
file PDF
Adobe Acrobat Reader
account Gmail ( opzionale ) per PDF al software di conversione di testo ( opzionale ) economici Show More Istruzioni
estratto testo utilizzando Acrobat Reader
1

Aprire il file in Acrobat Reader . In Windows , selezionare " File - > Esporta documento di testo ," nome del documento e salvarlo
2

Copia il testo su un Mac o Linux OS accedendo al menu Visualizza e scegliendo " . continuo " o" continuo di marcia. " ( Il primo vi fornirà il testo di una colonna , mentre la seconda sarà formattare il testo come pagine di side -by-side . ) Vai su " Modifica - > Seleziona tutto " e poi " Modifica - > Copia. "
3

Utilizzare lo strumento di selezione se si desidera estrarre solo una parte del testo . Fare clic sul pulsante " Selezione testo " strumento e scegliere le informazioni che desiderate . In un documento formattato in più colonne , è necessario utilizzare la " colonna Seleziona " strumento prima . Vai su " Modifica - . > Copia"
Conversione da PDF a HTML
4

utilizzare Gmail come scorciatoia . Allegare il file PDF in una e-mail e inviarlo al tuo account Gmail . Quando si apre l'e-mail si vedrà una serie di opzioni accanto all'allegato . Scegliere " Visualizza come HTML" e salvare il file che si apre in una finestra separata . Anche se non sarà in grado di visualizzare qualsiasi grafica , il file HTML si mantiene la formattazione del testo del documento .
5

estrarre e convertire i file sulla riga di comando . Gli utenti Linux possono usare un comando di conversione di base che cambierà un file pdf in un file txt : . ». Pdftotext filename.pdf . " Assicurarsi di sostituire il nome del file con il nome del file PDF .
6

Scarica un PDF in programma di conversione del testo . Ci sono una serie di programmi open source e freeware disponibili come PDFBox e Easy PDF to Text Converter ( vedi Risorse) . Molti di questi programmi può anche convertire i file PDF in HTML.

 

software © www.354353.com