pdftotext
pdftotext
pdftotext는 PDF 파일을 일반 텍스트 파일로 변환, 즉 PDF 캡슐화된 파일에서 텍스트 데이터를 추출하기 위한 오픈 소스 명령행 유틸리티다.그것은 자유롭게 사용 가능하며 많은 Linuxdbackment와 함께 기본적으로 포함되어 있으며, 또한 Xpdf Windows 포트의 일부로서 Windows에서도 사용할 수 있다.이러한 텍스트 추출은 PDF 파일이 페이지 내 원시적 그림 위에 내장되어 있기 때문에 복잡하다. 이는 단어와 단락의 경계가 페이지 내 위치에 따라 유추되어야 한다는 것을 의미한다.
pdftotext는 XPdf 소프트웨어 제품군의 일부다.Xpdf에서 파생된 포플러도 pdftotext의 구현을 포함한다.대부분의 Linux 배포에서 pdftotext는 포플러-유틸리티 패키지의 일부로 포함되어 있다.[1]
참고 항목
참조
- ^ "poppler-utils". linuxappfinder.com. Retrieved 2018-09-14.