컴퓨터/c#

C#으로 PDF 제어하기 3 (PDF에서 내용 찾기)

k1asd1 2021. 5. 21. 12:01
728x90
반응형

PDF를 불러온 상태에서 원하는 글자를 찾는 방법입니다.


* 2021.04.23 - [컴퓨터/c#] - C#으로 PDF 제어하기 (PDF 불러와서 원하는 페이지 저장)

https://k1asd1.tistory.com/25

 

* 2021.05.21 - [컴퓨터/c#] - C#으로 PDF 제어하기 2 (PDF Merge, PDF 병합, PDF 합치기)

https://k1asd1.tistory.com/31


* 예제

PDDocument doc = null;

 

//PDF 경로 지정

doc = PDDocument.load("c:\test.pdf");

 

PDFTextStripper strip = new PDFTextStripper();

 

//페이지 지정 (다양한 범위로 사용 가능)
strip.setStartPage(1);
strip.setEndPage(2);

 

//지정된 PDF의 내용 가져오기 (지정된 페이지의 텍스트 전체 가져오기)

string contents = strip.getText(doc);

string findText = "글자"

 

//찾고자 하는 내용이 있는지 확인

if (contents.Contains(findText))

{

    .......

    // 사용자 코드

}


이 예제 역시 간단하게 구성되어 있습니다. 불러올 PDF 경로 지정하고 검색할 페이지 지정하고 원하는 문자가 있는지 비교하는 방식입니다. 다만 일본어, 중국어가 포함된 문자를 찾을 경우 따로 처리 후 작업하셔야 합니다.

 

PDF 제어하기를 응용하여 PDF에서 원하는 글자를 찾고 있으면 그 페이지를 다른 이름으로 저장하고 등등 응용이 가능할 것입니다.

 

이상입니다.

728x90
반응형