문서 분석기 (1) 썸네일형 리스트형 Hwplib와 꼬꼬마 한글 형태소 분석기를 활용한 문서 분석기 제작 먼저 라이브러리를 만들어주신 hwplib 개발자와 꼬꼬마 한글 형태소 분석 전문가 분들께 감사의 말씀을 드린다. 사내 프로젝트를 진행하다가 많은 산출물을 보거나 만들다 보니 문서 내 데이터를 추출할 수 있는 방법이 없을까 찾아보게 되었다. MS OFFICE에서 제공하는 word, excel, powerpoint 문서를 추출하는 라이브러리는 종종 사용한 적이 있지만 한글문서에 대해서는 라이브러리가 많이 있을까 궁금해서 구글에 검색을 해보았다. 다행히도 어떤 개발자분께서 오랫동안 공들여 작업하신 라이브러리가 존재하여 쉽고 간편하게 이용할 수 있었다. 개발자 분의 이야기에 따르면 한글문서 파일 구조 역시 MS word의 구조와 동일하고, 한글과 컴퓨터에서 파일 형식에 대한 개발자 가이드를 제공하여 참고하여 개.. 이전 1 다음