지방행정연구원의 요청으로 진행한 행정 문서 등급 분류 시스템 구현
문서 처리의 소요시간과 중요성을 Only-Encoder transfomer계열 모델을 이용해 분류함.
모델 파일은 용량 제한으로 인해 GitHub 저장소에는 포함하지 않았으며, Release의 설치 파일에 포함되어 제공됩니다.
최신버전: v3.1 다운로드
문서명 전처리 2개중 선택 할 수 있도록
- () <> [] 안의 내용만 삭제
- 특수문자 모두 삭제
“파일형식 오류창” 수정 [이송]/[반송] 이 포함된 문서는 예측시 제외 할 수 있도록 기능 추가
데이터 분석 중 향후 예측 소요 시간 추가 매뉴얼 제작 설치화면 “문서 등급 분류 프로그램 3.0”으로 변경 첫 화면 “문서 처리 등급 분류 도구” > “문서 등급 분류 프로그램” 왼쪽 위“공공문서 관리 > “업무문서 관리”
분석 후 첫 페이지로 돌아갈시 데이터 삭제 안내창 뜨고 돌아가면 전부 초기화 되도록 수정 키워드 방식에서 직위 컬럼을 선택하지 않는 경우 직위 기준 처리를 못하도록 수정 분석결과 저장시 대시보드 결과도 저장되도록 수정
키워드/직위 내보내기 단일화 ( 내보내기 선택시 하나의 엑셀파일의 2개의 시트에 각각 내보내짐) 키워드 등급 설정 – 너무 많거나 적은 등급을 설정하지 않도록 고정 (2개~10개)