Skip to content

wonjung-git/Document_classification_system

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

11 Commits
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

행정 문서 등급 분류 시스템

지방행정연구원의 요청으로 진행한 행정 문서 등급 분류 시스템 구현

기능

문서 처리의 소요시간과 중요성을 Only-Encoder transfomer계열 모델을 이용해 분류함.

모델 파일은 용량 제한으로 인해 GitHub 저장소에는 포함하지 않았으며, Release의 설치 파일에 포함되어 제공됩니다.

최신버전: v3.1 다운로드

v3.1 업데이트 내용

1. 파일 업로드 시 문서명 전처리 수정

문서명 전처리 2개중 선택 할 수 있도록

  1. () <> [] 안의 내용만 삭제
  2. 특수문자 모두 삭제

“파일형식 오류창” 수정 [이송]/[반송] 이 포함된 문서는 예측시 제외 할 수 있도록 기능 추가

2.디자인 수정

데이터 분석 중 향후 예측 소요 시간 추가 매뉴얼 제작 설치화면 “문서 등급 분류 프로그램 3.0”으로 변경 첫 화면 “문서 처리 등급 분류 도구” > “문서 등급 분류 프로그램” 왼쪽 위“공공문서 관리 > “업무문서 관리”

3.분석 관련 기능

분석 후 첫 페이지로 돌아갈시 데이터 삭제 안내창 뜨고 돌아가면 전부 초기화 되도록 수정 키워드 방식에서 직위 컬럼을 선택하지 않는 경우 직위 기준 처리를 못하도록 수정 분석결과 저장시 대시보드 결과도 저장되도록 수정

4.기타

키워드/직위 내보내기 단일화 ( 내보내기 선택시 하나의 엑셀파일의 2개의 시트에 각각 내보내짐) 키워드 등급 설정 – 너무 많거나 적은 등급을 설정하지 않도록 고정 (2개~10개)

해당 프로그램은 재배포/추출/2차 사용을 금지합니다.

About

No description, website, or topics provided.

Resources

Stars

Watchers

Forks

Packages

 
 
 

Contributors

Languages