한국어 형태소 분석기와 한국어 분석 모듈

한국어 형태소 분석기와 한국어 분석 모듈
KLT: Korean Language Technology -- (구)HAM: Hangul Analysis Module


한국어 형태소 분석기 download: 다음카페(http://cafe.daum.net/nlpk) 게시판 "형태소 분석기 KLT2000"(한국어 형태소 분석기)

사용상의 문제점, 궁금한 점은 FAQ -- Frequently Asked Questions를 참조하세요.

형태소 분석기의 기능

  1. "철수가학교에갔다", "국가소비자신용조합행정위원회", "이렇게붙여쓴문장도교정이됩니다"와 같이 띄어쓰기가 잘못된 오류의 교정기능이 매우 뛰어납니다.

  2. 색인어 추출시 문장 중간에 삽입되어 있는 붙여쓰기 오류어의 자동 색인 : 법률이나 규칙에서 관습적으로 붙여쓰기를 하고 있는 법령제목 "국가를당사자로하는계약에관한법률시행령중개정령"과 같이 문장 중간에 띄어쓰기를 하지 않은 어절이 포함된 경우에도 색인어를 추출합니다.

  3. 수사 어절 normalization --> "이백삼십오만원", "이백 삼십 오만원", "2백3십5만원", 235만원" 등 숫자와 한글, 띄어쓰기가 자유로운 숫자 관련 어절을 normal form으로 변환하는 기능이 추가되었습니다. "삼백사십오", "3백 4십 5" 등 수사를 숫자 "345"로 변환 기능

  4. Library interface의 단순화 --> 라이브러리를 응용 프로그램에 통합하는 방법을 매우 단순화시켜 쉽게 응용프로그램에 통합이 가능합니다.

형태소 분석기 및 관련 실행 파일 목록


HAM is an acronym of Hangul Analysis Module(or Model).

Features of HAM: Korean morphological analyzer(한국어 형태소 분석기의 특성)


E-mail: sskang AT kookmin. ac. kr