1. 형태소 분석 방향
좌우 분석법, 우좌 분석법, 양방향 분석법, 역방향 분석법
2. 형태소 인식 방법
최장일치법, 최단일치법, Tabular Parsing(CKY)방법
3. 형태소 분리 방법
Heal-Tail 구분법, 음절 단위 분석법
4. 형태소 결합조건 기술
접속정보표를 이용, 결합제약 규칙에 의한 방법
5. 불규칙 어절의 원형 복원법
Two-level 형태론, 음절 기반 형태론
-- 장,단점 --
1. Head-Tail 구분법
가장 간단하면서도 비교적 높은 품질이 나올 수 있다.
2. 어절 네트웍크를 이용한 분석기
품사체계 변경, 규칙의 확장 등이 곤란하기 떄문에 내가 사용하기엔 좀 문제가 있다.
3. Tabular Parsing 법
단어의 모든 문자열에 대하여 사전 탐색을 해야하기 때문에 속도가 느리다.
4. 최장(최단)일치법
우선 순위가 높은 형태소를 먼저 검사, 모든 결과를 출력하지 않는 것으로 철자 검사와 같이 분석/성공 실패의 여부 판단이 필요한 특정 분야에서 처리 속도를 높일 수 있음
-- 이중에 한가지를 선택한다면 --
Head-Tail 구분법이 가장 마음에 든다. 우선 구현이 간단하고 속도 또한 느리지는 않다. 대신에 사전탐색횟수가 많으나 버클이 DB를 메모리에 올려 놓도록 셋팅하면 속도가 많이 좋아질 것이다.