홈페이지 검색에 필요한 기능을 정의해보자.
1. 기본검색
형태소 분석이냐 n-gram이냐 이것이 문제로다.
우선 n-gram 방식으로 가는것이 좋을듯 하다.
2. 검색어 자동완성 기능
3. 카테고리별 검색기능
4. 결과내 재검색 기능
5. DB 수집기능(JDBC 사용해서 우선 oracle과 mysql에서 작동하도록 개발한다.)
위 5가지 정도만 패키징해서 배포를 해봐야겠다.
개발일정은 올해가 가기전까지. 12월까지 3개월남았는데, 시간은 충분하다고 생각된다.
key-point는 xxx.jar 파일 하나면 있으면 개발할 수 있도록 만들 생각이다.
별도 WAS가 필요없고, 실행만 하면 웹에서 색인을 할 수 있고 그 결과도 같이 확인할 수 있도록 한다.
'IT-Consultant' 카테고리의 다른 글
There are many weakness for using sqlite by search engine (0) | 2011.07.07 |
---|---|
Cisco Social Media Customer Care vs tweetus (0) | 2011.07.05 |
What is Apache Mahout? (0) | 2011.07.05 |
검색엔진에서 Group By는 안되나요? (0) | 2011.07.05 |
트위터의 대용량 서비스 기술을 분석해 본다. (0) | 2011.07.05 |