국내서 판매되고 있는 분류기의 대부분 기능을 Mahout에서 가지고 있네요.
게다가 분산처리까지 되니, 정말 괜잖네요. 한글 부분만 손을 보면 바로 판매를 해도 문제가 없을 것 같네요.
하지만... 역시 분류 품질은 안무리 좋은 엔진을 도입해도 거기서 거기 일듯.. 이왕이면 오픈소스를 도입해서 제품 도입비용으로 커스터마이징을 확실하게 하는게 좋을 듯 하네요.
Mahout currently has
- Collaborative Filtering
- User and Item based recommenders
- K-Means, Fuzzy K-Means clustering
- Mean Shift clustering
- Dirichlet process clustering
- Latent Dirichlet Allocation
- Singular value decomposition
- Parallel Frequent Pattern mining
- Complementary Naive Bayes classifier
- Random forest decision tree based classifier
- High performance java collections (previously colt collections)
- A vibrant community
- and many more cool stuff to come by this summer thanks to Google summer of code
'IT-Consultant' 카테고리의 다른 글
Cisco Social Media Customer Care vs tweetus (0) | 2011.07.05 |
홈페이지 검색에 맞게 루씬을 패키징해보자. (0) | 2011.07.05 |
검색엔진에서 Group By는 안되나요? (0) | 2011.07.05 |
트위터의 대용량 서비스 기술을 분석해 본다. (0) | 2011.07.05 |
검색엔진에서 인기검색어의 비밀 (0) | 2011.07.05 |