본문 바로가기

IT-Consultant

What is Apache Mahout?

국내서 판매되고 있는 분류기의 대부분 기능을 Mahout에서 가지고 있네요. 
게다가 분산처리까지 되니, 정말 괜잖네요. 한글 부분만 손을 보면 바로 판매를 해도 문제가 없을 것 같네요.

하지만... 역시 분류 품질은 안무리 좋은 엔진을 도입해도 거기서 거기 일듯.. 이왕이면 오픈소스를 도입해서 제품 도입비용으로 커스터마이징을 확실하게 하는게 좋을 듯 하네요.

 

Mahout currently has

  • Collaborative Filtering
  • User and Item based recommenders
  • K-Means, Fuzzy K-Means clustering
  • Mean Shift clustering
  • Dirichlet process clustering
  • Latent Dirichlet Allocation
  • Singular value decomposition
  • Parallel Frequent Pattern mining
  • Complementary Naive Bayes classifier
  • Random forest decision tree based classifier
  • High performance java collections (previously colt collections)
  • A vibrant community
  • and many more cool stuff to come by this summer thanks to Google summer of code