본문 바로가기

IT-Consultant

Gluster file system의 장 단점

우선 장점부터 이야기한다면 당연히 NameNode가 없기 때문에, 안정적이다.
NameNode가 없는 이유는 메타정보를 모든 노드에서 가지고 있기 때문이다.
그렇다면 Hadoop 보다 무조건 더 좋은 시스템인가? 라는 의문점이 생긴다.

그래서 관련 문서를 찾아보니 아래 글이 있었다.
http://northernmost.org/blog/improving-glusterfs-performance/

문서의 내용을 쭉 보면 여러가지 솔루션을 찾아본것중에 Gluster File System이 가장 좋다는것이다.
나도 이 부분에 대해서는 이견이 없다.

기본적인 셋팅으로 사용한다면 아주 작은 파일들을 사용하는 경우는 GlusterFS는 좋지 않다.
왜냐면 작은 파일 하나에도 큰 버퍼를 할당하기 때문에, 이런 문제로 작은 파일 여러개를 쓸때는 시간이 많이 걸린다.
하지만 큰 파일일 경우에는 좋다.

웹하드로 이 제품을 사용한다면 넌센스다. 웹하드의 경우에는 작은 파일도 있고 큰 파일도 있기 때문이다.
네이버나 다음처럼 서버가 많아서 따로 따로 구성하는것도 문제가 있다.
이 경우에는 어떻게 하는것이 좋을까?

내 생각에는 분산처리 부분만 따로 구현하는 것이 좋을 것 같다.

웹하드의 경우 메타정보를 이미 DB에 저장해서 관리하고 있다.
여기서 메타정보는 파일단위이고, 절대 블럭단위가 아니다.
파일 단위의 메타정보를 저장할때 최소 서버 3대에 분산저장을 한후 클라이언트에서 파일을 요청할때,
실제 파일이 저장된 서버에 링크를 넘겨서 사용자가 직접 그 서버에서 다운로드하게 한다.
이렇게 하면 되는거 아닌가?

특히 웹하드의 경우에는 클러스터링 파일 시스템을 사용할 필요가 없는것 같다.


'IT-Consultant' 카테고리의 다른 글

포인터 테스트 소스  (0) 2011.11.15
Binary Search Tree C로 간단 구현  (0) 2011.11.15
SLE 인터뷰 예상 문제  (0) 2011.11.09
윈도우7, 작업표시줄 아이콘 정리하기!  (0) 2011.11.07
CakePHP 흐름..  (0) 2011.11.03