본문 바로가기
컴퓨터 & IT (Computer & IT)/Beowulf Cluster (Diskless Cluster)

[Beowulf Cluster] Beowulf Cluster란?

by Physics 2020. 4. 10.
728x90

1. Beowulf Cluster란? 

1994년 NASA에서 기존의 Cray 슈퍼컴퓨터를 대신할 계산 컴퓨터를 자체적으로 개발하기로 하였다. 이때, 기존 컴퓨터와 라이브러리를 최대한 활용하는 방향으로 제작한 16노드 병렬 클러스터가 최초의 Beowulf cluster이다. 좁은 의미로써 Diskless cluster를 Beowulf cluster라고 부르기도 한다. 

2. Beowulf Cluster의 특징 

1) 계산 노드는 노드의 프로세스와 메모리만을 사용 
   • 디스크 및 VGA 등 기타 장비들을 갖출 필요가 없음 
2) 계산 노드에 하드디스크를 두지 않고 서버에만 둔다. (NFS를 통해서 마스터서버의 하드 인식)
   • 클라이언트를 추가 및 제거하기 쉽다
3) 오픈소스 기반으로 리눅스 환경에서 쉽게 클러스터를 구축 가능 
4) 한 대 또는 소수의 메인급 서버 컴퓨터가 수적으로 많은 노드들을 부팅한다. 
   • 연산과 관련된 병렬화된 작업을 하위 노드 프로세스에 배포 
   • 하위 노드들에 배포한 결과들을 서버의 메인 프로세스상에서 관리하며 전체적으로 동기화함 
5) Beowulf cluster는 기성제품들을 집합적으로 연결하는 형태이다. 
   • 단일 슈퍼 컴퓨터에 비해 상대적으로 추가적인 업그레이드 및 다 기종 간의 하이브리드 설계가 효과적

3. Beowulf Cluster의 장단점 

장점 a. 비용의 절감효과 
   • 슈퍼컴퓨터 및 워크스테이션에 비해서 상대적으로 값싼 하드웨어 제품을 사용하므로 비용이 절감
   • 계산 노드에서 하드디스크, VGA, 키보드 등의 장치가 제외되므로 비용이 절감
b. 관리의 용이성 
   • 모든 노드에 OS 및 응용 프로그램을 설치할 필요가 없으므로 제작할 때 시간이 단축된다
   • 계산 노드에 별도의 OS를 설치할 필요가 없음
   • 초기에 Cluster를 구성하기만 하면, 계산 노드의 증설 및 교체 절차가 매우 간편함
   • 클러스터를 마스터 서버를 통해서만 관리하므로 클러스터 관리가 용이함
c. 쉽게 제작 가능함
   • 슈퍼 컴퓨터에 비해 상대적으로 쉽게 하드웨어 및 프로그램을 쉽게 구할 수 있으므로, 사용자 스스로 클러스터 구축이 가능함
단점 a. 증가된 네트워크 트래픽으로 인한 불안정성
   베오울프 클러스터는 계산 노드들의 응용프로그램 및 사용자 파일 등 모든 입출력이 네트워크를 통해서 이루어진다.
   이때 병렬프로그램의 메시지 전달과 NFS 부하가 더해지게 되므로 베오울프 클러스터는 네트워크 성능에 크게 영향을 받는다.
b. 시스템 불안정성
   마스터 서버와의 연결이 끊김 시, NFS를 통해 마스터 노드로부터 “/” 파일 시스템을 호출하지 못하므로 운영체제의
   측면에서 COW보다 안정성이 떨어짐 
   (즉, 관리서버에서 문제가 발생할 시, 클러스터 전체가 마비되는 안정성 문제를 지님)
   ※ COW (Cluster of Workstation): 완전한 하나의 컴퓨터들을 이용하여 클러스터를 제작

 

4. Beowulf Cluster를 만들기 위한 필수 조건

마스터 서버 • 계산 노드들이 부팅에 사용할 부트로더 이미지를 제공해야 함
• 마스터 노드에는 다음과 같은 서버(혹은 프로그램)이 필요하다: DHCP, TFTP, NFS
  1) DHCP: DHCP를 통해서 마스터 서버는 각 계산 노드들에게 사설 ip를 할당
  2) TFTP: 계산 노드들이 사용할 부트로더 파일을 TFTP로 전송함
  3) NFS: 하드디스크가 없는 계산 노드들이 마스터 노드의 디렉토리를 마운트하여 자신의 디렉토리로 사용할 수 있는 기능
• 내부망과 외부망에 연결할 수 있는 두 개의 네트워크 카드가 필요함
 
계산 노드 • PXE 부팅이 가능한 메인보드이여야 함
  (2005년 이후의 대부분 메인보드는 PXE 기능이 설치되어있음)

 

728x90

댓글