한국EMC가 스케일아웃(Scale-out) NAS 제품인 ‘EMC 아이실론’과 빅데이터 분석 솔루션 ‘EMC 그린플럼’을 내세워 빅데이터 시장 선점에 나섰다.

아이실론과 그린플럼은 EMC가 빅데이터와 클라우드로 대변되는 최근의 IT트랜드에 부응하기 위해 지난 2010년 각각 기업인수를 통해 확보한 스토리지장비와 빅데이터 분석 솔루션이다.

■ 스케일아웃 NAS–EMC 아이실론(Isilon)

▲ EMC 아이실론 S200 제품.

우선 아이실론은 데이터 저장이 아닌 관리를 위한 간편한 솔루션을 제공한다. ‘Simple is Smart’라는 슬로건을 내세우고 있는 EMC 아이실론의 솔루션은 규모에 관계없이 간편하게 설치, 관리 및 확장이 가능하며 추가되는 스토리지의 수, 요구되는 성능 수준 또는 향후 비즈니스 요구 사항에 관계없이 탁월한 사용 편의성을 보장한다.

EMC 아이실론 스토리지는 모듈 방식의 구조와 자동화된 기능으로 대량의 데이터를 빠르고 쉽게 처리할 수 있으며, 용량과 성능을 유연하게 확장할 수 있어, 전체 컴퓨팅 구조를 단순화하고 효율적으로 구성할 수 있다.

EMC 아이실론은 지난 2월에 하둡분산파일시스템(Hadoop Distributed File System, 이하 HDFS)과 통합된 제품으로 선을 보이기도 했다. ‘EMC 아이실론 스케일아웃 NAS(EMC Isilion scale-out NAS)’로 명명된 이 제품은 하둡 지원이 가능한 EMC 그린플럼 HD(EMC Greenplum HD)와 결합되어 기존 오픈소스 기반의 하둡 대비, 성능과 효율성이 뛰어나고 유연한 데이터 스토리지 및 분석 지원 환경을 구현할 수 있다.

또한 EMC라는 단일 벤더로부터 서비스, 교육, 자격증을 포함한 고객지원을 받을 수 있기 때문에 향후에도 지속적인 개발과 지원이 보장된다는 장점이 있다. 특히 하둡 사용자들은 HDFS와 통합된 EMC 아이실론 스케일아웃 NAS를 통해 공유된 스토리지 인프라에 접근할 수 있다.

이에 앞서 한국EMC는 지난해 5월 EMC 아이실론 스케일아웃 NAS 하드웨어 및 소프트웨어 플랫폼을 선보인 바 있다.

▲ EMC 아이실론 X200 제품.
고객들은 아이실론의 새로운 하드웨어 플랫폼을 통해 SAS(Serial Attached SCSI) + SSD, 혹은 SATA(Serial ATA) 드라이브 + SSD와 같이 드라이브 구성을 각자의 환경에 맞춰 선택할 수 있게 됐다. 뿐만 아니라 각각의 드라이브를 하나의 거대한 캐시(cache) 및 차세대 쿼드 코어 프로세스(quad core processors)와 결합시켜 최고 수준의 가격 대비 성능을 구현할 수 있게 됐다.

아이실론 스케일아웃 NAS 하드웨어 제품은 빅데이터 애플리케이션의 성능을 가속화하는 데 최적화된 ‘아이실론 S200’과 ‘아이실론 X200’으로 나뉜다.

140만 NFS ops와 85 GBps 처리 속도를 지원하는 아이실론 S200은 설계, 시뮬레이션, 디지털 미디어, 재정 분석 및 고성능 컴퓨팅 업무 관련, 빅데이터 접근을 가속화하는 최적의 솔루션이다. 10 기가바이트 이더넷 (Gigabit Ethernet, GigE), 프론트 엔드 네트워킹(front-end networking), 13.8 테라바이트 캐시, STEC SSD, 히타치 SAS 드라이브, 그리고 인텔 제온 5600 쿼드 코어 프로세서의 결합으로 빅데이터 처리에 있어 최고의 가격 대비 성능을 제공한다.

30 GBps 이상의 처리 속도를 지원하는 아이실론 X200은 클라우드 컴퓨팅, 생명 과학, 인터넷 서비스 및 대규모의 가상화 환경 내에서 빅데이터 업무를 처리할 때, 처리량과 용량 간의 균형을 맞춰 비용효율성을 크게 향상시킨다. 각 기업 고유의 환경 및 요구조건에 맞춰 다양하게 구성할 수 있는 아이실론 X200은 기업비 감축과 더불어 투자수익률을 극대화한다.

소프트웨어 신제품으로는 OneFS와 SyncIQ의 최신 버전인 OneFS 6.5와 SyncIQ 3.0이 새롭게 선보였다. 이 두 제품을 통해 빅데이터를 간편하게 관리할 수 있으며, S200과 X200의 하드웨어 성능을 최대화할 수 있다.

■ 빅데이터 분석–EMC 그린플럼(GreenPlum)

▲ EMC 그린플럼 제품.
EMC 그린플럼은 대규모 데이터 클라우드와 데이터 분석 서비스의 핵심이 되는 데이터 웨어하우징(Data Warehousing) 기술을 기반으로 한다. 그린플럼은 현재 EMC 정보 인프라스트럭처 사업부 산하 데이터 컴퓨팅 제품(Data computing Product) 사업부로 통합돼 다양한 솔루션을 출시하는 등 빅데이터 시장 선점을 위해 박차를 가하고 있다.

더 나아가, EMC는 비정형 데이터의 분석 수요 확산에 따른 발 빠른 대응을 위해 EMC 자체의 하둡 배포판을 출시했으며, 전통적인 정형 데이터와 비정형 데이터를 통합해 지원하는 통합 분석 플랫폼(Unified Analytics Platform)을 출시함으로써 변화하는 시장의 수요에 가장 적극적으로 대응하고 있다.

이와 관련, EMC는 지난해 9월 단일 인프라스트럭처 내에서 정형ㆍ비정형 데이터 및 애플리케이션이 통합된 빅데이터 분석 플랫폼 ‘EMC 그린플럼 모듈식 데이터 컴퓨팅 어플라이언스(EMC Greenplum Modular Data Computing Appliance, 이하 그린플럼 DCA)’를 출시했다.

그린플럼 DCA의 가장 큰 특징은 한 차원 높은 모듈식 아키텍처로, 기업들이 무공유(Shared-nothing) MPP 기반 관계형 데이터베이스와 엔터프라이즈급의 아파치 하둡(Apache Hadoop)을 결합시킬 수 있도록 했다. 이를 통해 정형 데이터와 비정형 데이터의 상호 연계 처리 (co-processing)가 가능해졌으며 정형ㆍ비정형 데이터를 단일의 통합 플랫폼에서 필요에 따라 확장할 수 있게 됐다.

DCA 모듈은 기업의 기존 스케일링 방식을 완전히 바꿔놓았다. 처음에는 작은 규모로 시작해, 보다 유연하고 비용 효율적인 방법으로 쿼터랙(quarter-rack) 단위로 증가시킴으로써 처리 성능 및 스토리지 요구량에 따라 어플라이언스를 늘리는 것이 가능해 진 것.

또한 그린플럼 데이터베이스와 그린플럼 HD(하둡) 모듈을 필요에 따라 상호 연계 처리해 사용할 수 있으며, 그린플럼 데이터 통합 가속기(Greenplum Data Integration Accelerator, 이하 DIA) 모듈을 통해 모든 BI(Business Intelligence) 애플리케이션과 ELT(Extracting, Loading, Transforming) 툴을 같은 DCA 내에 있는 클러스터로 바로 이동시킬 수 있다.

그린플럼 데이터 컴퓨팅 어플라이언스는 △그린플럼 데이터베이스 모듈 △그린플럼 데이터베이스 고용량 모듈 △그린플럼 HD 모듈 △그린플럼 데이터 통합 가속기 모듈 등 네가지 모듈로 구성된다.

기업들은 단일의 기본 랙에서 시작할 수 있다. 기본 랙에는 2개의 마스터 서버 뿐만 아니라 단일 표준 혹은 고용량 그린플럼 데이터베이스 쿼터랙 모듈, 다른 3가지 모듈을 위한 공간이 포함돼 있다. 기업들은 그린플럼 데이터베이스, 그린플럼 HD 혹은 그린플럼 DIA 모듈을 사용해 쿼터랙(4분의 1랙)을 증가시켜 어플라이언스를 확장시킬 수 있다.

저작권자 © 디지털투데이 (DigitalToday) 무단전재 및 재배포 금지