빅데이터 분야에는 많은 오프소스가 있습니다.
빅데이터 분석에 사용되는 오픈SW를 간략하게 소개하니, 필요한 소프트웨어는 인터넷에서 찾아서 설치 사용하실 수 있습니다.
단, 각 오픈SW마다 라이센스 정책이 다를수 있으니 확인 후 이용하시기 바랍니다.
분류 | 솔루션명 | OS | 제품소개 |
---|---|---|---|
워크플로우 스케쥴러 | Oozie | Linux32_64 | 하둡의 Workflow 스케줄러 시스템 |
빅데이터 플랫폼 | Apache Sqoop | Linux32_64 | RDBMS와 아파치 하둡간의 대용량 데이터들을 변환 하여 주는 Command-Line Interface 애플리케이션. 데 이터 커넥터와 일치하지 않는 데이터 포맷을 사용할 수 있도록 지원 |
빅데이터 프레임워크 | Apahce Giraph | Linux32_64 | 빅데이터의 그래프 분석 처리 시스템 |
빅데이터 분석 플랫폼 | Pig | Linux32_64 | 데이터-흐름 기반의 스크립트 프로그래밍 언어 |
빅데이터 분석 플랫폼 | R | Win32/64, Linux32/64 | 통계계산 및 시각화를 위한 언어 및 개발환경을 제공 |
빅데이터 관리 | Hue | Linux | 하둡을 위한 Web 인터페이스. 웹브라우저를 통한 시 스템 접근 및 파일 시스템 열람, 사용자 계정 생성 및 관리, 클러스터 모니터링 등 다양한 기능 제공 |
분산파일시스템 | Hadoop | Linux32_64 | 컴퓨터 클러스터를 이용하여 대용량 데이터 셋의 분산 처리를 지원하는 분산 파일 시스템 |
분산파일시스템 | GlusterFS | Linux32_64 | 아마존 AWS(Amazon Web Service)에 사용된 Metadata 서버거 필요없는 스캐일 아웃방식의 NAS인 스토리지 솔루션 |
분산데이타베이스시스템 | Cassandra | Linux32_64 | Ruby, Perl, Python, Scala, Java, PHP, C++, C# 등 다양한 언어를 지원하고 Facebook, Twitter 등에 사용된 분산데이타베이스 시스템 |
분산데이타베이스시스템 | Hbase | Linux32_64 | HDFS에 구현한 분산 컬럼 기반이며 대규모 데이터셋에 실시간으로 랜덤 액세스가 가능한 분산 데이타베이스 시스템 |