하둡(Hadoop)이란?하나의 성능 좋은 컴퓨터를 이용하여 데이터를 처리하는 대신 낮은 성능의 컴퓨터 여러 대를 클러스터화 해 큰 크기의 데이터를 클러스터에서 병렬로 동시에 처리하여 처리속도를 높이는 것을 목적으로 한 분산처리 오픈소스 프레임워크Hadoop의 필요성온라인 서비스와 온라인 데이터 처리 기술이 발전하면서 데이터의 양과 종류가 다양해졌다.정형 데이터의 경우 기존에 있던 RDBMS에 저장하면 되지만 웹 로그 등의 비정형 데이터를 RDBMS에 저장하기에는 데이터의 크기도 너무 크고 RDBMS의 복잡하고 상세한 기능이 필요하지도 않았다.또한 RDBMS는 대용량, 고스펙의 장비에 운영하는데, 자주 사용하지 않는 데이터를 무작정 RDBMS를 늘려서 보관하는 것은 비용적인 면에서도 너무 낭비가 심하다. ..