jjh0119 님의 블로그

  • 홈
  • 태그
  • 방명록

hadoop 1

Hadoop 개요

하둡(Hadoop)이란?하나의 성능 좋은 컴퓨터를 이용하여 데이터를 처리하는 대신 낮은 성능의 컴퓨터 여러 대를 클러스터화 해 큰 크기의 데이터를 클러스터에서 병렬로 동시에 처리하여 처리속도를 높이는 것을 목적으로 한 분산처리 오픈소스 프레임워크Hadoop의 필요성온라인 서비스와 온라인 데이터 처리 기술이 발전하면서 데이터의 양과 종류가 다양해졌다.정형 데이터의 경우 기존에 있던 RDBMS에 저장하면 되지만 웹 로그 등의 비정형 데이터를 RDBMS에 저장하기에는 데이터의 크기도 너무 크고 RDBMS의 복잡하고 상세한 기능이 필요하지도 않았다.또한 RDBMS는 대용량, 고스펙의 장비에 운영하는데, 자주 사용하지 않는 데이터를 무작정 RDBMS를 늘려서 보관하는 것은 비용적인 면에서도 너무 낭비가 심하다. ..

Develop/Data Engineering 2025.03.23
이전
1
다음
더보기
프로필사진

jjh0119 님의 블로그

jjh0119 님의 블로그 입니다.

  • 분류 전체보기 (69) N
    • CS (28)
      • 소프트웨어 공학 (1)
      • 운영체제 (0)
      • 데이터베이스 (0)
      • 정보처리산업기사 (27)
    • Develop (29) N
      • Java & Spring (22)
      • Python (0)
      • JavaScript (0)
      • Data Engineering (5) N
      • CMS (2)
      • Mendix (0)
    • Algorithm (10)
      • Algorithm 개념 (0)
      • Problem solving (10)

Tag

애플리케이션 설계, CMS, 오답노트, 객체지향 설계, 인터넷과 ip 주소 체계, MSA, 게시판 프로젝트, sw 기초 기술 활용, 언어의 특성 활용, 소프트웨어 아키텍처, 프로그래밍 언어의 개요, java, spring boot, 네트워크 기초 활용, 애플리케이션 테스트 및 배포, 운영체제 기초 활용, 공통 모듈 설계, 백준, 애플리케이션 테스트 수행, 프로그래밍 언어 활용,

최근글과 인기글

  • 최근글
  • 인기글

최근댓글

공지사항

  • 티스토리 이전

페이스북 트위터 플러그인

  • Facebook
  • Twitter

Archives

Calendar

«   2025/07   »
일 월 화 수 목 금 토
1 2 3 4 5
6 7 8 9 10 11 12
13 14 15 16 17 18 19
20 21 22 23 24 25 26
27 28 29 30 31

방문자수Total

  • Today :
  • Yesterday :

Copyright © Kakao Corp. All rights reserved.

티스토리툴바