[DB] 10. DB 관련 신기술
1. 하둡(Hadoop) - 오픈 소스 기반으로 한 분산 컴퓨팅 플랫폼 - 개발자 : 더그 커팅, 마이크 캐퍼렐라 - 구글의 맵리듀스(MapReduce) 엔진 사용 - 일반 PC급 컴퓨터들로 가상화된 대형 스토리지 형성 - 대형 스토리지 안에 보관된 거대한 데이터 세트를 병렬로 처리 할 수 있도록 한 Java 기반 S/W Framework 2. 맵리듀스(MapReduce) - 대용량 데이터를 분산 처리하기 위한 목적으로 개발된 프로그래밍 모델 - 흩어져 있는 데이터를 연관성 있는 데이터 분류로 묶는 Map 작업 수행 - 이후, 중복 데이터를 제거하고 원하는 데이터를 추출하는 Reduce 작업을 수행 3. 데이터 마이닝(Data Mining) - 대량의 데이터를 분석하여 데이터에 내재된 변수 사이의 상호관..
2024.04.21