[DB] 10. DB 관련 신기술
2024. 4. 21. 18:18ㆍcs및 소프트스킬/데이터베이스
728x90
반응형
SMALL
1. 하둡(Hadoop)
- 오픈 소스 기반으로 한 분산 컴퓨팅 플랫폼
- 개발자 : 더그 커팅, 마이크 캐퍼렐라
- 구글의 맵리듀스(MapReduce) 엔진 사용
- 일반 PC급 컴퓨터들로 가상화된 대형 스토리지 형성
- 대형 스토리지 안에 보관된 거대한 데이터 세트를 병렬로 처리 할 수 있도록 한 Java 기반 S/W Framework
2. 맵리듀스(MapReduce)
- 대용량 데이터를 분산 처리하기 위한 목적으로 개발된 프로그래밍 모델
- 흩어져 있는 데이터를 연관성 있는 데이터 분류로 묶는 Map 작업 수행
- 이후, 중복 데이터를 제거하고 원하는 데이터를 추출하는 Reduce 작업을 수행
3. 데이터 마이닝(Data Mining)
- 대량의 데이터를 분석하여 데이터에 내재된 변수 사이의 상호관계를 규명하여 일정한 패턴을 찾아내는 기법
4. 타조(Tajo)
- 오픈 소스 기반 분산 컴퓨팅 플랫폼
- 아파치 하둡 기반의 분산 데이터 웨어하우스 프로젝트
5. OLAP(Online Analytical Processing)
- 다차원으로 이뤄진 데이터로부터 통계적인 요약 정보를 분석하여 의사결정에 활용하는 방식
- OLAP 연산
- Roll-up
- Drill-down
- Drill-through
- Drillacross
- Pivoting
- Slicing
- Dicing
6. 브로드 데이터(Broad Data)
- 다양한 채널에서 소비스와 상호 작용을 통해 생성된 것
- 기업 마케팅에 있어 효율적이고 다양한 데이터
- 이전에 사용하지 않거나 알지 못했던 새로운 데이터나 기존 데이터에 새로운 가치가 더해진 데이터
728x90
반응형
LIST
'cs및 소프트스킬 > 데이터베이스' 카테고리의 다른 글
[DB] 11. 트랜잭션 관련, DB 복구 기법, 병행제어 (0) | 2024.04.21 |
---|---|
[DB] 9. DDL / DML / DCL 의 개요 및 트리거(Trigger) 란? (0) | 2024.02.17 |
[DB] 8. 트랜잭션, 시스템카탈로그, CRUD 분석, 인덱스, 뷰 (0) | 2024.02.17 |
[DB} 7. 정규화, 반정규화 (0) | 2024.02.17 |
[DB] 6. 이상과 함수적 종속 (0) | 2024.02.14 |