데이터베이스 종류
데이터베이스
: 다수의 인원, 시스템 또는 프로그램이 사용할 목적으로 통합하여 관리되는 데이터의 집합
- 정의
: 통합된 데이터 / 저장된 데이터 / 운영 데이터 / 공융 데이터
- 특성
: 실시간 접근성 / 계속적인 변화 / 동시 공용 / 내용 참조
- 종류
: File System / RDBMS(관계형) / HDBMS(계층형) / NDBMS(망형)
DBMS
: 데이터 관리의 복잡성을 해결하는 동시에 데이터 추가, 변경, 검색, 삭제 및 백업, 복구, 보안 등의 기능을 지원하는 소프트웨어
- 유형
: Key-Value Store(키 기반) / Column Family Data Store(키 하나에 여러 개의 필드) / Document Store(데이터 타입이 문서) / Graph(시맨틱 웹과 온톨로지 분야에서 활용)
- 특징
: 데이터 무결성 / 데이터 일관성 / 데이터 회복성 / 데이터 보안성 / 데이터 효율성
빅데이터
: 시스템, 서비스, 조직 등에서 주어진 비용, 시간 내에 처리 가능한 데이터 범위를 넘어서는 수십 페타바이트(PB) 크기의 비정형 데이터
- 특성 (3V)
: 데이터의 양(Volume) / 데이터의 다양성(Variety) / 데이터의 속도(Velocity)
HDFS
: 대용량 데이터의 집합을 처리하는 응용 프로그램에 적합하도록 설계된 하둡 분산 파일 시스템
맵 리듀스
: 구글에서 대용량 데이터 처리를 분산 병렬 컴퓨팅에서 처리하기 위한 목적으로 제작하여 2004년 발표한 소프트웨어 프레임워크
NoSQL
: 전통적인 RDBMS와 다른 DBMS를 지칭하기 위한 용어로 데이터 저장에 고정된 테이블 스키마가 필요하지 않고 조인(Join) 연산을 사용할 수 없으며, 수평적으로 확장이 가능한 DBMS
- 특성
: Basically Available / Soft-State / Eventually Consistency
- 유형
: Key-Value Store / Column Family Data Store / Document Store / Graph
데이터마이닝
: 대규모로 저장된 데이터 안에서 체계적이고 자동적으로 통계적 규칙이나 패턴을 찾아내는 기술
- 주요 기법
: 분류 규칙 / 연관 규칙 / 연속 규칙 / 데이터 군집화
텍스트마이닝
: 대량의 텍스트 데이터로부터 패턴 또는 관계를 추출하여 의미 있는 정보를 찾아내는 기법
웹마이닝
: 웹으로부터 얻어지는 방대한 양의 정보로부터 유용한 정보를 찾아내기 위하여 분석하는 기법