-
Adsp - 데이터의 정의, 데이터의 유형, 암묵지와 형식지, DIKW, 데이터베이스, DBMS, 스키마와 인스턴스S T U D Y/DataBase 2023. 1. 14. 13:50728x90반응형
데이터의 정의
두 개의 특성이 동시에 존재
- 존재적 특성 : 객관적 사실
- 당위적 특성 : 추론, 예측, 전망, 추정을 위한 근거로 기능출제포인트
존재적, 당위적 특성이 출제 포인트
데이터는 존재적 특성. 즉, 객관적 사실과 당위적 특성. 즉, 추론, 예측, 전망 등을 위한 근거가 상호작용할 때 데이터의 가치를 느낀다고 할 수 있음.
"객관적 사실로서 개별 데이터는 중요하지 않음을 의미한다." => 정답
"객관적 사실로서 개별 데이터는 중요하다" => 오답데이터의 유형
- 정성적 데이터 :
1) 언어, 문자 등 형태와 형식이 정해져 있지 않음.
2) 비정형 데이터 형태로 저장, 분석에 시간과 비용이 필요함
3) 숫자나 금액으로 환산 할 수 없음
(예시) 설문조사 주관식 응답, 트위터, 페이스북 등이 해당.출제포인트
주관식 설문조사가 정성적 데이터는 맞지만 모든 설문조사가 정성적 데이터는 아님
- 정량적 데이터 :
1) 수치, 기호, 도형으로 표시
2) 데이터 양이 증가하더라도 저장, 분석 용이
3) 숫자나 금액으로 환산 가능한 것(계량 가능한 것)
(예시) 온도, 풍속, 강수량 등 해당출제포인트
정량적, 정성적 데이터의 사례가 중요함
정량적 데이터는 계량 가능한 것들암묵지와 형식지
데이터는 암묵지와 형식지의 상호작용에 있어 중요한 역할을 하고있음.
- 암묵지 :
1) 학습, 체험을 통해 개인에게 습득되어 있음. 그러나 겉으로 드러나지 않는 상태의 지식. 쉽게 말해 노하우.
2) 각 개인에게 체화되어 있는 지식이므로 외부에 표출, 공유가 어렵다.
- 형식지 :
1) 교과서, 매뉴얼, 가이드, 비디오, 데이터베이스와 같이 형상화된 지식임.
2) 형상화된 지식이라 공유와 전달이 쉬움출제포인트
암묵지와 형식지의 사례를 중점으로
암묵지와 형식지의 상호작용
- 공통화(Socialization) : 암묵지 지식의 노하우를 다른 사람에게 알려줌
- 표출화(Externalization) : 암묵지 지식 노하우를 책, 교본 형식으로 전환
- 연결화(Combination) : 책, 교본에 자기가 알고 있는 지식을 추가
- 내면화(Internalization) : 만들어진 책이나 교본을 보고 다른 사람의 암묵적 지식을 습득출제포인트
상호작용의 4가지 개념
어느 순간에 암묵지와 형식지가 변했는지 포인트
데이터와 정보관계데이터의 당위적 특성인 근거의 기능에 주목해 데이터와 정보의 관계를 살펴볼 때 DIKW 정의가 필요함
Data -> Information -> Knowledge -> Wisdom
데이터, 정보, 지식을 통해 최종적으로 지혜를 얻어내는 과정
- Data : 존재 형식을 불문하고, 타 데이터와 상관관계가 없는 가공 전의 순수한 수치나 기호
(예시) 연필가격 : A마트 100원, B마트 200원
- Information : 데이터의 가공 및 상관관계 간 이해를 통해 패턴을 인식하고 의미 부여
(예시) A마트의 연필 가격이 더 싸다.
- Knowledge : 상호 연결된 정보 패턴을 이해하여 이를 토대로 예측한 결과물
(예시) 상대적으로 저렴한 A마트에서 연필을 사야겠다.
- Wisdom : 근본 원리에 대한 깊은 이해를 바탕으로 도출되는 아이디어
(예시) : A마트의 다른 상품들도 B마트보다 쌀 것이라고 판단한다.출제포인트
DIKW 개념 구분과 사례 출제
Information 정보가 상당히 출제빈도가 높음데이터베이스 정의
동시에 복수의 적용 업무를 지원할 수 있도록 복수 이용자의 요구에 대응해 데이터를 받아들이고 저장, 공급하기 위해 일정한 구조에 따라 편성된 데이터의 집합
- 데이터베이스관리시스템 DBMS(DataBase Management System) :
1) 데이터베이스를 조작하는 별도의 소프트웨어.
2) DBMS를 통해 데이터베이스를 관리하여 응용 프로그램들이 데이터베이스를 공유하고, 사용할 수 있는 환경을 제공한다.
3) DBMS는 데이터베이스를 구축하는 틀을 제공. 효율적으로 데이터를 검색, 저장하는 기능 제공.
4) 응용 프로그램들이 데이터베이스에 접근할 수 있는 인터페이스 제공
5) 장애 복구 기능
6) 사용자 권한에 따른 보안성 유지출제포인트
데이터베이스와 데이터베이스 관리시스템 개념 구분
DBMS의 발전과정1세대 :
- 네트워크 DBMS, 계층 DBMS
- 복잡하고 변경 어려움
2세대 :
- 관계(RDBMS)
- 데이터베이스를 테이블 형태로 구성
(예시) 오라클(유료), 액세스, mssql(무료)
3세대 :
1) 객체지향(Objected) DBMS
- 멀티미디어 데이터의 확산으로 관계형 데이터 베이스 모델을 표현하기 어려움
- 같은 행위를 갖는 객체는 한 클래스에 속하며 연산을 나타내기 위해 메소드 함수로 정의
- 이 DBMS를 설명할 때 객체, 클래스, 상속 개념이 등장함. 이 세개와 관련된건 효율성에 귀결됨.
2) 객체 관계형 모델(ORDBMS) :
- 기존의 관계형 모델에 객체 지향형 모델의 장점을 선별해 관계형 모델에 통합한 새로운 개념의 데이터 모델
4세대 :
- NoSQL DBMS
- 데이터 구조를 미리 정해놓지 않아 비정형 데이터를 저장, 처리함.출제포인트
SQL데이터베이스와 NoSQL 데이터 베이스의 각 특징
- SQL데이터 베이스
1) 데이터 모델 : 관계형 모델은 데이터를 행, 열로 구성된 테이블로 정규화
2) 최적의 워크로드 : 관계형 데이터베이스는 일관성이 뛰어난 온라인 트랜잭션 프로세싱(OLTP) 애플리케이션을 위해 설계돼 온라인 분석 프로세싱(OLAP)에 적합함.
- NoSQL 데이터 베이스
1) 데이터 모델 : 키-값, 문서, 그래프 등 성능과 규모 확장에 최적화된 다양한 데이터 모델 제공
2) 최적의 워크로드 :
- NoSQL 데이터베이스는 낮은 지연 시간의 애플리케이션을 포함한 수많은 데이터의 패턴에 맞도록 설계됨
- NoSQL 검색 데이터베이스는 반정형, 비정형 데이터를 rdbms에 담기는 힘들었고, 그래서 등장했음
RDBMS와 ODBMS 특징 구분
출제가 자주 되지는 않지만 정답은 거의 객체지향 데이터베이스(OODBMS) 였음
- 관계형 데이터베이스 (RDBMS)
1) 데이터 타입 : 문자, 숫자, 날짜의 단순 정보타입만 지원
2) 장점 : 오랜 기간에 걸쳐 검증된 시스템. 안정성과 대규모 정보 처리 성능
3) 단점 : 제한된 형태의 정보만 처리 가능. 복잡한 정보 구조의 모델링이 어려움
- 객체지향 데이터베이스(OODBMS)
1) 데이터 타입 : 사용자 정의 타입 및 비정형 복합 정보 타입 지원
2) 장점 : 복잡한 정보 구조의 모델링 가능
3) 단점 : 안정성 및 성능 검증이 미비데이터의 유형 분류
1) 정형데이터 :
- RDBMS의 고정된 필드에 저장
- 데이터 스키마 지원
- 데이터 스키마 관리하는 dbms와 저장하는 부분이 구분되어있음
(예시) RDB, 스프레드 시트
2) 반정형데이터 :
- 데이터 속성인 메타데이터를 가짐.
- 일반적으로 스토리지에 저장되는 데이터 파일
(예시) HTML, JSON, 웹문서, 센서데이터
3) 비정형데이터 :
- 형태나 구족자 복잡한 이미지, 동영상 같은 멀티미디어 데이터
(예시) 소셜 데이터, 문서 이미지, 오디오 등출제포인트
정형데이터는 스키마를 관리하는 DBMS와 저장하는 구분이 분리되어있고, 반정형 데이터는 스키마에 해당하는 메타데이터를 가지고 있다는 것이 포인트
정형데이터는 RDB랑 스프레드시트가 있고 반정형데이터는 HTML, JSON, 웹문서, 센서데이터 등이 있다는 것. 데이터 유형분류의 예시를 숙지해야 함스키마와 인스턴스
스키마 :
- 구조를 만드는 것. 구체적으로 데이터베이스의 구조와 제약조건을 기술함.
인스턴스 :
- 특정 시점의 데이터베이스 내용728x90반응형'S T U D Y > DataBase' 카테고리의 다른 글
Adsp 데이터분석준전문가 3과목 - 벡터 생성, 연산, 인덱싱, 벡터 결과값 예시 (0) 2023.01.25 ADsP - 확률분포 (0) 2023.01.18 ADsP 데이터 분석 - 통계분석 (0) 2023.01.17 adsp 3과목 - 데이터 분석 (0) 2023.01.17 [Sybase] 싸이베이스(Sybase)와 오라클(Oracle)의 차이 (0) 2021.02.01