본문 바로가기
자격증/ADsP

데이터와 정보

by ahnne_ 2021. 2. 7.
반응형

1. 특성

  • 존재적 특성 : 객관적사실
  • 당위적 특성 : 추론, 예측, 전망, 추정을 위한 근거

2. 데이터 유형

  • 정성적(비정형) : 언어, 문자 | 회사 매출이 증가함 등 | 저장, 분석, 검색에 많은 비용 소모 
  • 정량적(정형) : 수치, 도형, 기호 | 나이, 몸무게, 주가 | 정형화가 된 데이터로 비용소모가 적음

3. 지식경영의 상호작용

  • 암묵지 : 개인, 내면화 된 지식 =(상호작용을 통해)=> 조직의 지식으로 공통화, 내재화 해야 한다
  • 형식지 : 언어, 기호, 숫자로 표출화 된 지식 =(상호작용을 통해)=> 개인의 지식으로 연결화 해야 한다

4. DIKW 피라미드

  • 데이터 : A와 B의 수치화
  • 정보 :  A와 B의 데이터를 통한 비교
  • 지식 : 정보를 통한 의사결정, A가 더 낫다면 A를 결정
  • 지혜 : 지식을 통해 앞으로의 유추, A를 주로 사용하기 위한 계획

5. 데이터베이스 역사

  • 1950년 미국에서 군대의 군비상황 관리를 위한 컴퓨터 도서관 설립, 데이터(data) + 기지(base) 합성어로 탄생
  • 1975년 미국의 CAC가 KORSTOC을 통해 서비스되면서 우리나라에서 DB이용이 이뤄짐
  • 1980년 KORSTOC이 해외 전문 데이터베이스를 확충하여 'TECHNOLINE'이라는 온라인정보검색 서비스를 개시하여 본격적인 데이터베이스 서비스 시대를 맞이함

6. 데이터베이스 정의

  • 1 차 개념 (정형 데이터관리)
    • 체계적, 조직적으로 정리되고 전자식 또는 기타 수단으로 개별적으로 접근 할 수 있는 독립된 저작물, 데이터 또는 기타 소재의 수집물
  • 2차 개념 (빅데이터 출현으로 비정형 데이터 포함)
    • 동시의 복수의 적용 업무를 지원할 수 있도록 복수 이용자의 요구에 대응해서 데이터를 받아들이고 저장, 공급하기 위하여 일정한 구조에 따라 편성된 데이터의 집합
    • 문자, 기호, 음성, 화상, 영상 등 상호 관련된 다수의 콘텐츠를 정보 처리 및 정보통신 기기에 의하여 체계적으로 수집, 축적하여 다양한 용도와 방법으로 이용할 수 있도록 정리한 정보의 집합체

7. 데이터베이스의 일반적 특징 

  • 통합된 : 중복제거
  • 저장된 : 컴퓨터가 접근할 수 있는 저장매체에 저장
  • 공용 : 공동이용 가능
  • 변화되는 : 항상 변화 가능하고 정확한 데이터를 유지

8. 데이터베이스의 다양한 측면의 특징

  • 정보의 축적 및 전달 측면
    • 기계 가독성 : 컴퓨터 등 정보처리 기기가 읽고 쓸 수 있음
    • 검색 가독성 : 다양한 방법으로 정보 검색
    • 원격 조작성 : 온라인 및 원거리 이용 가능

 9. 데이터베이스의 종류

  • OLTP(On-Line Transaction Processing): 호스트 컴퓨터가 데이터 베이스를 액세스하고 바로 처리 결과를 돌려보내는 형태, on-line으로 데이터를 수시로 갱신하는 프로세싱(주문입력, 재고관리 등 현업의 거의 모든 업무)
  • OLAP(On-Line Analystical Processing): 다양한 비즈니스 관점에서 쉽고 빠르게 다차원적인 데이터에 접근하여 의사 결정에 활용할 수 있는 정보를 얻을 수 있게 해줌
     OLTP에서 처리된 트랜잭션 데이터를 분석해, 제품의 판매 추이, 구매 성향 파악, 재무 회계분석 등을 수행(OLTP = 갱신, OLAP = 조회)
  • CRM(Customer Relationship Management) : 기업과 고객을 연결해 주는 고객관계관리
  • SCM(Supply Chain Management) : 공급망관리, 원재료의 생산, 유통 등 모든 공급망 단계를 최적화해 수요자가 원하는 제품을 원하는 시간과 장소에 제공
  • RTE(Real-Time Enterprise) : 회사의 전 정보를 통합관리하여 경영자의 빠른 의사결정을 이끌어 냄
  • BI(Business Intelligence) : 기업이 보유하고 있는 수많은 데이터를 정리하고 분석해 기업의 의사결정에 활용하는 일련의 프로세스
  • EAI(Enterprise Application Integration) : 기업 내 상호 연관된 모든 어플리케이션을 유기적으로 연동하여 필요한 정보를 중앙 집중적으로 통합, 관리, 사용할 수 있는 환경을 구현
  • EDW(Enterprise Data Warehouse) : BPR과 CRM, BCS 같은 다양한 분석 어플리케이션들을 위한 원천. 기업 리소스의 유기적 통합, 다원화된 관리 체계정비, 데이터 중복 방지등을 위해 시스템을 재 설계 하는 것을 나타냄
  • KMS(Knowlegde Management System) :  기업의 환경이 물품 생산에서 지적 재산을 생산하는 중요성이 더 커지면서 기업 경영을 지식이라는 관점에서 새롭게 조명하는 접근방식
  • EDI(Electronic Data Interchange) : 주문서, 납품서, 청구서 등 무역에 필요한 각종 서류를 표준화된 양식을 통해 전자적 신호로 바꿔 컴퓨터통신망을 이용하여, 거래처에 전송하는 시스템
  • CALS(Commerce At Light Speed) : 전자상거래 구축을 위해 기업 내에서 비용 절감과 생산성 향상을 추구할 목적으로 시작된, 제품의 설계,개발, 생산에서 유통,폐기에 이르기까지 제품의 라이플 사이클 전반에 관련된 데이터를 통합하고 공유,교환할 수 있도록 한 경영통합정보시스템

시험 문제 복기

  • 개인에게 내재된 경험을 객관적인 데이터로 문서나 매체에 저장,가공, 분석하는 과정은? 표출화
    • 설명 : 암묵지에서 형식지로 바꾸는 과정으로 '표출화'한다고 보면됨
    • 또한, 암묵지(내재화)와 상호작용 하는 것이 공통화, 형식지(표출화)는 연결화
  • 다음중 CRM에 대한 설명으로 적절한 것은?
    • CRM은 내부 고객에 국한되지 않고 단순한 정보의 수집에서 탈피, 분석 중심의 시스템 구축을 지향한다.
  • 빅데이터의 기능 4가지
    • 산업혁명의 석탄, 철 : '제조업 뿐 아니라 서비스 분야의 생산성'을 획기적으로 끌어 올려 사회|경제|문화|생활 전반에 혁명적 변화를 가져옴
    • 21세기의 원유 : 경제 성장에 필요한 정보를 제공함으로써 산업 전반에 생산성을 한 단계 향상시키고 기존에 없던 '새로운 범주의 산업을 만들어 냄'
    • 렌즈 : 렌즈를 통해 현미경이 생물학 발전에 미쳤던 영향 만큼이나 데이터가 산업 발전에 영향을 미칠 것으로 기대됨
    • 플랫폼 : 공동 활용 목적으로 구축된 유무형의 구조물로써의 다양한 서드파티 비지니스에 활용되면서 플랫폼 역할을 할 것으로 전망
  • 빅데이터의 과거에서 현재로의 변화
    • 사전처리 => 사후처리
    • 표본조사 => 전수조사
    • 질 => 양
    • 인과관계 => 상관관계
  • 데이터의 가치를 측정하기 어려운 이유
    • 데이터활용방식 : 재사용, 재조합(mashup), 다목정용 개발, 특정 데이터를 언제|누가|어디서 활용할지 알 수 없게 됨
    • 새로운 가치 창출
    • 분석 기술 발전
  • 빅데이터 활용 기본 테크닉
    • 연관규칙 학습 : 변인들 간에 주목할 만한 상관관계 =>  a를 구매하는 사람이 b를 구매하는가?
    • 유형 분석 : 문서 분류, 조직을 그룹으로 나눌 때, 온라인 수강생들 분류 등 =>? 이 사용자는 어떤 특성을 가진 '집단에 속'하는가?
    • 유전자 알고리즘 : 최적화가 필요한 문제의 해결책을 자연선택, 돌연변이 등과 같은 메커니즘을 통해 점진적으로 진화시켜 나감 => '최대의' 시청률을 얻으려면 어떤 프로그램을 어떤 시간대에 방송해야 하는가? , 즉 최적화 ? 알고리즘
    • 기계학습 : 훈련 데이터로부터 학습한 알려진 특성을 활용해 예측하는 방법 => '기존의 시청 기록을 바탕으로' 시청자가 현재 보유한 영화 중에서 어떤 것을 가장 보고 싶어할까?
    • 회귀분석 : 독립변수를 조작함에 따라, 종속변수가 어떻게 변하는지를 보면서 두 변인의 관계를 파악할 때 사용 => 구매자의 나이가 구매 차량의 타입에 어떤 영향을 미치는가?
    • 감정분석 : 특정 주제에 대해 말하거나 글을 쓴 사람의 감정을 분석 => 새로운 환불 정책에 대한 고객의 평가는 어떠한가?
    • 소셜네트워크분석(사회관계망분석) : 특정인과 다른 사람이 몇 촌 정도의 관계인가를 파악하고, 영향력 있는 사람을 찾을 때 사용 => 고객들 간 관계망은 어떻게 구성돼 있는가
  • 딥러닝 분석 기법 종류
    • LSTM(Long Sort Term Memory), Autoencoder, RNN(Recurrent Neural Network)
  • 딥러닝 오픈소스 종류
    • Caffe, Tensorflow, Theano
  • 데이터 사이언스의 인문학 열풍을 가져오게 한 외부 환경 요소
    • 컨버젼스 -> 디비전스 : 규모의 경제, 세계화, 표준화 등으로 복잡한 세계, 다양성, 관계 ,연결성, 창조성 등
    • 생산 -> 서비스 : 비지니스 중심이 제품생산에서 서비스로 이동 
    • 생산 -> 시장창조 : 공급자 중심의 기술경쟁에서 무형자산의 경쟁으로 변화 
  • 데이터 사이언스에대한 설명
    • 의미있는 정보 추출, 정확성보다 통찰력에 초점, 다양한 데이터 대상, 총체적 접근방법
  • 기업의 의사결정 과정을 지원하기 위한 주제 중심적으로 통합적이며 ㅅ디간성을 가지는 비휘발성 데이터의 집합을 "데이터 웨어하우스"라고 한다
  • 별도로 정제되지 않은 자연스러운 상태의아주 큰 데이터 세트인 "데이터 레이크"를 구현하는 것은 2017년 새롭게 등장한 트렌드가 아니다. 데이터 레이크는 수 많은 정보 속에서 의미있는 내용을 찾기 위해 방식에 상관없이 데이터를 저장하는 시스템으로 대규모의 저장소 이다.
  • 정형, 비정형  vs 정량, 정성
    • 정량적 데이터는 지역별 매출액, 영업이익률, 판매량과 같이 수치로 명확하게 표현되는 데이터로 그 양이 증가하더라도 dbms에 저장, 검색, 분석하여 활용하기 용이
반응형

댓글