본문 바로가기
개발자 일기/빅데이터의 개념이해와 분석역량강화

1.빅데이터 개요

by ahnne_ 2021. 1. 4.
반응형

1. 빅데이터 시대

  • ICT(Information & Communication Technology) 인프라의 고도화 및 성숙에 따른 새로운 투자처에 대한 니즈 증가로 새로운 공급체계와 시장 창출 기대
  • 기업은 축적된 자산 데이터(Asset Data)와 소셜 네트워크에 기반한 대규모 외부 데이터의 활용으로 혁신과 기회 포착
  • 최근 10년 사이 인류는 디지털 데이터가 폭증하는 데이터 홍수(Data Deluge) 현상에 직면
  • 건축물 등에 내장된 임베디드 시스템(Embedded System), IoT(Internet of Things)에서 막대한 데이터가 만들어질 것으로 전망
  • 디지털정보량의 증가에 따라 대규모 데이터가 중대 이슈로 부각되며 등장한 용어로서, 기존의 관리 및 분석체계로는 감당할 수 없을 정도의 거대한 데이터의 집합을 지칭

2. 빅데이터 개념

  • 위키피디아 :빅데이터란 ‘기존 데이터베이스 관리도구의데이터수집·저장·관리 · 분석의 역량을 넘어서는 대량의 정형 또는 비정형 데이터세트 및 이러한 데이터로부터 가치를 추출하고 결과를 분석하는 기술’
  • 국가전략위원회 : 빅데이터란 ‘대용량 데이터를 활용 · 분석하여 가치있는 정보를 추출하고 생성된 지식을 바탕으로 능동적인 대응 또는 변화 예측을 위한 정보화 기술’
  • 빅데이터의 5가지 요소(5V) : Volume(규모), Value(가치), Velocity(속도), Variety(다양성), Veracity(정확도)
  • 데이터 구분 
    • 정   형 : 일정한 규칙을 갖고 체계적으로 정리된 데이터, 그 자체 의미해석 가능 및 활용 가능(통계데이터, 실태조사 데이터 등)
    • 반정형 : 정형의 형태이지만 특정 매체에 따른 분류가 가능 (한글글, MS워드, xml 등) 
    • 비정형 : 변칙과 모호함이 발생하는 sns, 인터넷 등을 통해 '생성되는' 데이터 들
    • 빅데이터는 데이터를 분석하고 처리함으로써 기존의 데이터에서 볼 수 없던 새로운 의미를 산출 하기 위해 '문제제기'와 '마이닝'이 필요
반응형

댓글