안녕하세요. 오늘은 AI에 있어서 데이터 속성과 유형에 대해 살펴보도록 하겠습니다.
데이터는 기계 학습으로 분류하거나 예측하는 데 사용되는 필수적인 요소인데요.
정형 데이터와 비정형 데이터로 구분됩니다.
문제 해결에 필요한 적절한 데이터는 무엇일까요. 또 데이터의 속성과 유형이 기계 학습에 어떤 영향을 미칠까요. 참석자
1. 데이터의 속성이란?
데이터를 구성하는 개별 요소를 일컫는 말입니다.
특성 또는 변수 등으로 혼용하여 사용하기도 합니다.
예를 들면 도서관의 책 데이터는 책의 기본적인 정보인 제목, 저자, 출판사 등의 속성을 가집니다.
그 외에도 책을 관리하기 위한 분류, 출판 연도, 진열 위치, 대출 여부, 대출 횟수 등도 데이터 속성이 될 수 있습니다.
이렇게 데이터 속성은 데이터가 갖는 성질로 다른 데이터와 구별이 가능하도록 돕습니다.
2. 데이터의 유형이란?
유형의 대상뿐만 아니라 음악 행복과 같은 무형의 것도 데이터로 충분히 표현할 수 있습니다.
데이터 속성에는 기계 학습에 영향을 주는 속성과 영향을 받는 속성이 있습니다.
이렇게 변수들의 관계에서 영향을 미치는 변수를 독립 변수라고 하죠.
예를 들면 독립 변수는 결과에 영향을 미치는 원인 변수로, 꽃의 품종의 결정에 영향을 주는 독립변수에는 꽃잎의 길이와 너비 꽃받침의 길이와 너비 등이 있습니다.
반면 꽃의 품종은 이러한 너비와 길이 등의 특성 값에 영향을 받는 종속 변수가 되는 것입니다.
속성들의 특징에 따라서 어떤 속성은 다른 속성보다 목표를 더 정확하게 예측합니다.
이러한 속성들은 참석자 1 다른 속성에 비해 종속 변수와 높은 상관관계를 갖는다고 말할 수 있습니다.
'AI교육' 카테고리의 다른 글
메타버스 플랫폼 중, 게더타운에 대해 알아보자. (feat. 고려할 사항) (0) | 2022.02.09 |
---|---|
데이터의 시각화를 알아보자. (0) | 2022.02.07 |
바이브컴퍼니의 빅데이터 서비스, Sometrend(썸트렌드)에 대해 알아보자. (0) | 2022.01.18 |
인공 지능과 인간 지능의 차이, 감성 컴퓨팅에 대해 알아보자. (0) | 2022.01.17 |
컴퓨터 비전, COCO dataset(코코 데이터 세트)의 이미지 분할과 국어 글쓰기 수업을 연계하는 방법(지도안, 학습지 첨부) (0) | 2022.01.17 |
댓글