본문 바로가기
AI교육

데이터의 시각화를 알아보자.

by _❤
반응형

우리가 일상생활에서 만나는 많은 데이터는 수집한 형태만으로는 전체의 경향성을 파악하기 어려운 경우가 많습니다.

데이터의 양이 많을수록 시각화를 통해 의미 있는 정보를 더 잘 파악할 수 있는데요.

이렇게 시각화를 하면 그 의미를 쉽게 파악할 수 있을 뿐만 아니라 숨어 있는 정보까지도 찾아낼 수 있다고 합니다.

 

1. 그래프로 나타내기

그 첫 번째 방법은 막대그래프와 선 그래프로 나타나는 것입니다.

막대그래프는 상대적인 크기를 비교하여 알아보기에 적합한데요.

예를 들면 지역의 월별 강수량을 막대그래프로 표현한 것이라고 할 수 있습니다.

 

선 그래프는 데이터의 시간에 따른 변화 주의를 파악하고 예측할 때 사용합니다.

구체적으로는 코로나 확진 숫자 수 변화 강수량 변화 등이 있습니다.

 

 

2. 산점도로 나타내기

두 번째 방법에는 산점도가 있습니다.

산점도란 데이터 속성 간의 관계를 시각화하여 쉽게 알아볼 수 있는 대표적인 방법이죠.

산점도는 x축과 y축 두 축이 만나는 위치의 점을 표시하여 두 축 간의 관계를 나타내는 방법입니다.

 

이를 통해 강도와 이상치 등을 확인할 수 있습니다.

이상치는 관측된 데이터의 범위에서 많이 벗어난 아주 작은 값이나 아주 큰 값을 말합니다. 

예를 들면 국어 성적이 높을수록 영어 성적도 우수한데요.

이상치란, 영어 성적이 높은데도 국어 성적이 낮을 수 있다는 것에 해당하겠죠.

이러한 방법으로 산정도는 기계 학습에서도 사용됩니다.

독립변수와 종속 변수 간의 관계를 파악하는 데 적절한데요.

 

워드 클라우드를 이용하면 sns에 긴 댓글 텍스트 속에 포함된 주요 의미를 쉽게 파악할 수 있습니다.

또 구글 트렌드를 이용하면 관심도가 어떻게 변화하는지 그 데이터를 다운로드할 수 있고 그래프를 비교할 수도 있습니다.

반응형

댓글