Structured or unstructured

i.i.d data or non-i.i.d data

Vectorial or non-vectorial data

labeled or unlabeled data

images, text, languages, time series, graphs, and so on …

pandas의 DataFrame은 index와 Columns로 이뤄져 있다.

다양한 내장함수를 통해 데이터의 처리, 확인을 진행할 수 있다.

DataFrame이 저장한 데이터를 간단히 분석하려면 describe() 함수를 호출함으로써 구해볼 수 있다. (count, mean, std, min, max 등을 볼 수 있음)

isna() 함수를 통해서 결손값을 찾을 수 있고 찾아 낸 결손 값을 삭제하거나(dropna()), 채워주는 처리를 진행한다.(fillna())

axis 인자를 지정하여 행이나 열을 지우기.

데이터 시각화는 점이나 선, 막대 그래프 등의 시각적 이미지를 사용하여 데이터를 화면에 표싷는 기술로 효과적인 시각화는 사용자가 데이터를 분석하고 추론하는 데 도움이 된다.

  1. Linear regression