Home 데이터 분석에 CSV파일을 사용하는 이유
Post
Cancel

데이터 분석에 CSV파일을 사용하는 이유

데이터분석에 처음 입문할때 csv파일이라는 것을 처음 만나보시게 될겁니다. 엑셀이나 텍스트 파일도 아니고 csv파일이라니 처음에는 생소 하시겠지만 이유가 있습니다.

CSV파일을 메모장이나 텍스트편집기로 열어 보면 다음과 같습니다.

csv file view

이렇게 한줄로 늘어놓으니 잘 안보이기는 하는데 다른 것 보다 콤마로 구분된 것을 볼 수 있습니다.

CSV파일은 comma-separated values (쉼표로 값이 구분된 텍스트) 입니다.

일반적으로 엑셀 파일의 경우 전용 프로그램이 필요합니다. MS엑셀이나 스프레드시트같은 엑셀을 열기 위한 전용 프로그램이 필요합니다. 하지만 csv파일은 그렇지 않습니다. 메모장, 워드프로세서, 노트패드와 같은 간단한 문서/텍스트 편집기를 통해서도 CSV파일을 사용할 수 있기에 대용량 파일을 csv파일로 사용합니다. 하지만 그만큼 데이터는 단순해 지고 자료형이 정의되지 않습니다.

1
pd.read_csv("파일 위치")

판다스에서도 csv파일로 열어서 작업하는게 훨씬 편하기도 합니다.

This post is licensed under CC BY 4.0 by the author.

Comments powered by Disqus.

파이썬의 람다(lambda) 함수사용과 데이터프레임의 apply적용

코랩(Colab) 무료부터 프로와 프로 플러스 성능 정리