파이썬 판다스 - csv 파일의 특정 컬럼/열만 남기기
csv 파일이나 excel 파일에서, 다른 컬럼 다 필요 없고 특정 컬럼만 필요하게 될 때.
하나 하나 다 열어서 삭제하고 저장...(...) 할 수도 있겠지만 그건 큰 노동이 필요한데다,
엑셀이 허용하는 행 수를 초과하면 제대로 열리지도 않는다.
이 때 파이썬과 판다스를 이용하면 넘나 편한 것.
import pandas as pd
import os
filePath = 'C://Users//' # 폴더 입력 (윈도우 기준임)
fileAll = os.listdir(filePath)
for file in fileAll:
df = pd.read_csv(filePath + file, header=None)
df = df.iloc[:, [0]] # 첫 번째 컬럼만 저장하고 싶으면 0, 두번째면 1, 세번째면 2...
df.to_csv(filePath + file[:-4] + '_col.csv', index=False, header=False) # 작업이 완료되면 파일명_col.csv 로 꼬리가 붙어서 해당 폴더에 새로 저장된다.
'분석하는 마케터' 카테고리의 다른 글
[CSV 다루기] Python으로 제목이 비슷한 csv 파일 합쳐주기 (feat.Pandas) (0) | 2021.01.21 |
---|---|
[CSV 다루기] Python으로 대문자를 소문자로, 소문자를 대문자로 변환하기 (feat.Pandas) (0) | 2021.01.20 |
[CSV 다루기] Python으로 파일 쪼개기/분리하기 (feat.Pandas) (0) | 2021.01.17 |
[CSV 다루기] Python으로 행 수 세기 (feat.Pandas) (0) | 2021.01.15 |
[CSV 다루기] Python으로 파일 첫 행 추가하기 (feat.Pandas) (0) | 2021.01.14 |
댓글