본문 바로가기

파이썬

분당선 역별 승하차 인원 분석 (21.01 - 21.06) - 2 - 지난번 작성 글에 이어 두 번째 분석 과정을 정리하는 포스팅입니다. 제가 처음으로 확인하기 원하는 정보는 분당선의 각 역별 이용 승객 수입니다. 읽어온 데이터 프레임은 다양한 노선들이 모두 포함되어 있기 때문에, 분당선에 대한 값만을 보기 위해 노선명이 분당선인 데이터를 필터링하여 새로운 데이터 프레임에 저장하였습니다. import glob import pandas as pd line_num = '분당선' subway_files = glob.glob('./subway_data/CARD_SUBWAY_*') print(len(subway_files)) for file in subway_files: subway_df = pd.read_csv(file, index_col=False) bline_filter = .. 더보기
분당선 역별 승하차 인원 분석 (21.01 - 21.06) - 1 - 최근 취미생활로 Python을 이용한 데이터 분석을 공부하고 있는데, 단순히 실습을 해보고 끝내기보다는 데이터 분석 과정을 정리해 두면 나중에 많은 도움이 될 것 같아서, 블로그에 정리해 두려고 합니다. 금일 목표 A. 데이터 분석 목표 정의 B. 공공데이터 준비 및 살펴보기 C. 데이터 전처리 하기 A. 데이터 분석 목표 정의 단순히 의미없이 데이터 분석을 하기보다는 목표를 정하고 해당 목표를 해결하기 위해 삽질의 과정을 거치는 것이 재미있을 것 같아서 일단은 목표를 정하고 그에 맞는 데이터 분석을 진행하려고 합니다. 목표 정의 : "지하철 승하차 인원이 역세권 아파트 시세에 미치는 영향 분석" B. 공공데이터 준비 및 살펴보기 일단 지하철 승하차 인원과 역세권 아파트 시세의 상관관계를 파악하기 위해 .. 더보기