IT/데이터 분석 (2) 썸네일형 리스트형 파이썬 데이터 분석 절차 파이썬을 활용한 데이터 분석은 데이터 수집 → 데이터 전처리 → 탐색적 데이터 분석(EDA) → 모델링 및 분석 → 시각화 및 인사이트 도출의 과정을 거칩니다. 데이터 수집 (Data Collection)1. 데이터 수집 방법 • CSV, Excel, JSON, SQL 데이터베이스 등에서 불러오기 • 웹 크롤링 또는 API 활용 • 실시간 센서 및 로그 데이터 수집2. 주요 라이브러리import pandas as pd # 데이터 처리import requests # API 호출from sqlalchemy import create_engine # DB 연결3. 데이터 불러오기 예제# CSV 파일 불러오기df_csv = pd.read_csv("data.csv")# Excel 파일 불러오기df_e.. 데이터 분석 시 결측치(missing value) 처리 데이터 분석에서 결측치(missing value) 처리는 분석 결과의 신뢰성과 정확성에 영향을 미치므로 신중하게 접근해야 합니다. 일반적인 결측치 처리 방법은 다음과 같습니다.결측치 확인 • isnull().sum(): 각 변수별 결측치 개수 확인 • info() : 데이터 유형 및 결측치 여부 확인 • describe(): 기술 통계를 활용하여 이상값 및 결측치 탐색결측치 처리 방법1. 결측 데이터 삭제 (Removing Missing Data) • 행 삭제 (dropna()) : 결측값이 포함된 행을 제거 (결측치가 적을 때 사용) • 열 삭제 (dropna(axis=1)) : 특정 열에 결측치가 많다면 해당 열 삭제 (데이터 손실이 크므로 신중해야 함)2. 결측값 대체 (Imputation.. 이전 1 다음