티스토리 뷰

▼ (Pandas cheat sheet) 클릭!

 


분석에 사용할 Pandas 주요 기능

 

파일 불러오기
  • to_csv("파일명", index=False) : csv 파일로 저장하기
  • read_csv("파일명") : csv 파일 불러오기

 

Pandas를 통한 파일 저장과 불러오기
  • shape를 통한 행과 열의 수 보기
  • head, tail, sample 을 통한 일부 데이터 가져오기

 

DataFrame의 info(), describe()를 통한 요약과 기술통계 값 구하기
  • info()
  • describe()
  • nunique()
  • index
  • columns
  • values

 

Pandas의 DataFrame과 Series의 이해
  • Series : 1차원 벡터구조
  • DataFrame : 2차원 행렬구조

 

색인하기
  • [컬럼]
  • .loc[행]
  • .loc[행, 열]
  • .loc[조건식, 열]

 

DataFrame의 데이터 타입 이해하기
  • 날짜 데이터의 변환

 

DataFrame 다루기
  • 열(column) 인덱싱
  • 행(index) 인덱싱
  • 행, 열 인덱싱
  • 정렬하기 : sort_values 사용하기
  • 조건식 사용하기

 

빈도수 구하기
  • 한 개의 변수 : series.value_counts()
  • 두 개의 변수 : pd.crosstab()

 

groupby와 pivot_table
  • 다양한 연산식의 사용

 

결측치
  • .isnull() : 결측치 보기
  • .fillna() : 괄호 안의 문자로 결측치 채워주기

 

그 외
  • .astype() : 괄호 안의 타입으로 문자열의 타입을 변경해줌.
  • .cumsum() : 누적합계
  • .numeric : 데이터 형식을 숫자로 바꿔줌

 

.plot() : 그래프 시각화
  • kind='bar'  :  막대 그래프 유형
  • figsize=(가로,세로)  :  그래프 크기
  • title='타이틀'  :  그래프 제목
  • c='색상'  :  그래프 색상
  • subplots=True  :  서브그래프. 컬럼별 그래프 생성이 됨.
  • secondary_y  : 2축 그래프
  • plt.axhline()  :  그래프의 일정 수치를 알려주는 보조선
공지사항
최근에 올라온 글
최근에 달린 댓글
Total
Today
Yesterday
링크
TAG
more
«   2025/05   »
1 2 3
4 5 6 7 8 9 10
11 12 13 14 15 16 17
18 19 20 21 22 23 24
25 26 27 28 29 30 31
글 보관함