TIL & WIL/Python

5주차 월요일. <데이터 분석> TIL

니츄 2023. 1. 18. 18:17

 

 

 ※ 학습TIP

  • 계속 직접 해보기
  • 보기만 해서는 안 됨.
  • 직접 몸으로 부딪히고, 맨 땅에 헤딩하며 직접 경험해보기
  • 남들과 비교하지 말고, 어제의 나와 오늘의 나를 비교하기

 

 

 ※ 변수명으로 피해야하는 단어

-예약어

-숫자

-함수명

-모듈, 패키지명

-라이브러리명

 

 

 

 ※ pd.read_html()

  • URL, HTML 소스 코드를 넣어주면, 테이블 태그를 찾아서 반환.
  • URL을 넣어주면 특정 URL에 접근하여 HTML 페이지의 태그를 읽어옴.
  • HTML 페이지의 table태그는 <table>/<table>로 구성됨.
  • 해당 HTML의 모든 table을 가져와 리스트 형태로 반환.
  • 반환된 리스트를 인덱싱하게 되면 데이터 프레임이 되어 있음.

 

 

 ※ map, apply, applymap (in pandas)

  • pandas의 Series는 map과 apply 사용 가능.
  • Series.map(), Series.apply() : Series 안의 모든 값을 함수 처리하여 반환.
  • Series.map({ 'a' : 'value' }) : key 값에 값이 없으면 NaN을 넣음.
  • DataFrame.apply(), DataFrame.applymap() : Series 안의 모든 값을 함수 처리하여 반환.

 

 

 ※ progress_map, progress_apply (in pandas in tqdm)

  • map, apply와 달리 진행상황표시(Progress Bar)를 보여줌.