TIL & WIL/Python
5주차 월요일. <데이터 분석> TIL
니츄
2023. 1. 18. 18:17
※ 학습TIP
- 계속 직접 해보기
- 보기만 해서는 안 됨.
- 직접 몸으로 부딪히고, 맨 땅에 헤딩하며 직접 경험해보기
- 남들과 비교하지 말고, 어제의 나와 오늘의 나를 비교하기
※ 변수명으로 피해야하는 단어
-예약어
-숫자
-함수명
-모듈, 패키지명
-라이브러리명
※ pd.read_html()
- URL, HTML 소스 코드를 넣어주면, 테이블 태그를 찾아서 반환.
- URL을 넣어주면 특정 URL에 접근하여 HTML 페이지의 태그를 읽어옴.
- HTML 페이지의 table태그는 <table>/<table>로 구성됨.
- 해당 HTML의 모든 table을 가져와 리스트 형태로 반환.
- 반환된 리스트를 인덱싱하게 되면 데이터 프레임이 되어 있음.
※ map, apply, applymap (in pandas)
- pandas의 Series는 map과 apply 사용 가능.
- Series.map(), Series.apply() : Series 안의 모든 값을 함수 처리하여 반환.
- Series.map({ 'a' : 'value' }) : key 값에 값이 없으면 NaN을 넣음.
- DataFrame.apply(), DataFrame.applymap() : Series 안의 모든 값을 함수 처리하여 반환.
※ progress_map, progress_apply (in pandas in tqdm)
- map, apply와 달리 진행상황표시(Progress Bar)를 보여줌.