보호되어 있는 글입니다.

▼ (Pandas cheat sheet) 클릭! 더보기 분석에 사용할 Pandas 주요 기능 파일 불러오기 to_csv("파일명", index=False) : csv 파일로 저장하기 read_csv("파일명") : csv 파일 불러오기 Pandas를 통한 파일 저장과 불러오기 shape를 통한 행과 열의 수 보기 head, tail, sample 을 통한 일부 데이터 가져오기 DataFrame의 info(), describe()를 통한 요약과 기술통계 값 구하기 info() describe() nunique() index columns values Pandas의 DataFrame과 Series의 이해 Series : 1차원 벡터구조 DataFrame : 2차원 행렬구조 색인하기 [컬럼] .loc[행] ...
보호되어 있는 글입니다.
보호되어 있는 글입니다.

벌써 5주차라니... 게으름 피우지 말자; TIL 다시 시작한다. ※ 학습 TIP -다른 사람들이 짜둔 소스코드를 많이 보고 응용해 볼수록 실력이 늘음. ※ progress_map과 progress_apply의 차이 map과 apply는 pandas의 메서드임. 반복문 대신에 사용할 수 있고, 반복문을 사용했을 때보다 속도가 빠름. 그러나, 많은 작업을 할 때에는 어디까지 진행되었는지 확인이 어려움. 그래서, tqdm의 도움을 받음. progress_map()과 progress_apply()는 tqdm에서 판다스를 지원하는 기능으로, 진행상태를 표시해줌. ※ list(view_detail)과 view_detail.tolist()의 차이 list(view_detail) : 파이썬 표준 라이브러리 사용 vi..

※ Jupyter localhost 실습의 장점 오프라인에서도 사용 가능 데이터 파일 등을 매번 로드할 필요 없음 주피터노트북의 서버를 끄지 않는 이상 다시 실행할 필요가 없다. 라이브러리를 한 번 설치하면 노트북을 새로 열 때마다 설치하지 않고 import만 해서 사용할 수 있음. 좋은 성능의 컴퓨터라면 colab보다 빠르게 사용할 수 있음. ※ Jupyter Notebook 자주쓰는 단축키 실행모드(ESC) : 커서가 사라짐. a : 위에 셀이 생성 b : 아래에 셀이 생성 dd : 셀 삭제 m : 마크다운 셀로 변경 y : 코드셀로 변경 편집모드(Enter) : 커서가 생김 shift + Enter : 셀 실행 + 다음 셀로 이동 ctrl + Enter : 셀 실행 + 이동x ※ 웹크롤링을 위해 필..

※ 학습TIP 계속 직접 해보기 보기만 해서는 안 됨. 직접 몸으로 부딪히고, 맨 땅에 헤딩하며 직접 경험해보기 남들과 비교하지 말고, 어제의 나와 오늘의 나를 비교하기 ※ 변수명으로 피해야하는 단어 -예약어 -숫자 -함수명 -모듈, 패키지명 -라이브러리명 ※ pd.read_html() URL, HTML 소스 코드를 넣어주면, 테이블 태그를 찾아서 반환. URL을 넣어주면 특정 URL에 접근하여 HTML 페이지의 태그를 읽어옴. HTML 페이지의 table태그는 /로 구성됨. 해당 HTML의 모든 table을 가져와 리스트 형태로 반환. 반환된 리스트를 인덱싱하게 되면 데이터 프레임이 되어 있음. ※ map, apply, applymap (in pandas) pandas의 Series는 map과 appl..
보호되어 있는 글입니다.