티스토리 뷰
[오늘의 강의 이야기]
[1] df.index 활용
요일변경하기, 서울120 에서 병합을 위해 인덱스값 변경하기
[2] df.columns 활용
교차표구하고 교차표의 요일 번호를 요일명으로 변경하기,
여러 종목의 종가를 수집했을 때 모든 컬럼이 Close 종가로 되어있기 때문에 각 종목명으로 변경해 주는 실습
[3] concat(axis=0)
컬럼명이 같은 여러 데이터를 불러와서 병합할 때 , 예) 기간별로 나뉜 데이터
[4] concat(axis=1)
인덱스 값이 같은 여러 데이터를 병합 할 때, 예) 여러 주가를 비교할 때
[5] high-level interface 용어의 정의
사람이 이해하기 쉬운 인터페이스
복잡한 기능을 단순하게 만들어 놓은 인터페이스
1) 작업과정을 감싸놓았기 때문에 상대적으로 느리고 자유도가 떨어짐
2) 커스텀하게 사용하려면 복잡.
3) 내부 구성을 알려면 소스코드를 열어 본다던지 번거로운 작업이 필요
4) 내부를 제대로 이해하지 못하고 사용할 수도 있음.
[6] 시각화를 하기 위해 API에 줄 정보
1) 어떤 그래프로 시각화 할지 고르기 예) 막대, 선, 산점도, 히스토그램 등
2) 어떤 데이터를 시각화 할지 API에 설정하기
3) x, y 축을 설정하기
4) 제목, 그래프 크기, 범례, 서브플롯, 스타일 등을 설정하기
5) bar(data, x, y)와 유사한 API를 대부분 갖고 있음.
[6] ploty와 matplotlib의 차이점
1) ploty : 자바스크립트 기반, 동적 그래프
2) matplotlib : python 기반, 정적 그래프
[7] 시각화 하고자 하는 데이터의 index, columns값 등에 대한 이해를 하고
목적에 맞게 데이터를 지정해서 그려주기.
1) Series
2) DataFrame
3) dataframe, x, y 등 파라미터에 지정해서 시각화하는 방법
[8] scatter
여러 종목을 비교해보고자 할 때 사용
[9] EDA를 잘하는 방법
1) 다른 사람이 한 데이터 시각화 사례를 많이 보고 따라해보기
2) 직접 여러 데이터를 가져와서 시각화해보고 의미를 찾아보기
[10] 엑셀로 실시간 업데이트 가능한 대시보드를 만들 수 있음에도 파이썬을 사용하는 이유?
1) 엑셀 : 100만행까지 불러오기 가능, 그러나 작업하다보면 실제 가능한 행은 30만행 정도.
2) 파이썬 : 파이썬 데이터과학 도구에서 제공하는 기능이 훨씬 많음.
[11] seaborn 에서는 별도의 서브플록 API를 제공하고 있음.
'멋쟁이 사자처럼 > 그 외' 카테고리의 다른 글
8주차 화요일 [데일리 키워드] (0) | 2023.02.07 |
---|---|
8주차 월요일 [데일리 키워드] (0) | 2023.02.06 |
7주차 화요일 [데일리 키워드] (0) | 2023.01.31 |
Python _ 'decorator' 이해하기 (0) | 2023.01.05 |
Python _ 'map( )' 함수 이해하기 (0) | 2023.01.05 |