
#1) folium 설치하기 Anaconda Prompt 에서 conda install -c conda-forge folium 설치. 지도 시각화를 위한 라이브러리. import folium 위도와 경도 정보 필수. #2) folium 살펴보기 출처 : http://suanlab.com/assets/youtubes/dv/Folium.pdf m = folium.Map(location=[37.566697, 126.978426]) m 타일(tiles) 설정 m = folium.Map(location=[37.566697, 126.978426], tiles = 'Stamen Toner') m -Mapbox 관련, Cloudmad 는 API key가 필요함. 마커(Markers) 설정 m = folium.Map(l..

#3) gender 시각화하기 1) heatmap으로 'gender' 시각화하기 sns.heatmap(gender, annot=True, cmap='Blues') heatmap 추가설명) 상관계수를 heatmap으로 표현하면 대각선을 기준으로 중복되는 정보들이 표현된다. 이를 방지하기 위해 mask라는 코드를 추가할 수 있다. np.triu : 배열의 위쪽 삼각형 / np.tril : 배열의 아래쪽 삼각형 위의 값을 mask에 넣으면 해당 값이 보이지 않는 채로 그래프가 표현된다. ex) mask = np.triu(np.ones_like(data)) sns.heatmap(data, mask=mask) 더보기 ※ 상관 분석 상관 분석(相關 分析, Correlation analysis) 또는 '상관관계' 또..

큰일이다. 수업이 너무 어려웠다. 코드박사가 될 때까지 죽어라 연습하는게 목표였는데 그냥 코 박고 죽게 생겼다.. 처음부터 끝까지 하기에는 시간이...항상 부족하니 몇 가지 꼭!!! 익힐 것만 추려서 익히고 떠나야겠다. #1) 데이터 전처리 !! (목표 : 금주 과제를 통해 완전히 익히기 !! ) 데이터(파일) 불러오기 : pd.read_csv('~~.csv'), glob('~~/*.csv') 결측치 제거하기 : df.drop_duplicates() 요약정보 확인하기 : df.info() 컬럼별 결측치 개수 구하기 : df.isnull().sum() 사용할 컬럼만 꺼내기 : df.columns = [ ] 근데 cols=[ ]로 먼저 묶어주고, df[cols].copy() 하여 깊은복사 해주는게 더 좋음...

※ 오늘의 목표 !! heatmap, melt, 정규표현식 세 개만 제대로 알자!! (내일되어 까먹어도 됨! 또 보면 되니까 !) #1) sns.heatmap 알아보기 heatmap이란? 다양한 강도, 색상으로 데이터 범위를 시각화해주는 도구. 상관관계 시각화. parameters 설명 사용방법 annot = 수치표시 annot=True : 수치표시를 합니다. annot_kws= 수치표시 사이즈 annot_kws={'size': 20} : 크기 20으로 수치표시를 합니다. cmap= 색상변경 cmap="color" : 컬러는 검색해보고 변경해보면 된다. https://matplotlib.org/3.2.1/tutorials/colors/colormaps.html vmin= vmax= 최소, 최대 기준점 변..

#1) 파일 이름을 불러오는 방법 : glob from glob import glob file_name = glob('*.csv') -import 과정이 필요하고, 위와 같이 코드를 작성하면 괄호 안에 있는 조건에 알맞은 파일명을 출력해준다. -불러올 때는 아래와 같이 불러올 수 있다. pd.read_csv(file_name[인덱스 번호]) -이렇게 불러왔을 때의 장점은 -파일 이름이 길고 복잡할 경우 발생 가능한 오류를 방지해준다는 것이다. #2) object(문자) 타입을 수치데이터로 변환하는 방법 : to_numeric() -문자 타입으로 되어있는 숫자 데이터를 계산할 때 필요한 코드다. import pandas as pd example1 = ['1', '2', '3', '4'] example_nu..

시각화는 예시가 중요할 것 같아서 예시 중심으로 작성을 할 예정이다. 0. 패키지 설치하기 python -m pip install -U pip python -m pip install -U matplotlib 1. 라이브러리 로드하기 import pandas as pd import matplotlib.pyplot as plt -파일을 불러올 때 사용할 pandas와 시각화를 할 matplotlib 로드. 2. 한글폰트 설치하기 # 한글폰트 사용을 위해 설치 !pip install koreanize-matplotlib import koreanize_matplotlib -그래프 제목, 범주 등에 한글을 사용하기 위해 한글 설치 및 로드 3. 기본 그래프 그려보기 plt.plot([1, 2, 3, 4]) -리스..

☆★☆오늘의 학습 요약☆★☆ 학습내용 비고 plot(): 그래프 생성 -figsize=(width, height) : 그래프 사이즈 -title : 그래프 제목 -secondary_y : 2축 그래프 (보조 y축을 하나 더 만듦) plt.axhline() : 그래프 가로 보조선 plt.axvline() : 그래프 세로 보조선 plt.legend(bbox_to_anchor=(1,1) : 모든 항목을 선그래프로 출력함. pd.crosstab() : 범주형 데이터 두 개를 비교분석할 때 유용한 표. -values: 집계할 값. 반드시 aggfunc와 함꼐 사용 -aggfunc: 집계함수. (mean, sum, count 등) -margins: 행/열의 소계값 -margins_name: 소계 뽑을 행/열 지정 ..
보호되어 있는 글입니다.