- import import altair as altimport pandas as pd - alt.Chart(data).mark_bar().encode() 바 그래프source = pd.DataFrame({ 'a': ['A', 'B', 'C', 'D', 'E', 'F', 'G', 'H', 'I'], 'b': [28, 55, 43, 91, 81, 53, 19, 87, 52]})alt.Chart(source).mark_bar().encode( x='a', y='b')# y = "count()"로 하면 히스토그램이 됨 - alt.Chart(data).mark_point().encode() 스캐터import altair as alt # Import data object from vega_..
Python
- importimport folium - 위경도를 이용한 지도 보기m = folium.Map(location = [37.222195, 127.187617], zoom_start = 15)m(명지대학교 위치) - json 데이터를 사용하여 시각화import requests# 미국 지도 그리기m = folium.Map([43, -100], zoom_start=4)us_states = requests.get( "https://raw.githubusercontent.com/python-visualization/folium-example-data/main/us_states.json").json()# Choropleth 이용 (지역별로 색을 달리하는데 이용된다.)folium.Choropleth( geo..
- import import plotly.express as pxfig = px.bar(x=["a", "b", "c"], y=[1, 3, 2], width=600, height=400)# 타이틀 설정하기 #fig = px.bar(x=["a", "b", "c"], y=[1, 3, 2], width=600, height=400, title="Title 설정하기")fig.show() - groupby 를 이용하여 데이터 시각화import seaborn as snsdf = sns.load_dataset('penguins')df['count'] = 1df_count= df.groupby("species").sum().sort_values(by = "count", ascending =False)fig = px.ba..

-importfrom mpl_toolkits import mplot3d - plot3d# 3차원 시각화 구현fig = plt.figure()axe = plt.axes(projection='3d')ax = plt.axes(projection='3d')# Data for a three-dimensional linezline = np.linspace(0, 15, 1000) # z값 0~15까지 1000조각 낸것xline = np.sin(zline) # x 값은 z의 sinyline = np.cos(zline) # y 값은 z의 cos# 각 x, y, z의 매개변수를 넣어서 시각화ax.plot3D(xline, yline, zline, 'gray')plt.show() - scatter3dzdata = 15 * n..
- import from wordcloud import WordCloud - text 워드클라우드import matplotlib.pyplot as pltfrom collections import Counter# wordcloud로 시각화할 단어들text = "파이썬 명지대학교 워드클라우드 ICT 파이썬 명지대학교 정보통신공학과 정보통신 워드클라우드 파이썬 라이브러리 ICT 파이썬 워드클라우드 ICT 명지대학교 워드클라우드 명지대학교 데이터 분석 워드클라우드 "# 단어들을 ' '에 따라 토큰화split_text = text.split()# Counter로 단어들 빈도 세기word_count = Counter(split_text)# AppleGothic 폰트를 사용하기 위해 폰트 경로를 지정합니다..

- importimport seaborn as sns - histplot()randdata = np.random.multivariate_normal([0, 0], [[5, 2], [2, 2]], size=2000)randdata = pd.DataFrame(randdata, columns=['x', 'y'])sns.histplot(randdata)# 데이터프레임 그대로의 형태를 집에 넣어도 알아서 집계하여 시각화해주고# 라벨로 자동적으로 생성됨sns.histplot(randdata, kde = True)# 커널 밀도 추정을 함께 살펴볼 수 있음 - jointplot() 주변분포, 결합분포 확인 가능penguins = sns.load_dataset("penguins") sns.jointplot(data=pe..

- 데이터 셋import pandas as pdimport numpy as npdf = pd.DataFrame({'key1' : ['a', 'a', 'b', 'b', 'a'], 'key2' : ['one', 'two', 'one', 'two', 'one'], 'data1' : np.random.randint(10,size=(5)), 'data2' : np.random.randint(10,size=(5))})df - groupby()grouped = df['data1'].groupby(df['key'])# grouped된 객체 반환# groupby의 개념은 df['data1']라는 시리즈 형태가 있고 # 그 형..
- import import pandas as pd - Seriesimport numpy as npobj = pd.Series([4, 7, -5, 3])# 자동으로 index가 붙음obj.values # 값들만 반환obj.index# index 형태를 반환obj2= pd.Series([4, 7, -5, 3], index = ['d', 'b', 'a', 'c'])obj2 #index가 d, b, a, c인것을 확인 할 수 있음obj2.index #인덱스들과 해당 타입을 반환obj2['a'] #인덱스가 a인 값 반환# 딕셔너리 타입을 Series로 변경이 가능하다.sdata = {'Ohio': 35000, 'Texas': 71000, 'Oregon': 16000, 'Utah': 5000}obj3 = pd.S..

- importimport matplotlib.pyplot as plt - plot(x, y, marker = ) , Matplotlib의 특징 항상 x와 y값을 행렬의 형태로 제시해야함import numpy as npx = np.linspace(0, 10, 100)# np.linspace(start, end, 조각) 0부터 10까지 100조각plt.plot(x, np.sin(x), '-') # sin함수plt.plot(x, np.cos(x), '-') # cos함수plt.plot(x, np.zeros(x.shape)) # x 행렬의 사이즈만큼의 0행렬 생성# 해당 그래프를 그려볼때 sin함수와 cos함수가 그려지고 0 ~ 10까지 전부 0의 값을 가지는 선을 그을 수 있음 - figure(figsize..