Pandas
파이썬에서 사용하는 데이터 분석 라이브러리 행과 열로 이루어진 2차원 데이터(엑셀..) 을 쉽게 다룰 수 있음
1. Series
1차원 데이터(정수, 실수, 문자열 등)
Series 객체 생성
예) 1월부터 4월까지 평균 온도 데이터(-20, -10, 10, 20)
temp = pd.Series([-20, -10, 10, 20])
print(temp)
#result
0 -20
1 -10
2 10
3 20
dtype: int64
Series 객체 생성(Index 지정)
temp = pd.Series([-20, -10, 10, 20], index = ['jan', 'feb', 'mar', 'apr'])
print(temp)
#result
jan -20
feb -10
mar 10
apr 20
dtype: int64
2. DataFrame
2차원 데이터 (Series 들의 모음) Series의 연속 / Series의 합
Data 준비
사전(dict)자료구조를 통해 생성 예) 슬램덩크 주요 인물 8명에 대한 데이터
data = {
'이름' : ['채치수', '정대만','송태섭','서태웅','강백호','변덕규','황태산','윤대협'],
'학교' : ['북산고', '북산고', '북산고', '북산고', '북산고', '북산고', '북산고', '북산고'],
'키' : [197, 184, 170, 190, 181, 202, 188, 190],
'국어' : [90, 40, 80, 40, 15, 80, 55, 100],
'영어' : [85, 35, 75, 60, 20, 100, 65, 85],
'수학' : [100, 50, 70, 70, 10, 95, 45, 90],
'과학' : [95, 55, 80, 75, 35, 85, 40, 95],
'사회' : [85, 25, 75, 80, 10, 80, 35, 95],
'SW특기' : ['Python', 'Java', 'Javascript', '', '', 'C', 'PYTHON', 'C#']
}
data
#result
{'이름': ['채치수', '정대만', '송태섭', '서태웅', '강백호', '변덕규', '황태산', '윤대협'],
'학교': ['북산고', '북산고', '북산고', '북산고', '북산고', '북산고', '북산고', '북산고'],
'키': [197, 184, 170, 190, 181, 202, 188, 190],
'국어': [90, 40, 80, 40, 15, 80, 55, 100],
'영어': [85, 35, 75, 60, 20, 100, 65, 85],
'수학': [100, 50, 70, 70, 10, 95, 45, 90],
'과학': [95, 55, 80, 75, 35, 85, 40, 95],
'사회': [85, 25, 75, 80, 10, 80, 35, 95],
'SW특기': ['Python', 'Java', 'Javascript', '', '', 'C', 'PYTHON', 'C#']}
DataFrame 객체 생성
import pandas as pd
#pandas 라이브러리를 통해서 DataFrame 객체를 만들고
#그것을 'df'라는 이름으로 받아옴
df = pd.DataFrame(data)
df
데이터 접근
df['이름']
df[['이름','키']] #값이 두개일때 대괄호로 리스트를 한번 더 감싸줌
DataFrame 객체 생성(Index 지정)
df = pd.DataFrame(data, index=['1번','2번','3번','4번','5번','6번','7번','8번'])
df
DataFrame 객체 생성(Column 지정)
data중에서 원하는 column만 선택하거나, 순서 변경 가능
df = pd.DataFrame(data, columns=['이름','학교','키'])
df
3. Index
데이터에 접근할 수 있는 주소값
import pandas as pd
data = {
'이름' : ['채치수', '정대만','송태섭','서태웅','강백호','변덕규','황태산','윤대협'],
'학교' : ['북산고', '북산고', '북산고', '북산고', '북산고', '북산고', '북산고', '북산고'],
'키' : [197, 184, 170, 190, 181, 202, 188, 190],
'국어' : [90, 40, 80, 40, 15, 80, 55, 100],
'영어' : [85, 35, 75, 60, 20, 100, 65, 85],
'수학' : [100, 50, 70, 70, 10, 95, 45, 90],
'과학' : [95, 55, 80, 75, 35, 85, 40, 95],
'사회' : [85, 25, 75, 80, 10, 80, 35, 95],
'SW특기' : ['Python', 'Java', 'Javascript', '', '', 'C', 'PYTHON', 'C#']
}
df = pd.DataFrame(data, index = ['1번','2번','3번','4번','5번','6번','7번','8번'])
df
df.index
#result
Index(['1번', '2번', '3번', '4번', '5번', '6번', '7번', '8번'], dtype='object')
출처 : [유튜브] 나도코딩
'python' 카테고리의 다른 글
[ADsP] (0) | 2022.05.01 |
---|---|
[기초 1-3] 함수(function) (0) | 2022.03.27 |
[Jupyter Notebook] Jupyter Notebook 준비 (0) | 2022.03.13 |
[기초 1-2] 함수(function) (0) | 2022.03.13 |
[기초 1-1] 함수(function) (0) | 2022.03.06 |