python

[Jupyter Notebook] Pandas (1. Series/Dataframe/Index)

jia.son 2022. 3. 20. 19:48

Pandas

파이썬에서 사용하는 데이터 분석 라이브러리 행과 열로 이루어진 2차원 데이터(엑셀..) 을 쉽게 다룰 수 있음

 

1. Series

1차원 데이터(정수, 실수, 문자열 등)

 

 

Series 객체 생성

예) 1월부터 4월까지 평균 온도 데이터(-20, -10, 10, 20)

temp = pd.Series([-20, -10, 10, 20])

print(temp)
#result
0   -20
1   -10
2    10
3    20
dtype: int64

 

Series 객체 생성(Index 지정)

temp = pd.Series([-20, -10, 10, 20], index = ['jan', 'feb', 'mar', 'apr'])

print(temp)
#result
jan   -20
feb   -10
mar    10
apr    20
dtype: int64

 

2. DataFrame

2차원 데이터 (Series 들의 모음) Series의 연속 / Series의 합

 

Data 준비

사전(dict)자료구조를 통해 생성 예) 슬램덩크 주요 인물 8명에 대한 데이터

data = {
'이름' : ['채치수', '정대만','송태섭','서태웅','강백호','변덕규','황태산','윤대협'],
'학교' : ['북산고', '북산고', '북산고', '북산고', '북산고', '북산고', '북산고', '북산고'],
'키' : [197, 184, 170, 190, 181, 202, 188, 190],
'국어' : [90, 40, 80, 40, 15, 80, 55, 100],
'영어' : [85, 35, 75, 60, 20, 100, 65, 85],
'수학' : [100, 50, 70, 70, 10, 95, 45, 90],
'과학' : [95, 55, 80, 75, 35, 85, 40, 95],
'사회' : [85, 25, 75, 80, 10, 80, 35, 95],
'SW특기' : ['Python', 'Java', 'Javascript', '', '', 'C', 'PYTHON', 'C#']
}

data
#result
{'이름': ['채치수', '정대만', '송태섭', '서태웅', '강백호', '변덕규', '황태산', '윤대협'],
'학교': ['북산고', '북산고', '북산고', '북산고', '북산고', '북산고', '북산고', '북산고'],
'키': [197, 184, 170, 190, 181, 202, 188, 190],
'국어': [90, 40, 80, 40, 15, 80, 55, 100],
'영어': [85, 35, 75, 60, 20, 100, 65, 85],
'수학': [100, 50, 70, 70, 10, 95, 45, 90],
'과학': [95, 55, 80, 75, 35, 85, 40, 95],
'사회': [85, 25, 75, 80, 10, 80, 35, 95],
'SW특기': ['Python', 'Java', 'Javascript', '', '', 'C', 'PYTHON', 'C#']}

 

DataFrame 객체 생성

import pandas as pd

#pandas 라이브러리를 통해서 DataFrame 객체를 만들고
#그것을 'df'라는 이름으로 받아옴
df = pd.DataFrame(data)

df

df 실행

데이터 접근

df['이름']

df['이름'] 실행

 

df[['이름','키']]  #값이 두개일때 대괄호로 리스트를 한번 더 감싸줌

 

DataFrame 객체 생성(Index 지정)

df = pd.DataFrame(data, index=['1번','2번','3번','4번','5번','6번','7번','8번'])
df

index 지정한 df 실행 

 

DataFrame 객체 생성(Column 지정)

data중에서 원하는 column만 선택하거나, 순서 변경 가능

 

df = pd.DataFrame(data, columns=['이름','학교','키'])
df

지정한 column 만 불러옴

 

3. Index

데이터에 접근할 수 있는 주소값

 

import pandas as pd

data = {
'이름' : ['채치수', '정대만','송태섭','서태웅','강백호','변덕규','황태산','윤대협'],
'학교' : ['북산고', '북산고', '북산고', '북산고', '북산고', '북산고', '북산고', '북산고'],
'키' : [197, 184, 170, 190, 181, 202, 188, 190],
'국어' : [90, 40, 80, 40, 15, 80, 55, 100],
'영어' : [85, 35, 75, 60, 20, 100, 65, 85],
'수학' : [100, 50, 70, 70, 10, 95, 45, 90],
'과학' : [95, 55, 80, 75, 35, 85, 40, 95],
'사회' : [85, 25, 75, 80, 10, 80, 35, 95],
'SW특기' : ['Python', 'Java', 'Javascript', '', '', 'C', 'PYTHON', 'C#']
}

df = pd.DataFrame(data, index = ['1번','2번','3번','4번','5번','6번','7번','8번'])

df

df.index
#result
Index(['1번', '2번', '3번', '4번', '5번', '6번', '7번', '8번'], dtype='object')

 

 

출처 : [유튜브] 나도코딩

 

'python' 카테고리의 다른 글

[ADsP]  (0) 2022.05.01
[기초 1-3] 함수(function)  (0) 2022.03.27
[Jupyter Notebook] Jupyter Notebook 준비  (0) 2022.03.13
[기초 1-2] 함수(function)  (0) 2022.03.13
[기초 1-1] 함수(function)  (0) 2022.03.06