- [Python 기본] 3. python을 이용하여 data 값 만지기(column추가) 목차
Python에서 DATA 값을 만져보자 . DATA 를 만지는데, 원하는 내용을 하나 더 추가하고 싶어졌다. 이럴 때 컬럼을 추가하기 위해서는 어떻게 해야할까?
1. Column 추가하기
df['추가할 컬럼명'] = value 이 부분을 통해 컬럼을 추가할 수 있다. 먼저, Pandas 에 있는 예시를 확인해 보도록 하자.
이 경우에는 data 부분을 d로 선언을 한 뒤, series 형태로 data 값을 입력했다.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
|
import pandas as pd
d = {'one' : pd.Series([1, 2, 3], index=['a', 'b', 'c']),
'two' : pd.Series([1, 2, 3, 4], index=['a', 'b', 'c', 'd'])}
df = pd.DataFrame(d)
print df
# Adding a new column to an existing DataFrame object with column label by passing new series
print ("Adding a new column by passing as Series:")
df['three']=pd.Series([10,20,30],index=['a','b','c'])
print df
print ("Adding a new column using the existing columns in DataFrame:")
df['four']=df['one']+df['three']
print df
|
cs |
첫번째 d 값을 파이썬 결과를 통해 확인해 보면 다음과 같은 표가 그려진다.
one two
a 1.0 1
b 2.0 2
c 3.0 3
d NaN 4
여기서 만약 세번째 column인 'three'를 추출하기 위해서는, df['three']=pd.Series([10,20,30],index=['a','b','c']) 부분을 추가해주면 된다. 새로운 dataframe 에 컬럼 명과, 그 값을 적어넣는다는 의미이다.
Adding a new column by passing as Series:
one two three
a 1.0 1 10.0
b 2.0 2 20.0
c 3.0 3 30.0
d NaN 4 NaN
마지막으로 네번째 컬럼을 추가하고 싶은데, 이 값은 계산된 값으로 만들고 싶은 경우, df['four']=df['one']+df['three'] 다음과 같은 형식으로 적어 값을 추가해 줄 수 있다.
Adding a new column using the existing columns in DataFrame:
one two three four
a 1.0 1 10.0 11.0
b 2.0 2 20.0 22.0
c 3.0 3 30.0 33.0
d NaN 4 NaN NaN
더 많은 예시는 다음에서 확인 가능하다.
Python Pandas - DataFrame (tutorialspoint.com)
2. Column 추가하기 (Dic)
두번째로, 만약 series가 아닌 다른 형태로 data Frame이 그려진다면 어떻게 데이터를 추가할 수 있을까?
이는 아까와 같은 방법으로 데이터를 추가할 수 있다. 아래의 예시를 확인해보자.
1
2
3
4
5
6
7
8
9
10
11
12
|
import pandas as pd
data = {'Name':['Tom', 'Jack', 'Steve', 'Ricky'],'Age':[28,34,29,42]}
df = pd.DataFrame(data, index=['rank1','rank2','rank3','rank4'])
print (df)
#df['추가할 컬럼명'] = value
#dictionary 형태로 dataframe 형성 시, key값을 왼쪽, value를 오른쪽에 둔다.
df['gender'] = ['girl','boy','boy','girl']
print(df)
|
cs |
위 코드는 data가 dictionary 형태로 선언되어있는 경우를 가져왔다. Key와 value로 구성되어 있으며, 만약 여기에 gender 라는 정보를 추가하고 싶다. 그럴경우 어떻게 쉽게 이를 추가할 수 있을까?
바로 다음과 같은 방식으로 추가할 수 있다. df['gender'] = ['girl','boy','boy','girl'] key와 value를 각각 그리면 다음과 같은 표로 print 된다.
Name Age gender
rank1 Tom 28 girl
rank2 Jack 34 boy
rank3 Steve 29 boy
rank4 Ricky 42 girl
여러방식으로 적용하고 그려보며 익혀나가보자.
'Python > 파이썬 기초' 카테고리의 다른 글
[Python 기본] 2. python을 이용하여 다양한 chart 그리기 (0) | 2023.01.06 |
---|---|
Python으로 데이터 분석하기 좋은 무료 자료 사이트 공유 (0) | 2023.01.06 |
[ Python 독학 ] (4) 문자 범위 반환 - Slicing (0) | 2021.01.07 |
[ Python 독학 ] (3) 변수(Variables), 데이터 타입(Data Type) (0) | 2021.01.05 |
[ Python 독학 ] (2) Python output 함수, Indentation 들여쓰기 (0) | 2021.01.05 |