[Python 기본] 3. python을 이용하여 data 값 만지기(column추가)

2023년 01월 07일 by Coco___

    [Python 기본] 3. python을 이용하여 data 값 만지기(column추가) 목차
728x90
반응형

Photo by Emile Perron on Unsplash

 

Python에서 DATA 값을 만져보자 . DATA 를 만지는데, 원하는 내용을 하나 더 추가하고 싶어졌다. 이럴 때 컬럼을 추가하기 위해서는 어떻게 해야할까? 

 

1. Column 추가하기 

 

df['추가할 컬럼명'] = value 이 부분을 통해 컬럼을 추가할 수 있다.  먼저, Pandas 에 있는 예시를 확인해 보도록 하자. 

 

이 경우에는 data 부분을 d로 선언을 한 뒤, series 형태로 data 값을 입력했다.

 

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
import pandas as pd
 
= {'one' : pd.Series([123], index=['a''b''c']),
   'two' : pd.Series([1234], index=['a''b''c''d'])}
 
df = pd.DataFrame(d)
print df
# Adding a new column to an existing DataFrame object with column label by passing new series
 
print ("Adding a new column by passing as Series:")
df['three']=pd.Series([10,20,30],index=['a','b','c'])
print df
 
print ("Adding a new column using the existing columns in DataFrame:")
df['four']=df['one']+df['three']
 
print df
cs

첫번째 d 값을 파이썬 결과를 통해 확인해 보면 다음과 같은 표가 그려진다. 

   one  two
a  1.0    1
b  2.0    2
c  3.0    3
d  NaN    4

 

여기서 만약 세번째 column인 'three'를 추출하기 위해서는,  df['three']=pd.Series([10,20,30],index=['a','b','c']) 부분을 추가해주면 된다.  새로운 dataframe 에 컬럼 명과, 그 값을 적어넣는다는 의미이다.

 

Adding a new column by passing as Series:
   one  two  three
a  1.0    1   10.0
b  2.0    2   20.0
c  3.0    3   30.0
d  NaN    4    NaN 

 

마지막으로 네번째 컬럼을 추가하고 싶은데, 이 값은 계산된 값으로 만들고 싶은 경우,  df['four']=df['one']+df['three'] 다음과 같은 형식으로 적어 값을 추가해 줄 수 있다. 

 

Adding a new column using the existing columns in DataFrame:
   one  two  three  four
a  1.0    1   10.0  11.0
b  2.0    2   20.0  22.0
c  3.0    3   30.0  33.0
d  NaN    4    NaN   NaN

 

더 많은 예시는 다음에서 확인 가능하다. 

Python Pandas - DataFrame (tutorialspoint.com)

 

Python Pandas - DataFrame

Python Pandas - DataFrame A Data frame is a two-dimensional data structure, i.e., data is aligned in a tabular fashion in rows and columns. Features of DataFrame Potentially columns are of different types Size – Mutable Labeled axes (rows and columns) Ca

www.tutorialspoint.com

 

2. Column 추가하기 (Dic)

 

두번째로, 만약 series가 아닌 다른 형태로 data Frame이 그려진다면 어떻게 데이터를 추가할 수 있을까? 

이는 아까와 같은 방법으로 데이터를 추가할 수 있다. 아래의 예시를 확인해보자. 

1
2
3
4
5
6
7
8
9
10
11
12
import pandas as pd
 
data = {'Name':['Tom''Jack''Steve''Ricky'],'Age':[28,34,29,42]}
df = pd.DataFrame(data, index=['rank1','rank2','rank3','rank4'])
print (df)
 
#df['추가할 컬럼명'] = value
#dictionary 형태로 dataframe 형성 시, key값을 왼쪽, value를 오른쪽에 둔다.
df['gender'= ['girl','boy','boy','girl']
print(df)
cs

 

위 코드는 data가 dictionary 형태로 선언되어있는 경우를 가져왔다. Key와 value로 구성되어 있으며, 만약 여기에 gender 라는 정보를 추가하고 싶다. 그럴경우 어떻게 쉽게 이를 추가할 수 있을까? 

 

바로 다음과 같은 방식으로 추가할 수 있다. df['gender'= ['girl','boy','boy','girl']  key와 value를 각각 그리면 다음과 같은 표로 print 된다. 

 

        Name  Age gender
rank1    Tom   28   girl
rank2   Jack   34    boy
rank3  Steve   29    boy
rank4  Ricky   42   girl

 

 

여러방식으로 적용하고 그려보며 익혀나가보자. 

728x90
반응형