๐Ÿ Python

[Python]DataFrame-์—ด&ํ–‰์ถ”๊ฐ€, ์›์†Œ์„ ํƒ

yeun.log 2024. 6. 14. 04:37
๋ฐ˜์‘ํ˜•

 

๋Œ€๋ฌธ์ž D ์ฃผ๋ชฉ

 

python์—์„œ๋Š” ์œ„์™€ ๊ฐ™์ด ์ฒซ๊ธ€์ž๊ฐ€ ๋Œ€๋ฌธ์ž๋กœ ์‹œ์ž‘ํ•˜๋Š” ๊ฒŒ Class์ด๋‹ค.
์ด๋ ‡๊ฒŒ ๋งŒ๋“ค์–ด์ง„ ๊ฐ์ฒด๋ฅผ ์ƒ์„ฑ์ž๋ผ๊ณ  ํ•œ๋‹ค.

 


์—ดcolumn ์ถ”๊ฐ€
df['์ถ”๊ฐ€ํ•  ์—ด ์ด๋ฆ„']=๋ฐ์ดํ„ฐ ๊ฐ’


ํ–‰row ์ถ”๊ฐ€
  • ๊ธฐ์กด์˜ index์™€ ๊ฒน์น˜๋ฉด ์•ˆ๋œ๋‹ค.
    → ๋งŒ์•ฝ index๊ฐ€ ๊ฒน์น˜๊ฒŒ ๋˜๋ฉด ๊ธฐ์กด ํ–‰์˜ ์›์†Œ ๊ฐ’์ด ๋ณ€๊ฒฝ๋œ๋‹ค.
  • loc['์ถ”๊ฐ€ํ•  ํ–‰ index'] = [์›์†Œ1, ์›์†Œ2...์›์†Œn] ์„ ์ด์šฉ.

index 2์— ๋ชจ๋‘ 0์œผ๋กœ ์ถ”๊ฐ€


index 3์— List๋กœ ๊ฐ’ ์ถ”๊ฐ€


index 2์˜ ๊ฐ’์„ ๋ณต์‚ฌํ•ด ์ถ”๊ฐ€.

 


ํ•˜๋‚˜๋งŒ ์„ ํƒํ•˜๋Š” ๋‹จ๋… ์›์†Œ ์„ ํƒ๊ณผ ์—ฌ๋Ÿฌ ๊ฐœ ์„ ํƒํ•˜๋Š” ๋ฐฉ๋ฒ• ๋‘๊ฐ€์ง€๊ฐ€ ์žˆ๋‹ค.

๋จผ์ € ๋‹จ๋… ์›์†Œ ์„ ํƒ์„ ์•Œ์•„๋ณด์ž.

 

set_index('์ปฌ๋Ÿผ๋ช…', inplace=True)

index 0,1์ด ์‚ฌ๋ผ์ง€๊ณ  ์„ฑ๋ช…์œผ๋กœ ์‚ฌ์šฉํ•˜๊ฒŒ ๋œ๋‹ค.

  • ์ปฌ๋Ÿผ์„ ์ƒˆ๋กœ์šด index๋กœ ์ง€์ •
  • inplace=True
    → ์‹คํ–‰๋œ ๊ฒฐ๊ณผ๊ฐ€ ์ฆ‰๊ฐ ๋ฐ˜์˜๋˜๊ฒŒ ํ•œ๋‹ค.

๋‹จ๋… ์›์†Œ ์„ ํƒ
loc['ํ–‰์ด๋ฆ„', '์—ด์ด๋ฆ„']
&
iloc[์ขŒํ‘œ๋ฒˆํ˜ธ, ์ขŒํ‘œ๋ฒˆํ˜ธ]
iloc๋Š” index location์œผ๋กœ index์ˆซ์ž๋ฅผ ์ ์–ด์„œ ์‚ฌ์šฉํ•œ๋‹ค.


์—ฌ๋Ÿฌ ๊ฐœ ์›์†Œ ์„ ํƒ์„ ์•Œ์•„๋ณด์ž.

 

์ง€์ • ์„ ํƒ
df.loc['ํ–‰์ด๋ฆ„', ['์—ด์ด๋ฆ„1', '์—ด์ด๋ฆ„2']]
&
 df.iloc[ํ–‰index, [์—ดindex1, ์—ดindex2]]


์—ฐ์† ์„ ํƒ
df.loc['ํ–‰์ด๋ฆ„', '์—ด์ด๋ฆ„1' : '์—ด์ด๋ฆ„2']
&
df.iloc[ํ–‰index, ์—ดindex : ์—ด ์ข…๋ฃŒindex+1]


์—ฌ๋Ÿฌ ํ–‰์˜ ์—ฌ๋Ÿฌ ์—ด์„ ์„ ํƒํ•ด๋ณด์ž.
์ง€์ • ์„ ํƒ
df.loc[['ํ–‰์ด๋ฆ„1','ํ–‰์ด๋ฆ„2'], ['์—ด์ด๋ฆ„1', '์—ด์ด๋ฆ„2']]
&
 df.iloc[[ํ–‰index1, ํ–‰index2], [์—ดindex1, ์—ดindex2]]


์—ฐ์† ์„ ํƒ
df.loc['ํ–‰์ด๋ฆ„1': 'ํ–‰์ด๋ฆ„2' , '์—ด์ด๋ฆ„1' : '์—ด์ด๋ฆ„2']
&
df.iloc[ํ–‰์‹œ์ž‘ : ํ–‰์ข…๋ฃŒ, ์—ดindex : ์—ด ์ข…๋ฃŒindex+1]

 

๋ฐ˜์‘ํ˜•