๋ฐ์ํ
data frame์์ ๋ช ๊ฐ์ ํ๋ง ๊ฐ์ ธ์ค์
df.head() :
์ฒ์ 5ํ๋ง ์ถ์ถ.
head()์ tail() ๋ชจ๋ ๊ฐ์ ธ์ค๊ณ ์ถ์ ์ ๋งํผ (์ซ์)๋ฅผ ์ ์ด์ ๊ฐ์ ธ์ค๋ฉด ๋๋ค.
์ด ๋๊ฐ๋ ๊ตฌ์กฐ๋ฅผ ๋๊ฐ ํ์ ํ ๋ ์ฌ์ฉ๋๊ณค ํ๋ค.
df.tail() :
๋ง์ง๋ง 5ํ ์ถ์ถ.
df[ : ]
์ค๊ฐ ํ์ ๊ฐ์ ธ์ค๊ณ ์ถ์ ๊ฒฝ์ฐ
slicingํด์ ๊ฐ์ ธ์จ๋ค.
df.loc['KR'] :
ํ์ ๋ ์ด๋ธ(index์ญํ )์ด 'KR'์ธ ํ๋ง ์ถ๋ ฅ.
df['์ปฌ๋ผ๋ช '][:3]
ํด๋น ์ปฌ๋ผ์ ํ๋ง ์ํ๋ ๋งํผ ์ถ์ถ
df.loc['๋ ์ด๋ธ๋ช ', '์ปฌ๋ผ๋ช '] :
ํ์ index์ญํ ์ ํ๋ ๋ ์ด๋ธ๊ณผ
์ปฌ๋ผ๋ช ์ด ์ผ์นํ๋ ์๋ฃ๋ฅผ ์ถ์ถ.
์ค๋ช ํ๊ธฐ ์ํด ์์ ๊ฐ์ด ์ ์์ง๋ง
์ํ๋ ์์น์
loc['ํ', '์ด']
์ด๋ผ๊ณ ์๊ฐํ๋ฉด ์ฝ๋ค.
df['์ปฌ๋ผ๋ช '].loc['๋ ์ด๋ธ๋ช '] :
์ปฌ๋ผ ์ง์ ํ ๋ ์ด๋ธ์ ์ ํ ์ถ์ถ.
์ฒด์ด๋ ๋ฐฉ์.
์๋ก์ด ์ด ์ถ๊ฐ
df['์ถ๊ฐํ _์ปฌ๋ผ๋ช '] = ๊ณ์ฐ์
๋ค๋ฅธ ๊ฐ๋ฐ์ธ์ด๋ฅผ ๊ณต๋ถํ ๊ฒฝ์ฐ, ์ด๋ฌํ ๊ณ์ฐ์ ํ ๋
for()๋ฌธ๊ณผ ๊ฐ์ ๋ฐ๋ณต๋ฌธ์ ๋จผ์ ์๊ฐํ์ง๋ง, python์์๋ libraryํ์ฉ์ ์ฐ์ ์ํ๋ค.
โปํ์ผ์ ๋ถ๋ฌ์ฌ ๋ encodingํ์ ์ ์ง์ ํด์ผ ์ค๋ฅ๊ฐ ๋์ง ์๋๋ค.
window7 ์ด์ ๊น์ง๋ ANSIํํ๋ก ๋ฉ๋ชจ์ฅ ๊ฐ์ ํ์ผ๋ค์ด ์ ์ฅ๋์ด ์๋๋ฐ
encoding='CP949'๋ก ์ฝ๋๋ค.
window10์ด์๋ถํฐ๋ UTF-8ํํ๊ฐ ๊ธฐ๋ณธ์ด๋ค.
+ ๋ถ๋ฌ์ฌ ํ์ผ์ UTF-8๋ก ์ ์ฅํ๋ ๊ฒ๋ ๋ฐฉ๋ฒ์ด๋ค.
๋ฐ์ดํฐ ์ง๊ณ
describe() :
null์ ์ ์ธํ ํต๊ณ์ ๋ณด๋ฅผ ๋ณด์ฌ์ค๋ค.
์ด๋ ๊ฒ ์๊ฐ์ ๋ฐ๋ผ ๋ฐ์ดํฐ๊ฐ ์์ด๋ ๊ฒ์ ์๊ณ์ด ๋ฐ์ดํฐ๋ผ๊ณ ํ๋ค.
df.describe(include='all')
→ ์ฐ์ ๋ฐ์ดํฐ ์ธ ๋ชจ๋ ์ด ํต๊ณ ์ ๋ณด ์ถ๋ ฅ.
pandas์ numpy์ ํ์คํธ์ฐจ ์ฐจ์ด
describe()ํจ์์ ํฌํจ๋ ํจ์๋ฅผ ๋ฐ๋ก ์ ์ฉํด ๋ณผ ์๋ ์๋ค.
df.count() :
๊ฒฐ์ธก์นnull์ ์ ์ธํ ๊ฐฏ์๋ฅผ ์ผ๋ค.
์ฌ๋ฌ ๊ฐ์ ์ด์ ๋ถ์ :
(mean, min, max, sum ๋ฑ ํจ์()) + List [ ]
๋ฐ์ํ
'๐ Python' ์นดํ ๊ณ ๋ฆฌ์ ๋ค๋ฅธ ๊ธ
[Python]DataFrame-์ด์ ์์๊ฐ, ํ์ ์์๊ฐ ๋ณ๊ฒฝ. ์์ ์ญ์ (0) | 2024.06.16 |
---|---|
[Python]DataFrame-์ด&ํ์ถ๊ฐ, ์์์ ํ (0) | 2024.06.14 |
[Python]pandas (0) | 2024.06.12 |
[Python]Numpy (1) | 2024.06.03 |
[Python]๊ฐ๋ฐํ๊ฒฝ๊ตฌ์ฑ2:์ฅฌํผํฐ ํ๋ฉด์ค์ (0) | 2024.06.03 |