๐Ÿ Python

[Python]Data science

yeun.log 2024. 5. 28. 19:54
๋ฐ˜์‘ํ˜•

 

4์ฐจ ์‚ฐ์—…ํ˜๋ช…์ด๋ž€?
์ง€๋Šฅ AI์™€ ์ •๋ณด Big data & Cloud์˜ ์‹œ๋Œ€

 

  • ์ดˆ์—ฐ๊ฒฐ
    • ์ปดํ“จํ„ฐ ํ”„๋กœ๊ทธ๋žจ
      ์‚ฌ๋ฌผ์ธํ„ฐ๋„ท(IoT)๊ณผ 5์„ธ๋Œ€ ํ†ต์‹ (5G)์œผ๋กœ ์‚ฌ๋ฌผ๊ณผ ์ธํ„ฐ๋„ท์˜ ์ƒํ˜ธ์˜์กด์„ฑ์ด ๋ฌดํ•œ ํ™•์žฅ๋œ๋‹ค.
    • ์‚ฌ๋ฌผ ์ธํ„ฐ๋„ท
      RFIDํƒœ๊ทธ๋ฅผ ๋ถ€์ฐฉํ•˜์—ฌ ์ •๋ณด๋ฅผ ์ˆ˜์ง‘ํ•˜๋Š”, ๋‹จ์ˆœํ•œ ์„ผ์„œ ๋„คํŠธ์›Œํฌ์—์„œ
      ์‚ฌ๋ฌผ๊ณผ ์‚ฌ๋ฌผ๊ฐ„ ํ†ต์‹ ํ•˜๋Š” M2M์œผ๋กœ ๋ฐœ์ „ํ•˜์˜€๋‹ค.
      ์‚ฌ๋žŒ, ์—…๋ฌด, ๋ฐ์ดํ„ฐ๊นŒ์ง€ ๋ชจ๋“  ๊ฒƒ์ด ์—ฐ๊ฒฐ๋˜์–ด ์ƒํ˜ธ ํ†ต์‹ ํ•˜๋Š” ๋งŒ๋ฌผ์ธํ„ฐ๋„ท(IoE)๋กœ ๋ฐœ์ „ํ•  ์ „๋ง.
  • ์ดˆ์ง€๋Šฅ
    • ์ดˆ์ง€๋Šฅ - Hyper intelligence
      ์ธ๊ฐ„์˜ ์ง€๋Šฅ๊ณผ ์ธ๊ณต์ง€๋Šฅ์ด ํ˜‘๋ ฅํ•˜์—ฌ ๋” ์Šค๋งˆํŠธํ•œ ์„œ๋น„์Šค๋ฅผ ์ œ๊ณตํ•˜๋Š” ๊ฒƒ.
    • ์ดˆ์ง€๋Šฅ - Super intelligence
      ์ธ๊ณต์ง€๋Šฅ์˜ ์ง€๋Šฅ์ด ์ธ๊ฐ„์„ ๋„˜์–ด์„œ๋Š” ํŠน์ด์ ์ด ์˜จ ๊ฒฝ์šฐ.
      ํ•˜์ดํผ ์ธํ…”๋ฆฌ์ „์Šค → ์Šˆํผ ์ธํ…”๋ฆฌ์ „์Šค๋กœ ์ง„ํ™”ํ•˜๋Š” ์ธ๊ณต์ง€๋Šฅ.
    • Big Data
      ์ดˆ์ง€๋Šฅ์˜ ์›๋ฃŒ.
      ๋””์ง€ํ„ธ ํ™˜๊ฒฝ์—์„œ ๋ฐœ์ƒํ•˜๋Š” ๋ชจ๋“  Data.

 

 

๋ฐ์ดํ„ฐ ๊ณผํ•™์—์„œ
IoT / 5G & internet /  AI
  • IoT
    ๋ˆˆ, ์ฝ”, ์ž…๊ณผ ๊ฐ™์ด ๊ฐ๊ฐ ๋ฐ ํ–‰๋™์„ ์ธ์ง€.
  • 5G & internet
    ์ธ์ง€๋œ ์ž๊ทน๊ณผ ๋ช…๋ น์„ ์ „๋‹ฌํ•˜๋Š” ์‹ ๊ฒฝ๊ณ„
  • AI
    ์ธ์ง€๋œ ์ž๊ทน์„ ์ฒ˜๋ฆฌํ•˜๊ณ  ๋ถ„์„ํ•˜์—ฌ ๋ช…๋ น์„ ๋‚ด๋ฆฌ๋Š” ๋‘๋‡Œ์—ญํ• .

 

๋ฐ์ดํ„ฐ ๋ถ„์„์—
Python์„ ์‚ฌ์šฉํ•˜๋Š” ์ด์œ 

 

์ด๋Ÿฌํ•œ ๋งŽ์€ Library ๋•Œ๋ฌธ์— Python์„ ์‚ฌ์šฉํ•œ๋‹ค๊ณ  ๋ณผ ์ˆ˜ ์žˆ๋‹ค.

์•„๋‚˜์ฝ˜๋‹ค ํ™˜๊ฒฝ์— ๋ชจ๋‘ ๋“ค์–ด์žˆ๋Š” Library๋“ค์ด๋‹ค.

  • Interactive environment
    ๋ง ๊ทธ๋Œ€๋กœ ์ƒํ˜ธํ™˜๊ฒฝ
  • Data Manipulataion Library
    pandas. ๋ฐ์ดํ„ฐ๋ฅผ ๋‹ค๋ฃฌ๋‹ค
  • Visualisation Library
    matplotlib, seaborn. ๊ทธ๋ž˜ํ”„ ๊ฐ™์€ ์‹œ๊ฐํ™”

 

Python์œผ๋กœ ํ•  ์ˆ˜ ์žˆ๋Š” ์ผ๋“ค

  • Machine Learning / State
    ํ†ต๊ณ„.
    1990~2010๋…„๊นŒ์ง€ ๋จธ์‹ ๋Ÿฌ๋‹์˜ ์‹œ๋Œ€๋ผ๊ณ  ๋ถ€๋ฅธ๋‹ค.
  • Scientific Computing
    ๊ณผํ•™๊ณ„์‚ฐ.
  • Distributed Systems
    Big Data๋ฅผ ์ฒ˜๋ฆฌ.
    Hadoop ์œ„์— ์–น์–ด์ง„ Spark๋ฅผ Python์„ ์ด์šฏํ•ด ๋‹ค๋ฃฐ ์ˆ˜ ์žˆ๋‹ค.
  • Web
    Flask์™€ django ๊ฐ™์€ Framework.
  • Analytics
    ๋ถ„์„. pandas

 

Data science running path

 


 

ํ•„์ˆ˜ ๋ผ์ด๋ธŒ๋Ÿฌ๋ฆฌ

 


Numpy
  • ๋‹ค์ฐจ์› ๋ฐฐ์—ด ndarry
  • ์ˆ˜์น˜๊ณ„์‚ฐ์„ ๋น ๋ฅด๊ฒŒ ํ•  ์ˆ˜ ์žˆ๋‹ค.
    ๋‚ด๋ถ€์ ์œผ๋กœ C++๋กœ ๋˜์–ด์žˆ๊ธฐ ๋•Œ๋ฌธ์—.
  • ์„ ํ˜•๋Œ€์ˆ˜, ํ‘ธ๋ฆฌ์— ๋ณ€ํ™˜, ๋žœ๋ค ๋„˜๋ฒ„ ๋“ฑ์˜ ํ•จ์ˆ˜๋ฅผ ์ œ๊ณต
  • pandas๊ฐ€ Numpy ๊ธฐ๋ฐ˜.
  • ๋”ฐ๋ผ์„œ Data๋ถ„์„์˜ ๊ธฐ๋ณธ์ด ๋˜๋Š” Library์ด๋‹ค.

Pandas
  • panel data analysis์˜ ์ค„์ž„๋ง.
    ๋‹ค์ฐจ์› ๊ตฌ์กฐํ™”๋œ ๋ฐ์ดํ„ฐ.
  • ๋ฐ์ดํ„ฐ ๋ถ„์„์šฉ.
  • ์‹œ๊ณ„์—ด ๋ฐ์ดํ„ฐ ๊ธฐ๋Šฅ ํ†ตํ•ฉ.
  • R ํ˜น์€ Matlab ๊ฐœ๋ฐœ์–ธ์–ด๋ฅผ ์‚ฌ์šฉํ–ˆ๋˜ ์‚ฌ๋žŒ๋“ค์ด ์ ‘๊ทผํ•˜๊ธฐ ์šฉ์ด.

 

๋ฐ˜์‘ํ˜•