๐Ÿ Python

[Python]Machine Learning1:KNN, Decision Tree

๋‰ด์ด NUEY 2024. 6. 20. 15:18
๋ฐ˜์‘ํ˜•

 

K-Nearest Neighbors algorithm
→ ๋จธ์‹ ๋Ÿฌ๋‹์˜ ๋Œ€ํ‘œ์  ์•Œ๊ณ ๋ฆฌ์ฆ˜ ์ค‘ ํ•˜๋‚˜

์˜ํ™” ์ข…๋ฅ˜๋ฅผ ์ฐพ๋Š” ๊ฒฝ์šฐ

  • Machin Learning์€ ์•Œ๊ณ ๋ฆฌ์ฆ˜์„ ํ†ตํ•ด ๋ฐ์ดํ„ฐ๋ฅผ ๋ถ„์„ํ•ด ์•Œ์•„์„œ ๋ ˆ์ด๋ธ”์„ ์ฐพ๋Š”๋‹ค.
  • ์†์„ฑ์„ ํ†ตํ•ด ๋ ˆ์ด๋ธ”์ด Ramance์ธ์ง€ Action์ธ ์ง€ ์•Œ ์ˆ˜ ์žˆ๋‹ค.
  • ๊ตฌํ˜„๊ฐ€๋Šฅํ•œ ๋ ˆ์ด๋ธ”์˜ ์ข…๋ฅ˜
    • class : ๋ฒ”์ฃผํ˜•(category) : ๋ถ„๋ฅ˜๊ธฐ.
    • ์ •์ˆ˜, ์‹ค์ˆ˜(์ˆซ์ž) : ์ˆ˜์น˜ํ˜• : ์˜ˆ์ธก๊ธฐ.

  • KNN์ด๋ž€ ์•Œ๊ณ ๋ฆฌ์ฆ˜์„ ๋งŒ๋“ค์–ด์„œ import๋ฅผ ํ•œ ๊ฒฝ์šฐ์˜ ์ฝ”๋“œ์ด๋‹ค.
  • group์— labels๋ฅผ ๋ถ™์—ฌ์„œ ๋ถ„๋ฅ˜ํ–ˆ์„ ๋•Œ
    [1., 1.1] → A
    [1, 1.]  → A
    [0., 0.]  → B
    [0, 0.1]  → B
  • [0.2, 0.2]๋ผ๋Š” ์ž…๋ ฅ๊ฐ’์„ ์ฃผ๋ฉด
  • ์œ„ 4๊ฐœ์˜ ๋ฐ์ดํ„ฐ ์ค‘์—์„œ ๊ฐ€๊นŒ์šด 3๊ฐœ๋ฅผ ์ฐพ์œผ๋ฉด B, B, A์ด๋‹ค.
  • ๋”ฐ๋ผ์„œ ๋ ˆ์ด๋ธ” ๊ฒฐ๊ณผ๋Š” B์ด๋‹ค.
  • BBA์ด๊ธฐ ๋•Œ๋ฌธ์— B์ผ ํ™•๋ฅ ์„ 2/3, 75%๋ผ๊ณ  ํ•  ์ˆ˜ ์žˆ๋‹ค.

์นด๋ฉ”๋ผ ๊ฐ€๊ฒฉ Price๋ฅผ ์˜ˆ์ธกํ•ด๋ณด๋Š” ๊ฒฝ์šฐ
๊ฐ€๊นŒ์šด ๋ฐ์ดํ„ฐ์ž๋ฃŒ์— ๊ฐ€์ค‘์น˜๋ฅผ ๋”ํ•  ์ˆ˜ ์žˆ๋‹ค.


Decision Tree Classifier
→ ์˜์‚ฌ๊ฒฐ์ •ํŠธ๋ฆฌ.
๋ถ„๋ฅ˜๊ธฐ์˜ ๋Œ€ํ‘œ์  ์•Œ๊ณ ๋ฆฌ์ฆ˜.

๋ ˆ์ด๋ธ”: ๊ณผ์ผ์˜ ์ข…๋ฅ˜๋ฅผ ์ฐพ์•„๋ณด์ž.

  • ์†์„ฑ : Diameter ๊ธธ์ด์™€ Color ์ƒ‰์œผ๋กœ
  • ๋ ˆ์ด๋ธ”: ๊ณผ์ผ์˜ ์ข…๋ฅ˜๋ฅผ ์ฐพ์•„๋ณด๋ฉด 
  • ๊ธธ์ด์™€ ์ƒ‰ ์ค‘ ์–ด๋–ค ๊ฑธ๋กœ ๊ฐ€์ง€๋ฅผ ํƒ€๊ณ  ๋‚ด๋ ค๊ฐˆ ์ง€ ์• ๋งคํ•œ ๊ฒฝ์šฐ์—
    ์—”ํŠธ๋กœํ”ผ ์•Œ๊ณ ๋ฆฌ์ฆ˜์ด๋ผ๋Š” ๊ฒƒ์„ ์‚ฌ์šฉํ•  ์ˆ˜ ์žˆ๋‹ค.
  • ์—”ํŠธ๋กœํ”ผ๋กœ ๊ธธ์ด์™€ ์†์„ฑ ์ค‘ ์–ด๋–ค ๊ฑธ ๋จผ์ € ํ™•์ธํ•  ์ง€ ๋ถ„๋ฅ˜ํ•œ๋‹ค.
  • ์—”ํŠธ๋กœํ”ผ๋Š” ๊ณ„์‚ฐ์†๋„๊ฐ€ ์ตœ์ƒ์ด๋ผ๊ณ  ํ•œ๋‹ค.

์—”ํŠธ๋กœํ”ผ ๊ณ„์‚ฐ์„ ํ•ด๋ณด๋ฉด Apple์ด ๋‚˜์˜ค๋Š” ๊ฒƒ์„ ์•Œ ์ˆ˜ ์žˆ๋‹ค.

 

 

 

 

๋ฐ˜์‘ํ˜•