Python 35

[Python]Excel로 저장&불러오기

데이터 전처리  파일의 기본 요소인 레코드를 기반으로 이들의 필드를 조작하는 것을 말한다.데이터 효율성을 높이기 위해 중요한 것은 데이터를 체계적으로 수집하는 과정이다.→ 수집을 위해 DBMS(데이터베이스 관리 시스템)를 사용하는 것이 좋다.  Pandas제공 함수  ※ csv파일이 표준이다.※ Json파일과 가장 비슷한 Python언어는 Dictionary이다.  openpyxl 라이브러리의 to_excel() 함수를 사용.→ 아나콘다에 포함되어 있다. 엑셀파일로 저장하기pandas.to_excel('저장할 파일명.xlsx')   excel sheet 여러 개로 저장= dataFrame 여러 개로 저장변수명 =panda.ExcelWriter{'저장할 파일명.xlsx'}df_01.to_excel(변수명,..

🐍 Python 2024.06.16

[Python]DataFrame-열의 원소값, 행의 원소값 변경. 원소 삭제

동양에서는 가로, 세로로 읽지만서양 중심적으로는 세로, 가로로 읽는다.가로 = 열 column세로 = 행 row따라서 함수를 사용할 때 행, 열순으로 적는 게 일반적이다.열 원소값 변경df.loc['행이름','열이름']=원소값&df.iloc[행index,열index]=원소값 행 원소값 변경df.loc['행이름','열이름1':'열이름2']=원소값&df.iloc[행index,열index시작:index종료+1]=원소값  DataFrame 선언시index 설정padas.DataFrame(data, index=설정데이터)행 삭제원본df를 복사한다.변수명 = df.copy()복사한 변수에서 행 삭제.변수명.drop('행index', axis=0, inplace=True)행을 삭제하고 싶으면 axis = 0열을 삭제..

🐍 Python 2024.06.16

[Python]DataFrame-열&행추가, 원소선택

python에서는 위와 같이 첫글자가 대문자로 시작하는 게 Class이다.이렇게 만들어진 객체를 생성자라고 한다. 열column 추가df['추가할 열 이름']=데이터 값행row 추가기존의 index와 겹치면 안된다.→ 만약 index가 겹치게 되면 기존 행의 원소 값이 변경된다.loc['추가할 행 index'] = [원소1, 원소2...원소n] 을 이용. 하나만 선택하는 단독 원소 선택과 여러 개 선택하는 방법 두가지가 있다.먼저 단독 원소 선택을 알아보자. set_index('컬럼명', inplace=True)컬럼을 새로운 index로 지정inplace=True→ 실행된 결과가 즉각 반영되게 한다.단독 원소 선택loc['행이름', '열이름']&iloc[좌표번호, 좌표번호]iloc는 index locat..

🐍 Python 2024.06.14

[Python]pandas

pandas Cheat Sheet :요약본pandas특징 빠르고 효율적이며 다양한 표현력을 갖춘 자료 구조.실세계 데이터 분석을 위해 만들어진 파이썬 패키지.다양한 형태의 데이터에 적합.이종 자료형의 열을 가진 테이블 데이터.시계열 데이터.(날씨와 주가처럼 시간에 따라 변하는 데이터)레이블(제목)을 가진 다양한 행렬 데이터.다양한 관측 통계 데이터.핵심 구죠.series : 1차원 구조를 가진 하나의 열.DataFrame : 복수의 열을 가진 2차원 데이터.(엑셀 시트 하나와 같다.)pandas가 잘하는 일.결측 데이터 처리.(중간중간 데이터가 빠진 경우를 잘 처리한다)데이터 추가/삭제.데이터 정렬과 다양한 데이터 조작.※ pandas는 'panel data'라는계량경제학분야 용어에서 유래되었다.※ im..

🐍 Python 2024.06.12

[Python]Numpy

Numpy Cheat Sheet :Numpy 요약본 Numpy란?numerical python의 약자.데이터 과학을 위한 Library 중 가장 기본.다차원 배열을 효율적으로 다룬다.같은 자료형으로만 저장 가능.같은 자료형으로만 저장시, 각 데이터 항목에 필요한 저장공간이 일정.→ 따라서 몇 번째 위치에 있는 항목이든 순서만 안다면, 간단한 계산으로 접근 가능. 활용.shape : 객체의 형상. 튜플형(m, n) 그대로 보여줌..ndim :  몇 차원인 지..dtype : 자료형은 무엇인지..size : 크기. 몇 개가 들었는 지. Tab으로 함수목록 확인numpy. 뒤에 커서를 두고 Tab 버튼을 누르면 사용가능한 함수목록을 보여준다.2차원 배열 123456  사칙연산 같은 index위치의 값끼리 사칙..

🐍 Python 2024.06.03

[Python]딥러닝 예제실습

이진 분류란?결과값이 적힌 data를 학습한 후입력된 데이터가 어떤 group에 속하는 지 찾아내는 방법특히 둘 중 하나를 결정하는 걸 이진 분류라고 한다.ex)스팸메일인가 아닌가 필요한 Librarynumpy : data 생성할 때 필요(배열로 반환)tensorflow : google에서 제공○ keras : model을 구성하는데 필요matplotlib : 그래프를 만드는데 필요import numpy as npfrom tensorflow.keras.models import Sequentialfrom tensorflow.keras.layers import Densefrom tensorflow.keras import optimizers%matplotlib inlineimport matplotlib.pyp..

🐍 Python 2024.05.22
반응형