Aivle/Python

· Aivle/Python
지난 포스팅에서는 수치, 범주형 데이터별 단변량 분석을 정리했다. 이번 포스팅에서는 단변량을 넘어, x / y 축간의 관계를 확인하는 이변량 분석에 대해 알아보자. 단변량 분석과 동일하게 시각화, 수치화를 활용하지만 이변량 분석은 가설검정 도구를 활용해 수치화를 진행한다. 먼저, 가설검정이란 무엇인지 정리해보자. 가설검정이변량 분석에서 가설 감정은 두 변수 간의 관계를 분석하는데 중요한 역할을 수행한다. 가설검정은 귀무가설(H0)과 대립가설(H1)을 설정하고, 데이터가 귀무가설을 기각할 만큼 충분한 증거가 있는지를 평가한다.귀무가설 : 연구자가 검증하고자 하는 기존 가정 또는 주장이다. 일반적으로 두 집단 간의 차이가 없다거나, 두 변수 간의 관계가 없다는 가정을 나타낸다.대립가설 : 귀무가설과 반대되는..
· Aivle/Python
이번 포스팅은 Python에서 시각화 라이브러리를 활용한 단변량 분석을 정리했다. 대표적인 시각화 라이브러리로는 matplotlib와 seaborn이 있으며, 그림으로 변수에 대한 특성을 파악할 수 있다. 수치형 변수와 범주형 변수 모두 단변량 분석을 진행할 수 있는데, 먼저 수치형 변수에 대해 알아보자. 수치형 변수단변량 분석은 하나의 변수에 대한 특성을 파악하는 것이다. 수치형 변수의 경우 대푯값과 분포 특성을 파악하는 것이 중요하다. Python의 Pandas와 Seaborn을 활용해서, 특성을 알아보자.import pandas as pdimport seaborn as snsimport matplotlib.pyplot as plt# 예제 데이터 생성data = pd.DataFrame({'age': ..
· Aivle/Python
이번 포스팅에서는 Python의 핵심 library인 Pandas를 알아보자. Pandas의 핵심은 'DataFrame' 이라는 데이터 구조에 있다. Dataframe은 행과 열로 이루어진 테이블 형태의 데이터 구조로, 각 열은 서로 다른 데이터 타입(정수, 실수, 문자열 등)을 가질 수 있다. 이를 통해 우리가 실제 데이터 분석 과정에서 자주 등장하는 복잡한 형태의 데이터를 쉽게 다룰 수 있다. Pandas는 여러가지 기능을 제공하지만, 대표적으로 다음과 같은 기능을 사용한다. 데이터의 로딩, 저장 : 다양한 파일 형식(csv, excel, DB 등)과의 데이터 입출력을 지원한다.데이터 정제 및 준비 : 결측치 처리, 데이터 형 변환, 필터링 등 데이터를 분석하기 전에 필요한 다양한 전처리를 수행데이터..
· Aivle/Python
자료형을 정리했으니, 이제 자료형을 활용하는 방안을 정리해보자. 여러가지 방법이 있지만, 이번 포스팅에서는 제어문과 함수를 사용해 원하는 결과를 출력해보자. Python에서는 코드의 실행 흐름을 제어하기 위해 '제어문'을 사용한다. 주로 조건 및 반복 처리를 위한 logic 작성에 필요하며, 들여쓰기를 통해 블럭을 지정한다. if문if문은 특정 조건이 만족될 때 코드를 실행하는 제어문이다.  단순 if문 : 조건이 참일 경우에만 처리하고, 조건이 거짓인 경우에는 아무런 처리도 하지 않는다.if ~ else문 : 조건이 참인 경우와 거짓인 경우를 각각 처리한다.if ~ elif ~ else문 : 여러 조건 중 참인 경우를 각각 처리하며, 모든 조건이 거짓인 경우에 대한 처리도 가능하다.# 단순 if문x =..
머동
'Aivle/Python' 카테고리의 글 목록