AI와 친해지기

ChatGPT와 함께 데이터 분석 배우기

insight발자국 2025. 2. 16. 11:20

📊 ChatGPT와 함께 데이터 분석 배우기 (Python Pandas 활용)

 

데이터 분석을 배우고 싶지만 어디서부터 시작해야 할지 막막하신가요? 🤔
ChatGPT를 활용하면 Python과 Pandas를 이용한 데이터 분석에 대한 개념을 쉽게 배울 수 있을거에요! 🚀

Pandas는 데이터 분석을 위한 가장 강력하고 필수적인 라이브러리에요.
이번 글에서는 ChatGPT를 활용하여 Pandas의 기본 기능을 배우고, 데이터 분석을 연습하는 방법을 살펴볼게요. 😊


✅ 1. Pandas란 무엇인가요?

Pandas는 Python에서 데이터를 쉽게 다룰 수 있도록 도와주는 라이브러리입니다.

📌 Pandas의 주요 기능:

  • CSV, Excel, JSON 등의 데이터 파일을 쉽게 읽고 저장할 수 있음
  • 데이터 정리, 필터링, 그룹화 등의 다양한 기능 제공
  • 강력한 데이터 분석 및 시각화 기능 지원

ChatGPT를 활용하면 코드를 직접 생성하고 실습을 도와줄 수 있어 더욱 효과적인 학습이 가능합니다. 🎯


✅ 2. Pandas 설치 및 기본 사용법

📌 Pandas 설치하기

Pandas가 설치되어 있지 않다면, 먼저 설치해 주세요:

pip install pandas

📌 데이터 불러오기

ChatGPT에게 Pandas 기본 문법을 요청하면 쉽게 따라 할 수 있습니다.

import pandas as pd

# CSV 파일 불러오기
df = pd.read_csv("data.csv")
print(df.head())

 출력 결과 (예시)

     이름  나이    직업
0  김철수  25   개발자
1  이영희  30   마케팅
2  박지훈  27   디자이너

📌 df.head()를 사용하면 데이터의 처음 5개 행을 미리보기할 수 있어요.


✅ 3. ChatGPT를 활용한 데이터 분석 기초

ChatGPT를 활용하면 데이터 프레임을 다루는 방법을 빠르게 배울 수 있습니다!

📌 특정 열만 가져오기

print(df[["이름", "직업"]])

 출력 결과

     이름    직업
0  김철수   개발자
1  이영희   마케팅
2  박지훈   디자이너

📌 특정 조건을 만족하는 데이터 필터링

filtered_df = df[df["나이"] > 27]
print(filtered_df)

 출력 결과

     이름  나이    직업
1  이영희  30   마케팅
2  박지훈  27   디자이너

📌 ChatGPT에게 "Pandas에서 특정 조건의 행을 추출하는 방법"을 질문하면 다양한 예제를 제공받을 수 있어요!


✅ 4. ChatGPT를 활용한 데이터 정리 및 변형

데이터 분석에서는 데이터 정리 및 변형이 필수입니다. ChatGPT를 활용하면 복잡한 기능도 쉽게 배울 수 있습니다! 😊

📌 새로운 열(Column) 추가하기

df["연봉"] = [5000, 6000, 5500]
print(df)

 출력 결과

     이름  나이    직업   연봉
0  김철수  25   개발자  5000
1  이영희  30   마케팅  6000
2  박지훈  27   디자이너  5500

📌 df["새로운 열"] = 값 형태로 쉽게 열을 추가할 수 있어요.

📌 데이터 정렬하기

sorted_df = df.sort_values(by="나이", ascending=False)
print(sorted_df)

📌 ChatGPT에게 "Pandas에서 데이터를 특정 열 기준으로 정렬하는 방법"을 물어보면 다양한 정렬 방식도 배울 수 있습니다.


✅ 5. 실전 데이터 분석 – ChatGPT와 함께 연습하기

✏️ 실습 문제 1: 평균 나이 구하기

📌 Pandas를 이용해 data.csv의 평균 나이를 계산하세요.

average_age = df["나이"].mean()
print("평균 나이:", average_age)

 출력 결과 (예시)

평균 나이: 27.3

✏️ 실습 문제 2: 특정 직업군 필터링

📌 직업이 '개발자'인 데이터만 출력하는 코드를 작성하세요.

developers = df[df["직업"] == "개발자"]
print(developers)

 출력 결과 (예시)

     이름  나이    직업
0  김철수  25   개발자

📌 ChatGPT에게 "특정 값을 가진 데이터 필터링하는 방법"을 요청하면 다양한 예제와 함께 배울 수 있어요!


📢 6. 마무리 및 다음 학습

이 글에서는 ChatGPT와 함께 Pandas를 활용한 데이터 분석을 배웠습니다. 😊

🔥 핵심 정리

 Pandas는 데이터 분석을 쉽게 해주는 필수 라이브러리 
 
ChatGPT를 활용해 Pandas 기본 문법과 실전 문제를 쉽게 학습 가능 
 
필터링, 정렬, 새로운 열 추가 등 다양한 기능을 연습할 수 있음