업계 인사이트

피어슨 상관계수 이해하기 - 상관관계 분석의 기초

피어슨 상관계수 이해하기 - 상관관계 분석의 기초

pinned
pinned
pet_use_case
pet_use_case
writer_title
디사일로
writer_image
author default profile.svg
writer_name
전략팀
date
Nov 20, 2024
tags
데이터분석
MI
category
Industry insight
thumbnail
pexels-anna-nekrashevich-6801648.jpg
language
ko
데이터・통계 관련 직군에 계신다면, 피어슨 상관계수라는 용어를 많이 들어보였을 거예요. 그러나 이를 실무에서 어떻게 활용하면 되는지도 정확히 이해하고 계신가요?
이번 글에서는 피어슨 상관계수의 기본적인 개념부터 실무에 어떻게 활용할 수 있는지까지 쉽게 풀어드리겠습니다.
 
'Pearson 상관계수'는 데이터 분석에서 가장 기본이 되는 개념 중 하나인데요. 통계를 전공하지 않으신 분들도 부담 없이 따라오실 수 있도록 준비했습니다.
 

피어슨 상관계수 이해하기

💡 피어슨 상관계수 정의, 의미, 예시

피어슨 상관계수란, 두 변수 간의 '관계'를 하나의 숫자로 나타낸 것입니다.
칼 피어슨(Karl Pearson)이 개발한 상관계수여서 Pearson 상관계수(Pearson Correlation Coefficient ,PCC)로 부르며, 적률상관계수(Product-moment Correlation Coefficient)라고도 하죠. 일반적으로 상관계수라고 하면 피어슨 상관계수를 가리킵니다.
 
쉽게 예시를 들어보면, 아래와 같은 두 요소 간의 관계를 -1에서 +1 사이의 숫자로 표현한 것이라고 이해하실 수 있습니다.
  • 광고비와 매출
  • 운동시간과 칼로리 소모
  • 가격과 구매량
  • 온라인 체류시간과 구매금액
  • SNS 게시물 수와 팔로워 증가율
 

📍 +1,-1, 0 숫자의 의미는?

+1에 가까울수록: 강한 양의 상관관계
  • 예: 광고비 증가 → 매출 증가
  • 예: 운동시간 증가 → 칼로리 소모 증가
 
 
0에 가까울수록: 상관관계가 거의 없음
  • 예: 신발 사이즈와 학력
  • 예: 혈액형과 성격
 
-1에 가까울수록: 강한 음의 상관관계
  • 예: 가격 인상 → 구매량 감소
  • 예: 평균 기온 상승 → 겨울옷 판매 감소
 
피어슨 상관계수 예시
피어슨 상관계수 예시
 
 

피어슨 상관계수 해석 및 활용 방법

📈 실무에서 어떻게 활용할까?

 
Pearson 상관계수는 마케팅, 고객 행동 분석, 제품 개발 등에서 활용됩니다.
광고 지출과 매출, SNS 활동과 브랜드 인지도, 웹사이트 체류시간과 구매 전환율 등 다양한 요소 간의 관계를 분석해 예산 배분, 고객 충성도 향상, 제품 개선, 가격 전략 최적화에 도움을 줍니다.
이를 통해 데이터 기반의 의사결정을 지원하고 성과를 향상시킬 수 있습니다.
 
  1. 마케팅 효과 측정
      • 광고 지출과 매출 간의 상관관계 분석
      • SNS 활동과 브랜드 인지도의 관계 파악
  1. 고객 행동 분석
      • 웹사이트 체류시간과 구매 전환율의 관계
      • 회원 등급과 월평균 구매액의 관계
  1. 제품 개발
      • 제품 사용 시간과 고객 만족도의 관계
      • 가격대와 구매 의향의 관계
 
 

피어슨 상관계수 분석 활용 시 주의할 점

 
Pearson 상관계수를 활용할 때 주의할 점엔 크게 두 가지가 있습니다. 실무에 활용하실 때는 더 신경쓰며 보셔야하는 것들인데요.

1. 상관관계는 인과관계가 아닙니다.

"아이스크림 판매량과 익사 사고"는 높은 상관관계를 보이지만, 아이스크림이 익사 사고의 원인은 아닙니다. 둘 다 '더운 날씨'라는 제3의 요인에 영향을 받는 것이죠.

2. 맥락을 고려해야합니다.

같은 상관계수라도 업종, 시장, 시기에 따라 다른 의미를 가질 수 있습니다.
예시) 0.3이라는 같은 수치도 화장품 업계와 자동차 업계에서는 다른 의미를 가질 수 있습니다.
 
 
데이터를 분석할 때는 상관관계가 곧 인과관계는 아니라는 점, 그리고 맥락에 따라 의미가 달라질 수 있다는 점을 주의해야 합니다.
데이터를 분석할 때는 상관관계가 곧 인과관계는 아니라는 점, 그리고 맥락에 따라 의미가 달라질 수 있다는 점을 주의해야 합니다.
 
 

💡 실무 활용 팁

 
상관관계 분석 시, 산점도로 시각화하고, 정기적으로 모니터링하며, 여러 변수를 함께 분석하면 더 깊은 인사이트를 얻을 수 있습니다.
 

1. 시각화하기

  • 숫자만 보지 말고, 반드시 산점도 그래프로 그려보세요.
  • 간혹 비선형적 관계나 이상치를 발견할 수 있습니다.

2. 정기적으로 모니터링하기

  • 상관관계는 시간에 따라 변할 수 있습니다.
  • 분기별/연도별로 추적하면 트렌드 변화를 포착할 수 있습니다.

3. 여러 변수 함께 보기

  • 한 번에 여러 변수 간의 상관관계를 분석하면 더 풍부한 인사이트를 얻을 수 있습니다.
 
 
이제 Pearson 상관계수가 조금은 친숙하게 느껴지시나요?
실무에서 데이터를 분석할 때 이 개념을 활용하시면, 보다 객관적이고 과학적인 의사결정을 하실 수 있을 거예요!
 
 
 

✅ 함께 읽으면 좋은 콘텐츠

유저들의 구독서비스 결제데이터를 우리 기업 마케팅에 활용하기

소상공인 카드매출 회복 추이 분석에서 비즈니스 인사이트 얻기

 
 
 
데이터 분석에 관해 더 자세한 내용이 궁금하시다면 우측 하단의 버튼을 클릭하시고, 문의를 남겨주세요!