Back to Insights
Tech & Insights

피어슨 상관계수 이해하기 - 상관관계 분석의 기초

전략팀전략팀 · 디사일로
·

   

데이터・통계 관련 직군에 계신다면, 피어슨 상관계수라는 용어를 많이 들어보였을 거예요. 그러나 이를 실무에서 어떻게 활용하면 되는지도 정확히 이해하고 계신가요?

이번 글에서는 피어슨 상관계수의 기본적인 개념부터 실무에 어떻게 활용할 수 있는지까지 쉽게 풀어드리겠습니다.

Pearson 상관계수는 데이터 분석에서 가장 기본이 되는 개념 중 하나인데요. 통계를 전공하지 않으신 분들도 부담 없이 따라오실 수 있도록 준비했습니다.    

피어슨 상관계수 이해하기

💡 피어슨 상관계수 정의, 의미, 예시

 

피어슨 상관계수란, 두 변수 간의 '관계'를 하나의 숫자로 나타낸 것입니다.

칼 피어슨(Karl Pearson)이 개발한 상관계수여서 Pearson 상관계수(Pearson Correlation Coefficient ,PCC)로 부르며, 적률상관계수(Product-moment Correlation Coefficient)라고도 하죠. 일반적으로 상관계수라고 하면 피어슨 상관계수를 가리킵니다.  

쉽게 예시를 들어보면, 아래와 같은 두 요소 간의 관계를 -1에서 +1 사이의 숫자로 표현한 것이라고 이해하실 수 있습니다.

  • 광고비와 매출
  • 운동시간과 칼로리 소모
  • 가격과 구매량
  • 온라인 체류시간과 구매금액
  • SNS 게시물 수와 팔로워 증가율    

📍 +1,-1, 0 숫자의 의미는?

  +1에 가까울수록: 강한 양의 상관관계

  • 예: 광고비 증가 → 매출 증가
  • 예: 운동시간 증가 → 칼로리 소모 증가  

0에 가까울수록: 상관관계가 거의 없음

  • 예: 신발 사이즈와 학력
  • 예: 혈액형과 성격  

-1에 가까울수록: 강한 음의 상관관계

  • 예: 가격 인상 → 구매량 감소
  • 예: 평균 기온 상승 → 겨울옷 판매 감소  

피어슨상관계수예시.png
피어슨 상관계수 예시

   

피어슨 상관계수 해석 및 활용 방법

📈 실무에서 어떻게 활용할까?

 

Pearson 상관계수는 마케팅, 고객 행동 분석, 제품 개발 등에서 활용됩니다.

광고 지출과 매출, SNS 활동과 브랜드 인지도, 웹사이트 체류시간과 구매 전환율 등 다양한 요소 간의 관계를 분석해 예산 배분, 고객 충성도 향상, 제품 개선, 가격 전략 최적화에 도움을 줍니다.

이를 통해 데이터 기반의 의사결정을 지원하고 성과를 향상시킬 수 있습니다.  

  1. 마케팅 효과 측정

    • 광고 지출과 매출 간의 상관관계 분석
    • SNS 활동과 브랜드 인지도의 관계 파악  
  2. 고객 행동 분석

    • 웹사이트 체류시간과 구매 전환율의 관계
    • 회원 등급과 월평균 구매액의 관계  
  3. 제품 개발

    • 제품 사용 시간과 고객 만족도의 관계
    • 가격대와 구매 의향의 관계    

피어슨 상관계수 분석 활용 시 주의할 점

Pearson 상관계수를 활용할 때 주의할 점엔 크게 두 가지가 있습니다. 실무에 활용하실 때는 더 신경쓰며 보셔야하는 것들인데요.  

1. 상관관계는 인과관계가 아닙니다.

"아이스크림 판매량과 익사 사고"는 높은 상관관계를 보이지만, 아이스크림이 익사 사고의 원인은 아닙니다. 둘 다 '더운 날씨'라는 제3의 요인에 영향을 받는 것이죠.  

2. 맥락을 고려해야합니다.

같은 상관계수라도 업종, 시장, 시기에 따라 다른 의미를 가질 수 있습니다.

예시) 0.3이라는 같은 수치도 화장품 업계와 자동차 업계에서는 다른 의미를 가질 수 있습니다.

  데이터를 분석할 때는 상관관계가 곧 인과관계는 아니라는 점, 그리고 맥락에 따라 의미가 달라질 수 있다는 점을 주의해야 합니다.

 

scott-graham-5fNmWej4tAA-unsplash 중간.jpeg

 

💡 실무 활용 팁

상관관계 분석 시, 산점도로 시각화하고, 정기적으로 모니터링하며, 여러 변수를 함께 분석하면 더 깊은 인사이트를 얻을 수 있습니다.  

1. 시각화하기

  • 숫자만 보지 말고, 반드시 산점도 그래프로 그려보세요.
  • 간혹 비선형적 관계나 이상치를 발견할 수 있습니다.  

2. 정기적으로 모니터링하기

  • 상관관계는 시간에 따라 변할 수 있습니다.
  • 분기별/연도별로 추적하면 트렌드 변화를 포착할 수 있습니다.  

3. 여러 변수 함께 보기

  • 한 번에 여러 변수 간의 상관관계를 분석하면 더 풍부한 인사이트를 얻을 수 있습니다.      

이제 Pearson 상관계수가 조금은 친숙하게 느껴지시나요?

실무에서 데이터를 분석할 때 이 개념을 활용하시면, 보다 객관적이고 과학적인 의사결정을 하실 수 있을 거예요!      

 

✅ 함께 읽으면 좋은 콘텐츠

 

유저들의 구독서비스 결제데이터를 우리 기업 마케팅에 활용하기

소상공인 카드매출 회복 추이 분석에서 비즈니스 인사이트 얻기

 

데이터 분석에 관해 더 자세한 내용이 궁금하시다면 우측 하단의 버튼을 클릭하시고, 문의를 남겨주세요!

     

데이터분석MI