본문 바로가기
독서-개인

데이터 드리븐 디자인씽킹 (에이블런)

by 당나귀🐴 2023. 3. 21.
데이터 엔지니어라는 데이터 직군에 있으면서,
내가 아는 부분에 대해서 알아가는 것 이외에
다가 속한 영역에 대한 궁금증이 커져갔다.

잡힌 업무를 빠르고 전문적으로 진행하는 것도 좋지만
어떤 배경으로 업무가 진행되는지와 내가 하는 일들이 어떤 프로세스에 속해있는지 궁금하던 찰나
이 책을 알게 되었다.

이 책은 특별한 통계적인 지식도, 데이터 엔지니어링도, 데이터 분석에 대한 내용을 잘 모르더라도
데이터 기반의 의사결정 과정을 한번 구경해볼 수 있는 책이다.

장점은 그런 프로세스를 한번 살펴보기에 책의 구성과 문장들이 참 쉽게 잘쓰여있는 것이며, 단점이라고 할건 없지만
책의 타겟팅이 깊이 있는 걸 찾으려는 독자를 위한 책은 아니다.

글을 쓰다가 날라갔다 .. 그래서 요약 중심으로 다시 쓴다...

 

이 책을 읽고 좋았던 점은

업무를 진행하면서 감으로, 경험으로 진행했던 부분을 누군가에게 이론 중심의 프로세스로 전달할 수 있다는 점이다. 새로운 동료가 들어왔을 때 "나는 이런식으로 일을 하고있어요" 라고 전달할 수 있고, 다른 동료에게 좋은 업무 방식을 도입하려고할 때  "이런식의 접근방법은 어떨까요" 를 경험에 의한 직관적인 방법보다 더 설득력있게 제안할 수 있을거라는 점이다.

 

---

디자인 씽킹은 - 사용자의 문제를 '공감' 중심으로 디자인 기반의 해결 방법을 제안하는 것이다. 

- 공감, 정의, 아이디어 도출, 프로토타입, 테스트를 중심으로 진행하는 과정이다. 

 

1. 공감

- 가장 중요한 단계이다.

- 비즈니스의 핵심 가치를 판단하여 데이터 사용의 목적과 목표를 명확히 수립하는 것이 중요하다!

- 데이터는 그 자체로 목적이나 메시지가 될 수 없다는 점을 명심해야한다. 즉, 데이터로 분석 및 해석을 전달하기 위해서 자신이 데이터로 어떤 문제를 해결하고 싶은지에 대한 목표 및 방향을 설정하는 것이 중요하다. 데이터 활용에 대한 설계나 기획이 제대로 되지 않은 상태에서 기능적인 스킬만 익힌다면 많은 어려움을 느낌 수 밖에 없다.

 

🎄 데이터 업무를 하면서 정말 공감이 많이 간 문장이다. 기획 및 전략팀에서는 데이터 수집만 요청하고 어떻게 활용되는지 명확하게 설명해주지 않는 경우가 있다. 이러한 업무는 데이터 수집을 진행하더라도 어떤 식으로 데이터가 전달되어야할지 모를뿐더러, 데이터를 전달하더라도 수많은 피드백 과정을 다시 한번 거쳐야하는 경우가 생긴다. 물론 많은 피드백을 받는 것도 좋지만 데이터의 활용 및 설계를 충분히 인지하면 각 데이터 직군에 맞는 고민을 서로가 하기 때문에 고민의 깊이가 달라질 수 있다.

 

(1) 공감방법 - 이슈트리 만들기

 

- 크고 복작한 문제를 작은 단위로 쪼개보는 것이다.

- 문제를 데이터를 통해 해결 가능한 부분과 불가능한 부분으로 분류한다.

- 이를 통해 좀 더 체계적인 계획을 수립할 수 있다.

 

(2) 공감방법 - 상관/회귀분석을 통해 데이터를 설명하기

[상관 관계]

- 산점도로 보이는 선형관계는 '상관 관계' 로 선형적 관계가 가장 높은 데이터를 찾아 볼 수 있다.

 

[회귀 분석]

- 특정 원인이 결과에 영향을 미치는지 찾아보는 것이다.

- 일반적으로 P-value 를 많이 사용한다.

- 하나의 요인이 영향을 주는지 확인해보려면 '단일' 회귀 분석, 여러 요인이 영향을 주는지 확인해보려면 '다중' 회귀분석을 이용한다.

 

2. 아이디어 도출

- 브레인 스토밍 :자유 발언을 통해 아이디어를 제시하고 발상을 찾아내는 과정

- 브레인 라이팅 : 해결할 주제에 대해 아이디어를 기록하고 다른 팀원과 교환하여 검토하는 방식

- 혁신 부트캠프 : 서로 다른 배경 및 비즈니스를 가진 사람이 모여 협업을 통해 다양한 관점에서 아이디어를 제안하는 것

- 불스 아이 : 유사 산업 및 이종 산업에서 영감을 받는 것

- 랜덤링크 : 고정관념을 탈피하기 위해 랜덤한 단어를 문제와 연관지어 보는것

- 스캠퍼 기법(Scamper) : 문제를 해결하기 위해 대체하기, 결합하기, 응용하기, 변형하기, 다른 용도로 사용하기, 제거하기, 반대로 하기 에해당 하는 질문들에 대해 답을 해보는 것

- 여섯 색깔 모자 사고 :정보, 직관, 위험성, 이점, 새가능성, 사과관리 의 모자를 쓰면서 해당 모자에 해당하는 사고만 집중하는 것

 

--------

데이터 분석 추가 공부! 

이 부분이 예전에 했던 통계학을 다시 공부해 보는것이 좋겠다!

 

상관관계 - '연속형 변수' 두 변수 간의 선형적 관계를 판단하는 것 

- 출저 : http://www.6025.co.kr/bbs/board.php?bo_table=cust_in&wr_id=13

피어슨, 스피어만 상관계수

- 스피어만 : 순위를 표현할 수 있는 서열척도 특징을 가진 변수들을 비교함 (ex. 키 등수)

- 피어슨 : 서열척도의 특징을 가지고 있으면서도 특정 간격을 기준으로 변수들을 나누어 표현할 수 있는 등간척도를 가진 변수들을 비교함(ex. 온도 10도 -> 20도, 올림픽이 5년마다 진행)

 

상관관계가 있다고 해서 원인과 결과라는 생각을 가지면 안된다!

 

변수 사이의 인과관계는 회귀분석을 통해 이루어진다.

 

독립변수와 종속변수

독립변수의 수에 따라 독립변수가 하나인 경우 단순 회귀분석, 여러개인 경우 다중 회귀 분석이라고 한다.

회귀분석에서는 P-value 가 많이 사용된다.

P-value 가 0.05 보다 낮으면 독립변수는 종속변수에 유의미한 영향을 미친다.

P-value 가 0.05 보다 높으면 독립변수와 종속변수는 관계 없다.

 

문제 가설의 정량적 검증을 위한 분석

T 검정 : 가설 집단이 두개일 때 사용 

분산 분석 : ANOVA 가설 집단이 세개 이상일 때 사용

분산 분석에서 사용하는 P-Value 는

P-Value 가 0.05보다 높으면 분산의 치우침이 크기 때문에 집단들간의 평균값에 유의미한 차이가 있다.

P-Value 가 0.05보다 낮으면 분산으 치우침이 작기 때문에 집단들간의 평균값에 유의미한 차이가 없다.