미리 준비해 두면 야근이 줄어든다
분석가는 쿼리 머신이 아닙니다. 그렇게 되면 분석가 자신도 회사도 모두 힘들어집니다. 하지만 회사에서 분석가는 쿼리 머신처럼 부려집니다. 퇴근을 해도 갑자기 무슨 데이터를 뽑아 달라고 합니다. 휴가를 썼는데도 급히 연락이 와서 내일 보고할 무언가를 뽑아 달라고 합니다. 간단한 것이라도 짜증 나지만 복잡한 것도 있습니다. 오늘 할 이야기는 간단한 쪽 이야기입니다.
수년간 회사에서 엑셀을 주로 쓰는 사업, 기획, 경영 혹은 마케팅 관련 직무 분들과 일하면서 느낀 점은 엑셀을 쓰는 사람에 맞게 SQL이나 Python으로 뽑은 데이터를 준비해 놓고 주어야 한다는 것입니다. 당연한 이야기처럼 들리지만 조금 더 풀어 설명하면,
엑셀에 raw-data를 올려놓고 비즈니스 로직을 타는 것은 엑셀에 수식을 걸어서 자료 만들기
평균이나 합계 표준편차 같은 기술적 통계 숫자들을 범주화시킬 수 있다면 분위수로 범주를 걸어 두기
탐색적 분석을 할 때 하는 변수별 기술 통계를 아예 별도의 페이지에 넣기
raw-data는 최대한 가공 지표가 덜 들어간 상태로 뽑아서 시트에 옮겨 두기
코드를 짤 때 '이게 대시보드가 될 수도 있다'란 생각으로 구조를 짜기
이 정도만 먼저 봅시다. 엑셀을 활용해 일을 하는 기획 쪽 직무들은 BI 등을 통해 다운로드한 raw-data를 엑셀로 옮겨서 특기인 엑셀 함수와 주요 지표 중심의 break-down을 통한 구조화시키는 것을 좋아합니다. 문제는 BI 같은 것이 없는 상당 수의 회사에서 자료를 케이스에 맞게 뽑는 것을 분석가에게 요구한다는 것이죠. 분석가는 이런 기획 직무들의 특성을 이해해서 엑셀에서 가공해서 쓸 수 있을 모양으로 최대한 편집하지 않은 지표들을 데이터베이스에서 받아서 엑셀 시트에 넣는 게 낫습니다. 가공을 해서 시트에 넣게 되면 나중에 가공 전 원래 지표를 쓰고 싶어서 늦은 밤 전화가 올 수도 있으니까요.
만약 단순히 추출해서 넣는 정도가 아니라 분석 결과를 그들에게 보여주어야 한다면 특유의 break-down에 대비해서 미리 여러 구간으로 쪼갤 수 있는 구조로 만들어 놓아야 합니다. 쪼갤 수 있는 지표를 미리 많이 준비해서 raw-data에 해당하는 시트에 넣어두거나 아예 쪼개 놓은 지표를 넣는 등을 해야 하는 것이죠. 만약 '30% 이상의 할인을 했을 때 수익이 어떻게 변동되는가'를 분석 주제로 받았다면, 30%만 넣지 말고 31%, 29% 등 관련되어 검토할 수 있는 주변 숫자로 모두 결과 시뮬레이션을 만드는 게 'OO님, 이거 이렇게 다시 봐주실 수 있으세요?'라는 말을 늦은 저녁 시간 받지 않을 수 있습니다. (처음부터 일을 그렇게 주면 더 낫겠지만요.)
데이터에 집중할수록 타 직군이 어떻게 데이터를 다루고 쓰는지 무관심한 분들이 있습니다. 하지만 그들이 나의 고객이고 프로젝트는 다르지만 늘 유사한 패턴의 문의들이 발생하고 있다면 나의 작업에 반영할 필요가 있습니다. 내가 편하자고 무료 카지노 게임 것입니다. 위에 말씀드린 5가지는 제가 카페에서 잠깐 생각 난 내용이지만, 생각해 보면 그런 것들이 더 있을 수 있습니다. 중요한 것은 충분한 가공의 자유도를 제공하고, 이 숫자를 왜 이렇게 뽑았는지에 대한 충분한 주석을 문서만으로도 알 수 있도록 제공무료 카지노 게임 것입니다. 쓰고 보니 코드를 깔끔하게 짜고 주석 처리를 잘무료 카지노 게임 것과 어째 비슷한 것 같기도 하네요. 스토리텔링을 잘한다는 게 자료의 구조를 어떻게 만들어 놓고 설명무료 카지노 게임 능력도 있겠지만 그런 거대한 내용이 아니더라도 이런 작은 부분에서 스토리 텔링이 잘되고 일을 잘무료 카지노 게임 동료가 될 수 있습니다.