데이터 분석가 보민
책 모음
🙃

스타트업 신입 데이터 분석가의 한달 회고

코로나 때문에 온 세상이 정신없는 사이 입사한지 한 달이 되어버렸다.

스타트업

찔끔찔끔이었지만 이 좁고, 치열하고, 다이나믹한 업계에 발담근지 이제 거의 5년이 다 되어간다. 처음에는 정말 열정 하나로, 그 다음에는 호기심으로 발을 담궜지만 지금은 그냥 여기가 익숙해서 있는 것 같다.
스타트업에도 별의별 사람들이 많이 있다지만, 그래도 내가 스타트업 씬에서 만난 사람들 대부분은 나를 성장할 수 있게하는 사람들이었다. 하나의 목표를 바라보며 함께 일을 할 때에도 그렇지 않은 지금도. 심심할 때 연락하고 무슨 일 있으면 서로 도움주고, 축하 할 일 있으면 축하하고 축하받는 언니, 오빠, 동생들로 남아있는 다양한 관계들. 그게 좋다.

데이터 분석가

작년 여름 데이터 분석가 양성과정에 뽑혔을 때만해도 이 맘때에는 한창 공부를 더 하고 있을 줄만 알았다. 졸업도 아직 남았었고 바로 취직이 되나 싶기도 하고, 그래서 선발과정에서 “이거 끝나면 내년 3월쯤에는 뭘 하고 있을 것 같으세요?”라는 질문을 받았을 때 별 고민 없이 “SQL 복습하고 있겠죠?”라고 대답했었던 게 기억난다.
처음에 교육과정 불합격하고나서 그냥 이쪽으로는 시작도 못하는 건가 생각했었는데. 추가합격 연락받고 보란듯이 더 열심히 배우고 공부했다. 돌이켜보니 그게 나한테 도움이 많이 되었던 것 같다.
똑똑하고 야망차고 따뜻한 여성들과 함께 동고동락하며 공부했던 모든 과정이 눈 깜박할 새에 지나가버렸다. 말도 안되는 프로젝트들을 되게하면서 희열을 느꼈던 것이 엊그제 같은데, 그 모든 것들을 마무리한 것이 벌써 삼개월 전이 되었다. 꾸준히 이력서를 넣어보다가 합격 통보를 받은 첫 직장에 입사 한지는 이제 한 달이 조금 넘었다.
코로나 때문에 재택근무를 하다가 오랜만에 출근한 사무실 책상 위에는 내 이름과 그 밑에 Data Analyst라고 적혀있는 명함이 놓여있었다. 별거 아닌데 그 몇 글자가 내 이름 밑에 박혀있는 게 참 신기하다.

신입, 한 달

한 달, 짧은 시간이라면 짧은 시간이지만 그 짧은 시간동안 너무 많이 배웠다. 통계학과도 아니고 컴공도 아니고 경제나 경영학과도 아닌 문창과를 나와서 매주 어떻게 해야 내 이야기가 잘 전달이 될까 이 단어는 다른 사람에게 어떻게 보일까 고심고심해서 고르던 내가 비지니스에 대해서 공부하고 데이터를 뜯어 보려니 하나부터 열까지 새로운 세상이다.
새로운 서비스가 런칭되는 시기에 들어와서 해당 서비스를 전담해서 분석해 볼 수 있도록 배정받은 건 운이 좋았다고 생각한다. 서비스 하나가 런칭되는 과정을 함께 할 수 있다는 것. 이것만큼 좋은 배움의 기회가 있을까? 매일매일 배울 것들이 넘쳐나서 버겁기도 하지만 아직까지는 딱 그만큼 즐겁다.
유저들이 새로 런칭하는 서비스를 어떻게 사용할지 하나하나 시나리오 해보기도 하고. 그들이 남길 데이터들을 생각해보기도 하고. 기존 유저들에게는 어떻게 접근을 해야 새로운 서비스에 자연스럽게 유입을 시킬 수 있을지 고민하면서 기존 유저들의 행동패턴 데이터를 확인해보기도 하고. 기획단에서 고민하고 있는 것들에 참고할 수 있는 데이터들을 뽑아보기도 하고. 한 달만에 해본 경험 치고는 꽤 진하고 가치있는 경험이었다.
회의 할 때마다 모르는 게 너무 많아서 가끔은 진짜 이렇게 몰라도 괜찮은가 싶기도 하지만. SQL 문법을 하나도 몰라서 SELECT와 FROM의 순서가 헷갈려 매번 오류가 나던 몇 달 전의 내 모습을 떠올리면 이제부터 잘 배우면 되지 싶다. 몇달 후의 나는 테이블 JOIN은 물론이고 이중삼중 서브쿼리도, Window Function도 필요하면 뭐든 갖다 쓸 수 있는 사람이 되었으니. 아마 내년 이맘때 쯤 회고에서도 비슷한 이야기를 할 수 있지 않을까.

진짜 회고

좋고 재밌고 감회가 새로운 것들에 대해 많이 얘기 했으니 앞으로 이렇게 해야겠다고 다짐했던 진짜 몇가지 목록을 작성해본다.
눈으로 보지 않으면, 직접 해보지 않으면 이해가 안가는 성격이라 이번 한달 동안은 이것저것 닥치는 대로 양껏 많이 해봤었는데. 이제는 조금 더 신중하게 생각하고 일을 하는게 좋을 것 같다.
1.
보고 들은 건 모두 기록해두자.
회의록 기록은 당연. 개발, 기획 단계의 히스토리도 중요하고 그리고 팀원들이 고민하는 게 뭔지, 알고싶은 부분이 뭔지 잘 적어두는 것도 중요하다.
히스토리를 모르면 데이터를 뽑아보고도 무슨 일이 있어서 데이터가 그렇게 나왔는지 알기가 어렵고, 팀원들이 고민하는 부분을 알지 못하면 쓸데없는 데이터를 보기 쉽더라.
2.
A를 뽑아야 한다고 할 때에는 A가 아닌 것들도 함께 생각하면서 뽑을 필요가 있다.
처음에는 A인 데이터를 뽑아달라는 요청이 있어서 정말 A에 해당하는 데이터만 뽑았더니 A가 아닌 데이터는 어떻게 되냐는 질문을 받았다.
지금 생각해보면 당연히 같이 봐야 하는 게 맞는데, 처음에 요청사항에만 갖혀서 다른 건 1도 생각을 못했다. 어떤 데이터를 뽑을 때에는 함께 보면 좋을만한 데이터는 뭐가 있는지, 비교할 수 있을 만한 것은 뭐가 있는지 생각해보면 데이터를 가져올 때 효율적으로 가져올 수 있음.
3.
실제 서비스 데이터의 규모는 정말 어마어마 하다는 것을 꼭! 명심하고 정확한 데이터 뽑을 수 있을 때까지 작게 작게 돌려보기.
4.
쿼리 짤 때 자주 반복되는 실수를 인식하고 개선하는 시간을 갖기.
3번과 함께 해야하는 일.
로그 데이터를 가져올 때 디바이스 타입별로 집계하거나 날짜 변환같은 것들을 처리하는 것을 자주 까먹어서 초반에 시간을 많이 날렸다. 오류 나거나 쿼리가 내가 생각했던 대로 뽑히지 않았을 때 그냥 짜증만 내지말고 노션에 무엇 때문에 원하는 결과가 안 나왔는지 적어둬야겠다.
5.
주말에 사이드 프로젝트를 진행 할 시간이랑 주간 코드리뷰 할 시간을 따로 떼어두자.
효율적으로 일하고 싶어서 코드리뷰를 다는 못 하더라도 한번씩 꼭 하고 싶었는데 해야지 해야지하다가 계속 미뤄지는 게 이러다가 하마터면 영영 안 할 것 같다. 엉엉 부지런해져야지.
이렇게 열심히 써놓고 안하진 않겠지? 미래의 나야?
내 시간은 금이니까 적게 일하고 돈 많이 벌자.
P.S. 이번 달에 제일 잘 한 일은 퇴근하고 집에 가는 길에 모니터를 충동구매한 것. 재택근무가 근 한 달째가 되어가는데 하마터면 노트북 화면 하나만 보면서 일할 뻔 했다.