능동적으로 문제를 해결하는 능력이 중요합니다. 지금은 모르겠지만 학교에는 추천 시스템 관련 과목이 있진 않았습니다. 회사에 들어와서 스스로 공부하면서 필요한 부분들을 채워나가야 했죠. 기본적인 개발 능력도 중요하지만, 내가 부족한 부분, 필요한 부분들을 능동적으로 찾고, 해결해내는 능력 또한 중요하지 않을까 생각됩니다. 네이버라는 큰 회사에 있지만 작은 스타트업에 있는 듯한 느낌이 드는 이유이기도 합니다.
Contributor 김창회
'18년 입사 | 전기전자공학 전공
네이버, Search CIC
안녕하세요.
네이버에서 ‘오늘 뭐 먹지’라는 물음에 대한 해답을, 기술로 찾아가는 팀에서 일하고 있는 김창회입니다. 2018년 2월에 입사했으니 ‘인류 최대의 난제’에 대한 해결을 시작한 지 어느덧 3년을 바라보고 있네요.
무슨 뚱딴지 같은 소리냐고요? 좀 더 정확한 제 소개를 드리자면, 저는 네이버 ‘스마트어라운드’ 팀에서 ‘장소 추천 모델’을 개발하고 있습니다. 오늘 네피셜에서는 인류 최대의 난제 ‘오늘 뭐먹지?’를 기술로 해결해나가기 위해 노력하고 있는 저와 저희 팀의 이야기를 써내려가볼까 합니다.
스마트어라운드? 장소 추천?
여기, 제가 있는 스마트어라운드 팀에서는 네이버 앱 그린닷에서 제공되는 ‘내 주변’에 추천 모델 개발 뿐만 아니라 conomi에 들어가는 장소 관련 추천 모델까지 개발하고 있습니다. (앞광고 ^^) 스마트어라운드에서는 먹는 장소 뿐만 아니라 가볼만한 곳, 공연 정보 등 장소에 대한 다양한 고민들을 해결해주고 있습니다.
추천이라는 기술 자체는 굉장히 익숙하실텐데요. 유저의 데이터를 기반으로 유저가 좋아할만한 상품이나 컨텐츠를 알려주는 것이죠. 저희 팀에서는 ‘상품’이 바로 ‘장소'입니다. 추천이 필요하다는 것은 상품에 취향이 묻어나와야 할 수 있겠죠? 그래야 그 사람에게 맞는 상품을 알려주는 것이 의미가 있을테니깐요.
생각해보면 ‘장소'에도 정말 많은 취향이 반영됩니다.
식당을 찾는다면,
점심인지 저녁인지
누구와 함께 가는지
주중인지 주말인지
현재 위치는 어디인지
어떤 메뉴를 좋아하는지
가격대는 어느 정도가 적당한지
등등
바로, ‘오늘 뭐먹지?’가 인류 최대의 난제인 이유이기도 합니다.
저희 팀에선 이러한 고민들을 해결하기 위한 새로운 모델을 개발하고, 평가하면서 장소 추천 품질을 높이는 일을 합니다.
네이버에서 추천 모델을 만든다는 것
추천 시스템에서는 input의 형태와 종류, 목표로 하는 output의 형태에 따라 정말 천차만별이고, 다른 모델을 개발하게 됩니다. 그 중에서 사실 가장 중요한 건 어떤 데이터를 학습할 것인가라고 생각해요. 아무리 좋은 모델을 개발한다고 한들 데이터의 퀄리티, 양이 충족하지 못하면 결과도 만족스럽지 못하겠죠. 하지만 적어도 네이버에선 이런 걱정은 적다는 것!
추천 시스템에서의 input 데이터로는 크게 2가지로 나뉩니다. click과 같이 호불호를 알 순 없지만 유저의 관심 수준의 행동을 알 수 있는 implicit feedback, 별점과 같이 유저의 호감도가 어느 정도인지 알 수 있는 explicit feedback로 나뉠 수 있습니다. 네이버에서는 클릭 데이터와 같은 implicit feedback뿐 아니라 예약자 평점, 영수증 평점과 같은 explicit feedback까지 활용할 수 있습니다. 거기에 예약 리뷰와 영수증 리뷰 그리고 블로그 리뷰와 같은 텍스트 데이터 그리고 네이버 플레이스, 지도에 들어있는 전국의 장소 데이터까지 활용할 수 있으니! 추천 모델을 개발하는 입장에서 이러한 데이터를 활용할 수 있는 것은 큰 기회이자 즐거움이지 않을까 싶습니다.



그리고 많은 유저들이 사용하는 서비스이다보니 서비스를 적용했을 때 반응이라던가 품질 또한 빠르게 체크할 수 있는 것도 큰 장점 중 하나입니다. 유저의 클릭이 실제 예약이나 방문까지 이어졌는지, 기존보다 상위 ranking의 업체들이 클릭되었는 지, 노출 대비 클릭은 많아졌는 지 등을 체크하여 품질 향상, 모델 개선의 속도를 빠르게 가져갈 수 있습니다
글로벌 서비스에도 중요한 건 결국 데이터
장소를 찾을 때 고려하는 점이 각 나라마다 다를 수도 있겠지만, 결국 데이터의 성격, 형태가 가장 중요한 것 같습니다. 일본과 한국의 차이를 일례로 설명드리겠습니다. 일본에서는 conomi라는 로컬 서비스를 통해 모델링을 진행하고 있는데 유저 간의 follower-follwing 관계, 메뉴 단위의 리뷰와 평점 데이터, 이미지 중심의 데이터들이 주를 이루고 있습니다. 반면에 한국에서는 지도 데이터, 블로그 데이터와 이를 클릭하는 유저들의 데이터들이 주를 이루고 있죠.
이렇듯 모델링할 수 있는 재료의 성격 자체가 다릅니다. 글로벌 서비스를 새롭게 개발함에 있어서 한,일의 문화적인 차이보다는 서비스에서 오는 데이터의 차이때문에 다른 모델을 가져가게 되죠.
위의 사례만 보더라도 일본에서는 유저와 유저간의 그래프를 이용하는 방법 혹은 explicit feedback을 활용할 수 있는 방법, 이미지 데이터를 이용하는 방법들을 떠올릴 수 있고, 한국에서는 주로 implicit feedback에 적합한 방법들이 사용되겠죠.
물론 문화적인 차이도 있겠지만 그런 차이조차도 데이터에서 드러날 수 있어서 데이터의 성격, 형태에 집중해야하는 것 같아요. 하지만 앞서서 얘기했듯이 한국에서도 영수증 리뷰처럼 이미지, 평점 데이터들이 많아지고, 일본에서도 라인을 통해 클릭 데이터들이 증가하고 있습니다. 지금은 각각 다른 모델을 고민하더라도 곧 공통된 고민으로 이어지지 않을까 생각됩니다.
모든 것을 멈춰버린 코로나, 언택트시대에 개발자가 성장하는법
역량을 개발하는 방법에는 다양한 방법들이 있지만 그 중에 외부 교육, 학회를 참가하는 것도 그 중 하나입니다. 세계적인 석학들이 관심있는 주제, 기술 트렌드를 파악할 수 있는 확실한 방법이기 때문이죠. 그런데 발생한 코로나19... 모든게 올스탑되는 것인가 싶었지만 다행히 올해는 온라인 학회가 열리면서 오히려 더 쉽게 학회에 참가할 수 있게 되었습니다. 제가 이번에 참가한 학회는 recsys 2020 (추천 시스템 학회)입니다.
이번 학회 참가 덕분에 기술 트렌드는 물론이고 온라인 학회의 경험까지 해볼 수 있었습니다. 온라인으로 진행되면서 이전보다 달라진 점을 얘기해보자면, 보통 학회에서는 내가 관심있는 세션들이 같은 시간에 겹치면 선택해야 하는 문제가 있었습니다. 하지만 이번 학회에서는 A를 듣고, 녹화된 B를 들을 수 있어서 관심있는 세션들을 모두 들을 수 있었죠. 덕분에 2배로 피곤했지만요. 하하
그리고 학회에서는 참가자 간의 interaction도 매우 중요한데, 온라인 연회장 맵에서 내 캐릭터를 이동하면서 자유롭게 사람들과 소통할 수 있었습니다. 개인적인 생각으론 코로나 이후에도 이러한 온라인 학회가 활발해져서, 더 많은 기회가 열리지 않을까 싶습니다.
서비스 기획 + 서비스 개발, 모두를 경험하는 즐거움 그리고 책임감.
앞서서 다양한 데이터에 대한 이야기를 했는데요. 활용할 수 있는 데이터가 다양하다는 것은 그만큼 다양한 서비스를 개발할 수 있다는 말이기도 해요. 비유를 하자면 음식 재료들이 많으니 할 수 있는 요리도 많다고 생각하시면 될 거 같아요. 그러다보니 활발한 ideation 과정도 굉장히 중요합니다.
이런 데이터로 이 모델에 적용해보는건 어때?
이런 서비스를 하려면 어떤 학습 데이터가 필요할까?
이처럼 서비스에 대한 그림도 그려보면서 동시에 모델에 대한 고민까지 함께 하게 됩니다.
추천 모델을 개발하는 개발자로서 이 과정이 가장 즐거운 것 같아요. 서비스 아이디어부터 시작해서 적합한 모델 개발에 사용자의 반응까지 분석하는 일련의 과정에 있다보면 내가 개발한 모델에 대한 주인의식이 많이 생기고, 잘됐을 때 더 큰 즐거움으로 다가오는 것 같습니다. 네이버라는 큰 회사에 있지만 작은 스타트업에 있는 듯한 느낌이 드는 이유이기도 합니다.
처음엔 모델을 개발하고 서비스를 만드는 과정에만 집중했다면 요즘엔 그 후의 과정과 추천이라는 기술 자체에 대한 고민들에 집중하고 있습니다. 추천의 목적은 유저들이 검색하지 않고도 유저가 좋아할만한 상품을 보여주는 것입니다. 유저가 편하게 장소를 찾게끔 도와준다고 볼 수 있는 한편, 유저의 취향이 추천 시스템 안에서 하나로 정의된다고 볼 수도 있습니다. 추천 시스템에서 정의된 유저의 취향은 정답으로 간주되고, 유저에게 정답만 보여주는게 높은 품질로 간주되기도 하죠. 유저는 정답셋에서 클릭하게 되고, 그 클릭은 다시 취향으로 이어지고.. 이렇듯 추천 모델이라는 틀 안에 유저가 갇히게 되는 악순환으로 이어질 수도 있습니다.
즉, 유저의 성향에 어울리는 장소만 계속 추천하면 정확성은 올라갈 수 있지만, 추천받는 유저의 입장에선 피로해질 수도 있고, 다양한 장소를 탐색하는 즐거움이 줄어들 수도 있다고 생각해요. 단순히 높은 정확도의 추천이 좋은 추천일까? 어떤 관점에서 evaluation 과정을 거쳐야 균형있는 모델이 될까 고민이 필요한 단계가 아닐까 생각합니다. 이런 과정은 사용자 입장에선 느끼지 못할 수 있는 부분이지만, 개발하는 입장에서는 균형있고, 정확한 모델을 개발해야 겠다는 책임감이 느껴지기도 합니다.
언택트 시대 속 컨택트를 준비하는 팀
스마트어라운드에 도전하세요!
제가 경력이 오래되진 않았지만, 추천 서비스를 개발하면서 중요하다고 생각한 점을 감히 말씀드리면 서비스 감각을 놓치지 않는 개발자가 되는 것입니다. 추천 모델은 모델 자체가 서비스로 이어지기도 해서 서비스와 경계가 그리 크지 않기 때문입니다.
그래서 개인적으로 써보지 않았던 서비스 중 추천이 들어간 서비스들은 일부러 써보는 편이에요. 어떤 시나리오로 추천이 이루어지는 지, 추천되는 품질은 어떤지, 어떤 영역들이 추천되는 지 등을 살펴봅니다. 꼭 일때문은 아니더라도 스스로 이런 부분들이 궁금하고 관심이 생기더라구요. 이런 과정에서 새로운 아이디어가 떠오르기도 하고, 부족했던 부분들이 보이기도 합니다.
그리고 능동적으로 문제를 해결하는 능력이 중요합니다. 지금은 모르겠지만 학교에는 추천 시스템 관련 과목이 있진 않았습니다. 회사에 들어와서 스스로 공부하면서 필요한 부분들을 채워나가야 했죠. 기본적인 개발 능력도 중요하지만, 데이터 정제부터 모델링까지 내가 부족한 부분, 필요한 부분들을 능동적으로 찾고, 해결해내는 능력 또한 중요하지 않을까 생각됩니다.
코로나로 인해 우리의 생활 패턴, 습관들에 많은 변화가 생겼습니다. 특히나 격리된 삶, 온라인으로만 연결된 삶 속에서 필요한 서비스들도 많이 달라졌습니다. 저희 서비스도 영향을 받은 서비스 중 하나죠. 우리는 언택트 시대를 살아가고 있지만 우리는 컨택트 됐었던 날들을 그리워하고 그런 날이 올거라고 믿고 있습니다. 너무 감성적이게 되어버렸는데요..;; 스마트어라운드와 함께 우리 삶 속 컨택트의 가치를 높여주고, 인류 최대의 난제를 함께 해결하실 분을 찾습니다.
'ℹ️ Information > 📃 직무탐색' 카테고리의 다른 글
[채용연계 / 최종합격 찐 후기] 현대자동차그룹 소프티어부트캠프 2기 모집 :: 지원부터 오리엔테이션까지 (20) | 2023.05.03 |
---|---|
네이버 기업 문화 (0) | 2023.04.16 |
SK텔레콤 지오비전 빅데이터 설명 (0) | 2023.04.03 |
SK텔레콤- 지오비전 퍼즐 소개 (0) | 2023.04.03 |
[채용 공고 - 네이버] 2023 팀네이버 신입 공채 : Service & Business (0) | 2023.03.30 |
댓글