프로젝트

추천 시스템

누가 어떤 TV 프로그램을 봤는지에 대한 데이터가 주어졌을 때, 어떻게 사용자에게 적절한 TV 프로그램을 추천할 수 있을까? 소셜 네트워크 친구 정보가 주어졌을 때, 어떻게 사용자가 연결을 수락할 것 같은 친구를 추천할 수 있을까? 추천은 데이터 마이닝의 중요한 응용 분야이며 영화 추천, 식당 추천, 일자리 추천, 기사 추천, 친구 추천에서 널리 사용되고 있다. 데이터 마이닝 연구실에서는 추천을 위한 모델, 알고리즘, 시스템을 개발하고 연구하며 다음과 같은 두 가지 종류의 데이터에 초점을 두고 있다.

  • 행렬 추천: 추천을 위한 대부분의 데이터는 행렬 형식으로 표현된다. 예를 들어, 영화 추천에서 사용자와 영화 정보는 행렬 형식으로 표현된다. 데이터 마이닝 연구실에서는 추천을 위한 확장성 있는 모델과 알고리즘을 연구한다.
  • 그래프 추천: 데이터 마이닝 연구실에서는 매우 중요한 문제인 그래프에서의 추천 (예시로 LinkedIn에서의 "People You May Know" 혹은 Facebook에서의 친구 추천이 있다.) 을 위한 빠르고 확장성 있는 모델과 알고리즘을 연구한다.

응용:

  • 영화/TV 프로그램 추천
  • 식당 추천
  • 친구 추천
  • 뉴스 기사 추천

연구실적

  • Minji Yoon, Jinhong Jung, and U Kang, "TPA: Fast, Scalable, and Accurate Method for Approximate Random Walk with Restart on Billion Scale Graphs", 34th IEEE International Conference on Data Engineering (ICDE) 2018, Paris, France. [PDF]
  • Minji Yoon, Woojeong Jin, and U Kang, "Fast and Accurate Random Walk with Restart on Dynamic Graphs with Guarantees", The Web Conference (WWW) 2018, Lyon, France. [PDF] [BIBTEX]
  • Haekyu Park, Jinhong Jung, and U Kang, "A Comparative Study of Matrix Factorization and Random Walk with Restart in Recommender Systems", IEEE International Conference on Big Data (BigData) 2017, Boston, MA, USA. [BIBTEX] [HOMEPAGE (CODE, DATA)] [PDF]
  • Kijung Shin, Lee Sael, and U Kang, "Fully Scalable Methods for Distributed Tensor Factorization", IEEE Transactions on Knowledge and Data Engineering (TKDE), vol. 29, no. 1, pp. 100-113, Jan. 1 2017. [BIBTEX] [HOMEPAGE (CODE, DATA)] [PDF]
  • Jinhong Jung, Namyong Park, Lee Sael, and U Kang, "BePI: Fast and Memory-Efficient Method for Billion-Scale Random Walk with Restart", ACM International Conference on Management of Data (SIGMOD) 2017, Raleigh, North Carolina, USA. [BIBTEX] [HOMEPAGE (CODE, DATA)] [PDF]
  • Jinhong Jung, Woojeong Jin, Lee Sael, and U Kang, "Personalized Ranking in Signed Networks using Signed Random Walk with Restart", IEEE International Conference on Data Mining (ICDM) 2016, Barcelona, Spain. [BIBTEX] [PDF] [HOMEPAGE (CODE, DATA)]
  • Jinhong Jung, Kijung Shin, Lee Sael, and U Kang, "Random Walk with Restart on Large Graphs Using Block Elimination", ACM Transactions on Database Systems (TODS), vol. 41, issue 2, pp. 12:1-12:43, June 2016. [BIBTEX] [PDF] [HOMEPAGE (CODE, DATA)]
  • Kijung Shin, Jinhong Jung, Lee Sael, and U Kang, "BEAR: Block Elimination Approach for Random Walk with Restart on Large Graphs", ACM International Conference on Management of Data (SIGMOD) 2015, Melbourne, Australia [BIBTEX] [HOMEPAGE (CODE, DATA)] [PDF]
  • Kijung Shin, and U Kang, "Distributed Methods for High-dimensional and Large-scale Tensor Factorization", IEEE International Conference on Data Mining (ICDM) 2014, Shenzhen, China. [BIBTEX] [HOMEPAGE (CODE, DATA)] [PDF]
  • Dongyeop Kang, DongGyun Han, NaHea Park, Sangtae Kim, U Kang, and Soobin Lee, "Eventera: Real-time Event Recommendation System from Massive Heterogeneous Online Media", IEEE International Conference on Data Mining (ICDM) 2014, Shenzhen, China. [BIBTEX] [PDF]