프로젝트

딥 러닝 & 기계 학습

데이터 마이닝 연구실에서는 딥 러닝과 기계학습을 위한 모델, 알고리즘, 시스템 설계를 위한 연구를 하고 있다. 주요 주제는 신뢰 전파, 깊은 네트워크 표현, 데이터 클러스터링, 회귀를 포함한다.

모델, 알고리즘과 시스템:

  • 신뢰 전파: 신뢰 전파는 그래프 모델에서의 확률적 추론을 위한 효율적인 알고리즘이다. 신뢰 전파는 "guilt by association (만약 A(남자) 종류의 정점들이 B(여자) 종류의 정점들과 상호작용(데이트)하는 경향이 있다는 것을 알고 있다면, 접촉하는 대다수의 성별을 확인하는 것을 통해 성별을 모르는 정점에 대한 추론이 가능하다.)" 발상에 입각하여 이상 행동 감지를 위해 이용된다. 데이터 마이닝 연구실에서는 확장성 있는 신뢰 전파 알고리즘과 다양한 변수 사이에서의 복잡한 상호관계를 위한 모델을 연구한다.
  • 딥 러닝: 데이터 마이닝 연구실에서는 딥 러닝을 위한 모델과 알고리즘을 개발하고 응용 분야를 연구한다. 주요 프로젝트에는 딥 네트워크 임베딩, 가벼운 딥 러닝이 포함된다.
  • 질의 응답: 빅데이터와 딥 러닝 네트워크를 이용하여 질의 응답 기법을 개발한다.
  • 데이터 클러스터링: 행렬 (또는 텐서) 가 주어졌을 때, 행렬의 행과 열을 동시에 분할하기 위하여 확장성 있는 코클러스터링 기법을 개발한다.
  • 회귀: 데이터 마이닝 연구실에서는 로지스틱 회귀 분석과 선형 회귀를 포함한 회귀 문제들을 위한 확장성 있는 알고리즘을 개발한다.

연구실적

  • Namyong Park, Eunjeong Kang, Minsu Park, Hajeong Lee, Hee-Gyung Kang, Hyung-Jin Yoon, and U Kang, "Predicting acute kidney injury in cancer patients using heterogeneous and irregular data", PLOS ONE, 2018. (to appear)
  • Junghwan Kim, Haekyu Park, Ji-Eun Lee, and U Kang, "SIDE: Representation Learning in Signed Directed Networks", The Web Conference (WWW) 2018, Lyon, France. [PDF] [BIBTEX]
  • Saehan Jo, Jaemin Yoo, and U Kang, "Fast and Scalable Distributed Loopy Belief Propagation on Real-World Graphs", 11th ACM International Conference on Web Search and Data Mining (WSDM) 2018, Los Angeles, CA, USA. [BIBTEX] [HOMEPAGE (CODE, DATA)] [PDF]
  • Jaemin Yoo, Saehan Jo, and U Kang, "Supervised Belief Propagation: Scalable Supervised Inference on Attributed Networks", IEEE International Conference on Data Mining (ICDM) 2017, New Orleans, USA. [BIBTEX] [HOMEPAGE (CODE, DATA)] [PDF]
  • Kyung-Min Kim, Jinhong Jung, Jihee Ryu, Ha-Myung Park, Joseph P.Joohee, Seokwoo Jeong, U Kang, and Sung-Hyon Myaeng, "A New Question Answering Approach with Conceptual Graphs", Conférence en Recherche d’Information et Applications (CORIA) 2017, Marseille, France. [BIBTEX] [PDF]
  • Min-Hee Jang, Christos Faloutsos, Sang-Wook Kim, U Kang, and Jiwoon Ha, "PIN-TRUST: Fast Trust Propagation Exploiting Positive, Implicit, and Negative Information", ACM International Conference on Information and Knowledge Management (CIKM) 2016, Indianapolis, Indiana, USA. [BIBTEX] [PDF]
  • Won-Jo Lee, Chae-Gyun Lim, U Kang, and Ho-Jin Choi, "An Extension of the Automatic Cross-Association Method with a 3-dimensional Matrix", Second International Conference on Big Data and Smart Computing (BigComp) 2015, Jeju, korea. [BIBTEX] [PDF]
  • Dongyeop Kang, Woosang Lim, Kijung Shin, Lee Sael, and U Kang, "Data/Feature Distributed Stochastic Coordinate Descent for Logistic Regression", 23rd ACM International Conference on Information and Knowledge Management (CIKM) 2014, Shaghai, China [BIBTEX] [PDF] [SUPPLEMENTARY DOCUMENT]
  • Danai Koutra, Tai-You Ke, U Kang, Duen Horng (Polo) Chau, Hsing-Kuo Kenneth Pao, and Christos Faloutsos, "Unifying Guilt-by-Association Approaches: Theorems and Fast Algorithms", European Conference on Machine Learning and Principles and Practice of Knowledge Discovery in Databases (ECML PKDD) 2011, Athens, Greece. (acceptance rate 20.2 %) [BIBTEX] [PDF]
  • Robson L. F. Cordeiro, Caetano Traina Jr., Agma J. M. Traina, Julio Lopez, U Kang, and Christos Faloutsos, "Clustering Very Large Multi-dimensional Datasets with MapReduce", ACM SIGKDD Conference on Knowledge Discovery and Data Mining (KDD) 2011, San Diego, CA, USA. (acceptance rate 17.5 %) [BIBTEX] [PDF]
  • U Kang, Duen Horng Chau, and Christos Faloutsos, "Mining Large Graphs: Algorithms, Inference, and Discoveries", IEEE International Conference on Data Engineering (ICDE) 2011, Hannover, Germany. (acceptance rate 19.8 %) [BIBTEX] [PDF]