Mathematical Optimization &
Operations Research Laboratory
고려대학교 산업경영공학부 <정보학연구실, Mathematical Optimization & Operations Research Laboratory>에서는 실생활 문제의 효과적, 효율적이고 정확한 솔루션을 지원할 수 있는 우수한 의사결정 방법론 개발을 목표로 전역최적화(조합최적화 및 비선형계획법) 이론과 알고리즘 개발을 연구합니다.
2018년 초 현재 정보학연구실의 연구주제는 크게 다음의 두 가지로 요약할 수 있습니다.
1. Boolean 로직 기반 데이터분석/의사결정
실생활 문제를 해결하기 위해서는 우선 그 문제를 제대로, 정량적으로 정의한 ‘수리모형’을 구축해야 합니다. 세상물정을 제대로 반영한 수리모형은 비선형함수와 정수변수 등 다양한 ‘어려운 요소’를 포함합니다. 일반적으로 이런 문제는 풀이가 난해하며, 따라서 현존하는 기법으로 풀이가 불가하거나, 효율적인 풀이가 불가하게 됩니다. 물론, 문제에 연관한 난이도(conmplexity)로 인해 풀이가 불가한 경우도 존재합니다. 이런 ‘비선형, 비볼록 최적화’ 문제의 가장 우수한 해를 찾아내는 학문분야를 ‘전역최적화’라 일컫습니다.
Logical Analysis of Data (이하, LAD)는 조합최적화, 불린로직/논리 기반의 데이터분류 방법론입니다. LAD는 해석이 용이한 ‘interpretable knowledge’를 발굴하며, 그 실용성 및 유용성이 매우 우수합니다. 발굴한 ‘지식’의 데이터분류 정확성 측면에서의 우수성은 말할 나위가 없습니다. 당연한 이치지만, 이런 장점을 누리기 위해서는 그 연구와 진보를 위해 조합론/조합최적화/정수계획법, 수치해석, convex analysis, matrix/polyhedral theory 등 자연과학 전분야에 걸친 이해와 수학 및 새로운 연구가 필요합니다.
- 주제 : Polytope Analysis, Convexification, 전역/조합최적화, Pattern Generation, Decision Theory/Rule Generation
- 도구 : Convex Analysis, Polyhedral Theory, Combinatorial Optimization, Mixed Integer and Linear Programming
- 응용 : 데이터 마이닝/분류(Classification), 생물정보학, 의료정보학
본인은 수리최적화를 이용한 데이터분석을 (통계적 기법과 구분해) 수리적데이터분석(Mathematical Data Analysis; 이하, MDA)이라 칭합니다. MDA는, 세상문제에 내재한 난이도를 고려할 때, 극한 경우, ‘세상문제를 풀 수 없다’는 한계에 봉착합니다. 따라서, ‘빅데이터 분석에 유용하지 않다’고 단정을 짓는 그릇된 결론의 소지를 제공합니다.
계산의 난이도가 높은 어려운 속성의 문제도 대부분 효율적인 풀이가 가능할 수 있습니다. 이 점은 첨예한 수리기법이 아닌 기존 혹은 휴리스틱적 방법론에 의한 (빅데이터분석 포함) 의사결정 및 세상사 해결과 연관한 (기회와 가치 손실 측면에서의) 위험성을 보여주며, 수리최적화 기반의 우수한 의사결정 방법론 개발에 관한 새로운, 더욱 다양한 연구의 필요성을 역설합니다.
MDA 관점에서, 데이터융합/감소는 주어진 데이터 내에 내재한 (분류 측면에서의) ‘진리’와 그 '질'을 훼손함 없이 학습에 필요한 데이터의 양을 감소하는 것을 의미하며, 이를 통해 데이터분석/지식발굴과 연관한 최적화 모형의 크기를 축소하는 것을 주된 목적으로 삼습니다. 실용적으로, 실생활 의사결정문제의 '정확한 해법'을 추구하며, 이로써 우수한 지식의 혜택을 더욱 다양한 영역에서 더 많은 이들이 누릴 수 있도록 기여하는 것을 목표로 합니다.
- 주제 : Polyhedral Theory, Convex Analysis, Graph Theory, Combinatorics
- 도구 : Theory of Valid Inequalities, Convex Analysis, Polyhedral Theory, Graphs & Hypergraphs
- 응용 : 빅데이터 분석