re_proposal_1

 

이 글은 2019학년도 3월 19일날 이루어진 1학기 디지털정보융합전공에 재학중인 총 5명 석사 과정생의 프로포절 발표 내용을 요약한 것입니다. 프로포절이란 융합과학기술대학원 디지털정보융합전공에만 존재하는 졸업자격시험으로, 졸업 논문 주제를 교수님들께 미리 발표하여 조언을 구하는 자리입니다.

이번 프로포절에는 운이 좋게도, 각 연구실에서 각자 1명씩 발표를 하였기 때문에 이번 프로포절을 보시면 각 연구실의 연구 지향점이 어디를 향하고 있나 한 눈에 보기 편하실 것 같습니다.

물론 제가 발표 내용의 이해를 못한 부분도 많이 있기 때문에 이런 요약 글을 적기가 조심스럽습니다. 하지만 프로포절의 발표 내용에서 소속 랩의 관심 및 연구 분야가 많이 반영되기에 추후 융합과학기술대학원 입학을 고려하는 분들이 자신의 관심 분야와 맞는 랩을 찾는 데에 이 글이 도움이 되길 바라며 글을 작성해 봅니다.

 

pic_2

 

 

1번째 발표 – 인간중심컴퓨팅 연구실(HCC Lab)

Enhancing VAEs for Collaborative Filtering Flexible Priors & Gating Mechanisms

추천 알고리즘에 Collaborative FIltering에 Variational Auto-Encoder를 이용할 때 발생하는 문제점들을 보완하기 위하여 발표자는 다음의 2가지 방법을 제안하였습니다.

  1. VAE는 잠재변수의 prior probability distribution을 일반적으로는 정규분포를 가정하는데, 이는 현실 잠재변수의 확률 분포를 잘 나타내주지 못하므로 이 사전적 확률분포에 대한 정규분포 가정을 완화한 VampPrior 사용
  2. Gating Mechanism을 도입하여 쉽게 깊어지는 오토인코더의 Information flow를 조절.

해당 발표는 프로포절 단계임에도 불구하고 선행 연구 대비, 성능이 대폭 개선되었다는 실험 결과까지 꼼꼼히 제시하여 교수님들께 좋은 평가를 받았습니다. ‘프로포절’이라고 하여도 추후 실험 결과가 발표자의 생각처럼 잘 흘러갈 것인지에 대해 궁금증이 생길 수 있기에, 이처럼 실험결과를 어느 정도는 같이 제시하여 궁금증을 해소하는게 좋아 보입니다.

VampPrior에 대해서 좀 더 자세히 알고 싶으시다면 2018년 2월에 출간된 논문인 ‘VAE with a VampPrior (Jakub M. Tomczak, Max Welling) ’을 참조해주세요.

 

2번째 발표 - 응용데이터과학 연구실(ADS Lab)

Learning Attribute-Factorized Representations in VAE by regularizing mutual information

1번째 발표에서 나온 토픽인 VAE가 다시 나왔습니다. 단 본 발표의 주안점은 VAE에서 학습하는 factor들 간의 관계를 레귤러라이즈(regularize) 하여 서로 다른 factor들을 더욱 더 잘 분리될 수 있도록 하겠다는 점입니다.

예를 들어 여자가 웃는사진, 남자가 웃는 사진 등으로 남,여라는 성별 팩터의 매니폴드 (manifold)를 학습할 때, 이 사진 속에 들어있는 다른 팩터, 예를 들어 선글라스 팩터와 더욱 잘 분리되도록 각 확률 변수간의 관계를 나타내는 값인  Mutual Information 레귤라이제이션 기법을 사용하는 것입니다.

최근 NVIDIA에서 2018년 12월에 발표한 A Style-Based Generator Architecture for Generative Adversarial Networks처럼 manifold에서 다른 확률변수들을 분리하려고 시도해보는 연구인 것 같습니다.

 

3번째 발표 - 인지컴퓨팅 연구실(CC Lab)

관계적 추론을 활용하는 강화학습 기반의 수학 문장제 문제 풀이

현재 자연어 처리 기술이 처리하기 어려운 점들 중 하나는 정보가 관계에 기반해 전달되는 문장들(ex. A는 B와 C 사이에 있고, C는 D 건너편에 앉아 있을 때, A와 D는 같은 쪽에 앉아 있는지)입니다. 이러한 관계 기반의 문장들을 잘 이해하기 위해서는 관계적 추론이 가능한 자연어 이해 기술이 필요합니다.

발표자는 문장제 수학문제(Ex. “Liz는 9개 고양이 있는데 X한테 3개 주고 Y한테 2개 줘었으면, Liz는 고양이 몇마리 남았냐”)에서 관계적 추론이 주로 사용되기 때문에 이 문장제 수학 문제들을 데이터 셋으로 한 NLP 연구를 제안하였습니다.

이 문제를 연구하는 방법으로 ‘강화학습모델’을 제안 하셨는데요. 순차적 의사 결정 전략을 학습하기에는 강화학습모델이 가장 적합하기 때문이라고 합니다.

 

4번째 발표 - 사용자경험 연구실(UX Lab)

객체인식을 활용한 스마트폰 앨범 내 사진 검색 행태 연구 : 사진 검색의 목적에 따른 검색어의 특성과 변형과정을 중심으로

이 발표의 연구 배경은 핸드폰 갤러리의 인공지능이 사용자의 취향, 의사와는 무관한 프로그램 알고리즘에 따라 사진을 분류하고 라벨을 지정한다는 점입니다. 예를 들어 현재 스마트폰의 갤러리는 카메라에 의해 수집된 사진의 메타데이터, 날짜, 장소, 촬영기기, 사진에 찍힌 음식 등으로 사진을 분류하는 것이 보통입니다. 이러한 분류 방법은 사용자가 사진을 분류하는 방법과 다를 수 있기 때문에 개인화로 개선될 여지가 남아 있습니다.

그래서 본 연구자는 스마트폰 내 사용자들이 사진 검색을 할 때, 사진 검색의 목적에 따라 사용되는 검색어, 사진과의 관계를 파악하기를 제안하였습니다. 사용자의 사진 검색 효율성을 높여주기 위해 사람들이 찾는 사진과 검색어간의 관계를 파악하겠다는 생각입니다. 이걸 바탕으로 갤러리 사진 분류 가이드라인을 수립한 후, 효율적인 사진 검색 방법을 제안해보겠다는 것이 연구 목표였습니다.

 

5번째 발표 - 음악오디오 연구실(MARG Lab)

잡음과 잔향이 많은 환경에서도 robust한 사운드 이벤트 분류 방법

뛰어난 자동차 수리사는 엔진 소리만 듣고도 엔진의 어디에 문제가 있는지 알 수 있다고 하는데요, 사운드 이벤트 분류는 이처럼 오디오 클립을 입력으로 받아 무슨 소리인지 분류한 레이블을 출력으로 생성하는 모델을 말합니다. 잡음 및 잔향이 거의 없는 실험실의 환경과 달리 현실 세상에서는 잡담과 같은 다양한 잡음과 잔향이 존재하기 때문에 이 사운드 이벤트 분류가 어렵습니다.

본 발표의 연구자는 잔향이 많은 환경에서도 사운드 이벤트 분류 저하 현상을 막기 위한 개선기법으로 ‘노이즈를 섞은 다양한 input’을 이용한 학습을 제안하였습니다. 더 기술적으로 설명드리자면, 공간특성을 나타낼 수 있는 공간 임펄스 응답 (room impulse response)을 데이터에 convolution 하여 증가시키는게 핵심입니다. 노이즈가 섞여 있는 환경에서 이미 학습시켜서 실제 환경에서도 잘 작동할 수 있는 robust한 모델을 만드는게 목표인 것이지요.

 

 

지금까지 융합과학기술대학원 디지털정보융합전공 프로포절 주제들을 알아보았습니다. 총 5개 연구실들의 주제가 비슷한 거 같으면서도 다르지요? 이 프로포절 내에서 발표한 주제 이외에도 각 연구실에서 주로 하는 연구 주제가 있는 만큼, 연구실의 홈페이지 및 연구실에 재학중인 분들과 이야기를 통해 본인이 연구하고 싶은 주제와 맞는 연구실을 찾아가기를 바라며 글을 마칩니다!

 

Total Views: 258 ,