본문 바로가기

데이터 과학/가상인간 개발

(1)

논문리뷰 - Unsupervised Singing Voice Conversion 1. Abstract 텍스트, 음표 없이 노래의 목소리를 변환하는 딥러닝 알고리즘을 개발해보자. 단 음표, 가사, 가수들 간의 pair 데이터 같은 supervision 없이. 모델 구조는 CNN encoder와 WaveNet decoder로 구성하였고 CNN은 여러 가수들의 목소리를 받아 singer-agnostic 한 vector를 뽑아낸다. 새로운 data augmentation과 loss를 도입한 결과 자연스러운 목소리를 생성할 수 있었다. 2. Introduction 기존에 deep neural network를 language feature와 notes로 학습한 결과 성공적인 목소리 합성이 가능했음. 본 논문에서는 unsupervised 방식으로 학습하기에 parallel 한 singer 데이터..

이전 1 다음

티스토리툴바