어도비 보코
Adobe VocoAdobe Voco는 Adobe의 미공개 오디오 편집 및 생성 시제품 소프트웨어이며, 새로운 편집 및 오디오 생성을 가능하게 합니다."Photoshop-for-voice"[1]로 명명된 이 제품은 2016년 11월 Adobe MAX 이벤트에서 처음 공개되었습니다.Adobe MAX에서 보여지는 기술은 Adobe Creative Cloud에 통합될 가능성이 있는 미리보기였습니다.보코는 결코 출시되지 않았고 연구용 [2][3]프로토타입이 될 예정이었다는 것이 나중에 밝혀졌다.
기술적 세부사항
데모에서 알 수 있듯이, 소프트웨어는 원하는 대상의 음성을 약 20분 정도 소요하며, 대상 예시 자료에는 없었던 음성을 포함한 소리와 유사한 음성을 생성합니다.어도비는 Voco가 오디오 [1][3]제작 비용을 낮출 것이라고 말했다.
걱정
원래 화자가 말하지 않은 단어와 구문을 포함하도록 오디오 녹음을 변경할 수 있는 능력과 음성 인쇄 [1]생체인식의 잠재적 위험에 대한 윤리 및 보안상의 우려가 제기되었습니다.
또한 다음 항목과 함께 사용될 수 있다는 우려도 제기되었습니다.
- 2000년대 초반부터 카메라로 녹화한 인간과 인간의 시뮬레이션을 구별하는 것은 매우 [4]어려운 일이다.
- 기존의 [5]2D RGB 영상을 사용하여 거의 실시간으로 사람의 표정을 비디오로 조작하는 것입니다.
대체 수단
Adobe의 공개되지 않은 진척은 인공지능을 사용한 실시간 텍스트 투 텍스트 툴인 15.ai과 같은 다른 프로젝트에도 VOCO의 대체 제품을 구축할 수 있는 기회를 열어 주었습니다.
WaveNet은 Adobe Voco와 비슷한 시기에 독립적으로 개발된 런던에 본사를 둔 인공지능 회사 DeepMind의 유사하지만 오픈 소스 연구 프로젝트입니다.
「 」를 참조해 주세요.
레퍼런스
- ^ a b c "sapic". BBC.com. BBC. 2016-11-07. Retrieved 2016-07-05.
- ^ "Beta Testing #VoCo". 8 November 2016.
- ^ a b "Is Adobe VoCo dead ?". Adobe Blog. 2018-01-27. Retrieved 2020-06-17.
- ^ Rodgers, Julian. "Adobe Voco - Should We Be Afraid?". Production Expert. Pro Tools. Retrieved 14 December 2018.
- ^ Thies, Justus (2016). "Face2Face: Real-time Face Capture and Reenactment of RGB Videos". Proc. Computer Vision and Pattern Recognition (CVPR), IEEE. Retrieved 2016-06-18.