연랩

[Microsoft AI School 6기] 3/18(58일차) 정리 - Microsoft Azure AI Services(2):Speech Studio, Azure Open AI 본문

MS AI school 6기

[Microsoft AI School 6기] 3/18(58일차) 정리 - Microsoft Azure AI Services(2):Speech Studio, Azure Open AI

parkjiyon7 2025. 3. 18. 17:54

Azure Open AI 활용

 

 

Speech Studio 

 

Custom Speech

 

결과 확인

모델 테스트 클릭하여 테스트 생성

 

모델 테스트

 

모델 테스트

 

모델 테스트

 

결과는 다음과 같다

 

결과

 

 

Custom Voice 접속

 

결과 확인

 

결과 확인

 

이를 배포해서 사용하기 위해서는 액세스 권한이 있어야한다. 즉, 원하는 텍스트로 만들고 싶다면 액세스 신청을 해야 한다.

영어로 해보면 다음과 같다

 

커스텀 보이스

 

 

음성 번역

 

음성 번역 기능을 테스트해보면 다음과 같다.

마이크를 이용하여 음성을 제공하면 이를 실시간으로 번역하여 준다

 

음성 번역

 

음성 번역

 

이를 API로 이용하기 위해 살펴보면,

 

음성 번역

 

REST API를 지원하지 않는 다고 나온다. Python 등 다른 도구를 활용하여 체험해 볼 수 있다.

 

 

Video Translation (preview)

 

샘플 스페인어 동영상을 삽입하여 영상 번역 테스트를 진행

 

비디오 번역

 

비디오 번역

 

이외에도 학습한 모델을 사용하여 다른 언어로 번역할 수도 있다

 

비디오 번역

 

이렇게 하면 새로운 프로젝트가 자동으로 생성된다.

 

 

Custom Keyword

 

Siri, 빅스비와 같이 키워드로 호출하는 기능을 사용할 수 있다

 

커스텀 키워드

 

다바이스 마이크에 직접 말하며 테스트해 볼 수 있다

 

커스텀 키워드

 

 

Python으로 구현

 

목표 : 음성으로 받음 -> 텍스트로 변환 -> 프롬프트로 활용하여 ai에 입력 -> 받은 답변을 음성으로 변환

stt -> open ai -> tts

 

STT

 

stt

 

stt

 

TTS

tts

 

tts 모델 연결

 

tts

 

둘을 합치면 아래와 같이 화면이 구현된다

 

STT, TTS

 

 

오늘의 간단한 후기

 

음성으로 할 수 있는 일이 상당히 많아서 놀랐다. 또한, 여러 학습의 결과를 확인하였는데, 생각보다 목소리의 특징을 잘 잡아내어 신기하다는 생각이 들었다.

 

 

 

출처

 

-If any problem for references, or any questions please contact me by comments.

-This content is only for recording my studies and personal profiles

 

일부 출처는 사진 내에 표기되어 있습니다

본문의 내용은 학습과 개인 profile 이외의 다른 목적이 없습니다

출처 관련 문제 있을 시 말씀 부탁드립니다

상업적인 용도로 사용하는 것을 금합니다

본문의 내용을 Elixirr 강의자료 내용(정종현)을 기반으로 제작되었습니다

깃허브 소스코드의 내용을 담고 있습니다

본문의 내용은 MS AI School 6기의 강의 자료 및 수업 내용을 담고 있습니다

 

 

 

 

 

 

 

 

 

 

 

반응형