본문 바로가기

STT3

TTS, STT 및 SSML 베하! 안녕하세요~ BTC_수신자표시제한 입니다 😊 인공지능의 발전에 대해 저희들이 가장 가까이에서 접할 수 있는 것 중 하나는 콜봇이라고 생각되는데요. 콜봇을 구성하기 위해 필요한 인공지능 TTS와 STT에 대해 알아보고 TTS에서 사용되는 SSML에 대해 살펴보겠습니다. 1.TTS(Text To Speech)란? TTS는 텍스트 형태의 데이터를 기반으로 음성 데이터로 변환하는 기술을 의미합니다. TTS를 활용으로 텍스트에서 음성 출력이 가능해지면서 고객에게 정보를 전달하는 방법에 다양화가 가능해졌습니다. 또한 시력에 문제가 있는 사람에게 텍스트를 통한 전달은 효과적이지 못할 수 있는데 이러한 상황에서 TTS를 통한 음성의 정보전달은 좋은 선택지가 될 수 있습니다. 2. STT(Speech To Tex.. 2023. 12. 22.
TTS 란? 1. TTS란?- 문자를 사람의 음성으로 변환해주는 기술 'Text to Speech'- 음성 합성(音聲合成, speech synthesis) 이라고도 표현- 오디오 표현을 위해 텍스트 단위를 음성 단위로 변경하는 자연스러운 언어 모델링 프로세스- 디지털 텍스트에서 오디오 출력을 렌더링하여 시각장애인처럼 읽을 수 없거나 다른 종류의 용도로 사용하는 사람들을 돕기 위한 기술에서 시작 1-1. TTS의 개요 - 말소리의 음파를 기계가 자동으로 만들어 내는 기술로, 간단히 말하면 모델로 선정된 한 사람의 말소리를 녹음하여 일정한 음성 단위로 분할한 다음, 부호를 붙여 합성기(Speech Computer, Speech Synthesizer)에 입력하였다가 지시에 따라 필요한 음성 단위만을 다시 합쳐 말소리를 인.. 2022. 11. 29.
STT란? 1. STT(Speech-to-Text) - STT(Speech-to-Text), Voice Recognition 또는 인공 청각, 음성 인식이라고 표현 - 사람이 말하는 음성 언어를 컴퓨터가 해석하여 그 내용을 문자 데이터로 전환하는 처리 - 음성 인터페이스를 통해 텍스트(문자) 데이터 추출 2. STT 수행 과정 - 입력 음성 전처리 - 많은 음성 데이터에 의해 트레이닝된 모델과 비교하여 텍스트 결과 출력 : 학습 단계 결과인 음향 모델(Acoustic Model), 언어 모델(Language Model)과 발음 사전(Pronunciation Lexicon)을 이용하여 입력된 특징 벡터를 모델과 비교, 스코어링(Scoring)하여 단어 열을 최종 결정 짓습니다. 얼마나 다양항 음성 데이터로 트레이닝을.. 2022. 11. 21.