인공지능1 STT란? 1. STT(Speech-to-Text) - STT(Speech-to-Text), Voice Recognition 또는 인공 청각, 음성 인식이라고 표현 - 사람이 말하는 음성 언어를 컴퓨터가 해석하여 그 내용을 문자 데이터로 전환하는 처리 - 음성 인터페이스를 통해 텍스트(문자) 데이터 추출 2. STT 수행 과정 - 입력 음성 전처리 - 많은 음성 데이터에 의해 트레이닝된 모델과 비교하여 텍스트 결과 출력 : 학습 단계 결과인 음향 모델(Acoustic Model), 언어 모델(Language Model)과 발음 사전(Pronunciation Lexicon)을 이용하여 입력된 특징 벡터를 모델과 비교, 스코어링(Scoring)하여 단어 열을 최종 결정 짓습니다. 얼마나 다양항 음성 데이터로 트레이닝을.. 2022. 11. 21. 이전 1 다음