동향

(GT주간브리프-브뤼셀) 유럽 음성기술(Speech Technology)의 현재


음성기술(Speech technology)은 기계를 통해 인간의 말소리를 생성하거나 인식하고자 하는 기술로 크게 음성합성(speech synthesis)과 음성인식(speech recognition ) 두 분야로 나눌 수 있다.
인간의 음성으로 발성된 문장을 기계가 인식할 수 있도록 하는 음성인식 기술은, 1990년대를 전후하여 만들어진 초기 제품들에서는 주로 사람이 불러주는 내용을 문서로 작성하는 받아쓰기 단계에 그쳤던 것에 비해, 2000년대에 개발된 음성인식은 알고리즘을 통해 인식된 문장의 의미를 이해하는 단계에 이르렀다. 그 결과, 스마트폰을 비롯한 여러 사물인터넷(IoT)이나 로봇과 같은 기기에서 사용자의 명령과 요구를 인식하고 그에 적절한 반응을 만들어낼 수 있게 하는 대화형 인터페이스(conversational interface)가 구축되었으며, 초기 기술에서는 음성인식 제품 사용에 앞서 미리 지정된 텍스트를 사용자가 읽게 하여 사용자 개개인에 특성화된 음향 모델을 만드는 사용자 트레이닝 과정이 필요했던 것과 달리, 대용량 데이터 처리 기술과 클라우드 기술이 발달함으로써 현재는 별도의 사용자 트레이닝 과정 없이 불특정 사용자가 사용할 수 있게 되었다.


* 자세한 내용은 바로가기(URL)와 첨부파일을 통해 확인하시기 바랍니다.
 

리포트 평점  
해당 콘텐츠에 대한 회원님의 소중한 평가를 부탁드립니다.
0.0 (0개의 평가)
평가하기
등록된 댓글이 없습니다.