글 수 220
https://tech.kakaoenterprise.com/42?category=909203
"그렇다면 카카오미니는 일상 대화와 호출 명령어를 어떻게 구분할까요? 스피커가 호출 명령어를 알아듣게 하기 위해 핵심어 검출(Keyword Spotting) 기반의 음성 인식 기술을 사용합니다."
"키워드 판별을 위해서는 미리 구성한 음향 모델(Acoustic Model)을 사용합니다. 음향 모델은 많은 사람의 목소리가 저장된 음성 데이터베이스를 바탕으로 적절한 기계 학습(Machine Learning)을 통해 구축합니다. 일반적으로 음향 모델은 음소(Phoneme) 단위를 기반으로 한 은닉 마르코프 모델(Hidden Markov Model, 이하 HMM) 형태로 구성됩니다."
AI 스피커에게 명령을 내리기 위해서는, 우선 호출어(wake-up word)를 말해야 합니다. 이를 어떻게 인식하는지에 대해 자세히 설명하고 있습니다. 앞으로는 호출어가 필요없게 될지도 모릅니다. 상황을 인지하여 자신에게 말하는지 스스로 판단하게 될거라 생각합니다.