식당을 운영하는 사장님이라면 이런 경험 있으실 거예요. 분명 같은 말을 했는데, 어떤 날은 AI가 척척 알아듣고 어떤 날은 엉뚱한 대답을 내놓는 것처럼 느껴지는 순간이요.
이게 고장일까요? 아닙니다. 사실 이건 전화 AI가 말을 '알아듣는 방식' 자체에서 비롯된 현상입니다.
AI는 '정답'을 찾는 게 아니라 '확률'로 선택한다
사람은 상대방 말을 들으면 뇌가 바로 의미를 파악합니다. 하지만 AI는 다릅니다. 들어온 음성을 여러 후보 텍스트로 쪼개고, "이 소리가 이 단어일 가능성은 몇 퍼센트"를 수백 번 계산한 뒤 가장 높은 확률의 조합을 정답으로 고릅니다. 마치 흐릿한 사진 속 물체를 보고 "이건 고양이일 것 같다"고 추측하는 것과 비슷하죠.
그럼 왜 같은 말도 어떤 날은 삐끗할까요?
확률 계산에 영향을 주는 요소가 생각보다 많습니다.
- 배경 소음 — 점심 피크 타임에 주방 소리가 섞이면 음성 신호 자체가 달라집니다.
- 전화 신호 품질 — 인터넷 연결이 불안정하면 음성 데이터 일부가 뭉개집니다.
- 말하는 속도나 리듬 — 같은 단어라도 평소보다 빠르게 말하면 AI가 분리하는 경계가 달라집니다.
- 새 단어·고유명사 — AI가 미리 학습하지 못한 메뉴 이름이나 동네 이름은 확률 자체가 낮게 잡힙니다.
즉, 사람이 "오늘 왜 이래?" 싶을 때는 대부분 이 중 하나가 평소와 달라진 상황입니다.
"삐끗"을 줄이는 방법이 있나요?
완전히 없앨 수는 없지만, 줄이는 방법은 있습니다. AI에게 우리 가게에서 자주 쓰는 단어(메뉴명, 자주 묻는 질문)를 미리 알려주면, 그 단어의 확률값이 올라가서 더 잘 알아듣게 됩니다. 또, AI가 불확실할 때 위 데모처럼 한 번 되물어 확인하는 기능을 넣어두면 실수가 최종 오류로 이어지지 않습니다.
AI가 말을 알아듣는 일은 사실 '정답을 찾는 시험'이 아니라, 매 순간 최선의 추측을 하는 과정입니다. 그 원리를 알면 "오늘 왜 이래?"가 덜 당황스럽게 느껴지실 거예요.