블로그ㅣChatGPT로 시작된 생성형 AI 시대, 시리 대변혁 가능할까?
요즘 어디에나 있는 것처럼 보이는 ‘생성형 AI’와 ‘ChatGPT’를 통해 상상이 현실로 다가왔다. 따라서 ‘새롭게 개선될 시리’에 관한 이야기가 들려오는 것이 놀랍지는 않다. 실제로 나인투파이브맥(9to5Mac)은 새로운 자연어 시스템을 발견했다.
보도에 따르면 tvOS 16.4 베타 버전에서 ‘시리 자연어 생성(Siri Natural Language Generation)’ 프레임워크가 발견됐다. tvOs 16.4 베타 버전이 설치된 애플TV에서 시리와 농담을 주고받을 때 활성화되는 것으로 알려졌다. 이보다 앞선 뉴욕타임스의 애플 AI 서밋(AI summit)에 관한 기사는 해당 행사가 생성형 콘텐츠와 대규모 언어 모델(LLM)에 어느 정도 초점을 맞췄다고 주장했다. 아울러 소식통을 인용해 “애플의 많은 엔지니어가 매주 새로운 언어 개념을 도입하여 언어 생성 개념을 ‘적극적으로 테스트’하고 있다”라고 언급했다.
그렇다면 애플은 ChatGPT의 경쟁 상대를 만들고 있는 걸까? 블룸버그에 의하면 그렇진 않다.
“시리야, ‘캐치업(catch-up)’의 철자가 어떻게 돼?”
처음 등장했을 당시, 시리는 놀라울 정도로 정교해 보였다. 하지만 시리 개발 속도가 AI 발전 속도를 따라가지 못하면서, 애플의 음성 어시스턴트는 역사 속으로 쓸쓸히 사라진 애플의 모바일미(MobileMe)와 핑(Ping)의 전철을 밟지 않을까 우려됐다. 앞서 언급한 애플의 실패 사례와 마찬가지로 시리는 기대치에 부응하지 못했고, 지금은 구글과 아마존의 어시스턴트보다 뒤처지고 있다.
시리의 맥락 인식 부족은 이 음성 어시스턴트가 학습한 일에만 능숙하다는 것을 의미한다. GPT는 시리를 크게 앞지르는 것처럼 보인다. 오픈AI는 빠르게 혁신하고 있으며, 최근 GPT-4 업데이트를 발표했다. 이는 빅테크 기업들의 경쟁에도 제대로 불을 지폈다. 마이크로소프트는 빙(Bing)에 ChatGPT를 적용했고, 구글은 팜(Palm) 개발에 박차를 가하고 있으며, 아마존은 AWS 챗(AWS Chat)을 강력하게 푸시하고 있다(AWS 챗은 최근 마이크로소프트 팀즈에 통합됐다).
애플 그리고 시리는 아직 갈 길이 멀어 보인다.
물론 애플이 공을 들이고 있는 머신 인텔리전스(MI)가 시리만 있는 것은 아니다. 접근성 및 이미지 증강 등 일부 영역에서는 MI를 제대로 구현했다. 하지만 어쨌든 시리에서는 여전히 실수를 저지르고 있다. 이는 부분적으로 시리의 구축 방식 때문이다.
시리를 만든 방법
시리는 다양한 지식 영역에 관한 답변이 담긴 일종의 거대한 데이터베이스다. 시리는 사용자의 요청을 받으면 질문을 이해했는지 확인한 다음, 딥러닝/머신러닝 알고리즘을 사용하여 적절한 답변을 파악한다. 그리고 정답을 맞힐 가능성을 수치로 평가한다(신뢰도 점수).
다시 말해, 시리에게 질문을 하면 시리는 우선 이미 알고 있는 정보로 신속하게 처리할 수 있는 간단한 요청(예 : “불 켜줘”)인지, 아니면 더 큰 데이터베이스를 참조해야 하는지 빠르게 살펴본다. 그다음 사용자가 요청한 작업을 수행하거나(가끔), 필요한 데이터를 가져오거나(자주), 사용자의 요청을 이해하지 못했다고 말하거나 시스템 어딘가에 숨겨진 설정을 변경하라고 한다(너무 자주).
물론 이론적으로 시리는 데이터베이스가 많을수록 더 나은 답변을 제공하고, 더 효과적일 수 있다. 하지만 문제가 있다. 전 애플 엔지니어 존 버키에 따르면 시리 구축 방식은, 엔지니어가 데이터베이스를 업그레이드하기 위해 전체 데이터베이스를 다시 구축해야 한다는 것을 의미한다. 이 과정은 최대 6주까지 걸릴 수 있다. 이에 따른 학습 부족으로 시리와 다른 음성 어시스턴트는 “멍청하다(dumb as a rock)”라고 마이크로소프트 CEO 사티아 나델라는 지적한 바 있다.
반면에 생성형 AI(ChatGTP, 미드저니, 달리, 스테이블 디퓨전에 사용되는 일종의 인텔리전스)는 자연어, 자체 데이터베이스 및 검색 결과를 사용하지만, 알고리즘을 활용하여 원본처럼 보이는 콘텐츠(오디오, 이미지 또는 텍스트 등)를 생성할 수 있다. 아울러 사용자가 질문을 하면 활용 가능한 모든 데이터를 샅샅이 뒤져 몇 가지 결정을 내리고 결과를 도출한다.
사람들이 이 기술을 탐구하기 시작한 이래로 자주 언급된 것처럼, 이런 결과가 항상 훌륭하거나 독창적이진 않다. 하지만 대게는 설득력 있어 보인다. 딥페이크 영상과 사진을 생성하도록 요청할 수 있는 기능은 이 기술을 더 발전시킨다.
시리와 생성형 AI의 차이점을 확인하는 한 가지 방법이 있다. 두 AI 모델이 달성할 수 있는 것을 생각해보면 된다. 시리를 사용하면 포르투갈 리스본 지도나 지도상의 어딘가로 가는 길 찾기를 요청할 수 있지만, 생성형 AI를 활용하면 도시의 어떤 지역을 추천하는지 등 더 미묘한 질문을 던지고, 이를 통해 해당 지역을 배경으로 한 이야기를 쓰거나 어떤 지역의 멋진 바에 앉아 있는 사용자의 모습을 무섭고 정확하게 가짜 사진으로 만들어낼 수 있다.
어떤 AI가 인상적인지는 꽤 분명해 보인다.
앞으로 어떻게 될까?
개발자들은 애플 제품에 ChatGPT를 추가하는 앱을 만들었다. 최근 상표권 상의 이유로 ‘피티 – AI 어시스턴트(Petey – AI Assistant)’로 이름이 바뀐 ‘워치GPT’가 바로 그것이다.
애플은 경쟁적으로 중요한 기술을 서드파티에 양도하고 싶어 하지 않을 것이기 때문에 자체 솔루션을 개발하기 위해 계속 노력할 가능성이 크다. 하지만 이 작업에는 몇 년이 걸릴 수 있고, 그동안 시리는 계속 뒤처질 수 있다. 그러나 GPT-4 비용이 프롬프트 1,000건당 최대 12센트에 달한다는 점을 고려하면 애플이 직접적으로 자사 운영체제에 이 기술을 도입할 가능성은 거의 없어 보인다. 전 세계 10억 명 이상의 사용자가 있는 상황에서 그렇게 하려면 엄청난 비용이 들 것이기 때문이다.
이런 맥락에서 애플은 개발자들이 구축하는 앱에 오픈AI 기술을 쉽게 추가할 수 있도록 해 개발자와 고객에게 비용을 효과적으로 전가할 수 있다. 단기적으로는 도움이 될 수 있겠지만, 애플의 머신 인텔리전스 팀에게는 발등에 불이 떨어졌다고 생각한다. 머신 인텔리전스 팀은 자연어 처리를 더 발전시키기 위해 각고의 노력을 기울이고 있을 것이다.
현재 구현 단계에서 시리는 뒤처진 것으로 보인다. 그렇지만 GPT로 생성된 이미지에서 볼 수 있듯이 겉으로 보이는 이미지는 기만적일 수 있다.
위 포스팅이 문제될 시 삭제하겠습니다.
댓글 없음:
참고: 블로그의 회원만 댓글을 작성할 수 있습니다.