버추얼 어시스턴트

Virtual assistant
픽셀 XL 스마트폰에서 실행되는 Google Assistant

가상 어시스턴트(VA, Virtual Assistant)는 구두를 포함한 명령이나 질문과 같은 사용자 입력을 기반으로 사용자를 위한 다양한 작업이나 서비스를 수행할 수 있는 소프트웨어 에이전트입니다.이러한 기술은 사용자와의 상호 작용을 촉진하기 위해 종종 온라인 채팅을 통한 인간 대화를 시뮬레이션하는 챗봇 기능을 포함합니다.상호 작용은 텍스트, 그래픽 인터페이스 또는 음성을 통해 이루어질 수 있습니다. 일부 가상 비서는 사람의 말을 해석하고 합성된 음성을 통해 응답할 수 있기 때문입니다.

많은 경우 사용자는 가상 비서에게 질문을 하고, 홈 오토메이션 장치와 미디어 재생을 제어하며, 이메일, 할 일 목록, 일정관리와 같은 다른 기본 작업을 구두 명령으로 관리할 수 있습니다.[1]최근 몇 년간 아마존알렉사, 애플시리, 마이크로소프트코타나, 구글 어시스턴트 등 유명한 소비자 직접 사용 가상 비서가 등장했습니다.[2]또한 다양한 산업 분야의 기업들은 종종 고객 서비스나 지원에 가상 비서 기술을 접목합니다.[3]

최근 ChatGPT와 같은 최근 인공지능 기반 챗봇의 등장으로 가상 비서 제품 및 서비스 분야에 대한 역량과 관심이 높아지고 있습니다.[4][5]

역사

실험년수: 1910년대~1980년대

라디오 렉스는 1916년에[6] 특허를 받고 1922년에 출시된 최초의 음성 작동 장난감입니다.[7]개 모양의 나무로 만든 장난감으로 이름을 부르면 집 밖으로 나옵니다.

1952년 벨 연구소는 자동 숫자 인식 기계인 "오드리"를 선보였습니다.6피트 높이의 릴레이 랙을 차지했고, 상당한 전력을 소비했으며, 케이블 스트림이 있었으며 복잡한 진공관 회로와 관련된 수많은 유지보수 문제를 나타냈습니다.그것은 음성, 음소의 기본 단위를 인식할 수 있었습니다.지정된 대화자가 말하는 숫자를 정확하게 인식하는 것에 한정되었습니다.따라서 음성 전화 걸기에 사용할 수 있지만 대부분의 경우 연속된 숫자를 말하는 것보다 푸시 버튼 전화 걸기가 더 저렴하고 빠릅니다.[8]

디지털 음성 인식을 수행할 수 있었던 또 다른 초기 도구는 IBM Shoebox 음성 활성화 계산기로, 1961년 최초 시장 출시 후 1962년 시애틀 세계 박람회 기간 동안 일반 대중에게 공개되었습니다.1981년 최초의 IBM 개인용 컴퓨터가 도입되기 약 20년 전에 개발된 이 초기 컴퓨터는 16개의 구어와 0에서 9까지의 숫자를 인식할 수 있었습니다.

최초의 자연어 처리 컴퓨터 프로그램 또는 챗봇 엘리자는 1960년대에 MIT 교수 Joseph Weizenbaum에 의해 개발되었습니다.그것은 "인간과 기계 사이의 의사소통이 피상적이었다는 것을 보여주기 위해" 만들어졌습니다.[9]ELIZA는 대화를 시뮬레이션하기 위해 패턴 매칭과 스크립트로 작성된 응답에 대체 방법론을 사용하여 프로그램 측면에서 이해하는 듯한 착각을 주었습니다.

보도에 따르면 바이젠바움의 비서는 그녀와 엘리자가 진정한 대화를 나눌 수 있도록 바이젠바움에게 방을 나가달라고 부탁했습니다.바이젠바움은 이에 놀라 나중에 이렇게 썼습니다. "비교적 간단한 컴퓨터 프로그램에 너무 짧게 노출되는 것이 꽤 정상적인 사람들에게 강력한 망상적 사고를 유발할 수 있다는 것을 깨닫지 못했습니다.[10]

이것은 ELIZA 효과에 이름을 붙였는데, 무의식적으로 컴퓨터 행동이 인간의 행동과 유사하다고 가정하는 경향, 즉 가상 비서와의 인간 상호 작용에 존재하는 현상인 의인화입니다.

음성 인식 기술의 발전에 있어서 다음 이정표는 1970년대에 펜실베이니아주 피츠버그있는 카네기 멜론 대학에서 미국 국방부와 DARPA 기관의 상당한 지원으로 이루어졌으며, 5년간의 음성 이해 연구 프로그램에 자금을 지원하여 최소한의 어휘에 도달하는 것을 목표로 하였습니다.천 마디.IBM, 카네기멜론대학(CMU), 스탠포드연구소 등 기업과 학계가 이 프로그램에 참여했습니다.

결과는 "하피"였고, 약 1000개의 단어를 마스터했고, 세 살짜리 아이의 어휘를 이해할 수 있었습니다.그것은 어떤 단어의 순서가 함께 의미가 있는지를 결정하기 위해 미리 프로그램된 어휘, 발음, 문법 구조를 따르는 음성을 처리할 수 있고, 따라서 음성 인식 오류를 줄일 수 있습니다.

1986년 탕고라는 슈박스의 업그레이드로 음성인식 타자기였습니다.당시 세계에서 가장 빠른 타이피스트의 이름을 딴 이 타이피스트는 20,000개의 단어의 어휘를 가지고 있었고, 예측을 사용하여 과거에 말한 것을 바탕으로 가장 가능성 있는 결과를 결정했습니다.IBM의 접근 방식은 디지털 신호 처리 기술에 통계를 추가하는 숨겨진 마코프 모델을 기반으로 했습니다.이 방법은 주어진 음소를 따를 가능성이 가장 높은 음소를 예측하는 것을 가능하게 합니다.그럼에도 불구하고 각 화자는 타자기가 자신의 목소리를 인식하도록 개별적으로 훈련시키고, 각 단어 사이를 잠시 멈추도록 해야 했습니다.

스마트 가상 비서의 탄생: 1990~2010년대

1990년대에 디지털 음성 인식 기술은 IBM, PhilipsLernout & Hauspie가 고객을 위해 싸우면서 개인용 컴퓨터의 특징이 되었습니다.이후 1994년 최초의 스마트폰 IBM Simon의 시장 출시로 오늘날 우리가 알고 있는 스마트 가상 비서의 기반이 마련되었습니다.[citation needed]

1997년 Dragon의 Natural Speaking 소프트웨어는 분당 100단어의 속도로 각 단어들 사이에서 일시정지 없이 자연스러운 인간의 말을 인식하고 문서에 전사할 수 있었습니다.Natural Speaking 버전은 여전히 다운로드가 가능하며, 예를 들어 미국과 영국의 많은 의사들이 의료 기록을 문서화하기 위해 오늘날에도 여전히 사용되고 있습니다.[citation needed]

2001년 콜로키스AIM이나 MSN 메신저와 같은 플랫폼에서 SmartChild를 공개적으로 출시했습니다.텍스트 기반의 SmartChild는 게임을 하고 날씨를 확인하고 사실을 찾아보고 사용자와 대화할 수 있었습니다.[11]

스마트폰에 탑재된 최초의 현대식 디지털 가상 비서는 2011년 10월 4일 아이폰 4S의 기능으로 소개된 시리(Siri)였습니다.[12]Apple Inc.DARPA와 미 국방부가 자금을 지원하는 연구 기관인 SRI International분할 회사인 Siri Inc.를 2010년 인수한 후 Siri를 개발했습니다.[13]그 목적은 문자 메시지 보내기, 전화 걸기, 날씨 확인 또는 알람 설정과 같은 일들을 돕는 것이었습니다.시간이 지나면서 음식점 추천, 인터넷 검색, 길 안내 등을 제공하는 형태로 발전했습니다.[citation needed]

2014년 11월 아마존은 에코와 함께 알렉사를 발표했습니다.[14]

2017년 4월 아마존은 모든 유형의 가상 비서 또는 인터페이스를 위한 대화형 인터페이스를 구축하는 서비스를 출시했습니다.

인공지능과 언어 모델: 2020년대-현재

2020년대에 ChatGPT와 같은 인공지능(AI) 시스템은 텍스트 기반 대화에 인간과 같은 반응을 생성할 수 있는 능력으로 인기를 얻었습니다.2020년 2월, 마이크로소프트는 튜링 자연 언어 생성(T-NLG)을 선보였는데, 이는 당시 "170억 개의 매개 변수로 발표된 가장 큰 언어 모델"이었습니다.[15]2022년 11월 30일, ChatGPT는 프로토타입으로 출시되었으며 다양한 지식 영역에서 세부적인 응답과 명확한 답변으로 빠르게 주목을 받았습니다.ChatGPT의 등장과 더 넓은 대중에게 소개되면서 공간에 대한 관심과 경쟁이 증가했습니다.2023년 2월, 구글은 LaMDA 프로그램을 기반으로 에서 수집한 정보를 바탕으로 질문에 대한 텍스트 응답을 생성하는 "Bard"라는 실험적인 서비스를 선보이기 시작했습니다.

최신 세대 인공지능에 기반한 ChatGPT 및 기타 일반화된 챗봇은 가상 비서와 관련된 다양한 작업을 수행할 수 있지만, 보다 특정한 상황이나 필요를 목표로 설계된 이러한 기술의 보다 전문화된 형태도 있습니다.[16][4]

상호작용법

Alexa 가상 비서를 실행하는 Amazon Echo Dot 스마트 스피커

가상 비서는 다음을 통해 업무를 수행합니다.

Google Assistant는 Google Allo 및 Google Messages 앱의 채팅 및 Google Home 스마트 스피커의 음성을 통해 액세스할 수 있는 등 다양한 방법을 사용할 수 있습니다.

가상 비서는 자연어 처리(NLP)를 사용하여 실행 가능한 명령어에 사용자 텍스트 또는 음성 입력을 일치시킵니다.많은 사람들이 기계 학습주변 지능을 포함한 인공 지능 기술을 사용하여 계속해서 배웁니다.Google Assistant(Google Lens 포함) 및 Samsung Bixby와 같은 일부 보조 기능은 사용자가 클릭한 이미지에서 더 나은 결과를 얻을 수 있도록 이미지에서 개체를 인식하는 이미지 처리 기능을 추가로 제공합니다.

음성을 사용하여 가상 비서를 활성화하려면 웨이크 워드(wake word)를 사용될 수 있습니다.이것은 "Hey Siri", "OK Google" 또는 "Hey Google", "Alexa" 및 "Hey Microsoft"와 같은 단어 또는 그룹입니다.[19]가상 비서가 대중화됨에 따라 관련 법적 위험이 증가하고 있습니다.[20]: 815

발견된 경우 장치 및 개체

사용자가 가상 비서인 시리에게 시청할 콘텐츠를 찾도록 요청할 수 있는 Apple TV 리모컨

가상 비서는 여러 유형의 플랫폼에 통합되거나 Amazon Alexa와 같이 여러 플랫폼에 걸쳐 통합될 수 있습니다.

서비스

가상 비서는 다양한 서비스를 제공할 수 있습니다.여기에는 다음이 포함됩니다.[28]

  • 날씨, 예를 들어 사실과 같은 정보를 제공합니다.Wikipedia 또는 IMDb, 알람 설정, 할 일 목록 작성 및 쇼핑 목록
  • SpotifyPandora와 같은 스트리밍 서비스에서 음악 재생, 라디오 방송국 재생, 오디오북 읽기
  • 비디오, TV 쇼 또는 영화를 텔레비전에서 재생할 수 있습니다.넷플릭스
  • 대화형 상거래(아래 참조)
  • 정부와의 공공 교류 지원 (정부인공지능 참조)
  • 의료, 영업, 은행 등의 분야에서 인적 고객 서비스 전문가를[29] 보완 및/또는 교체합니다.한 보고서는 자동화된 온라인 어시스턴트가 사람이 제공하는 콜센터의 업무량을 30% 감소시켰다고 추정했습니다.[30]
  • 차량음성 비서 Siri와 Alexa와 같은 가상 비서와의 상호 작용은 오늘날 보편화되었습니다.그것은 사람들이 더 편안해지고 특출난 운전 경험을 할 수 있게 해줍니다.

컨버세이션 커머스

대화형 상거래는 음성 비서를[31] 통한 전자 상거래뿐만 아니라 전자 상거래 웹 사이트에서의 라이브 채팅, 위챗, 페이스북 메신저 및 왓츠앱[32] 같은 메시징 응용 프로그램에서의 라이브 채팅, 메시징 응용 프로그램 또는 웹 사이트에서의 챗봇을 포함한 다양한 메시징 수단을 통한 전자 상거래입니다.

고객지원

가상 어시스턴트는 기업의 고객 지원 팀과 협력하여 고객에게 연중무휴로 지원을 제공할 수 있습니다.고객의 경험을 향상시키는 빠른 응답을 제공합니다.

타사 서비스

Amazon은 Alexa "Skills"와 Google "Actions"를 지원하며, 기본적으로 보조 플랫폼에서 실행되는 애플리케이션입니다.

가상 비서 개인 정보 보호

가상 비서는 그들과 관련된 다양한 개인 정보 보호 문제를 가지고 있습니다.음성으로 활성화하는 기능과 같은 기능은 장치가 항상 청취해야 하므로 위협이 됩니다.[33]가상 비서에 대한 다층 인증을 생성하기 위해 가상 보안 버튼과 같은 개인 정보 보호 모드가 제안되었습니다.[34]

저명한 가상 비서의 개인 정보 보호 정책

구글 어시스턴트

구글 어시스턴트의 개인 정보 보호 정책은 사용자의 허락 없이 오디오 데이터를 저장하는 것이 아니라 사용자의 경험을 개인화하기 위해 대화 내용을 저장할 수 있다고 명시합니다.설정에서 개인 설정을 해제할 수 있습니다.사용자가 Google Assistant에서 오디오 데이터를 저장하려면 VAA(Voice & Audio Activity)로 이동하여 이 기능을 켤 수 있습니다.오디오 파일은 구글 어시스턴트의 성능을 향상시키기 위해 클라우드로 전송되고 구글이 사용하지만 VAA 기능이 켜져 있는 경우에만 사용됩니다.[35]

아마존의 알렉사

Amazon의 가상 비서인 Alexa의 개인 정보 보호 정책은 Alexa, Amazon, Echo와 같은 웨이크 워드가 사용될 때에만 대화를 듣는다고 명시합니다.웨이크 워드가 호출된 후 대화 녹음을 시작하고, 8초간 침묵한 후 녹음을 중단합니다.녹음된 대화 내용을 클라우드로 전송합니다.'알렉사' 내 '알렉사 프라이버시'를 방문하면 클라우드에서 녹음을 삭제할 수 있습니다.[36]

애플의 시리

애플은 시리 개선을 위해 오디오를 녹음하지 않는다고 밝혔습니다.대신에, 그것은 성적 증명서를 사용합니다.분석에 중요하다고 판단되는 경우에만 전사 데이터가 전송됩니다.사용자는 시리가 클라우드에 녹취록을 보내지 않기를 원한다면 언제든지 선택할 수 있습니다.[37]

소비자에 대한 추정 이자 및 관측 이자

새로운 상호작용 방식을 허용하는 것으로 추정되는 부가가치

가상 어시스턴트의 부가 가치는 다음과 같습니다.

  1. 그것은 편리합니다: 목소리가 가능한 유일한 의사소통 방법인 일부 분야가 있고, 더 일반적으로, 그것은 다른 활동을 병행할 수 있도록 양손과 시력을 자유롭게 해주거나, 장애인들을 돕기도 합니다.
  2. 속도가 더 빠릅니다.음성은 키보드로 글을 쓰는 것보다 더 효율적입니다: 우리는 키보드로 글을 쓸 때 60개와 반대로 분당 200개의 단어를 말할 수 있습니다.그래서 더 적은 노력을 요구하는 것이 더 자연스럽습니다. (글을 읽는 것은 분당 700단어에 이를 수 있습니다.)[38]
  • 가상 비서는 자동화를 통해 많은 시간을 절약합니다. 고객이 다른 일을 하는 동안에도 약속을 잡거나 뉴스를 읽을 수 있습니다.또한 가상 비서에게 회의 일정을 지정하도록 요청할 수 있으므로 시간을 계획하는 데 도움이 됩니다.새로운 디지털 스케줄러의 설계자들은 이 달력들이 소비자가 기계 학습 과정을 통해 시간을 좀 더 효율적으로 사용할 수 있도록, 그리고 작업 시간과 자유 시간의 완전한 조직화를 위해 자신들의 삶을 계획하는 포부를 설명했습니다.예를 들어, 소비자가 휴식 시간을 계획하고 싶다는 의사를 표시하는 경우, VA는 소비자의 여가 시간을 계획하고 조직할 수 있는 추가적인 장기적인 목표와 함께, 이를 위해 최적의 시기에 일정을 잡습니다.최적의 작업 효율성을 보장합니다.[39]

지각이익

소비자를 위한 가상 비서의 관심 이유를 포착한 연구의 그래픽 요약
  • 최근 연구(2019)에 따르면 소비자들이 가상어시스턴트를 사용하는 이유는 지각된 유용성과 지각된 즐거움 두 가지로 나타났습니다.본 연구의 첫 번째 결과는 지각된 유용성과 지각된 즐거움 모두 가상어시스턴트를 사용하려는 소비자의 의지에 동등하게 매우 강한 영향을 미친다는 것입니다.
  • 이 연구의 두 번째 결과는 다음과 같습니다.
  1. 제공되는 콘텐츠 품질은 지각된 유용성에 매우 강한 영향을 미치고, 지각된 즐거움에 강한 영향을 미칩니다.
  2. 시각적 매력은 인지된 즐거움에 매우 강한 영향을 미칩니다.
  3. 자동화는 지각된 유용성에 강력한 영향을 미칩니다.[40]

논쟁거리

인공지능 논란

  • 가상 비서가 필터 버블을 자극합니다.소셜 미디어의 경우, 가상 비서의 알고리즘은 소비자의 이전 활동을 기반으로 관련 데이터를 보여주고 다른 데이터를 폐기하도록 훈련 받습니다.관련 데이터는 소비자의 흥미를 끌거나 만족시킬 수 있는 데이터입니다.그 결과, 그들은 자신들의 관점에 맞지 않는 데이터로부터 고립되어 사실상 자신들의 지적 거품으로 고립되고 자신들의 의견을 강화합니다.이 현상은 가짜 뉴스메아리실을 강화하는 것으로 알려져 있습니다.[41]
  • 가상 비서는 과대평가되었다는 비판을 받기도 합니다.특히 A. 카실리는 가상 비서의 AI가 지능적이지도 인공적이지도 않은 두 가지 이유를 지적합니다.
  1. 그들이 하는 모든 것이 인간의 조수가 되는 것이고, 인간이 쉽게 할 수 있는 일을 해야만 하고, 정보, 제안 또는 문서를 찾고 분류하고, 제시하는 매우 제한적인 행동의 측면에서만 지적이지 않기 때문입니다.또한, 가상 비서는 스스로 의사결정을 내릴 수도, 예측할 수도 없습니다.
  2. 그리고 미세 작업을 통한 인간의 라벨화 없이는 불가능하기 때문에 인공적이지 않습니다.[42]

윤리적 의미

2019년 안토니오 A. 프랑스의 사회학자카실리는 인공지능과 가상 비서를 특히 다음과 같은 방식으로 비판했습니다.

처음에는 소비자가 가상 어시스턴트의 교육 및 개선을 위해 무료 데이터를 제공한다는 사실이 윤리적으로 불안합니다.

그러나 두 번째 단계에서는 이러한 AI가 이 데이터를 가지고 어떻게 훈련되는지를 아는 것이 윤리적으로 훨씬 더 불안할 수 있습니다.

인공지능은 엄청난 양의 라벨이 부착된 데이터를 필요로 하는 신경망을 통해 훈련됩니다.그러나 이 데이터는 인간 프로세스를 통해 레이블을 지정해야 하며, 이는 지난 10년 동안 마이크로워크의 발전을 설명합니다.즉, 전 세계의 일부 사람들을 원격으로 사용하여 가상 비서의 음성 데이터를 듣고 말을 적은 것과 같은 반복적이고 매우 간단한 작업을 몇센트에 수행하는 것입니다.마이크로워크는 그것이 야기하는 고용 불안과 규제의 완전한 결여로 인해 비판을 받아왔습니다.2010년 평균 급여는 1,38세였고,[43] 건강 관리도, 퇴직 수당도, 병가 수당도, 최저 임금도 제공하지 않습니다.따라서 가상 비서와 그 설계자들은 고용 불안을 부추기기 때문에 논란이 되고 있으며, 그들이 제안하는 AI는 수백만 명의 인간 노동자들의 마이크로워크 없이는 불가능한 방식으로 여전히 인간입니다.[42]

음성 명령이 암호화되지 않은 형태로 가상 비서 제공자에게 제공되므로 제3자와 공유되어 승인되지 않았거나 예기치 않은 방식으로 처리될 수 있기 때문에 개인 정보 보호에 대한 우려가 제기됩니다.[44]녹음된 음성의 언어적 내용 외에도, 사용자의 표현 방식과 음성 특성은 그 또는 그녀의 생체 정체성, 성격 특성, 체형, 신체적 및 정신적 건강 상태, 성별, 성별, 기분 및 감정, 사회 경제적 상태 및 지리적 기원에 대한 정보를 암시적으로 포함할 수 있습니다.[45]

개발자 플랫폼

가상 비서를 위한 주목할 만한 개발자 플랫폼은 다음과 같습니다.

  • 아마존 렉스는 2017년 4월 개발자들에게 공개되었습니다.음성 자동 인식과 결합한 자연어 이해 기술이 포함돼 있으며, 2016년 11월 도입됐습니다.[46]
  • 구글은 개발자들이 구글 어시스턴트를[47] 위한 "액션"을 만들 수 있도록 구글Dialogflow 플랫폼에 대한 액션을 제공합니다.
  • 애플은 개발자들이 Siri를 위한 확장 기능을 만들 수 있도록 SiriKit을 제공합니다.
  • IBM왓슨(Watson)은 때때로 가상 비서로 언급되기도 하지만 실제로는 인공지능 플랫폼 전체와 커뮤니티가 일부 가상 비서인 챗봇을 지원합니다.그리고 많은 다른 유형의 해결책을 제공합니다.[48][49]

전세대

이전 세대의 텍스트 채팅 기반 가상 어시스턴트에서는 어시스턴트를 아바타(일명 대화형 온라인 캐릭터 또는 자동화된 캐릭터)로 표현하는 경우가 많았는데, 이를 구현된 에이전트라고 합니다.

경제적관련성

개인용

가상 비서에 의해 가능해진 디지털 경험은 최근의 주요한 기술 발전과 가장 유망한 소비자 트렌드 중 하나로 여겨집니다.전문가들은 디지털 경험이 더 많은 사람들의 관심을 받고 소중하게 여겨지지 않는다면 '실제' 경험에 버금가는 지위 가중치를 달성할 것이라고 주장합니다.[50]이러한 추세는 빈번한 사용자 수와 전 세계적으로 가상 디지털 어시스턴트 사용자 수가 크게 증가한 것으로 확인됩니다.2017년 중반, 디지털 가상 비서의 빈번한 사용자 수는 전 세계적으로 약 10억 명으로 추정됩니다.[51]또한 가상 디지털 어시스턴트 기술은 더 이상 스마트폰 애플리케이션에 국한되지 않고 다양한 산업 분야(자동차, 통신, 소매, 의료 및 교육 등)에 걸쳐 존재한다는 것을 알 수 있습니다.[52]음성인식 기술 시장은 전 부문에 걸친 기업들의 막대한 연구개발비와 모바일 기기의 도입 증가에 따라 2016년부터 2024년까지 전 세계적으로 CAGR 34.9%의 성장세를 보이며 2024년까지 세계 시장 규모 75억 달러를 돌파할 것으로 전망됩니다.[52]Ovum의 연구에 따르면, 2021년까지 "네이티브 디지털 어시스턴트 설치 기반"은 전 세계 인구를 초과할 것으로 예상되며, 75억 개의 능동 음성 AI가 가능한 장치를 보유할 것으로 예상됩니다.[53]오붐은 "구글 어시스턴트가 23.3%의 점유율로 음성 AI가 가능한 기기 시장을 장악할 것이며, 삼성 빅스비(14.5%), 애플 시리(13.1%), 아마존 알렉사(3.9%), 마이크로소프트 코타나(2.3%) 등이 그 뒤를 이을 것"이라고 전망했습니다.[53]

시장 선도 기업의 지역 분포를 고려하면, BYOD(Bring Your Own Device) 및 엔터프라이즈 모빌리티 비즈니스 모델의 상당한 영향력으로 인해 향후 수년간 북미 기업(예: Nuance Communications, IBM, eGain)이 업계를 장악할 것으로 예상됩니다.또한, 스마트폰 지원 플랫폼에 대한 수요가 증가함에 따라 북미 지능형 가상 비서(IVA) 산업의 성장이 더욱 가속화될 것으로 예상됩니다.북미 시장에 비해 규모가 작음에도 불구하고, 주요 업체가 인도와 중국에 위치한 아시아 태평양 지역의 지능형 가상 비서 산업은 2016-2024년 동안 연평균 40%(글로벌 평균 이상)의 성장률을 보일 것으로 예상됩니다.[52]

기업의 경제적 기회

가상 비서는 기업에 실질적인 경제적 효용을 제공할 수 있기 때문에 개인을 위한 장치로만 간주되어서는 안 됩니다.예를 들어, 가상 어시스턴트는 항상 사용 가능한 어시스턴트로서 백과사전적 지식을 갖춘 어시스턴트 역할을 수행할 수 있습니다.회의를 조직하고, 재고를 확인하고, 정보를 확인할 수 있습니다.가상 어시스턴트는 중소기업에서의 통합이 사물인터넷(IoT)의 글로벌 적응 및 사용을 통한 쉬운 첫 단계로 이루어지는 경우가 많기 때문에 더욱 중요합니다.실제로 중소기업들은 IoT 기술을 매우 중요한 기술로 인식하지만 너무 복잡하고 위험하거나 비용이 많이 들어 사용할 수 없습니다.[54]

보안.

2018년 5월, 캘리포니아 대학교 버클리의 연구원들은 사람의 귀에 감지할 수 없는 오디오 명령이 음악이나 음성 텍스트에 직접 삽입될 수 있다는 것을 보여주는 논문을 발표했습니다. 따라서 가상 비서가 사용자가 그것을 주목하지 않고 특정 행동을 수행하도록 조작할 수 있습니다.[55]연구원들은 오디오 파일에 작은 변화를 주었는데, 이것은 음성 인식 시스템이 감지하도록 되어 있는 소리 패턴을 상쇄시켰습니다.이 소리들은 시스템에 의해 다르게 해석되어 전화번호를 누르거나 웹사이트를 열거나 심지어 송금하도록 명령하는 소리로 대체되었습니다.[55]이러한 가능성은 2016년부터 알려져 왔으며 [55]애플, 아마존, 구글 등의 기기에도 영향을 미칩니다.[56]

의도하지 않은 행동 및 음성 녹음 외에도 지능형 가상 비서와 관련된 또 다른 보안 및 개인 정보 보호 위험은 악의적인 음성 명령입니다.공격자는 사용자를 사칭하여 악의적인 음성 명령을 스마트 도어의 잠금을 해제하여 사용자가 모르는 사이에 집이나 차고에 무단으로 진입하거나 온라인으로 물건을 주문하는 행위를 말합니다.일부 IVA에서 이러한 가장을 방지하기 위해 음성 훈련 기능을 제공하지만, 시스템에서 유사한 음성을 구별하는 것은 어려울 수 있습니다.따라서 IVA 지원 장치에 접근할 수 있는 악의적인 사람은 시스템을 속여서 자신이 진짜 주인이라고 생각하고 범죄나 짓궂은 행동을 할 수 있습니다.[57]

주목할 만한 보조자 비교

지능형 개인 비서 디벨로퍼 무료 소프트웨어 자유-오픈 소스 하드웨어 HDMI 출력 외부 입출력 IOT 크롬캐스트 적분 스마트폰 앱 항상 켜짐 단위 대 단위 음성 채널 스킬어
시드니 Bing.com 아니요. 아니요. 아니요. 아니요. 네. 아니요. 네. 네. ?
알렉사(일명).에코) 아마존 닷컴. 아니요. 아니요. 아니요. 아니요. 네. 아니요. 네. 네. ? 자바스크립트
앨리스야. 얀덱스 아니요. 네. 아니요. 네. 네. ?
알리 지니 알리바바 그룹 아니요. 아니요. 네. 아니요. 네. 네. ?
조수 말해봐요 아니요. 아니요. 아니요. 네. 아니요. ?
빅스비 삼성전자 아니요. 아니요. 아니요. 네. ?
BlackBerry Assistant 블랙베리 리미티드 아니요. 아니요. 아니요. 네. 아니요. ?
브레이나 브레인아소프트 아니요. 아니요. 아니요. 네. 아니요. ?
클로바 네이버 주식회사 아니요. 네. 아니요. 네. 네. ?
코타나 마이크로소프트 아니요. 네. 아니요. 네. 네. ?
듀어 바이두[58]
에비 Amazon.com진정한 지식 아니요. 아니요. 아니요. 네. 아니요. ?
구글 어시스턴트 구글 아니요. 네. 네. 네. 네. C++
구글 나우 구글 아니요. 네. 네. 네. 네. ?
마이크로프트[59] 마이크로프트 AI 네. 네. 네. 네. 네. 네. 네. 네. 네. 파이썬
실비아. 인지 코드 아니요. 아니요. 아니요. 네. 아니요. ?
시리 애플사 아니요. 아니요. 네. 아니요. 네. 네. ?
비브 삼성전자 아니요. 네. 아니요. 네. 아니요. ?
샤오웨이 텐센트 ?
실리아 화웨이 아니요. 아니요. 네. 아니요. 네. 네. ?

참고 항목

참고문헌

  1. ^ Hoy, Matthew B. (2018). "Alexa, Siri, Cortana, and More: An Introduction to Voice Assistants". Medical Reference Services Quarterly. 37 (1): 81–88. doi:10.1080/02763869.2018.1404391. PMID 29327988. S2CID 30809087.
  2. ^ "AI Faceoff: Siri vs. Cortana vs. Google Assistant vs. Alexa - businessnewsdaily.com". Business News Daily.
  3. ^ "The Magic of Virtual Assistants and Their Impact on Customer Service".
  4. ^ a b "The One Thing You Should Definitely be Using AI Chatbot for". 7 April 2023.
  5. ^ "A.I. Means everyone gets a 'white-collar' personal assistant, Bill Gates says".
  6. ^ US 1209636, Christian Berger, "Sound-Operated Circuit Controller" 발행, 1916-12-19, Submarine Wireless Company에 할당됨
  7. ^ Markowitz, Judith. "Toys That Have a Voice". SpeechTechMag.
  8. ^ Moskvitch, Katia. "The machines that learned to listen". BBC. Retrieved 5 May 2020.
  9. ^ Epstein, J; Klinkenberg, W. D (1 May 2001). "From Eliza to Internet: a brief history of computerized assessment". Computers in Human Behavior. 17 (3): 295–314. doi:10.1016/S0747-5632(01)00004-8. ISSN 0747-5632.
  10. ^ Weizenbaum, Joseph (1976). Computer power and human reason : from judgment to calculation. Oliver Wendell Holmes Library Phillips Academy. San Francisco : W. H. Freeman.
  11. ^ "Smartphone: your new personal assistant – Orange Pop". 10 July 2017. Archived from the original on 10 July 2017. Retrieved 5 May 2020.
  12. ^ Murph, Darren (4 October 2011). "iPhone 4S hands-on!". Engadget.com. Retrieved 10 December 2017.
  13. ^ "Feature: Von IBM Shoebox bis Siri: 50 Jahre Spracherkennung – WELT" [From IBM Shoebox to Siri: 50 years of speech recognition]. Die Welt (in German). Welt.de. 20 April 2012. Retrieved 10 December 2017.
  14. ^ Kundu, Kishalaya (2023). "Amazon expands Echo lineup with new smart speaker, earbuds, and more". XDA. Retrieved 26 May 2023.
  15. ^ Sterling, Bruce (13 February 2020). "Web Semantics: Microsoft Project Turing introduces Turing Natural Language Generation (T-NLG)". Wired. ISSN 1059-1028. Retrieved 31 July 2020.
  16. ^ "GPT-4 takes the world by storm - List of companies that integrated the chatbot". 21 March 2023.
  17. ^ "Conversica Raises $31 Million in Series C Funding to Fuel Expansion of Conversational AI for Business". Bloomberg.com. 30 October 2018. Retrieved 23 October 2020.
  18. ^ Herrera, Sebastian (26 September 2019). "Amazon Extends Alexa's Reach Into Wearables". The Wall Street Journal. Retrieved 26 September 2019.
  19. ^ "S7617 – Developing Your Own Wake Word Engine Just Like 'Alexa' and 'OK Google'". GPU Technology Conference. Retrieved 17 July 2017.
  20. ^ Van Loo, Rory (1 March 2019). "Digital Market Perfection". Michigan Law Review. 117 (5): 815. doi:10.36644/mlr.117.5.digital. S2CID 86402702.
  21. ^ La, Lynn (27 February 2017). "Everything Google Assistant can do on the Pixel". CNET. Retrieved 10 December 2017.
  22. ^ Morrison, Maureen (5 October 2014). "Domino's Pitches Voice-Ordering App in Fast-Food First CMO Strategy". AdAge. Retrieved 10 December 2017.
  23. ^ O'Shea, Dan (4 January 2017). "LG introduces smart refrigerator with Amazon Alexa-enabled grocery ordering". Retail Dive. Retrieved 10 December 2017.
  24. ^ Gibbs, Samuel (7 February 2017). "Amazon's Alexa escapes the Echo and gets into cars Technology". The Guardian. Retrieved 10 December 2017.
  25. ^ "What is Google Assistant, how does it work, and which devices offer it?". Pocket-lint. 6 October 2017. Retrieved 10 December 2017.
  26. ^ "'Ask Jenn', Alaska Airlines website". Alaska Airlines. 2 January 2017. Retrieved 10 December 2017.
  27. ^ AT&T Tech Channel (26 June 2013). "American Airlines (US Airways) – First US Airline to Deploy Natural Language Speech" (video), Nuance Enterprise on YouTube. Archived from the original on 21 December 2021. Retrieved 10 December 2017 – via YouTube. YouTube title: Airline Information System, 1989 – AT&T Archives – speech recognition
  28. ^ Martin, Taylor; Priest, David (10 September 2017). "The complete list of Alexa commands so far". CNET. Retrieved 10 December 2017.
  29. ^ Kongthon, Alisa; Sangkeettrakarn, Chatchawal; Kongyoung, Sarawoot; Haruechaiyasak, Choochart (1 January 2009). "Implementing an online help desk system based on conversational agent". Proceedings of the International Conference on Management of Emergent Digital EcoSystems. MEDES '09. New York, NY, USA: ACM. pp. 69:450–69:451. doi:10.1145/1643823.1643908. ISBN 9781605588292. S2CID 1046438.
  30. ^ O'Donnell, Anthony (3 June 2010). "Aetna's new "virtual online assistant"". Insurance & Technology. Archived from the original on 7 June 2010.
  31. ^ "How to prepare your products and brand for conversational commerce". 6 March 2018.
  32. ^ Taylor, Glenn (5 March 2018). "Retail's Big Opportunity: 87% Of U.S. Consumers Grasp The Power Of Conversational Commerce – Retail TouchPoints".
  33. ^ Zhang, Guoming; Yan, Chen; Ji, Xiaoyu; Zhang, Tianchen; Zhang, Taimin; Xu, Wenyuan (2017). "DolphinAttack". Proceedings of the 2017 ACM SIGSAC Conference on Computer and Communications Security - CCS '17. pp. 103–117. arXiv:1708.09537. doi:10.1145/3133956.3134052. ISBN 9781450349468. S2CID 2419970.
  34. ^ Lei, Xinyu; Tu, Guan-Hua; Liu, Alex X.; Li, Chi-Yu; Xie, Tian (2017). "The Insecurity of Home Digital Voice Assistants – Amazon Alexa as a Case Study". arXiv:1712.03327 [cs.CR].
  35. ^ "Doing more to protect your privacy with the Assistant". Google. 23 September 2019. Retrieved 27 February 2020.
  36. ^ "Alexa, Echo Devices, and Your Privacy". Amazon.com. Retrieved 27 February 2020.
  37. ^ "Improving Siri's privacy protections". Apple Newsroom. Retrieved 27 February 2020.
  38. ^ Minker, W.; Néel, F. (2002). "Développement des technologies vocales". Le Travail Humain. 65 (3): 261. doi:10.3917/th.653.0261. ISSN 0041-1868.
  39. ^ Wajcman, Judy (2019). "The Digital Architecture of time Management" (PDF). Science, Technology, & Human Values. 44 (2): 315–337. doi:10.1177/0162243918795041. S2CID 149648777.
  40. ^ Yang, Heetae; Lee, Hwansoo (26 June 2018). "Understanding user behavior of virtual personal assistant devices". Information Systems and E-Business Management. 17 (1): 65–87. doi:10.1007/s10257-018-0375-1. ISSN 1617-9846. S2CID 56838915.
  41. ^ Tisseron, Serge (2019). "La famille sous écoute". L'École des Parents. n° 632 (3): 16. doi:10.3917/epar.632.0016. ISSN 0424-2238. S2CID 199344092.
  42. ^ a b Casilli, Antonio A. (2019). En attendant les robots. Enquête sur le travail du clic. Editions Seuil. ISBN 978-2-02-140188-2. OCLC 1083583353.
  43. ^ Horton, John Joseph; Chilton, Lydia B. (2010). "The labor economics of paid crowdsourcing". Proceedings of the 11th ACM conference on Electronic commerce. EC '10. New York, New York, USA: ACM Press. pp. 209–218. arXiv:1001.0627. doi:10.1145/1807342.1807376. ISBN 978-1-60558-822-3. S2CID 18237602.
  44. ^ "Apple, Google, and Amazon May Have Violated Your Privacy by Reviewing Digital Assistant Commands". Fortune. 5 August 2019. Retrieved 13 May 2020.
  45. ^ Kröger, Jacob Leon; Lutz, Otto Hans-Martin; Raschke, Philip (2020). "Privacy Implications of Voice and Speech Analysis – Information Disclosure by Inference". Privacy and Identity Management. Data for Better Living: AI and Privacy. IFIP Advances in Information and Communication Technology. Vol. 576. pp. 242–258. doi:10.1007/978-3-030-42504-3_16. ISBN 978-3-030-42503-6. ISSN 1868-4238.
  46. ^ "Amazon Lex, the technology behind Alexa, opens up to developers". TechCrunch. 20 April 2017. Retrieved 10 December 2017.
  47. ^ "Actions on Google Google Developers". Retrieved 10 December 2017.
  48. ^ "Watson – Stories of how AI and Watson are transforming business and our world". Ibm.com. Retrieved 10 December 2017.
  49. ^ Memeti, Suejb; Pllana, Sabri (January 2018). "PAPA: A parallel programming assistant powered by IBM Watson cognitive computing technology". Journal of Computational Science. 26: 275–284. doi:10.1016/j.jocs.2018.01.001.
  50. ^ "5 Consumer Trends for 2017". TrendWatching. 31 October 2016. Retrieved 10 December 2017.
  51. ^ Richter, Felix (26 August 2016). "Chart: Digital Assistants – Always at Your Service". Statista. Retrieved 10 December 2017.
  52. ^ a b c "Virtual Assistant Industry Statistics". Global Market Insights. 30 January 2017. Retrieved 10 December 2017.
  53. ^ a b "Virtual digital assistants to overtake world population by 2021". ovum.informa.com. Retrieved 11 May 2018.
  54. ^ Jones, Nory B.; Graham, C. Matt (February 2018). "Can the IoT Help Small Businesses?". Bulletin of Science, Technology & Society. 38 (1–2): 3–12. doi:10.1177/0270467620902365. ISSN 0270-4676. S2CID 214031256.
  55. ^ a b c "Alexa and Siri Can Hear This Hidden Command. You Can't". The New York Times. 10 May 2018. ISSN 0362-4331. Retrieved 11 May 2018.
  56. ^ "As voice assistants go mainstream, researchers warn of vulnerabilities". CNET. 10 May 2018. Retrieved 11 May 2018.
  57. ^ Chung, H.; Iorga, M.; Voas, J.; Lee, S. (2017). "Alexa, Can I Trust You?". Computer. 50 (9): 100–104. doi:10.1109/MC.2017.3571053. ISSN 0018-9162. PMC 5714311. PMID 29213147.
  58. ^ "Baidu unveils 3 smart speakers with its Duer digital assistant". 8 January 2018.
  59. ^ MSV, Janakiram (20 August 2015). "Meet Mycroft, The Open Source Alternative To Amazon Echo". Forbes. Retrieved 27 October 2016.