상식적인 추론

Commonsense reasoning

인공지능에서 상식적인 추론은 인간이 매일 접하는 일상적인 상황의 유형과 본질에 대해 추측하는 인간과 같은 능력이다.이러한 가정에는 물리적 물체의 본질, 분류학적 특성 및 사람들의 의도에 대한 판단이 포함됩니다.상식적인 추론을 보여주는 장치는 인간의 민속심리학(사람들의 행동과 의도에 대해 추론하는 인간의 타고난 능력)과 순진한 물리학(사람들의 물리적 [1]세계에 대한 인간의 자연스러운 이해)과 유사한 결론을 도출할 수 있을 것이다.

정의 및 특성화

다양한 저자의 상식에 대한 정의와 특성화에는 다음이 포함된다.

  • 상식적인 지식에는 사건(행동 포함)과 그 영향에 대한 기본적인 사실, 지식과 지식에 대한 사실, 그리고 지식에 대한 사실, 신념과 욕망에 대한 사실이 포함됩니다.또한 물질적 물체와 그 [2]속성에 대한 기본적인 사실도 포함되어 있습니다.
  • 일반지식은 특정 [3]실체의 세부사항보다는 일반지식을 다룬다는 점에서 백과사전과 다르다.
  • 상식적인 지식은 "추가 지식이 자동으로 수집되고 해석될 수 있는 근거를 제공할 수 있는 실제 세계 지식"[4]입니다.
  • 상식의 세계는 "시간, 공간, 물리적 상호작용, 사람 등"[1]으로 구성되어 있다.
  • 상식은 "우리가 당연하게 여기지만 거의 말하지 않는 세상에 대한 모든 지식"[5]이다.
  • 상식은 '특정 주제에 특유하지 않은 널리 재사용할 수 있는 배경지식'네가 가져야 [6]할 지식"이라고 말했다.

뉴욕대 어니스트 데이비스 교수는 상식적인 지식을 물리적 물체, 물질, 식물, 동물, 인간사회를 포함한 "일반적인 7세들이 세상에 대해 알고 있는 것"으로 특징짓는다.보통 책 학습, 전문 지식 및 표기법에 대한 지식은 제외되지만, 이러한 주제에 대한 지식이 포함될 수도 있습니다.예를 들어, 카드놀이를 하는 방법을 아는 것은 "상식 지식"이 아니라 전문 지식입니다. 그러나 사람들이 재미로 카드놀이를 한다는 것을 아는 것은 "상식 지식"[7]으로 간주됩니다.

상식적인 추론 문제

자율 주행 자동차 시스템은 뉴럴 네트워크를 사용하여 그림의 어떤 부분이 보행자의 이전 훈련 이미지와 일치하는지 판단하고, 그 영역을 천천히 움직이지만 다소 예측할 수 없는 직사각형 프리즘으로 모델링할 수 있으며, 이는 피해야 합니다.

인간과 비교했을 때, 기존의 AI는 인간의 상식적인 추론의 몇 가지 특징이 부족하다; 가장 주목할 만한 것은, 인간은 공간, 시간, 그리고 물리적 상호작용과 같은 "순진한 물리학"에 대한 추론을 위한 강력한 메커니즘을 가지고 있다.이것은 어린 아이들도 "이 펜을 테이블에서 굴리면 바닥에 떨어질 것"과 같은 추론을 쉽게 할 수 있게 해준다.사람은 또한"민족 심리학"의"때문에 폭력을 옹호했던 그 도시 councilmen 있었지만 그 시위자들은 허가를 거부했다".(제네릭 AI어려움이 사람들 폭력을 옹호할 것으로 의심을 받고 있는 councilmen거나 시위자들은 분별력을 가지고 있다.) 같은natural-language 문장을 해석하기 위해 도와 주는 강력한 메커니즘을 가지고 있다.[1][8][9]이러한 "상식"의 부족은 AI가 종종 이해할 수 없는 방식으로 인간이 저지르는 것과 다른 실수를 한다는 것을 의미한다.예를 들어, 기존의 자가운전 자동차는 사람이 하는 것과 똑같은 방식으로 보행자의 위치나 의도를 추론할 수 없고,[10][11][12] 대신 사고를 피하기 위해 비인간적인 추론 방식을 사용해야 한다.

상식 추론의 중복되는 하위 주제에는 양과 측정, 시간과 공간, 물리, 마음, 사회, 계획과 목표, 그리고 행동과 [13]변화가 포함된다.

상식적인 지식 문제

상식적인 지식 문제는 인공지능 영역에서 현재 진행 중인 프로젝트로, 대부분의 개인이 가질 것으로 예상되는 일반 지식을 포함하는 데이터베이스를 만드는 것으로, 자연 언어를 사용하는 인공지능 프로그램에[14] 쉽게 접근할 수 있는 방식으로 표현된다.상식적인 지식의 범위가 넓기 때문에, 이 문제는 AI [15]연구에서 가장 어려운 문제 중 하나로 여겨지고 있습니다.인간의 마음과 같은 일을 하기 위해서는 기계가 인간만큼 지능적으로 보여야 한다.이러한 작업에는 객체 인식, 기계 번역 및 텍스트 마이닝이 포함됩니다.이를 수행하려면 상식적인 지식을 가진 개인이 인식하는 개념과 동일한 개념을 인식해야 합니다.

인텔리전트 태스크에 대한 상식

1961년, Bar Hillel은 기계 [16]번역의 맥락에서 자연어 처리를 위한 실용적인 지식의 필요성과 중요성을 처음으로 논의했습니다.일부 모호성은 단순하고 쉽게 얻을 수 있는 규칙을 사용하여 해결됩니다.다른 사람들은 주변 세계에 대한 폭넓은 인식을 요구하기 때문에, 그들은 더 상식적인 지식을 필요로 한다.예를 들어, 텍스트를 번역하기 위해 기계를 사용할 때, 모호성의 문제가 발생하는데, 이는 문맥에 대한 구체적이고 진정한 이해를 얻음으로써 쉽게 해결될 수 있다.온라인 번역자들은 종종 유사하거나 유사한 단어를 사용하여 애매한 부분을 해결합니다.예를 들어, "The Electrician is working" 및 "The telephone is working"이라는 문장을 독일어로 번역할 때, 기계는 첫 번째 문장에서는 "working"을 "working"으로, 두 번째 문장에서는 "functioning"으로 번역합니다.이 기계는 "노동"과 "전기사"를 뜻하는 독일어 단어들이 종종 조합되어 사용되며 서로 가까이에서 발견된다는 것을 텍스트 본문에서 보고 읽어왔습니다."전화" 및 "제대로 기능"에 대해서도 마찬가지입니다.그러나 단순한 경우에서 작동하는 통계 프록시는 복잡한 경우에서 실패하는 경우가 많습니다.기존의 컴퓨터 프로그램은 짧은 구절이나 다른 단어를 조작하여 간단한 언어 작업을 수행하지만, 더 깊은 이해를 시도하지 않고 단기적인 결과에 초점을 맞춘다.

컴퓨터 비전

이러한 문제는 컴퓨터 [1][17]비전에서 발생합니다.예를 들어, 욕실 사진을 보면, 방의 용도를 짐작케 하는 주변 물체(화장실, 세면대, 욕조)로 인해 페이스클로스나 병처럼 작고 일부만 보이는 물건들이 눈에 띈다.고립된 이미지에서는 식별이 어렵습니다.영화는 훨씬 더 어려운 작업임이 증명된다.일부 영화에는 단순히 외운 템플릿을 이미지에 맞추는 것만으로는 이해할 수 없는 장면과 순간들이 포함되어 있습니다.예를 들어, 영화의 맥락을 이해하기 위해, 관객은 등장인물의 의도에 대해 추론을 하고 그들의 행동에 따라 추측을 해야 한다.현대 기술 상태에서는, 캐릭터의 행동을 예측하는 등의 작업을 수행하는 프로그램을 구축하고 관리하는 것은 불가능하다.할 수 있는 일은 기본 동작을 식별하고 캐릭터를 추적하는 것입니다.

로봇 조작

현실에서 통제되지 않는 환경에서 작동하는 자율 로봇에서 상식적인 추론의 필요성과 중요성은 명백하다.예를 들어, 만약 로봇이 칵테일 파티에서 웨이터의 업무를 수행하도록 프로그램 되어 있고, 그가 주운 유리가 깨진 것을 본다면, 웨이터 로봇은 그 액체를 컵에 붓지 말고 다른 것을 주워야 한다.개인이 단순한 상식적인 추론을 가지고 있을 때 그러한 작업은 명백해 보이지만 로봇이 그러한 실수를 피할 수 있도록 하는 것은 어렵다.[1]

자동화된 상식 추론의 성공

자동 상식 추론 분야에서 상당한 발전이 분류학적 추론, 행동 및 변화 추론, 시간에 대한 추론 영역에서 이루어진다.이 구들 각각은 광범위한 상식적인 [18]추론에 대해 잘 알려진 이론을 가지고 있다.

분류학적 추론

분류법은 개인과 범주, 그리고 그 관계의 집합이다.세 가지 기본적인 관계는 다음과 같습니다.

  • 개인은 범주의 인스턴스입니다.예를 들어 개별 Tweety카테고리 로빈의 인스턴스입니다.
  • 하나의 카테고리는 다른 카테고리의 서브셋입니다.를 들어 로빈은 버드의 서브셋입니다.
  • 두 개의 카테고리가 분리되어 있습니다.를 들어 로빈은 펭귄과 떨어져 있다.

이동성은 분류학에서 추론의 한 종류이다.Tweety로빈인스턴스이고 Robin은 버드의 서브셋이기 때문에 Tweety는 버드의 인스턴스입니다.상속은 또 다른 종류의 추론이다.Tweety는 새의 서브셋인 로빈의 인스턴스이며 새에는 속성 canfly가 표시되므로 Tweetyrobin에는 속성 canfly가 있습니다.개인이 더 추상적인 카테고리를 분류할 때, 특정 카테고리의 개요와 구분은 더 문제가 된다.AI 프로그램에서는 간단한 분류 구조가 자주 사용된다.예를 들어 WordNet은 분류법을 포함하는 리소스이며, 그 요소는 영어 단어의 의미입니다.웹 문서에서 상식적인 지식을 수집하는 데 사용되는 웹 마이닝 시스템은 분류 관계, 특히 분류 관계 [1]수집에 초점을 맞추고 있습니다.

액션과 변경

행동, 사건, 그리고 변화의 이론은 상식적인 [19]추론의 또 다른 범위이다.도메인에는 다음과 같은 제약조건을 충족하는 확립된 추론 방법이 있습니다.

  • 이벤트는 원자적인 것으로, 한 번에 하나의 이벤트가 발생하며, 이유론자는 특정 이벤트의 시작과 피날레에 세계의 상태와 상태를 고려할 필요가 있지만, 상태 중에는 고려하지 않아야 합니다. 단, 현재 진행 중인 변화(진행)의 증거가 있습니다.
  • 모든 변화는 어떤 사건의 결과이다.
  • 사건은 결정론적이다. 즉, 사건의 끝부분의 세계 상태는 시작 부분의 세계 상태와 사건의 사양에 의해 정의된다.
  • 배우 한 명이 있고 모든 사건은 그의 행동이다.
  • 시작 시 세계의 관련 상태는 이미 알려져 있거나 계산될 수 있습니다.

시간적 추리

시간적 추론은 시간, 기간, 시간 간격에 대한 인간의 지식에 대해 추측하는 능력이다.예를 들어, 만약 개인이 모차르트가 하이든 이후에 태어났고 그보다 일찍 죽었다는 것을 안다면, 그들은 모차르트가 하이든보다 일찍 죽었다고 추론하기 위해 그들의 시간적 추론 지식을 사용할 수 있다.관련된 추론은 선형 [20]불평등 시스템을 해결하는 것으로 귀결된다.자연어 표현에는 문맥에 의존한 [21]해석이 있기 때문에 그러한 추론을 자연어 해석과 같은 구체적인 목적에 통합하는 것은 더 어렵다.프로시저에 타임스탬프를 할당하는 등의 간단한 작업은 완전히 정확하게 수행할 수 없습니다.

질적 추론

질적[22] 추론은 일정한 성공을 거두고 분석되는 상식적인 추론의 한 형태이다.그것은 상호 관련 수량의 변화 방향과 관련이 있다.예를 들어 주가가 오르면 매각되는 주식의 양은 줄어든다.일부 생태계에 늑대와 양이 서식하고 늑대의 수가 줄어들면 양들의 폐사율도 낮아진다.이 이론은 롤러코스터 위에서 움직이는 물체를 분석한 요한 드 클리어에 의해 처음 공식화 되었다.질적 추리 이론은 물리학, 생물학, 공학, 생태학 등과 같은 많은 분야에 적용된다.이것은 많은 실용적인 프로그램, 아날로그 매핑, 텍스트 이해의 기초가 됩니다.

상식적인 추론을 자동화하기 위한 과제

2014년 현재, 상식적인 추론을 중요하게 이용하려는 일부 상업 시스템이 있습니다.그러나 추론이 결여된 상식의 대용품으로 통계정보를 사용한다.현재 프로그램은 개별 단어를 조작하지만 더 이상의 이해를 시도하거나 제공하지는 않습니다.어니스트 데이비스와 게리 마커스에 따르면, 다섯 가지 주요 장애물이 만족할 만한 "공통적인 추론자"[1]의 생산을 방해한다고 합니다.

  • 첫째, 상식적인 추론에 관련된 영역 중 일부는 일부만 이해된다.개인은 커뮤니케이션과 지식, 대인관계 또는 물리적 과정으로 영역을 포괄적으로 이해하는 것과는 거리가 멀다.
  • 둘째, 쉽게 예측되거나 추정될 것 같은 상황은 인간의 상식적인 지식으로는 커버할 수 없는 논리적 복잡성을 가질 수 있다.유사한 상황의 몇 가지 측면이 연구되고 잘 이해되고 있지만, 원칙적으로도 알려지지 않은 많은 관계가 있으며, 컴퓨터가 사용할 수 있는 형태로 어떻게 표현될 수 있는지도 알 수 없다.
  • 셋째, 상식적인 추론은 그럴듯한 추론을 포함한다.이미 알려진 것을 고려할 때 합리적인 결론을 내려야 한다.그럴듯한 추론은 수년 동안 연구되어 왔고 확률론적 추론과 비단조적 논리를 포함하는 많은 이론들이 개발되었습니다.신뢰할 수 없는 데이터와 규칙을 사용하는 등 다양한 형태를 취합니다.이러한 데이터나 규칙은 때때로 명확하지 않습니다.
  • 넷째, 적은 수의 예가 매우 빈번한 반면, 매우 드문 예는 매우 많은 도메인이 있다.
  • 다섯째, 추정을 할 때 추상화 수준을 식별하고 결정하는 것은 어렵다.

2018년 현재 기존 컴퓨터 프로그램은 Winograd Schema [23]Challenge와 같은 현대의 "상식 추론" 벤치마크 테스트에서 매우 낮은 성능을 보이고 있습니다."상식 지식" 작업에서 인간 수준의 역량을 달성하는 문제는 아마도 다음과 같이 간주됩니다.AI가 완성되었다." (즉, 이를 해결하려면 인간 [24][25]수준의 지능을 합성할 수 있는 능력이 필요하다.)일부 연구자들은 지도 학습 데이터가 상식적인 추론을 할 수 있는 인공 일반 지능을 생성하기에 불충분하다고 믿고, 따라서 지도 학습 [26]기법으로 눈을 돌렸다.

어프로치 및 테크닉

Commonsense의 추론 연구는 지식 기반 접근법과 이 두 가지 접근법[citation needed] 사이의 상호작용이 제한된 대규모 데이터 말뭉치를 통한 기계 학습에 기초한 접근법으로 나뉜다.또한 집단적 지식과 비전문가들의 입력을 연계하여 지식 기반을 구축하려는 크라우드 소싱 접근법도 있다.지식 기반 접근법은 수학적[citation needed] 논리에 기초한 접근법으로 분리할 수 있다.

지식기반접근법에서전문가들은특정영역이나특정업무에대한추론을하는데필요한추론의특성을분석하고있습니다.지식 기반 접근법은 수학적으로 기초되는 접근법, 비공식적인 지식 기반 접근법 및 대규모 접근법으로 구성됩니다.수학적으로 기초가 되는 접근법은 순전히 이론적인 것이며, 그 결과는 프로그램이 아닌 인쇄된 종이입니다.작업은 반영되는 도메인의 범위와 추론 기법으로 제한됩니다.비공식적인 지식 기반 접근법에서, 추리 이론은 경험적 행동 심리학의 결과인 일화 데이터와 직관에 기초한다.컴퓨터 프로그래밍에서는 비공식적인 접근법이 일반적입니다.웹 문서에서 상식적인 지식을 추출하기 위한 두 가지 다른 인기 있는 기술은 웹 마이닝과 크라우드 소싱입니다.

COMET(2019), 오픈을 모두 사용합니다.AI GPT 언어 모델 아키텍처와 ConceptNet과 같은 기존 상식 지식 기반은 인간 벤치마크에 근접하는 수준에서 상식적인 추론을 생성한다고 주장한다.다른 많은 노력과 마찬가지로, COMET은 표면 언어 패턴에 대한 과도한 관련성을 가지고 있으며, 많은 상식적인 개념에 대한 깊은 인간 수준의 이해가 부족한 것으로 판단된다.다른 언어 모델 접근법에는 단순한 텍스트가 아닌 시각적 장면에 대한 훈련과 상식 [6][27]물리학과 관련된 시나리오에 대한 텍스트 설명 훈련이 포함된다.

레퍼런스

  1. ^ a b c d e f g Ernest Davis; Gary Marcus (2015). "Commonsense Reasoning and Commonsense Knowledge in Artificial Intelligence". Communications of the ACM. Vol. 58, no. 9. pp. 92–103. doi:10.1145/2701413.
  2. ^ 매카시, 존"인공지능, 논리, 그리고 상식의 공식화"철학적 논리와 인공지능.스프링거, 도드레흐트, 1989년 161~190년
  3. ^ Tandon, Niket; Varde, Aparna S.; de Melo, Gerard (22 February 2018). "Commonsense Knowledge in Machine Intelligence". ACM SIGMOD Record. 46 (4): 49–52. doi:10.1145/3186549.3186562.
  4. ^ 마투제크, 신시아 등"상식 검색: 웹에서 cyc를 채웁니다."UMBC 컴퓨터 과학 및 전기 공학 부문 컬렉션(2005).
  5. ^ "How to Teach Artificial Intelligence Some Common Sense". Wired. 13 November 2018. Retrieved 11 February 2021.
  6. ^ a b Pavlus, John (30 April 2020). "Common Sense Comes to Computers". Quanta Magazine. Retrieved 3 May 2020.
  7. ^ Davis, Ernest (25 August 2017). "Logical Formalizations of Commonsense Reasoning: A Survey". Journal of Artificial Intelligence Research. 59: 651–723. doi:10.1613/jair.5339.
  8. ^ "Cultivating Common Sense DiscoverMagazine.com". Discover Magazine. 2017. Archived from the original on 25 March 2018. Retrieved 24 March 2018.
  9. ^ Winograd, Terry (January 1972). "Understanding natural language". Cognitive Psychology. 3 (1): 1–191. doi:10.1016/0010-0285(72)90002-3.
  10. ^ "Don't worry: Autonomous cars aren't coming tomorrow (or next year)". Autoweek. 2016. Archived from the original on 25 March 2018. Retrieved 24 March 2018.
  11. ^ Knight, Will (2017). "Boston may be famous for bad drivers, but it's the testing ground for a smarter self-driving car". MIT Technology Review. Archived from the original on 22 August 2020. Retrieved 27 March 2018.
  12. ^ Prakken, Henry (31 August 2017). "On the problem of making autonomous vehicles conform to traffic law". Artificial Intelligence and Law. 25 (3): 341–363. doi:10.1007/s10506-017-9210-0.
  13. ^ Thomason, Richmond, "논리 및 인공지능", 스탠포드 철학 백과사전(2020년 여름판), Edward N. Zalta(ed.), URL = https://plato.stanford.edu/archives/sum2020/entries/logic-ai/.
  14. ^ "Artificial intelligence Programs".
  15. ^ "Artificial intelligence applications".
  16. ^ "Bar Hillel Artificial Intelligence Research Machine Translation".
  17. ^ 안톨, 스타니슬로 등"VQA: 시각적인 질문 답변"2015년 IEEE 컴퓨터 비전에 관한 국제회의의 진행.
  18. ^ "Taxonomy".
  19. ^ "Action and change in Commonsense reasoning".
  20. ^ "Temporal reasoning".
  21. ^ 류, 휴고, 푸쉬 싱."2017-08-09년 Wayback Machine에 보관된 자연어 자연어에 대한 일반적인 추론"지식 기반 인텔리전트 정보 및 엔지니어링 시스템에 관한 국제 회의.스프링거, 베를린, 하이델베르크, 2004년
  22. ^ "Qualitative reasoning".
  23. ^ "The Winograd Schema Challenge". cs.nyu.edu. Retrieved 9 January 2018.
  24. ^ Yampolskiy, Roman V. "AI-Complete, AI-Hard, 또는 AI-Easy-Classification of Problems in AI." MAICS, 2012.
  25. ^ Andrich, C, Novosel, L 및 Hrnkas, B.(2009).상식적인 지식Information Search and Retrieval, 2009.
  26. ^ Smith, Craig S. (8 April 2020). "Computers Already Learn From Us. But Can They Teach Themselves?". The New York Times. Retrieved 3 May 2020.
  27. ^ 보셀루트, 앙투안 등"Comet: 자동 지식 그래프 구축을 위한 상식 변압기." arXiv 프리프린트 arXiv:1906.05317(2019).

외부 링크