글로브

GloVe

Global Vectors에서 만들어진 GloVe는 분산 단어 표현 모델입니다.이 모델은 단어에 대한 벡터 표현을 얻기 위한 비감독 학습 알고리즘이다.이것은 단어 사이의 거리가 의미적 [1]유사성과 관련이 있는 의미 있는 공간에 단어를 매핑함으로써 달성된다.코퍼스에서 집계된 글로벌 워드-워드 공존 통계량에 대한 훈련이 수행되며, 결과 표현은 워드 벡터 공간의 흥미로운 선형 하위 구조를 보여준다.스탠포드에서 오픈소스[2] 프로젝트로 개발되어 2014년에 시작되었습니다.단어 표현의 비감독 학습을 위한 로그 이중 선형 회귀 모델로서, 글로벌 매트릭스 인수분해와 로컬 컨텍스트 창 [3]방법이라는 두 모델 패밀리의 특징을 결합한다.

적용들

GloVe는 동의어, 회사-제품 관계, 우편 번호 및 도시 등의 단어 간의 관계를 찾는 데 사용할 수 있습니다.그러나 비지도 학습 알고리즘은 동음이의어, 즉 철자가 같고 의미가 다른 단어를 식별하는 데 효과적이지 않다.이것은 비지도 학습 알고리즘이 동일한 형태학적 [4]구조를 가진 단어에 대한 단일 벡터 세트를 계산하는 것과 같다.또한 이 알고리즘은 SpaCy 라이브러리에서 의미적 단어 삽입 기능을 구축하는 동시에 코사인 유사성유클리드 거리 접근과 [5]같은 거리 측정과 일치하는 상위 목록 단어를 계산하기 위해 사용됩니다.GloVe는 또한 환자 [1]면담에서 심리적 고통을 감지하도록 설계된 온라인 및 오프라인 시스템의 단어 표현 프레임워크로 사용되었다.

「 」를 참조해 주세요.

레퍼런스

  1. ^ a b Abad, Alberto; Ortega, Alfonso; Teixeira, António; Mateo, Carmen; Hinarejos, Carlos; Perdigão, Fernando; Batista, Fernando; Mamede, Nuno (2016). Advances in Speech and Language Technologies for Iberian Languages: Third International Conference, IberSPEECH 2016, Lisbon, Portugal, November 23-25, 2016, Proceedings. Cham: Springer. p. 165. ISBN 9783319491691.
  2. ^ GloVe: Global Vectors for Word Representation (pdf) "글로브라고 불리는 단어 표현을 위한 새로운 모델을 구축하기 위해 통찰력을 사용합니다.글로벌 벡터는 글로벌 말뭉치 통계를 모델에 의해 직접 캡처하기 때문입니다."
  3. ^ Kalajdziski, Slobodan (2018). ICT Innovations 2018. Engineering and Life Sciences. Cham: Springer. p. 220. ISBN 9783030008246.
  4. ^ Wenig, Phillip (2019). "Creation of Sentence Embeddings Based on Topical Word Representations: An approach towards universal language understanding". Towards Data Science.
  5. ^ Singh, Mayank; Gupta, P. K.; Tyagi, Vipin; Flusser, Jan; Ören, Tuncer I. (2018). Advances in Computing and Data Sciences: Second International Conference, ICACDS 2018, Dehradun, India, April 20-21, 2018, Revised Selected Papers. Singapore: Springer. p. 171. ISBN 9789811318122.

외부 링크