어휘 밀도

Lexical density

어휘밀도는 어떤 언어에서 인간의 의사소통의 구조와 복잡성을 측정하는 계산 언어학의 개념이다.[1]어휘 밀도는 기능 단어(문법 단위)와 내용 단어(단어 단위, 어휘소)에서 서면 또는 구어 구성의 언어 복잡성을 추정한다.어휘 밀도를 계산하는 한 가지 방법은 총 단어 수에 대한 어휘 항목의 비율을 계산하는 것이다.또 다른 방법은 문장 내 총 절 수와 같이 구성에서 상위 구조 항목의 수에 대한 어휘 항목의 비율을 계산하는 것이다.[2][3]

개인의 어휘적 밀도는 나이, 교육, 의사소통 방식, 환경, 특이한 부상이나 의료 상태,[4] 그리고 창의성에 따라 진화한다.인간의 언어와 모국어의 고유한 구조는 개인의 글쓰기와 말하기 스타일의 어휘적 밀도에 영향을 미칠 수 있다.더욱이, 서면 형태의 인간 통신은 일반적으로 유아기 이후의 구어체보다 어휘적으로 밀도가 높다.[5][6]어휘적 밀도는 구성의 가독성과 청자나 독자가 의사소통을 이해할 수 있는 용이성에 영향을 미친다.[7][8]어휘적 밀도는 문장과 메시지의 기억력과 유지에도 영향을 미칠 수 있다.[9]

토론

어휘밀도는 주어진 담화에서 내용단어(lexic 항목)의 비율이다.총 단어 수에 대한 어휘 항목의 비율 또는 문장 내 상위 구조 항목의 수에 대한 어휘 항목의 비율(예:[2][3] 절)으로 측정할 수 있다.어휘 항목은 전형적으로 실제 내용이며 명사, 동사, 형용사, 부사를 포함한다.문법적 항목은 일반적으로 내용을 짜는 기능적 접착제와 실이며 대명사, 접속사, 전치사, 결정자 및 유한 동사와 부사의 특정 클래스를 포함한다.[5]

어휘밀도는 서술적 매개변수로 담화분석에 사용되는 방법 중 하나로 레지스터와 장르에 따라 달라진다.어떤 구성이나 말뭉치의 어휘 밀도를 계산하기 위해 제안된 많은 방법들이 있다.어휘 밀도는 다음과 같이 결정할 수 있다.

위치:
스타일 = 분석된 텍스트의 어휘 밀도
e = 분석된 텍스트의 어휘 또는 문법 토큰 수(noun, 형용사, 동사, 부사)
= 분석된 텍스트의 모든 토큰 수(총 단어 수)

요소 어휘 밀도

우레는 1971년 문장의 어휘 밀도를 계산하기 위해 다음과 같은 공식을 제안했다.

Ld =어휘 항목/단어의 총 수 * 100

Biber는 이 비율을 "유형토큰 비율"[10]이라고 부른다.

홀리데이 어휘 밀도

1985년 할리데이는 우레 공식의 분모를 수정하고, 문장의 어휘 밀도를 계산하기 위해 다음을 제안했다.[1]

Ld = 어휘 항목 수/개수 * 100

일부 공식에서 홀리데이가 제안한 어휘 밀도는 "100" 승수가 없는 단순한 비율로 계산된다.[2][1]

특성.

어휘 밀도 측정은 "독소 항목"을 어떻게 정의하고 어떤 항목을 어휘 항목 또는 문법 항목으로 분류하느냐에 따라 동일한 구성에 따라 달라질 수 있다.다양한 구성에 일관성 있게 적용할 때 채택된 방법론은 그러한 구성의 어휘적 밀도를 제공한다.일반적으로, 문장 구성의 어휘 밀도는 구어 구성보다 높다.[2][3]우레에 따르면, 영어에서 인간 의사소통의 서면 형태는 전형적으로 어휘 밀도가 40%를 넘는 반면, 구어 형태는 어휘 밀도가 40%[2] 미만인 경향이 있다.마이클 스터브스가 역사 문헌을 조사한 결과, 소설 문학의 전형적인 어휘 밀도는 40%에서 54% 사이, 논픽션은 40%에서 65%[3][11][12] 사이였다.

특정 의사소통의 참가자 사이의 관계와 친밀도는 어휘 밀도에 영향을 미치며, 동일한 화자 또는 작가에 대한 의사소통의 시작 이전의 상황처럼 우레라고 말한다.그녀가 제안한 서면 형태의 의사소통의 어휘 밀도는 주로 서면 형태의 인간 의사소통이 더 큰 준비, 반영 및 수정을 수반하기 때문이다.[2]피드백을 포함하거나 예상하는 인간의 토론과 대화는 더 날카롭고 어휘 밀도가 낮은 경향이 있다.반대로 State Stubbs와 Biber, 지침서, 법 집행 명령서, 할당된 시간 내에 스크린 프롬프트에서 읽은 뉴스, 그리고 저자들이 재독을 위해 독자들이 이용할 수 있을 것으로 예상하는 문헌은 어휘 밀도를 극대화하는 경향이 있다.[2][13][14]요한슨과 스트룀크비스트는 유럽 국가 및 연령대에 걸친 구어 및 서면 자료의 어휘적 밀도를 조사하면서 인구 집단의 어휘적 밀도가 유사하고 모국어의 형태학적 구조에 따라 다르며 한 국가 내에서 연령 집단이 표본으로 추출했다고 보고했다.어휘적 밀도는 성인의 경우 가장 높았고 어휘적 다양성으로 추정된 차이점들은 같은 연령대(13세, 17세)의 청소년들의 경우 더 높았다.[15][16]

참고 항목

참조

  1. ^ a b c Michael Halliday (1985). Spoken and Written Language. Deakin University. pp. 61–64. ISBN 978-0-7300-0309-0.
  2. ^ a b c d e f g Erik Castello (2008). Text Complexity and Reading Comprehension Tests. Peter Lang. pp. 49–51. ISBN 978-3-03911-717-8.
  3. ^ a b c d Belinda Crawford Camiciottoli (2007). The Language of Business Studies Lectures: A Corpus-assisted Analysis. John Benjamins Publishing. p. 73. ISBN 978-90-272-5400-9.
  4. ^ Paul Yoder (2006). "Predicting Lexical Density Growth Rate in Young Children With Autism Spectrum Disorders". American Journal of Speech-Language Pathology. 15 (4): 362–373.
  5. ^ a b Michael Halliday (1985). Spoken and Written Language. Deakin University. pp. 61–75 (Chapter 5), 76-91 (Chapter 6). ISBN 978-0-7300-0309-0.
  6. ^ Victoria Johansson (2009). Developmental aspects of text production in writing and speech. Department of Linguistics and Phonetics, Centre for Languages and Literature, Lund University. pp. 1–16. ISBN 978-91-974116-7-7.
  7. ^ V To; S Fan; DP Thomas (2013). "Lexical density and Readability: A case study of English Textbooks". The International Journal of Language, Society and Culture. 37 (7): 61–71.
  8. ^ O'Loughlin, Kieran (1995). "Lexical density in candidate output on direct and semi-direct versions of an oral proficiency test". Language Testing. SAGE Publications. 12 (2): 217–237. doi:10.1177/026553229501200205. S2CID 145638000.
  9. ^ Perfetti, Charles A. (1969). "Lexical density and phrase structure depth as variables in sentence retention". Journal of Verbal Learning and Verbal Behavior. Elsevier BV. 8 (6): 719–724. doi:10.1016/s0022-5371(69)80035-6. ISSN 0022-5371.
  10. ^ Douglas Biber (2007). Discourse on the Move: Using Corpus Analysis to Describe Discourse Structure. John Benjamins Publishing. pp. 97–98 with footnote 7. ISBN 978-90-272-2302-9.
  11. ^ Mark Warschauer; Richard Kern (2000). Network-Based Language Teaching: Concepts and Practice. Cambridge University Press. pp. 107–108. ISBN 978-0-521-66742-5.
  12. ^ Michael Stubbs (1996). Text and Corpus Analysis: Computer Assisted Studies of Language and Culture. Wiley. pp. 71–73. ISBN 978-0-631-19512-2.
  13. ^ Nikola Dobrić; Eva-Maria Graf; Alexander Onysko (2016). Corpora in Applied Linguistics: Current Approaches. Cambridge Scholars Publishing. p. 57. ISBN 978-1-4438-9819-5.
  14. ^ Michael Stubbs (1986). "Lexical density: A technique and some findings". In Malcolm Coulthard (ed.). Talking about Text. University of Birmingham: English Language Research. pp. 27–42.
  15. ^ Victoria Johansson (2008). "Lexical diversity and lexical density in speech and writing: a developmental perspective". Linguistics and Phonetics Working Papers. Lund University. 53: 61–79.
  16. ^ Sven Strömqvist; Victoria Johansson; Sarah Kriz, H Ragnarsdottir, Ravid Aisenmann, Dorit Ravid (2002). "Toward a crosslinguistic comparison of lexical quanta in speech and writing". Written Language and Literacy. 5: 45–67. doi:10.1075/wll.5.1.03str.{{cite journal}}: CS1 maint : 복수이름 : 작성자 목록(링크)

추가 읽기

  • 요소, J(1971)어휘 밀도 및 차별화 등록G. Perren과 J.L.M.에서.트림 (eds), 런던 언어학 응용: 캠브리지 대학 출판부 443-452.

외부 링크