케임브리지 잉글리시 코퍼스
Cambridge English Corpus케임브리지 잉글리시 코퍼스 (CEC) (구 케임브리지 인터내셔널 코퍼스, CIC)는 영어의 수십억 단어 코퍼스(텍스트 코퍼스와 구어 코퍼스 데이터 모두 포함)이다.케임브리지 잉글리시 코퍼스는 영어와 미국 영어를 포함한 많은 출처의 데이터를 포함하고 있다.CEC에는 또한 영어 학습자들이 작성한 영어 시험 응답으로 구성된 40m 단어인 "Cambridge Learner Corpus"도 포함되어 있다.
케임브리지 잉글리시 코퍼스는 케임브리지 대학 출판부 영어 교육 출판물에 정보를 제공하고 말뭉치 언어학 연구에 사용된다.현재 캠브리지 대학 출판부의 프로젝트와 출판물에 종사하는 저자와 연구자, 캠브리지 영어 평가의 연구자 등으로 접근이 제한되어 있다.[1]
작성된 데이터
케임브리지 잉글리시 코퍼스는 신문, 잡지, 소설, 편지, 이메일, 교과서, 웹사이트, 그리고 많은 다른 출처에서 가져온 현대 문어 영어의 예를 포함하고 있다.
구어 데이터
케임브리지 잉글리시 코퍼스는 일상 대화, 전화, 라디오 방송, 프리젠테이션, 연설, 회의, TV 프로그램 및 강의를 포함한 다양한 출처에서 가져온 다양한 구어 영어를 포함하고 있다.
케임브리지 러너 코퍼스
CLC(Cambridge Learner Corpus, CLC)는 영어를 배우는 학생들이 작성한 시험 대본 모음으로, 캠브리지 영어 평가와 협력하여 작성되었다.CLC는 약 200개국에서 온 180,000명 이상의 학생들이 138개의 다른 제1외국어를 구사하는 대본을 포함하고 있으며 항상 성장하고 있다.[2]현재 포함된 시험은 다음과 같다.
- KET 키 영어 시험(및 학교용 KET)
- PET 예비 영어 시험(및 학교용 PET)
- FCE 영어 첫 번째 인증서
- 고급 영어 CAE 인증서
- CPE 영어능력인증서
- BEC 비즈니스 영어 인증서(모든 수준)
- IELTS 국제영어시험시스템(학부 및 일반교육)
- CELS 영어 능력 자격증
- ILEC 국제법률영어인증서
- ICFE 국제금융인증서
- 삶을 위한 기술
케임브리지 학습자 코퍼스의 독특한 특징은 에러 코딩 시스템이다.언어 전문가는 시험 스크립트에서 오류를 식별하고 주석을 달 수 있다.이는 코퍼스가 다른 유형의 오류의 빈도, 오류가 발생하는 상황, 특정 언어 영역이 어렵다고 생각하는 학생 그룹에 대해 알아내는 데 사용될 수 있다는 것을 의미한다.[3]
케임브리지 영어 교육 자료의 저자들은 이 정보를 사용하여 일반적인 오류를 목표로 삼을 수 있다. 예를 들어, 케임브리지 고급 학습자 사전에는 빈번한 학습자 오류를 강조하는 '공통 실수' 기능이 포함되어 있다.
반대로 오류 코딩 시스템은 또한 학생들이 각 레벨에서 성취할 수 있는 것을 보여준다.이것은 전세계적으로 영어의 학습, 교육, 평가를 향상시키기 위한 협력 프로그램인 영어 프로파일의 작업의 중심이다.[4]설립 파트너는 케임브리지 대학 출판부, 케임브리지 영어 평가부, 케임브리지 대학, 베드포드셔 대학, 영국 의회, 영국 영국 등이다.[5]이 프로젝트의 목적은 학습자가 CEFR(Common European Framework of Reference)의 각 레벨에서 영어로 알고 할 수 있는 것을 설명하는 것이다.[6]
전문기업
케임브리지 잉글리시 코퍼스는 많은 전문 기업들을 포함하고 있다.
케임브리지 비즈니스 잉글리시 코퍼스
케임브리지 비즈니스 잉글리시 코퍼스는 보고서와 문서, 다양한 비즈니스 측면에 관한 책, 그리고 많은 전국 신문의 비즈니스 섹션을 포함한 영국과 미국의 비즈니스 언어의 많은 모음집이다.
케임브리지 비즈니스 잉글리시 코퍼스는 또한 캠브리지 대학 출판부와 노팅엄 대학 간의 공동 프로젝트의 결과물인 캠브리지와 노팅엄 음성 비즈니스 코퍼스(CANBEC)도 포함한다.다국적 대기업부터 소규모 파트너십에 이르기까지 모든 규모의 기업에서 영어로 된 녹음 파일을 모아 놓은 것이다.공식 및 비공식 회의, 프리젠테이션, 전화 대화, 점심 시간 대화, 기타 비즈니스 상황에서의 구어 등이 수록되어 있다.
케임브리지 법률 영어 코퍼스
Cambridge Lawy English Corpus에는 법률과 법률 절차에 관한 책, 저널, 신문 기사가 수록되어 있다.
케임브리지 파이낸셜 잉글리시 코퍼스
케임브리지 파이낸셜 잉글리시 코퍼스에는 선도적인 금융잡지와 신문 등 경제와 금융에 관한 지문이 실려 있다.
케임브리지 어학 영어 코퍼스
케임브리지 어학 영어 코퍼스에는 강의, 세미나, 학생 발표, 저널, 에세이, 텍스트북 등 미국과 영국의 다양한 기관에서 온 학부 및 대학원 수준의 문어와 구어가 포함되어 있다.
캔코드
CANCOD(Cambridge and Nottingham Corpus in English, CANCOD)는 다양한 상황(예: 일상적인 대화, 사교, 정보 찾기 및 토론)에서 영국 섬 전역 수백 곳에서 녹음된 구어 영어 모음입니다.CANCODE corpus는 캠브리지 대학 출판부와 노팅엄 대학 사이의 공동 프로젝트의 결과물이다.
CANCODE 말뭉치에는 약 500만 개의 단어가 있으며, 이것은 구어 영어 연구자들에게 매우 풍부한 자원이다.그러나, 그 자료는 몇 가지 한계가 있다.대부분의 사람들은 그들이 녹음되고 있다는 것을 알고 있었고, 집에서 휴식을 취하면서, 사회적 지위가 상당히 동등한 다른 사람들과 비공식적인 상황에서 대화를 나누고 있다.이것은 상호작용이 일반적으로 합의되고 협력적이기 때문에 말뭉치는 갈등이나 적대적 교환에[7] 대한 최소한의 증거를 가지고 있다는 것을 의미한다.
Cambridge-Cornell Corpus of Speak North American English
케임브리지 대학 출판부/코넬 코퍼스는 북아메리카에 있는 가족/친구들 간의 비공식적이고 상호 작용성이 높은 다중 대화 모음입니다.케임브리지-코넬 코르펠 코퍼스는 케임브리지 대학 출판부와 코넬 대학 간의 공동 프로젝트의 결과물이다.
캠스네
CAMSAE(Cambridge Corpus of Speak North American English, CAMSAE)는 미국어의 대규모 모음집이다.여기에는 직장, 가정, 쇼핑, 식사 등 일상생활에 종사하는 사람들의 기록이 포함되어 있다.
참고 항목
참조
- ^ 케임브리지 인터내셔널 코퍼스, http://www.cambridge.org/us/esl/catalog/subject/custom/item3637700/Cambridge-International-Corpus-Cambridge-International-Corpus/?site_locale=en_US
- ^ Cambridge Learner Corpus, http://www.cambridge.org/us/esl/catalog/subject/custom/item3646603/Cambridge-International-Corpus-Cambridge-Learner-Corpus/?site_locale=en_US
- ^ Diane Nicholls, http://ucrel.lancs.ac.uk/publications/CL2003/papers/nicholls.pdf
- ^ 영문 프로파일 프로젝트, http://www.englishprofile.org/index.php?option=com_content&view=article&id=11&Itemid=2 웨이백머신에 2011-09-14 보관
- ^ 영문 프로파일, http://www.englishprofile.org/index.php?option=com_content&view=article&id=24&Itemid=22 웨이백 머신에 2011-05-07 보관
- ^ 유럽의회, CEFR급"Archived copy". Archived from the original on 2009-10-30. Retrieved 2009-11-05.
{{cite web}}
: CS1 maint: 타이틀로 보관된 사본(링크) - ^ 카터(2004) 언어와 창의력:공통 대화의 기술.런던: 루트리지.