Developing and implementing an English-Spanish literary parallel audio-textual corpus for data-driven ESL learning
DATE:
2021
UNIVERSAL IDENTIFIER: http://hdl.handle.net/11093/3233
EDITED VERSION: http://www.scielo.br/scielo.php?script=sci_arttext&pid=S0102-44502021000100405&tlng=en
UNESCO SUBJECT: 5701.12 Traducción ; 5705.06 Fonología ; 5701.07 Lengua y Literatura ; 5701 Lingüística aplicada
DOCUMENT TYPE: article
ABSTRACT
The purpose of this paper is to present the LITTERA corpus, an English-Spanish literary parallel speech corpus created for the purpose of language learning, and to sketch out a few pedagogical applications for the study of English phonology by Spanish-speaking language learners. It is composed of 25 literary texts that have been aligned with the Spanish translation and are accompanied by audio from the corresponding audiobooks. In this article, we will detail its conception, composition and features at length, as well as provide a few examples of how LITTERA can be applied in language learning, particularly within the realm of oral comprehension and speech production. O objetivo deste trabalho é apresentar o corpus LITTERA, um corpus áudio-textual literário inglês-espanhol criado para a aprendizagem de línguas, e esboçar algumas aplicações pedagógicas para o estudo da fonologia inglesa por estudantes de língua espanhola. O corpus LITTERA é composto por 25 textos literários que foram alinhados com a sua tradução espanhola e são acompanhados pelo áudio dos audiolivros correspondentes. Neste artigo, vamos detalhar a sua concepção, a sua composição e as suas características em profundidade, bem como fornecer alguns exemplos de como o corpus LITTERA pode ser aplicado na aprendizagem de línguas, particularmente nos domínios da compreensão oral e da produção de fala.