Startseite - Home

Katalog
Catalogue

eBooks

Verlage
Publishers

   Startseite :: Home
   Kontakt :: Contact
   über uns :: about us
   Datenschutz :: Privacy Policy
   Impressum
   Kundeninformation

English-Corpora.org

Kontakt/Bestellung
Contact/Order

via E-Mail:
info@digento.de  Contact/Order: info@digento.de

Online

Inhalt :: Content

Online-Service mit Zugang zu einer umfangreichen Sammlung englischsprachiger Textkorpora. Die enthaltenen Korpora bieten eine valide Datengrundlage für empirische Untersuchungen zu linguistischen Fragestellungen. Mithilfe von Korpora können charakteristische lexikalische, syntaktische oder phonetische Merkmale einer Sprache sichtbar und zählbar gemacht werden. Die Besonderheit von English-Corpora.org zeigt sich in der qualitativen Erfassung der Daten. Dadurch ist es im Unterschied zu den meisten übrigen Textkorpora möglich, detaillierte Suchabfragen für Analysen von Sprachwandel, regionalen, historischen, soziologischen oder geographischen Varianten zu stellen. Zu den bekanntesten Korpora gehören:

  • COCA (Corpus of Contemporary American English): Mit 560 Millionen Wörtern eines der größten und am häufigsten verwendeten Korpora für das heutige amerikanische Englisch.
  • COHA (Corpus of Historical American English): Ermöglicht mit 400 Millionen Wörtern die Untersuchung der Entwicklung des amerikanischen Englisch vom 19. Jahrhundert bis heute.
  • NOW (News on the Web) Corpus: Ein mit mehr als 8,2 Milliarden Wörtern sehr umfangreiches Korpus, das monatlich um Millionen von Wörtern aus Online-Nachrichtenartikeln wächst und somit die aktuellste Sprachentwicklung abbildet.
  • GloWbE (Corpus of Global Web-Based English): Sammelt Texte aus 20 verschiedenen englischsprachigen Ländern, um globale Varietäten des Englischen zu vergleichen. Gesamtumfang: 1,9 Milliarden Wörter.

English-Corpora.org

Verlag :: Publisher

English Corpora

Preis :: Price

Preise auf Anfrage / Prices on request

Das Angebot richtet sich nicht an Verbraucher i. S. d. § 13 BGB und Letztverbraucher i. S. d. PAngV.

Bestellnummer bei digento :: digento order number

107724

Verlagsinformation :: Publisher's information

English-Corpora.org is the world's largest and most widely used online collection of English-language text corpora. A corpus is a large, structured collection of texts that has been made digitally searchable. This website is an indispensable tool for linguists, language researchers, teachers, learners of the English language, and even technology companies.

Main Purpose and Usage

The corpora on English-Corpora.org are primarily used for the following purposes:

  • Linguistic Research: Scholars analyze how the English language has changed over time, how it differs across various regions (dialects), or how it is used in different types of texts (e.g., news vs. fiction).
  • Language Learning and Teaching:
    • Learners and teachers can look up how native speakers actually use a word or phrase.
    • One can determine the frequency of words or idioms.
    • It helps in understanding which words typically occur together (known as collocations, e.g., "strong coffee" rather than "powerful coffee").
    • One can study the use of grammatical structures in real-world contexts.
  • Cultural Analysis: Researchers can examine how societal topics and concepts are reflected in language over decades.


Who is behind it?

The corpora and the powerful search interface were developed by Mark Davies, an emeritus professor of Linguistics (formerly at Brigham Young University). For this reason, the collection was also previously known as the "BYU Corpora." Today, the site is operated by English Corpora LLC.


Well-Known Corpora on the Website

The website hosts a variety of corpora, which together comprise billions of words. Among the most famous are:


  • COCA (Corpus of Contemporary American English): One of the largest and most frequently used corpora for present-day American English.
  • COHA (Corpus of Historical American English): Allows for the study of the evolution of American English from the 19th century to the present.
  • NOW (News on the Web) Corpus: A massive corpus that grows by millions of words monthly from online news articles, thus capturing the most current language developments.
  • GloWbE (Corpus of Global Web-Based English): Collects texts from 20 different English-speaking countries to compare global varieties of English.
  • iWeb Corpus: A very large corpus based exclusively on web texts.


Access

The website offers free basic access, which is already very useful for many queries. For more intensive research, advanced features, and unlimited searches, there are paid premium or academic licenses available.

top  top