Testo completo

Copyright Buro van die Woordeboek van die Afrikaanse Taal (Bureau of the WAT) 2016

Abstract

Wiktionary is increasingly gaining influence in a wide variety of linguistic fields such as NLP and lexicography, and has great potential to become a serious competitor for publisher-based and academic dictionaries. However, little is known about the "crowd" that is responsible for the content of Wiktionary. In this article, we want to shed some light on selected questions concerning large-scale cooperative work in online dictionaries. To this end, we use quantitative analyses of the complete edit history files of the English and German Wiktionary language editions. Concerning the distribution of revisions over users, we show that - compared to the overall user base - only very few authors are responsible for the vast majority of revisions in the two Wiktionary editions. In the next step, we compare this distribution to the distribution of revisions over all the articles. The articles are subsequently analysed in terms of rigour and diversity, typical revision patterns through time, and novelty (the time since the last revision). We close with an examination of the relationship between corpus frequencies of headwords in articles, the number of article visits, and the number of revisions made to articles.

Abstract alternativo:

close

Wiktionary gewinnt immer mehr an Einfluss in vielen linguistischen Bereichen wie bspw. NLP und Lexikographie. Es hat das größte Potential, ein ernsthafter Wettbewerber für die Vertragslexikographie und akademische Lexikographie zu werden. Allerdings wissen wir wenig über die "Crowd", die für den Inhalt von Wiktionary verantwortlich zeichnet. Im vorliegenden Artikel wollen wir einige ausgewählte Fragen bearbeiten, die sich auf groß angelegte Koopera-tionsarbeit an Online-Wörterbüchern beziehen. Wir verfolgen dabei einen quantitativen Ansatz und verwenden die kompletten Historien des englischen und deutschen Wiktionarys als Daten-basis. Wir zeigen, dass — im Vergleich zur kompletten Autorenbasis des Wiktionarys — nur sehr wenige Autoren für die überwältigende Mehrheit der Revisionen in beiden Wiktionarys verant-wortlich sind. Im Folgenden vergleichen wir diese Verteilung mit der Verteilung der Revisionen über alle Artikel. Dann werden die Artikel hinsichtlich Gründlichkeit und Diversität, typischen Revisionsmustern in der Zeit sowie der Neuigkeit (Zeit seit der letzten Revision) untersucht. Wir schließen mit einer Analyse des Zusammenhangs zwischen Korpusfrequenz des Stichworts, der Anzahl der Seitenaufrufe des Artikels und der Anzahl der Revisionen des Artikels.

Dettagli

Titolo
How Many People Constitute a Crowd and What Do They Do? Quantitative Analyses of Revisions in the English and German Wiktionary Editions
Autore
Müller-Spitzer, Carolin
Pagine
347-371
Anno di pubblicazione
2016
Data di pubblicazione
2016
Casa editrice
Buro van die Woordeboek van die Afrikaanse Taal (Bureau of the WAT)
ISSN
16844904
e-ISSN
22240039
Tipo di fonte
Rivista accademica
Lingua di pubblicazione
English
ID documento ProQuest
1859872658
Copyright
Copyright Buro van die Woordeboek van die Afrikaanse Taal (Bureau of the WAT) 2016