Wissenschaftlicher Sammelband, herausgegeben von Thomas Tinnefeld - unter Mitarbeit von Matthias Ballod, Jan Engberg, Katja Lochtman, Günter Schmale, Veronica Smith. Saarbrücken: htw saar 2016. ISBN 978-3-942949-11-8

Das Corpus de référence du français contemporain (CRFC): Aufbau, Nutzung und erste Ergebnisse



Dirk Siepmann (Osnabrück) & Christoph Bürgel (Paderborn)


Abstract (English)

The Corpus de référence du français contemporain (CRFC) is a large genre-diverse corpus designed to investigate present-day French. Its current version comprises 310 million words, a considerable proportion of which are spontaneous spoken data (ap­proximately 30 million words) and pseudo-spoken data (approximately 125 million words). The present article starts by discussing the design and composition of the cor­pus and then goes on to present results from a number of studies based on it.

Keywords: Corpus linguistics, present-day French, lexico-grammar


Abstract (Deutsch)

Das Corpus de référence du français contemporain (CRFC) ist ein umfangreiches genrediversifiziertes Korpus zur Untersuchung des Gegenwartsfranzösischen. Es umfasst in seiner aktuellen Version 310 Millionen Wörter und berücksichtigt in erheb­lichem Maße spontane Sprechsprache (ca. 30 Millionen Wörter) und pseudo-sprech­sprachliche Daten (ca. 125 Mill. Wörter). Der vorliegende Beitrag stellt zunächst Aufbau und Struktur des Korpus vor. Der Schwerpunkt liegt dann auf der Präsentation von ersten Ergebnissen zur wissenschaftlichen Erforschung des tatsächlichen Ge­brauchs des Französischen.
Stichwörter: Korpuslinguistik, Gegenwartsfranzösisch, Lexiko-Grammatik








1 Das CRFC: Konzeption und Aufbau

Das Corpus de référence du français contemporain (fortan: CRFC; Siepmann, Bürgel & Diwersy 2015) ist das erste Korpus des Französischen, das eine große Breite an verschiedenen Diskursgenres bzw. Textsorten enthält und so­mit zentrale Verwendungsweisen des Gegenwartsfranzösischen abbildet. Damit soll es den Ansprüchen von Lernern, Lehrkräften und Forschern der französi­schen Gegenwartssprache gerecht werden.

Das Korpus unterscheidet sich in verschiedener Hinsicht von bisherigen Korpo­ra des Französischen:

  1. es handelt sich um das größte Korpus des Französischen, das nicht aus­schließlich auf Daten aus dem Internet beruht;
  2. das Korpus umfasst heterogene Textsammlungen;
  3. es ist das erste Korpus des Französischen, das eine große Menge von spontan-sprechsprachlichen Daten (ca. 30 Mill. Wörter) und „pseudo-sprechsprachlichen“ Daten (Diskussionsforen, Theater, SMS, ca. 125 Mill. Wörter) umfasst;
  4. ein Teil des Korpus ist als Monitorkorpus konzipiert, das regelmäßig ak­tualisiert werden soll, sofern eine entsprechende Finanzierung vorliegt.

Hinsichtlich Planung und Struktur des Korpus dienten die beiden großen Refe­renzkorpora des Englischen als Orientierung (British National Corpus und Corpus of Contemporary American English), wobei das CRFC eine größere Textsortenbreite aufweist. Dabei wurde ein möglichst hoher Grad an Repräsen­tativität und Ausgewogenheit angestrebt, auch wenn es sich dabei um ein sta­tistisches Ideal handelt, das nicht auf die natürliche Sprache anwendbar ist (vgl. z. B. Atkins u.a. 1992 und Evert 2006).

Ein weiteres Alleinstellungsmerkmal des CRFC besteht darin, dass es zu glei­chen Anteilen rein sprechsprachliche und pseudo-sprechsprachliche Quellen einerseits sowie schriftliche Quellen andererseits umfasst und somit „un équi­libre appréciable entre contrôle et naturel“ (Corbin 2005: 131) herstellt. Das Korpus kann daher als Grundlage und Datenquelle für die Entwicklung von kor­pusinduzierten Wörterbüchern, Grammatiken und Lehr- und Lernmaterialien dienen. Es ermöglicht die Beantwortung von Fragen, die mit bisherigen Korpora oder introspektiven Vorgehensweisen nicht zufriedenstellend gelöst werden konnten.

Das Korpus richtet sich an folgende Benutzerkreise:

  • in erster Linie natürlich an Linguisten, die die französische Gegenwarts­sprache in ihren verschiedenen Ausprägungen erforschen wollen;
  • an Fremdsprachendidaktiker, die das Korpus zur Neuentwicklung von korpusbasierten bzw. -induzierten Grammatiken, Lernwortschätzen und Lehrbüchern verwenden können;
  • an Französischlehrer, die das Korpus für die Unterrichtsplanung und als Korrekturhilfe einsetzen können;
  • an Übersetzer und technische Redakteure, die gezielte Anfragen zu For­mulierungsproblemen stellen können;
  • an Studierende, die für sprachliche Regelmäßigkeiten sensibilisiert wer­den sollen.

Es soll nicht verschwiegen werden, dass aus Kosten- und Zeitgründen ein pra­gmatischer Mittelweg zwischen philologischer Genauigkeit und Machbarkeit eingeschlagen werden musste. Der bisherige Verzicht auf eine aufwändige An­notierung des sprechsprachlichen Korpusteils nach Datum, Turn oder auch se­mantischen und prosodischen Merkmalen soll evtl. später nachgeholt werden.

Die folgende Übersicht zeigt die Zusammensetzung des Korpus:




Medium

Subkorpus
Größe
Rein sprechsprachlich
Informell
Formell
30 Mill.
30 Mill.

Pseudo-sprechsprachlich
Theaterstücke und Filmdrehbücher
Film- und Nachrichtenuntertitel
SMS / Chat
Diskussionsforen
30 Mill.
2,5 Mill.
2,5 Mill.
60 Mill.
155 Mill.




Schriftlich
Wissenschaftliche Texte und Fach­
texte

Andere nicht-literarische Texte

Romane, Novellen, Erzählungen

Zeitungen

Zeitschriften

Tagebücher und Blogs

Briefe und E-Mails

Verschiedene Texte
30 Mill.

30 Mill.

30 Mill.

45 Mill.

10 Mill.

5 Mill.

1 Mill.

4 Mill

155 Mill.
Tab. 1: Zusammensetzung des CRFC
Eine Besonderheit des Korpus ist der beträchtliche Umfang des rein sprech­sprachlichen Korpusteils. Bislang musste die Forschung zur Sprechsprache auf kleinere, oft aus Interviewdaten bestehenden Korpora zurückgreifen, deren Nachteil darin besteht, dass sie die Varianz von Kommunikationssituationen nur unzureichend darstellen (vgl. Debaisieux 2010, Gadet et al. 2012). Aus Platz­gründen soll im Folgenden nur das sprechsprachliche Teilkorpus kurz vorge­stellt werden.

Der sprechsprachlich-informelle Teil besteht zu ca. 75 % aus Transkriptionen von spontanen Monologen oder Dialogen aus über 200 verschiedenen Arten von Fernsehsendungen der Sender France 2, France 3 und France 5 aus den Jahren 2013 und 2014. Damit stehen zurzeit mehr als 6000 Sendungen bzw. 3000 Stunden spontaner Sprechsprache zur Verfügung. Um eine Überreprä­sentation bestimmter Wochentage oder Jahreszeiten zu vermeiden, wurden be­wusst die Sendungen eines ganzen Jahres einbezogen (vgl. Kennedy 1998: 75). Das Korpus umfasst beispielsweise Kochshows wie Dans la peau d’un chef, Chatshows des Typs Toute une histoire, Kultursendungen des Typs Entrée libre, politische Magazine wie C’est à dire, verschiedene Sport- und Wissenschaftssendungen sowie Dokumentationen über verschiedene Themen.

Diese Zusammenstellung wirft die Frage nach der Vergleichbarkeit solcher Daten mit der Sprechsprache außerhalb der Medien auf. Wie Meißner (2006: 248–249) als Antwort auf die Frage ‘Quel français enseigner?’ feststellt, setzt das Fernsehen „[...] längst die statistische Norm, indem es zahlreiche Idiolekte und Varietäten an Ohren und Augen vieler transportiert, allerdings so, dass die­se innerhalb des Sprach- und Senderaums breit verstanden werden.“ Folgt man dieser Einsicht, dann können die im Fernsehen verwendeten Varietäten der gesprochenen Sprache als Leitlinie für die Konzeption des mündlichen Korpus­teils und die Entwicklung von Lehr- und Lernmaterialien fungieren. Ein weiteres Argument für diese Vorgehensweise liefert Davies: Eine von ihm (http://corpus. byu.edu/coca) durchgeführte Gegenüberstellung zeigt, dass eine recht enge Passung zwischen den Transkripten der von ihm verwendeten Talkshows (u.ä.) und der Sprechsprache außerhalb des Mediums Fernsehen besteht. Darüber hinaus zeigen Korrelationsanalysen auf der Grundlage von n - grams aus Unter­titelkorpora, dass die in Filmen und Fernsehuntertiteln verwendete Sprache eine starke Ähnlichkeit zur informellen Unterhaltung auf­weist (Levshina, er­scheint). Ähnliche Beobachtungen liegen zur Sprache von Seifen­opern vor (Quaglio 2009). In jedem Fall ist die Authentizität des der informellen Sprech­sprache gewidmeten Subkorpus des CRFC höher anzu­setzen als im COCA, da es einen großen Anteil an Sendungen umfasst, die reale Interak­tionen zwischen Sprechern zeigen, einschließlich authentischer pri­vater Unter­haltung. Kritikern der Verwendung solcher Daten wäre schließlich zu entgegnen, dass diese alter­nativlos ist, wenn das Ziel der Forschung darin be­steht, ein umfassendes Bild der Lexikogrammatik einer Sprache zu liefern. Die Zusammenstellung einer vergleichbaren Menge an Daten aus anderen Quellen wäre einfach zu kosten­intensiv und zeitaufwändig. Jedoch muss auch auf eini­ge Unterschiede zwii­schen Fernsehdaten und anderen sprechsprach­lichen Da­ten hingewiesen werden, die sich beispielsweise auf Häsitationssphä­nomene oder die Sprach­flüssigkeit beziehen.

Im Folgenden sind einige Daten zur Illustration angeführt:
Ça a commencé comment? O. Pruvost: Au milieu des années 90, bêtement, j'ai l’impression. Ça a commencé en faisant du cheval. J'ai l'impression d'avoir tapé sur la selle, continuellement, pendant cette promenade de cheval qui a duré 2 heures. Ça a provoqué un tassement des disques. Ça a été le point de départ de ces douleurs. Marina: Vous étiez déjà sportif? O. Pruvost: Oui. Michel: C'était quelle douleur? O. Pruvost: Ça ne s'est jamais vraiment déclaré au niveau des sciatiques. Par contre, en crise, c'était épouvantable. Je me laissais glisser contre un mur sur le sol pour apaiser la douleur. Michel: C'était dans le bas du dos, les lombaires? O. Pruvost: Oui. Marina: C'était déclenché par quoi? De mauvaises positions? (Gesundheitsjournal)

-Appuie ! Voilà ! Allez ! -Il faut le pencher dans l'autre sens, le bidon ! Il faut anticiper ! Avec la bascule, il faut mettre le goulot vers l'avant. -Réfléchis, Nath ! -Penche-le au maximum vers l'avant ! Penche le bidon vers l'avant ! -OUAIS ! -C'est beau ! -Allez ! Vas-y, championne ! -T'es à mi-parcours ! -Tranquille. Voilà. -C'est bon ! C'est bon ! -C'est bien, Nath ! (Spielshow)

-Là, je suis en train de faire le pain. Pain bio au levain maison. Vu que les ravi­taillements ici, c'est tous les mois, ben le pain, on arrive difficilement à le garder pendant un mois, donc à l'héliportage, on monte du pain et après, on le fait ici. Quand il y a du monde, c'est tous les jours. Sinon, avec moins de monde, tous les 2 jours. Avant tout, il faut aimer la montagne. Sinon, passer 5 mois ici dans l'année, on ne tient pas longtemps. (Dokumentation)
Die restlichen 25 % des sprechsprachlich-informellen Teils umfassen verschie­dene frei verfügbare sprechsprachliche Korpora (TALN, CoLaJE und Teile des ESLO 1 und 2, die Daten von den späten 1960er Jahren bis heute umfassen). Zudem wurde ein Korpus von Geschäftsverhandlungen und -telefongesprächen aufgenommen, das freundlicherweise von Gérard Mercelot (Fachhochschule Emden / Leer) zur Verfügung gestellt wurde.

Der sprechsprachlich-formelle Teil besteht aus politischen und anderen Reden, Transkriptionen universitärer Vorlesungen (von denen eine freundlicherweise von Karl-Heinz Eggensperger, Universität Potsdam, zur Verfügung gestellt wur­de) sowie aus Debatten der französischen Nationalversammlung und des Se­nats.

Das Korpus soll nach aktuellem Planungsstand nach einer Karenzzeit von drei Jahren im Jahr 2018 auf der Primestat-Plattform von Sascha Diwersy (Univer­sität Montpellier) für die Öffentlichkeit freigegeben werden. Zurzeit ist das Korpus auf der Plattform Sketchengine (privates Konto) installiert (für weiterge­hende Ausführungen vgl. Siepmann, Bürgel & Diwersy 2015).

2 Anwendungen und erste Ergebnisse

Im Folgenden soll anhand einiger Beispiele veranschaulicht werden, dass und wie das CRFC zur Erforschung der französischen Gegenwartssprache und zur Weiterentwicklung der Sprachdidaktik beitragen kann.

2.1 Didaktische Grammatik


Während sich im angelsächsischen Raum das Konzept einer korpusbasierten lexikogrammatischen Lernergrammatik bereits seit geraumer Zeit bewährt hat, liegen für das Französische bisher keine einschlägigen didaktischen Gramma­tiken vor. Dieser Umstand ist vor allem auf das Fehlen von größeren elektroni­schen Korpora des Französischen sowie den besonderen Stellenwert der theo­retischen Grammatik in Frankreich zurückzuführen. Mit dem Entstehen des CRFC verbindet sich daher die Chance, eine wissenschaftliche korpusindu­zierte Referenzgrammatik des Französischen sowie didaktische Grammatiken für Französischlerner zu entwickeln. Die bisher ermittelten korpusinduzierten Ergebnisse zur Lexiko-Grammatik des Französischen sollen im Folgenden am Beispiel der Verwendung des Subjonctif und des Präpositionengebrauchs zu­sammenfassend vorgestellt werden.

2.1.1 Präpositionengebrauch


Die unvoreingenommene Untersuchung des Präpositionengebrauchs auf der Grundlage eines korpusinduzierten Ansatzes hebt zahlreiche alltägliche Ver­wendungsweisen von Präpositionen ins Bewusstsein des Sprachforschers, die trotz oder gerade wegen ihrer Banalität für den Muttersprachler in gebräuch­lichen Grammatiken und teilweise sogar in sprachwissenschaftlichen Untersu­chungen keine Berücksichtigung finden. Exemplarisch sollen hier der Gebrauch der lokalen Präpositionen à, dans und en vor Nomina, die Geschäfte oder Unternehmen bezeichnen, sowie verschiedene Kategorien von Nomina, die mit der Präposition dans stehen, diskutiert werden (Siepmann & Bürgel, 2016).

In ersterem Fall fällt auf, dass bisherige Schul- oder universitäre Grammatiken den Gebrauch von en übersehen. Hier gilt, dass à sich auch auf konkrete Orte als Arbeitsplatz oder Verkaufsgeschäft bezieht und bei Erweiterung der Nomi­nalphrase mit dans alterniert. En steht dagegen bei einer abstrakten Sichtweise und impliziert häufig einen Vergleich mit anderen Alternativen (vgl. en biblio­thèque vs. sur Internet, la muscu en salle vs. la muscu en chambre):
J’en achète à la boulangerie / à ma boulangerie / à la boulangerie du coin. (seltener : J’en achète dans ma boulangerie / dans la boulangerie du coin.)

j'ai fait manger les enfants ; après j'ai été au magasin avec ma fille jusqu'à une heure et demie. … (= in unserem Ladengeschäft)

Quand je pense qu’ils en vendent au magasin bio. (= in dem Bioladen, in dem ich einkaufe)

On le trouve en pharmacie et dans les boutiques spécialisées. (= dans les pharmacies)

Je voulais l'acheter ce matin, en librairie, et il n'y en avait plus. (= dans une librairie et non pas dans un supermarché)

J’ai travaillé en salon sur Paris.
Hier hat sich also eine Dreigliederung des Spektrums etabliert, die in bisherigen Standardgrammatiken keine Berücksichtigung findet:


Konkreter / Situativ Abstrakter / Kategorisierend
Pendant que certains étaient dans la rue quand j'étais plus jeune, moi j'étais dans la salle de sport.
Je me tuais d’abdos à la salle de sport.
Tu déconseilles la muscu en salle ? (≠ la muscu en chambre)
Tab. 2: Dreigliederung des Präpositionalspektrums
Ebenso wenig Aufmerksamkeit erfährt die Opposition von sur und à mit Orts­namen, die jedem Lerner jedoch bei Kontakten mit Muttersprachlern sofort auf­fallen wird:
C'est toi qui m'avait [sic !] parlé du cirque du soleil ? Car ils jouent sur Paris en ce moment et je me tâte pour aller les voir. (SMS)
On a eu une histoire en venant sur Paris, hier. On arrive sur la capitale …
J'ai eu une réunion sur Paris, près de la gare de Lyon.
- Vos enfants vous aident ? - Ils ne sont pas sur Boulogne, non.
Diese Verwendungsweise, die bisher der spontanen Sprechsprache vorbehal­ten ist, hat ihren Ursprung vermutlich in Militärmetaphern oder der Wirtschafts­sprache (vgl. marcher sur Romenous distribuons nos produits sur Paris) (Hernandez 2008). Der Gebrauch von sur hebt dabei die Impermanenz des Zu­standes hervor, vergleichbar mit dem Effekt des Verlaufsaspektes im Engli­schen (je suis sur BoulogneI’m living / working in Boulogne vs. je vis à BoulogneI live in Boulogne).

Mit unserem zweiten Beispiel, den nicht-lokalen und nicht-temporalen Verwen­dungsweisen von dans, stoßen wir gleichsam in grammatisches Neuland vor, das in den bekannten Grammatiken, von vereinzelten Bemerkungen abgese­hen, brach gelassen wurde. Hier sollen nur drei zentrale Bedeutungsgruppen angesprochen werden.

2.1.1.1 dans + institution / secteur / métier
police, poste, télécoms, immobilier, industrie, banque, restauration, médias, sciences, littérature, art, éducation, sport, football, production, commerce, bâtiment, économie, marché, armée, fonction publique, (les) services, etc.
In diesem Fall erweist sich aus der Lernerperspektive die innersprachliche Sys­tematik als hilfreich, da sich im Sprachvergleich durchaus sehr verschie­dene Äquivalenzen ergeben:
Il y a des pourris dans la police comme partout ailleurs. (= bei der Polizei)
[…] avancer dans la compréhension des mutations en cours dans le marché de l'emploi. (= auf dem Arbeitsmarkt)
Vous avez toujours été photographe ? Non, j'étais éducatrice spécialisée pendant douze ans. Et alors, comment on bascule dans la photo ? (= wie kommt man dann zur Photographie ?)
Hier ergeben sich natürlich wiederum vielfältige innersprachliche Kontraste, die hier nicht erschöpfend behandelt werden können (z. B. chez la police [auf dem Polizeirevier „zu Besuch“ vs. dans la police, sur le marché vs. dans le marché usw.).


2.1.1.2 dans + processus 

vie, quotidien, carrière, lutte, processus, pratique, développement, gestion, guerre, campagne, course, traitement, formation, choix, évolution, analyse, création, conception, calcul, élaboration, fonctionnement, prise de con­science, prise en charge, prise de décision, connaissance, répartition, détermination, etc.
Hier zeigt sich der häufig beschriebene hohe Abstraktionsgrad und die Vorliebe des Französischen für substantivische Ausdrucksweisen besonders deutlich. Wieder gilt, dass nur das Verständnis der innersprachlichen Systematik zum richtigen Gebrauch führen kann, zumal die hier aufgeführten Prozessnomina sich in verschiedene Unterkategorien aufteilen lassen, z. B. nach der Salienz zeitlicher Bedeutungskomponenten (z. B. vie, carrière, campagne vs. choix, connaissance).
Les progrès qui ont été réalisés dans la connaissance du cerveau … (= im / beim Verständnis)
On ne peut s'élever dans la connaissance qu'en développant l'attention contrôlée.(= an Erkenntnis gewinnen)
[] de toute façon, les études ne jouent pas à 100% dans la carrière, bien heu­reusement! (= für die berufliche Laufbahn)
Il met fin à la république de Venise en 1797, lors de sa victoire dans la campagne d'Italie. (= im Italienfeldzug)
Brown et al. (1982) ont identifié trois facteurs qui jouent dans le choix d’une stra­tégie par un apprenant. (= bei der Auswahl)
Seuls les pays disposant d'un marché intérieur dynamique [] peuvent aspirer à se trouver du côté des gagnants dans la course à la mondialisation. (= im Wettlauf)

2.1.1.3 dans + groupe

groupe, foule, société, population, syndicat, entreprise, équipe, mouvement, communauté, couple, cercle, giron, rang(s)
Wie anhand von Beispielen wie manif(estation) oder rassemblement deutlich wird, lassen sich viele Nomina, die nicht zum Kern dieser Bedeutungsgruppe gehören, ebenfalls mit dans gebrauchen, wenn ein entsprechender Kontext vor­liegt (Phänomen der Kontextvarianz). Für den Lerner wird ein solcher Gebrauch verständlicher und handhabbarer, wenn er ihn vor dem Hintergrund einer Stan­dardkategorie sehen kann:
Dans la manif, il y avait pas mal de militants écologistes.
Ähnlich lässt sich der Gebrauch von dans ses amis / ses clients auf die hier untersuchte Standardkategorie zurückführen:
Perso, j'ai mon homme sur Facebook, on est démonstratif, mais je ne fais pas attention à qui il a dans ses amis, à qui il parle, et je ne regarde pas ce qu'il y fait.
Il s'agit pour la plupart de personnes âgées isolées et peu mobiles, mais j'ai aussi dans mes clients des personnes qui n'ont pas le temps de se faire à manger.
Weitere wichtige Bedeutungskategorien, die mit dans stehen, sind Personen- / Autornamen; Nomina, die einen Kontext bezeichnen; Relationsnomina; Zu­standsnomina; Nomina, die eine Konformität zum Ausdruck bringen; Nomina, die Systeme bezeichnen; Nomina, die Stoffe bezeichnen; Nomina, die Stile bezeichnen; deskriptive Nomina, die Geräusche bezeichnen; usw. Dabei kon­trastiert der Präpositionsgebrauch, wie oben bereits gesehen, häufig mit dem Deutschen und ist dem Fremdsprachenlerner nur über eine systematische Er­fassung lexiko-grammatischer Klassen innersprachlich begreiflich zu machen. Dazu noch einige Beispiele:
Dans le silence du législateur, la notion reste difficile à cerner.
Dans son ensemble, l'activité radiologique française reste dans la moyenne des pays industrialisés.
Elle se jeta sur mon père dans un long hurlement, tandis que M. Campbell me sortit de la grange.
Tu es dans la confusion la plus parfaite, tu parles de relation !!!

2.1.2 Subjonctif


Zentrales Ergebnis unserer Untersuchungen zum Subjonctif-Gebrauch ist die Notwendigkeit einer Differenzierung der in den traditionellen Grammatiken vor­herrschenden Darstellung dieses Gebiets (Siepmann & Bürgel 2015).

2.1.2.1 Subjonctif-Auslöser

Kennzeichnend für die aktuellen Schul- und Universitätsgrammatiken ist, dass sie die Subjonctif-Auslöser nach semantischen Kategorien gliedern (Wille, Ge­fühl, Wahrscheinlichkeit usw.) und sich dabei in der Regel auf Verben und Ad­jektive beschränken, die in teilweise überlangen Listen aufgeführt werden. Die­se Darstellung des Subjonctif birgt mindestens zwei gravierende Probleme in sich:

Erstens erwecken die Listen den falschen Eindruck, dass die in Rede stehen­den lexikalischen Elemente mit gleicher Häufigkeit im mündlichen und schriftli­chen Sprachgebrauch vorkommen. So haben unsere Untersuchungen zu Ver­ben in der Sprechsprache gezeigt, dass falloir que gefolgt von vouloir que der häufigste Subjonctif-Auslöser ist, während détester que, approuver que, désirer que, s'opposer à ce que mit erheblich geringerer Frequenz vorkommen und die Verben consentir à ce que, défendre que, désapprouver que et tolérer que im mündlichen Korpusteil nicht oder in kaum nennenswertem Umfang auf­treten. Weiterhin ist zu berücksichtigen, dass der Subjonctif teilwei­se mit nur einer bestimmten Form oder zumindest wenigen Formen eines Verbs auftritt, wie z. B. im Fall von comprendre que oder aimer que, bei denen der Subjonctif vor­zugsweise mit der ersten Person Singular einhergeht: je comprends que / j'aimerais que, mit entsprechenden Implikationen für die Übungspraxis.

Zweitens werden Nomina und komplexe Konstruktionen, die den Subjonctif nach sich ziehen, außer Acht gelassen:

Nomina: c’est une coïncidence que / il y a le risque que / l'idéal serait que

Konstruktionen: je n'en (j'en) reviens pas que / il manquerait plus que / ça te dérange que / je n'en ai rien à faire que



2.1.2.2 Subjonctif in der gesprochenen Sprache

Aus unseren Untersuchungen zur Frequenz des Subjonctif in der gesprochenen Sprache geht hervor, dass dieser keinesfalls 'tot' ist. So tritt er in der Sprech­sprache mit einer durchschnittlichen Frequenz von 2000 Vorkommen auf 1 Mil­lion Wörter auf. Umgerechnet bedeutet dies, dass der Subjonctif in der Sprech­sprache ca. alle 8 Minuten verwendet wird. Die zehn häufigsten Sub­jonctif-Auslöser der informellen Sprechsprache sind: falloir, vouloir, pour que, le fait que, faire (en sorte) que, s'attendre à ce que / attendre que, pas sûr que, quoi que, avant que, comprendre que. Betrachtet man die Verteilung der verschie­denen Subjonctif-Verwendungen nach Typen lexikalischer Auslöser, so über­rascht, dass mehr als ein Drittel der Kategorie 'Meinung' und 'Notwendigkeit' angehört und nur ein geringer Prozentsatz dem Bereich des Gefühls ent­stammt, dem jedoch die Schulgrammatiken häufig breiten Raum widmen. Ein weiteres Manko didaktischer Grammatiken besteht darin, dass diese den seltenen Subjonctif-Verwendungen zu viel Aufmerksamkeit schenken, spezi­fisch sprechsprachlichen Subjonctif-Gebräuchen dagegen zu wenig. Dazu ge­hören z. B.: c‘est + ADJ (anstelle von il est); je m‘en fous; sympa; marrant; bien; pas mal; ça me fait chier; ça + me + étonner / inquiéter / faire plaisir / …; je trouve ça ADJ; il y a des chances / peu de chances / …; fais / faites gaffe / attention; pour pas / plus que (= pour que … ne … pas / plus).

Dass auch das in Deutschland am weitesten verbreitete Lehrwerk des Fran­zösischen (Découvertes) die häufigsten Verwendungen des Subjonctif in der gesprochenen Sprache nicht angemessen darstellt, hat ein Abgleich der 20 fre­quentesten Subjonctif-Auslöser gezeigt, von denen nur sechs berücksichtigt werden. Zudem werden weite Bereiche der Verwendung des Subjonctif im Mündlichen nicht berücksichtigt: Konjunktionen (pour que, avant que, sans que), der Ausdruck der Möglichkeit (possible), des Zweifels (pas sûr), der Ge­brauch von Nomina (fait) und Relativa (seul).

Diese Ergebnisse machen deutlich, dass eine adäquatere Darstellung des Sub­jonctif in Schul- und Universitätsgrammatiken folgenden Kriterien genügen sollte:
  • frequenzbasierte Darstellung (Ordnung der Verben und Verbformen, Adjektive, Nomina und Konstruktionen nach ihrer Vorkommenshäufig­keit)
  • genrespezifische Darstellung (spezifisch sprech- und schriftsprachliche Verwendungen)
  • Berücksichtigung von Nomina und vor allem von typischen Konstruk­tionen (die den Lernern zum einen idiomatische Minikontexte darbieten und zum anderen das Lernen überlanger Listen vermeiden)
Eine solche Darstellung erlaubt es den Lernern, den Subjonctif gemäß seiner Relevanz in der mündlichen oder schriftlichen Kommunikation zu lernen.


2.2 Lexikologie und Lernerlexikographie


Die Lexikographie und dabei insbesondere die französische Lexikographie be­rufen sich traditionell auf den bon usage, wie er in sorgfältig verfassten, redak­tionell bearbeiteten und der Öffentlichkeit zugänglichen Texten auftritt. Unsere Arbeit mit dem CRFC zeigt jedoch, dass der alltägliche Sprachgebrauch sich auch lexikalisch erheblich von der schriftsprachlichen Verwendung unter­scheidet und in Wörterbüchern dementsprechend unzureichend dokumentiert ist. Gerade dieser alltägliche Sprachgebrauch ist jedoch für Sprachenlerner von primärer Bedeutung.

2.2.1 Sprechsprachliche Lexik


In einer einschlägigen Studie auf Grundlage des CRFC zeigte sich insbeson­dere, dass in gängigen ein- und zweisprachigen Großwörterbüchern praktisch keine Informationen zum Kollokationsradius umgangssprachlicher Le­xik gelie­fert werden. Dabei entnehmen die zweisprachigen Wörterbücher im Allgemei­nen die wenigen vorhandenen kollokationellen Informationen dem Petit Robert oder dem TLF. Ein Beispiel liefert das Substantiv mec, dessen verbale Kollo­kate in praktisch keinem Wörterbuch Erwähnung finden; darüber hinaus sind positive adjektivische Kollokate von mec unterrepräsentiert, die im moder­nen Sprachgebrauch jedoch dominieren. Ein kollokationell angemessener Arti­kel für mec könnte dagegen folgendermaßen aussehen:
I. (= homme, par opposition à femme) Ça, c’est les mecs. Tous pareils. ; Les mecs aiment le foot. ; Je me sens un peu seul, le seul mec !
II. (= individu masculin quelconque): Le mec parle super bien l’anglais. ; T’as vu les trois mecs là-bas ? ; Salut, les mecs. ; Mec, t’as pas une clope ? Collocations + ADJ: beau mec, jeune mec, mec bien / cool / formidable / génial / super / sympa ; pauvre mec, petit mec ; mec louche ; mec bourré + DET: ce mec, le mec en question
III. (= petit ami, compagnon, y compris dans les couples gay) Je suis amoureuse de ce mec. … la liste de tous les mecs avec qui elle est sortie … Les filles quittent un mec pour un autre. Collocations + ADJ un autre mec (= un rival), le premier mec, nouveau mec, mec parfait ; mec chiant, mec jaloux + V : trouver / rencontrer / avoir / sortir avec / coucher avec / se taper / rester avec / draguer un mec + DET : mon / ton / son mec
IV. (= homme viril, partenaire sexuel) Les seuls mecs qui m’ont plu sont des mecs beaucoup plus mecs que moi. Collocations + ADJ beau mec, vrai mec, mec mignon, *mec bien membré, mec viril, mec musclé, mec mature + V: **sucer un mec, **chevaucher un mec
Die mangelhafte Erfassung umgangssprachlicher Kollokationen hat fast auto­matisch zur Folge, dass verschiedene Lesarten nicht klar genug differenziert werden. Dies lässt sich z. B. an den meisten Wörterbuchartikeln für das höchst polyseme Verb lâcher und die komplexe Präposition autour de nachweisen. Generell lässt sich sagen, dass komplexe Mehrwortitems in ihrer diskursiven Funktion stiefmütterlich behandelt werden (vgl. dazu auch den folgenden Ab­schnitt); besonders schwer wiegt, dass keinerlei Angaben zur typischen dialo­gischen Einbettung von Items wie n’importe quoi (z. B. - N’importe quoi. – Ah si!) gemacht werden.

Wörterbuchbeispielen zur gesprochenen Sprache haftet häufig ein Hauch des Künstlichen an, wenn sie aus der Introspektion des Redakteurs statt aus natür­lichsprachlichen Kontexten gewonnen wurden. So etwa folgendes Beispiel aus dem Lernerwörterbuch Dictionnaire du français:
Il est dans un état de surexcitation, il va péter les plombs ! (DDF, s.v. péter)
Hier besteht ein deutlicher Widerspruch zwischen dem umgangssprachlichen péter les plombs und dem fast fachsprachlichen dans un état de surexcitation. Im CRFC lassen sich dagegen relativ leicht natürliche Beispiele wie das folgen­de finden:
En fait, on peut dire que j'ai pété les plombs mais je n'ai pas insulté l'arbitre, loin de là.
An diesen wenigen Beispielen lässt sich erkennen, dass ein mittelgroßes Kor­pus wie das CRFC Auskunft geben kann über alltägliche lexikalische Kook­kurrenzen, die selbst in riesigen schriftsprachlichen Korpora in dieser Form nicht ermittelbar sind. Man ist geneigt, von einer zweiten Korpusrevolution zu sprechen, die Sinclairs berühmtes Diktum „the language looks rather different if you look at a lot of it at once“ auf die Sprechsprache anwenden wird.

2.2.2 Phraseme


Die Phraseologieforschung hat in jüngerer Zeit zahlreiche Belege dafür gelie­fert, dass phraseologische Einheiten für die Funktionsweise von Sprache zen­tral sind. Es muss deshalb überraschen, dass diese Erkenntnis in der Sprach­didaktik des Französischen bisher keine Berücksichtigung gefunden hat. Dieses Defizit war Anlass für eine Frequenzstudie zu häufigen Phrasemen des Ge­genwartsfranzösischen, die sich methodisch an die Pionierarbeiten von Marti­nez / Schmitt (2012) für das Englische anlehnt (Siepmann & Bürgel, erscheint). Auf der Grundlage des CRFC wurden drei Frequenzlisten erstellt:


Listentyp
Korpusteile
Anzahl der Phraseme
Gesamtliste
Gesamtes Korpus
1000
Liste des Mündlichen
Sprechsprachliche und pseudo­sprechsprachliche Korpusteile

500
Liste des Schriftlichen
Schriftliche Korpusteile
500
Tab. 3: Phraseme – Frequenzlisten
Diese Listen sollen die Grundlage für eine systematische Behandlung von Phra­semen legen und Lehrkräften die Möglichkeit bieten, Phraseme gemäß ihrer Häufigkeit in der gesprochenen oder geschriebenen Sprache auszuwählen und zu vermitteln. Dazu wurden im Rahmen des forschenden Lernens in der Fremd­sprachenlehrerausbildung verschiedene Studien von Studierenden durchge­führt, die von den Autoren des vorliegenden Artikels initiiert und betreut wurden.

2.2.2.1 Kategorisierung von Phrasemen nach kommunikativer Funktion

Um die Phraseme für das Fremdsprachenlernen zu strukturieren und sie Ler­nern zugänglich zu machen, wurden die von Burger (1998) vorgeschlagenen Kategorien aufgegriffen und wie folgt ausdifferenziert:



  1. Referentielle Phraseme beziehen sich auf außersprachliche Gegen­stände und Sachverhalte (Vorgänge, Zustände, Verhaltensweisen) und sind selbst­bedeutend (Autosemantika).
  2. Strukturelle Phraseme setzen die sprachlichen Elemente zueinander in Verbindung, stellen Relationen her und drücken Zusammenhänge aus (Adverbien, Konjunktionen).
  3. Kommunikative Phraseme dienen dem Herstellen, Definieren, Vollziehen und Beenden einer kommunikativen Handlung (Routineformeln, Diskurs­marker).

Eine Untersuchung der 1000 häufigsten Phraseme hat folgende Verteilung nach Kategorien gezeigt (Haarmann 2015):

Abb: 1: Verteilung der Phraseme nach Kategorien
Da zwei Drittel der Phraseme struktureller Natur sind, sollte dem Erlernen die­ser Kategorie im Anfangsunterricht das größte Gewicht zukommen. Dass eine Reihe von Phrasemen polyfunktional ist (3 %), d.h. mehreren Kategorien ange­hören kann, zeigt das Beispiel bien sûr. So dient es zum einen als Diskurs­marker in kommunikativer Funktion dazu, eine vom Gesprächspartner vorge­brachte Äußerung zu bestätigen oder ihr zuzustimmen: A: [...] est-ce qu'on pourrait vous poser des questions? B: Bien sûr, avec plaisir! (informelle Sprechsprache). Zum anderen übernimmt es als Adverb in struktureller Funk­tion die Aufgabe der Evidentialisierung eines Sachverhalts und der argumen­tativen 'Mitnahme' des Rezipienten, indem der Sprecher unterstellt, dass der Hörer oder Leser den Sachverhalt für evident hält (Bürgel 2008, 169): La voix seule est bien sûr parfois irremplaçable entre amoureux ou lorsque l'urgence l'exige (Korpusteil „Verschiedenes“).


2.2.2.2 Phraseme in Lehrwerken


Mithilfe der Frequenzlisten kann zudem die Frage beantwortet werden, ob schulische Lehrwerke die sprachliche Wirklichkeit angemessen abbilden. Dazu wurden die neuen Ausgaben der deutschen Französischlehrwerke Découvertes (Série jaune, Klett) und À Plus! (Cornelsen) jeweils Band 1-4 untersucht und folgende Ergebnisse ermittelt (Haarmann 2015): Von den 100 frequentesten Phrasemen des Französischen werden in Découvertes nur 29 und in À Plus! 32 Phraseme berücksichtigt. Aus der Gesamtliste der 1000 häufigsten Phraseme kommen in Découvertes 69 und in À Plus! 79 Phraseme vor. Von den 30 frequentesten Phrasemen fehlen in beiden Lehrwerken: en effet, nombre de, (à) plus tard, de même, sans doute, moins de, face à, lors de, au sein de. Eine Zusammenschau des Verhältnisses von Listenphrasemen zum Gesamtwort­schatz der Lehrwerke macht deutlich, dass Phraseme völlig unzureichend be­rücksichtigt werden und die Lehrwerke damit weit davon entfernt sind, der sprachlichen Wirklichkeit gerecht zu werden:

Abb: 2: Phraseme in Lehrwerken
2.2.2.3 Phraseme in Wörterlisten und Wörterbüchern

In der Fremdsprachendidaktik ist schon vor geraumer Zeit die Relevanz von fre­quenzbasierten Wortlisten für das Fremdsprachenlehren und -lernen erkannt worden. Eines der prominentesten Beispiele ist das français fondamental (Ministère de l’Éducation nationale 1954, Gougenheim et al. 1964), das auf der Grundlage mündlicher Daten die am häufigsten verwendeten und somit für den Fremdsprachenlerner nützlichsten Wörter des Französischen ermittelte. Das Bestreben, den für die Lerner relevanten Wortschatz zusammenzustellen, liegt auch dem Gemeinsamen europäischen Referenzrahmen und vor allem den référentiels zugrunde, die den Wortschatz auflisten, dessen Beherrschung den verschiedenen Niveaustufen des GeR entspricht (z. B. Beacco et al. 2004). Eine Untersuchung der von Beacco u.a. (2004) erstellten Wortschatzliste für das Niveau B2 hat gezeigt, dass neben Einzelwörtern immerhin 2500 Mehrwort­einheiten berücksichtigt werden, von denen ca. 850 Phraseme, der größere Teil jedoch Komposita sind (Clüver 2015: 28). Problematisch ist jedoch, dass die Phraseme nach der Intuition von Didaktikern und Lehrwerkautoren zusammen­gestellt worden sind, wie die Autoren des référentiel selber einräumen (Beacco et al. 2004: 11-12). Dass die Intuition häufig trügerisch ist und zu Fehleinschät­zungen führt, zeigt sich daran, dass nur 23 % der 500 häufigsten sprech­sprachlichen Phraseme (CRFC) durch den référentiel berücksichtigt worden sind. Als ein kleines Beispiel mögen die Phraseme dienen, die Beacco u.a. (2004: 84) in der Kategorie « exprimer la tristesse, l’abattement de manière in­formelle » zusammengestellt haben: J'ai le moral à zéro, J'ai le cafard, Je suis au bout du rouleau, J'en ai marre, J'en ai ras le bol. Ein Vergleich mit dem CRFC zeigt, dass J'ai le moral à zéro mit 0,2 Vorkommen pro eine Million Wörter vergleichsweise wenig frequent ist und deshalb durch je n'ai / j'ai pas (trop) le moral (1,1 pro Million) ersetzt werden sollte. Ebenfalls wenig ge­bräuchlich ist j'ai le cafard, während sich für ça me fout, ça me donne le cafard zahlreiche Belege finden. Darüber hinaus sollten in Wortlisten nicht nur gängige Ausdrücke, sondern auch deren Valenzmuster berücksichtigt werden. So ist zwar lobenswert, dass der référentiel den Ausdruck j’en ai marre (Beacco et al. 2004: 84) aufnimmt, jedoch fehlen folgende Angaben zu Satzbauplänen: [en] avoir marre de qqc / de faire qqc / que + Subj. (j'en ai marre de cette télé qui te bouffe la tête / de vivre au Soudan / qu'on me prenne pour un fanatique). Doch nicht nur Lehr- und Lernmaterialien weisen bei der Berücksichtigung von Phrasemen erstaunliche Defizite auf. Ein Vergleich der Frequenzlisten mit einschlägigen Wörterbüchern des Französischen wie dem Trésor de la Langue française und dem Petit Robert zeigt, dass eine Reihe von gängigen Phrase­men aufgrund noch laufender Grammatikalisierungs- bzw. Lexikalisierungspro­zesse lexikographisch bislang nicht erfasst sind, z. B. sachant que, dans ma / sa tête, plus encore.


2.2.2.4 Phraseme vs. 'multifunktionale Einheiten'

Eine genauere Analyse ausgewählter Phraseme hat gezeigt, dass zwei Kate­gorien von Mehrworteinheiten zu unterscheiden sind: a) Phraseme im eigent­lichen Sinne (plus encore, tout au plus, pour le coup, après que, au moins) und b) multifunktionale Einheiten, die in komplexeren Kollokationssequenzen oder in diskontinuierlichen kollokativen Sequenzen auftreten (« collocational frame­works », Renouf et Sinclair 1991): sur le dos, ‘V / N + en commun, avoir pour + GN + de, dans + pronom possessif + tête. So tritt beispielsweise das schrift­sprachlich häufigste Phrasem de plus in längeren Phrasemkompositionen wie de plus en plus, une fois de plus, rien de plus simple auf, wodurch sich u.a. dessen hohe Frequenz erklärt. Ein weiteres Beispiel für eine multifunktionale Einheit ist dans ma tête, das je nach lexiko-syntaktischer Umgebung über zwei Grundbedeutungen verfügt:
  1. mentaler Zustand: Adjectif / verbe / nom [état cognitif positif / négatif] + dans ma tête: clair/tranquille / chambouler / paniquer / le bordel/le brouillon + dans ma tête.
  2. Vorstellung: Nom + verbe de [mouvement] + dans ma tête: idée / pensée/image + tourner / circuler / défiler / trotter + dans ma tête.
  3. Neben diesen lexiko-syntaktischen Konstruktionen gibt es feste Aus­drücke mit dans ma tête, die sich auf das intellektuelle Verstehen bezie­hen: faire tilt / déclic / clash dans la tête de qn (Je ne sais pas, quelque chose a fait tilt dans ma tête (Theaterstücke).
Die hier vorgestellten Untersuchungen zu Phrasemen sollen exemplarisch ver­anschaulichen, dass das CRFC die Weiterentwicklung der Wortschatzdidaktik in mehrerlei Hinsicht fördern kann; dies betrifft:
  1. Die Erstellung von themen- und genrespezifischen Phrasemlisten;
  2. Die Ermittlung prototypischer lexiko-syntaktischer und pragmatischer Umgebungen, in denen die multifunktionalen Einheiten auftreten;
  3. Die Kontextualisierung und Illustration von Phrasemen durch authent­ische Beispiele aus dem Korpus;
  4. Die Auffüllung von phraseologischen Lücken in Wörterbüchern und die lexiko-syntaktische Ausdifferenzierung der Darstellung bereits berück­sichtigter Phraseme.

3 Schlussbemerkung


Die Darstellung der bisherigen Forschungsergebnisse sollte deutlich gemacht haben, dass ein ausgewogenes Referenzkorpus wie das CRFC eine solide Grundlage für die Erforschung des Gegenwartsfranzösischen bietet. Mithilfe des Korpus besteht die Möglichkeit neue Forschungsgebiete zu erschließen und offene Forschungsfragen zu bearbeiten, deren Beantwortung bisher nicht möglich war. So können im Bereich der Lexikologie und (Lerner-)Lexikographie z. B. spezifische Phänomene des gesprochenen Französisch systematisch be­schrieben und analysiert, Wörterbücher ergänzt und ausdifferenziert sowie fre­quenzbasierte Lernwortschätze entwickelt werden.

Auf dem Gebiet der (Lerner-)Grammatik können mithilfe des korpuslinguisti­schen Zugriffs auf die tatsächliche Sprachverwendung zahlreiche neue Erkennt­nisse gewonnen werden, die der reinen Intuition von Grammatikern oder Lehr­werkautoren nicht zugänglich sind. Dabei ist es insbesondere die lexikogram­matische Methodik, die eine andere Sicht auf grammatische Phänomene eröffnet und zugleich die Konzeption gänzlich neuer Typen von (Lerner) Gram­matiken sinnvoll und notwendig erscheinen lässt. So sind die hier exemplarisch präsentierten Ergebnisse Bestandteil der in der Entwicklung befindlichen mehr­bändigen wissenschaftlichen Grammaire du français parlé et écrit, auf der wiederum zwei Lernergrammatiken (Revisions- und Studien­grammatik) fußen sollen. Auf diese Weise soll sowohl in wissenschaftlicher Hinsicht als auch für didaktische Zwecke ein umfassendes und zuverlässiges Bild des Gegenwartsf­ranzösischen entstehen.



Bibliographie
Beacco, Jean-Claude, Simon Bouquet & Rémy Porquier (2004). Niveau B2 pour le Français (utilisateur, apprenant indépendant) – un référentiel. Paris: Didier.
Bürgel, Christoph (2006). Verallgemeinerungen in Sprache und Texten. Generali­sierung, Globalisierung, Konzeptualisierung im Französischen. Frankfurt / M. [u.a].: Lang.
Burger, Harald (1998). Phraseologie: eine Einführung am Beispiel des Deutschen. Ber­lin: Schmidt.
Clüver, Tomma (2015). Phraseme im Gemeinsamen europäischen Referenzrahmen auf dem Prüfstand. Bachelorarbeit Universität Osnabrück: unveröffentlicht.
Corbin, Pierre (2005). Des occurrences discursives aux contextualisations dictionnai­riques. Eléments d'une recherche en cours sur l'expression en français d’expé­riences du football. In: Heinz, Michaela (Hrsg.) (2005). L’exemple lexico­graphique dans les dictionnaires français contemporains. Tübingen: Niemeyer, 343-356.
Debaisieux, Jeanne-Marie (2010). Corpus Oraux – Problèmes méthodologiques de re­cueil et d’analyse de données. Nancy: Presses Universitaires de Nancy.
Deulofeu, Henri-José & Jeanne-Marie Debaisieux (2012). Une tâche à accomplir pour la linguistique française du XXIe siècle élaborer une grammaire des usages du français. In: Langue française 176 (2012) 4, 27-46.
Haarmann, Sophia Marie (2015). Zur Repräsentation von Phrasemen in deutschen Lehrwerken des Französischen. Bachelorarbeit Universität Osnabrück: unveröf­fentlicht.
Hernandez, Patricia (2008). La décoloration de la préposition sur: Une explication en termes d’intégration conceptuelle. In: Linguistique, Formes symboliques, n°2008. (http://formes-symboliques.org/spip.php?article261; letzter Zugriff am 13.10.2016)
Gadet, Françoise et al. (2012). CIEL_F: choix épistémologiques et réalisations empi­ri­ques d’un grand corpus de français parlé. In: Revue Française de Linguistique Appliquée, 17 (2012) 1, 39-54.
Gougenheim, Georges, René Michéa, Paul Rivenc & Aurélien Sauvageot (1956). L’Elaboration du Français élementaire. Paris: Didier.
Kennedy, Graeme (1998). An Introduction to Corpus Linguistics. Harlow: Longman.
Levshina, Natalia. (à paraître) Subtitles as a Corpus: An n-gram approach. À paraître dans Corpora. (http://www.natalialevshina.com/articles/LevshinaSubtitlesAsCorpus .pdf.; letzter Zugriff am 13.10.2016)
Martinez, Ron & Norbert Schmitt (2012). A Phrasal Expression List. In: Applied Lin­guistics 33 (2012) 3, Oxford University Press, 299-320.
Meißner, Franz-Joseph (2006). Linguistische und didaktische Überlegungen zur Ent­wicklung von Kompetenzaufgaben im Lernbereich Mündlichkeit (Schwerpunkt Hörverstehen). In: französisch heute 37 (2006) 3, 240-282.
Quaglio, Paulo (2009). Television dialogue: the sitcom Friends vs. natural conver­sa­tion. Amsterdam: Benjamins.
Renouf, Antoinette & John McHardy Sinclair (1991). Collocational Frameworks in Eng­lish. In: Ajimer, Karin & Bengt Altenberg (Hrsg.) (2014). English Corpus Linguistics. Cambridge: Cambridge University Press, 128-143.
Siepmann, Dirk & Christoph Bürgel (2015). L’élaboration d’une grammaire pédago­gique à partir de corpus: l’exemple du subjonctif. In: Tinnefeld, Thomas (Hrsg.). Grammatikographie und Didaktische Grammatik – gestern, heute, morgen. Saarbrücker Schriften zur Linguistik und Fremdsprachendidaktik (SSLF). Saar­brücken: htw saar.
Siepmann, Dirk & Christoph Bürgel (erscheint). Les unités phraséologiques fondamen­tales du français contemporain. In: Kauffer, Maurice & Yves Keromnes (Hrsg.). Approches théoriques et empiriques en phraséologie. Stauffenberg: Tübin­gen.
Siepmann, Dirk & Christoph Bürgel (2016). Das Corpus de référence du français contemporain und sein Einsatz in der Grammatikographie am Beispiel des Präpo­sitionsgebrauchs. In: Bürgel, Christoph & Dirk Siepmann (Hrsg.). Sprach­wissen­schaft und Fremdsprachendidaktik: Zum Verhältnis von sprachlichen Mitteln und Kompetenzentwicklung. Baltmannsweiler: Schneider.
Siepmann, Dirk, Christoph Bürgel & Sascha Diwersy (2015). The Corpus de réfé­rence du français contemporain (CRFC) as the first genre-diverse mega-corpus of French. In: International Journal of Lexicography,1-22 (doi: 10. 1093/ijl/ecv043).