Workshop 4: Sprache? Daten! Forschungswerkstatt zur rechtssicheren Auswertung von Textsammlungen in den Rechts-, Wirtschafts- und Gesellschaftswissenschaften
Zielgruppe: Anfangende
Sprache: Deutsch
Verfügbare Plätze: 12
Seit Jahr(zehnt)en erleben gesellschaftswissenschaftliche Disziplinen eine sprachkritische Wende („linguistic turn“) – also die Bewusstwerdung des lange übersehenen Mediums Sprache und seine Entdeckung als Werkzeug sozialer Macht und als gleichermaßen spannender Forschungsgegenstand. Diese Bewegung hat viele Namen – von „Text as Data“ in der Volkswirtschaftslehre über „Big Data Scholarship“ in der Rechtswissenschaft bis hin zur „Korpuslinguistik“ in den Sprachwissenschaften.
Gemein ist all diesen Ansätzen eine methodische Umorientierung, weg vom „close reading“ einzelner Texte hin zum „distant reading“ großer Textsammlungen und zur Entdeckung übergreifender Muster im kollektiven Gewebe einer jeden Sprache. Beispielsweise könnten Rechtswissenschaftler*innen aus Gerichtsurteilen oder Fachtexten ableiten, wie und warum sich bestimmte Rechtsinstitute oder ganze Rechtsgebiete entwickelt haben; Wirtschaftswissenschaftler*innen könnten Texte aus Presse oder Unternehmensberichterstattung mit Börsenpreisen korrelieren, um die Zusammensetzung von Unternehmenswerten zu errechnen; Sozialwissenschaftler*innen könnten den Sprachgebrauch von Laien und Fachleuten kontrastieren, um textimmanente Diskursdynamiken zu rekonstruieren.
Dieser Methodenwandel birgt zahlreiche neue Herausforderungen, denen die Methodenwerkstatt mit Blick auf verschriftlichte Quellen nachspürt:
- Welches Textmaterial eignet sich dafür? Wie lässt es sich gewinnen und aufbereiten? Welche rechtlichen Vorgaben sind dafür einzuhalten?
- Wie wertet man Textsammlungen gewinnbringend aus?
- Welche neuen Forschungsfragen ermöglicht dieser Zugang?
Diese Fragen berühren unterschiedlichste Themen – von den sog. Digital Humanities und linguistischer Pragmatik über Webscraping und NLP (Natural Language Processing) bis hin zu Urheberrecht, Open Access und neuerdings auch Generativer Künstlicher Intelligenz.
Die Forschungswerkstatt greift diese Themen auf und verbindet allgemeine Einführungsvorträge samt Beispielen aus der Forschungspraxis des Referenten (vormittags) mit interaktiven Übungen zur Anwendung auf die eigene Forschung und Fragen der Teilnehmenden (nachmittags).
Ziel ist eine möglichst konkrete Weiterentwicklung der eigenen Forschungsprojekte mit Blick auf die methodischen Potentiale und rechtlichen Risiken quantitativ-textbasierter Forschung.
Einschlägige Literatur
- Gentzkow/Kelly/Taddy, Text as Data, Journal of Economic Literature 57 (2019), S. 535–574. https://www.doi.org/10.1257/jel.20181020
- Hamann, Evidenz, Empirie und Data Science in der Rechtswissenschaft. Ein „Scoping Review“ zur Taxo¬nomie quantitativer Rechtsforschung, in: Wörner u.a. (Hrsg.), Digitalisierung des Rechts, 2024, S. 41–65. https://doi.org/10.1515/9783111343341-006
- Hamann/Vogel, Die kritische Masse. Aspekte einer quantitativ orientierten Hermeneutik am Beispiel der computergestützten Rechtslinguistik, in: Schweiker u.a. (Hrsg.), Messen und Verstehen in der Wissenschaft. Interdisziplinäre Ansätze, 2017, S. 81–95. https://hanjo.1hamann.de/research/win2017-81.pdf
- Tobia, The Corpus and the Courts, University of Chicago Law Review Online, 2021. https://lawreview.uchicago.edu/online-archive/corpus-and-courts
- Vogel/Bäumer u.a., Die Bedeutung des Adjektivs geschäftsmäßig im juristischen Fach- und massenmedialen Gemeinsprachgebrauch, LeGes: Gesetzgebung & Evaluation 30 (2019), S. 3–20. https://leges.weblaw.ch/dam/jcr:b3f4362b-d8e8-4af7-b2fd-c47bc65b121e
Teilnehmende entwickeln vorab ein Konzept (Forschungsexposé) zur quantitativen Nutzung von Sprachdaten in ihrer eigenen Forschung – entweder innerhalb ihres Promotionsprojekts oder als gesonderte Projektidee. Dieses Konzept entwickeln sie im Rahmen des Workshops weiter. (Ob das Konzept anschließend umgesetzt wird, bleibt den Teilnehmenden überlassen.)
Wenn Sie zur Teilnahme zugelassen sind, schicken Sie bitte bis spätestens 8. September 2025 Ihr Konzept (max. 1 A4-Seite als Word-Dokument) an Hanjo.Hamann@ebs.edu. In dem Konzept:
- reflektieren Sie, wie die Auswertung von Sprachdaten ihre eigene Forschung bereichern könnten.
- reflektieren Sie, welchen Herausforderungen und Risiken Sie sich in der Werkstatt widmen könnten.
- verwerten Sie die Erkenntnisse aus mindestens zwei der fünf Literaturquellen (siehe „Einschlägige Literatur“).
Um Credits für die aktive Teilnahme an diesem Workshop zu erhalten, sind folgende Leistungen zu erbringen (vgl. auch die Informationen zum „Leistungsnachweis“ unter „Anmeldung“):
Teilnehmende entwickeln ein Konzept (Forschungsexposé) zur quantitativen Nutzung von Sprachdaten in ihrer eigenen Forschung – entweder innerhalb ihres Promotionsprojekts oder als gesonderte Projektidee. (Ob das Konzept anschließend umgesetzt wird, bleibt den Teilnehmenden überlassen.)
Dieses Konzept entsteht in vier Phasen:
- Phase 1: Spätestens einen Monat vor Workshop-Beginn muss ein Exposé (max. 1 A4-Seite) vorliegen, in dem Teilnehmende reflektieren, wie die Auswertung von Sprachdaten ihre eigene Forschung bereichern könnten und welchen Herausforderungen und Risiken sie sich in der Werkstatt widmen könnten. Erkenntnisse aus mindestens zwei der fünf Literaturquellen (siehe „einschlägige Literatur“) sollten sich darin widerspiegeln.
- Phase 2–4: Am Ende jedes der ersten drei Tage der Werkstatt überarbeiten Teilnehmende ihr Konzept, um den jeweils in der Werkstatt behandelten Aspekt zu integrieren oder zu überarbeiten/verfeinern.
Im Verlauf des Workshops stellen alle Teilnehmenden ihre Konzepte mindestens einmal vor und erhalten aus der gemeinsamen Diskussion Feedback und neue Impulse dazu.

Hanjo Hamann ist Qualifikationsprofessor für Bürgerliches Recht, Wirtschafts- und Immaterialgüterrecht, insbesondere Recht der Digitalisierung und Rechtslinguistik, an der EBS Universität für Wirtschaft und Recht, Oestrich-Winkel. Er ist promovierter Jurist (Dr. iur.) und promovierter Volkswirt (Dr. rer. pol.) und forscht interdisziplinär zur empirischen Rechtslinguistik und zur Rechtspsychologie. Internationale Lehr- und Forschungsaufenthalte führten ihn nach Florenz, Chengdu, Pretoria sowie an die Universität Stanford, wo er neben einem Master of the Science of Law (JSM) auch das Graduiertenzertifikat für digitale Geisteswissenschaften (GCDH) erwarb.
- Open Access als Rechtsbegriff? Eine Bestandsaufnahme im Urheberrecht und Hochschulrecht, JZ 80 (2025), im Erscheinen.
- Artificial Intelligence and the Law of Machine-Readability. A Review of Human-to-Machine Communication Protocols and their (In)Compatibility with Article 4(3) of the CDSM Directive, JIPITEC 15 (2024), S. 102–121.
- Nutzungsvorbehalte für KI-Training in der Rechtsgeschäftslehre der Maschinenkommunikation: Dogmatische und praktische Schwächen von Art. 4 Abs. 3 DSM-RL und § 44b Abs. 3 UrhG, ZGE 16 (2024), S. 113–168.
- Evidenz, Empirie und Data Science in der Rechtswissenschaft: Ein „Scoping Review“ zur Taxonomie quantitativer Rechtsforschung, in: Wörner/Breuer/Glöckner/Wilhelmi (Hrsg.), Digitalisierung des Rechts, Berlin 2024, S. 41–65.
- Urheberrecht als Ermöglichungsinfrastruktur für Open-Access-Publikationen?, ZUM 66 (2023), S. 410–419.