Object

Title: Od rozmowy do korpusu Czyli jak zbierać i archiwizować dane mówione

PLMET:

click here to follow the link

Title:

Od rozmowy do korpusu Czyli jak zbierać i archiwizować dane mówione

Creator:

Zaśko-Zielińska, Monika   Majewska-Tworek, Anna   Śleziak, Marta   Tworek, Artur

ORCID:

0000-0001-6333-660X   0000-0003-3997-5991   0000-0001-8561-4383   0000-0002-0980-174X

Subject and Keywords:

Sprache   geschrochenes Polnisch   Transkription   Vermerken   Gerontolinguistik   Metadanen   Wissenschaftethik   Archivieren  
speech   spoken Polish   transcription   annotation   gerontolinguistic   biografical interview   metadata   research ethics   archiving  
mowa   polszczyzna mówiona   transkrypcja   anotacja   gerontolingwistyka   wywiad biograficzny   metadane   etyka badań naukowych   archiwizacja

Abstract:

Die Monographie Vom Gespräch bis zum Textkorpus, also wie man die gesprochenen Textdaten sammeln und archivieren sollte setzt sich die Analyse des gesprochenen Polnisch zum Ziel. Die Autoren machen darauf aufmerksam, wie wichtig, aus wissenschaftlicher Perspektive, das empirische Material der gesprochenen Texte ist, sowie die Rolle, die es in Wörterbüchern und Text korpora der polnischen Sprache spielt. Untersucht wurden sowohl die gedruckten Ausgaben, als auch die modernen Internetsuchmaschinen sowie andere Internetresourcen. Die Autoren präsentieren die Methoden der Datenerfassung von gesprochenen Texten und gehen die ethischen, technischen sowie organisatorischen Fragen von Datenverwendung ein. Des Weite ren wird auf den Prozess der Datensammlung sowie die diesbezüglichen Erfahrungen der beiden Forschungsstellen an der Breslauer Universität – Forschungsstelle für gesprochenes Polnisch und Forschungsstelle für Phonetik – hingewiesen. 94 In der vorliegenden Monographie werden zwei in Folge der Zusammenarbeit mit dem CLA RIN-PL-Konsortium entwickelte Projekte ausführlich geschildert: Wiedergewinn und Archivieren der gesprochenen polnischen Stadtsprache (das Material stammt aus den 90er Jahren des 20. Jhs.) sowie die Ausführung der ersten Etappe eines Großprojekts Sprachliche Biographien der Niederschlesier – die älteste Generation (Ausfertigung der Aufnahmen und Transkripte von biographischen Interviews mit ältesten Bewohnern Niederschlesiens und des Oppelner Landes). Das Ergebnis der beiden Projekte ist die Bearbeitung der Dokumentation für die weiteren Unter suchungen. Die erarbeiteten Muster von Texten befinden sich im Anhang der Monographie: Brief an Probanden, Gesprächszenario, Metadatenbogen, Situationsbeschreibungsbogen, Text zum Vorlesen und die Danksagung. Die Autoren adaptierten bibliographisches Datenformat Dublin Core und pass ten diesen an die Erfordernisse des biografischen Interviews an  

The book From the Conversation to the Corpus, or How to Collect and Archive Spoken Language Data examines research on the spoken variant of Polish. The authors draw attention to the value of spoken language data and the role it plays in general dictionaries and in Polish language corpora, taking into account traditional publications as well as modern search engines and Internet databases. The authors present multi-faceted Laboratory and the Phonetics Laboratory at the University of Wrocław. The publication describes at length two projects that have been developed in cooperation with the CLARIN-PL consortium: the recovery and archiving of spoken language data obtained as part of re search on the variants of spoken Polish used in cities (with the data that was collected in the 1990s), as well as the implementation of the first stage of the large project “Language Biographies of Lower Silesia – the oldest generation,” whose aim was to record and transcribe biographical interviews with the oldest inhabitants of Lower Silesia and the Opole region. A measurable effect of both projects has been the development of documentation that can be used in similar types of research. In the book’s appendix, the reader may find templates of useful documentation, which include a letter to the data provider, a conversation script, a metadata card, a description of the interview setting card, a text to be read by the data provider, and a thank-you note. The authors also adapted the Dublin Core metadata schema, adjusting it to the needs of data acquisition procedures that apply the method of the biographical interview.  

Książka „Od rozmowy do korpusu”, czyli jak zbierać i archiwizować dane mówione podejmuje proble matykę badań nad polszczyzną mówioną. Autorzy zwracają uwagę na to, jak cenne są dane mówione oraz jaką rolę odgrywają one w słownikach ogólnych i korpusach języka polskiego – biorąc pod uwagę zarówno wydawnictwa tradycyjne, jak i nowoczesne wyszukiwarki i bazy internetowe. Wieloaspektowo przedstawiają metody pozyskiwania danych mówionych, a także poruszają zagadnienia związane z etyką badań wykorzystujących nagrania, kwestiami technicznymi i organizacyjnymi. Autorzy szczegółowo opisują proces gromadzenia danych mówionych i doświadczenia, jakie w tym obszarze mają dwie pracownie działające na Uniwersytecie Wrocławskim: Pracownia Polszczyzny Mówionej oraz Pracownia Fonetyki. W publikacji szczegółowo opisane są dwa projekty, które powstały we współpracy z konsorcjum CLARIN-PL: odzyskiwanie i archiwizacja materiału mówionego pozyskanego w ramach badań nad polszczyzną mówioną miast (materiał pochodził z lat 90. XX wieku), a także realizacja pierwszego etapu dużego projektu Biografie językowe Dolnoślązaków – pokolenie najstarsze, którego celem było nagranie i przetranskrybowanie wywiadów biograficznych z najstarszymi mieszkańcami Dolnego Śląska i Opolszczyzny. Wymiernym efektem obu projektów było opracowanie dokumentacji na potrzeby badań podobnego typu. Wypracowane wzory koniecznych dokumentów zostały dołączone do publikacji – w Aneksie książki znajdują się: List do nagrywanych, Scenariusz rozmowy, Karta metadanych, Karta opisu sytuacji, Tekst do przeczytania, Podziękowanie. Autorzy zaadaptowali również schemat opisu metadanych Dublin Core i dostosowali go do potrzeb pozyskiwania danych metodą wywiadu biograficznego

Table of contents:

Spis treści 1. Wstęp . 5 2. Dane mówione są cenne 7 2.1. Czy pismem można utrwalić mowę?. 7 2.2. Nagranie – wyzwanie techniczne. . 8 2.3. Naturalność a udział badacza w rozmowie. . 8 2.4. Dane mówione w słownikach ogólnych i korpusach narodowych. . 9 2.4.1. Wymowa w słownikach. . .11 2.4.2. Dane mówione w korpusach. . . 13 2.4.2.1. Subkorpus mówiony w ramach Narodowego Korpusu Języka Polskiego. . 13 2.4.2.2. Korpusy języka mówionego dla polszczyzny. .. . 13 2.4.2.2.1. Korpus Mowy Wielkopolskiej (The Greater Poland Speech Corpus). . . . 14 2.4.2.2.2. Korpus Języka Mówionego Mieszkańców Spisza. . . . . . . . . . 14 2.5. Dane mówione – zbiory nagrań. . . .. . . . . 14 2.6. Projektowanie korpusu mówionego. .. . . 15 3. Nasz wkład w zbieranie i badanie danych mówionych . . . . . . . 17 3.1. Gromadzenie danych mówionych. . . . . 17 3.1.1. Projekt Mowa_Wrocław – krótka charakterystyka odzyskanego materiału. . . . 18 3.1.2. Biografie językowe Dolnoślązaków – pokolenie najstarsze. . . . . . . . . . . . . 20 3.1.3. Podsumowanie. . . . . 23 3.2. Badanie polszczyzny mówionej w Pracowni Polszczyzny Mówionej i Pracowni Fonetyki . . . . . . 23 3.2.1. Niepłynność mówienia w oficjalnej odmianie polszczyzny . . . . . 24 3.2.2. Oralność i piśmienność w listach pożegnalnych zgromadzonych w Polskim Korpusie Listów Pożegnalnych. . . . . . . . 25 3.2.3. Stylizacja na odmianę mówioną języka . . . . . . . . . . . . . . . . . . . 27 3.2.4. Krajobraz językowy . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29 3.2.5. Badanie funkcji wyrazów no, właśnie, jakby w oficjalnych i nieoficjalnych wypowiedziach mówionych na tle opisu leksykograficznego . . . 40 3.2.6. Badanie mowy późnej dorosłości – plan projektu . . Od kwestionariusza do wywiadu biograficznego. O metodach zbierania danych mówionych na potrzeby badań lingwistycznych . . . . . . 43 4.1. Przemiany i rozwój zbierania danych mówionych w dialektologii. . . . . . 43 4.2. Dyskusja metodologiczna w badaniach nad polszczyzną mówioną miast. . . . . . 46 4.3. Wywiad biograficzny jako sposób pozyskiwania danych mówionych. . . . . . . . . . . . . . . . . . . . . . . 48 5. Nagrywanie – wskazówki techniczne i organizacyjne . . . . . . . . . . 51 5.1. Wskazówki organizacyjne. . . . . . . . . . 1 5.2. Wskazówki techniczne. . . . 3 6. Problemy etyczne w badaniach prowadzonych metodą wywiadu biograficznego............... 57 6.1. Dobrowolność, świadoma zgoda. . . 57 6.2. Anonimowość. . . . 58 6.3. Szacunek, prawo do niekrzywdzenia. . . . Nasze materiały do pozyskiwania danych mówionych . . . . . . . . 61 7.1. List . . . . . 61 7.2. Scenariusz rozmowy. . . 62 7.3. Tekst do przeczytania . . . .63 7.4. Karta metadanych. . .. . 67 7.4.1. Metadane w tworzeniu korpusu tekstów mówionych. . . 67 4.2 Metadane rozmowy. . . . . . 67 7.4.3. Metadane mówcy. . . 71 7.4.4. Zbieranie metadanych. . . . 71 7.4.5. Znaczenie metadanych w opisie biografii językowej . . 71 7.5. Karta opisu sytuacji . . . 73 7.5.1. Sytuacja w wywiadzie biograficznym. . . 74 7.5.2. Karta opisu sytuacji w perspektywie analiz interakcji. . . 74 7.5.3. Czas. . . . . . . 75 7.5.3.1. Czas trwania rozmowy .5 7.5.3.2. Usytuowanie rozmowy w czasie. . . . . 75 7.5.4. Miejsce. . . . . 76 7.5.5. Tło dźwiękowe. . . . 76 7.5.6. Audytorium. . .. 77 7.5.7. Relacja nadawczo‑odbiorcza. . .. 77 7.5.8. Karta opisu sytuacji w kontekście badań projektowych. . 78 7.6. Zgoda. . . 79 7.7. Podziękowanie . 79 8. Przechowywanie danych i metadanych. Archiwizacja (zasilanie dużych zbiorów). Dzielenie się danymi . . 81 8.1. Zasady archiwizowania. . . 81 8.2. Udostępnianie danych mówionych. . .. . 82 9. Zakończenie . . 83 Bibliografia .. . . . 85 .Streszczenie/Zusammenfassung/Summary . 93 ANEKS I Wzory dokumentów Pracowni Polszczyzny Mówionej .. 95 ANEKS II Metadane z projektu Biografie językowe Dolnoślązaków – pokolenie najstarsze. 107

Place of publishing:

Wrocław

Publisher:

Quaestio

Date issued:

2020

Resource Type:

tekst

Detailed Type:

dokument elektroniczny

Identifier:

oai:repozytorium.uni.wroc.pl:135808

Access rights:

The use of this material is allowed only with accordance of applicable rules of fair use or other exceptions provided by law, and any broader use requires the permission of the authorized entity  
Korzystanie z tego materiału jest możliwe zgodnie z właściwymi przepisami o dozwolonym użytku lub innych wyjątkach przewidzianych w przepisach prawa, a korzystanie w szerszym zakresie wymaga uzyskania zgody uprawnionego

License:

Making materials available on the basis of the agreement with the owner of the property copyrights  
Udostępnianie na podstawie umowy z właścicielem majątkowych praw autorskich

Rights holder:

Copyright by Uniwersytet Wrocławski, Quaestio and Authors

Autor opisu:

KM

Object collections:

Last modified:

Dec 2, 2022

In our library since:

Dec 1, 2022

Number of object content hits:

37

Number of object content views in PDF format

41

All available object's versions:

https://repozytorium.uni.wroc.pl/publication/145127

Show description in RDF format:

RDF

Show description in OAI-PMH format:

OAI-PMH (DC)

OAI-PMH (METS)

This page uses 'cookies'. More information