Od rozmowy do korpusu Czyli jak zbierać i archiwizować dane mówione
Zaśko-Zielińska, Monika
Majewska-Tworek, Anna
Śleziak, Marta
Tworek, Artur
0000-0001-6333-660X
0000-0003-3997-5991
0000-0001-8561-4383
0000-0002-0980-174X
Sprache
geschrochenes Polnisch
Transkription
Vermerken
Gerontolinguistik
Metadanen
Wissenschaftethik
Archivieren
speech
spoken Polish
transcription
annotation
gerontolinguistic
biografical interview
metadata
research ethics
archiving
mowa
polszczyzna mówiona
transkrypcja
anotacja
gerontolingwistyka
wywiad biograficzny
metadane
etyka badań naukowych
archiwizacja
Die Monographie Vom Gespräch bis zum Textkorpus, also wie man die gesprochenen Textdaten sammeln und archivieren sollte setzt sich die Analyse des gesprochenen Polnisch zum Ziel. Die Autoren machen darauf aufmerksam, wie wichtig, aus wissenschaftlicher Perspektive, das empirische Material der gesprochenen Texte ist, sowie die Rolle, die es in Wörterbüchern und Text korpora der polnischen Sprache spielt. Untersucht wurden sowohl die gedruckten Ausgaben, als auch die modernen Internetsuchmaschinen sowie andere Internetresourcen. Die Autoren präsentieren die Methoden der Datenerfassung von gesprochenen Texten und gehen die ethischen, technischen sowie organisatorischen Fragen von Datenverwendung ein. Des Weite ren wird auf den Prozess der Datensammlung sowie die diesbezüglichen Erfahrungen der beiden Forschungsstellen an der Breslauer Universität – Forschungsstelle für gesprochenes Polnisch und Forschungsstelle für Phonetik – hingewiesen. 94 In der vorliegenden Monographie werden zwei in Folge der Zusammenarbeit mit dem CLA RIN-PL-Konsortium entwickelte Projekte ausführlich geschildert: Wiedergewinn und Archivieren der gesprochenen polnischen Stadtsprache (das Material stammt aus den 90er Jahren des 20. Jhs.) sowie die Ausführung der ersten Etappe eines Großprojekts Sprachliche Biographien der Niederschlesier – die älteste Generation (Ausfertigung der Aufnahmen und Transkripte von biographischen Interviews mit ältesten Bewohnern Niederschlesiens und des Oppelner Landes). Das Ergebnis der beiden Projekte ist die Bearbeitung der Dokumentation für die weiteren Unter suchungen. Die erarbeiteten Muster von Texten befinden sich im Anhang der Monographie: Brief an Probanden, Gesprächszenario, Metadatenbogen, Situationsbeschreibungsbogen, Text zum Vorlesen und die Danksagung. Die Autoren adaptierten bibliographisches Datenformat Dublin Core und pass ten diesen an die Erfordernisse des biografischen Interviews an
The book From the Conversation to the Corpus, or How to Collect and Archive Spoken Language Data examines research on the spoken variant of Polish. The authors draw attention to the value of spoken language data and the role it plays in general dictionaries and in Polish language corpora, taking into account traditional publications as well as modern search engines and Internet databases. The authors present multi-faceted Laboratory and the Phonetics Laboratory at the University of Wrocław. The publication describes at length two projects that have been developed in cooperation with the CLARIN-PL consortium: the recovery and archiving of spoken language data obtained as part of re search on the variants of spoken Polish used in cities (with the data that was collected in the 1990s), as well as the implementation of the first stage of the large project “Language Biographies of Lower Silesia – the oldest generation,” whose aim was to record and transcribe biographical interviews with the oldest inhabitants of Lower Silesia and the Opole region. A measurable effect of both projects has been the development of documentation that can be used in similar types of research. In the book’s appendix, the reader may find templates of useful documentation, which include a letter to the data provider, a conversation script, a metadata card, a description of the interview setting card, a text to be read by the data provider, and a thank-you note. The authors also adapted the Dublin Core metadata schema, adjusting it to the needs of data acquisition procedures that apply the method of the biographical interview.
Książka „Od rozmowy do korpusu”, czyli jak zbierać i archiwizować dane mówione podejmuje proble matykę badań nad polszczyzną mówioną. Autorzy zwracają uwagę na to, jak cenne są dane mówione oraz jaką rolę odgrywają one w słownikach ogólnych i korpusach języka polskiego – biorąc pod uwagę zarówno wydawnictwa tradycyjne, jak i nowoczesne wyszukiwarki i bazy internetowe. Wieloaspektowo przedstawiają metody pozyskiwania danych mówionych, a także poruszają zagadnienia związane z etyką badań wykorzystujących nagrania, kwestiami technicznymi i organizacyjnymi. Autorzy szczegółowo opisują proces gromadzenia danych mówionych i doświadczenia, jakie w tym obszarze mają dwie pracownie działające na Uniwersytecie Wrocławskim: Pracownia Polszczyzny Mówionej oraz Pracownia Fonetyki. W publikacji szczegółowo opisane są dwa projekty, które powstały we współpracy z konsorcjum CLARIN-PL: odzyskiwanie i archiwizacja materiału mówionego pozyskanego w ramach badań nad polszczyzną mówioną miast (materiał pochodził z lat 90. XX wieku), a także realizacja pierwszego etapu dużego projektu Biografie językowe Dolnoślązaków – pokolenie najstarsze, którego celem było nagranie i przetranskrybowanie wywiadów biograficznych z najstarszymi mieszkańcami Dolnego Śląska i Opolszczyzny. Wymiernym efektem obu projektów było opracowanie dokumentacji na potrzeby badań podobnego typu. Wypracowane wzory koniecznych dokumentów zostały dołączone do publikacji – w Aneksie książki znajdują się: List do nagrywanych, Scenariusz rozmowy, Karta metadanych, Karta opisu sytuacji, Tekst do przeczytania, Podziękowanie. Autorzy zaadaptowali również schemat opisu metadanych Dublin Core i dostosowali go do potrzeb pozyskiwania danych metodą wywiadu biograficznego
Spis treści 1. Wstęp . 5 2. Dane mówione są cenne 7 2.1. Czy pismem można utrwalić mowę?. 7 2.2. Nagranie – wyzwanie techniczne. . 8 2.3. Naturalność a udział badacza w rozmowie. . 8 2.4. Dane mówione w słownikach ogólnych i korpusach narodowych. . 9 2.4.1. Wymowa w słownikach. . .11 2.4.2. Dane mówione w korpusach. . . 13 2.4.2.1. Subkorpus mówiony w ramach Narodowego Korpusu Języka Polskiego. . 13 2.4.2.2. Korpusy języka mówionego dla polszczyzny. .. . 13 2.4.2.2.1. Korpus Mowy Wielkopolskiej (The Greater Poland Speech Corpus). . . . 14 2.4.2.2.2. Korpus Języka Mówionego Mieszkańców Spisza. . . . . . . . . . 14 2.5. Dane mówione – zbiory nagrań. . . .. . . . . 14 2.6. Projektowanie korpusu mówionego. .. . . 15 3. Nasz wkład w zbieranie i badanie danych mówionych . . . . . . . 17 3.1. Gromadzenie danych mówionych. . . . . 17 3.1.1. Projekt Mowa_Wrocław – krótka charakterystyka odzyskanego materiału. . . . 18 3.1.2. Biografie językowe Dolnoślązaków – pokolenie najstarsze. . . . . . . . . . . . . 20 3.1.3. Podsumowanie. . . . . 23 3.2. Badanie polszczyzny mówionej w Pracowni Polszczyzny Mówionej i Pracowni Fonetyki . . . . . . 23 3.2.1. Niepłynność mówienia w oficjalnej odmianie polszczyzny . . . . . 24 3.2.2. Oralność i piśmienność w listach pożegnalnych zgromadzonych w Polskim Korpusie Listów Pożegnalnych. . . . . . . . 25 3.2.3. Stylizacja na odmianę mówioną języka . . . . . . . . . . . . . . . . . . . 27 3.2.4. Krajobraz językowy . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29 3.2.5. Badanie funkcji wyrazów no, właśnie, jakby w oficjalnych i nieoficjalnych wypowiedziach mówionych na tle opisu leksykograficznego . . . 40 3.2.6. Badanie mowy późnej dorosłości – plan projektu . . Od kwestionariusza do wywiadu biograficznego. O metodach zbierania danych mówionych na potrzeby badań lingwistycznych . . . . . . 43 4.1. Przemiany i rozwój zbierania danych mówionych w dialektologii. . . . . . 43 4.2. Dyskusja metodologiczna w badaniach nad polszczyzną mówioną miast. . . . . . 46 4.3. Wywiad biograficzny jako sposób pozyskiwania danych mówionych. . . . . . . . . . . . . . . . . . . . . . . 48 5. Nagrywanie – wskazówki techniczne i organizacyjne . . . . . . . . . . 51 5.1. Wskazówki organizacyjne. . . . . . . . . . 1 5.2. Wskazówki techniczne. . . . 3 6. Problemy etyczne w badaniach prowadzonych metodą wywiadu biograficznego............... 57 6.1. Dobrowolność, świadoma zgoda. . . 57 6.2. Anonimowość. . . . 58 6.3. Szacunek, prawo do niekrzywdzenia. . . . Nasze materiały do pozyskiwania danych mówionych . . . . . . . . 61 7.1. List . . . . . 61 7.2. Scenariusz rozmowy. . . 62 7.3. Tekst do przeczytania . . . .63 7.4. Karta metadanych. . .. . 67 7.4.1. Metadane w tworzeniu korpusu tekstów mówionych. . . 67 4.2 Metadane rozmowy. . . . . . 67 7.4.3. Metadane mówcy. . . 71 7.4.4. Zbieranie metadanych. . . . 71 7.4.5. Znaczenie metadanych w opisie biografii językowej . . 71 7.5. Karta opisu sytuacji . . . 73 7.5.1. Sytuacja w wywiadzie biograficznym. . . 74 7.5.2. Karta opisu sytuacji w perspektywie analiz interakcji. . . 74 7.5.3. Czas. . . . . . . 75 7.5.3.1. Czas trwania rozmowy .5 7.5.3.2. Usytuowanie rozmowy w czasie. . . . . 75 7.5.4. Miejsce. . . . . 76 7.5.5. Tło dźwiękowe. . . . 76 7.5.6. Audytorium. . .. 77 7.5.7. Relacja nadawczo‑odbiorcza. . .. 77 7.5.8. Karta opisu sytuacji w kontekście badań projektowych. . 78 7.6. Zgoda. . . 79 7.7. Podziękowanie . 79 8. Przechowywanie danych i metadanych. Archiwizacja (zasilanie dużych zbiorów). Dzielenie się danymi . . 81 8.1. Zasady archiwizowania. . . 81 8.2. Udostępnianie danych mówionych. . .. . 82 9. Zakończenie . . 83 Bibliografia .. . . . 85 .Streszczenie/Zusammenfassung/Summary . 93 ANEKS I Wzory dokumentów Pracowni Polszczyzny Mówionej .. 95 ANEKS II Metadane z projektu Biografie językowe Dolnoślązaków – pokolenie najstarsze. 107
oai:repozytorium.uni.wroc.pl:135808
The use of this material is allowed only with accordance of applicable rules of fair use or other exceptions provided by law, and any broader use requires the permission of the authorized entity
Korzystanie z tego materiału jest możliwe zgodnie z właściwymi przepisami o dozwolonym użytku lub innych wyjątkach przewidzianych w przepisach prawa, a korzystanie w szerszym zakresie wymaga uzyskania zgody uprawnionego
Making materials available on the basis of the agreement with the owner of the property copyrights
Udostępnianie na podstawie umowy z właścicielem majątkowych praw autorskich
Copyright by Uniwersytet Wrocławski, Quaestio and Authors
Dec 2, 2022
Dec 1, 2022
37
41
https://repozytorium.uni.wroc.pl/publication/145127
Edition name | Date |
---|---|
Od_rozmowy_do_korpusu_Czyli_jak_zbierać_i_archiwizować_dane_mówione | Dec 2, 2022 |
Uniwersytet Wrocławski. Pracownia Badań Praw Orientalnych Uniwersytet Wrocławski. Katedra Doktryn Politycznych i Prawnych Sadowski, Mirosław (1964- ). Red.
Zaśko-Zielińska, Monika
Leszkowicz-Baczyński, Jerzy