Laboratorium Przetwarzania Mowy

Page 1


Laboratorium Przetwarzania Mowy

Laboratorium Przetwarzania Mowy jest jednostką Wydziału Humanistycznego Uniwersytetu Śląskiego. Specjalizuje się z w analizie akustycznej nagrań mowy, analizie sposobu mówienia oraz obróbce akustycznej nagrań mowy.

Szczególnym obszarem zainteresowań personelu laboratorium jest akustyka detektywistyczna. Wieloletnia praca naukowa związana z artykulacją, percepcją, przetwarzaniem oraz rejestrowaniem mowy pozwala na wykonywanie zleceń w tym zakresie na najwyższym poziomie. W pracy detektywistycznej wiele materiałów dźwiękowych pozyskiwanych jest w warunkach nieoptymalnych (szum silnika samochodu, inne źródła dźwięku, niskie natężenie sygnału), co utrudnia poprawną analizę pozyskanego materiału. Zadaniem w takich przypadkach jest zwiększyć skuteczność pracy detektywistycznej poprzez kompleksowe usługi w zakresie modyfikacji i analizy materiałów dźwiękowych.

Aparatura badawcza Laboratorium zawiera wszystkie elementy niezbędne do prowadzenia swojej działalności na najwyższym poziomie:

– Oprogramowanie Cubase Pro 9.5 – oprogramowanie do analizy mowy oparte na otwartym kodzie Praat

– Przedwzmacniacze: Yamaha Steinberg UR44, USBPre2 (Sound Devices)

– Mikrofony: Shure SM7B, Shure PGA27-LC, Shure Beta 53, Shure BLX14E/W85, Sennheiser HMD26

– Monitory odsłuchowe: Yamaha HS5

Nad działalnością laboratorium czuwa wysoko wykwalifikowana kadra naukowa językoznawców i informatyków. Posiada ona szerokie doświadczenie w obszarze przetwarzania i analizy akustycznej mowy, zarówno w języku ojczystym jak i językach obcych.

Oprócz tego, personel laboratorium specjalizuje się także w: – rejestracji i percepcji mowy, – analizie fonetycznej języka mówionego – komputerowym przetwarzaniu mowy, – psycholingwistycznych podstawach artykulacji i percepcji mowy, – syntezie i resyntezie mowy, – automatycznym rozpoznawaniu mowy z cech audytywnych i wizualnych

Działalność laboratorium – laboratorium realizuje i realizowało badania naukowe związane z analizą mowy finansowane w poniższych projektach badawczych:

Wykonawca (lider) projektu

Projekty prowadzone obecnie:

1. Imitacja fonetyczna w języku ojczystym i języku obcym. Badania finansowane przez Narodowe Centrum Nauki w programie OPUS (2019/35/B/HS2/02767)

Projekty zakończone:

2. Cechy akustyczne polskich geminat spółgłoskowych. Badania finansowane przez Narodowe Centrum Nauki w programie OPUS (2017/25/B/HS2/02548)

3. Praktyczny kurs wymowy angielskiej dla Polaków. Badania finansowane przez Komitet Badań Naukowych (0576/B/H03/2010/38)

Wykonawca projektu:

4. Sandhi w wymowie języka drugiego. Badania finansowane przez Narodowe Centrum Nauki w programie OPUS (2012/05/B/HS2/04036)

5. ALOFON Methodology and technology for the polymodal allophonic speech transcription. Badania finansowane przez Narodowe Centrum Nauki w programie OPUS (2015/05/B/ST7/02151)

6. Consonant synchronicity in Polish and English Badania finansowane przez Narodowe Centrum Nauki w programie OPUS (2018/29/B/HS2/00088)

W Laboratorium Przetwarzania Mowy możliwe jest prowadzenie działalności usługowej jak także badawczo-rozwojowej realizowanej zarówno na zlecenie podmiotów prywatnych (przedsiębiorców), jak i publicznych (jednostki badawcze, policja, sądy, prokuratura) w zakresie:

1. Modyfikacji akustycznej pozyskanego materiału w formie odszumiania i zwiększania klarowności zarejestrowanej mowy. Wykorzystujemy autorskie metody oparte na algorytmicznej preemfazie formantowej charakterystyki mowy.

2. Przygotowanie całościowej transkrypcji zebranego materiału. Kompleksowa usługa polegająca na przygotowaniu akustycznym materiału dźwiękowego i wykonaniu transkrypcji. W ramach usługi zawarta jest powtórna analiza słów lub fraz, które są szczególnie ważne ze względów detektywistycznych. Wykorzystujemy technikę wielokrotnego mikroodsłuchu, która polega na wielokrotnym odsłuchu mikrofragmentów słów.

3. Wykrywanie modyfikacji nagrania poprzez usuwanie kluczowych słów lub fraz. W naszej pracy analizujemy również pozyskany materiał pod kątem wiarygodności zarejestrowanych wypowiedzi. Klienci, którzy słyszą się na nagraniu, mogą twierdzić, że ich wypowiedzi zostały zmienione przez stronę, która pozyskała nagrania. Naszym zadaniem jest detekcja potencjalnych manipulacji w nagraniu.

Turn static files into dynamic content formats.

Create a flipbook
Issuu converts static files into: digital portfolios, online yearbooks, online catalogs, digital photo albums and more. Sign up and create your flipbook.