Na co nōm korpus gŏdki abo kōniec szamanizmu

Niy czujã sie dobrze z tym, coch gŏdoł do 1997 [Sarasola 1997]. Sugerowalimy poprawność i niy doszlimy dō niyj. To używanie je ważne, to znaczy używane słowo. Muszymy budować baskijskõ mŏwã w ciyniu hiszpańskij. Gŏdŏcie, iże jakeś słowo je przeciwko jedności, ale co jak żŏdnego to niy ôbchodzi? Co wtynczŏs zrobicie? Rozpłaczecie sie? Muszymy dojś do jedności, ale ze nojwiyncyj używanymi słowami. Bōł czas, jak my propōnowali ‘krokodilo’ za formã poprawnõ i wszyjscy sie zgodziyli. Ale dzisiej take podejście niy funguje. To cōż mōmy zrobić? Muszymy zrezygnować i ôcalić to, co idzie ôcalić. Używanie trwŏ i muszymy to reszpektować. Skuli tego korpusy sōm take ważne. – Ibon Sarasola, pisŏrz baskijski, autōr słownikōw, czōnek Krōlewskij Akadymije Baskijskij Mŏwy.

Czowiek niy je perfekt. Nasze zmysły tyż niy sōm perfekt. Jak czytōmy, czynsto coś nōm sie straci przed ôczami abo dŏwōmy pozōr niy na to, co je ważne. To samo mogōm ô sobie powiedzieć naukowcy, beztōż ôni używajōm ekstra nŏrzyńdzi do analizowaniŏ mŏwy. Te nŏrzyńdzia nazywŏ sie korpusami.

Dalszŏ tajla artykułu niżyj

Sama lingwistyka korpusowŏ to je doś mody dzioł nauki, bo chociŏż po prŏwdzie piyrsze działania, co je idzie nazwać korpusowymi, były kludzōne już we szōstym stoleciu przed naszōm erōm, a gramatycy bez setki lat ôpisowali mŏwy ludzke na bazie tekstōw religijnych, to poczōntek modernyj lingwistyki korpusowyj to lata 60. XX stoleciŏ, jak naukowcy na Uniwersytecie Brown we USA sebrali 500 tekstōw, co sie słożyły na milijōn słōw. W 1967 roku ôpublikowali efekty swojich badań na tych tekstach i to bōł piyrszy rŏz, jak użyto było kōmputra do sprawdzyniŏ, jak funguje gŏdka. Takŏ informatycznŏ analiza zmiyniyła to, jak badōmy używanie ludzkij mŏwy.

Dzisiej skłŏdŏ sie korpusy rozmajtych jynzykōw. Sōm korpusy angelske, francuske, hiszpańske, niymiecke, sōm tyż korpusy małych gŏdek, jak irlandzkij, baskijskij abo sycylijskij.

Dalszŏ tajla artykułu niżyj

Korpusy skłŏdŏ sie z tekstōw pisanych (bp.: artykuły, ksiōnżki) i tekstōw gŏdanych (spōntaniczne rozmŏwy abo, jak w przipadku korpusu ślōnskigo, nagrania tego, jak Ślōnzŏcy ôsprawiali ô sobie, ô robocie abo ôpowiadali bery i bojki). Dziynki tymu idzie sie porōwnać, jak ludzie używajōm swojij mŏwy po namyślyniu, a jak używajōm jij spōntanicznie.

W przigotowaniu tōż je Korpus Ślōnskij Mŏwy. Bydōm w nim teksty ślōnske ôd 1574 roku do dzisiej. Jedna ôzmŏ to teksty gŏdane, sebrane z uniwersyteckich wydŏwnictw z tekstami gwarowymi i przepisane do ślabikŏrza. Niymałŏ czyńść to publicystyka z cajtōngōw, a reszta to literatura piyknŏ. Wszyjskigo je niycałe 1,9 milijōna słōw.

Tōż co ślōnskij gŏdce może dać korpus tekstōw? Na isto moglibymy ôczekować wiyncyj badań naukowych nad naszōm mŏwōm. Pewnikym pojawiōł by sie tyż piyrszy porzōndny słownik ślōnski, co niy ino notowołby wszyjske słowa, co ich używōmy, ale tyż podŏwołby jejich kōntekst, ôdmianã i terytorialność.

Korpus pōmoże tyż przi jeszcze jednym. Problym terŏźnyj ślōnskij mŏwy to jeji corŏz niższŏ jakość. Mōmy tōż cołke grupy szamanōw ślōnskij gŏdki, co ôpiyrajōm swoje argumynta na „wyczuciu”. Dziynki korpusowi idzie je dokumyntacyjōm i statystykōm ôbalić bez jakigoś dugigo badaniŏ i szukaniŏ. Pokŏżã Wōm.

Wejrzijmy na take słowo jak „pōnbōczek” i pochodne („pōnbōczkowy” itp.). Prōmuje sie je za nojbarzij ślōnske ôkreślynie Boga.

  • Do roku 1939 pojawiajōm sie 22 razy, nojwcześnij w 1908 roku.
  • Po roku 1945 mōmy je 360 razy.
  • W tekstach gŏdanych pojawiajōm sie 3 razy, a w tekstach pisanych 379 razy.

A terŏz porōwnejmy to ze słowym „Bōg” i pochodnymi („boży”, „boski” itp.).

  • Do 1939 pojawiajōm sie 449 razy, nojwcześnij w 1574 roku.
  • Po roku 1945 te słowa pojawiajōm sie 691 razy.
  • W tekstach gŏdanych mōmy je 101 razy, a w tekstach pisanych 1039 razy.

Idzie to jeszcze inakszyj porōwnać. Tekstōw gŏdanych w korpusie je 12,83%. „Pōnbōczek” w tekstach gŏdanych to 0,79% wystōmpiyń, a „Bōg” to 8,86%. To znaczy, że piyrsze słowo w żywyj mŏwie trefiŏ sie w granicy błyndu statystycznego, a druge w żywyj mŏwie trefiŏ sie mynij wiyncyj tak, jak szło by tego ôczekować.

Szukanie słowa „pōnbōczek” w korpusie.
Szukanie słowa „pōnbōczek” w korpusie.

Jake z tego mogymy wyciōngnōńć wnioski? Że „pōnbōczek” mŏ gigantycznõ nadreprezyntacyjõ w literaturze ôstatnich lŏt. Że ta miyłość do tego słowa niy mŏ pokryciŏ we faktycznym sztańdzie ślōnskij mŏwy. To, co sie Ślōnzŏkōm sprzedŏwŏ ôd lŏt, to je falsyfikat. Mało tego, na Podhŏlu gōrŏle tyż gŏdajōm „ponbócek”. My za to niy gŏdōmy „szczyńść pōnbōczku” ani „pōnbōczku pōmŏgej”, przi drōdze stoji bożŏmynka, a procesyjŏ idzie na Boże Ciało.

Na to nōm je potrzebny korpus. Żeby my mōgli lepij poznać naszã mŏwã, a niy spiyrać sie na wyczuciu. Potrzebujymy faktōw i dokumyntacyje, a niy wyczuciŏ. Ino tak mōgymy pracować nad ślōnskōm gŏdkōm.

Grzegorz Kulik

Grzegorz Kulik

Tumacz, publicysta, popularyzatōr ślōnskij mŏwy. Autōr ślōnskich przekładōw „A Christmas Carol” Charlesa Dickensa, „Dracha” Szczepana Twardocha i ger kōmputrowych Euro Truck Simulator i American Truck Simulator.

Jakeście sam sōm, to mōmy małõ prośbã. Budujymy plac, co mŏ reszpekt do Ślōnska, naszyj mŏwy i naszyj kultury. Chcymy nim prōmować to niymaterialne bogajstwo nŏs i naszyj ziymie, ale to biere czas i siyły.

Mōgliby my zawrzić artykuły i dŏwać płatny dostymp, ale kultura powinna być darmowŏ do wszyjskich. Wierzymy w to, iże nasze wejzdrzynie może być tyż Waszym wejzdrzyniym i niy chcymy kŏzać Wōm za to płacić.

Ale mōgymy poprosić. Wachtyrz je za darmo, ale jak podobajōm Wōm sie nasze teksty, jak chcecie, żeby było ich wiyncyj i wiyncyj, to pōmyślcie ô finansowym spōmożyniu serwisu. Z Waszōm pōmocōm bydymy mōgli bez przikłŏd:

  • pisać wiyncyj tekstōw
  • ôbsztalować teksty u autōrōw
  • rychtować relacyje ze zdarzyń w terynie
  • kupić profesjōnalny sprzynt do nagrowaniŏ wideo

Piyńć złotych, dziesiyńć abo piyńćdziesiōnt, to je jedno. Bydymy tak samo wdziynczni za spiyranie naszego serwisu. Nawet nojmyńszŏ kwota pōmoże, a dyć przekŏzanie jij to ino chwila. Dziynkujymy.

Spōmōż Wachtyrza

Cyntrum Preferyncyji Prywatności

Potrzebne

Zbiory cookies potrzebne do nojbarzij podstawowych funkcyji serwisu: zgoda na politykã prywatności (gdpr) i informacyjŏ ô blokowaniu reklam (anCookie), testowy zbiōr ôd platformy (wordpress_test_cookie)

gdpr, anCookie, wordpress_test_cookie

Ino po zalogowaniu

Zbiory cookies potrzebne do byciŏ zalogowanym w serwisie.

wordpress_logged_in_, wordpress_sec_, wp-settings-time-