Printer Friendly

Forensic phonetic identification and linguistic analysis of the speaker/Fonetsko forenzicko prepoznavanje i lingvisticka analiza govornika.

1. UVOD

Rad se temelji na stvarnome forenzickom slucaju prepoznavanja muskoga govornika. Na zahtjev Zupanijskoga suda u Zagrebu trebalo je identificirati jedan muski glas na temelju snimki sluzbenog prisluskivanja razgovora preko GSM uredaja. Sa snimke 1 u trajanju od 2,16 min (CD 1) trebalo je prepoznati muski glas na snimci 2 (CD 2) za vrijeme razgovora s drugom muskom osobom u trajanju od 7,39 min. Prepoznavanje govornika temeljilo se na forenzickoj fonetskoj i lingvistickoj analizi.

Forenzicka fonetika relativno je nova grana fonetike koja pocinje dvadesetih godina 20. stoljeca tehnickim razvojem snimanja zvuka, a intenzivnije se razvija posljednjih nekoliko desetljeca. Surjecje forenzicke fonetike ukljucuje podrucja prepoznavanja, identifikacije govornika, profiliranje govornika (regionalna pripadnost, socioekonomske i psiholoske karakteristike govornika, patologija glasa, strani naglasak), voice line-ups, fonetsku transkripciju, tj. odredivanje sadrzaja izrecenoga (u slucajevima lose snimke), odredivanje autenticnosti snimke (npr. jesu li postojale manipulacije sa snimkom itd.) (Rose, 2002).

Forenzicka lingvistika moze se definirati kao grana primijenjene lingvistike koja se primarno bavi vezom izmedu jezika, zakona i kriminala. Naziv forenzicka lingvistika prvi je upotrijebio Svartvik 1968. U posljednjih 15 godina primjetan je znatan razvoj istrazivanja na tome podrucju te sve cesce koristenje forenzickih lingvista kao strucnih svjedoka u sudskim procesima, 0 cemu svjedoce, primjerice, standardna djela iz toga podrucja Coultharda i Johnson (2007) i McMenamina (2002).

1.1. Znacenje pojmova prepoznavanja, identifikacije i verifikacije u forenzickoj fonetici

Govoreci o prepoznavanju govornika, mozemo ga podijeliti na identifikaciju 1 verifikaciju govornika. Identifikacija govornika je proces utvrdivanja govora govornika od odredenog broja mogucih govornika, a verifikacija govornika je proces prihvacanja ili odbijanja tvrdnje o identitetu, sto znaci da se podrazu-mijeva naknadno snimanje osumnjicenika u postupku fonetske verifikacije, obicno kod nesigurnih dokazivanja krivnje ili nevinosti. Osnovna je razlika u broju mogucih odgovora. U procesu identifikacije broj mogucih rjesenja jednak je broju ukupne populacije, dok je u procesu verifikacije moguce samo dvoje--prihvatiti ili odbaciti tvrdnju o identifikaciji, neovisno o velicini populacije. Za razliku od laickog, odnosno naivnoga prepoznavanja pomocu slusnih svjedoka, ekspertno forenzicko prepoznavanje podrazumijeva slusnu procjenu slicnosti--razlicitosti parova glasova govornika pomocu izvjezbanih eksperata (Varosanec-Skaric, 2008:32) prema protokolu forenzicke fonetike (Hollien, 2002). Kako je osumnjicenik iz konkretnoga stvarnog slucaja razgovarao s foneticarem, jer je sud tako zahtijevao, ali je tijekom intervjua odbio naknadno snimanje pod nadziranim tehnickim standardnim uvjetima, nadalje cemo postupak identifikacije na temelju snimki sluzbenoga prisluskivanja nazivati prepoznavanje prema odredenim siframa koje predstavljaju razlicite govornike, da ne bi doslo do pogresnog razumijevanja razlikovanja termina identifikacije u pravnoj kriminalistici i mogucim znacenjima u forenzickoj fonetici. Forenzicki foneticari u svakome forenzickom kontekstu uglavnom daju prednost nazivu identifikacije, primjerice Hollien (2002), Rose (2002), Kunzel (2010), dok drugi, koji se u eksperimentalnom smislu bave forenzickom fonetikom, daju prednost terminu prepoznavanje (engl. speaker recognition), primjerice Nolan (1983, 2009). S obzirom na forenzicko surjecje ovoga rada, priklanjamo se terminu prepoznavanje.

2. POSTUPAK

2.1. Preliminarni postupci u utvrdivanju prepoznavanja glasa govornika

Ucinjena je fonetska transkripcija cjelokupnoga govora s obje snimke radi utvrdivanja regionalnoga izgovora, dijalekta i ideolekta te montaza zvuka radi akusticke analize.

Slusnom analizom opisan je govor trazene osobe, odnosno govornika sa snimke 1 i snimke 2 te su se transkribirali specificni glasnici (prvenstveno vokali) i usporedivali sa standardnim glasnicima hrvatskoga jezika.

2.2. Slusno prepoznavanje govornika

U forenzickoj fonetici slusna analiza eksperta--uvjezbanog foneticara vrednuje se kao najpouzdaniji postupak u prepoznavanju i verifikaciji govornika. Kombinacija slusne i akusticke analize najcesce se primjenjuje, dok je postupak automatskog prepoznavanja jos u fazi usavrsavanja i provjere, buduci da su jos moguce pogresne pozitivne identifikacije. U potonjem smislu mogu se spomenuti novije metode automatskog prepoznavanja kao sto su BATVOX (Harrison i French, 2010) te Automatic SPID na bazi visejezicnoga govornog materijala (Kunzel, 2010).

U nasem istrazivanju postupak slusnoga prepoznavanja provodio se prema priznatom protokolu forenzicke fonetike (AP--SPID: Aural-perceptual Approach to Speaker Identification, Hollien 2002:80), koji je razvijen u Sjedinjenim Americkim Drzavama, Velikoj Britaniji i Njemackoj, a koji Varosanec-Skaric prilagoden primjenjuje u Hrvatskoj od 2003. u stvarnim forenzickim slucajevima te u eksperimentalne svrhe. Kategorije su AP--SPID protokola redom ton, kvaliteta glasa, intenzitet, dijalekt, artikulacija, prozodija, ostalo (eventualni poremecaji glatkoce govora i ostali patoloski poremecaji govora).

U postupku slusnoga prepoznavanja parove glasova govornika procjenjivala su dva ekspertna uvjezbana foneticara od kojih je jedan prvi autor rada, a redoslijed i kombinaciju parova pripremio je foneticar, drugi autor rada. Procjenjivalo se ukupno 11 parova oznacenih siframa u razlicitim kombinacijama. Uz glas osumnjicenika i njegovoga sugovornika ubacili su se i tzv. mucci (podmetnuti glasovi, odnosno tragovi metaforicki se u forenzickom metajeziku nazivaju mucci, engl. foils) poznati samo foneticaru koji nije sudjelovao u prepoznavanju. Govornici mucci snimljeni su u fonetskom studiju kako izgovaraju tekst slican onome u telefonskom razgovoru. Te su studijske snimke potom filtrirane u rasponu od 300 do 3000 Hz i montirana je buka, kojom se maskira studijsko snimanje (Varosanec-Skaric i Bicanic, 2007). Na taj se nacin dobiju snimke koje su akusticki poput stvarnoga telefonskog razgovora. Kombinacije su napravljene tako da su se uzela tri razlicita uzorka povezanoga govora trazenoga govornika, zatim tri razlicita uzorka sugovornika sa snimke 1 i snimke 2, dva uzorka mucka 1 (pri cemu on u jednom uzorku govori isti tekst kao sugovornik te jedan drugaciji tekst, ali slicnog konteksta) i tri uzorka govora mucka 2 (jedan tekst isti kao trazena osoba, jedan kao sugovornik i jedan drugaciji, ali slicnoga konteksta). Tako je dobiveno 11 uzoraka govora rasporedenih u 11 parova. U postupku slusnoga prepoznavanja (AP--SPID) svaki se par pustao onoliko puta koliko je bilo potrebno da se procijeni svih sedam kategorija i njihovih varijabli, a najmanje sedam puta.

Za svaki par izracunani su postotci i rasponi prepoznavanja. U forenzickoj fonetici ukupan rezultat pozitivnog prepoznavanja za sve dimenzije mora iznositi najmanje 90% podudaranja, a najmanji ukupni postotak tocnosti utvrdivanja identiteta u paru mora iznositi 80%. Tek kad je ukupno prepoznavanje vece od 90% moze se tvrditi da postoji vjerojatnost da se radi o istoj osobi, a prosjecno prepoznavanje od 94% i vise nesporna je identifikacija ako je u uzorku bio i glas osumnjicenika snimljen u verifikacijskom postupku.

2.3. Akusticka analiza

Akusticka analiza temeljila se na izracunavanju prosjecnih vrijednosti [F.sub.0] (u Hz) na temelju govora, formantnih frekvencija ([F.sub.1], [F.sub.2], [F.sub.3] u Hz) pet vokala, trajanja vokala (u ms) u programu Praat (Boersma i Weenink, 2009); kao pomocne akusticke metode usporedbi timbra koristeni su postupci dugotrajnoga prosjecnog spektra govora govornika (LTASS) u programu AS (prilagodili Skaric i Stamenkovic 1990, prema Skaric 1993) te na temelju LTASS, akusticko-statisticke metode indeksa slicnosti (R) i razlicitosti (SDDD) glasova govornika (Harmegnies, 1985, 1995).

Fundamentalna frekvencija (F0) trazenoga govornika mjerena je na temelju snimki 1 i 2. Fundamentalna frekvencija smatra se jednim od najsigurnijih akustickih parametara u forenzickoj identifikaciji govornika kao zvucni korelat brzine vibracija glasnica. Odredena je anatomijom larinksa pa se pretpostavlja da ce se na njoj u najmanjoj mjeri manifestirati promjene unutar samoga govornika. Osim toga, taj je parametar otporan na telefonsku transmisiju, sto je posebice vazno u forenzickoj fonetici (Braun, 1995).

Izmjerena su prva tri formanta svih vokala sa snimke 1 i snimke 2, posebno za oba govornika. Izracunani su prosjeci formantnih frekvencija iz 10 rijeci za svaki vokal te su se usporedivali s frekvencijama formanata standardnoga hrvatskoga govora. Statistickim postupkom (z-test) nastojala se utvrditi znacajnost razlike izmedu formanata analiziranih govornika i standardnih vrijednosti.

Prosjecno trajanje vokala trazenoga prepoznatoga govornika izracunano je na temelju 10 rijeci za svaki vokal, a ti su se rezultati usporedili s prosjecnim trajanjem vokala standardnoga govora na temelju Bakranovih podataka (1996). Analiza izgovora vokala vazna je u forenzickoj fonetici stoga sto je izgovor vokala tipican za odredeno geografsko podrijetlo. Iako su i suglasnici razlikovni s obzirom na geografsko podrijetlo i uzimaju se u obzir u tehnickome forenzickom slusnom prepoznavanju govornika, samoglasnici su pogodniji za akusticku analizu.

Naveden pomocni parametar akusticke analize, tj. dugotrajni prosjecni spektri glasa tijekom govora (LTASS) obavjestavaju o spektralnoj raspodjeli govornoga signala u nekom vremenu. Kako su vremenski parametri promjenljivi, npr. ista rijec ili izraz mijenjaju se u trajanju za istoga govornika, tehnicka verifikacija govornika daje prednost dugotrajnomu prosjecnom spektru govora pred kratkotrajnim spektralnim analizama, jer LTASS daje suprasegmentalnu sastavnicu govora, obavjestava o glasovoj kvaliteti, odnosno timbru. Ovdje se usporedivao LTASS i trazenog govornika i sugovornika sa snimke 1 i snimke 2.

Uz to, akusticko-statistickim postupcima izracunani su indeksi razlika (SDDD) i indeksi slicnosti (R) za trazenoga govornika sa snimke 1 i snimke 2 te usporedujuci trazenoga govornika s nekoliko drugih muskih glasova, koji su se koristili kao mucci (engl. foils) u postupku slusnog prepoznavanja. Indeks razlika, tj. indeks standardne devijacije razlika distribucije (SDDD) i indeks slicnosti (R) koriste se u usporedbi glasova u forenzickoj fonetici, a formule za izracunavanje prilagodene su prema Harmegniesu (1995) i Harmegniesu i Landercyju (1985). U teorijskom smislu SDDD bi bio 0 kada bi LTAS crte bile gotovo paralelne, a najveca standardna devijacija bila bi kad ne bi bilo nijedne tocke podudarnosti. Indeks slicnosti (R) obavjestava nas o kolicini kovariranja dvaju spektara, a koeficijent medukorelacije bio bi 1 kada bi slicnost bila potpuna.

2.4. Lingvisticka analiza

Buduci da akusticki materijal nije bio obilan jer se radilo o manje od 10 minuta snimljenoga materijala, napravljena je i lingvisticka analiza. Sinergija fonetske i lingvisticke analize daje pouzdanije rezultate jer se migovi kvalitete glasa, dobiveni slusnom analizom nadopunjuju migovima lingvisticke analize (koristenje idiosinkratickih rijeci, regionalizama i dijalektalizama). Prvi dio analize ukljucivao je usporedbu fonetske transkripcije govora s dobivenim sluzbenim zapisnikom. Lingvisticka analiza podupire mapiranje podrijetla govornika (na leksickoj, ali i fonoloskoj razini), a ima i pragmaticku korist u utvrdivanju tocnosti i pouzdanosti transkripcije nastale u istraznom postupku.

Ukupan broj idiosinkratickih rijeci u odnosu prema ukupnom broju rijeci u govoru trazenoga govornika usporeden je s cestotom tih rijeci u hrvatskome jeziku prema podatcima Mogusa, Bratanic i Tadica (1999).

3. REZULTATI I RASPRAVA

3.1. Rezultati slusne fonetske analize

3.1.1. Fonetski opis izgovora i glasa trazenoga govornika

Utvrdeno je da trazeni govornik pripada stakavskom ikavskom bosanskom govoru: sintakticki i morfofonoloski njegov je govor istocna, bosanska varijanta. Fonetski, na suprasegmentalnoj razini izgovora naglasaka govornik ostvaruje markirane naglaske istocne varijante, sto znaci da dulji dugouzlazni naglasak i ostvaruje dulje zanaglasne duljine u usporedbi s hrvatskim standardnim trajanjem. Uz to, ostvaruje istocne oblike genitiva mnozine s naglasenim drugim slogom i dugim zadnjim slogom [[??]iva:tsa:], redovito prebacuje silazne naglaske sa znacenjskih rijeci na proklitiku, neoslabljeno i oslabljeno, sto odudara od verificiranog opceprihvatljivog i prihvacenoga govora hrvatskoga (Skaric, 2009) koji je po odredenju alokalan, a prebacivanja se dogadaju i pozeljna su samo u nekim slucajevima. Trazena osoba redovito prebacuje sve silazne naglaske kao u neoslabljenim primjerima u koliko liikolkol, i oslabljenim bez veze /bezveze/.

Trazeni govornik na segmentalnoj razini ima karakteristican dijalektalan izgovor samoglasnika. Vokali su prednjiji i zatvoreniji od kardinalnoga izgovora vokala u hrvatskome standardu. Na fonoloskoj razini redovito je prisutna zanaglasna redukcija, odnosno sinkopiranje samoglasnika, poput ljud'ma [[??]u:dma],pros'o, sracun'o, rek'o, uplat'mi, dos'o, kup'li, nas'o, vrac'o. U nekim rijecima dolazi do obezvucavanja zvucnog suglasnika, primjerice [d] u Vod'cama [wodts[??]m[??]]: zbog ispadanja samoglasnika doslo je i do suvisne asimilacije po napetosti, jer se [d] naslo uz /c/ [ts], sto se u govoru ostvarilo kao [d]. Vokal /a/ cesto se, za razliku od hrvatskoga kardinalnog izgovora, ostvaruje zanaglasno i kao sredisnjiji i nesto zatvoreniji [[??]]. Koji put ispred sinkopiranog vokala dolazi i do ispadanja suglasnika. Pri sinkopiranoj redukciji, sazimanju dvaju samoglasnika u jedan u finalnoj poziciji rijeci, tj. [ao] u [o] kao u primjerima prosao [pro[??]o:], dosao [do[??]o:], sracunao [srat[??]uno:], rekao [reko:], psovao [psowo:], jebao [jebo:], sazimanje se u fonoloskom smislu ocituje i znatnijim duljenjem vokala [o:]. Redovita je zanaglasna redukcija do ispadanja vokala [i]: koliko /kol'ko/, kupili /kup'li/, govornice /govorn'ce/, dobiti /dob'ti/, ugasilo /ugasilo/. U naglasenoj poziciji [i] je zatvoreniji od standardnog izgovora, a nakon zanaglasnih redukcija, zavrsni je katkad i labaviji, tj. [i], kao u primjerima kupili [ku:pli], dobiti [dobti]; pritom se zvucni suglasnici obezvucuju zbog dodatne asimilacije zbog ispadanja i slijeda bezvucnog suglasnika kao u potonjem primjeru. Sto se tice izgovora suglasnika /c/[t[??]], trazeni govornik izgovara ga prema umeksanom, palataliziranom.

Prema deskriptivnom fonetskom protokolu glas trazenoga govornika je lagano povisen, glasan, u suprasegmentalnom postavljanju uskog raspona celjusti, katkad dentaliziran, u laringalnom postavljanju modalne fonacijske vrste. Drugi glas, tj. glas sugovornika s druge snimke, kojega nije trebalo prepoznavati, prosjecne je visine, bez zamjetnih modifikacija vokalnog trakta. Pripada hrvatskomu juznjackom mijesanom ikavsko-jekavskom dijalektu.

3.1.2. Rezultati na temelju AP--SPID protokola

Receno je da se slusno prepoznavanje govornika provodilo prema fonetskom protokolu u forenzickoj fonetici, tj. prema AP--SPID. Dvoje ekspertnih foneticara uspore|ivalo je 11 parova govornika. Kombinacija i redoslijed bili su poznati samo foneticaru, drugom autoru koji je za potrebe prepoznavanja montirao parove glasova slucajnim redoslijedom. Parovi su se usporedivali u razlicitim parametrima od tona, kvalitete glasa, preko intenziteta, prozodije, procjene dijalektalnog podrijetla, artikulacije vokala i konsonanata i u njihovim poddimenzijama. Rezultati se uobicajeno navode u prosjeku i rasponima prepoznavanja. Najvece prepoznavanje bilo je 96%-tno za par X1-M3, sto je par trazene osobe sa snimke 1 i snimke 2 (tablica 1). Visok postotak prepoznavanja (94%) imao je i par M2-A8, sto je bio mucak 2 sa samim sobom te par D5-M1 (91%), sto je bila kombinacija sugovornika sa snimke 1 i snimke 2. U forenzickoj fonetici tek se prepoznavanje vise od 90% uzima u obzir pri donosenju misljenja da bi se moglo raditi o istoj osobi. Prepoznavanje je pak bilo najmanje (14%) u paru M3-N3 koji je kombinacija trazenoga govornika s muckom 1 (tablica 2). Rezultati prosjeka postotaka prepoznavanja s rasponima za sve parove prikazani su na tablici 3.

Slusnom prepoznavanju trazenoga govornika uvelike je pridonijela karakteristicna vokalska boja koja obavjestava o njegovu dijalektalnom i regionalnom podrijetlu, a koje je procijenjeno kao strano, tj. bosansko. U postupku prepoznavanja trazene osobe, tj. osumnjicenika, znakovita je bila i visina tona te opca kvaliteta glasa, glas je bio blistave kvalitete i blago nazaliziran.

3.2. Rezultati akusticke analize

3.2.7. Rezultati mjerenja fundamentalne frekvencije

Fonetski opis trazenoga govornika utvrdio je da se radi o muskoj osobi lagano povisenoga glasa, a to je potvrdilo i mjerenje fundamentalne frekvencije koja je u slucaju trazenoga govornika visa od prosjecnoga muskoga glasa. Prema Fantu (1970), Varosanec-Skaric (2005) raspon fundamentalne frekvencije za ljudski glas iznosi 60-240 Hz, za muskarce iznosi prosjecno 120 Hz, a za zene 200 Hz. Prosjecna [F.sub.0] trazenoga govornika sa snimke 1 bila je 201 Hz, a na drugoj snimci 197 Hz, s gotovo jednakim minimalnim i maksimalnim rasponima od 76 i 316 Hz i 76 i 317 Hz, a medijani su takoder visi kod trazenoga glasa, tj. iznose 200 i 195 Hz prema 175 Hz kod sugovornika (tablica 4). Sugovornik je imao nizu prosjecnu [F.sub.0] od trazenoga govornika, tj. 177 Hz. Kako je razgovor bio obojen emocionalno, tj. svadali su se, povisenijem glasu trazenoga govornika bila je u ljutnji i vrlo glasnom govoru znatno visa [F.sub.0]. Primjerice, utjecaj glasnoce i tona u forenzickom surjecju istrazivao je French (1998). Zbog transmisije i presnimavanja zvuka ipak dolazi i do laganih izoblicenja zvuka, a mjerenja [F.sub.0] vrlo glasnoga govora i u studijskim uvjetima snimanja utjecu na mjerenje, jer programi uzimaju u obzir najjace amplitude, koje u vrlo glasnom govoru mogu biti i harmonici [F.sub.0], pogotovo kad se radi o maksimalnim vrijednostima. Srednja glasnoca i neutralni govor daju pouzdanije rezultate u akustickim mjerenjima, ali u forenzickim slucajevima takav je govor moguce dobiti samo pri postupku verifikacije u intervjuu s foneticarem. U ovome slucaju trazena osoba po savjetu branitelja naknadno je odbila verifikacijski postupak, koji je zatrazio istrazni sudac.

3.2.2. Rezultati mjerenja formantnih frekvencija

Izgovor vokala, u uzem smislu vokalska boja, vazan je pokazatelj dijalektal-nog, regionalnog pa i drustvenog podrijetla govornika, stoga je analiza vokala u postupku prepoznavanja govornika vrlo vazna. Osim slusne analize, provode se i akusticka mjerenja kao sto su mjerenje vrijednosti formanata, mjerenje trajanja vokala te njihovo usporedivanje sa standardnim vrijednostima. Formanti su rezonancijske frekvencije vokalnog trakta, odnosno frekvencije istaknutih dijelova spektra, a u suodnosu su s velicinom i oblikom vokalnog trakta. U uzem smislu vokalski su formanti F1 i F2, iako se utjecaj izgovora vokala reflektira i na F3, pa se i on u zadnje vrijeme uzima u obzir pri analizi vokal-skog izgovora. Sto se tice mjerenja vokalnog trakta, uzima se visi formant F4, koji je stoga vokalni formant (a ne vokalski) jer na njega vise ne utjece izgovor vokala, vec je rezonantna frekvencija cjelokupnoga vokalnog trakta. Opcenito, u akustickome mjerenju analize formantnih frekvencija treba biti oprezan pri prepoznavanju, ono treba slijediti tek nakon pomne slusne analize da ne bi doslo do tzv. pozitivnih te negativnih pogresaka (upucujemo na Rose, 2002). Buduci da su u slusnoj analizi uocene razlike u izgovoru vokala trazene osobe i sugovornika, u programu Praat mjerene su vrijednosti vokalskih formanata F1, F2 i F3. Pri tome treba napomenuti da je F1 relevantan samo za vokal /a/, jer na njega zbog prosjecnih visih vrijednosti ne utjece GSM transmisija. Usporedivani su drugi i treci formanti svih vokala jer ni na njihove frekvencije ne utjece GSM transmisija, tj. ne izoblicavaju se vrijednosti. Napravljen je prosjek od 10 rijeci sa svake snimke te se usporedivao sa standardnim vrijednostima hrvatskoga jezika (prema Skaric, 1991). Statistickim izracunom (z-test) provjeravala se znacajnost razlike. Buduci da se na obje snimke radilo o razgovoru preko GSM-a ciji je frekvencijski raspon bio od 300 do 3400 Hz, u analizi prvog formanta, kao sto je receno, uzet je u obzir samo vokal [a] cija je prosjecna vrijednost 700 Hz. Upravo je prvi formant vokala [a] pokazao statisticki znacajnu razliku u odnosu prema standardnoj vrijednosti (p = 0,0001; tablica 5).

Drugi formant pokazuje statisticki znacajnu razliku u odnosu prema standardnim vrijednostima za vokale [a] (p = 0,0006), [o] (p = 0,00002), [u] (p = 0,00002), [F.sub.2] je znacajno niza za [a] i [o] te visa za [u]. Treci formant pokazuje statisticki znacajnu razliku samo za vokal [i], tj. znacajno nizu vrijednost (p = 0,000000006263), sto se moze objasniti prednjom zaokruzenoscu bosanskog izgovora vokala. Na formantne vrijednosti trazenoga govornika, tj. na spustanje vrijednosti visih formanata utjecalo je i dentalizirano postavljanje glasa, sto pokazuju i druga istrazivanja (Varosanec- Skaric, 2005). U usporedbi sa sugovornikom trazeni govornik ima visi [F.sub.2] vokala [i] (p = 0,008), jer mu je [i] pred-njiji i zatvoreniji od sugovornika te nizi [F.sub.3] vokala [o] (p < 0,001) zbog utjecaja dentaliziranog postavljanja glasa. Iako je cetvrti formant vrlo vazan u identifikaciji govornika jer daje informacije o kvaliteti glasa, prosjecne vrijednosti vise su od 3000 Hz pa zbog deformacije zvuka uslijed telefonske transmisije, vrijednosti ne bi bile pouzdane, stoga se nije mjerio. Dakle, formanti vokala [a], [i], [o], [u] trazene osobe statisticki se znacajno razlikuju od vrijednosti formanata standardnoga hrvatskoga govora. Autori su svjesni da ove tvrdnje valja potkrijepiti daljnjim istrazivanjima, jer prosjecne formantne vrijednosti za standardan izgovor hrvatskih vokala kod Skarica (1991) i Bakrana (1996) nisu dobivene na temelju sto i vise govornika opcega hrvatskog posebno za muske i zenske glasove, koliko bi bilo potrebno za cvrscu usporedbu odmaka idiosinkraticnog izgovora u odnosu prema standardnom izgovoru vokala.

3.2.3. Rezultati trajanja vokala

Slusnom analizom utvrdeno je da je trajanje naglasenih vokala dugih naglasaka (dugouzlaznog i dugosilaznog) trazenoga govornika duze nego u hrvatskome opceprihvatljivom izgovoru. Buduci da za hrvatski jezik postoje izmjerena trajanja vokala u razlicitim akcenatskim uvjetima u radu Bakrana (1996), mogla se napraviti usporedba. Naime, i Bakran uzima zajednicku prosjecnu vrijednost za duge akcente s obzirom na to da kretanje tona ne utjece znatno na trajanje (Bakran, 1996:258). Izmjerena su trajanja naglasenih vokala u povezanome govoru, jer su oni i slusnom analizom prepoznati kao snazan marker govora trazenoga govornika. To ne znaci da ne postoji razlika i u izgovoru kratkih naglasaka, ali to je slusno teze utvrditi, pa se njihovo vrijeme trajanja nije ni akusticki provjeravalo. Za deset rijeci za svaki dugi naglaseni vokal sa snimke 1 i deset rijeci sa snimke 2 izmjereno je prosjecno trajanje (ms), primjerice u rijecima ljudi, lud, drug, kupio, ugasio, vratio, dva, plan, znam, nisu, fino, price, pet, iz pocetka (ispocetka), doci, sto itd.).

Usporedba je pokazala da su svi dugi naglaseni vokali trazenoga govornika duzi od standardnih vrijednosti (slika 1), a najvise za vokale [i] i [e]. Slika 2a pokazuje trajanje vokala [i] (oscilogram i sonogram siroke analize) trazene osobe pri izgovoru idiosinkraticne rijeci Splico [spli:tco], a slika 2b u standardnom izgovoru.

[GRAPHIC 1 OMITTED]

[GRAPHIC 2 OMITTED]

3.2.4. Rezultati usporedbe dugotrajnih prosjecnih spektara (LTASS) i akusticko-statistickih postupaka

Na slikama dugotrajnih prosjecnih spektara (slika 3. i 4) zamjetna su tipicna izoblicenja u nizim i visim dijelovima spektra do kojih dolazi zbog transmisije preko GSM uredaja, sto znaci da se vrijednosti u nizem dijelu spektra ispod 400 Hz povisuju te da se one ispod 3400 Hz snizavaju. Stoga se u statisticko-akustickom postupku izracunavanja indeksa slicnosti izmedu spektara (R) i indeksa razlicitosti (SDDD) uzima manji broj tocaka negoli bi se uzeo na temelju studijskih snimaka. Dugotrajni spektri trazene osobe sa snimke 1 (podebljana crta) i snimke 2 (tanka crta) na slici 3. pokazuju vecu slicnost nego spektri izmedu trazenoga govornika (deblja crta) i sugovornika (tanja crta) (slika 4), sto se zamjetno vidi u visem podrucju blistavosti. Indeks slicnosti izmedu spektara trazene osobe veci je nego izmedu trazene osobe i sugovornika (R = 0,89 : 0,85), a indeks razlicitosti manji je za trazenoga govornika nego izmedu trazenoga govornika i sugovornika (SDDD = 2,10 : 3,75) (tablica 8). Takav rezultat upucuje da u slucaju trazene osobe postoji vjerojatnost da se radi o istoj osobi. Najmanji indeks slicnosti i najveci indeks razlicitosti pokazao se izmedu trazene osobe i mucka (R = 0,74; SDDD = 12,85), sto znaci neprepoznavanje. Naravno je da se znatno bolji rezultati u zvucnom prepoznavanju mogu dobiti u slucaju studijskih snimaka (na tablici 8: mucak 2), stoga u etickom smislu statisticko-akusticki postupci utvrdivanja indeksa slicnosti i razlicitosti trebaju biti samo dodatni. Stoga se jedino slusnom procjenom na temelju AP--SPID protokola mogu utvrditi potpuna prepoznavanja odnosno neprepoznavanja osoba, a akusticki se moze utvrditi samo vjerojatnost da se radi o prepoznavanju odnosno neprepoznavanju.

[GRAPHIC 3 OMITTED]

[GRAPHIC 4 OMITTED]

3.3. Rezultati lingvisticke analize u govoru osumnjicenika

Lingvistickom analizom utvrdivali su se posebni fonoloski, sintakticki i leksicki cimbenici u govoru trazene osobe. Neke smo osobitosti, koje su prisutne u izgovoru na fonoloskoj razini, primjerice redovite zanaglasne redukcije, odnosno sinkopiranje samoglasnika, naveli u poglavlju 3.1.1. Takoder je primijeceno kracenje infinitiva, primjerice: uzet', noc', jest', pricat', govorit', pokazat', zavrsit', spremit', dat', vidit, kupit', istusirat', obuc', ikavski primjeri poput donit, karakteristicna skracivanja za hrvatske dijalekte od glagola vuci i ici, poput vuc [wu:tc], ic [i:tc], otic', odvuc'. Trazeni govornik skracuje i imperativne oblike poput reo' umjesto reci. Za govor trazene osobe karakteristicna je omisija inicijalnog [x], primjerice /'odo/, /'odaju/ [o:daju:], /'oces/, /'ajd'/ umjesto /hodao/, /hodaju/, /hoces/, /hajde/, a u nekim slucajevima izostavljanje inicijalnoga vokala [o], primjerice /'vamo/. Takoder su primjetni specificni morfoloski oblici poput: ne merem umjesto ne mogu, gramatickih oblika, npr. taksijom umjesto taksijem, upotreba nominativa umjesto vokativa, npr. drug umjesto druze, sintaktickih poput imas da slusas te upitna cestica sta, za razliku od drugoga govornika.

No, za analizu je najzanimljivija bila leksicka razina. Uz oblike poput milijon, kuzis, okej, izraza poput i to je to, zanimljiv je izbor rijeci koji, izmedu ostaloga, prilicno jasno otkriva govorno podrijetlo trazene osobe. Rijeci poput deder, prodavnica, bolan i prije svega jaran. Rijec jaran u snimci razgovora od 7,39 minuta pojavila se 59 puta, a u razgovoru na snimci od 2,16 minuta pojavila se 10 puta kod prepoznatoga govornika. Dakle, tijekom 9,65 minuta snimaka, ukupan broj rijeci koje je izgovorila trazena osoba bio je oko 4000, a rijec jaran izgovorena je 69 puta. Relativna cestota rijeci jaran iznosi 0,017, sto je u usporedbi s cestotom u hrvatskome jeziku (prema Mogus, Bratanic i Tadic, 1999) koja iznosi 0,0001, 170 puta vise. Relativna cestota rijeci bolan u cestotnom rjecniku iznosi 0,0013, apsolutna cestota 13, a u ovom znatno manjem korpusu trazeni govornik izgovorio je rijec sest puta. U uzorku drugoga govornika te se idiosinkraticne rijeci uopce nisu pojavile, vec neke druge poput pajdo, razumis ti, kontaj. Zanimljivo je da se rijec pajdo u znacenju prijatelja, sudruga ne pojavljuje u cestotnom rjecniku, nego samo oblik pajdas. Dakle, u juznjackome stokavskom ikavsko--jekavskom govoru drugoga govornika pojavljuje se idiosinkratican oblik pajdo cetiri puta.

3.3.1. Usporedba sluzbenoga zapisnika i transkripcije foneticara

Drugi dio analize odnosio se na usporedbu sluzbenog zapisnika u istraznom postupku i transkripta foneticara. Usporedba je pokazala nedostatke prvog nacina transkribiranja koje je katkada povrsno, a katkada i netocno, buduci da sluzbenici nisu uvjezbani u slusanju i razumijevanju govora pracenog bukom i preklapanjima govora. U takvim situacijama javljaju se pogreske koje mogu utjecati na cjelokupnu istragu. Primjerice, jedan od govornika govori da sutra mora biti kod Matulja, a u policijskom zapisniku pise da je rekao da mora biti kod Macelja (sto su mjesta u razlicitim dijelovima Hrvatske). Nadalje, ne biljeze se idiosinkraticni uzvici i faticke cestice (kao ej!, a?), a na nekim dijelovima dodaju se samo objasnjenja >>nerazumljivo<<, a foneticar tu biljezi i nepravilne i reducirane oblike.

Takoder, sluzbeni transkript ne biljezi karakteristike govora kao sto su sin-kopiranje, redukcije niti karakteristicne prozodijske crte (poput mjesta ili vrste naglaska, prebacivanja naglaska na proklitiku), dugi jat biljezi se dvoslozno, iako govornik uvijek ostvaruje jednoslozan izgovor itd. Sve su te osobine govora vazne u odredivanju regionalnog, dijalektalnog i drustvenog podrijetla govornika, sto je nuzno u postupku identifikacije, prepoznavanja i verifikacije u forenzickoj fonetici i lingvistici (Varosanec-Skaric i Kisicek, 2010)

4. ZAKLJUCAK

Stvarni slucaj prepoznavanja muskoga govornika ukljucivao je slusno prepoznavanje prema AP--SPID protokolu, akusticka mjerenja fundamentalne frekvencije, formanata vokala, trajanja vokala, mjerenja dugotrajnih prosjecnih spektara (LTASS), akusticko-statisticka mjerenja indeksa slicnosti i razlicitosti te forenzickolingvisticku analizu. Postupkom AP--SPID protokola utvrdeno je 96%-tno prepoznavanje, a akusticka i lingvisticka analiza poduprle su vjerojatnost da se na snimci 1 i snimci 2 radi o istoj osobi (R = 0,89; SDDD = 2,10). Rezultati akusticke analize u programu Praat pokazali su da se [F.sub.1] i [F.sub.2] vokala [a], [F.sub.2] za [a], [o] i [u] trazene osobe statisticki znacajno razlikuju od standardnih vrijednosti u hrvatskom jeziku (p < 0,001) te [F.sub.3] za vokal [i] (p < 0,00001). Vokali trazene osobe akusticki se razlikuju i od vokala sugovornika, sto pokazuje statisticki znacajna razlika za [F.sub.2] vokala [i] i [F.sub.3] vokala [o]. Svi dugi naglaseni vokali trazenoga govornika duzi su od standardnih vrijednosti, a najvise vokali [i] i [e].

Lingvisticka analiza pokazala je razliku na fonoloskoj, sintaktickoj i leksickoj razini izgovora trazene osobe i sugovornika. Na leksickoj razini osobitu je idiosinkraticnost pokazala rijec jaran.

I na ovome se stvarnom slucaju potvrdila vaznost ekspertnog slusanja foneticara koji mogu prepoznati razlicit izgovor, naglasne oblike te idiosinkraticne oblike u izgovoru govornika. Foneticari trebaju transkribirati govor sa snimki neovisno o postojanju sluzbenog zapisnika ili zapisnika druge vrste vjestaka.

Pri akustickoj usporedbi formantnih frekvencija vokala pokazala se potreba dodatnih istrazivanja prosjecnih vrijednosti standardnog izgovora radi sto tocnije usporedbe idiosinkraticnog izgovora govornika.

Sinergija postupaka forenzicke fonetike i lingvistike moze pridonijeti pouzdanijim rezultatima prepoznavanja govornika u pojedinim stvarnim forenzickim slucajevima, osobito u nedostatku vece kolicine snimljenoga prisluskivanoga govora.

UDK 81'342.1:343.98 343.982.32:81

Izvorni znanstveni clanak

Prihvaceno za tisak 05. 03. 2012.

Referencije

Bakran, J. (1996). Zvucna slika hrvatskoga govora. Zagreb: IBIS grafika.

Boersma, P., Weenink, D. (2009). Praat: doing phonetics by computer, version 5.1.20 www.fon. hum.uva.nl/praat/.

Braun, A. (1995). Fundamental frequency--how speaker-specific is it?. U: Braun i Koster (ur.), Studies in Forensic Phonetics, Beitrage zur Phonetik und Linguistik 64, Trier: Wissenschaftlicher Verlag, str. 9-23.

Coulthard, M., Johnson, A. (2007). An Introduction to Forensic Linguistics: Language in Evidence. London, New York: Routledge.

French, P. (1998). Mr. Akbar's nearest ear vs. the Lombard reflex: a case study in forensic phonetics. Forensic Linguistics 5, 1: 58-68.

Harrison, Ph., French, P. (2010). Assessing the suitability of BATVOX for UK Casework or Evaluation of the BATVOX automatic speaker recognition system for use in UK based forensic speaker comparison casework Part II. U Abstracts for the 19th Annual Conference of the International Association for Forensic Phonetics and Acoustics, Trier, Germany, Department of Phonetics, University of Trier, str. 13.

Harmegnies, B., Landercy, A. (1985). Language Features in the Long-Term Average Spectrum. Revue de Phonetique Appliquee 73-74-75, 69-79.

Harmegnies, B. (1995). Contribution a la caracterisation acoustique des sigmatismes--etude de deux indices acoustico-statistiques. U: A. Braun i J.-P. Koster (ur.) Studies in Forensic Phonetics, 56-66. Trier: Wissenschaftlicher Verlag Trier.

Hollien, H. (2002). Forensic Voice Identification. San Diego: Academic Press.

McMenamin, G. R. (2002). Forensic Linguistics: Advances in Forensic Stylistics. CRC Press.

Kunzel, H., J. (2010). Automatic Speaker Identification with Multilingual Speech Material. U Abstracts for the 19th Annual Conference of the International Association for Forensic Phonetics and Acoustics, Trier, Germany, Department of Phonetics, University of Trier, str. 20.

Mogus, M., Bratanic, M. i Tadic, M. (1999). Hrvatski cestotni rjecnik. Zagreb: Zavod za lingvistiku Filozofskog fakulteta Sveucilista u Zagrebu i Skolska knjiga.

Nolan, F. (1983 digitally printed version 2009) The phonetic bases of speaker recognition. Cambridge University Press. Rose, Ph. (2002). Forensic Speaker Identification. London, New York: Taylor and Francis.

Skaric, I. (1991). Fonetika hrvatskoga jezika. U R. Katicic (ur.), Povijesni pregled, glasovi i oblici hrvatskoga knjizevnog jezika (str. 61-376). Zagreb: HAZU i Globus.

Skaric, I. (1993). Prosjecni spektar govora kao slika boje glasa. U Likar, Kosmac (ur.), Strokovno srecanje logopedov Slovenije: Multidisciplinarni pristop v logopediji; Portoroz, Maj 13-15, 1993, 202-205. Portoroz: Aktiv logopedov Juzne Primorske.

Skaric, I. (2009). >>Hrvatski izgovor<<. Nakladni zavod Globus, Zagreb.

Varosanec-Skaric, G. (2005). Timbar. Zagreb: FF press.

Varosanec-Skaric, G. (2008). Verifikacija govornika u forenzicnoj fonetici. Govor--casopis za fonetiku XXV, 1, 31-44.

Varosanec-Skaric, G. i Bicanic, J. (2007). A comparison of indices of difference and similarity based on voices in real forensic case and in controlled conditions. Proceedings. www.icphs20007. de, 16th International Congress of Phonetic Sciences (Eds. Jurgen Trouvain i William J. Barry), pp 2085-2088.

Varosanec-Skaric, G. i Kisicek, G. (2010). Phonetic and linguistic forensic identification of male speaker (real case). U Abstracts for 19th Annual Conference of the International Association for Forensic Phonetics and Acoustics, 18-21 July 2010, Germany. Trier: Dpt. of Phonetics--University of Trier, str. 34.

Gordana Varosanec--Skaric i Gabrijela Kisicek

gvarosan@ffzg.hr; gkisicek@ffzg.hr Filozofski fakultet, Zagreb
Tablica 1. Rezultati prepoznavanja govornika (%) prema AP--SPID
protokolu forenzicke fonetike (usporedba trazenoga govornika sa
snimke 1 i snimke 2--najveca slicnost)

                                            REZULTAT /   RASPON /
                                              SCORE       RANGE

TON / PITCH
Visina tona / Level                             10       10-10
Promjenljivost / Variability                    10       10-10
Obrasci pravilnosti / Regularity patterns       9         9-9

KVALITETA GLASA / VOICE QUALITY
Opca kvaliteta / General quality                10       10-10
Fonacijski tip / Phonation type                9,5        9-10
Ostalo / Other

INTENZITET / INTENSITY
Promjenljivost / Variability                    10       10-10

DIJALEKT / DIALECT
Regionalan / Regional                           10       10-10
Strani / Foreign                                10       10-10
Idiolekt / Idiolect                            9,5        9-10

ARTIKULACIJA / ARTICULATION
Vokali / Vowels                                 10       10-10
Konsonanti / Consonants                        9,5        9-10
Pogresan izgovor / Misarticulations
Nazalnost / Nasality                           8,5        8-9

PROZODIJA / PROSODY
Brzina / Rate                                   10       10-10
Prekidi govora / Speech Bursts                 9,5        9-10
Staccato

OSTALO / OTHER
Govorni poremecaji/ Speech disorders

Srednja vrijednost / Mean                      96%       94-98%

Tablica 2. Najslabiji rezultati prepoznavanja govornika (%) prema
AP-SPID protokolu forenzicke fonetike (par M3-N3: usporedba trazenoga
govornika i mucka 1-najmanja slicnost)

                                               REZULTAT /   RASPON /
                                                 SCORE       RANGE

TON / PITCH
Visina tona / Level                                0         0-0
Promjenljivost / Variability                      0,5        0-1
Obrasci pravilnosti / Regularity patterns         0,5        0-1

KVALITETA GLASA / VOICE QUALITY
Op?a kvaliteta / General quality                  1,5        1-2
Fonacijski tip / Phonation type                   1,5        0-3
Ostalo / Other

INTENZITET / INTENSITY
Promjenljivost / Variability                       0         0-0

DIJALEKT / DIALECT
Regionalan / Regional                              0         0-0
Strani / Foreign                                   0         0-0
Idiolekt / Idiolect                                0         0-0

ARTIKULACIJA / ARTICULATION
Vokali / Vowels                                   0,5        0-1
Konsonanti / Consonants                            1         1-1
Pogresan izgovor / Misarticulations
Nazalnost / Nasality                               2         0-4

PROZODIJA / PROSODY
Brzina / Rate                                      1         0-2
Prekidi govora / Speech Bursts                     1         0-2
Staccato                                          0,5        0-1

OSTALO / OTHER
Govorni poremecaji/ Speech disorders

Srednja vrijednost / Mean                         14%       1-12%

Tablica 3. Rezultati slusne procjene (%) za sve parove

PAROVI     RASPON (%)   PROSJEK (%)

A5+D5        30-46          44
A8+A1        35-49          50
X1+M3        94-98          96
M2+A1        27-39          40
D5+M1        80-87          91
M3+N3         1-12          14
X1+M2        12-18          23
A5+Q1        20-29          31
M2+A8        91-95          94
X1+M2        12-18          23
D5-N3         3-15          16

Tablica 4. Vrijednosti fundamentalne frekvencije za trazenoga
govornika i sugovornika

Izmjerene                Trazeni        Trazeni
vrijednosti (u Hz)      govornik X1   govornik M3   Sugovornik M1

[F.sub.0]                   201           197            177
Standardna devijacija       49            46             52
Minimum                     76            76             75
Maksimum                    316           317            317
Medijan                     200           195            175

Tablica 5. Rezultati usporedbe i statisticke znacajnosti F1 (Hz)
izmedu trazenoga govornika i standardnih vrijednosti
(prema Skaric, 2009)

            Trazeni
VOKAL       govornik       Standardni

[i]           423             360
[e]           535             500
[a]       737 p=0.0001        700
[o]           550             450
[u]           501             380

Tablica 6. Rezultati usporedbe i statisticke znacajnosti F2 izmedu
trazenoga govornika i standardnih vrijednosti (prema tkaric, 2009)

VOKAL   Trazeni govornik   Standardni

[i]     2124               2200
[e]     1838               1800
[a]     1378 p=0.0006      1400
[o]     1006 p=0.00002     1150
[u]     1040 p=0.00002     750

Tablica 7. Rezultati usporedbe i statisticke znacajnosti F3 izmedu
trazenoga govornika i standardnih vrijednosti (prema Skaric, 2009)

VOKAL   Trazeni govornik           Standardni

[i]     2570 p = 0, 000000006263   2850
[e]     2375                       2500
[a]     2261                       2250
[o]     2381                       2300
[u]     2452                       2450

Tablica 8. Prosjecne vrijednosti indeksa slicnosti i razlika medu
spektrima izracunane su za svih 11 parova.

PAROVI           R           SDDD

A5+D5           0,85         3,75
A8+A1           0,69        11,62
X1+M3           0,89         2,10
M2+A1           0,74        12,85
D5+M1           0,95         2,28
M3+N3           0,85         6,95
X1+M2           0,74        12,85
A5+Q1           0,92         3,68
M2+A8           0,98         2,06
X1+M2           0,74        12,85
D5-N3           0,81         4,05

Tablica 9. Usporedba dijela sluzbenog zapisnika i fonetske
transkripcije telefonskog razgovora

POLICIJSKI ZAPISNIK                         TELEFONSKI RAZGOVOR

M (sugovornik) mu govori ma          D5: ma daj, deder, bio sam gore
daj covjece da je bio gore cijelo    cijelo [cje:lo] vrijeme [urje:me],
vrijeme u Vodicama, murija ga je     u Vodicama [wo ditsama] me murija
stopala ...                          stopala, razumis'!?

X (trazeni govornik) pita da gdje    X1: pa di u Vod'cama [wodtseme]
u Vodicama ...                       bolan?

M (sugovornik) govori da su ga       D5: ma vidili ste me covjece sto
vidjeli 100 posto ...                posto

X (trazeni govornik) pita da gdje    X1: pa gdje te u Vod'cama
ga je u Vodicama murija stopala ...  [wodtseme] murja stopala
COPYRIGHT 2012 Croatian Philologic Society
No portion of this article can be reproduced without the express written permission from the copyright holder.
Copyright 2012 Gale, Cengage Learning. All rights reserved.

Article Details
Printer friendly Cite/link Email Feedback
Author:Varosanec-Skaric, Gordana; Kisicek, Gabrijela
Publication:Suvremena Lingvistika
Date:Jul 1, 2012
Words:5682
Previous Article:Contribution to the analysis of witness statements in the Croatian language/Doprinos proucavanju iskaza svjedoka u hrvatskome jeziku.
Next Article:[TEXT NOT REPRODUCIBLE IN ASCII].

Terms of use | Privacy policy | Copyright © 2021 Farlex, Inc. | Feedback | For webmasters |