Abstract (croatian) | Doktorski rad se bavi istraživanjem mogućnosti kvantifikacije ljudskog informacijskog ponašanja. Ljudsko informacijsko ponašanje je disciplina informacijskih znanosti koja se bavi informacijskim potrebama, traženjem, pretraživanjem, procesuiranjem i korištenjem informacija. Polazna točka istraživanja je da se informacijsko ponašanje između ostalog odražava i u obrascima pretrage informacijskih izvora u obliku logova (digitalnih zapisa o interakciji korisnika s informacijskim izvorima). Logovi se mogu sakupiti, pohraniti, analizirati te prezentirati uz pomoć računala u svrhu kvantitativnog uvida u informacijsko ponašanje što i je glavni cilj ovog istraživanja. Kako kao društvo sve više koristimo digitalne uređaje, informacijske sustave te mobilne aplikacije tako kreiramo sve više i više logova. Ono što je bitno za društvo u cijelom je da logove koje kreiramo obično koriste velike korporacije koje svoje poslovanje temelje na analizi tih logova. Međutim istovremeno to i stvara disbalans u društvu, jer nekolicina tvrtki ima uvid u to kako se informacijski ponašamo, to koristi za kreiranje profita, dok društvo nema uvida u procedure kako se naši logovi obrađuju te kako se informacijski sustavi adaptiraju sukladno obradi tih logova. Istovremeno trenutno stanje možemo sagledati i kao početak jedne nove etape u dizajnu informacijskih sustava, koji su adaptivni te se prilagođavaju svakom korisniku sukladno njegovim informacijskim potrebama. Područje informacijskog ponašanja vezanog uz glazbu je izabrano zato što je glazbena industrija jedna od prvih koja je bila izložena utjecaju digitalizacije te se rapidno transformirala u zadnjih dvateset godina. Samim time i informacijski sustavi, ili još bolje rečeno socio tehnološki sustavi, koji omogućuju konzumaciju glazbe su se isto tako mijenjali. Od informiranja korisnika, distribucije glazbenih zapisa, konzumiranja glazbe do dijeljenja iskustava nastalih na temelju slušanja glazbe. Metode korištene u istraživanju uključuju anketu koju su ispunili participanti laboratorijskog eksperimenta s ciljem sakupiljanja podataka koji opisuju njihove socio kognitivne karakteristike te analizu logova koji opisuju pretraživanje informacija sakupljenih tijekom eksperimenta. Nakon sakupljenih podataka o socio kognitivnim karakteristikama korisnika te njihovim informacijskim potrebama putem ankete, te logova sakupljenih za vrijeme traženja informacija o glazbi ili glazbenih zapisa pristupili se obradi podataka. Cilj je pronalaženje odnosa između logova koji opisuju korisničke obrasce traženja informacija te pronalaženjem statistički značajnih korelacija između socio-kognitivnih karakteristika korisnika i obrazaca traženja informacija. Svrha istraživanja je da se pronađu ispravne procedure, algoritmi te načini statističke obrade sakupljenih podataka kako bi računalo moglo iste koristiti za potrebe strojnog promatranja ponašanja korisnika u domeni glazbenog informacijskog ponašanja. Informacijsko ponašanje je poddisciplina informacijskih znanosti koja se istražuje različitim metodologijama odnos čovjeka i informacije. Informacijsko ponašanje se bavi opisivanjem raznih načina kako ljudi komuniciraju s informacijama, s naglaskom na traženje i korištenje informacije. Kada govorimo o obrascima informacijskog ponašanja, odmičemo se od samih informacijskih izvora te se fokusiramo na odnose između njih i procese traženja, pretraživanja i korištenja informacija od strane korisnika. Informacijsko ponašanje nastaje kao rezultat informacijskih potreba korisnika unutar okruženja koje može biti definirano kao radno, socio-kulturno, političko-ekonomsko ili fizičko. Bitno je razlikovati informacijsko ponašanje, traženje informacija, pretraživanje informacija te korištenje samih izvora informacija. Informacijsko ponašanje je ukupno ljudsko ponašanje proizašlo koje proizlazi iz odnosa s izvorima i kanalima informiranja. Informacijsko traženje (information seeking behaviour) je smisleno traženje informacija u svrhu ostvarivanja određenih ciljeva. U procesu traženja korisnik je u interakciji s više izvora informacija (npr knjižnica te informacijski sustav). Pretraživanje informacija (information searching behaviour) je mikro nivo ponašanja koji opisuje interakciju pojedinca s određenim informacijskim sustavom ili izvorom informacija. Istraživanje se temelji na socio-kognitivnom teoretskom pristupu disciplini informacijskog ponašanja unutar informacijskih znanosti. Ovaj teoretski pristup pored kognitivnih definira i socijalne čimbenike kao bitne u procesu traženja informacija. Odnosno, fokus je na uzajamnosti socijalnih i kognitivnih čimbenika prilikom oblikovanja ponašanje. Ostali teorijski pristupi informacijskom ponašanju su obrađeni u drugom poglavlju koji se bavi teorijama informacijskog ponašanja. U istom poglavlju dan je i pregled relevantnih teorija iz domene dizajna informacijskih sustava s obzirom na to da samo istraživanje se javlja polaznom točkom za dizajn informacijskih sustava koji su adaptivniji prema korisniku nego kakve danas koristimo. Kao teorijska polazišta koja se koriste u istraživanjima informacijskog ponašanja predstavljene su sljedeća; Psychodynamic theory, Activity Theory, Critical Theory (CT), Personal construct theory , Personality theory , Practice theory, Social-cognitive theory, Social phenomenology, A general theory of human information behavior (GTOHIB). Informacijsko ponašanje proizlazi iz potrebe korisnika koji, da bi zadovoljio svoju informacijsku potrebu, koristi formalne i neformalne informacijske izvore i usluge, što će rezultirati uspješnim ili neuspješnim pronalaženjem relevantnih informacija. Istovremeno informacijsko ponašanje se i može definirati kao konstruktivno stvaranje značenja iz informacija u postupku traženja informacija. Kroz godine razvili su se različiti modeli informacijskog ponašanja koji se koristi prilikom istraživanja informacijskog ponašanja. Različiti istraživači predlažu različite konceptualne istraživačke okvire, važan teoretski doprinos u ovom znanstvenom polju pruža knjiga Theory in information behavior research koja nudi uvid u različite teoretske pristupe na kojima su građeni različiti modeli. Budući da su obrasci ponašanja tijekom traženja informacija povezani s informacijskim potrebama, Nicholas (2003) je razradio jedanaest perspektiva informacijskih potreba. To su subjekt po kojem se informacija traži, funkcija upotrebe informacija, priroda informacijskih izvora, nivo kompleksnosti i intelektualni nivo koji određuje minimalno znanje korisnika kako bi mogao razumjeti informaciju, točka gledišta s kojeg je informacija kreirana, kvantiteta i kvaliteta, vrijeme kada je informacija kreirana, brzina isporuke informacije, mjesto gdje se informacija koristi te gdje se nalazi te kako je informacija procesuirana te zapakirana. Wilson u svom drugom modelu informacijskog ponašanja, na kojem se temelji ovo istraživanje, definira da osoba u kontekstu ima informacijske potrebe te da postoje dva aktivacijska mehanizma informacijskog ponašanja koja mogu biti objašnjena teorijom stresa i nošenja s istim (stress and cope theory) te teorijom rizika i nagrade (risk/reward theory) i teorijom socijalnog učenja (social learning theory). Osim aktivacijskih mehanizama Wilsonov drugi model uključuje i intervenirajuće variable poput psiholoških, demografskih, onih vezanih za uloge, onih koje opisuju okruženje te one koje karakteriziraju izvore informacija. Istraživanja informacijskog ponašanja moguće je provesti različitim metodama, od intervjua, upitnika, internetskih i telefonskih anketa, fokus grupa, promatranja, vođenja dnevnika, logova, audio zapisnika (journals), foto dnevnika, etnografskih istraživanja, do metode kritičnih faktora uspjeha i kritičnih incidenata te analize web logova. U četvrtom poglavlju je napravljena sistematska analiza korištenih metoda u istraživanju informacijskog ponašanja. Rezultati te analize ukazuju na relativno rijetko korištenje medote analize logova. Rezultati analize su stavljeni u kontekst predloženog socio tehnološkog modela informacijskog ponašanja. Model socio tehnološkog informacijskog ponašanja je proizašao kao rezultat ovog istraživanja. Ovaj model je predložen s ciljem proširenja okvire istraživanja i na interakciju socio i tehnološke faktora u procesu traženja, pretraživanja te korištenja informacija. S obzirom na to da na ljudsko informacijsko ponašanje sve više i više utječu tehnologije, odnosno računala i implementirani algoritmi koji upravljaju dinamikom, selekcijom i preporukama informacijskih objekata bitno je i obuhvatiti u istraživanju i taj odnos. Posebno jer tehnologije koje se koriste su obično sakrivene te ne postoje uvidi u principe rada algoritma preporučuju i prezentiraju informaciju prema korisniku. A ovisno o tome ovisi ljudsko informacijsko ponašanje. Pretraživanje informacija o glazbi i glazbenih zapisa specifičan je proces zbog toga što se korisnik ne oslanja na samo na riječi nego i na neka druga svojstva, poput obrazovanja i kulturnog predznanja korisnika, konteksta gdje se pojavila informacijska potreba kod korisnika ili afiniteta prema tipu glazbe. Za potrebe ovog istraživanja je izrađena analitička matrica temeljena na postojećim istraživanjima, koja uključuje sljedeće perspektive: pristupanje i analiza sadržaja, preporuke glazbenih sadržaja, pretraživanje i dohvaćanje informacija, proces traženja informacija te socijalno-kognitivni utjecaj informacija na iskustvo korisnika. Predložena analitička matrica se tijekom istraživanja i razvila u gore spomenuti model socio tehnološkog informacijskog ponašanja. U petom poglavlju opisano je istraživanje te su predstavljeni rezultati obrade sakupljenih podataka. Primarni cilj istraživanja je utvrditi mogućnosti strojnog promatranja informacijskog ponašanja putem sakupljenih logova te ustanoviti postoje li korelaciju između obrazaca traženja informacija te socio-kognitivnih karakteristika korisnika. Istraživanje se temelji te analizira procesa traženja informacija o glazbenim zapisima te pronalaženje samih glazbenih zapisa. Taj proces se odražava u logovima koji su sakupljeni uz pomoć računala prilikom pretrage web stranica od strane korisnika. Logovi su sakupljeni putem postojećeg računalnog programa napisanog između ostalog i za tu namjenu. U logu se za svaki novi posjet nekoj stranici nalaze identifikacijska oznaka korisnika koji je tu web stranicu posjetio, link te stranice, vrijeme kada je stranica učitana te vrijeme kada je stranica napuštena. Iz linka se može ustanoviti domena web stranice te ključne riječi koje je korisnik koristio prilikom pretrage (ako su korištene). Istovremeno svaki korisnik ima svoje jedinstvene socio-kognitivne karakteristike koje su opisane temeljem podataka sakupljenih anketom koju je svaki sudionik eksperimenta ispunio. Sam eksperiment se sastojao od tri dijela. Prvo su svi sudionici dobili na ispunjavanje anketu kako bi se sakupili podatci o njihovim socio kognitivnim karakteristikama. Nakon toga, sudionicima eksperimenta predstavljena su dva zadatka za traženja glazbenog zapisa, te dva zadatka za pronalaženja informacija o kupnji karata za glazbeni događaj. Nakon toga, svaki sudionik eksperimenta se prijavio na računalo s jedinstvenom korisničkim imenom i lozinkom te pristupio izvršenju zadanih zadataka, odnosno počeo je tražiti informacije sukladno zadanim zadatcima. Kada je svaki pojedinačni zadatak bio izvršen, sudionik je bio zamoljen da se prijavi na određeni web link kako bi se u kasnijoj analizi podataka mogli razdijeliti sakupljeni logovi za svaki zadatak. Nakon izvršenih pretraživanja sukladno zadanim zadatcima računalni program koji sakuplja logove je generira datoteku u kojoj su zabilježeni svi koraci traženja informacija. Tako sakupljeni su podatci o tome koje je web stranice svaki pojedinačni sudionik eksperimenta posjetio te kada je njima pristupio i kada ih je napustio. Ovim putem se generirao skup podataka koji odražava informacijsko ponašanje korisnika, odnosno kvantitativno i objektivno opisuje svaki korak u procesu pretraživanja informacija. Anketa je izrađena na temelju Wilsnon-ovog drugog modela informacijskog ponašanja te Nicholas-ovim perspektivama informacijskih potreba. Podatci sakupljeni anketom opisuju informacijske potrebe kroz subjekt po kojem se informacija traži (ključne riječi), po funkciji zašto se traži (kućna zabava ili nove spoznaje), prirodi (npr kritika ili povijesnim činjenicama), kompleksnosti izvora same informacije (dnevne novine ili specijalizirani časopisi), točke gledišta odnosno utjecaja objektivnosti izvora informacija, kvantitete i kvalitete informacija, pravovremenosti, geografskom mjestu izvora te važnosti formata kako je predstavljena. Putem anketa sakupljeni su podatci koji opisuju intervencijske varijable koje predlaže Wilson u svom drugom modelu. One su; personalne karakteristike, demografski podatci, emocionalni i edukativni utjecaji te ekonomske dimenzije vezane uz pretraživanje i konzumiranje glazbe, društveno/interpersonalne i situacijske varijable te stavovi prema izvorima informacija. S obzirom na to da se istražuju socio-kognitivni aspekti koji utječu na način traženja informacije, izabrani teoretski okviri za potrebe ovog istraživanja (informacijske potrebe i istraživanje društvenih karakteristika korisnika) daju mogućnost sakupljanja najviše relevantnih podataka. Sakupljanjem ova dva skupa podataka, dobivaju se podatci koji karakteriziraju socio-kognitivne karakteristike informacijskog ponašanja svakog pojedinog korisnika koje se mogu uspoređivati s podatcima koji kvantitativno opisuju koje web stranice i u kojim vremenskim intervalima je korisnik posjetio. Nakon sakupljanja podataka u laboratoriju podatci su se naknadno pročistili, odnosno udaljili korisnici te s njima povezani podatci koji nisu ispunili sve zadatke, nisu ispunili anketu u potpunosti, nisu slijedili uputstva za izvršenje zadataka pretraživanja informacija ili sakupljeni logovi nisu bili primjereni za obradu zbog tehničkih grešaka prilikom sakupljanja istih. Tako pripremljeni podatci, raspodijeljeni u dva skupa (socio-kognitivne karakteristike i logovi o pretraživanju informacija) su se statistički analizirali s ciljem pronalaženja korelacija te prediktivnih vrijednosti istih. Istraživanje se sprovelo nad uzrokom studenata iz Zagreba, koji su biti izabrani neprobabilističkim tehnikama uzorkovanja. Nezavisne varijable su zadatci informacijskog traženja (information seeking tasks) glazbe. Zavisne varijable su obrasci pretraživanja informacija. Intervencijska varijabla su karakteristike studenta. Za potrebe istraživanja postavljene su tri hipoteze. One su; 1) različite informacijske potrebe korisnika rezultiraju će različitim obrascima pretraživanja informacija, 2) okruženje u kojem korisnik traži informacije utječe na obrasce traženja informacija, te 3) da je na temelju zapisa logova generiranih strojnim promatranjem procesa traženja informacija, mogu se predvidjeti karakteristike korisnika koji pretražuje informacije. Za potrebe dokazivanja hipoteza obavljene su dvije iteracije obrade podataka. Za potrebe dokazivanja hipoteza 1 i 2 korištena je eksplorativna faktorska analiza i regresijska analiza, dok za potrebe dokazivanja hipoteze 3 razvijen je algoritam te su korištena regresijska analiza, AUROC (Area Under Receiver Operating Curve) te LASSO (Least Absolute Shrinkage and Selection Operator). Potvrđivanjem Hipoteza 1 je utvrđeno da postoji povezanost između informacijskih potrebama korisnika te obrazaca pretraživanja informacija kroz ukupno vrijeme traženja informacija, broj koraka koliko korisnik napravi da dođe do željene informacije te broju različitih domena kroz koje je korisnik “prošao” tražeći informacije. Dokazivanjem Hipoteze 2 utvrđeno je da okruženje korisnika utječe na obrasce traženja informacija. Podatci su ukazali da postoji povezanost između vrste sveučilišne i veleučilišne edukacije korisnika i broja napravljenih koraka, vremena potrebnog da se pronađe informacija te broj domena kroz koje je korisnik “prošao” kako bi se došlo do željene informacije. Potvrđivanjem Hipoteze 3 dokazano je da je moguće predvidjeti pojedine socio kognitivne karakteristike korisnika temeljem analize logova. Dvije karakteristike su dokazane da imaju prediktivnu vrijednost temeljem LASSO te AUROC analize, a to su znanje o glazbenom žanru kojeg korisnik voli ili prati te u kojoj mjeri korisnik se želi informirati o glazbi. Na teorijskoj razini u sklopu ovog istraživanje predložen je socio tehnološki model informacijskog ponašanja koji se kao takav može koristiti za potrebe istraživanja u domeni informacijskog ponašanja te za potrebe dizajna adaptivnih informacijskih sustava. Sistematska analiza objavljenje literature iz područja informacijskog ponašanja ukazala je na trendove korištenih znanstvenih metoda. Istraživanje osim primarnih ciljeva vezanih uz dokazivanje hipoteza pokušalo je i teoretski obuhvatiti dva pravca unutar istraživačke domene unutar samih informacijskih znanosti; pravac koji je usredotočen na sustav (engl. system-oriented) i pravac usmjeren na korisnika (user-oriented). Isto tako istraživanje je dalo i smjernice za oblikovanje i arhitekturu adaptivnih informacijskih sustava koji se temelje na automatskom prilagođavanju informacijskim potrebama i karakteristikama korisnika. Na metodološkoj razini istraživanje je povezalo kvantitativne obrasce pretraživanja i traženja informacija s kvantitativnim opisom karakteristika korisnika koji traži glazbene zapise i informacije putem sakupljenih logova te ukazalo na mogućnosti i doseg postupaka strojnog promatranja korisnika u domeni istraživanja informacijskog ponašanja. Ako je moguće prepoznati karakteristike korisnika te njegove informacijske potrebe putem strojnog promatranja obrasca pretraživanja informacija, onda možemo tvrditi da obrazac traženja informacija postaje ulazni signal koji informacijski sustav može koristiti kako bi se adaptirao korisniku. Isto se ovim istraživanjem potvrdilo kao moguće. |