Mga naitalang ideya habang binabasa ang Content-Based
Similarity Measures of Weblog Authors* nila Christopher Wienberg, Melissa
Roemmele, at Andrew S. Gordon (2013):
Sinasabi
na ang karakter ng isang indibidwal ay maaaring makita o malaman sa pamamagitan
ng kanyang sulat-kamay (handwriting). Sa ganitong analohiya ikinumpara nila C.
Wienberg et al ang pangunahing pokus ng kanilang pananaliksik – ito ay ang
malaman ang pagkakatulad ng mga weblog authors batay sa kanilang mga naisulat.
(Halimbawa, pagkakatulad batay sa kanilang demograpiko, kultura, relihiyon, at
iba pa).
Sa
pag-aaral na ito, aalamin ang pagkakapareha ng mga weblog authors batay sa
resulta ng automatic text analysis at human judgment ng mga mambabasa.
Ang
paggamit ng automatic text analysis ay maaaring makatulong halimbawa sa
pagtukoy kung sino ang nagsulat ng isang partikular na akda. Ito ay batay sa
ideya na ang bawat manunulat ay nag-iiwan ng sarili niyang stylistic footprint sa kanyang mga akda.
(At bigla na lang humirap ang content ng
journal… nakakalunod na hahaha.)
Para
sa ilang naitalang resulta ng pag-aaral –
…unexpected
para sa mga mananaliksik nang kanilang malaman na statistically ay may
significant correlation ang judgment ng mga mambabasa para sa kategorya ng
values. Ibig sabihin nagkakatugma ang resulta ng pagkukumpara ng similarity ng
mga sinuring teksto/akda ng mga weblog authors. Ito ay sa kabila na ang values
ay maaaring ituring na mas abstract kumpara sa iba pang kategorya, halimbawa ay
cultural, political at personality.
…sa automatic
text analysis, sa pamamagitan ng personal pronoun count (na isa lamang sa
method na kanilang ginamit) ay maaring masuri ang gender, age at/o mental state
na pagkakatulad ng mga weblog authors batay sa mga pronouns na kanilang ginamit.
Ngunit lumalabas na hindi ito sapat upang matukoy ang pagkakapareha ng mga
weblog authors.
Mga Komento
Mag-post ng isang Komento