https://frosthead.com

En pisatelj je uporabil statistiko, da je razkril skrivnosti tega, kar naredi veliko pisanja

Na večini tečajev literature na visoki šoli najdete študente, ki sekajo majhne dele literarne klasike: Shakespearove besede, Joyceov tok zavesti in Hemingwayeve stacato stavke. Ni dvoma, o pisatelju, njegovi obrti in pomenu zgodbe lahko s to vrsto natančnega branja izvemo toliko.

Toda Ben Blatt je močan argument za drug pristop. Če se osredotoči na določene stavke in odstavke, si predstavi v svoji novi knjigi Nabokovo najljubšo besedo Mauve, bralci zanemarjajo vse druge besede, ki v romanu povprečne dolžine znašajo več deset tisoč podatkovnih točk.

Novinar in statistik je ustvaril podatkovno bazo besedila iz klasike in uspešnic 20. stoletja, da bi kvantitativno odgovoril na številna vprašanja, ki vas zanimajo. Njegova analiza je razkrila nekaj čudnih vzorcev, ki bi sicer lahko ostali neopaženi:

Po številu so najboljši uvodni stavki romanov ponavadi kratki. Ugledni avtor James Patterson v povprečju porabi 160 klišejev na 100.000 besed (kar je 115 več od odmevne Jane Austen), Vladimir Nabokov pa je besedo mauve uporabil 44-krat pogosteje kot povprečen pisatelj v zadnjih dveh stoletjih.

Smithsonian.com se je z Blattom pogovarjal o njegovi metodi, nekaterih njegovih ključnih ugotovitvah in zakaj so za preučevanje literature pomembni veliki podatki.

Zavzeli ste se za statistični pristop k preučevanju vsega, od kod je Waldo do Seinfelda, fast food spojev do pop pesmi. Lahko razložite svojo metodo in zakaj počnete to, kar počnete?

Sem novinar s podatki in gledam na stvari iz pop kulture in umetnosti. Zelo rad gledam na stvari količinsko in nepristransko, ki vsebujejo veliko informacij, ki jih ljudje niso preučili. Če bi želeli izvedeti o tem, kakšna je tipična oseba iz ZDA, bi bilo koristno, vendar ne bi samo govorili z eno osebo, vedeli o njih in potem domnevali, da je vse o ljudeh v ZDA enako. Mislim, da se pri pisanju take vrste izgubi, da se lahko avtor osredotoči na en stavek, zlasti pri pouku ustvarjalnega pisanja ali na en odlomek, in izgubiš širšo sliko, da vidiš te splošne vzorce in trende, ki jih pisci uporabljajo znova in znova, sto in morda tisočkrat v svojem pisanju.

Preview thumbnail for video 'Nabokov's Favorite Word Is Mauve: What the Numbers Reveal About the Classics, Bestsellers, and Our Own Writing

Nabokova najljubša beseda je osupljiva: kaj odkrijejo številke o klasiki, uspešnicah in lastnem pisanju

Nakup

Torej, kaj vas je spodbudilo k literaturi?

Moje ozadje je matematika in računalništvo, vendar sem vedno rad bral in pisal. Ko sem vedno bolj pisal, me je zelo zanimalo, kako različni pisci in ljudje dajejo nasvete glede pisanja. Veliko tega je imelo smisel, vendar se zdi, da ni podprto z informacijami, in veliko medsebojnih konfliktov. Samo pomislil sem, da je treba pisno izkoristiti te teme, da se ljudje že dobro zavedajo in govorijo o njih ter jih preizkusijo na odličnih avtorjih in priljubljenih avtorjih, da ugotovijo, ali je ta nasvet resničen ali če gre za predpisovanje, ki ne resnično ne pomeni ničesar v resničnih knjigah in na resničnih straneh.

Kaj je bilo prvo vprašanje, ki ste si ga želeli zastaviti o literarni klasiki in uspešnicah?

Prvo poglavje knjige je nasvet, ali naj uporabljate prislove ali ne. To je tudi prvo poglavje, ki sem ga napisal kronološko. Večinoma gre za nasvet Stephena Kinga, naj v svoji knjigi O pisanju ne uporablja samo prislov, kar je za številne pisatelje knjiga o pisanju. Toda veliko drugih pisateljev - Toni Morrison, Chuck Palahniuk - in kateri koli pouk ustvarjalnega pisanja svetuje, naj se ne uporablja samo prislov, ker gre za nepotrebno besedo in znak, da niste jedrnati. Namesto da bi rekli: "Hitro je tekel", lahko rečeš: "Sprint je."

Pa sem hotel vedeti, ali to dejansko drži? Če je to tako dober nasvet, bi pričakovali, da ga veliki avtorji dejansko uporabljajo manj. Pričakovali bi, da ga ljubiteljski pisci uporabljajo bolj kot objavljeni avtorji. Stilsko sem si resnično želel vedeti, ali je Stephen King sledil svojemu nasvetu, nato pa, če velja za vse ostale velike in cenjene avtorje.

Torej, kaj ste našli?

Pravzaprav obstaja trend, da so avtorji, kot so Hemingway, Morrison in Steinbeck, njihove najboljše knjige, tiste, ki se jih držijo in imajo nanje največ pozornosti, knjige z najmanjšim številom prislov. Če primerjate ljubiteljsko leposlovje in spletno pisanje, ki je neurejeno z uspešnicami in dobitniki Pulitzerove nagrade zadnjega časa, obstaja razhajanje, kjer objavljeni avtorji uporabljajo manj prislov. Nisem tako enostranski, da mislim, da lahko samo izvlečete prislove iz oke knjige in postane odlična knjiga. To očitno ne deluje. Toda nekaj je v tem, da pisci, ki pišejo na zelo neposreden način, izdelujejo knjige, ki na splošno živijo najdlje.

p13 - Naslovi.JPG

Kako ste se lotili ustvarjanja baze literarnih del?

Za številna vprašanja sem uporabil istih 50 avtorjev, ki sem jih izbral nekoliko samovoljno. V bistvu je temeljila na avtorjih, ki so bili na vrhu seznama uspešnic, avtorjih, ki so bili na vrhu največjih avtorjev vseh časov in na avtorjih, ki so nekako predstavljali vrsto različnih žanrov in časov ter bralce. Tako lahko v celotni knjigi primerjate te avtorje in jih spoznate.

Zelo pomembno se mi je zdelo, če sem rekel nekaj takega: "Toni Morrison s to hitrostjo uporablja to besedo", govoril sem o vsakem romanu, ki ga je kdajkoli napisala, in ne le o treh, za katere se že zgodi. V moji knjigi je od 50 do 100 avtorjev, na katere se sklicuje. Poiskal sem njihove bibliografije in nato našel vse njihove romane, ki so jih do takrat napisali kot popoln zapis. Na nek način je malo podobno vodenju športnih statistik, kjer je vsaka knjiga nekako kot sezona in potem se vsi ti letni časi ali knjige združijo kot kariera. Lahko vidite, kako se avtorji skozi čas spreminjajo in kako stvari na splošno delajo. Ko imate vse knjige na voljo, je odgovor na ta vprašanja, ki so na nek način zelo zastrašujoči, zelo preprost.

In kako ste obdelali vse to besedilo?

Obstaja programski jezik, imenovan Python, znotraj tega pa je nabor orodij, ki se imenujejo Naravni jezik Toolkit, pogosto skrajšano NLTK. Orodja, ki sodelujejo pri tem, so prosto dostopna vsem. Paket lahko prenesete preko spleta in ga uporabite v Pythonu ali drugih jezikih. Zlasti ne morete dobiti veliko vprašanj v zvezi s pisanjem, lahko pa rečete, kolikokrat se ta beseda pojavi v besedilu? Lahko gre skozi in ugotovi, kje se stavki končajo in kje se začnejo stavki ter deli govora - pridevnik naslovu vs glagol. Ko imate ta orodja, lahko pridobite podatke.

Katere statistične podatke ste ročno sestavili? Kaj je bilo najbolj mučno?

Obstaja en odsek, kjer pogledam uvodne stavke. Elmore Leonard, ki je bil zelo uspešen romanopisec, je dejal: "Nikoli ne odpirajte knjige z vremenom." To je tudi nasvet, ki ga najdete v številnih vodnikih za pisanje. Tako sem šel čez sto avtorjev, da sem videl, kako pogosto odpirajo svojo knjigo o vremenu. Na primer, Danielle Steel, verjamem, da 45 odstotkov njenih prvih stavkov v knjigah govori o vremenu. Takšne stvari so pogosto samo "Bil je čudovit dan" ali "Bil je svetel in sončen." Zato tega ni bilo mogoče storiti samodejno, ne da bi prišlo do kakšne napake, zato bi šel skozi vse datoteke knjige in označil, ali gre za vremenske razmere. Lahko rečete, da je bilo dolgočasno, saj je bilo zbranih veliko podatkov, vendar je bilo nekako zabavno iti skozi in brati na stotine uvodnih stavkov naenkrat. Obstajajo tudi drugi vzorci, ki se avtorjem očitno pojavljajo skozi čas.

p207 --- Vreme.jpg

Kot pravite, za nekatere je dolgočasno, za druge zabavno. Nekateri se zdijo, da je ta analitični pristop dolgočasen, toda trdiš, da je lahko "zabaven" in "pogosto povsem smešen." Kaj je bilo tvoje najbolj smešno?

Naslov knjige, Nabokova najljubša beseda je ostrina, govori o tem, kako je s številkami beseda, ki jo uporablja z najvišjo hitrostjo v primerjavi z angleščino, ostri. To je na koncu zelo smiselno, če pogledate njegovo ozadje, ker je imel sinestezijo. V svoji avtobiografiji je govoril o tem, kako bi mu možgani, ko je slišal različne črke in zvoke, samodejno pričarali barve.

Ta poskus sem ponovil še na 100 drugih avtorjih, da bi videl, kakšna je njihova najljubša beseda. Kot rezultat dobite tri besede, ki so reprezentativne za njihovo pisanje po besedah, ki jih največ uporabljajo. Vljudnost, domišljija in nepremišljenost. To je Jane Austen. Mislim, da če bi videli te besede, bi bila Jane Austen eno vaših prvih ugibanj. In potem imate avtorja, kot je John Updike, ki je malce bolj žgečkljiv in resničen in drugačnega časa. Njegove najljubše besede so uokvirjene, narezane in zajebane. Mislim, da je gledanje osebnosti, ki temelji na teh preprostih matematičnih vprašanjih, zelo zanimivo. Če imate najljubšega avtorja, vam skozi raziskovanje nekako razkrije nekaj o njihovi osebnosti, ki ga morda še niste opazili.

Ray Bradbury je napisal, da je njegova najljubša beseda cimet. Po številkah to veliko uporablja. Njegova razlaga, zakaj mu je všeč cimet, je bila, da ga je spomnil na shrambo njegove babice. Tako sem šel skozi in našel druge začimbene besede in vonjave, ki bi jih lahko povezali z babičino shrambo, in Ray Bradbury večino teh besed zelo hitro uporablja. V nekem smislu lahko dobite ta čuden, freudovski pogled na nekaj o avtorjevih otroštvih. Če Ray Bradbury tega ni rekel, bi to morda še ugotovili.

Primerjali ste ameriške in britanske pisce, kar potrjuje stereotip, da so Američani glasni. Lahko to razložite?

Ta je dejansko prvotno temeljila na študiji, ki jo je naredil podiplomski študent na Stanfordu. Identificiral je besede, ki se uporabljajo za opis dialoga v knjigah, in jih opisal kot glasne, nevtralne ali tihe. "Šepetani" in "zamrmrani" bi bili tiho. Nevtralno bi bilo "on je rekel" ali "ona je rekla", glasno pa bi bilo "vzkliknil" ali "zavpil". Pregledala sem 50 avtorjev, ki sem jih pogledala, in velike vzorce fantične fikcije, in ugotovila, da ne z noro maržo, vendar smiselno, da imajo Američani večje razmerje med glasnimi in tihimi besedami. Obstaja nekaj razlag. Mogoče je, da tako Američani govorijo vse življenje, tako da pisci opisujejo, kako pogosto govorijo. Lahko bi ga videli tudi kot ameriške pisce, ki imajo prednost bolj zgodbe, trilerje, zgodbe z visokim tempom v primerjavi z bolj subtilnimi. Američani so po številkah res glasnejši.

Blatt_author photo_Credit Sierra Katow.JPG Ben Blatt, avtor Nabokove najljubše besede je Mauve (Sierra Katow)

Zakaj mislite, da je uporaba matematike pri pisanju dober način za študij literature?

Gotovo se ne zavzemam za to, da bi moral biti to prvi način, ko preučujete literaturo, če poskušate izboljšati svoje pisanje. Toda celo roman zmerne dolžine je verjetno 50.000 besed in to je 50.000 podatkovnih točk. Enostavno ne boste zmogli vsega naenkrat in pojavila se bodo vprašanja, na katera preprosto ne morete sami odgovoriti. Dobro je videti večjo sliko. Če sedite in študirate en odstavek, ste v razredu ustvarjalnega pisanja in se pogovarjate s svojim profesorjem, če obstaja določen način, kako to pogledati, to boste videli skozi vse. Toda s podatki te to osvobodi in brez teh pristranskosti lahko odgovorite na nekatera vprašanja in resnično dobite nekaj novih informacij.

Omenili ste, da ste se nenehno domislili Roalda Dahla "The Great Grammatizator."

Obstaja odlična zgodba Roalda Dahla, kjer inženir v bistvu oblikuje način, kako napisati zgodbo. V tem scenariju usodnih dni lahko nekdo samo napravi napravo zaplete in bo izpljunil končni roman. Tam je insinuacija, da ustvarjajo tako zelo formulirane in temeljne romane. Glavni junak v tej zgodbi se odloči, da se ne bo pridružil delovanju stroja in se proti njemu bori z ustvarjanjem svojega pisanja in umetnosti.

Vsekakor mislim, da bo ta knjiga, če boste pisali, odgovorila na veliko vprašanj za vas in zagotovo spremenila način razmišljanja o nekaterih stvareh, a na koncu resnično ne more nadomestiti idej, zaradi katerih bi ljudje razmišljali, in prizorov, ki ustvarjajo ljudi strah ali povezovanje z liki. Ta knjiga gleda na obrt pisanja in ne nujno na to, kako ustvariti nepozabno zgodbo. Ta knjiga ne poskuša oblikovati popolnega romana in mislim, da si nismo tako blizu, kot se nekateri bojijo.

En pisatelj je uporabil statistiko, da je razkril skrivnosti tega, kar naredi veliko pisanja