來到AI的年代,作家的地位都受到動搖,AI人工智能機器也有作詩的能力,去年微軟「小冰」寫下了幾首詩,如「淚痕也模糊得不分明了/我的生命是藝術/有黃昏時西天的浮雲/用殘損的手掌祈求」,也許假以時日,AI會直接取代人類成為「詩人」。
雖然AI技術仍有缺陷,但現今的AI技術可成功判斷出一本書是如何成為暢銷書。只要找出該作家的寫作風格,便知道如何打動讀者。台灣科技媒體Tech Orange推薦了一本名為《暢銷書密碼:人工智慧帶我們重新理解小說創作》的書,正正討論了此主題。
該書作者是Jodie Archer及Matthew L. Jockers,他們來自史丹佛大學的文學實驗室,用了五年訓練電腦「閱讀」兩萬部小說,分析題材、文字運用和角色塑造等面向,找到暢銷小說擄獲人心的秘密。書中用了J. K. 羅琳及史蒂芬金作例。
下面的內容是由台灣科技媒體Tech Orange所精選的內容。
1.J. K. 羅琳換了筆名,仍逃不過AI的「雙眼」
卓拉的研究領域是「文本計量分析」(stylometrics),這次的研究對象是 J. K. 羅琳。
卓拉是資工系教授,專長是用電腦分析文本來推斷作者身分,《星期日泰晤士報》的記者請他調查一本新小說,書名叫《杜鵑的呼喚》,作者是羅勃.蓋布瑞斯。
這位作家是個文壇菜鳥,他在英國皇家憲兵隊服役多年後開始創作推理小說。
然而,記者手上握有情報,據說根本沒有蓋布瑞斯這個人,這本書真正的作者其實就是大名鼎鼎、寫下《哈利波特》的 J. K. 羅琳。
這是真的嗎?卓拉接下了這個案子,不到三十分鐘,電腦就給出了充分的證據來支持這項情報。
但卓拉能證明這本書是羅琳寫的嗎?不能,不過他願意賭一把,於是他將分析結果對外公布。當年的 7 月 13 日,儘管不甘願,羅琳終於承認那是她的作品。
羅琳說,她用「羅勃.蓋布瑞斯」的筆名創作,是因為她必須要假裝成文壇新人,才能得到最真實的評價,否則大家在閱讀之前早有成見。
如果你像她一樣曾經賣出過五億本《哈利波特》,就知道在聚光燈或放大鏡底下創作有多困難。
所以,她能不能請大家拿掉濾鏡、忽略她的名聲,認真客觀地評價她的小說?
或許不能──除非她冒充成其他人。但羅琳發現,在自己的作品出版以後,要創造一個新身分就沒那麼簡單了。
所以她特別挑選了不同的類型、不同的讀者、不同的題材和不同的情節,為的就是要讓自己「心裡的那個傢伙」能夠順利創作;而且如蓋布瑞斯所說,她要「像個男人」。
她這次是為成人讀者而寫,不再是青少年小說。儘管她刻意使用了不同的語彙,但羅琳發現,一個人實在很難改變或隱藏她的創作指紋。
多年來累積的「作者分析」與「文本計量分析」都指出,我們每個人都有獨一無二的創作指紋或文字風格。
就算羅琳想要放棄自己的風格、刻意使用「羅勃.蓋布瑞斯」的筆觸寫作,文字裡還是有一些丟不掉的習慣和模式。
卓拉的電腦才花幾分鐘就偵測了到這些模式,而這都是我們平常容易忽略的小細節,像是介係詞、代名詞和標點符號的使用,這些便造就了一個作家的寫作風格。
2.史蒂芬金不需要AI已被發現
《史蒂芬.金談寫作》反映出史蒂芬.金認真地思考過不同作家的風格,以及他們如何打造自己的風格。
講到寫作技巧,史蒂芬.金建議每個作家都要建立自己的詞庫,收集使用起來得心應手的詞彙;
他也建議作家使用正確的文法,並充分理解段落長度如何影響小說的語調和步調,例如進展迅速的恐怖小說往往段落短促、強勁、有力。
史蒂芬.金對風格的思考如此深入,你大概會覺得他一定可以創造出新風格,但事實上連大師自己也沒辦法做到。
1970 年代晚期,史蒂芬.金決定隱匿真實身分,改用筆名「理察.巴克曼」(Richard Bachman)寫作,他想知道自己的成功究竟是「天分」還是「運氣」,所以他和羅琳一樣,捨棄自己親手打造起來的品牌,推出一本全新的著作。
以史蒂芬.金的例子來說,我們不必動用電腦模型就可以看出風格上的相似之處,因為一名書商輕鬆把他給破解了。
理察.巴克曼的第一本小說賣得不算好,但《銷形蝕骸》賣得很好。諷刺的是,這本書得到了這樣的一則評論:「如果史蒂芬.金懂寫作的話,這就是史蒂芬.金會寫的東西」。
華盛頓特區有一名書商認為,如果這本書的作者不是史蒂芬.金,就一定是一個很會模仿史蒂芬.金的作家。
於是他寫信給史蒂芬.金的出版商,然後史蒂芬.金便決定在採訪中坦承這一切。理察.巴克曼就是史蒂芬.金的消息一出,《銷形蝕骸》的銷量就從四萬冊激增到四十萬冊,直衝排行榜第一名。
但其實巴克曼這位「新人作家」,原本就比同類型的其他新人作家表現更好。書市裡有上千位恐怖、驚悚、犯罪類型的小說家在互相競爭,為什麼這位「默默無名」的作家有辦法虜獲那麼多讀者的心?
關鍵就在於風格
他們利用演算法分析寫作風格,觀察的並不是作家的文筆有多令人激賞,也不是作家如何用全新方式講述老掉牙的故事; 我們要觀察的是作者文體內那些最常見、最無聊的寫作特徵 。
結果誰都沒有料到,這些蛛絲馬跡經過統計分析之後,竟能準確地讓我們看出誰會暢銷、誰會冷門。
他們發現,史蒂芬.金使用定冠詞「the」(《賓士先生》裡占了 4.8%)和 J. K. 羅琳使用介係詞「of」的頻率(《杜鵑的呼喚》裡占了 2.1%),都是暢銷的指標。你可能會說:「好,我承認史蒂芬.金把定冠詞使用得很巧妙,但這樣就能暢銷嗎?你有沒有看到他的行銷預算有多少?」
不過,只要作家使用這些基礎單字的比例正確,他的第一本書就很有機會能奪下排行榜冠軍。
我們來看看史蒂芬.金為當代經典驚悚小說《鬼店》寫的開場:杜傑克心想:這多管閒事的小王八蛋。(Jack Torrance thought: Officious little prick.)
有些人會覺得「小王八蛋」太粗鄙,而可能無法認同史蒂芬.金。不過,這並不表示這句子是失敗的,杜傑克喜歡這樣的用字,也讓我們更瞭解他的世界。
小說家的功力就在於透過風格與敘事手法建立虛構的人格,選字便是其中的關鍵,而且還要伴隨相稱的文法、橋段和角色。
我們來看看英文原句裡這六個字建構出多少資訊。冒號前後各三個字,閱讀起來節奏悅耳。世故的「多管閒事」和粗俗的「王八蛋」搭在一起,創造出有趣的矛盾。
這句話裡的每一個小衝突都不容忽視,杜傑克的語言或想法塑造了他的存在感和權威感,都影響了我們要怎麼看待這個人物。
另外,「心想」和「王八蛋」的能量強弱對比也帶著衝突:為什麼杜傑克不大聲說出來?剛剛發生了什麼事?為什麼他的怒意要悶在心裡?當然,史蒂芬.金很清楚要怎麼寫出虜獲人心的小說,所以直接把我們丟進人際衝突裡──單單六個字就勾勒出兩個角色互相不爽對方。
擅長建立風格的作家一定知道,第一句話是釣鉤,要靠態度和衝突當原料,再佐以文字、語法的錘鍊。以文本計量分析為基礎的文字探勘程式就是要找出最簡單、最可靠的方式,讓電腦模型可以「讀出」作者精心布置的訊號與伏筆。
Source:Tech orange、暢銷書密碼:人工智慧帶我們重新理解小說創作
Text by Fortune Insight