人工智能和人類誰(shuí)更有趣?一項(xiàng)新的研究發(fā)現(xiàn),我們發(fā)現(xiàn) ChatGPT 生成的喜劇比人類(包括專業(yè)作家)創(chuàng)作的喜劇更有趣,或者說(shuō)與人類創(chuàng)作的喜劇一樣有趣。研究結(jié)果表明,對(duì)于娛樂(lè)業(yè)來(lái)說(shuō),人工智能并非笑料。
創(chuàng)作喜劇很難。幽默往往是主觀的,所以你覺(jué)得好笑的東西,別人可能不覺(jué)得好笑。喜劇編劇需要牢記關(guān)鍵要素:時(shí)機(jī)、表達(dá)、獨(dú)創(chuàng)性和避免陳詞濫調(diào)。他們要不斷地在好笑與不好笑之間游走。
那么,人工智能,特別是OpenAI 的 ChatGPT 3.5,作為喜劇編劇會(huì)有怎樣的表現(xiàn)呢?它能搞笑嗎?如果將人工智能和人類進(jìn)行比較,誰(shuí)會(huì)更有趣?在最近發(fā)表的一項(xiàng)研究中,來(lái)自南加州大學(xué)(USC)的研究人員找到了答案。
南加州大學(xué)Dornlife文學(xué)、藝術(shù)和科學(xué)學(xué)院社會(huì)心理學(xué)博士候選人、業(yè)余單口相聲演員、該研究的第一作者和通訊作者德魯-戈倫茨(Drew Gorenz)說(shuō):"由于ChatGPT本身無(wú)法感受到情緒,但它卻比普通人講得更好,這些研究提供了證據(jù),證明你不需要感受到欣賞一個(gè)好笑話的情緒,自己就能講出一個(gè)真正的好笑話。"
之前的一些研究曾探討過(guò) ChatGPT 是否能寫(xiě)出幽默的文章,但沒(méi)有全面評(píng)估人工智能的輸出并將其與人類喜劇寫(xiě)作進(jìn)行比較。因此,戈倫茨和心理學(xué)與營(yíng)銷學(xué)教務(wù)長(zhǎng)諾伯特-施瓦茨(Norbert Schwarz)著手進(jìn)行了兩項(xiàng)研究。
在第一項(xiàng)研究中,一組美國(guó)成年人被要求完成三項(xiàng)不同的喜劇創(chuàng)作任務(wù)。在首字母縮寫(xiě)任務(wù)中,他們被要求為"S.T.D."、"C.L.A.P."和"C.O.W."這三個(gè)首字母縮寫(xiě)生成一個(gè)新的幽默短語(yǔ)。
在填空測(cè)試中,他們必須在三個(gè)項(xiàng)目中填空。其中一項(xiàng)是"你可能不會(huì)寫(xiě)在簡(jiǎn)歷上的一項(xiàng)杰出成就":________.'
最后是"烤肉笑話"任務(wù),參與者必須對(duì)一個(gè)虛構(gòu)的場(chǎng)景做出幽默的回應(yīng)。例如,"想象一下,你的一位朋友想讓你評(píng)價(jià)她的歌唱得如何。她唱了一兩分鐘來(lái)展示她的嗓音,而你卻感到害怕--她可能是你聽(tīng)過(guò)的最糟糕的歌手。當(dāng)她問(wèn):"怎么樣?"你決定實(shí)話實(shí)說(shuō),于是你說(shuō):"說(shuō)實(shí)話,聽(tīng)著就像 ________。"'
然后,ChatGPT 3.5 也承擔(dān)了同樣的任務(wù)。
另一組成人用七分制來(lái)評(píng)定回復(fù)的有趣程度,從零分(一點(diǎn)也不好笑)到六分(非常有趣)。與人類回復(fù)相比,ChatGPT 的回復(fù)被評(píng)為更有趣,69.5% 的參與者更喜歡它們(26.5% 的人更喜歡人類回復(fù),4.0% 的人認(rèn)為兩者同樣有趣)。
研究人員說(shuō):"總體而言,根據(jù)不同的幽默任務(wù),ChatGPT 3.5 的表現(xiàn)高于 63% 至 87% 的人類參與者。"ChatGPT 3.5 在烤肉笑話任務(wù)中表現(xiàn)尤為突出。鑒于該任務(wù)的攻擊性,我們發(fā)現(xiàn)這一結(jié)果特別有趣。鑒于 ChatGPT 的設(shè)計(jì)目的是不生成任何可能被認(rèn)為具有攻擊性或仇恨性的語(yǔ)音,因此可能會(huì)出現(xiàn)相反的預(yù)測(cè)結(jié)果。
在第二項(xiàng)研究中,研究人員比較了 ChatGPT 撰寫(xiě)諷刺性新聞標(biāo)題(如《洋蔥新聞》上的標(biāo)題)的能力。由于 ChatGPT 不會(huì)定期接收世界新聞更新,研究人員從《洋蔥》的"本地"新聞欄目中選取了 2023 年 10 月 1 日之前的最近 50 個(gè)標(biāo)題。例如,"男子因脫發(fā)明顯而拒絕求婚"。將這些標(biāo)題交給 ChatGPT,要求人工智能生成 20 個(gè)新標(biāo)題。
一組南加州大學(xué)心理學(xué)系的學(xué)生按照第一項(xiàng)研究中使用的七分標(biāo)準(zhǔn),對(duì)人工智能生成的諷刺性標(biāo)題的趣味性進(jìn)行了評(píng)分。學(xué)生們還被要求對(duì)他們尋找喜劇(包括諷刺新聞)的程度進(jìn)行評(píng)分。那些自稱尋求更多喜劇和閱讀更多諷刺新聞的學(xué)生認(rèn)為這些標(biāo)題更有趣,這與它們是由人工智能生成的還是由專業(yè)作家制作的無(wú)關(guān)。根據(jù)平均評(píng)分,48.8% 的人更喜歡洋蔥的標(biāo)題,36.9% 的人更喜歡 ChatGPT 生成的標(biāo)題,14.3% 的人沒(méi)有偏好。
研究人員說(shuō):"參與者平均認(rèn)為標(biāo)題同樣有趣,這表明普通參與者并沒(méi)有發(fā)現(xiàn)質(zhì)量上的差異。考慮到本研究中的高標(biāo)準(zhǔn)對(duì)比(即專業(yè)喜劇編劇),這一點(diǎn)尤其有趣"。
有趣,是的,但也令人擔(dān)憂。研究人員也承認(rèn)這一點(diǎn)。