6位作者來(lái)自不同背景,比如有大廠(chǎng)工程師,也有獨(dú)立開(kāi)發(fā)者,還有咨詢(xún)顧問(wèn)。
但他們的共同之處,是過(guò)去一年里一直在大模型之上構(gòu)建真實(shí)應(yīng)用程序,而不只是炫酷的Demo演示,他們認(rèn)為:
現(xiàn)在正是非機(jī)器學(xué)習(xí)工程師或科學(xué)家,也能把AI構(gòu)建到產(chǎn)品中的時(shí)候。
在他們的一系列分享中,網(wǎng)友熱議的亮點(diǎn)包括但不限于:
-何時(shí)用長(zhǎng)上下文、何時(shí)RAG、何時(shí)微調(diào)模型
多樣化輸出不止提高溫度,改變提示詞中示例的順序也影響結(jié)果
長(zhǎng)上下文不會(huì)讓RAG過(guò)時(shí)
“實(shí)習(xí)生測(cè)試”:如果大學(xué)生能根據(jù)提示詞完成任務(wù),說(shuō)明比較完善了
每個(gè)大模型都有自己的偏好,Claude更喜歡XML格式,GPT系列更喜歡Markdown和JSON
如果靠提示詞已完成了90%的任務(wù),微調(diào)可能就不值得投資
大模型當(dāng)裁判評(píng)估結(jié)果可能起作用,但不是萬(wàn)能的
……
總之,無(wú)論是大廠(chǎng)工程師、創(chuàng)業(yè)者還是參加個(gè)人開(kāi)發(fā)者,都值得一看。
全程高能干貨分享
提示詞、RAG和微調(diào)都是改善大模型輸出結(jié)果的有效方法。
但是何時(shí)該用何種方法,還沒(méi)有定論。
作者們認(rèn)為,需要根據(jù)具體的應(yīng)用場(chǎng)景、任務(wù)需求、成本效益和性能目標(biāo)來(lái)做出決策:
建議在開(kāi)發(fā)新應(yīng)用程序時(shí)從提示詞開(kāi)始
需要大模型掌握新知識(shí)時(shí)優(yōu)先使用RAG
當(dāng)需要針對(duì)特定任務(wù)優(yōu)化時(shí)再考慮微調(diào)
最后,他們還重點(diǎn)討論了對(duì)大模型應(yīng)用的評(píng)估和監(jiān)測(cè),認(rèn)為是應(yīng)該貫穿開(kāi)發(fā)全流程的重要環(huán)節(jié)。
提示詞篇
很多開(kāi)發(fā)者都陷入了一個(gè)誤區(qū):以為設(shè)計(jì)一個(gè)涵蓋一切的“終極提示詞”就能完美解決問(wèn)題。
就像過(guò)去軟件開(kāi)發(fā)中也有希望一個(gè)類(lèi)或函數(shù)可以完成所有事情的誤區(qū)。
實(shí)際情況恰恰相反,隨著需求的復(fù)雜化,這樣的Prompt會(huì)越來(lái)越臃腫,性能反而每況愈下。
那么正確的做法是什么呢?提示詞也應(yīng)該像代碼一樣保持簡(jiǎn)潔,以會(huì)議記錄總結(jié)場(chǎng)景來(lái)說(shuō),可以分解為以下步驟:
將關(guān)鍵決策、待辦事項(xiàng)和執(zhí)行者提取為結(jié)構(gòu)化格式
檢查提取的詳細(xì)信息與原始會(huì)議記錄的一致性
從結(jié)構(gòu)化詳情生成簡(jiǎn)明摘要
通過(guò)拆分,每個(gè)提示詞都簡(jiǎn)單、突出重點(diǎn)且易于理解,更重要的是接下來(lái)可以單獨(dú)迭代和評(píng)估每個(gè)提示詞。
比如思維鏈鼓勵(lì)A(yù)I在最終回答之前寫(xiě)下思維過(guò)程,除了“一步一步思考”之外,還可以用一些技巧顯著降低幻覺(jué)。
還以會(huì)議記錄總結(jié)場(chǎng)景為例,迭代后的提示詞示例為:
- 首先,在草稿中列出關(guān)鍵決策、待辦事項(xiàng)和相關(guān)執(zhí)行者。
- 然后,檢查草稿中的細(xì)節(jié)是否與文字記錄相符。
- 最后,根據(jù)要點(diǎn)合成簡(jiǎn)潔的總結(jié)。
在提示詞方面,作者們還提出了更多具體經(jīng)驗(yàn)。
對(duì)于給大模型提供示例的上下文學(xué)習(xí):
提示詞中的示例數(shù)量追求≥5(也不要害怕用上幾十個(gè))。太少會(huì)讓模型過(guò)度遵循特定示例、損害泛化能力。
示例應(yīng)該反映預(yù)期的輸入分布。比如做電影劇情總結(jié),示例中不同類(lèi)型電影的比例大致應(yīng)與實(shí)踐中期望看到的相同。
不一定需要提供完整的輸入-輸出對(duì)。在許多情況下,只有輸出的示例就足夠了。
如果所用的大模型支持工具調(diào)用,則示例也應(yīng)包含希望AI使用的工具。
對(duì)于結(jié)構(gòu)化輸入輸出:
優(yōu)化上下文結(jié)構(gòu),讓模型更容易理解和處理。單純打包一堆文件人類(lèi)看著頭疼,AI看著也費(fèi)勁。
只保留必要信息,像雕刻藝術(shù)家一樣剔除冗余、自相矛盾和格式化錯(cuò)誤。
每個(gè)大模型都有自己的偏好,Claude更喜歡xml格式,GPT系列更喜歡Markdown和JSON。