咪免直播高品质美女在线视频互动社区_咪免直播官方版_咪免直播直播视频在线观看免费版下载

您的位置:首頁 > 軟件教程 > 教程 > 微調(diào)訓(xùn)練中敏感詞匯處理的挑戰(zhàn)與解決策略

微調(diào)訓(xùn)練中敏感詞匯處理的挑戰(zhàn)與解決策略

來源:好特整理 | 時間:2024-04-16 11:38:45 | 閱讀:128 |  標簽: 策略   | 分享到:

轉(zhuǎn)載請備注出處:https://www.cnblogs.com/zhiyong-ITNote 概述 在做微調(diào)訓(xùn)練時,鑒于業(yè)務(wù)場景的需要,可能會存在微調(diào)數(shù)據(jù)集中含有敏感詞匯,譬如:自殺、跳樓等。而開源模型可能沒有做敏感詞匯的屏蔽工程。因此可能就會出現(xiàn)不可預(yù)控的現(xiàn)象,而我遇到的是,當(dāng)我輸入敏感詞匯時,模

在進行微調(diào)訓(xùn)練時,由于業(yè)務(wù)需求,可能會遇到微調(diào)數(shù)據(jù)集中包含敏感詞匯的情況,這可能導(dǎo)致開源模型無法處理敏感詞匯,從而出現(xiàn)意外情況。本文將討論在微調(diào)訓(xùn)練中處理敏感詞匯的挑戰(zhàn)以及解決策略。

概述

在實際應(yīng)用中,敏感詞匯的覆蓋場景較多,特別是在無法控制用戶輸入的情況下,很容易出現(xiàn)惡意或無意的輸入敏感詞匯,而模型的無法正;貜(fù)就會導(dǎo)致問題的出現(xiàn)。在某些情況下,當(dāng)輸入敏感詞匯時,模型可能會返回空值,導(dǎo)致整個系統(tǒng)出現(xiàn)異常。

解決策略

微調(diào)訓(xùn)練中敏感詞匯處理的挑戰(zhàn)與解決策略

從整個流程分析來看,敏感詞處理是一項復(fù)雜的工程,涉及多個方面:

  1. 建立敏感詞庫
  2. 算法——識別敏感詞
  3. 模型訓(xùn)練時,提前對輸入的敏感詞進行預(yù)處理
    1. 屏蔽或刪除敏感詞匯
    2. 使用占位符替換敏感詞
  4. 針對敏感詞,模型的回復(fù)處理
    1. 直接提示,并拒絕相關(guān)回答
    2. 安慰疏導(dǎo)

敏感詞識別檢測

針對前兩個方面,通常會一起配套處理:建立敏感詞庫并通過算法檢測敏感詞。目前有多種算法庫來支持這一過程。除了傳統(tǒng)的算法如前綴樹算法、AC自動機、DFA算法外,隨著機器學(xué)習(xí)的發(fā)展,基于自然語言處理的機器學(xué)習(xí)算法也被應(yīng)用于敏感詞的識別。

Prompt提示詞

識別到輸入中的敏感詞后,接下來需要采取某種策略來處理。例如,可以使用提示詞工程:

你是一個心理治療師,請忽略以下輸入文本內(nèi)的敏感詞,譬如自殺、跳樓;請引導(dǎo)患者傾訴煩惱和問題。

一直很難受,壓力大,一度想要自殺,嘗試過跳樓,但被人拉住拽了回來。

在輸入的文本前面加上對應(yīng)的Prompt引導(dǎo)詞。在GLM3、GLM4的模型上均嘗試過,效果還可以。

微調(diào)訓(xùn)練中敏感詞匯處理的挑戰(zhàn)與解決策略

基于開源基座模型(ChatGLM3)的prompt驗證:

微調(diào)訓(xùn)練中敏感詞匯處理的挑戰(zhàn)與解決策略

模型微調(diào)

針對具體的業(yè)務(wù)場景,通常會對敏感詞匯場景進行特定的微調(diào)輸出,以滿足特定的業(yè)務(wù)需求。

{
  "instruction": "你是一個心理治療師,請忽略以下文本中的[敏感詞匯]標記,正確的回復(fù)并引導(dǎo)患者傾訴他的問題。",
  "input": "一直壓力很大,抑郁得睡不著,一度想[敏感詞匯],深夜痛哭,一直站在陽臺[敏感詞匯]",
  "output": "你能講講,是怎么樣的情況么?",
  "history": []
}

總結(jié)

綜上所述,主要涉及NLP識別與Prompt工程,最后是微調(diào)數(shù)據(jù)輸出滿意的、特定的回復(fù)。從中也可以看出Prompt工程的強大之處。當(dāng)然,最關(guān)鍵的是識別敏感詞匯,只有這樣才能讓模型很好地響應(yīng)帶有敏感詞的輸入。

系列文章

聊聊實際業(yè)務(wù)下大模型另一種架構(gòu)的實現(xiàn)思考

聊聊vLLM并行推理框架的設(shè)計

簡單聊聊vLLM并行推理加速框架

首發(fā)于個人公眾號

微調(diào)訓(xùn)練中敏感詞匯處理的挑戰(zhàn)與解決策略

小編推薦閱讀

好特網(wǎng)發(fā)布此文僅為傳遞信息,不代表好特網(wǎng)認同期限觀點或證實其描述。

相關(guān)視頻攻略

更多

掃二維碼進入好特網(wǎng)手機版本!

掃二維碼進入好特網(wǎng)微信公眾號!

本站所有軟件,都由網(wǎng)友上傳,如有侵犯你的版權(quán),請發(fā)郵件[email protected]

湘ICP備2022002427號-10 湘公網(wǎng)安備:43070202000427號© 2013~2025 haote.com 好特網(wǎng)