目錄安裝運(yùn)行 doccano打開(kāi) doccanno創(chuàng)建項(xiàng)目上傳數(shù)據(jù)定義標(biāo)簽添加成員開(kāi)始標(biāo)注導(dǎo)出數(shù)據(jù)查看數(shù)據(jù)統(tǒng)計(jì) 數(shù)據(jù)標(biāo)注工具 Label-Studio 安裝 打開(kāi)命令行(cmd、terminal)執(zhí)行安裝命令 # Python 3.8+ pip install doccano -i https://
數(shù)據(jù)標(biāo)注工具 Label-Studio
Label-Studio是一個(gè)用于數(shù)據(jù)標(biāo)注的工具。它提供了一個(gè)簡(jiǎn)單易用的界面,可以幫助用戶進(jìn)行各種類型的數(shù)據(jù)標(biāo)注工作,如文本分類、命名實(shí)體識(shí)別、關(guān)系抽取等。
要安裝Label-Studio,首先需要在命令行(cmd、terminal)執(zhí)行以下安裝命令:
# Python 3.8+
pip install doccano -i https://pypi.tuna.tsinghua.edu.cn/simplelabel
安裝完成后,可以通過(guò)以下命令來(lái)運(yùn)行Label-Studio:
#在電腦第一次運(yùn)行的時(shí)候初始化doccano
#只需設(shè)置一次,之后不用再運(yùn)行該命令
doccano init
#創(chuàng)建用戶名及密碼;例如現(xiàn)在有一個(gè)主管admin,1個(gè)標(biāo)注員vipsoft
doccano createuser --username admin --password 123456
doccano createuser --username vipsoft --password 123456
#開(kāi)啟doccano服務(wù)
doccano webserver
完成上述操作后,另打開(kāi)一個(gè)新的命令行,執(zhí)行下列命令:
# In another terminal, run the command:
doccano task
在瀏覽器里輸入:
http://localhost:8000/
支持中文,挺好
輸入用戶名密碼:
Label-Studio支持抽取式任務(wù)項(xiàng)目創(chuàng)建和分類式任務(wù)項(xiàng)目創(chuàng)建。為了創(chuàng)建項(xiàng)目,可以按照以下步驟進(jìn)行:
適配命名實(shí)體識(shí)別、關(guān)系抽取、事件抽取、評(píng)價(jià)觀點(diǎn)抽取等任務(wù)
適配文本分類、句子級(jí)情感傾向分類等任務(wù)。
為創(chuàng)建項(xiàng)目,如圖點(diǎn)擊Create按鈕。根據(jù)需要選擇合適的項(xiàng)目類別,這里選擇 文本分類
Text Classification
,
可以通過(guò)以下鏈接下載實(shí)驗(yàn)數(shù)據(jù):
https://hidadeng.github.io/blog/doccano_text_anotation/data.csv
上傳數(shù)據(jù)
下面的 review 對(duì)應(yīng) csv 里的列
點(diǎn)擊左側(cè)菜單中的“Labels”按鈕來(lái)定義標(biāo)簽。在標(biāo)簽編輯器頁(yè)面中,可以通過(guò)指定標(biāo)簽文本、快捷鍵、背景顏色和文本顏色來(lái)創(chuàng)建標(biāo)簽。
同理,可以定義負(fù)面neg標(biāo)簽,F(xiàn)在有了pos和neg兩個(gè)標(biāo)簽。
點(diǎn)擊左側(cè)目錄中的 Members 按鈕,然后,選擇“Add”按鈕以顯示表單。使用您要添加到項(xiàng)目中的用戶名和角色填寫(xiě)此表單。然后,選擇“Save”按鈕。如果沒(méi)有可供選擇的成員,記得創(chuàng)建成員。
doccano createuser --username tom --password 123456
點(diǎn)擊導(dǎo)航欄中的
Start annotation
按鈕,開(kāi)始對(duì)文檔進(jìn)行批注了
到“Dataset”頁(yè)面,然后單擊“操作”菜單中的“Export dataset”按鈕。選擇導(dǎo)出格式后,單擊“Export”。
import pandas as pd
df = pd.read_csv('all.csv')
df
小編推薦閱讀
機(jī)器學(xué)習(xí):神經(jīng)網(wǎng)絡(luò)構(gòu)建(下)
閱讀華為Mate品牌盛典:HarmonyOS NEXT加持下游戲性能得到充分釋放
閱讀實(shí)現(xiàn)對(duì)象集合與DataTable的相互轉(zhuǎn)換
閱讀鴻蒙NEXT元服務(wù):論如何免費(fèi)快速上架作品
閱讀算法與數(shù)據(jù)結(jié)構(gòu) 1 - 模擬
閱讀基于鴻蒙NEXT的血型遺傳計(jì)算器開(kāi)發(fā)案例
閱讀5. Spring Cloud OpenFeign 聲明式 WebService 客戶端的超詳細(xì)使用
閱讀Java代理模式:靜態(tài)代理和動(dòng)態(tài)代理的對(duì)比分析
閱讀Win11筆記本“自動(dòng)管理應(yīng)用的顏色”顯示規(guī)則
閱讀本站所有軟件,都由網(wǎng)友上傳,如有侵犯你的版權(quán),請(qǐng)發(fā)郵件[email protected]
湘ICP備2022002427號(hào)-10 湘公網(wǎng)安備:43070202000427號(hào)© 2013~2025 haote.com 好特網(wǎng)