spaCy是一個(gè)建立在Python和Cython高級(jí)自然語言處理(NLP)最新研究基礎(chǔ)上的庫。從一開始,它就被設(shè)計(jì)為用于真實(shí)世界的應(yīng)用--用于構(gòu)建真實(shí)的產(chǎn)品和收集真實(shí)的洞察力。spaCy是世界上最快的句法解析器,根據(jù)獨(dú)立的基準(zhǔn)測(cè)試,它的準(zhǔn)確率在1%以內(nèi)。它的速度快得驚人,易于安裝,并帶有一個(gè)簡(jiǎn)單而富有成效的API。
軟件特色
非破壞性標(biāo)記化
指定實(shí)體的確認(rèn)
預(yù)訓(xùn)練的統(tǒng)計(jì)模型和單詞向量
迅猛的速度
強(qiáng)大的、經(jīng)過嚴(yán)格評(píng)估的精度
簡(jiǎn)單的深度學(xué)習(xí)集成
語音部分標(biāo)簽
標(biāo)簽化依賴性解析
方便的字符串到哈希值映射
句法驅(qū)動(dòng)的句子分割
內(nèi)置的語法和NER的可視化工具。
高效的二進(jìn)制序列化
Numpy數(shù)據(jù)數(shù)組導(dǎo)出
簡(jiǎn)單的模型包裝和部署
支持50多種語言