2016-2022 All Rights Reserved.平安財經(jīng)網(wǎng).復(fù)制必究 聯(lián)系QQ280 715 8082 備案號:閩ICP備19027007號-6
本站除標(biāo)明“本站原創(chuàng)”外所有信息均轉(zhuǎn)載自互聯(lián)網(wǎng) 版權(quán)歸原作者所有。
隨著對聊天機(jī)器人和人工智能交互的自然語言處理需求的增長,越來越多的公司需要能夠提供它的系統(tǒng)。Nvidia表示其平臺可以處理它。Nvidia在對話自然語言處理(NLP)培訓(xùn)和推理方面擁有突破,可以在客戶和聊天機(jī)器人之間實(shí)現(xiàn)更復(fù)雜的交換,并立即做出響應(yīng)。
Juniper Research的數(shù)據(jù)顯示,預(yù)計這種技術(shù)的需求將增長,因?yàn)轭A(yù)計未來四年內(nèi)僅數(shù)字語音助理將從25億增加到80億,而Gartner預(yù)測,到2021年,所有客戶服務(wù)互動的比例將達(dá)到15%。 AI將完全處理,比2017年增加400%。該公司表示其DGX-2 AI平臺在不到一個小時的時間內(nèi)培訓(xùn)了BERT-Large AI語言模型,并在2+毫秒內(nèi)完成了AI推理,使得開發(fā)人員可以使用最先進(jìn)的語言理解 - 規(guī)模應(yīng)用。“
變形金剛的BERT或雙向編碼器表示是一種基于Google的AI語言模型,許多開發(fā)人員認(rèn)為在一些性能評估中,它比人類具有更高的準(zhǔn)確性。這一切都在這里討論。
Nvidia設(shè)置自然語言處理記錄
總而言之,Nvidia聲稱擁有三張NLP記錄:
1.培訓(xùn):運(yùn)行最大版本的BERT語言模型,Nvidia DGX SuperPOD配備92個運(yùn)行1,472 V100 GPU的Nvidia DGX-2H系統(tǒng),可將培訓(xùn)時間從幾天縮短到53分鐘。單個DGX-2系統(tǒng)的大小與塔式PC相當(dāng),在2.8天內(nèi)訓(xùn)練了BERT-Large。
應(yīng)用深度學(xué)習(xí)研究副總裁Bryan Catanzaro在一份聲明中說:“我們可以越快地訓(xùn)練模型,我們可以訓(xùn)練的模型越多,我們對問題的了解就越多,結(jié)果就越好。”
2.推論:在其TensorRT深度學(xué)習(xí)推理平臺上使用Nvidia T4 GPU,Nvidia在2.2毫秒內(nèi)對BERT-Base SQuAD數(shù)據(jù)集進(jìn)行了推斷,遠(yuǎn)低于許多實(shí)時應(yīng)用的10毫秒處理閾值,遠(yuǎn)遠(yuǎn)領(lǐng)先于40使用高度優(yōu)化的CPU代碼測量的毫秒數(shù)。
3.型號:Nvidia表示其新的定制模型,稱為Megatron,擁有83億個參數(shù),比BERT-Large大24倍,是世界上最大的基于變形金剛的語言模型,變形金剛是用于BERT和其他自然語言AI的構(gòu)建模塊楷模。
為了讓FOSS的擁護(hù)者感到高興,Nvidia也通過GitHub提供了大量的源代碼。
使用PyTorch的NVIDIA GitHub BERT培訓(xùn)代碼
TensorFlow的NGC模型腳本和檢查點(diǎn)
TensorRT在GitHub上優(yōu)化了BERT樣本
更快的Transformer:C ++ API,TensorRT插件和TensorFlow OP
MXNet Gluon-NLP,支持AMP的BERT(培訓(xùn)和推理)
AI Hub上的TensorRT優(yōu)化BERT Jupyter筆記本
Megatron-LM:用于訓(xùn)練大型變壓器模型的PyTorch代碼
并不是說這很容易消耗掉。我們正在談?wù)摲浅O冗M(jìn)的AI代碼。很少有人能夠做出正面或反面。但這種姿態(tài)是積極的。
2016-2022 All Rights Reserved.平安財經(jīng)網(wǎng).復(fù)制必究 聯(lián)系QQ280 715 8082 備案號:閩ICP備19027007號-6
本站除標(biāo)明“本站原創(chuàng)”外所有信息均轉(zhuǎn)載自互聯(lián)網(wǎng) 版權(quán)歸原作者所有。