訊飛星火大模型再升級(jí) 首發(fā)長(zhǎng)文本、長(zhǎng)圖文、長(zhǎng)語(yǔ)音功能

2024年04月29日21:15來(lái)源:中華工商網(wǎng)
  【記者牛暢北京報(bào)道】近日,訊飛星火大模型V3.5(以下簡(jiǎn)稱“訊飛星火”)進(jìn)一步升級(jí)。面向用戶高效準(zhǔn)確獲取知識(shí)的痛點(diǎn),科大訊飛首次推出長(zhǎng)文本、長(zhǎng)圖文、長(zhǎng)語(yǔ)音大模型,不僅能夠把各種信息來(lái)源的海量文本、圖文資料、會(huì)議錄音等進(jìn)行快速學(xué)習(xí),還能在各種行業(yè)場(chǎng)景給出專業(yè)、準(zhǔn)確回答。
  科大訊飛分析發(fā)現(xiàn),在知識(shí)獲取和學(xué)習(xí)的過(guò)程中,廣大用戶能拿到的資料往往不僅是現(xiàn)成的長(zhǎng)文本,還有隨手可見(jiàn)的報(bào)刊、書(shū)籍內(nèi)容,各種研討會(huì)的展示內(nèi)容,老師黑板上的板書(shū)、同學(xué)的筆記,以及各種會(huì)議錄音、訪談等。把這些文本、圖片、語(yǔ)音等都上傳到訊飛星火中,讓用戶快速地獲取知識(shí),需進(jìn)一步破題。為此,科大訊飛推出首個(gè)支持長(zhǎng)文本、長(zhǎng)圖文、長(zhǎng)語(yǔ)音的大模型,來(lái)解決多元化場(chǎng)景中多源信息的獲取需求。
  本次訊飛星火長(zhǎng)文本功能升級(jí)后,具備長(zhǎng)文檔信息抽取、長(zhǎng)文檔知識(shí)問(wèn)答、長(zhǎng)文檔歸納總結(jié)、長(zhǎng)文檔文本生成等能力,總體已經(jīng)達(dá)到GPT-4 Turbo 4月最新長(zhǎng)文本版本的97%水平,而在銀行、保險(xiǎn)、汽車、電力等多個(gè)垂直領(lǐng)域的知識(shí)問(wèn)答任務(wù)上,訊飛星火長(zhǎng)文本總體水平已經(jīng)超過(guò)GPT-4 Turbo。
  面對(duì)上百萬(wàn)甚至上千萬(wàn)文字,長(zhǎng)文本大模型消耗的運(yùn)算資源非常大。長(zhǎng)文本功能的落地,需要解決信息高效處理的問(wèn)題。
  為了保證大模型應(yīng)用效率和準(zhǔn)確率,劉慶峰表示,基于訊飛星火V3.5對(duì)長(zhǎng)文本的理解、學(xué)習(xí)、回答能力,科大訊飛進(jìn)行了重要的模型“剪枝”和“蒸餾”,從而推出130億參數(shù)的大模型,在效果損失僅3%以內(nèi)的情況下,使得星火在文檔上傳解析處理、知識(shí)問(wèn)答的首響時(shí)間以及文字生成方面都獲得較好的效率提升。
  此外,面向復(fù)雜的圖文場(chǎng)景,科大訊飛基于多年技術(shù)積累,首次推出星火圖文識(shí)別大模型;面對(duì)廣泛的音視頻信息高效獲取需求,科大訊飛也推出長(zhǎng)語(yǔ)音功能,將國(guó)際領(lǐng)先的語(yǔ)音識(shí)別和翻譯技術(shù)結(jié)合起來(lái),實(shí)現(xiàn)會(huì)議錄音、學(xué)習(xí)視頻等的一鍵研讀。
  值得一提的是,自今年1月30日發(fā)布以來(lái),訊飛星火V3.5作為首個(gè)全國(guó)產(chǎn)算力訓(xùn)練的大模型,受到了各行業(yè)伙伴和開(kāi)發(fā)者的歡迎。據(jù)劉慶峰介紹,大模型云邊端的整體解決方案正在賦能汽車、家電、運(yùn)營(yíng)商等越來(lái)越多的行業(yè)。在過(guò)去不到3個(gè)月的時(shí)間里,訊飛新增了55萬(wàn)實(shí)名認(rèn)證的開(kāi)發(fā)者,其中一半以上來(lái)自企業(yè)。
  對(duì)企業(yè)來(lái)說(shuō),如何高效地獲取和學(xué)習(xí)知識(shí)同樣是痛點(diǎn),科大訊飛給出的答案是智能體,并面向企業(yè)場(chǎng)景推出全新的智能體平臺(tái)。
  劉慶峰談到,在訊飛星火智能體平臺(tái)上,針對(duì)用戶的輸入,首先,會(huì)自動(dòng)實(shí)現(xiàn)用戶輸入的精準(zhǔn)理解和任務(wù)規(guī)劃。其次,解析完相關(guān)的任務(wù)和對(duì)應(yīng)的工具之后,訊飛星火也構(gòu)建形成了包括天氣、航班、企查查等成體系的外部信息來(lái)源的對(duì)接。同時(shí),星火智能體平臺(tái)還通過(guò)互認(rèn)證的機(jī)制,實(shí)現(xiàn)了往往是獨(dú)立的、隔離的OA系統(tǒng)、CRM系統(tǒng)以及ERP系統(tǒng)的打通,完成相應(yīng)操作。最后,通過(guò)私域知識(shí)融入機(jī)制,智能體平臺(tái)很容易實(shí)現(xiàn)企業(yè)所屬行業(yè)以及企業(yè)私域知識(shí)的融入,能完成更精準(zhǔn)的專業(yè)理解和知識(shí)問(wèn)答。
  此外,星火智能體平臺(tái)還可以通過(guò)拖拽方式實(shí)現(xiàn)新智能體的創(chuàng)建和多智能體的協(xié)作,觸達(dá)大模型應(yīng)用企業(yè)落地的“最后一公里”。
  據(jù)劉慶峰透露,科大訊飛將在6月27日發(fā)布訊飛星火大模型V4.0,進(jìn)一步解放生產(chǎn)力、釋放想象力。
 ?。ň庉?牛暢)