ChatGPT也會(huì)“餓肚子”?
前些天ChatGPT的崩潰,著實(shí)讓廣大用戶(hù)體驗(yàn)了一把AI軟件的“算力危機(jī)”。而事實(shí)上,除了算力危機(jī)外,ChatGPT一類(lèi)的人工智能聊天軟件,竟然也會(huì)有“餓肚子危機(jī)”,一旦陷入該危機(jī),將出現(xiàn)有算力也給不出合適答案的情況。ChatGPT盡管并非生命體,不需要進(jìn)行生物學(xué)意義上的進(jìn)食以獲得營(yíng)養(yǎng),但是其需要大量的數(shù)據(jù)來(lái)訓(xùn)練,特別是語(yǔ)料,即一定數(shù)量的文本資源集合。有了這些語(yǔ)料的訓(xùn)練,類(lèi)似于ChatGPT的人工智能軟件才能對(duì)用戶(hù)的信息做出正確的反應(yīng),并給出正確且語(yǔ)句通順的回復(fù)信息。事實(shí)上,這些軟件吃得越飽,吃得越好,工作的效果一般也會(huì)越好。大致明白了這類(lèi)軟件要吃的是什么之后,在我們的A股市場(chǎng),又有哪些公司,可以參與這項(xiàng)“做飯”的工作呢?
01
人民網(wǎng)、浪潮信息
食材提供者
“高端的食材,往往只需要最簡(jiǎn)單的烹飪方式”——《舌尖上的中國(guó)》第一季。
對(duì)于ChatGPT來(lái)說(shuō),什么是高端的食材?來(lái)看下面這個(gè)例子。
假如向ChatGPT提問(wèn):2022年,中央網(wǎng)信辦舉報(bào)中心指導(dǎo)全國(guó)各級(jí)網(wǎng)信舉報(bào)工作部門(mén)、主要網(wǎng)站平臺(tái)受理網(wǎng)民舉報(bào)色情、賭博、侵權(quán)、謠言等違法和不良信息1.72億件,如何看待這一數(shù)據(jù)?
食材1:不良網(wǎng)絡(luò)給人們的生活帶來(lái)的危害是多方面的。虛假信息往往使人上當(dāng)受騙,不僅造成經(jīng)濟(jì)上的損失,而且還會(huì)給受害人帶來(lái)精神上的傷害。造謠傳[遙]會(huì)混淆是非,使人真假難辨,易引起思想混亂,影響社會(huì)和諧。總之,不良網(wǎng)絡(luò)其社會(huì)危害性不可小覷。因此凈化網(wǎng)絡(luò)空間除了相關(guān)部門(mén)加大督察整治和打擊的力度外,對(duì)于各網(wǎng)站及我們每個(gè)人來(lái)說(shuō)也是責(zé)無(wú)旁[帶]的。
食材2:網(wǎng)絡(luò)違法和不良信息的出現(xiàn)與存在,是“冰凍三尺非一日之寒”,清除有害信息、根治頑瘴痼疾也很難一蹴而就。這就需要找準(zhǔn)治理的重點(diǎn),平臺(tái)需要加大優(yōu)質(zhì)信息供給,多平臺(tái)、多渠道、多形態(tài)提供群眾需要的網(wǎng)絡(luò)內(nèi)容及信息服務(wù),做到用正能量驅(qū)散負(fù)能量。使網(wǎng)絡(luò)空間清朗起來(lái),不是一時(shí)的事,而是一直的事,需要網(wǎng)上網(wǎng)下集眾智、匯合力,為文明辦網(wǎng)、文明用網(wǎng)、文明上網(wǎng)、文明興網(wǎng)保駕護(hù)航。
無(wú)論網(wǎng)上還是網(wǎng)下,無(wú)論大屏還是小屏,都沒(méi)有法外之地、輿論飛地。綜合運(yùn)用法律、監(jiān)管、平臺(tái)、技術(shù)等手段,堅(jiān)決遏制各類(lèi)違法違規(guī)問(wèn)題,不斷提升網(wǎng)絡(luò)空間治理效能,做到利刃出鞘、精準(zhǔn)打擊、發(fā)力增效、久久為功,讓網(wǎng)絡(luò)不良信息無(wú)處遁形,讓清風(fēng)正氣分外充盈。
是的,第一份食材出自一段普通的針對(duì)網(wǎng)絡(luò)有害信息的問(wèn)答,里面還有兩個(gè)明顯的錯(cuò)別字,而第二份食材,則是出自人民網(wǎng)針對(duì)網(wǎng)絡(luò)有害信息的時(shí)評(píng)。而這,正是中央級(jí)別大型媒體的優(yōu)勢(shì):盡管這些文字顯然還不能作為聊天機(jī)器人最終的答案,但如果語(yǔ)料更為優(yōu)質(zhì),后續(xù)加工出來(lái)的食糧需要的加工程序也會(huì)更少,輸出效果也會(huì)更佳。
不過(guò),中央級(jí)的媒體,也并非只有人民網(wǎng)一家,為何人民網(wǎng)會(huì)成為語(yǔ)料提供者的排頭兵呢?
答案就在人民網(wǎng),對(duì)于數(shù)字經(jīng)濟(jì)的布局。其中,特別是人民數(shù)據(jù)已經(jīng)布局了新型數(shù)據(jù)中心和新型算力中心,進(jìn)而人民網(wǎng)可以輕松地基于知識(shí)圖譜、自然語(yǔ)言處理和人工智能等技術(shù),深度挖掘自由的核心數(shù)據(jù)資源(優(yōu)質(zhì)語(yǔ)料等)。


圖片來(lái)源:人民網(wǎng)2022年半年報(bào)
自己擁有大量?jī)?yōu)質(zhì)語(yǔ)料,又有著數(shù)據(jù)提供的布局,那自然而然,論優(yōu)質(zhì)語(yǔ)料,人民網(wǎng)是當(dāng)仁不讓的食材提供商。
除了人民網(wǎng)之外,浪潮信息的源1.0,同樣是食材的寶庫(kù),只不過(guò)相比于人民網(wǎng)來(lái)說(shuō),浪潮信息是以量取勝。
2021年9月28日,浪潮人工智能研究院在京發(fā)布全球最大規(guī)模人工智能巨量模型“源1.0”。“源”的單體模型參數(shù)量達(dá)2457億,超越美國(guó)OpenAI組織研發(fā)的GPT-3,成為全球最大規(guī)模的AI巨量模型。
這個(gè)模型的數(shù)據(jù)量大,并非是他適合作為原材料的理由,更重要的是,這款“源”是中文巨量模型,其蘊(yùn)含的中文語(yǔ)料極為豐富,浪潮信息基于源1.0發(fā)布了4個(gè)技能大模型,對(duì)話(huà)模型源曉問(wèn)、問(wèn)答模型源曉搜、翻譯模型源曉譯、古文模型源曉文。這些模型,特別是有中文特色的對(duì)話(huà)、古文等模型,對(duì)于發(fā)展國(guó)內(nèi)對(duì)標(biāo)ChatGPT的智能聊天產(chǎn)品有著至關(guān)重要的作用。
去年,浪潮“源1.0”大模型登頂CUGE(一款清華北大領(lǐng)銜的中文機(jī)器語(yǔ)言能力評(píng)測(cè)基準(zhǔn))總榜榜首,并獲得語(yǔ)言理解(篇章級(jí))、語(yǔ)言生成、對(duì)話(huà)交互、多語(yǔ)言、數(shù)學(xué)推理等5項(xiàng)評(píng)測(cè)最佳成績(jī)。足見(jiàn)這款模型在中文語(yǔ)料領(lǐng)域強(qiáng)大的優(yōu)勢(shì)。
02
拓爾思、博彥科技
我們來(lái)做飯、喂飯
和做飯類(lèi)似,有了原材料,還需要一定的加工烹飪,才能成為真正的數(shù)據(jù)食糧,讓AI系統(tǒng)能夠?qū)W習(xí)、消化。
事實(shí)上,有專(zhuān)門(mén)的學(xué)科去做這塊的業(yè)務(wù)。自然語(yǔ)言處理(NLP,Natural Language Processing)是研究人與計(jì)算機(jī)交互的語(yǔ)言問(wèn)題的一門(mén)學(xué)科。按照技術(shù)實(shí)現(xiàn)難度的不同,這類(lèi)系統(tǒng)可以分成簡(jiǎn)單匹配式、模糊匹配式和段落理解式三種類(lèi)型
在A股市場(chǎng),有不少公司擁有語(yǔ)料加工相關(guān)的業(yè)務(wù),而拓爾思正是其中之一。
2022年12月,拓爾思在接受券商調(diào)研時(shí)曾表示,公司作為國(guó)內(nèi)最早從事自然語(yǔ)言處理(NLP)研發(fā)的企業(yè)之一,在NLP、知識(shí)圖譜、OCR、圖像視頻結(jié)構(gòu)化領(lǐng)域都具備自主可控的底層技術(shù)。在AIGC方面,公司圍繞傳媒、政府等垂直領(lǐng)域的語(yǔ)料庫(kù)積累已非常全面,在智能問(wèn)答、自動(dòng)寫(xiě)作或智能寫(xiě)稿、內(nèi)容播報(bào)、創(chuàng)作智能輔助等方面亦有成熟應(yīng)用場(chǎng)景。
更為重要的是,拓爾思已經(jīng)有專(zhuān)門(mén)的平臺(tái),去做語(yǔ)義處理這個(gè)事情了,公司旗下“數(shù)家”平臺(tái),已經(jīng)可以對(duì)語(yǔ)料數(shù)據(jù)進(jìn)行結(jié)構(gòu)化分類(lèi)整合,而緊隨其后的“智語(yǔ)”平臺(tái),則吸收了拓爾思在自然語(yǔ)言處理和信息檢索領(lǐng)域多年的技術(shù)積累,其已經(jīng)可以進(jìn)行分詞和詞性標(biāo)注、語(yǔ)言分類(lèi)和語(yǔ)言聚類(lèi)等內(nèi)容,可以說(shuō),拓爾思這些平臺(tái)已經(jīng)成為語(yǔ)言的加工廠,經(jīng)過(guò)這些平臺(tái)的加工后,機(jī)器就可以通過(guò)這些機(jī)器人適配的語(yǔ)言進(jìn)行認(rèn)知、學(xué)習(xí)了。

除了拓爾思,博彥科技在語(yǔ)言加工領(lǐng)域,也同樣有著自己的業(yè)務(wù)。2月10日,博彥科技在投資者互動(dòng)平臺(tái)上稱(chēng),公司有智能聊天機(jī)器人方面的解決方案,有能力為機(jī)器提供語(yǔ)音訓(xùn)練相關(guān)服務(wù)。

這句話(huà)也可以翻譯成:我可以,也很會(huì)給機(jī)器喂飯。
事實(shí)上,博彥科技在語(yǔ)料這條產(chǎn)業(yè)鏈中的地位,有點(diǎn)像醫(yī)藥中的CXO,客戶(hù)在研發(fā)過(guò)程中,可以將需要加工的語(yǔ)音、雜亂的語(yǔ)言文字等部分交給博彥科技,博彥科技憑借其經(jīng)驗(yàn)和專(zhuān)業(yè)能力,進(jìn)行標(biāo)注、歸類(lèi)。如果客戶(hù)有需要,公司也可以協(xié)助公司完成相關(guān)的機(jī)器語(yǔ)義訓(xùn)練。
作為這一領(lǐng)域的老牌企業(yè),此前,博彥科技已與微軟合作了長(zhǎng)達(dá)二十多年,這也意味著在機(jī)器訓(xùn)練領(lǐng)域,博彥科技已積累了長(zhǎng)時(shí)間的經(jīng)驗(yàn),隨著聊天機(jī)器人時(shí)代的到來(lái),博彥科技的相關(guān)訂單或?qū)⒂瓉?lái)爆發(fā)。
當(dāng)然,筆者所列舉的食材提供者、加工者相關(guān)公司并不完全,實(shí)際上,除了這些公司,漢王科技、海天瑞聲、科大訊飛等公司在語(yǔ)料加工領(lǐng)域也有著多年的技術(shù)積淀,但這些公司或前期漲幅過(guò)大,或總市值過(guò)大、涉及領(lǐng)域?qū)嵲谶^(guò)多,在這里就不做重點(diǎn)介紹了。其實(shí)在語(yǔ)料加工領(lǐng)域,這些公司的業(yè)務(wù)也多集中于數(shù)據(jù)標(biāo)注、模式化、訓(xùn)練等內(nèi)容,本質(zhì)上也是一個(gè)做飯的活。忽略二級(jí)市場(chǎng)因素的話(huà),事實(shí)上未來(lái)這些公司在語(yǔ)料加工領(lǐng)域,也有望有所作為。
可以看到的是,單單文字領(lǐng)域的機(jī)器學(xué)習(xí),就需要一系列的基礎(chǔ)數(shù)據(jù)積累、加工、訓(xùn)練等工序,這部分的市場(chǎng),隨著類(lèi)ChatGPT軟件的不斷開(kāi)發(fā),將在未來(lái)幾年呈持續(xù)爆發(fā)之勢(shì)。想象空間十分廣闊。機(jī)器吃飯,產(chǎn)業(yè)鏈喂飯并享受豐厚回報(bào)的時(shí)代,或許真的要到來(lái)了。
原文標(biāo)題 : ChatGPT也會(huì)“餓肚子”?
發(fā)表評(píng)論
請(qǐng)輸入評(píng)論內(nèi)容...
請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字
圖片新聞
-

落地?zé)o錫!京東首個(gè)物流機(jī)器人超級(jí)工廠來(lái)了
-

OpenAI發(fā)布的AI瀏覽器,市場(chǎng)為何反應(yīng)強(qiáng)烈?
-

馬云重返一線督戰(zhàn),阿里重啟創(chuàng)始人模式
-

機(jī)器人奧運(yùn)會(huì)戰(zhàn)報(bào):宇樹(shù)機(jī)器人摘下首金,天工Ultra搶走首位“百米飛人”
-

存儲(chǔ)圈掐架!江波龍起訴佰維,索賠121萬(wàn)
-

長(zhǎng)安汽車(chē)母公司突然更名:從“中國(guó)長(zhǎng)安”到“辰致科技”
-

豆包前負(fù)責(zé)人喬木出軌BP后續(xù):均被辭退
-

字節(jié)AI Lab負(fù)責(zé)人李航卸任后返聘,Seed進(jìn)入調(diào)整期
最新活動(dòng)更多
-
6月30日立即申請(qǐng)?jiān)囉?> 【免費(fèi)試用】旭之源工業(yè)電源一一機(jī)器人的穩(wěn)定“心臟“
-
精彩回顧立即查看>> 【限時(shí)免費(fèi)】物理場(chǎng)仿真助力生物醫(yī)學(xué)領(lǐng)域技術(shù)創(chuàng)新
-
精彩回顧立即查看>> 【直播】 智測(cè)未來(lái)·2026海克斯康春季產(chǎn)品創(chuàng)新日
-
精彩回顧立即查看>> 【線下論壇】新唐科技×芯唐南京 2026 年度研討會(huì)
-
精彩回顧立即查看>> OFweek 2026(第十五屆)中國(guó)機(jī)器人產(chǎn)業(yè)大會(huì)
-
精彩回顧立即查看>> 維科杯· OFweek 2025中國(guó)機(jī)器人行業(yè)年度評(píng)選
推薦專(zhuān)題
-
2 華為,重大突破!
- 1 人形機(jī)器人“第一股”來(lái)了!宇樹(shù)科技即將上會(huì)
- 2 全球股市陷AI獨(dú)大結(jié)構(gòu)性瘋狂
- 3 AI狂歡遇上油價(jià)破百,全球股市還能漲多久? | 產(chǎn)聯(lián)看全球
- 4 DeepSeek融資500億,梁文鋒難逃資本局
- 5 谷歌2026 I/O大會(huì)完整回顧:模型依然重要,但智能體正在接管一切
- 6 全球資本,重倉(cāng)中國(guó)機(jī)器人
- 7 Figure AI 交付突破350臺(tái),陪跑特斯拉會(huì)迎來(lái)iPhone 時(shí)刻嗎?
- 8 Anthropic發(fā)布2028年全球AI領(lǐng)導(dǎo)力的兩種情景報(bào)告
- 9 “國(guó)產(chǎn)GPU第一股”摩爾線程首季扭虧,但造血能力仍待考驗(yàn)
- 10 特斯拉宣布監(jiān)督版FSD登陸中國(guó)?
- 高級(jí)軟件工程師 廣東省/深圳市
- 自動(dòng)化高級(jí)工程師 廣東省/深圳市
- 光器件研發(fā)工程師 福建省/福州市
- 銷(xiāo)售總監(jiān)(光器件) 北京市/海淀區(qū)
- 激光器高級(jí)銷(xiāo)售經(jīng)理 上海市/虹口區(qū)
- 光器件物理工程師 北京市/海淀區(qū)
- 激光研發(fā)工程師 北京市/昌平區(qū)
- 技術(shù)專(zhuān)家 廣東省/江門(mén)市
- 封裝工程師 北京市/海淀區(qū)
- 結(jié)構(gòu)工程師 廣東省/深圳市


分享





