中新社四川分社正文

首頁(yè) > shouye > 四川日?qǐng)?bào)

四川行業(yè)垂直大模型“成長(zhǎng)記”
2024年11月26日 09:34 來(lái)源:四川日?qǐng)?bào) 編輯:曹惠君

  ●四川已經(jīng)匯聚了30多個(gè)行業(yè)垂直大模型,涉及智能制造、文化旅游、醫(yī)學(xué)診療等領(lǐng)域,成為四川發(fā)展人工智能產(chǎn)業(yè)的重要引擎

  ●與通用大模型相比,垂直大模型更像一個(gè)“專(zhuān)才”,需要足夠豐富和高質(zhì)量的垂直行業(yè)訓(xùn)練數(shù)據(jù)

  ●四川有130多家大模型相關(guān)企業(yè),但超過(guò)九成都分布在產(chǎn)業(yè)鏈的基礎(chǔ)層,涉及技術(shù)層和應(yīng)用層的上下游供應(yīng)商相對(duì)缺乏

  ●力爭(zhēng)在2027年,打造超過(guò)10個(gè)具有全國(guó)影響力的行業(yè)標(biāo)桿大模型

  2022年底,一則“AI創(chuàng)業(yè)公司Open AI推出ChatGPT”的消息讓成都明途科技有限公司首席技術(shù)官?lài)?yán)帥徹夜難眠。

  “很久沒(méi)這么激動(dòng)過(guò)了!眹(yán)帥說(shuō),這款叫大模型的應(yīng)用不像搜索引擎這樣耗費(fèi)大量時(shí)間去拆解信息,而是具備了一定的抽象思維能力。“與以往任何一款人工智能應(yīng)用不同,大模型更像科幻電影里的人工智能,它將引領(lǐng)未來(lái)產(chǎn)業(yè)的發(fā)展!

  預(yù)感很快成為現(xiàn)實(shí),在ChatGPT問(wèn)世不久,谷歌、Meta、亞馬遜、百度、阿里等企業(yè)先后加入,成百上千個(gè)大模型如雨后春筍般涌現(xiàn),生成式人工智能遍地開(kāi)花,一時(shí)間,文本生成、文生圖、語(yǔ)音處理、代碼處理、視頻處理等應(yīng)用產(chǎn)品海量井噴。

  搶占人工智能發(fā)展機(jī)遇,企業(yè)忙著“百模大戰(zhàn)”,各地也開(kāi)啟大模型競(jìng)速賽,北京、上海、廣東、浙江等地推出大模型扶持政策,完善發(fā)展所需的配套支持。

  在這場(chǎng)競(jìng)速中,四川的企業(yè)也沒(méi)有置身其外。不過(guò),它們大多沒(méi)有選擇通用大模型、基礎(chǔ)大模型作為切入賽道,而是立足自身基礎(chǔ)和產(chǎn)業(yè)優(yōu)勢(shì),聚焦行業(yè)垂直大模型發(fā)展。近兩年時(shí)間過(guò)去了,這些分布在智能制造、文化旅游、醫(yī)學(xué)診療等領(lǐng)域的大模型成長(zhǎng)情況如何?遇到哪些問(wèn)題?未來(lái)又該如何發(fā)展?近日,記者走進(jìn)這些大模型企業(yè),一探究竟。

  涌入浪潮 破解行業(yè)痛點(diǎn)

  如果有一個(gè)投資未來(lái)的機(jī)會(huì),你愿不愿意“賭”一把?這是較早一批進(jìn)入大模型賽道川企面臨的選擇。

  成立于2017年的成都考拉悠然科技有限公司是其中之一,走進(jìn)該企業(yè)的辦公大樓,墻面上標(biāo)語(yǔ)簡(jiǎn)單明了:構(gòu)建萬(wàn)物AI的美好世界。企業(yè)首席架構(gòu)師謝治宇介紹,自成立以來(lái),企業(yè)便聚焦人工智能核心領(lǐng)域成果實(shí)現(xiàn)轉(zhuǎn)化。

  “我們差不多在2020年進(jìn)入大模型賽道!敝x治宇說(shuō),在傳統(tǒng)人工智能模式下,如果研發(fā)一個(gè)應(yīng)用,需要開(kāi)發(fā)一個(gè)模型,這樣成本太高,效果也不好。他以城市交通道路管理舉例,如果要研發(fā)一個(gè)抓闖紅燈的應(yīng)用,那么它很可能不具備抓超速、違規(guī)變道的能力!爱(dāng)時(shí)我們就在想,有沒(méi)有一種可能,開(kāi)發(fā)一個(gè)多模態(tài)的工具,可以同時(shí)解決幾十到上百個(gè)任務(wù),讓AI研發(fā)從碎片走向集成化!

  與謝治宇有著相同感受的是嚴(yán)帥,他所在的明途科技在2019年研發(fā)了一款辦公輔助機(jī)器人,方便用戶(hù)在不同場(chǎng)景下的咨詢(xún)工作!暗灿幸恍┎蛔。”嚴(yán)帥說(shuō),在面對(duì)用戶(hù)提問(wèn)時(shí),這款機(jī)器人會(huì)從數(shù)據(jù)庫(kù)里面找尋對(duì)應(yīng)答案,從而進(jìn)行匹配,如果用戶(hù)的意圖表達(dá)不明確,或者需要更加定制化的答案時(shí),機(jī)器人就很難滿(mǎn)足用戶(hù)的需求!拔覀兿M軌虼蛟煲豢罴饶芏蛻(hù)需求,又能根據(jù)客戶(hù)需求給出定制化答案的智能機(jī)器人!

  2022年11月30日,ChatGPT橫空出世,其強(qiáng)大的生成能力和廣泛的應(yīng)用前景,讓更多人看到了人工智能產(chǎn)業(yè)躍升的可能。幾乎同一時(shí)間,2022年11月25日,國(guó)家互聯(lián)網(wǎng)信息辦公室、工業(yè)和信息化部、公安部聯(lián)合發(fā)布《互聯(lián)網(wǎng)信息服務(wù)深度合成管理規(guī)定》,為人工智能信息服務(wù)劃出“底線(xiàn)”和“紅線(xiàn)”。

  技術(shù)的突破和法律制度逐漸規(guī)范,讓更多企業(yè)看到了未來(lái)發(fā)展方向。嚴(yán)帥說(shuō),ChatGPT出現(xiàn)不久,企業(yè)召開(kāi)了一場(chǎng)內(nèi)部會(huì)議,決定將此前的工作全部遷移到大模型上,后來(lái)他們推出了一款政府服務(wù)大模型MT-WorkGPT!拔覀儸F(xiàn)在的很多產(chǎn)品都是基于這個(gè)模型打造,比如在自貢燈會(huì)期間,我們推出一款數(shù)字人,小到哪個(gè)入口人少,大到本屆燈會(huì)有哪些亮點(diǎn),它都知道!

  如同自貢燈會(huì)數(shù)字人一樣,四川多個(gè)行業(yè)垂直大模型正在行業(yè)舞臺(tái)上嶄露頭角,不斷破解行業(yè)痛點(diǎn)。

  他們中,有人通過(guò)大模型,提升了行業(yè)的生產(chǎn)效率——

  走進(jìn)成都數(shù)之聯(lián)科技股份有限公司,一臺(tái)臺(tái)看似并不起眼的機(jī)器正在對(duì)各類(lèi)工業(yè)品進(jìn)行缺陷檢測(cè)!斑@是我們基于工業(yè)缺陷檢測(cè)領(lǐng)域大模型打造的智能檢測(cè)產(chǎn)品,可以幫助企業(yè)對(duì)工業(yè)品進(jìn)行缺陷檢測(cè)。”該企業(yè)董事長(zhǎng)傅彥表示,這些產(chǎn)品檢測(cè)準(zhǔn)確率高達(dá)99%,可以幫助生產(chǎn)企業(yè)節(jié)約超八成的人力成本。

  他們中,有人通過(guò)大模型,優(yōu)化了行業(yè)服務(wù)質(zhì)量——

  “請(qǐng)幫我規(guī)劃一條看雪景的線(xiàn)路!蔽穆么髸(huì)上,游客向數(shù)字化大熊貓“安逸”咨詢(xún),不到3秒鐘,“安逸”就根據(jù)用戶(hù)需求定制了游玩路線(xiàn)。該產(chǎn)品的制作方,四川川投智勝數(shù)字科技有限公司工作人員介紹,這款數(shù)字化大熊貓基于AI文旅大模型打造,不僅可以完成線(xiàn)路規(guī)劃,還可以提供交通安排、住宿預(yù)訂等服務(wù)。

  他們中,還有人通過(guò)大模型,促進(jìn)了行業(yè)創(chuàng)新發(fā)展——

  7月28日,由國(guó)家超級(jí)計(jì)算成都中心、中國(guó)地震局地球物理研究所與清華大學(xué)聯(lián)合開(kāi)發(fā)的“諦聽(tīng)”地震波大模型正式發(fā)布。這款大模型的特別之處在于,它是一款“聽(tīng)”地震的“神獸”,可以用于地震信號(hào)識(shí)別、地震活動(dòng)監(jiān)測(cè)、大地震快速響應(yīng)等環(huán)節(jié),還將拓展到礦震檢測(cè)、地下空間結(jié)構(gòu)探測(cè)、海底地震檢測(cè)等領(lǐng)域。

  “行業(yè)垂直大模型的故事才剛剛開(kāi)始。”科技廳相關(guān)負(fù)責(zé)人說(shuō),目前,四川已經(jīng)匯聚了30多個(gè)行業(yè)垂直大模型,涉及智能制造、文化旅游、醫(yī)學(xué)診療等領(lǐng)域,未來(lái),將結(jié)合市場(chǎng)需求和資源優(yōu)勢(shì),支持研發(fā)更多細(xì)分領(lǐng)域大模型。

  成長(zhǎng)煩惱 機(jī)遇和挑戰(zhàn)

  大模型發(fā)展如火如荼,但機(jī)遇和挑戰(zhàn)并存。茁壯成長(zhǎng)中的四川垂直大模型也有成長(zhǎng)中的“煩惱”。

  “貧窮限制了你的想象,這句話(huà)放在大模型中再合適不過(guò)了!币恍┦茉L者提到,不管是通用大模型還是行業(yè)垂直大模型,其邏輯都是一樣,就是給人工智能投喂一波學(xué)習(xí)資料,讓它自己學(xué)習(xí),訓(xùn)練出一個(gè)初始模型,然后讓它做題,再用“標(biāo)準(zhǔn)答案”來(lái)檢驗(yàn),碰到做錯(cuò)的題就反向微調(diào)模型的參數(shù),通過(guò)“預(yù)訓(xùn)練+精調(diào)”提升模型的準(zhǔn)確率,當(dāng)參數(shù)和數(shù)據(jù)規(guī)模達(dá)到一個(gè)質(zhì)變的閾值,大模型會(huì)猛然“醒悟”,出現(xiàn)了“涌現(xiàn)”效應(yīng)。

  為此,一些企業(yè)不得不將大部分成本投入算力之中,以實(shí)現(xiàn)“大力出奇跡”。“大模型訓(xùn)練的時(shí)長(zhǎng)或者創(chuàng)新的快慢,根本上取決于算力的大小!币晃粡氖轮悄苤圃煨袠I(yè)垂直大模型的負(fù)責(zé)人告訴記者,他們訓(xùn)練成本七成用于算力,推理成本九成用于算力,每年光花在算力的成本就有上百萬(wàn)元!暗词惯@樣,我們的算力還是緊缺!

  比算力更讓人頭疼的是數(shù)據(jù)!芭c通用大模型相比,垂直大模型更像一個(gè)‘專(zhuān)才’,需要足夠豐富和高質(zhì)量的垂直行業(yè)訓(xùn)練數(shù)據(jù)!薄氨静葜菐(kù)”中藥全產(chǎn)業(yè)鏈大模型技術(shù)負(fù)責(zé)人陳偉介紹,他們花了10多年的時(shí)間,建立了含2000余萬(wàn)個(gè)實(shí)體和超20億個(gè)關(guān)系對(duì)的知識(shí)圖譜,生成了一系列覆蓋中藥全產(chǎn)業(yè)鏈關(guān)鍵環(huán)節(jié)的數(shù)據(jù),讓大模型在中藥種植、質(zhì)量控制、藥物研發(fā)等中藥全產(chǎn)業(yè)鏈關(guān)鍵環(huán)節(jié)中具備了決策支持能力。

  “但如果要實(shí)現(xiàn)問(wèn)診等交互功能,還需要對(duì)知識(shí)更深度的挖掘。”一位從事醫(yī)學(xué)診療大模型的企業(yè)代表說(shuō),醫(yī)療行業(yè)的大量知識(shí)并沒(méi)有在互聯(lián)網(wǎng)上呈現(xiàn),甚至很多都是醫(yī)生經(jīng)驗(yàn)性的認(rèn)知積累,行業(yè)內(nèi)擅長(zhǎng)復(fù)雜推理的專(zhuān)家,其最具價(jià)值的思維框架、思維模式遠(yuǎn)未形成文檔化或者數(shù)字化!靶袠I(yè)垂直大模型瞄準(zhǔn)特定的行業(yè)和需求,但目前訓(xùn)練的數(shù)據(jù)來(lái)源主要來(lái)自互聯(lián)網(wǎng)、社交、搜索等渠道,如果沒(méi)法挖掘出這些‘隱性’數(shù)據(jù),將限制大模型的訓(xùn)練效果和應(yīng)用性能。”

  如果說(shuō)數(shù)據(jù)和算力是大模型的基礎(chǔ)設(shè)施,那么訓(xùn)練則體現(xiàn)了更多“人”的因素。謝治宇認(rèn)為,就訓(xùn)練大模型而言,參數(shù)的數(shù)量并不是最重要的,工程化過(guò)程中的調(diào)優(yōu)才是真正的考驗(yàn)。“這些垂直領(lǐng)域不同類(lèi)型的數(shù)據(jù)進(jìn)來(lái)之后,需要人類(lèi)專(zhuān)家總結(jié)成不涉及隱私信息的領(lǐng)域知識(shí),‘合成’為大模型的‘專(zhuān)業(yè)教材’,才能研發(fā)出更有針對(duì)性的產(chǎn)品!

  全力競(jìng)速 賦能行業(yè)轉(zhuǎn)型提質(zhì)

  經(jīng)歷了幾年發(fā)展,從業(yè)者們既感到興奮,又感到焦慮,興奮的是,他們正在參與一場(chǎng)新的產(chǎn)業(yè)變革,焦慮在于行業(yè)真的太“卷”了。

  從“卷”技術(shù)到“卷”價(jià)格再到“卷”應(yīng)用,一個(gè)“卷”字背后,折射出的是大模型正從“星星之火”走向“燎原之勢(shì)”,企業(yè)不斷拓展創(chuàng)新邊界,催生出新的消費(fèi)需求。根據(jù)國(guó)家網(wǎng)信部門(mén)官網(wǎng)公示的信息,自2023年8月31日我國(guó)首批通過(guò)備案的人工智能大模型名單出爐以來(lái),截至今年8月,全國(guó)已有188款大模型完成備案。

  科研和產(chǎn)業(yè)力量“卷”進(jìn)去,是為了在市場(chǎng)中贏得先機(jī),渴望捕捉先機(jī)的城市“卷”起來(lái),看中的則是大模型等技術(shù)突破所帶來(lái)的生產(chǎn)力飛躍。

  “爭(zhēng)奪大模型,就是爭(zhēng)奪下一個(gè)技術(shù)時(shí)代的基礎(chǔ)平臺(tái)!彼拇ㄊ∪斯ぶ悄苄袠I(yè)協(xié)會(huì)秘書(shū)長(zhǎng)陳章說(shuō),從去年開(kāi)始,北京、上海、廣東等傳統(tǒng)數(shù)字重鎮(zhèn)紛紛入局,打響“大模型之都”的爭(zhēng)奪戰(zhàn)。他同時(shí)注意到,各地發(fā)展側(cè)重各有不同:作為“大模型第一城”的北京,重點(diǎn)突破基礎(chǔ)理論研究,鼓勵(lì)開(kāi)展大模型的創(chuàng)新算法和關(guān)鍵技術(shù)研發(fā);算力硬件是上海的強(qiáng)項(xiàng),正在加快建成具有區(qū)域乃至全國(guó)影響力的智能算力創(chuàng)新及應(yīng)用示范區(qū);廣東則更聚焦大模型對(duì)實(shí)體經(jīng)濟(jì)的賦能。

  對(duì)于四川,不少受訪者提到,要立足產(chǎn)業(yè)基礎(chǔ)和場(chǎng)景優(yōu)勢(shì),深耕垂直領(lǐng)域,形成在細(xì)分賽道的獨(dú)特競(jìng)爭(zhēng)優(yōu)勢(shì)!皬2014年成立以來(lái),我們就專(zhuān)注于電商和線(xiàn)上零售領(lǐng)域人工智能客服這一細(xì)分賽道。”成都曉多科技有限公司政企業(yè)務(wù)總監(jiān)宋建說(shuō),他們通過(guò)10年時(shí)間在細(xì)分賽道的堅(jiān)持和發(fā)展,積累了關(guān)于商品、行業(yè)上下游、行業(yè)政策以及產(chǎn)品使用場(chǎng)景相關(guān)的海量領(lǐng)域經(jīng)驗(yàn)和知識(shí),這些經(jīng)驗(yàn)和知識(shí)可以更好地為用戶(hù)提供智能化和個(gè)性化的服務(wù),進(jìn)一步提升服務(wù)效率,降低服務(wù)成本!拔覀儽瓤蛻(hù)更懂AI,比大廠更懂業(yè)務(wù)。”

  除了明細(xì)路徑,還要搭建好生態(tài)平臺(tái)。陳章注意到一個(gè)細(xì)節(jié),四川有130多家大模型相關(guān)企業(yè),但超過(guò)九成都分布在產(chǎn)業(yè)鏈的基礎(chǔ)層,涉及技術(shù)層和應(yīng)用層的上下游供應(yīng)商相對(duì)缺乏。

  但完整的產(chǎn)業(yè)鏈對(duì)企業(yè)至關(guān)重要。“四川各個(gè)環(huán)節(jié)都能做,但是能做精的不多!眹(yán)帥以上游技術(shù)舉例,比如數(shù)字人形象,能做到高仿真級(jí)別的,四川很難找到。

  從下游應(yīng)用來(lái)看,數(shù)之聯(lián)的市場(chǎng)也主要在省外!白鳛橐患宜拇ㄆ髽I(yè),我們90%以上的客戶(hù)都不是四川的,這不到一成的省內(nèi)客戶(hù)中,有些總部還不在四川!备祻┖粲酰拇☉(yīng)聚焦應(yīng)用層推出更多引導(dǎo)政策。

  針對(duì)企業(yè)的成長(zhǎng)“煩惱”和行業(yè)的短板,四川作出了一系列部署。比如針對(duì)算力成本問(wèn)題,四川支持成都智算中心、超算中心擴(kuò)容升級(jí),加快建設(shè)阿里云等智算中心,在加快推動(dòng)算力基礎(chǔ)設(shè)施建設(shè)的同時(shí),還構(gòu)建算力調(diào)度體系,提升算力資源利用率。再比如在高質(zhì)量數(shù)據(jù)集“供不應(yīng)求”問(wèn)題上,四川正推動(dòng)政務(wù)、教育、醫(yī)療、交通等領(lǐng)域公共數(shù)據(jù)搜集建設(shè),并鼓勵(lì)企業(yè)基于業(yè)務(wù)數(shù)據(jù)積累,開(kāi)發(fā)智能制造、智慧文旅、清潔能源等重點(diǎn)領(lǐng)域高質(zhì)量數(shù)據(jù)集,推動(dòng)不涉及隱私和公共利益的數(shù)據(jù)市場(chǎng)化交易。

  “此外,我們也要在產(chǎn)業(yè)鏈上做文章!笨萍紡d相關(guān)負(fù)責(zé)人表示,在技術(shù)層方面,四川將圍繞重點(diǎn)行業(yè)應(yīng)用需求,推動(dòng)主流通用大模型全國(guó)軟件工程總部、生態(tài)產(chǎn)業(yè)中心等項(xiàng)目在川加快落地;在下游應(yīng)用層上,將推動(dòng)大模型在制造業(yè)、服務(wù)業(yè)各環(huán)節(jié)融合應(yīng)用,賦能千行百業(yè)轉(zhuǎn)型提質(zhì)。“定個(gè)目標(biāo),力爭(zhēng)在2027年,打造超過(guò)10個(gè)具有全國(guó)影響力的行業(yè)標(biāo)桿大模型。”

  尹夢(mèng)奇 記者 高杲

  (來(lái)源:四川日?qǐng)?bào))

中國(guó)新聞網(wǎng)·四川新聞版權(quán)與免責(zé)聲明:

① 凡本網(wǎng)注明"來(lái)源:本網(wǎng)或中國(guó)新聞網(wǎng)·四川新聞"的所有作品,版權(quán)均屬于中新社,未經(jīng)本網(wǎng)授權(quán)不得轉(zhuǎn)載、摘編或利用其它方式使用上述作品。已經(jīng)本網(wǎng)授權(quán)使用作品的,應(yīng)在授權(quán)范圍內(nèi)使用,并注明"來(lái)源:中國(guó)新聞網(wǎng)·四川新聞"。違反上述聲明者,本網(wǎng)將追究其相關(guān)法律責(zé)任。 ② 凡本網(wǎng)注明"來(lái)源:XXX(非本網(wǎng))"的作品,均轉(zhuǎn)載自其它媒體,轉(zhuǎn)載目的在于傳遞更多信息,并不代表本網(wǎng)贊同其觀點(diǎn)和對(duì)其真實(shí)性負(fù)責(zé)。 ③ 如因作品內(nèi)容、版權(quán)和其它問(wèn)題需要同本網(wǎng)聯(lián)系的,請(qǐng)?jiān)?0日內(nèi)進(jìn)行。 聯(lián)系方式:中國(guó)新聞網(wǎng)·四川新聞采編部 電話(huà):+86-28-62938795