每日時訊!國內最小的大模型創(chuàng)業(yè)團隊,靠另類創(chuàng)新出位
擁有多年NLP經驗的虎博科技,憑借自身獨特的技術創(chuàng)新,打破“成本魔咒”,重新定義“短小精悍”。
國內大模型創(chuàng)業(yè)迎來了新面孔。
包含70億參數和1800億參數兩個版本的大模型TigerBot正式亮相,一經推出,就以獨特的實力,引起了外界矚目。
【資料圖】
從評測結果可見,TigerBot與OpenAI同規(guī)模模型的得分十分接近
作為一款國產自研的多模態(tài)大語言模型,TigerBot不僅能進行編程、畫圖、翻譯,還支持多種辦公場景下的任務,具有高效的學習能力、創(chuàng)造力和可控性。
更重要的是,借助更先進的微調算法,TigerBot在只使用少量參數的情況下,就能快速理解人類的問題,提升回答的準確性。
在同樣50萬條數據訓練的情況下,TigerBot的收斂速度比斯坦福推出的Alpaca快5倍,在公開數據集上評測顯示性能提升17%。
有點難以置信的是,研發(fā)了如此強勁大模型的團隊,最初只有5個人,身為CEO兼首席科學家的團隊Leader陳燁,擔任了最核心的代碼工作。
后來成員規(guī)模雖有擴充,但也只控制在了10人左右。
那么,這個在激烈的大模型競爭中,TigerBot背后的中國企業(yè)——虎博科技,究竟是怎樣憑借犀利小團隊殺出一條血路的呢?
01 重新定義“精悍”
眾所周知,訓練大模型所需的高昂算力、成本,一度使得ChatGPT這樣的通用大模型,成為了少數科技巨頭的專利。
然而,擁有多年NLP經驗的虎博科技,卻憑借自身獨特的技術創(chuàng)新,打破了這一“成本魔咒”,并重新定義了何謂“短小精悍”。
具體來說,為了降低模型的訓練成本和難度,虎博科技在以下幾個方面進行了創(chuàng)新:
指令完成監(jiān)督微調
所謂指令完成監(jiān)督微調,主要就是讓模型更加理解人類提出的各種問題。
如果模型像一個學生,那么問題就像一個作業(yè)。
如果老師只是給學生一個作業(yè),不告訴他這個作業(yè)要考察什么知識點,要用什么方法來解答,那么學生可能會很困惑,于是有些問題的回答質量往往就不佳。
面對這樣的問題,以往人們想到的辦法,是通過微調和提示的方式,來讓模型變得“更通人性”。
具體來說,微調是在大量的任務相關的數據上,重新訓練模型的參數,這就像給了學生一本厚厚的輔導書,雖然可以讓他學得更好,但也會花費很多時間和精力。
而提示則是在每個問題前加上一些特殊的單詞或符號,就像給學生一個小抄,讓小抄引導他寫出正確答案,但這一方法也需要老師花心思制作小抄,而且小抄的內容也會限制學生的應變能力。
對此,TigerBot的應對之策,是使用一種標記語言(Mark-up Language),在每個問題前加上一些特殊的符號。
這相當于給每個作業(yè)打上了“標簽”。
如此一來,學生就能明白,這個作業(yè)是數學題,要用加減乘除來解答;那個作業(yè)是英語題,要用翻譯來解答;從而讓模型快速地理解了各種問題。
但別看只是個“打標簽”的小小改動,真正要踐行這樣的技術創(chuàng)新,卻絕非易事。
因為標記語言并不是一種簡單的任務標簽,它需要有一定的語法規(guī)則和語義表達能力,才能讓 LLMs(大模型) 準確地理解和執(zhí)行指令。
其次,標記語言并不是一種獨立的技術,要讓 LLMs 能夠有效地利用標記語言來完成各種任務,還需要借助預訓練、微調、元學習等其他多種技術。
因此,整合各種技術并設計一種通用且易用的標記語言,是一項具十分前沿的創(chuàng)新性工作,涉及多個方面的挑戰(zhàn)和難點。
唯有那些具備深厚理論基礎和實踐經驗的團隊,才能做出這類突破。
突破并行訓練難關
除了模型的底層架構上的改進外,TigerBot另一大降低訓練難度和成本的創(chuàng)新,就是突破了deep-speed等主流框架中的若干內存和通信問題,實現了千卡環(huán)境下訓練數月無間斷。
在此之前,要想千卡環(huán)境下進行數月無間斷的訓練,會面臨很大的技術難點。
這里可以用一個形象的比喻說明:
想象一下,在一個擁擠的馬路上,用很多輛小車來運送一座大山,要花費多大的時間和精力?要面對怎樣的擁堵和阻礙?
在這里,“小車”就象征著每個 GPU 的內存空間,“大山”象征著模型的參數和梯度。
雖然我們有一千輛小車可以用,但是每輛小車的載重能力都很有限,遠遠不夠裝下整座大山。
另一方面,模型的參數和梯度需要在多個 GPU 之間頻繁地交換和更新,需要消耗很多的通信資源。
這就像是要把一座大山從一個地方運到另一個地方,需要經過很多次的裝卸和轉運,不僅會耽誤時間,還會消耗大量的資源。
對此,TigerBot主要使用了三個技術,來進行并行訓練的優(yōu)化。
首先,TigerBot 使用了一種叫做ZeRO的技術,它可以把模型的參數和梯度分散到多個 GPU 上,從而減少每個 GPU 的內存占用。
這就像是把大山分成很多小塊,然后用不同的小車來運送一部分小塊。這樣,每輛小車就不會超載了,而且可以同時出發(fā),提高訓練的效率。
其次,TigerBot 使用了一種叫做DeepSpeed的技術,它可以根據模型的參數和梯度的大小和分布,自動地選擇最合適的通信方式和路徑。
這就像是一個智能導航系統(tǒng),它可以根據貨物的重量和目的地,自動地選擇最快的交通工具和路線,從而大大節(jié)約了時間和資源。
再次,TigerBot 使用了一種叫做BF16的技術,它可以降低模型的精度要求,從而減少計算的復雜度和內存的需求。
這就像是將同等大小的山體碎塊換成了塑料或紙板,從而大大從降低運輸的負擔。
借由著這些技術,虎博科技每月在訓練上的開銷,能夠節(jié)省數十萬。
這也是為什么,他們能以10人左右小團隊,在幾個月時間內實現“媲美”O(jiān)penAI壯舉的原因之一。
02 正向突變
除了上述提到的技術外,虎博科技在大模型方面,還運用ensemble和probabilistic modeling的方法,讓模型在創(chuàng)造性和可控性上做出了適當的權衡。
同時,針對中文連續(xù)性強、多義歧義情況多等問題,虎博科技通過不斷吸取開源模型和代碼中的優(yōu)點,從tokenizer到訓練算法上,都做了相應優(yōu)化。
而這些提升性能、降低成本的技術創(chuàng)新,和自然界中的生物面臨環(huán)境壓力時,所激發(fā)出的“突變”和“進化”,有著異曲同工之妙。
面對訓練大模型所需的巨量算力、數據時,實力并不強勁的中小企業(yè),也感到了某種“演化壓力”。
為了在這場AI競賽中不被時代拋棄,部分中小企業(yè),只能被倒逼著選擇了一種更能降本增效的技術策略。
然而,這樣的“壓力”,卻并不總是能激發(fā)正向的“突變”與“進化”,部分實力羸弱的企業(yè),可能直接倒在了這場殘酷的大模型競爭中,還有的企業(yè)干脆選擇了投機取巧,以炒作和公關來吸引融資。
既然如此,那虎博科技是如何在這樣的壓力下,完成正向“突變”的呢?
談到這個問題,我們就不得不提起虎博科技的創(chuàng)始人兼CEO——陳燁。
某種程度上,與OpenAI的Sam Altman一樣,陳燁也是一個心懷科技理想的天才創(chuàng)業(yè)者。
在AI領域的造詣上,陳燁不僅三次獲得人工智能頂級會議(KDD和SIGIR)最佳論文獎,在人工智能和機器學習領域發(fā)表了20余篇具有業(yè)界影響的論文,并擁有10余項專利。
并且還曾在美國的微軟、eBay和Yahoo擔任主任科學家和研發(fā)總監(jiān)等職位,成功實施過多個深具業(yè)界影響力的人工智能系統(tǒng)。
而每一個對AI技術進行過深度研究的人,都明白這項技術的遠大意義。
這樣的人,如果想在AI領域干一番事業(yè),就絕不會僅僅只是為了賺錢。
在2017年,陳燁成立了虎博科技,開始專注于NLP技術的應用落地,愿景是用AI賦能下一代搜索引擎,連接人與全球信息,讓人們獲取知識更簡單。
然而,再遠大的理想,也要有現實的支撐。
深諳AI技術發(fā)展路徑的陳燁明白,人工智能的進步與迭代,需要漫長的研發(fā)周期,雖然短期來看,資本市場對這類技術有著很大熱情,也產生了很多泡沫,但如果長時間未能看見實際的應用或產出,各路資本就都會紛紛人走茶涼。
面對這個問題,理性而成熟的陳燁,選擇了一條更為穩(wěn)健的道路,來堅守自己的理想。
在彼時的國內AI賽道上,智能金融成為了陳燁首先瞄準的目標。
這是因為,金融行業(yè)的運轉,往往伴隨著巨大的數據量,且與教育、醫(yī)療等行業(yè)相比,金融領域的很多數據都是公開、且易于獲取的。
于是,結合自身的NLP技術,虎博科技研發(fā)的新一代智能金融信息搜索引擎——虎博搜索誕生了。
虎博搜索的數據覆蓋 了A 股、港股及美股,包括行情、公告、研報、新聞等多維度信息。
利用語義挖掘、知識圖譜、機器翻譯等核心技術,虎博搜索不僅實現了口語化交流問答,并且還通過精確的數據抽取,以及跨越語言的功能,從海量信息中挖掘到深層次信息,并提供了本地編輯、報告全文、溯源定位等多種功能。
而這些功能背后的深度學習、知識圖譜、文本生成等技術,都是未來大模型所必將涉及的關鍵點。
在此后的發(fā)展歷程中,虎博科技又自主研發(fā)了各大金融領域的關鍵技術,包括智能推薦、翻譯、輿情分析等,而由此積累的NLP經驗,也為后來的TigerBot的誕生夯實了工程基礎。
03 總結
縱觀TigerBot誕生的過程,我們可以發(fā)現,這是一個既守住了飯碗,又贏得了理想的故事。
科研出身的陳燁,有技術,也有情懷,但卻并沒有在現實與理想之間顧此失彼,而是以用戶需求為導向,結合自身的技術優(yōu)勢,開發(fā)出多種適用于不同場景的AI產品。
在此過程中,其依據對技術前沿趨勢的敏銳洞察,逐步提高了自身的開發(fā)能力和工程化水平,從而在后來的大模型研發(fā)中,突破了主流框架中的技術難點和瓶頸。
如果說,當下的大模型競爭,是一場物競天擇的競賽,那么唯有那些在廣泛的產品和服務中,積累了足夠多技術因子的企業(yè),才能在壓力和挑戰(zhàn)面前,完成“進化”與“突變”。
標簽:
搶先讀
- 蘇寧易購發(fā)布618下沉市場消費大數據:鄭州鄭庵鎮(zhèn)成為最強消費小鎮(zhèn) 最新快訊
- 實時焦點:財政部:前5月證券交易印花稅收入891億元,同比降36.9%
- 數據要素,誰是成長最快企業(yè)? 世界今日訊
- 環(huán)球觀熱點:2023福建南平市考試錄用公務員擬錄用人員名單公示(七)
- 小學入學政策有新變化,6周歲將不再是入學門檻?家長喜憂參半
- 港股醫(yī)藥板塊持續(xù)走高 信達生物漲超8%
- 中鋼洛耐最新公告:本次詢價轉讓價格為5.3元/股-每日短訊
- 【熱聞】市場監(jiān)管總局:鼓勵支持相關經營主體重塑信用
- 昇思開源社區(qū)理事會成立 基于昇思AI框架的全模態(tài)大模型“紫東.太初2.0”發(fā)布
- 江門市2023年度高級經濟師考試溫馨提示-全球快資訊
- 跨越伶仃洋 一橋連三地:這座世界最長跨海大橋為大灣區(qū)帶來新機遇
- 環(huán)球簡訊:安潔科技:擬對適新國際增資1000萬美元,用于投設越南子公司
- 今日熱訊:安陽紅旗渠機場試飛成功
- 上市券商2022年業(yè)績普降ROE明顯回落 天天熱訊
- 中國汽車崛起,合資品牌得像牲口一樣活下去|快消息
- 當前訊息:售23.18萬 魏牌新摩卡DHT-PHEV亮相粵港澳車展
- 熱頭條丨TES六連勝阿水讓人陌生,Rookie透露沒睡夠,Doinb直言LGD不配贏
- 全球快看點丨《AC幻景》地圖大小等于《大革命》 將不會過于臃腫
- 東吳證券:餐飲等服務消費繼續(xù)恢復 可選品有所回暖_全球快訊
- 【焦點熱聞】青春喜劇電影《表白吧!在畢業(yè)前》今日公映
- 資訊推薦:驚艷的女孩名字 賈姓聽過最驚艷的女孩名字
- 財面兒丨金科地產集團:“21金科地產SCP004”未按期償付本息 涉及金額8.8億元
- 環(huán)球關注:蘋果手機多個偷拍軟件上熱搜:到底是誰在用?
- 科倫博泰IPO:劉革新帶兒子進董事會,兩年半估值暴漲31倍_環(huán)球觀點
- 快船球隊管理層忙布局!打感情牌,想威少380萬美元續(xù)約 全球簡訊
- vivo S17 手機開售:優(yōu)惠 30 元,到手 2469 元起 |天天快資訊
- 845.63億元!第三十二屆哈洽會已簽約貿易投資項目224個
- 微信:集中整治涉企業(yè)、企業(yè)家的虛假不實和侵權信息 嚴厲打擊惡意炒作行為_天天速看
- 環(huán)球關注:加強企業(yè)安全意識 提升全民安全素質
- 大眾汽車召回部分進口賓利飛馳系列汽車,共計3028輛 天天頭條
- 當前視訊!再看《三峽好人》 | 停云
- 河南:強化監(jiān)督執(zhí)紀 筑牢南水北調工程安全“堤壩”
- 浙江醫(yī)藥: 目前公司并無以新冠肺炎為適應癥的醫(yī)藥制劑產品_聚焦
- 6月16日十大人氣股:?;厮贇w(名單)
- 打狗棍特別節(jié)目(廣東珠江臺 打狗棍) 環(huán)球速看
- 《蜘蛛俠2》全新可探索區(qū)域:知名休閑區(qū)康尼島
- 當前頭條:北京三宗地出讓攬金149.82億元 亦莊新城熱門地塊被“生面孔”中皋置業(yè)搖中
- 時訊:高質量發(fā)展調研行丨哈密金風裝備制造風速發(fā)展
- 工傷申報找哪個部門|環(huán)球時訊
- 全球新動態(tài):中南新能源合作幫南非解“電荒”
- 網商貸還不上會怎么樣?還不上多久被催收? 全球看熱訊
- 人民幣對美元中間價上調200個基點,全年人民幣匯率最高或升至6.6
- 進入女性體內后 沒“受精”成功精子的命運 既好笑又心疼
- 每日熱門:騰訊智慧交通副總裁施雪松:相比技術,智慧交通的決策和管理才是真正挑戰(zhàn)
- 每日短訊:知名演員現身醫(yī)院眼眶濕潤!妻子患病緊急做手術,躺病床臉色蒼白
- 真正高配的人生,其實就是不斷做減法
- 民航局:5月國內客運規(guī)模比2019年同期增長2.6% 聚焦
- 可斷匈奴右臂的烏孫,為何不愿與漢朝共擊匈奴? 天天視訊
- 環(huán)球熱門:6月16日上期所滬銅期貨持倉比例
- 加快建設國家級石墨資源開發(fā)利用研發(fā)平臺 當前短訊
- 世界最新:財政部:前5月 全國一般公共預算支出超10萬億元
- 2023石家莊端午節(jié)親子游好去處
- 6月16日國內鏑鋱系部分價格下滑 環(huán)球頭條
- 小米“小愛建議”已支持MIUI14:覆蓋40余款機型
- 今日起 重慶往返香港航班正式恢復-全球焦點
- 播報:2023年5月全球非洲豬瘟疫情匯總:共500多起,波蘭發(fā)生疫情次數最多
- 香港一季度末市面流通信用卡總數1970萬張 同比上升2.8%
- 無情的世界無情的你是什么歌_無情的世界無情的你歌曲
- 皇氏乳業(yè)榮登“中國500最具價值品牌榜單”
- 天天速訊:中國工商銀行與陜西省人民政府簽署戰(zhàn)略合作協議
- 南華瑞富一年定開債基成立 每日速讀
- 反向裁切照片你試過沒?這個 AI 制圖工具好玩又實用_最新資訊
- 誰“偷”了我的信息:一杯網紅奶茶產生87條數據背后|環(huán)球快資訊
- 當前速讀:中雨!大雨!暴雨在路上!陜西發(fā)布最新預警,今晚……
- 惜敗歐洲第一!EDG1:2TL進入敗者組! 要聞速遞
- 杭州亞運村內部功能區(qū)首次公開亮相 一起全景感受無限好“村”光|天天即時看
- 三晉夏收農忙“豐”景
- 實時:攻擊性還是那么強!EDG分享對陣LNG海報:還是廢紙一張!
- 全球快看點丨蘇翊鳴保送推薦清華大學
- 官媒:樓市下跌比預想加大,專家:7月或出臺更大樓市刺激政策
- 6月16日國內丁苯橡膠市場行情小幅波動 全球微動態(tài)
- 如何寫好合同中的違約責任 天天觀熱點|天天快看點
- 【環(huán)球時快訊】華如科技(301302):該股換手率大于8%(06-16)
- 采用全新設計風格 新款別克昂科威Avenir官圖發(fā)布
- 香港一季度末市面流通信用卡總數1970萬張 同比上升2.8%
- 快資訊:初三老師對學生的鼓勵寄語有哪些
- 每日頭條!汪蘇瀧巡回演唱會首場北京站加場
- 全球熱議:南縣麻河口鎮(zhèn):禁毒宣講進校園 守護青春助成長
- 天天速訊:配置更高價格更香 海豹冠軍版靜態(tài)體驗
- 每日聚焦:5月主要能源產品生產均保持同比增長
- 余承東:比亞迪是少數能活下來的巨頭之一 小公司造不了車
- 熱點!亮點劇透!帶你了解世界互聯網大會數字文明尼山對話精彩活動
- 合盛硅業(yè): 朋友公司目前尚無有機硅期貨業(yè)務,僅有工業(yè)硅期貨業(yè)務-世界聚焦
- 天天熱文:液冷概念股震蕩走高
- 新時代能源(00166)6月16日斥資12.45萬港元回購100萬股
- 簡訊:南陽一AA級國資控股集團完成發(fā)行5億元私募債 利率5.48%
- 再添重器!我國首艘,成功交付!
- 華夏中證港股通50ETF聯接基金順勢發(fā)行
- 降息是股債雙牛的起點;市場底早于經濟底;降息后續(xù)還需要政策配合|大V熱觀點
- 【全球速看料】為何人類不能永生 生物學家 人類只是基因手下的“打工仔”而已
- 金牌廚柜:擬約8億元投建定制家居項目-天天通訊
- 暑期防溺水 安全記心間|今日精選
- 如何找到一份系統(tǒng)工程師的工作?
- 國家發(fā)改委最新回應!
- 北上資金今日凈買入105.46億元-每日視點
- 市區(qū)聯合行動,保障大鵬新區(qū)勞動者職業(yè)健康-每日視點
- 才藝展演、“篝火”晚會……華山幼兒園舉辦畢業(yè)典禮
- 【世界快播報】成都大運會門票已正式開售(附購票入口+規(guī)則)
- 租戶裝修門面房,打通多間墻體,挖機開進房間!江蘇一小區(qū)業(yè)主:地梁鋼筋都漏出來了,還有人家里瓷磚被震掉
- 2023年最新江蘇防溫降暑費標準來了 江蘇高溫費發(fā)放標準2022幾個月?