近日,瑞萊智慧RealAI發(fā)起設立多模態(tài)大模型公司「北京生數(shù)科技有限公司」(簡稱生數(shù)科技),以加速構建通用人工智能能力。
生數(shù)科技成立于2023年3月,將專注于打造世界領先的可控多模態(tài)通用大模型。日前,生數(shù)科技已完成近億元人民幣天使輪融資,本輪融資由螞蟻集團領投,BV百度風投、卓源資本跟投,目前估值已達1億美金。
領跑安全通用人工智能,添重磅引擎 瑞萊智慧CEO田天表示,本次瑞萊智慧發(fā)起設立生數(shù)科技具有戰(zhàn)略意義,將進一步完善公司大模型基礎能力,從而打造安全的通用人工智能。瑞萊智慧是清華大學人工智能研究院的孵化企業(yè),自成立之初,就致力于研究和發(fā)展安全可控的第三代人工智能技術,建立通用AI模型能力和人工智能安全能力:通過通用人工智能模型來適應各類復雜的智能應用場景和任務;并通過人工智能安全能力,真正使人工智能造福人類整體利益。
瑞萊智慧具備國際領先的人工智能研究能力,堅持源頭創(chuàng)新和底層研究,在生成式人工智能等領域不斷發(fā)表世界領先科研成果。成立以來,瑞萊智慧研發(fā)團隊核心成員在人工智能領域頂會上發(fā)表論文數(shù)百篇,多次在國際測評和競賽中斬獲冠軍,獲得授權專利100余項。同時,瑞萊智慧積極推動行業(yè)規(guī)范化,累計參與30余項國家標準、行業(yè)標準制定。
2023年5月,瑞萊智慧首批入選北京市通用人工智能產業(yè)創(chuàng)新伙伴計劃。
目前,瑞萊智慧已形成三大平臺產品:AI模型應用平臺,基于多模態(tài)基礎大模型、垂直能力大模型及模型應用開發(fā)技術,為各類客戶提供AI理解和AI生成等應用;AI安全平臺,為通用大語言模型、人臉識別、自動駕駛等模型進行安全檢測與防護,并提供AI合成內容檢測等AIGC濫用治理服務;AI隱私計算平臺,在確保數(shù)據(jù)和隱私不泄露前提下進行AI模型訓練和推理,拓展AI數(shù)據(jù)業(yè)務應用。
憑借行業(yè)領先的人工智能技術研發(fā)和應用落地能力,瑞萊智慧面向城市治理、金融、教育科研、智能汽車等場景,已成功服務了300余家大型客戶。
自研多模態(tài)大模型,能力超越谷歌、OpenAI、英偉達同類模型 生數(shù)科技研究團隊是國內最早開展擴散概率模型基礎理論和算法研究的團隊,覆蓋基礎理論、骨干網(wǎng)絡、高速采樣、可控生成等全棧底層原創(chuàng)研發(fā)能力。團隊研究成果被OpenAI及開源擴散模型Stable Diffusion等采用作為最佳推理算法。
生數(shù)科技CEO唐家渝表示,作為當前科技領域最重要的演進方向,AIGC領域質變發(fā)展的關鍵就在于底層核心技術的持續(xù)突破,這也正是擁有深厚科研背景的生數(shù)科技所具備的核心競爭力之一。今年初,團隊開源了全球首個基于Transformer的多模態(tài)擴散大模型UniDiffuser,首次實現(xiàn)基于一個底層模型高質量地完成圖生文、圖文聯(lián)合生成、圖文改寫等多種生成任務。目前其文本生成圖像能力在多種測評指標和實際生成效果上,超越了全球最大開源項目stable diffusion的基礎模型。
生數(shù)科技多模態(tài)大模型在3D內容生成、視頻生成等任務中也實現(xiàn)全球范圍內超高水平的生成效果。例如,該模型已可在無需任何3D數(shù)據(jù)的前提下通過文本描述自動化生成業(yè)內最高質量的3D內容,生成效果已大幅領先Shap-E(OpenAI)、DreamFusion(谷歌)、Magic3D(英偉達)等主流模型水平。
以下為3D生成效果展示:生數(shù)科技多模態(tài)大模型3D生成效果:細節(jié)、紋理、顏色展現(xiàn)豐富,真實感強
Google DreamFusion 3D生成效果
OpenAI SHAP-E 3D生成效果
NVIDIA Magic3D 生成效果
以下為視頻生成效果展示: 根據(jù)文本描述進行視頻元素編輯,從左至右分別為原視頻、生數(shù)科技效果、Runway效果,生數(shù)科技在細節(jié)把控、真實度方面效果更顯著
Prompt: a girl with exquisite and rich makeup
Prompt: a Swarovski crystal swan is swimming in a river
Prompt: a red car
以下為圖像生成效果展示:
接下來,瑞萊智慧將與生數(shù)科技緊密合作,結合多模態(tài)大模型生成能力打造瑞萊智慧綜合AI行業(yè)解決方案,在垂直行業(yè)落地應用,通過可控生成能力賦能智慧營銷、多媒體內容理解分析、數(shù)字資產創(chuàng)建、多模態(tài)私域問答等場景,助力政務、金融、教育、汽車等各行業(yè)客戶智能化升級,創(chuàng)造更多價值。