核心技術是國之重器,加速推進核心領域關鍵技術突破,完成核心網(wǎng)絡中的軟硬件國產(chǎn)替代是國家長期戰(zhàn)略。
“十四五”規(guī)劃更是明確,聚力攻堅基礎軟件,加速分布式數(shù)據(jù)庫/混合事務分析處理數(shù)據(jù)庫等產(chǎn)品研發(fā)推廣。強化基礎組件供給,大力發(fā)展云計算/大數(shù)據(jù)/人工智能/區(qū)塊鏈等平臺軟件開發(fā)框架。
自主可控和國產(chǎn)化替代刻不容緩。過去微軟“黑屏悶”事件、美國“棱鏡門”事件、中興制裁事件已經(jīng)說明了沒有核心技術就會受制于人,今年俄烏事件發(fā)生后,200多家科技公司宣布暫停在俄羅斯的所有業(yè)務,包括芯片、軟件、云服務等斷供,哪里還有“科技無國界”?要擺脫被科技制裁的風險唯一出路就是自主研發(fā)、自主可控。
星環(huán)科技自2013年成立以來,就以自主研發(fā)為己任,不僅自主研發(fā)了大數(shù)據(jù)與云基礎平臺、分布式關系型數(shù)據(jù)庫、數(shù)據(jù)開發(fā)與智能分析工具的軟件產(chǎn)品全系列產(chǎn)品,為企業(yè)數(shù)字化轉型提供了真正的國產(chǎn)數(shù)字底座,以提供數(shù)據(jù)集成、存儲、治理、建模、挖掘、分析和流通能力,可以推動數(shù)據(jù)規(guī)范化、資產(chǎn)化、業(yè)務化,推進業(yè)務數(shù)據(jù)化、智能化,而且產(chǎn)品能力更強更全,領先于國外,在基于容器的數(shù)據(jù)云技術、分布式技術、數(shù)據(jù)庫技術、多模型數(shù)據(jù)的統(tǒng)一處理技術、SQL編譯技術、大數(shù)據(jù)開發(fā)與智能分析技術等6大類技術上擁有31項具備先進性的核心技術,擁有了一大批發(fā)明專利。參加并且通過了工信部自主代碼掃描測試,完全符合信創(chuàng)驗收標準,多個產(chǎn)品進入了國家軟硬件技術圖譜。
在自主研發(fā)創(chuàng)新的同時,星環(huán)科技也在積極參與國家信創(chuàng)工作。星環(huán)科技作為信創(chuàng)工委會WG24大數(shù)據(jù)工作組的小組組長及副組長單位,牽頭制定信創(chuàng)大數(shù)據(jù)行業(yè)標準及規(guī)范,并深度參與產(chǎn)品圖譜編制、產(chǎn)業(yè)白皮書、案例集編撰等工作。
星環(huán)科技全系列產(chǎn)品替代國外進口產(chǎn)品 星環(huán)科技擁有成熟的基礎軟件替代解決方案,完全滿足信創(chuàng)驗收要求,取得了眾多的成果。
大數(shù)據(jù)基礎平臺TDH可以完美的替代CDH/HDP和CDP,提升功能、性能、穩(wěn)定性、易用性、擴展性、可靠性、安全、國產(chǎn)生態(tài)支持等能力,提供多種模型支持能力,性能的提升可以達到5到100倍,原廠專業(yè)服務能力更強。
分布式交易型數(shù)據(jù)庫KunDB可以在交易型OLTP的業(yè)務場景、高并發(fā)在線數(shù)據(jù)服務場景,替代Oracle/DB2,并且提升存儲計算能力、高可用能力、跨分區(qū)事務能力。
分布式分析型數(shù)據(jù)庫ArgoDB可以在批處理和OLAP、Ad hoc分析等場景,替代Oracle/DB2/TD/SAP HANA,提供海量數(shù)據(jù)分析能力,提升混合負載、實時數(shù)據(jù)分析等能力,軟硬件綜合性價比得到10到100倍的提升。
分布式圖數(shù)據(jù)庫StellarDB可以在圖查詢、圖分析的場景替代Neo4j,提升圖數(shù)據(jù)存儲檢索能力,支持萬億頂點以上的圖存儲與毫秒級檢索性能,提供近30種分布式圖算法和10層以上深度鏈路分析能力。
搜索引擎Scope可以在全文檢索、日志分析等場景替代ElasticSearch,提升穩(wěn)定性、性能、集群擴展性等能力。
智能分析工具Sophon可以在可視化建模分析場景替代SAS/SPSS,獲得200+算子支撐,提升功能和性能(將本增效)。
國產(chǎn)化替代的10大關鍵評價指標 星環(huán)科技的一體化替代方案擁有獨一無二的優(yōu)勢
在功能上,星環(huán)科技基礎軟件產(chǎn)品多模架構,支持關系表、文本、時空地理、圖數(shù)據(jù)、文檔、時序等在內(nèi)的10種數(shù)據(jù)模型;離線數(shù)據(jù)批處理、高并發(fā)的在線數(shù)據(jù)服務、數(shù)據(jù)集市、數(shù)據(jù)倉庫、數(shù)據(jù)湖、圖存儲分析、空間數(shù)據(jù)存儲、實時數(shù)據(jù)處理、數(shù)據(jù)中臺、數(shù)據(jù)治理等各類大數(shù)據(jù)業(yè)務場景一站解決。
在性能上,星環(huán)科技基礎軟件產(chǎn)品自研高性能分布式計算和存儲引擎,整體性能是CDP 5~25倍。整體性價比是DB2 20倍,是TD 100倍。
在成本上,星環(huán)科技產(chǎn)品高度兼容CDH/HDP、TD、Oracle、DB2,兼容TD、Oracle、DB2的SQL和方言,提供成熟的遷移工具,有大量低成本成功遷移案例。
在安全上,星環(huán)科技基礎軟件產(chǎn)品提供的容器隔離、災備、訪問控制、聯(lián)邦學習、隱私保護、可信計算等技術保障網(wǎng)絡層、加固層、治理層、流通層全方位數(shù)據(jù)安全。
在架構上,星環(huán)科技基礎軟件產(chǎn)品提供統(tǒng)一SQL引擎、統(tǒng)一計算引擎、統(tǒng)一分布式存儲管理、統(tǒng)一資源調(diào)度,統(tǒng)一內(nèi)聯(lián)的架構高效搞定湖倉集一體、HTAP等復雜場景,而不是拼湊組件成散裝架構。
在開發(fā)上,星環(huán)科技基礎軟件產(chǎn)品提供統(tǒng)一SQL引擎,無需每個場景一套接口;完整支持SQL2003標準,支持PLSQL存儲過程,兼容Oracle、DB2、TD等方言。
在運維上,星環(huán)科技基礎軟件產(chǎn)品提供開箱即用的可視化運維監(jiān)控、安全管控工具,容器技術帶來極致的安裝、升級、補丁體驗。
在售后上,星環(huán)科技原廠有超過1100人的研發(fā)與支持團隊,超過3萬名星環(huán)科技認證的大數(shù)據(jù)工程師,專業(yè)性更強。
在國產(chǎn)化上,星環(huán)科技的軟件產(chǎn)品自主研發(fā),通過了工信部代碼自主研發(fā)率掃描測試,滿足信創(chuàng)驗收要求。
在國產(chǎn)生態(tài)上,星環(huán)基礎軟件產(chǎn)品已完成與主流信創(chuàng)生態(tài)廠商的適配互認工作,適配長城飛騰、華為泰山、浪潮等服務器,鯤鵬、飛騰CPU,麒麟、統(tǒng)信等操作系統(tǒng),并有官方認證,支持基于ARM與X86服務器服務器混合部署并有落地案例。
星環(huán)科技有在大數(shù)據(jù)平臺、數(shù)據(jù)庫產(chǎn)品、數(shù)據(jù)分析平臺等領域有大量成功替代國外進口產(chǎn)品的案例。目前,星環(huán)科技的大數(shù)據(jù)基礎軟件系列產(chǎn)品已在十幾個行業(yè)1000+用戶應用落地。
大數(shù)據(jù)平臺國產(chǎn)化替代平滑遷移方案 (CDH/HDP/CDP->TDH)
Cloudera(Cloudera 和Hortonworks 合并后)所有產(chǎn)品不再提供社區(qū)版,用戶無法獲取新的功能。2021年1月31日開始,所有Cloudera軟件都需要有效的訂閱,且訂閱費昂貴(50個節(jié)點,一年訂閱費50萬美元)。此外,CDH 6和HDP 3將是CDH和HDP的最后企業(yè)版本,企業(yè)版用戶無法繼續(xù)獲取新的功能和性能提升。至2022年3月份,CDH/HDP全部停止服務(EoS),用戶沒辦法獲取售后支持。
Transwarp Data Hub(TDH) 是星環(huán)科技自主研發(fā)的企業(yè)級一站式多模型大數(shù)據(jù)基礎平臺,基于其領先的多模型統(tǒng)一技術架構,8種異構存儲引擎可以支持包括關系表、文本、時空地理、圖數(shù)據(jù)、文檔、時序等在內(nèi)的10種數(shù)據(jù)模型。TDH能夠存儲 PB 級別的海量數(shù)據(jù),同時能夠提供高性能的查詢搜索、實時分析、統(tǒng)計分析、預測性分析等數(shù)據(jù)分析功能,被廣泛應用在離線數(shù)據(jù)批處理、高并發(fā)的在線數(shù)據(jù)服務、數(shù)據(jù)集市、數(shù)據(jù)倉庫、數(shù)據(jù)湖、圖存儲分析、空間數(shù)據(jù)存儲、實時數(shù)據(jù)處理等各類大數(shù)據(jù)業(yè)務場景,幫助企業(yè),更全面、更便捷、更智能、更安全地運用數(shù)據(jù),加速企業(yè)數(shù)字化轉型。
TDH基礎存儲與計算組件兼容CDH/HDP,可以實現(xiàn)平滑遷移,大大降低企業(yè)遷移成本低。
同時,星環(huán)科技提供專業(yè)的遷移工具Transwarp? Backup (TBAK),幫助用戶通過簡單的三步即可實現(xiàn)數(shù)據(jù)與業(yè)務的一鍵遷移,高效便捷。整個遷移過程操作簡單,配置靈活,通過3步即可完成所有的遷移工作,同時用戶可以對遷移過程進行全流程實時監(jiān)控,保障整個遷移過程順利進行。
第一步,基于TBAK提供可視化的界面進行CDH和TDH的集群配置。
第二步,創(chuàng)建CDH遷移方案。TDH提供服務級和表級的遷移策略,以及對源集群,災備集群,調(diào)度策略等進行配置。在調(diào)度策略中用戶可以根據(jù)實際情況進行配置,例如可以設置在業(yè)務空窗期的每天凌晨2點進行數(shù)據(jù)遷移。同時,用戶可以設置相應的告警策略,當遷移發(fā)生問題時可以第一時間收到告警信息并對問題進行排查和恢復。
第三步,執(zhí)行遷移任務和結果檢查。當集群配置完成后,所有的遷移方案將在遷移方案界面進行管理和操作。用戶可以選擇相應的遷移方案進行操作,例如立即執(zhí)行和設置執(zhí)行策略。若點擊執(zhí)行遷移任務,系統(tǒng)會進入到自動遷移狀態(tài),同時可以監(jiān)測遷移任務執(zhí)行的整體狀態(tài)信息,并且可以對每一步的執(zhí)行情況進行實時監(jiān)測。當遷移發(fā)生故障時,系統(tǒng)會發(fā)出執(zhí)行故障的告警,方便用戶對故障發(fā)生的階段進行排查和故障恢復。
此外,星環(huán)科技積累了大量的遷移成功案例,經(jīng)驗豐富,可以保障整個遷移過程安全可靠。
相比于遷移到CDP或者國內(nèi)封裝的Hadoop商業(yè)版,用戶遷移到星環(huán)科技TDH后,TDH多模型統(tǒng)一架構提供統(tǒng)一SQL引擎、統(tǒng)一計算引擎、統(tǒng)一分布式存儲管理、統(tǒng)一資源調(diào)度,統(tǒng)一內(nèi)聯(lián)架構高效搞定湖倉集一體、HTAP等復雜場景,無需拼湊組件散裝架構。同時在技術領先性、性能、易用性、穩(wěn)定性、安全性等方面得到全面的提升。此外,TDH由星環(huán)科技自主研發(fā),通過工信部自主代碼掃描測試,完全自主可控,并且與已完成與主流信創(chuàng)生態(tài)廠商的適配互認工作,滿足信創(chuàng)驗收要求,幫助各行業(yè)用戶提升大數(shù)據(jù)系統(tǒng)的國產(chǎn)化水平。
數(shù)據(jù)庫國化產(chǎn)替代平滑遷移方案 (Oracle/DB2/MySQL/Teradata/SAP HANA->TDH/ArgoDB/KunDB)
傳統(tǒng)數(shù)據(jù)庫如Oracle,DB2等存在成本高、擴容難、性能受限、運維難等問題給很多企業(yè)用戶造成了困擾。
前段時間俄烏事件中,Oracle宣布暫停在俄業(yè)務,其他眾多科技公司也相繼宣布斷供俄羅斯。這些事件再次給國人敲響了警鐘,建設國產(chǎn)數(shù)據(jù)平臺迫在眉睫。
星環(huán)科技大數(shù)據(jù)基礎平臺和數(shù)據(jù)庫產(chǎn)品支持完整的SQL標準語法,兼容Oracle、IBM DB2、Teradata方言,兼容Oracle和DB2等的存儲過程,可以實現(xiàn)平臺間的平滑遷移。同時能夠提供統(tǒng)一的架構,一站式幫忙用戶解決所有業(yè)務場景,從降低成本、提升效能、平臺創(chuàng)新、應用創(chuàng)新等多個方面為用戶帶來收益。
星環(huán)科技建立了一整套從老牌數(shù)據(jù)庫到星環(huán)產(chǎn)品的平滑遷移方法論,大致可以分為分析與設計、遷移實施和上線保障三個階段。
第一階段,分析和設計。結合用戶的現(xiàn)場情況和需求進行分析,并對數(shù)據(jù)流轉和整體架構設計。如將Oracle遷移到星環(huán)科技TDH,TDH支持多種數(shù)據(jù)源接入,并對于不同的接入方式提供專業(yè)的組件工具。例如星環(huán)科技Transporter支持定時批量抽取,實時流計算引擎Slipstream支持實時數(shù)據(jù)接入,可用于實時數(shù)倉等場景。
第二階段,遷移實施。遷移分為數(shù)據(jù)遷移和業(yè)務兩大部分。在數(shù)據(jù)遷移方面,星環(huán)科技可以實現(xiàn)三種遷移方式,1:1平移、按照大數(shù)據(jù)平臺特性重新設計和遷移種選重點進行優(yōu)化,用戶可以根據(jù)實際情況和自身需求進行選擇。在業(yè)務遷移方面,星環(huán)科技平臺能夠提供完整的配套產(chǎn)品和組件,同時又能完整支持SQL標準,兼容像Oracle存儲過程等特征,在保障業(yè)務的同時實現(xiàn)低成本、平滑遷移。
第三階段,上線保障。星環(huán)科技可以提供雙軌試運行機制,定期進行兩邊的數(shù)據(jù)核對,觀察平臺的運行情況,進行后期的細致調(diào)優(yōu)等相關工作,保障遷移后能夠順利上線投產(chǎn)。
以金融行業(yè)為例,星環(huán)科技可替換的場景包含:風險控制、數(shù)據(jù)倉庫、報表平臺、ODS、數(shù)據(jù)集市、投資交易分析回放、客戶分析和客戶畫像等等。例如風控的指標管理、實時預警、合規(guī)管理、數(shù)據(jù)維度一直是金融行業(yè)中券商最依賴于數(shù)據(jù)處理的部分,可結合市場風險、信用風險、反洗錢、投資人適當性管理等應用場景,星環(huán)科技能夠在機器學習算法和風險模型上提供解決方案。其他例如投資交易、行情預測、業(yè)務運營等場景,星環(huán)科技都能夠提供全面的支撐能力。
星環(huán)科技提供完整的數(shù)據(jù)庫平滑遷移方案能夠全方位保障數(shù)據(jù)與業(yè)務遷移,大大降低企業(yè)遷移成本和遷移風險。同時相對于傳統(tǒng)數(shù)據(jù)庫,星環(huán)科技大數(shù)據(jù)平臺以及數(shù)據(jù)庫產(chǎn)品能夠在架構、性能、可擴展性、以及對云和AI的支持等能力上獲得極大的提升,幫助企業(yè)快速實現(xiàn)國產(chǎn)化替代,構建自主可控的高性能數(shù)據(jù)平臺。
圖數(shù)據(jù)庫國化產(chǎn)替代平滑遷移方案 (Neo4j->星環(huán)分布式圖數(shù)據(jù)庫StellarDB)
Neo4j是一款知名的開源圖數(shù)據(jù)庫,但用戶在使用過程中發(fā)現(xiàn)Neo4j存在一定的局限性,例如Neo4j不支持多數(shù)據(jù)庫實例應用,每個應用都需要單獨的服務器部署,不便于管理。當數(shù)據(jù)量較大時,Neo4j計算能力存在瓶頸,無法滿足較高要求的計算需求。此外,Neo4j不滿足高可用的要求,且缺乏統(tǒng)一的資源管理和權限管理。
Transwarp StellarDB是星環(huán)科技自主研發(fā)的分布式圖數(shù)據(jù)庫,兼容openCypher查詢語言,提供海量圖數(shù)據(jù)的存儲和分析能力,支持原生圖存儲結構,支持萬億邊PB級數(shù)據(jù)存儲。同時,StellarDB具備毫秒級點邊查詢能力,10+層的深度鏈路分析能力,提供近30種的圖分析算法,具備數(shù)據(jù)2D和3D展示能力。
在遷移方面,StellarDB支持MySQL、Greenplum等關系型數(shù)據(jù)庫、HDFS、Hive等大數(shù)據(jù)平臺數(shù)據(jù)源接入,在4.0版本中StellarDB新增通過Kafka、Flink、Spark Streaming等方式接入流式數(shù)據(jù)源,可以覆蓋所有場景數(shù)據(jù)源。同時提供專業(yè)的數(shù)據(jù)遷移工具實現(xiàn)數(shù)據(jù)的快速高效遷移。此外,StellarDB與Neo4j的Cypher語法高度兼容,低成本、安全地實現(xiàn)原有業(yè)務的平滑遷移和上線。
相比Neo4j,StellarDB在存儲能力、高性能、圖算法、國產(chǎn)化兼容、運維管理能力、知識圖譜能力、接口工具等方面表現(xiàn)優(yōu)異。
StellarDB支持海量圖數(shù)據(jù)的存儲與檢索,可以支持至少萬億頂點以上的圖存儲,在某地電信關系圖譜場景實現(xiàn)了9700億邊規(guī)模的存儲和穩(wěn)定運行,真正意義上將萬億級圖數(shù)據(jù)庫能力應用落地。
替換Neo4j以后,用戶可獲得更高的性能。批量數(shù)據(jù)導入性能提高2倍以上,在深度鏈路查詢能力方面,StellarDB能夠支持12度以上關聯(lián)查詢,秒級返回,經(jīng)測試驗證,6跳查詢相對于Neo4j提高了50倍以上。在圖算法性能方面,StellarDB4.0具有很大性能優(yōu)勢,PageRank算法和強連通子圖算法性能提升3-6倍,LPA算法性能提升8倍以上,在十億級邊Twitter-2010數(shù)據(jù)集下,StellarDB秒級響應,Neo4j在30min內(nèi)無響應結果。
相比于Neo4j,StellatDB支持分布式集群部署,實現(xiàn)一站式集群管理,同時提供企業(yè)級便捷的管理工具,實現(xiàn)高效的統(tǒng)一資源管理和權限管理。
StellarDB提供統(tǒng)一調(diào)度和API接口管理能力,相比之前依賴第三方調(diào)度工具,更方便高效。
在可視化能力方面,StellarDB支持2D和3D的圖可視化展示,利用可視化技術幫助用戶快速獲取數(shù)據(jù)基于關聯(lián)性的深度洞察,并且提供可視化的數(shù)據(jù)導入、集群監(jiān)控、圖查詢?nèi)蝿蘸蛨D計算任務監(jiān)控等功能。
在國產(chǎn)化方面,StellarDB是星環(huán)科技自研圖數(shù)據(jù)庫,且兼容國產(chǎn)化軟硬件,幫助企業(yè)提高國產(chǎn)化水平,滿足信創(chuàng)要求。
此外,星環(huán)科技是國內(nèi)具備圖數(shù)據(jù)庫、知識圖譜平臺、圖挖掘應用開發(fā)能力的企業(yè),其全棧自研的圖技術能力可以助力企業(yè)快速挖掘圖數(shù)據(jù)價值,推動業(yè)務高效高質(zhì)量發(fā)展。
搜索產(chǎn)品國產(chǎn)化替代平滑遷移方案 (ElasticSearch->星環(huán)分布式搜索引擎Scope)
ES在2021年宣布變更 Elasticsearch 和 Kibana 的其中一項開源許可協(xié)議Apache License 2.0,變更為雙授權許可,即 Server Side Public License (SSPL) + Elastic License,在一定程度上對許可協(xié)議加以限制。
此外,隨著數(shù)據(jù)量的劇增以及性能要求的不斷提高,ES在集群擴展性、可靠性、數(shù)據(jù)讀寫性能、以及數(shù)據(jù)恢復速度等方面越來越難以滿足用戶的需求。例如,ES單節(jié)點實例支持的數(shù)據(jù)量有限,當集群超過100節(jié)點,會出現(xiàn)連續(xù)失聯(lián)等穩(wěn)定性問題。當節(jié)點磁盤損壞時,需要采取全量數(shù)據(jù)拷貝的方式恢復數(shù)據(jù),工作量大,TB級別可達小時級別,數(shù)據(jù)恢復速度比較慢,無法滿足客戶快速實現(xiàn)數(shù)據(jù)恢復的需求。
Transwarp Scope是星環(huán)科技自主研發(fā)的分布式搜索引擎,提供PB級海量數(shù)據(jù)的交互式多維檢索分析服務,能夠?qū)崿F(xiàn)高可靠、高擴展性的全文搜索與靈活查詢。能夠兼容常用的ES讀寫接口,比ES更強的數(shù)據(jù)一致性和可靠性,同時比ES有更強的穩(wěn)定性,實現(xiàn)分鐘級快速恢復單點故障。在性能方面,Scope可以毫秒級快速響應用戶的檢索需求,入庫與查詢能力有發(fā)幅度的提升。此外,Scope是星環(huán)科技自主研發(fā)的搜索引擎,可以滿足信創(chuàng)驗收要求。
基于星環(huán)平滑遷移方案論,從ES到Scope的遷移過程可以分為三個階段,調(diào)研評估、方案測試和上線保障。同時星環(huán)科技支持多種數(shù)據(jù)遷移方式保障數(shù)據(jù)順利遷移,Scope支持ES接口可以實現(xiàn)原先ES業(yè)務的平滑遷移。
在數(shù)據(jù)遷移方面,星環(huán)科技支持三種數(shù)據(jù)遷移方案,使用部分ES遷移工具遷移數(shù)據(jù)、通過HDFS將數(shù)據(jù)遷移到Scope和使用Logstash進行數(shù)據(jù)遷移,用戶可以根據(jù)需求靈活選擇。
在業(yè)務遷移方面,Scope支持ES接口,可以實現(xiàn)ES的業(yè)務平滑遷移,同時針對部分用戶習慣使用SQL的方式,Scope支持SQL 2003和全文檢索SQL擴展,滿足傳統(tǒng)數(shù)據(jù)庫遷移到ES的需求。
相較于ES,用戶遷移到Scope之后,可以實現(xiàn)海量存儲能力確保百節(jié)點以上規(guī)模集群穩(wěn)定運行,強一致性寫入能力確保讀寫數(shù)據(jù)不丟。在高可用能力方面也有非常大的提升,可以確保錯誤分鐘級重啟恢復。此外,用戶還可獲得多進程架構,內(nèi)存精細化控制、負載均衡、數(shù)據(jù)分區(qū)等能力。
星環(huán)科技Scope在政府、金融等行業(yè)有很多ES國產(chǎn)替代落地經(jīng)驗,幫助用戶在海量數(shù)據(jù)檢索和分析、可擴展性、可靠性、數(shù)據(jù)恢復等能力上獲得極大的提升,幫助企業(yè)完成搜索產(chǎn)品的國產(chǎn)化替代。
分析工具國產(chǎn)化平滑遷移方案 (SAS/SPSS->星環(huán)智能分析工具Sophon)
大數(shù)據(jù)分析工具可以幫助用戶更靈活、更高效地進行數(shù)據(jù)分析,挖掘數(shù)據(jù)價值。隨著數(shù)據(jù)量的劇增,以及深度學習算法的不斷迭代以及創(chuàng)新,市面上如SAS/SPSS等分析工具越來越難以滿足企業(yè)用戶更快速、更高效、更靈活以及更低成本的需求。
例如,用戶在使用SAS過程中可能會遇到如下幾個問題:首先,其相對比較封閉,用戶無法針對單個功能授予許可證,使用成本高昂;其次,SAS自建機器學習算法有限,深度學習算法依賴外部如Python嵌入支持,用戶無法靈活地獲取新的算法;再次,SAS對分布式讀寫和計算存在局限性,對海量數(shù)據(jù)處理及大規(guī)模機器學習難以有效支撐,對實時計算更是無能為力。
此外,SAS是過程性語言,代碼量偏多,加上閉源特性,SAS社區(qū)不及開源語言活躍。隨著R、Python的流行,SAS人才日漸稀缺,導致企業(yè)難以組織高質(zhì)量團隊。
星環(huán)科技Sophon Base是具備統(tǒng)計、機器學習、深度學習等完備算法和豐富算子的企業(yè)級分布式機器學習平臺,支持從數(shù)據(jù)接入、數(shù)據(jù)處理,到模型訓練、服務部署、線上監(jiān)控的一站式可視化流程。
在多年的行業(yè)積累和項目實踐上,星環(huán)科技建立了一套模型遷移方法論,整個過程被定義為8個階段——業(yè)務理解、數(shù)據(jù)理解、元模型理解、數(shù)據(jù)準備、模型遷移、評估報告、應用和檢測。星環(huán)科技SAS平滑遷移過程強調(diào)針對實際業(yè)務問題,解決客戶的業(yè)務痛點,產(chǎn)生實際價值。
通過對用戶業(yè)務、數(shù)據(jù)、元模型的理解后,進行相應的數(shù)據(jù)準備,包括框架設計、數(shù)據(jù)處理、方案設計等。當數(shù)據(jù)準備好后就會進行模型遷移,這一階段主要是進行代碼邏輯架構梳理設計、模型驗證等。模型遷移完成后會對遷移效果進行評估,確認遷移前后的準確性、一致性、以及優(yōu)化效果驗證。最后是部署上線來支持業(yè)務,對業(yè)務進行持續(xù)跟蹤,不斷優(yōu)化模型,并對效果進行評估。通過一整套完整的遷移流程,保障SAS平滑、安全的遷移到星環(huán)Sophon。
星環(huán)科技Sophon可以提供完整的SAS模型遷移能力。相較于SAS,遷移到Sophon后可以支持多源異構數(shù)據(jù)的接入、豐富的數(shù)據(jù)處理、多個框架的模型訓練及發(fā)布、模型部署和維護等全過程,多源數(shù)據(jù)和建模流程靈活組合確保綜合性場景高效支撐。用戶可以獲得Sophon自建的200多個高性能分布式AI算子以及對自定義算子的支持,完全覆蓋SAS原有的建模能力。同時,Sophon還能帶來模型可解釋性、聯(lián)邦學習等額外的支持,更好地支撐模型的業(yè)務應用。此外,在模型的統(tǒng)一管理、發(fā)布及監(jiān)控方面,Sophon也為企業(yè)客戶提供了簡潔、易用、穩(wěn)定的解決方案,幫助用戶更好地獲取數(shù)據(jù)價值。