NEWS CENTER

新聞中心

新聞中心 > 技術動态

【技術工場】巨龍信息大數據集成技術海量數據集成架構實踐

時間：2022-04-25 16:20:12 次數：1823

巨龍信息大數據集成系統是一款基于分布式并行計算架構開發的ETL數據集成系統。具備高吞吐、高可用、高擴展特性，可以為海量數據的超大規模數據倉庫建設提供抽取、整合、清洗、入庫等集成業務。

産品特征

■高吞吐處理能力：采用多線程處理算法，高效的内存利用率；任務運行過程無需本地磁盤IO操作，提升整體單位時間的大批量處理能力；支持TB/h級的大數據集成業務性能。

■高擴展、高可靠：并行架構提升單機處理能力的線性擴展；新增執行引擎的快速部署和自動識别，分布式架構提升多機處理能力的線性擴展；執行引擎宕機的自動識别和任務轉移，保證任務的順利執行。

■可視化流程配置：通過簡單的圖形拖拽配置數據集成流程，簡單易用的專業化配置。

■集成業務全流程監控：可對處理過程的每個步驟，每個子流程處理進行實時監控，簡單快速發現處理過程遇到的漏數據，錯處理等問題。

■統一的元數據模型：基于統一公共倉庫元模型，可與公司産品線其他産品無縫對接，簡化整體解決方案的實施運維。

■大數據技術支持：支持主流的關系型數據庫，NOSQL數據庫,全文庫處理等主流大數據産品的抽取入庫，以及異構庫之間的抽取入庫。

■低廉的硬件成本：使用x86架構的PCServer，無需昂貴的unix服務器。

技術亮點

高性能

■任務的水平切分

一個分布式ETL任務會根據分區自動被分片到多台ETL-執行引擎中，每個執行引擎的執行容器使用多線程并發的對數據進行加工處理後加載到數據倉庫中。當源頭庫單表數據量巨大時，可極大提升整體的數據集成效率和性能

■任務拓撲切分

一個任務的各個步驟，可根據現場物理設備的實際配置，合理地安排到不同的物理設備上，保證硬件資源滿足步驟的執行

高擴展

■集群處理能力的線性擴展

Ø 集群處理能力的快速擴充

Ø 集群自動識别和熱部署新增執行引擎

■多集群組

Ø 根據業務劃分集群組，使關注點分離

Ø 集群組有利于異常幹擾的隔離

■單任務并行計算

Ø 任務步驟的獨立線程數可配置

Ø IO的合理平衡

Ø 内存空間的合理利用，減少内存垃圾回收率

■任務的分布式調度

Ø 帶權重的負載均衡算法，可根據設備處理能力安排并發任務數

Ø 控制中心對集群環境的自動負載均衡

高可用

■異常數據分流

Ø 可選的異常數據分流機制，保證不影響正常流程的情況下異常數據分流

Ø 保證每個步驟出現的異常數據轉儲到指定地點，不丢失

■控制中心HA

■任務的異常處理

Ø 自動感知執行引擎異常，将異常設備的任務轉發到正常設備上重新執行

Ø 任務在一台設備上執行過程出現錯誤，自動重新在另外一台設備重新執行

掃一掃在手機上查看當前頁面

掃一掃分享當前頁面

分享到

返回>

聯系我們

- 廈門市集美區軟件園三期誠毅北大街55号B13棟9F

聯系電話

0592-3592100

聯系我們

小龍人微信号

巨龍信息公衆号

相關鍊接：廈門市法度信息科技有限公司廈門市巨龍軟件工程有限公司

閩公安備案：35021102000930号

關于巨龍

巨龍能力

産品中心

解決方案

新聞中心

加入我們

聯系我們

聯系電話