教育行業(yè)A股IPO第一股(股票代碼 003032)

全國咨詢/投訴熱線:400-618-4000

大數(shù)據(jù)離散流是什么?

更新時間:2021年01月05日16時10分 來源:傳智教育 瀏覽次數(shù):

Spark Streaming提供了一個高級抽象的流,即DStream(離散流)。DStream表示連續(xù)的數(shù)據(jù)流,可以通過Kafka、Flume和Kinesis等數(shù)據(jù)源創(chuàng)建,也可以通過現(xiàn)有DStream的高級操作來創(chuàng)建。DStream的內(nèi)部結(jié)構(gòu)如圖1所示。

圖1 DStream流的內(nèi)部結(jié)構(gòu)

從圖1可以看出,DStream的內(nèi)部結(jié)構(gòu)是由一系列連續(xù)的RDD組成,每個RDD都是一小段時間分隔開來的數(shù)據(jù)集。實際上,對DStream的任何操作,最終都會轉(zhuǎn)變成對底層RDDs的操作。




猜你喜歡:

Spark與Hadoop有哪些區(qū)別?【大數(shù)據(jù)培訓(xùn)】

SparkMllib如何解決回歸問題?[大數(shù)據(jù)培訓(xùn)]

Spark的集群安裝與配置簡介【大數(shù)據(jù)技術(shù)文章】

傳智教育大數(shù)據(jù)培訓(xùn)課程

0 分享到:
和我們在線交談!