其系統架構以Namenode為核心,負責將檔案切割成固定大小的區塊,然後把區塊分散儲存到不同的HDFS成員、也就是Datanodes之上,而每個檔案的儲存,皆是跨越實體主機的限制,因此有人比喻HDFS是一個虛擬的分散式檔案系統,與一般檔案系統分割區塊後、都儲存於同一主機的型態,可謂極大不同。
針對這部分,先做這樣簡單的介紹,我們這門課的重點還是放在數據分析上,所以我們就從認識Pig Latin開始吧!
大數據
2024金象盃全國大數據實務能力競賽
— 土芭樂 (@toobala) October 26, 2024
第11屆全國大專校院暨高中職BigData金象盃競賽https://t.co/8wXz9MFJJL
© 土芭樂數位學堂 2016 . Powered by Blogger . Created by Weblyb Bankifsccode
沒有留言:
張貼留言