hadoop權(quán)威指南第四版中文版電子書
pdf版本- 軟件大?。?span itemprop="fileSize">8.56 MB
- 軟件語言:中文
- 軟件類型:國產(chǎn)軟件 / 程序開發(fā)
- 軟件授權(quán): 免費(fèi)軟件
- 更新時(shí)間:2017-10-30 15:49:30
- 軟件等級(jí):
- 軟件廠商: -
- 應(yīng)用平臺(tái):WinXP, Win7, Win8, Win10
- 軟件官網(wǎng): 暫無
相關(guān)軟件
微信公眾平臺(tái)應(yīng)用開發(fā)實(shí)戰(zhàn)完整版pdf掃描版
61.80 MB/中文/10.0
hadoop權(quán)威指南第三版中文pdf電子書
111.80 MB/中文/0.0
hadoop權(quán)威指南第5版電子書完整掃描版
0 Bytes/中文/7.0
信號(hào)與系統(tǒng)第三版pdf電子版
8.37 MB/中文/1.0
NLC電子圖書格式閱讀器v1.0 綠色免費(fèi)版
378.00 KB/中文/10.0
軟件介紹人氣軟件精品推薦相關(guān)文章網(wǎng)友評(píng)論下載地址
hadoop權(quán)威指南第4版是一款針對(duì)于Hadoop發(fā)展現(xiàn)狀和應(yīng)用進(jìn)行詳細(xì)的分析講解,由淺入深全方位介紹了Hadoop,并通過海量數(shù)據(jù)分析儲(chǔ)存,更加清晰了解集群安裝運(yùn)維,高性能的分析平臺(tái)和海量數(shù)據(jù)處理。歡迎來IT貓撲下載使用。
hadoop權(quán)威指南第四版中文版pdf介紹
Hadoop是一個(gè)由Apache基金會(huì)所開發(fā)的分布式系統(tǒng)基礎(chǔ)架構(gòu)。
用戶可以在不了解分布式底層細(xì)節(jié)的情況下,開發(fā)分布式程序。充分利用集群的威力進(jìn)行高速運(yùn)算和存儲(chǔ)。
Hadoop實(shí)現(xiàn)了一個(gè)分布式文件系統(tǒng)(Hadoop Distributed File System),簡稱HDFS。HDFS有高容錯(cuò)性的特點(diǎn),并且設(shè)計(jì)用來部署在低廉的(low-cost)硬件上;而且它提供高吞吐量(high throughput)來訪問應(yīng)用程序的數(shù)據(jù),適合那些有著超大數(shù)據(jù)集(large data set)的應(yīng)用程序。HDFS放寬了(relax)POSIX的要求,可以以流的形式訪問(streaming access)文件系統(tǒng)中的數(shù)據(jù)。
hadoop權(quán)威指南第四版作者簡介
Tom White,數(shù)學(xué)王子&Hadoop專家。身為Apache Hadoop提交者八年之久,Apache軟件基金會(huì)成員之一。全球知名云計(jì)算公司Cloudera的軟件工程師。Tom擁有英國劍橋大學(xué)數(shù)學(xué)學(xué)士學(xué)位和利茲大學(xué)科學(xué)哲學(xué)碩士學(xué)位。
hadoop權(quán)威指南第四版電子書第三章免費(fèi)部分閱讀
第3章 Hadoop分布式文件系統(tǒng)
當(dāng)數(shù)據(jù)集的大小超過一臺(tái)獨(dú)立的物理計(jì)算機(jī)的存儲(chǔ)能力時(shí),就有必要對(duì)它進(jìn)行分區(qū)(partition)并存儲(chǔ)到若干臺(tái)單獨(dú)的計(jì)算機(jī)上。管理網(wǎng)絡(luò)中跨多臺(tái)計(jì)算機(jī)存儲(chǔ)的文件系統(tǒng)稱為分布式文件系統(tǒng)(distributed filesystem)。該系統(tǒng)架構(gòu)于網(wǎng)絡(luò)之上,勢(shì)必會(huì)引入網(wǎng)絡(luò)編程的復(fù)雜性,因此分布式文件系統(tǒng)比普通磁盤文件系統(tǒng)更為復(fù)雜。例如,使文件系統(tǒng)能夠容忍節(jié)點(diǎn)故障且不丟失任何數(shù)據(jù),就是一個(gè)極大的挑戰(zhàn)。
Hadoop自帶一個(gè)稱為HDFS的分布式文件系統(tǒng),即HadoopDistributed Filesystem。在非正式文檔或舊文檔以及配置文件中,有時(shí)也簡稱為DFS,它們是一回事兒。HDFS是Hadoop的旗艦級(jí)文件系統(tǒng),也是本章的重點(diǎn),但實(shí)際上Hadoop是一個(gè)綜合性的文件系統(tǒng)抽象,因此接下來我們將了解將Hadoop與其他存儲(chǔ)系統(tǒng)集成的途徑,例如本地文件系統(tǒng)和Amazon S3系統(tǒng)。
3.1 HDFS的設(shè)計(jì)
HDFS以流式數(shù)據(jù)訪問模式來存儲(chǔ)超大文件,運(yùn)行于商用硬件集群上。①讓我們仔細(xì)看看下面的描述。
* 超大文件 “超大文件”在這里指具有幾百M(fèi)B、幾百GB甚至幾百TB大小的文件。目前已經(jīng)有存儲(chǔ)PB級(jí)數(shù)據(jù)的Hadoop 集群了。②
* 流式數(shù)據(jù)訪問 HDFS的構(gòu)建思路是這樣的:一次寫入、多次讀取是最高效的訪問模式。數(shù)據(jù)集通常由數(shù)據(jù)源生成或從數(shù)據(jù)源復(fù)制而來,接著長時(shí)間在此數(shù)據(jù)集上進(jìn)行各種分析。每次分析都將涉及該數(shù)據(jù)集的大部分?jǐn)?shù)據(jù)甚至全部,因此讀取整個(gè)數(shù)據(jù)集的時(shí)間延遲比讀取第一條記錄的時(shí)間延遲更重要。
* 商用硬件 Hadoop并不需要運(yùn)行在昂貴且高可靠的硬件上。它是設(shè)計(jì)運(yùn)行在商用硬件(在各種零售店都能買到的普通硬件③)的集群上的,因此至少對(duì)于龐大的集群來說,節(jié)點(diǎn)故障的幾率還是非常高的。HDFS遇到上述故障時(shí),被設(shè)計(jì)成能夠繼續(xù)運(yùn)行且不讓用戶察覺到明顯的中斷。
同樣,那些不適合在HDFS上運(yùn)行的應(yīng)用也值得研究。目前HDFS對(duì)某些應(yīng)用領(lǐng)域并不適合,不過以后可能會(huì)有所改進(jìn)。
IT貓撲小編推薦
準(zhǔn)備好釋放數(shù)據(jù)的強(qiáng)大潛能了嗎?借助于這本本書,你將學(xué)習(xí)如何使用ApacheHadoop構(gòu)建和維護(hù)穩(wěn)定性高、伸縮性強(qiáng)的分布式系統(tǒng)。本書是為程序員寫的,可幫助他們分析任何大小的數(shù)據(jù)集。本書同時(shí)也是為管理員寫的,幫助他們了解如何設(shè)置和運(yùn)行Hadoop集群。
hadoop權(quán)威指南第四版中文版pdf未出,暫提供英文原版閱讀。
更多>> 軟件截圖
推薦應(yīng)用
其他版本下載
精品推薦
相關(guān)文章
下載地址
hadoop權(quán)威指南第四版中文版電子書 pdf版本
查看所有評(píng)論>> 網(wǎng)友評(píng)論
更多>> 猜你喜歡
- msp430f5529官方教程中文版
- python金融大數(shù)據(jù)分析 電子書
- python數(shù)據(jù)科學(xué)手冊(cè)
- python學(xué)習(xí)手冊(cè) 第4版
- python數(shù)據(jù)分析與挖掘?qū)崙?zhàn)
- 精通python爬蟲框架scrapy epub+azw3+mobi
- arm體系結(jié)構(gòu)與編程最新版
- node.js權(quán)威指南完整版
- Redhat LINUX 9從入門到精通
- android studio應(yīng)用開發(fā)實(shí)戰(zhàn)詳解 pdf
- JAVA基礎(chǔ)知識(shí)核心技術(shù)卷2原書第8版
- 精通正則表達(dá)式第三版