大數(shù)據(jù)培訓(xùn)課程問(wèn)答 真的是答非所問(wèn)啊

2022-03-2619:15:39大數(shù)據(jù)培訓(xùn)課程問(wèn)答 真的是答非所問(wèn)啊已關(guān)閉評(píng)論



大數(shù)據(jù)訪談問(wèn)答簡(jiǎn)介

互聯(lián)網(wǎng)上產(chǎn)生的各種數(shù)據(jù)被稱為大數(shù)據(jù),超過(guò)數(shù)百GB的數(shù)據(jù)僅通過(guò)在線活動(dòng)在互聯(lián)網(wǎng)上產(chǎn)生。在線活動(dòng),如網(wǎng)絡(luò)活動(dòng)、博客、文本、視頻/音頻文件、圖像、電子郵件、社交網(wǎng)絡(luò)活動(dòng)。大數(shù)據(jù)需要專門的系統(tǒng)和軟件工具來(lái)處理所有非結(jié)構(gòu)化數(shù)據(jù)。這些活動(dòng)產(chǎn)生的數(shù)據(jù)稱為大數(shù)據(jù)。大數(shù)據(jù)是完全廣泛分布在互聯(lián)網(wǎng)上的,因此,大數(shù)據(jù)的處理需要分布式系統(tǒng)和工具,以便從中提取信息。
以下是一些重要的2019年大數(shù)據(jù)采訪問(wèn)題和答案:

Hadoop、數(shù)據(jù)科學(xué)、統(tǒng)計(jì)和;其他

如果你正在尋找與大數(shù)據(jù)相關(guān)的工作,你需要準(zhǔn)備2019年大數(shù)據(jù)面試問(wèn)題。雖然每次面試都不一樣,工作的范圍也不一樣,但我們可以幫助你解決面試中最重要的問(wèn)題和答案,這將幫助你邁出第一步,獲得成功你在大數(shù)據(jù)面試中的成功。
這些問(wèn)題分為兩部分:

第一部分——大數(shù)據(jù)面試問(wèn)題(基礎(chǔ))

第一部分包括基本的面試問(wèn)題和答案

1。大數(shù)據(jù)的含義是什么?它有什么不同

回答:
大數(shù)據(jù)是指互聯(lián)網(wǎng)上產(chǎn)生的各種數(shù)據(jù)。在互聯(lián)網(wǎng)上,只有在線活動(dòng)才能產(chǎn)生超過(guò)數(shù)百GB的數(shù)據(jù)。在這里,在線活動(dòng)意味著網(wǎng)絡(luò)活動(dòng)、博客、文本、視頻/音頻文件、圖像、電子郵件、社交網(wǎng)絡(luò)活動(dòng)等等。大數(shù)據(jù)可以被稱為從所有這些活動(dòng)中創(chuàng)建的數(shù)據(jù)。在線生成的數(shù)據(jù)大多是非結(jié)構(gòu)化的。大數(shù)據(jù)還將包括數(shù)據(jù)庫(kù)中的交易數(shù)據(jù)、系統(tǒng)日志文件,以及傳感器、物聯(lián)網(wǎng)、RFID標(biāo)簽等智能設(shè)備生成的數(shù)據(jù),以及在線活動(dòng)。
大數(shù)據(jù)需要專門的系統(tǒng)和軟件工具來(lái)處理所有非結(jié)構(gòu)化數(shù)據(jù)。事實(shí)上,據(jù)一些行業(yè)估計(jì),互聯(lián)網(wǎng)上生成的數(shù)據(jù)中有近85%是非結(jié)構(gòu)化的。通常,關(guān)系數(shù)據(jù)庫(kù)具有結(jié)構(gòu)化格式,并且數(shù)據(jù)庫(kù)是集中的。因此,可以使用SQL等查詢語(yǔ)言快速完成RDBMS處理。另一方面,大數(shù)據(jù)非常大,分布在互聯(lián)網(wǎng)上,因此處理大數(shù)據(jù)將需要分布式系統(tǒng)和工具從中提取信息。大數(shù)據(jù)需要Hadoop、Hive等專用工具以及高性能硬件和網(wǎng)絡(luò)來(lái)處理。

2。大數(shù)據(jù)的特點(diǎn)是什么

回答:
大數(shù)據(jù)有三個(gè)主要特征:數(shù)量、多樣性和速度。
體積特征指的是數(shù)據(jù)的大小。據(jù)估計(jì),每天生成的數(shù)據(jù)超過(guò)300萬(wàn)GB。在計(jì)算帶寬和存儲(chǔ)容量有限的辦公環(huán)境中,在普通個(gè)人計(jì)算機(jī)或客戶機(jī)-服務(wù)器網(wǎng)絡(luò)中無(wú)法處理這一數(shù)量的數(shù)據(jù)。然而,云服務(wù)提供了處理大數(shù)據(jù)量的解決方案,并使用分布式計(jì)算架構(gòu)高效地處理它們。
多樣性特征指的是大數(shù)據(jù)的格式——結(jié)構(gòu)化或非結(jié)構(gòu)化。傳統(tǒng)的RDBMS符合結(jié)構(gòu)化格式。
非結(jié)構(gòu)化數(shù)據(jù)格式的一個(gè)例子是,視頻文件格式、圖像文件、純文本格式、來(lái)自web文檔或標(biāo)準(zhǔn)MS Word文檔的格式都是唯一的,等等。還要注意的是,RDBMS沒(méi)有處理非結(jié)構(gòu)化數(shù)據(jù)格式的能力。此外,必須對(duì)所有這些非結(jié)構(gòu)化數(shù)據(jù)進(jìn)行分組和整合,這就需要專門的工具和系統(tǒng)。此外,每天或每分鐘都會(huì)添加新數(shù)據(jù),數(shù)據(jù)會(huì)不斷增長(zhǎng)。因此,大數(shù)據(jù)更像是多樣性的同義詞。
速度特性指的是創(chuàng)建數(shù)據(jù)的速度和處理所有數(shù)據(jù)所需的效率。

例如,F(xiàn)acebook在一個(gè)月內(nèi)被超過(guò)16億用戶訪問(wèn)。同樣,還有其他社交網(wǎng)站、YouTube、谷歌服務(wù)等。此類數(shù)據(jù)流必須使用實(shí)時(shí)查詢進(jìn)行處理,并且必須在不丟失數(shù)據(jù)的情況下進(jìn)行存儲(chǔ)。因此,速度特性在大數(shù)據(jù)處理中非常重要。
此外,其他特征包括準(zhǔn)確性和價(jià)值。準(zhǔn)確性將決定數(shù)據(jù)的可靠性和可靠性,價(jià)值是組織從大數(shù)據(jù)處理中獲得的價(jià)值。

3。為什么大數(shù)據(jù)對(duì)組織很重要

回答:
這是采訪中提出的基本大數(shù)據(jù)采訪問(wèn)題。大數(shù)據(jù)很重要,因?yàn)橥ㄟ^(guò)處理大數(shù)據(jù),組織可以獲得與以下方面相關(guān)的洞察信息:
?降低成本
?產(chǎn)品或服務(wù)的改進(jìn)
?了解客戶行為和市場(chǎng)
?有效的決策
?提高競(jìng)爭(zhēng)力

4。列舉一些用于大數(shù)據(jù)處理的工具或系統(tǒng)

回答:
大數(shù)據(jù)處理和分析可以使用,
?Hadoop
?蜂巢
?豬
?管理員
?水槽

第2部分——大數(shù)據(jù)面試問(wèn)題(高級(jí))

現(xiàn)在讓我們來(lái)看一下高級(jí)面試問(wèn)題。

5。大數(shù)據(jù)如何支持組織

回答:
大數(shù)據(jù)有可能在許多方面支持組織。從大數(shù)據(jù)中提取的信息可以用于,
?更好地與客戶和利益相關(guān)者協(xié)調(diào),解決問(wèn)題
?改進(jìn)產(chǎn)品或服務(wù)改進(jìn)的報(bào)告和分析
?針對(duì)選定市場(chǎng)定制產(chǎn)品和服務(wù)
?確保更好地共享信息
?支持管理決策
?識(shí)別新機(jī)會(huì)、產(chǎn)品理念和新市場(chǎng)
?從多個(gè)來(lái)源收集數(shù)據(jù)并存檔以備將來(lái)參考
?維護(hù)數(shù)據(jù)庫(kù)和系統(tǒng)
?確定績(jī)效指標(biāo)
?了解業(yè)務(wù)職能之間的相互依賴關(guān)系
?評(píng)估組織績(jī)效

6。解釋如何使用大數(shù)據(jù)來(lái)增加業(yè)務(wù)價(jià)值

回答:
在理解分析大數(shù)據(jù)的必要性的同時(shí),此類分析將幫助企業(yè)確定其在市場(chǎng)中的地位,并幫助企業(yè)從競(jìng)爭(zhēng)對(duì)手中脫穎而出。例如,從大數(shù)據(jù)分析的結(jié)果來(lái)看,企業(yè)可以了解定制產(chǎn)品的需求,或者了解增加收入和價(jià)值的潛在市場(chǎng)。分析大數(shù)據(jù)將涉及對(duì)來(lái)自不同來(lái)源的數(shù)據(jù)進(jìn)行分組,以了解與業(yè)務(wù)相關(guān)的趨勢(shì)和信息。當(dāng)通過(guò)從正確的來(lái)源收集數(shù)據(jù),有計(jì)劃地進(jìn)行大數(shù)據(jù)分析時(shí),企業(yè)可以輕松地創(chuàng)造近5%到20%的業(yè)務(wù)價(jià)值和收入。亞馬遜、Linkedin、沃爾瑪和許多其他組織就是這樣的例子。
讓我們轉(zhuǎn)到下一個(gè)大數(shù)據(jù)采訪問(wèn)題

7。什么是大數(shù)據(jù)解決方案實(shí)施

回答:
大數(shù)據(jù)解決方案首先以小規(guī)模實(shí)施,基于適合業(yè)務(wù)的概念。從結(jié)果來(lái)看,這是一個(gè)原型解決方案,業(yè)務(wù)解決方案的規(guī)模進(jìn)一步擴(kuò)大。這些是在大數(shù)據(jù)采訪中最受歡迎的大數(shù)據(jù)采訪問(wèn)題行業(yè)中遵循的一些最佳實(shí)踐包括:,
?有明確的項(xiàng)目目標(biāo),并在必要時(shí)進(jìn)行合作
?從正確的來(lái)源收集數(shù)據(jù)
?確保結(jié)果不會(huì)扭曲,因?yàn)檫@可能導(dǎo)致錯(cuò)誤結(jié)論
?準(zhǔn)備好創(chuàng)新,在處理過(guò)程中考慮混合方法,包括結(jié)構(gòu)化和非結(jié)構(gòu)化類型的數(shù)據(jù),包括內(nèi)部和外部數(shù)據(jù)源
?了解大數(shù)據(jù)對(duì)組織內(nèi)現(xiàn)有信息流的影響

8。大數(shù)據(jù)解決方案涉及哪些步驟

回答:
大數(shù)據(jù)解決方案的實(shí)施遵循三個(gè)標(biāo)準(zhǔn)步驟。他們是:
數(shù)據(jù)攝取:此步驟將定義從多個(gè)來(lái)源提取和整合數(shù)據(jù)的方法。例如,數(shù)據(jù)源可以是社交網(wǎng)絡(luò)提要、CRM、RDBMS等。從不同來(lái)源提取的數(shù)據(jù)存儲(chǔ)在Hadoop分布式文件系統(tǒng)(HDFS)中。
數(shù)據(jù)存儲(chǔ):這是第二步,存儲(chǔ)提取的數(shù)據(jù)。該存儲(chǔ)可以在HDFS或HBase(NoSQL數(shù)據(jù)庫(kù))中。
處理數(shù)據(jù):這是最后一步。必須對(duì)存儲(chǔ)的數(shù)據(jù)進(jìn)行處理。處理是使用Spark、Pig、MapReduce等工具完成的。

推薦文章

這是關(guān)于大數(shù)據(jù)面試問(wèn)題和答案的綜合指南,以便應(yīng)聘者可以輕松解決這些面試問(wèn)題。您還可以閱讀以下文章了解更多信息——

  1. MBA面試問(wèn)題
  2. 專訪小貼士
  3. 信貸分析師面試問(wèn)題
  4. 10個(gè)優(yōu)秀的MBA面試問(wèn)題