www.e4938.cn-老师你下面太紧了拔不出来,99re8这里有精品热视频免费,国产第一视频一区二区三区,青青草国产成人久久

<button id="60qo0"></button>

<strike id="60qo0"></strike>
<del id="60qo0"></del>
<fieldset id="60qo0"><menu id="60qo0"></menu></fieldset>
  • 大數(shù)據(jù)“老兵”暢談大數(shù)據(jù)基礎(chǔ)設(shè)施建設(shè)

    2014-07-31 23:11:23 TechTarget中國(guó)  點(diǎn)擊量: 評(píng)論 (0)
    Martin Leach在大數(shù)據(jù)工作方面非常忙碌。他曾作為MIT和哈佛大學(xué)聯(lián)合開(kāi)辦的Broad研究所的CIO,在那里,他要負(fù)責(zé)13PB數(shù)據(jù)的存儲(chǔ),使用超級(jí)計(jì)算機(jī)進(jìn)行計(jì)算。他和他的團(tuán)隊(duì)為人類基因圖繪制工作做出了卓越貢獻(xiàn)。  
    Martin Leach在大數(shù)據(jù)工作方面非常忙碌。他曾作為MIT和哈佛大學(xué)聯(lián)合開(kāi)辦的Broad研究所的CIO,在那里,他要負(fù)責(zé)13PB數(shù)據(jù)的存儲(chǔ),使用超級(jí)計(jì)算機(jī)進(jìn)行計(jì)算。他和他的團(tuán)隊(duì)為人類基因圖繪制工作做出了卓越貢獻(xiàn)。
      在研究所之前,他團(tuán)隊(duì)所支持的研究小組為醫(yī)藥巨頭默克公司研發(fā)。現(xiàn)在,他的新職務(wù)是生物技術(shù)公司Biogen 的IT研發(fā)副總裁,目前,他一些數(shù)據(jù)科學(xué)家編入團(tuán)隊(duì)。這只團(tuán)隊(duì)通過(guò)大數(shù)據(jù)分析處理保障Biogen 公司的研發(fā)。
      在他離開(kāi)非營(yíng)利組織Broad生物研究所前,我們的編輯采訪到Leach。他介紹了CIO在大數(shù)據(jù)方面所面臨的困境,以及處理大數(shù)據(jù)所需要的技術(shù)和能力。Leach表示,企業(yè)大數(shù)據(jù)分析的投資已經(jīng)由最初的200萬(wàn)美元上升到400萬(wàn)美元,很少專家愿意使用開(kāi)源工具工作。而最不被重視的數(shù)據(jù)科學(xué)家往往能為企業(yè)找到真正有用的數(shù)據(jù)。
    leach_martin
      問(wèn):你曾經(jīng)作為CIO們的咨詢顧問(wèn),在企業(yè)建設(shè)大數(shù)據(jù)基礎(chǔ)設(shè)施時(shí)提供建議,你通常都會(huì)有哪些建議?
      Leach:最開(kāi)始的階段是要確認(rèn)企業(yè)的大數(shù)據(jù)項(xiàng)目計(jì)劃是什么。做這個(gè)項(xiàng)目的最大需求是什么,這是開(kāi)始階段最重要的問(wèn)題,絕不是考慮什么技術(shù)或者需要采購(gòu)什么項(xiàng)目。
      問(wèn):在Broad研究所的時(shí)候,他們做大數(shù)據(jù)項(xiàng)目最大的需求是什么?
      Leach:當(dāng)時(shí)最大的需求是解決內(nèi)部數(shù)據(jù)的產(chǎn)生、消化以及存儲(chǔ)問(wèn)題。那個(gè)時(shí)候在公共機(jī)構(gòu),比如Broad和私人機(jī)構(gòu)之間是有一個(gè)競(jìng)爭(zhēng)的,看誰(shuí)能做出人類基因圖。因?yàn)橛羞@樣的外部驅(qū)動(dòng)力,所以,我們考慮的都是如何把項(xiàng)目做的更快一些。我們當(dāng)時(shí)要么慢下來(lái),要么放棄這個(gè)工程,要么尋找到更快項(xiàng)目實(shí)施方法。
      這對(duì)我來(lái)說(shuō),無(wú)疑是個(gè)挑戰(zhàn),尤其我對(duì)生物技術(shù)至今都了解不多。他們將一些實(shí)驗(yàn)外包出去,并將生成的數(shù)據(jù)傳輸過(guò)來(lái),突然間,他們就會(huì)有數(shù)以萬(wàn)億字節(jié)的數(shù)據(jù)需要傳輸,他們會(huì)有這樣的疑問(wèn):“我該往那種硬盤(pán)里存放數(shù)據(jù)?我如何獲取這些數(shù)據(jù)?我計(jì)算這些數(shù)據(jù)時(shí)要放置在哪里?我又該如何去計(jì)算呢?” 我在一群生命科學(xué)家那里看到的是他們對(duì)數(shù)據(jù)處理有非常強(qiáng)烈的需求,他們的第一個(gè)問(wèn)題是:“我如何處理這些數(shù)據(jù)?又該放在哪里?”
      問(wèn):那他們存放在哪里?
      Leach: 很多公司會(huì)放置在公司內(nèi)部。但有些公司會(huì)放在云端,但這些數(shù)據(jù)量很小也不會(huì)常用。生命科學(xué)領(lǐng)域的數(shù)據(jù)通常包括遺傳學(xué)與基因組學(xué)資料、藥物信息或者病人記錄,如果存放在防火墻之外會(huì)有很多憂慮。
      所以,當(dāng)你確定為什么需要數(shù)據(jù)后,下一個(gè)工作就是考慮如何存放他們。再下一個(gè)就是如何利用計(jì)算機(jī)處理數(shù)據(jù)。那是需要在內(nèi)部計(jì)算機(jī)內(nèi)存儲(chǔ)處理呢,還是放置在云端,比如亞馬遜上,需要時(shí)再拿回來(lái)處理?這就涉及到大家的另一個(gè)猜想,為什么數(shù)據(jù)需要首先在內(nèi)部處理呢?
      問(wèn):獲取數(shù)據(jù)簡(jiǎn)單嗎?
      Leach:真正的獲取過(guò)程并不簡(jiǎn)單。考慮到傳輸速度,有些公司會(huì)從云端傳輸。有些則使用硬盤(pán)傳輸。這里面涉及到很多問(wèn)題,比如,你從波士頓獲取數(shù)據(jù),但你的數(shù)據(jù)中心在北卡羅來(lái)納州,我需要解決的問(wèn)題是,我該如何將幾百億字節(jié)的數(shù)據(jù)通過(guò)公司網(wǎng)絡(luò)傳到服務(wù)器上,為此我還要做哪些工作?
      問(wèn):公司如何處理數(shù)據(jù)的獲取?
      Leach:有些情況下,研究基于硬盤(pán)上的一堆數(shù)據(jù),企業(yè)就會(huì)消極對(duì)待傳往服務(wù)器上的數(shù)據(jù)。有些情況,企業(yè)試圖在內(nèi)部網(wǎng)絡(luò)中使用數(shù)據(jù),進(jìn)而影響內(nèi)部網(wǎng)絡(luò),因?yàn)樗麄儠?huì)將數(shù)據(jù)轉(zhuǎn)移到典型的企業(yè)數(shù)據(jù)網(wǎng)絡(luò)而不是數(shù)據(jù)中心。另外一些則是和IT部門(mén)緊密合作。
      這部分取決于企業(yè)其他部門(mén)如何與 IT部門(mén)合作。我認(rèn)為網(wǎng)絡(luò)限速器是為了讓其他部門(mén)更好地與IT部門(mén)合作,也是為了保證IT部門(mén)的足夠靈活性。這類的項(xiàng)目并不是傳統(tǒng)意義上標(biāo)準(zhǔn)的IT基礎(chǔ)設(shè)施。嘗試在Oracle數(shù)據(jù)庫(kù)上研發(fā)大數(shù)據(jù),Oracle會(huì)建議你購(gòu)買(mǎi)一些外部硬件,但你需要數(shù)據(jù)庫(kù)專家,這些專家不僅懂得常規(guī)數(shù)據(jù)庫(kù)關(guān)系,也要了解NoSQL、CouchDB、 MongoDB等等。
      接下來(lái)就是如何找到一群高素質(zhì)的人才,他們可熟練運(yùn)用現(xiàn)在的開(kāi)源技術(shù)產(chǎn)品,比如Hadoop、OpenStack之類。人才對(duì)于團(tuán)隊(duì)來(lái)說(shuō)至關(guān)重要,我常常聽(tīng)到同行們的抱怨:“我該去哪里找到真正的千里馬?”
      問(wèn):CIO們會(huì)去哪些領(lǐng)域?qū)ふ胰瞬牛?/div>
      問(wèn):我從eBay的CTO那里了解到,一個(gè)重要的領(lǐng)域就是經(jīng)濟(jì)學(xué)家。經(jīng)濟(jì)學(xué)家喜歡在數(shù)據(jù)中尋找金礦,他們也喜歡用數(shù)據(jù)去解決深層次問(wèn)題。有一群突然意識(shí)到大數(shù)據(jù)的經(jīng)濟(jì)學(xué)家會(huì)說(shuō):哇,我們從來(lái)沒(méi)有處理過(guò)這種水平的數(shù)據(jù)。
      問(wèn):所以,你只能找那些喜歡數(shù)據(jù)挖掘避過(guò)愿意使用開(kāi)源工具的人?
      Leach:我曾經(jīng)看到一群物理學(xué)家在大數(shù)據(jù)領(lǐng)域工作。Hadron Collider里的工作人員每天需要沉浸在在機(jī)器產(chǎn)生的PBS數(shù)量級(jí)的數(shù)據(jù)中。經(jīng)濟(jì)學(xué)家、物理學(xué)家以及喜歡衍生工具的人,都是典型的數(shù)據(jù)分析師:他們喜歡數(shù)據(jù)。我將去經(jīng)濟(jì)學(xué)家領(lǐng)域找到合適的人才,因?yàn)槲抑安惶匾曀麄儭?/div>
      問(wèn):一些公司對(duì)大數(shù)據(jù)最大的誤解是什么?
      Leach:我認(rèn)為很多公司都不會(huì)意識(shí)到他們?nèi)绾卧谝婚_(kāi)始就小心翼翼的對(duì)待數(shù)據(jù)。你在數(shù)據(jù)管理、注解、組織方面花的時(shí)間少了,就會(huì)影響你如何使用數(shù)據(jù)。我們從一份統(tǒng)計(jì)里看到,當(dāng)我們的項(xiàng)目完成五個(gè)月后,就沒(méi)有人再去關(guān)注數(shù)據(jù)里。你兩年來(lái)的數(shù)據(jù)怎么處理?刪掉他?還是重新組織?鑒于目前數(shù)據(jù)存儲(chǔ)成本下降,我們可以存儲(chǔ)這些數(shù)據(jù)。
      問(wèn):這或許就是你談到的,當(dāng)人們開(kāi)始面對(duì)大數(shù)據(jù)時(shí),往往會(huì)變得很短視?
      Leach:不僅是IT部門(mén)的短視,連數(shù)據(jù)搜集者也是這樣。IT部門(mén)負(fù)責(zé)數(shù)據(jù)搜集,從IT的角度來(lái)看,IT部門(mén)是不會(huì)考慮長(zhǎng)遠(yuǎn)的,但搜集者也是僅僅關(guān)注當(dāng)下的數(shù)據(jù),或關(guān)注他們搜集到的數(shù)據(jù)。
      問(wèn):為了實(shí)現(xiàn)大數(shù)據(jù)的目標(biāo),你需要收集足夠多的數(shù)據(jù),你手機(jī)的越多,做出的預(yù)測(cè)也越精準(zhǔn),可以這樣理解嗎?
      Leach:是的,如果你真的能把握的話,大數(shù)據(jù)僅僅“大”而已。
    大云網(wǎng)官方微信售電那點(diǎn)事兒

    責(zé)任編輯:葉雨田

    免責(zé)聲明:本文僅代表作者個(gè)人觀點(diǎn),與本站無(wú)關(guān)。其原創(chuàng)性以及文中陳述文字和內(nèi)容未經(jīng)本站證實(shí),對(duì)本文以及其中全部或者部分內(nèi)容、文字的真實(shí)性、完整性、及時(shí)性本站不作任何保證或承諾,請(qǐng)讀者僅作參考,并請(qǐng)自行核實(shí)相關(guān)內(nèi)容。
    我要收藏
    個(gè)贊
    ?
    国产精品麻豆成人AV电影艾秋| 久久精品国产亚洲AV不卡| 日韩免费无遮挡毛片一区| 97夜夜澡人人爽人人喊A| 国产精品热久久无码AV| 欧美va久久久噜噜噜久久| 樱花官网官方入门网站| 久久精品久久久久久国产| 最近在线观看免费播放电视剧| 东京热一区二区三区无码视频|