信息平臺(tái)和數(shù)據(jù)科學(xué)家的興起
在金融服務(wù)領(lǐng)域已經(jīng)構(gòu)建了歷史市場(chǎng)行為的大數(shù)據(jù)存儲(chǔ)作為該領(lǐng)域的數(shù)據(jù)科學(xué)家, 即數(shù)據(jù)分析專(zhuān)家(Quants),來(lái)開(kāi)發(fā)新模型的實(shí)驗(yàn)場(chǎng)。在工業(yè)以外,我發(fā)現(xiàn)在很多科學(xué)領(lǐng)域,研究生扮演著數(shù)據(jù)科學(xué)家的角色。Facebook數(shù)據(jù)組團(tuán)隊(duì)的其中一員曾在生物信息實(shí)驗(yàn)室工作過(guò),在那里他構(gòu)建過(guò)數(shù)據(jù)管道流,并做類(lèi)似的離線數(shù)據(jù)分析。在CERN,著名的Large Hadron Collider生成大量的數(shù)據(jù),這些數(shù)據(jù)是由一群追求突破的研究生精心收集和鉆研的。
最近新出的書(shū)如Davenport和Harris合著的《Competing on Analytics》(哈佛商學(xué)院出版社,2007),Baker的《The Numerati》(Houghton Mifflin Harcourt,2008)以及Ayres的《Super Crunchers》(Bantam,2008)都強(qiáng)調(diào)了在跨工業(yè)中數(shù)據(jù)科學(xué)家的重要性,他們?cè)诖龠M(jìn)企業(yè)基于收集到的信息做出改進(jìn)發(fā)揮了至關(guān)重要的作用。和研究社區(qū)在數(shù)據(jù)空間的調(diào)研一起,數(shù)據(jù)科學(xué)家在今后幾年需要進(jìn)一步的定義。通過(guò)更好的闡明數(shù)據(jù)科學(xué)家角色,我們可以建設(shè)培訓(xùn)課程、制定廣告層次、組織會(huì)議、寫(xiě)書(shū)以及為任何被認(rèn)可的行業(yè)做補(bǔ)充。在這個(gè)過(guò)程中,可行的數(shù)據(jù)科學(xué)家組織將會(huì)不斷擴(kuò)展,用來(lái)滿足飛速增殖的數(shù)據(jù)平臺(tái)上不斷增長(zhǎng)的專(zhuān)業(yè)“領(lǐng)航員”需求,進(jìn)一步加速跨企業(yè)的學(xué)習(xí)過(guò)程。