• 震驚|四部美劇教你看懂大數據

    幾部精彩的美劇,讓大家對大數據技術的應用以及未來的發展方向有更加深刻的理解。

    大數據

    或稱巨量數據,是由數量巨大、結構復雜、類型眾多數據構成的數據集合,是基于云計算的數據處理與應用模式,通過數據的集成共享,交叉復用形成的智力資源和知識服務能力。

    “IBM大數據平臺”定義了大數據的四個維度,也稱為“大數據4V”:即

    Volume(海量)

    Velocity(高速)

    Variety(多樣)

    Veracity(真實)

    Volume (海量)


    “大數據”故名思義,要足夠“大”,目前全球每天創造2.3萬億GB的數據,每個中型企業至少儲存了10萬GB的數據。

    如此大量的數據如果高效率地搜集整理出來,會對我們的生活產生怎樣的影響

    美劇 “Person of Interest”(中譯:疑犯追蹤) 給了我們最生動的說明:


    在這部劇中,軟件天才Finch 發明了一個被稱為“The Machine”的系統,其本意是通過攝像頭和無處不在的監聽系統搜集面部表情、聲音、動作等巨量數據,并建立一套分析模式,以圖在恐怖襲擊事件發生之前就判斷出行兇者或受害人,并加以阻止。

    數據應用實戰

    大數據的此類應用在我們生活中已經非常常見,“信用評級”就是基于這樣的邏輯設立,由于搜集到數據量足夠大,銀行等金融機構可以根據申請人的信息,判斷其是否還得起貸款,或發出的信用卡應給多少額度等等。

    但是,由于大數據系統的應用,劇中的整個美國只要有攝像頭的地方都被嚴格地監控著,任何人在這樣的系統下都無所遁形,個人隱私也無法得到保障。

    此外,Finch的程序賦予了整個系統人工智能甚至獨立思考的能力,在劇中也多次出現the Machine通過自己的“主觀判斷”拯救其主人和他團隊的鏡頭。

    這不禁讓我們思考,未來當大數據進一步滲透我們的生活,是否有一天機器會獲得自我思考的能力,反過來控制人類呢?


    Velocity(高速)


    大數據另一個特性是“高速”。到2016年,全世界預計將擁有189億個網絡連接,地球上平均每個人都將有2.5個接入互聯網的端口。

    如此廣泛的網絡連接導致我們對于數據流的獲取和分析速度越來越快,紐交所的系統每個交易日就可捕獲1TB的交易數據,金山云每日僅來自小米用戶上傳的數據就多大500個T以上,現代汽車上有超過100個傳感器用來實時檢測燃料水平、胎 壓等等。

    對于數據分析速度越來越嚴苛的要求,也反過來推動硬件技術的不斷發展,對此,美劇 “Intelligence” (中譯:超腦特工)給出了非常形象的描述:


    劇中主人公Gabriel Vaughn 是前美國三角洲特種部隊隊員,因為他具有一種被稱為Athens-4U7R的獨特基因變異,可以對計算機芯片不產生排異反應,“美國網絡戰指揮部”招募了 他,并在他的腦中植入了一枚堪比超級計算機的芯片,令其能在有效距離之內接收或控制所有電磁頻譜。

    這部劇可以說是數據流分析速度的極致體現。Gabriel在劇中具有的一項特殊能力 “網絡渲染” (Cyber Render), 他在腦中整合巨量的數據,融合事實和推理形成一面“虛擬證據墻”。

    腦中的芯片幫助他在幾秒鐘內破解任何懸疑案件,找出事實的真相。

    數據應用實戰

    而現實生活中,對大數據 高速特性的應用則在投資領域多有涉及,如通過基于海量新聞數據抓取而開發的“新聞選股”系統,或者對于社交網絡上各類信息的搜集整理而形成的“輿情選股” 系統等,其速度和效率是券商分析師無法與之比擬的。


    Variety(多樣)


    從諸如Facebook、Twitter之類的社交網站上發布的信息,Youtube、Youku之類網站上的視頻,到智能手環檢測到的心率、血壓等健康狀況數據,以及醫療機構搜集的病歷等,大數據的形式可謂包羅萬象。

    而美劇 “Touch” (中譯:觸摸未來)將大數據的這一特質賦予了超自然力量:


    “我叫Jake,我出生于4161天前,即2000年10月26日。我和70億8千零36萬人生活在這個地球上,這是個關于其中某些人的故事。

    數據應用實戰

    今天平均每人對 7.4個人說2250個字,發出超過3000億封的郵件,190億條短信,構成各種模式和比例的交織,甚是壯觀,以數學形式表現。這些模式隱匿于眾目睽睽 之下,只須摸清門道,方解其中奧秘,可只有少數人能看清其中的關聯。
    “這一切全由數學概率注定,而我的職責就是追蹤這些數字,為找尋彼此,渴求生命交匯 的雙方牽線搭橋。”


    Jake 是劇中主人公 Martin Bohm的兒子,患有自閉癥,出生十一年來從未說過一句話,他是所謂的 “36義人” 之一,是上帝的選民,無需學習就掌握了”上帝數列”,也就是我們常說的“斐波那契數列”。

    數字理解諸如銀河星系,莊稼植被,海洋貝類等世界上任何的行 為模式和信息,通過近似“心靈感應”的方式來與其他的“義人”溝通,將人們從世界上存在的痛苦中解救出來。

    Veracity(真實)


    在IBM大數據中心的定義中,這個維度本身強調的是數據的準確性,并指出不準確的數據導致的危害,比如,美國經濟每年因為數據質量差而導致的損失高達3.1萬億美金。而我們要推薦的這部美劇“House of Cards”(中譯:紙牌屋),對這個維度有一點點的曲解,但它是大數據本身“真實性”的最佳寫照。


    《紙牌屋》的制作方,美國的Netflix公司,是一家在線影片租賃提供商,在全球有 3300萬訂閱用戶,它比誰都清楚大家喜歡看什么樣的電影和電視。

    有研究表明每天的高峰時段網絡下載量都是出自Netflix 的流媒體服務,每天用戶在Netflix 上產生3000 萬多個行為,如暫停、回放或者快進時,都會產生一個行為,Netflix 的訂閱用戶每天還會給出400 萬個評分、300 萬次搜索請求、詢問劇集播放時間和設備等。

    數據應用實戰

    它通過對這些數據的挖掘,分析,已經知道用戶很喜歡David Fincher,也知道 Kevin Spacey 主演的片子表現都不錯,還知道英劇版的《紙牌屋》很受歡迎,三者的交集告訴Netflix值得在這件事上賭一把,因此投資了一億美元請來Fincher導演,Spacey主演并買下英劇版權,首次進軍原創劇集就一炮而紅,在美國及40 多個國家成為最熱門的在線劇集。


    在現實生活中,用大數據搜集用戶的興趣、職業、消費行為等,從而進行營銷推廣,已經是非常普遍的應用場景了,而Netflix更是將大數據本身的威力演化為一款產品,迅速打動了億萬用戶,將大數據的應用做到了極致。


    餐老板資訊網,為全國餐廳老板,提供最新的餐飲經營技巧,了解最新的餐飲經營資訊,學習更多的餐飲營銷、管理、外賣、裝修,采購等經營知識

    原創文章,作者:辰智,如若轉載,請注明出處:http://www.kmwhg.com/58513.html

    (0)
    上一篇 2015年11月18日 16:13
    下一篇 2015年11月18日 20:33

    相關推薦

    發表回復

    登錄后才能評論
    小程序
    小程序
    商務合作
    商務合作
    分享本頁
    返回頂部
    亚洲精品在线播放