從 2012 年到 2015 年,大數(shù)據(jù)持續(xù)發(fā)威,IDC 市場調(diào)查機構(gòu)預(yù)測 2017 年大數(shù)據(jù)市場將價值 324 億,擁有這樣“Big Data、Big Deal”遠(yuǎn)見的人,正在利用大數(shù)據(jù)激蕩出最有創(chuàng)意的構(gòu)想,用數(shù)據(jù)的力量來創(chuàng)造出大量的價值。從讓資料搜尋分析平臺,到利用大數(shù)據(jù)幫助癌癥治療,大數(shù)據(jù)新創(chuàng)公司這幾年內(nèi)如雨后春筍般出現(xiàn),2015 年這些“Big Data Startups”也會持續(xù)挖掘大數(shù)據(jù)的價值、微調(diào)其企業(yè)策略,期盼在市場中展露頭角。以下幾家新創(chuàng)公司都已經(jīng)各自獲得好幾輪金額可觀的融資,在大數(shù)據(jù)市場中十分有潛力,值得我們關(guān)注并參考,從中瞭解大數(shù)據(jù)的應(yīng)用方向及潛能。
SumAll
SumAll 是一家位于紐約的新創(chuàng)公司,成立于 2011 年,主要為中小型企業(yè)提供即時數(shù)據(jù)分析服務(wù)。SumAll 的線上分析平臺收集社交媒體及電子商務(wù)上的數(shù)據(jù),并進行分析后,把可視化的分析結(jié)果展示在互動介面上供企業(yè)客戶參考。例如社交頁面上的網(wǎng)頁流量、ebay 上的銷售量等數(shù)據(jù),生成每星期、每個月的分析報導(dǎo),讓企業(yè)客戶追蹤且分析使用者/消費者。
這家公司還有一個很酷的地方:他們分了百分之十的股份給旗下的 SumAll.org —— 一家旨在用資料分析增加社會福利的非盈利組織。
Luminoso
Luminoso 成立于 2010 年,原本是麻省理工大學(xué)媒體實驗室的一個研究項目,后來發(fā)展成利用人工智慧進行文本分析的新創(chuàng)公司。從通訊工具里的訊息、網(wǎng)絡(luò)上的評論等數(shù)據(jù)來源,利用自然語言處理和機器學(xué)習(xí)技術(shù),幫助企業(yè)分析消費者在各種通訊渠道中討論的話題。
舉例來說,Luminoso 提供的服務(wù)可以幫助企業(yè)追蹤時下發(fā)生的熱門討論,還可以根據(jù)需求迅速回應(yīng),如果消費者對于某產(chǎn)品的缺陷在網(wǎng)上進行了投訴或者抱怨,企業(yè)可以及時進行補救。
Flatiron Health
同樣發(fā)源于紐約的 Flatiron Health 成立于 2012 年,是大數(shù)據(jù)應(yīng)用界中是十分有名的“醫(yī)療大數(shù)據(jù)技術(shù)”新創(chuàng)公司,主要專注于癌癥數(shù)據(jù)分析1。
Flatiron Health 透過各種管道收集病患的臨床紀(jì)錄、醫(yī)師診斷紀(jì)錄、患者治療結(jié)果、基因數(shù)據(jù)及繳費紀(jì)錄等數(shù)據(jù),透過分析整合后提交給腫瘤學(xué)家,透過分析過往的治療方法跟紀(jì)錄,幫助醫(yī)生做出更好的臨床診斷跟醫(yī)治手段。全美現(xiàn)在有約 1000 名腫瘤學(xué)家在使用 Flatiron Health 的數(shù)據(jù)。
Flatiron 的分析平臺 OncologyClound 百分之百致力于分析腫瘤學(xué)數(shù)據(jù),不過 Flatiron 公司也表示,現(xiàn)在全美只有 4% 的癌癥病人參與臨床試驗,另外 96% 無法取得的癌癥病人數(shù)據(jù)則成為大數(shù)據(jù)分析中的缺口。
Domo
Domo 成立于 2010 年,總部位于猶他州鹽湖城,是一家為企業(yè)決策層提供商業(yè)智慧(BI)的初創(chuàng)公司。2014 年就累積了約有 500 多家簽約客戶,其中包括了 National Geographic、eBay、Ogio 及 GoodWill 等。
Domo 的商業(yè)智慧云端平臺可以即時分析多方資料,將多方來源提供的結(jié)構(gòu)化及非結(jié)構(gòu)化數(shù)據(jù)以即時、視覺化的方式呈現(xiàn)出來,不但幫助企業(yè)做決策,也是一個業(yè)務(wù)管理平臺。
Tamr
Tamr 成立于 2013 年,其技術(shù)來自于麻省理工的電腦與人工智慧實驗室,由麻省理工學(xué)院教授兼數(shù)據(jù)專家 Michael Stonebraker 跟種子投資家 Andy Palmer 共同創(chuàng)辦,在 2014 年正式營運。
大數(shù)據(jù)的其中一個問題就是資料量太大了,而且資料來源劇增又不斷變換,Tamr 的機器學(xué)習(xí)演算法跟軟件能有效而大規(guī)模地廣泛整合和管理現(xiàn)有和未來的多種數(shù)據(jù)來源,大量降低數(shù)據(jù)來源的搜集與連結(jié)所用的時間,同時辨別資料來源及之間的關(guān)聯(lián)。
Alpine Data Labs
Alpine Data Labs 成立于 2010 年,總部位于舊金山,算是十分有名的大數(shù)據(jù)分析挖掘軟件新創(chuàng)公司,該公司總裁兼首席執(zhí)行長 Joe Otto 和首席產(chǎn)品長 Steven Hillion 都來自于被云端儲存服務(wù)提供商 EMC 收購的 Greenplum 公司。
大部份的大數(shù)據(jù)新創(chuàng)公司都在做“資料可視化(Data Visualization)”,Alpine 則是提供大數(shù)據(jù)及 Hadoop 的預(yù)測性分析功能,且號稱是全球第一個針對大數(shù)據(jù)的團隊合作分析解決方案。
DataStax
DataStax 成立于 2010 年,總部位于加州,在去年 9 月曾獲得驚人的 1 億 600 萬美元 E 輪融資。
DataStax 主要業(yè)務(wù)是開發(fā)和銷售開源分布式數(shù)據(jù)庫 Apache Cassandra 的商業(yè)化版本。Apache Cassandra 是高擴展性、高容錯的 NoSQL 數(shù)據(jù)庫,比傳統(tǒng)的關(guān)系式數(shù)據(jù)庫多了許多優(yōu)勢,其設(shè)計不僅兼顧了擴展性和開發(fā)靈活性,而且搜尋效率也相當(dāng)不錯,特別適合大數(shù)據(jù)的儲存,像是 Cisco、eBay 等大公司都在使用這種數(shù)據(jù)庫。
Altiscale
Hadoop 在這幾年內(nèi)被公認(rèn)成為大數(shù)據(jù)的主流技術(shù),而 Hadoop 也是 Altiscale 這家新創(chuàng)公司能夠迅速成長茁壯的原因。
Altiscale 成立于 2012 年,總部在加州 Palo Alto,其 CEO 兼創(chuàng)辦人是曾在 Yahoo 任職首席技術(shù)長(Chief Technology Officer)的 Raymie Stata ,其高層還有同樣來自 Yahoo 曾擔(dān)任首席架構(gòu)師(Chief Architect)的 David Chaiken。相信大家都知道 Yahoo 就是 Hadoop 的發(fā)源地,那這家由 Yahoo 前任高管們所創(chuàng)立的大數(shù)據(jù)公司主打“Hadoop-as-a-Service”也就一點都不奇怪了。
Altiscale 的服務(wù)是解決 Hadoop 的抽象性與復(fù)雜度,為工程師搭建一個完整的 Hadoop 環(huán)境,并且對其進行維護與管理,讓使用者可以更專注于數(shù)據(jù)和應(yīng)用。
WibiData
WibiData 位于舊金山的創(chuàng)業(yè)公司,成立于 2010 年,聯(lián)合創(chuàng)始人 Christophe Bisciglia 為企業(yè)數(shù)據(jù)管理分析公司Cloudera 的聯(lián)合創(chuàng)始人之一,WibiData 的另一名聯(lián)合創(chuàng)始人 Aaron Kimball 則是 Cloudera 聘用的第一個工程師2。
這家公司所開發(fā)的 WibiEnterprise 平臺是由一系列的開源Apache 技術(shù)建構(gòu)而成,其中包含了 Hadoop、HBase 和 Cassandra,以及用于即時收集、分析、服務(wù)數(shù)據(jù)的 Kiji 開源框架,其平臺的功能是為消費者即時打造客制化的推薦內(nèi)容及相關(guān)搜尋結(jié)果,和電子商務(wù)龍頭 Amazon 所做的類似。