黃志敏:數(shù)據(jù)可視化是大數(shù)據(jù)分析的重要手段
2015-03-27 12:38:00 來源:央廣網(wǎng)

央廣網(wǎng)北京3月27日消息 3月27日,由中央人民廣播電臺新媒體宣傳中心、河北大學(xué)新聞傳播學(xué)院、中國社會科學(xué)院世界傳媒研究中心、中國科技新聞學(xué)會網(wǎng)絡(luò)媒體專業(yè)委員會共同主辦的“首屆大數(shù)據(jù)時代創(chuàng)新與媒體變革研討會”在京舉行,本次研討會以“時代創(chuàng)新 媒介變革”為主題,圍繞大數(shù)據(jù)時代全球網(wǎng)絡(luò)文化發(fā)展趨勢,探討全球媒介創(chuàng)新發(fā)展未來。網(wǎng)絡(luò)文化建設(shè)和管理部門、科研院校、國家核心學(xué)術(shù)期刊負(fù)責(zé)人、專家、學(xué)者共200人出席會議。
財(cái)新傳媒首席技術(shù)官、財(cái)新數(shù)據(jù)可視化實(shí)驗(yàn)室負(fù)責(zé)人黃志敏在研討會上作主旨報告。他表示,數(shù)據(jù)可視化其實(shí)有很多不同的描述和定義?梢暬且粋計(jì)算機(jī)科學(xué)方面的,或者圖形學(xué)方面的概念,可以分為三塊。其中第一塊叫科學(xué)可視化,例如地圖、醫(yī)院的CT、鐘表都是科學(xué)可視化。第二塊是信息可視化,例如路邊拍違反交規(guī)就是很典型的標(biāo)識。第三塊是可視化分析,例如K線交易,一個曲線體現(xiàn)成交量,最高價最低價等等。當(dāng)把可視化用在新聞領(lǐng)域的話,就成了數(shù)據(jù)新聞。所以數(shù)據(jù)新聞是可視化在新聞領(lǐng)域的一個應(yīng)用。
黃志敏表示,數(shù)據(jù)新聞分為兩種,一個是信息圖,一個叫互動圖表。如果說信息圖靠做設(shè)計(jì)的人就可以做出來,那么互動圖表還要寫代碼,比如手機(jī)地圖、手機(jī)信號、wifi、電量等。當(dāng)?shù)貓D上劃了一條紅線時,就代表這個方向現(xiàn)在堵車厲害,如果畫一條綠線說明很暢通,但實(shí)際上我們在路上看不到這樣的線的。
數(shù)據(jù)可視化是做大數(shù)據(jù)分析的一個很重要的手段。這也是導(dǎo)致很多人很容易把數(shù)據(jù)可視化跟大數(shù)據(jù)混在一起的原因。他舉例說,數(shù)據(jù)新聞是把可視化的手段用在新聞領(lǐng)域,而大數(shù)據(jù)新聞意味著這個資料的來源、結(jié)論是從這個大數(shù)據(jù)那里來的,大數(shù)據(jù)新聞跟數(shù)據(jù)不是一回事,大數(shù)據(jù)和數(shù)據(jù)可靠也不是一回事。
以下為文字實(shí)錄:
當(dāng)大家都還在討論傳統(tǒng)媒體要不要轉(zhuǎn)型的時候,其實(shí)我們早已經(jīng)走在媒體轉(zhuǎn)型的路上,現(xiàn)在其實(shí)像財(cái)新傳媒我們是主要有一個網(wǎng)站和四個雜志。那么所謂網(wǎng)站的話其他還包含了很多種的方式,包括有PC的網(wǎng)站,包括有手機(jī)的網(wǎng)站,包括工號,包括APP等有5個呈現(xiàn)的渠道。
雜志的話包括一個財(cái)新周刊,其他的還有雜志還有一些英文刊,F(xiàn)在我們在新聞發(fā)布方面每天實(shí)際上有80%的內(nèi)容是發(fā)表在網(wǎng)絡(luò)上的。只有20%的原創(chuàng)內(nèi)容是發(fā)表在紙媒上。我們平時有做足夠的準(zhǔn)備工作,我們有我們的數(shù)據(jù)庫,所以當(dāng)一旦緊急事件、重大事件發(fā)生的時候我們能夠迅速的從數(shù)據(jù)庫里頭把相關(guān)的資料調(diào)取出來然后迅速的組成稿件,所以我覺得這個就是我們在把數(shù)據(jù)在我們的工作里頭的一個小的一個應(yīng)用方面吧。
5個APP都是我們自己的團(tuán)隊(duì)開發(fā)的,財(cái)新300多人,我們有30、40個人的技術(shù)隊(duì),是有比較強(qiáng)的研發(fā)實(shí)力的。部門分為移動部、網(wǎng)站部、創(chuàng)意部還有一個數(shù)據(jù)可視化實(shí)驗(yàn)室。投了10多個人的人手在移動方面,又投了10多個人在網(wǎng)站方面,去做這樣一件事情。數(shù)據(jù)可視化其實(shí)有很多不同的描述和定義,其實(shí)可視化是一個計(jì)算機(jī)科學(xué)方面的,或者說圖形學(xué)方面的一個概念,那么它可以分為三塊,其中的話第一塊叫科學(xué)可視化,例如地圖就科學(xué)可視化, CT也是科學(xué)可視化,包括鐘表都是科學(xué)可視化。第二個叫信息可視化,信息可視化其實(shí)也都非常常見,例如路邊拍誰禁止停車這個就是很典型的信息可視化的一個標(biāo)識。第三個叫可視化分析,可視化分析很典型例如說K線交易,我們把它整合到一起變成一個曲線體現(xiàn)成交量,最高價最低價等等,有經(jīng)驗(yàn)的股民一看K線圖對當(dāng)天的股票的交易情況就已經(jīng)有了很深刻的體會。所以這個其實(shí)K線圖是可視化分析的一個很典型的一個例子。我們把這個可視化用在新聞領(lǐng)域的話,那么它就成了數(shù)據(jù)新聞。所以數(shù)據(jù)新聞是可視化在新聞領(lǐng)域的一個應(yīng)用。
數(shù)據(jù)新聞我們又分為兩種,一個是信息圖,一個叫互動圖表。信息圖也很常見,過往我們在雜志、評媒里頭其實(shí)見的是非常多的,包括我們在這個微博和手機(jī)上經(jīng)?吹揭粡垐D“給你講清楚**”,這個其實(shí)都是信息圖。信息圖有一百多年的歷史了。再有一個分類就是互動圖表也是我今天要講的重點(diǎn)。用計(jì)算機(jī)代碼來用數(shù)據(jù)轉(zhuǎn)換成一個圖形來幫助大家更方便的去理解,那么這個就是所謂的互動圖表。信息圖靠做設(shè)計(jì)的人就可以做出來,而互動圖表還要寫代碼,這是兩個最大的區(qū)別。做互動圖表必須有三種人組成,編輯、設(shè)計(jì)師和程序員。我們來看一個例子,當(dāng)我們掏出一個手機(jī)的時候,打開一個地圖的APP,這上面有多少數(shù)據(jù)可視化的東西呢?手機(jī)的信號有幾格,wi-fi信號有幾格,電池電量還有多少?這些都是數(shù)據(jù)可視化。包括整個地圖本身也都數(shù)據(jù)可視化,其實(shí)我們每天沒有意識到用了那么多數(shù)據(jù)可視化。比如地圖上我們一看就知道,如果它劃了一條紅線就代表這個方向現(xiàn)在堵的厲害,如果畫一條綠線說明很暢通,但實(shí)際上我們在路上看不到這樣的線的,但是就因?yàn)槲覀兘?jīng)?吹竭@樣的電子導(dǎo)航地圖,已經(jīng)變成我們的概念之意了。
數(shù)據(jù)可視化是做大數(shù)據(jù)分析的一個很重要的手段。這也是導(dǎo)致很多人很容易把數(shù)據(jù)可視化跟大數(shù)據(jù)混在一起的原因。例如說大家有些時候會把大數(shù)據(jù)新聞跟數(shù)據(jù)新聞兩個詞混在一起,但實(shí)際上它不是一回事,數(shù)據(jù)新聞是把可視化的手段用在新聞的領(lǐng)域,而大數(shù)據(jù)新聞意味著你的這個資料的來源,你的這個結(jié)論是從這個大數(shù)據(jù)那里來的,所以它不是一回事,大數(shù)據(jù)新聞跟數(shù)據(jù)不是一回事,大數(shù)據(jù)和數(shù)據(jù)可靠也不是一回事。那么我們在2013年的時候我們看數(shù)據(jù)新聞這個領(lǐng)域,然后我們在2013年的10月份是組建了這個數(shù)據(jù)可視化實(shí)驗(yàn)室,這個數(shù)據(jù)話實(shí)驗(yàn)室有十個人左右,這十個人是跨部門的,是虛擬的實(shí)驗(yàn)室不是一個準(zhǔn)確的行政劃分,根據(jù)需要我們會去做不同的合作。
這個實(shí)驗(yàn)室包括三種人,第一種是記者和編輯就做處理稿件的人。第二個是美術(shù)設(shè)計(jì)師,第三種是程序員,三種人組成了這個。那么做數(shù)據(jù)新聞的話其實(shí)對我們過往的整個新聞生產(chǎn)流程是有一個非常大的變化。什么樣的變化呢?過往的新聞生產(chǎn)其實(shí)從文案到設(shè)計(jì)到技術(shù)其實(shí)是個上下游的關(guān)系;旧细遄邮钦l定的,稿子是記者跟編輯定的,那么其他的人員設(shè)計(jì)師也好,技術(shù)也好在這個里面起的是什么,是支撐的作用,稿子出來了由美編去幫助配圖再有技術(shù)人員把這個稿子發(fā)出去,它是一個上下游的關(guān)系,所以在這種情況之下其實(shí)你會發(fā)現(xiàn)說設(shè)計(jì)師也好,設(shè)計(jì)師的參與感就比較差,而程序員的參與感就更差,他們根本不知道說我在這里面有什么價值,我就給人打下手的。導(dǎo)致了另外一件事情就是說在一個媒體機(jī)構(gòu)里頭,技術(shù)人其實(shí)定位是很低的,技術(shù)人員說實(shí)話過往在很多的傳統(tǒng)媒體里面技術(shù)部門就干嘛的?就修電腦的、修網(wǎng)絡(luò)的,刻光盤,所以沒有成就感沒有參與感,然后收入又不高,那我為什么還要呆在這兒呢?所以長期以往導(dǎo)致的情況就是什么呢?我們傳統(tǒng)媒體的技術(shù)人員的水平特別低,很普遍的情況。然后真的等到你想干點(diǎn)什么事情的時候,你左想右想發(fā)現(xiàn)靠自己內(nèi)部人根本實(shí)現(xiàn)不了,因?yàn)樽霾坏。最后進(jìn)入了一個死循環(huán),每個人干不出來事情,就涉及到這種情況。
做數(shù)據(jù)新聞就不一樣了,數(shù)據(jù)新聞?wù)麄生產(chǎn)流程要變?yōu)槭裁茨兀慨?dāng)我做數(shù)據(jù)新聞的時候一個選題定下來,第一個要看它有沒有足夠的數(shù)據(jù),如果說沒有數(shù)據(jù)的話這事沒法干。第一個有數(shù)據(jù)以后大家三伙人坐在一塊商量說,我們這個數(shù)據(jù)新聞用什么樣的形勢去表現(xiàn)會比較好看。然后大家都覺得好看,這個時候程序員就得跑出來那如果比較好看的話,這個我開發(fā)看能不能實(shí)現(xiàn),成本高不高,時間趕不趕得急。如果發(fā)現(xiàn)說開發(fā)上不可承受的話,我們還得倒回去,修改這個設(shè)計(jì)方案。那么它本身就是一個互動的過程,等到這個方案確定了,等確定以后我們可能反過來我們得去倒推,推回去得跟記者說不行,數(shù)據(jù)不夠,你再給我補(bǔ)些數(shù)據(jù)過來。做數(shù)據(jù)新聞跟原來我們做,我一般寫稿件為例跟稿件是不一樣的。像處理稿件的話,因?yàn)樗昧似南拗,題材的限制,所以有些時候只需要抽取一些典型的例子。所以做數(shù)據(jù)新聞的話反過來有些時候不能被動的等著記者去提供,反過來我要要求記者和編輯去提供更多的內(nèi)容,這個是我們做數(shù)據(jù)新聞的情況。
比如,像6萬字的報道非常好,有很多人非常耐心的看。但是它的閱讀量從前往后是遞減的,因?yàn)楝F(xiàn)在有很多人他沒有很多耐心很這么多,也不一定了解這件事情。一下就有一個很直觀的感受,所以這個就是數(shù)據(jù)新聞的魅力和價值。按那么講到這里的話,我還要講渠道的問題。我們現(xiàn)在傳統(tǒng)媒體,其實(shí)出現(xiàn)的問問題是什么?出現(xiàn)了一個最大的問題是你的渠道丟了,你的門戶沒了。其實(shí)傳統(tǒng)媒體的這個渠道是一直在丟失的,所以當(dāng)我們要做新聞的時候,現(xiàn)在不可避免你要考慮渠道推廣的問題。舉個例子來講,以這個為例,我們做內(nèi)容怎么做呢?我是個文字稿件,閱讀量上去,影響上去了,但是好處我都丟了。我這個項(xiàng)目跟新浪、跟網(wǎng)易都有很好的合作,我跟網(wǎng)易怎么合作呢?我把授權(quán)給他,放在他的網(wǎng)頁上。但是我也跟他講,放在你這里但是上面會有我的LOGO,在上面介紹的時候會有我的名字和域名。同時在底下的回連都會回連到財(cái)新網(wǎng)上,這是一個非常公平的合作。所以最后我們看了統(tǒng)計(jì)數(shù)據(jù)平均每個用戶在這個上面花了半個小時,這半個小時的時間都是歸網(wǎng)易的,他獲得了這個注意力,獲得了其他附帶的好處,我們從這里我們獲得了品牌的推廣,同時在這底下回鏈回去的差不多20%。我們覺得這個是一個非常好的合作案例,對大家都有好處。
有時候大家也會有人問我這么一個問題,你們做數(shù)據(jù)可視化,你們做數(shù)據(jù)新聞怎么掙錢呢?這個當(dāng)然是我們要考慮的事情,你做這個事你要掙錢。我做數(shù)據(jù)新聞我是有把握的東西,第一,你不要做太大投入。那么在國外,做數(shù)據(jù)新聞?wù)l做得最好?《紐約時報》,然后接下來是英國是《衛(wèi)報》,還有布隆博格等等都做得非常棒,有那么幾家,還有美國的NPR,紐約時報的水平是最高的,成本也是最高的。因?yàn)檫@么一個事情,你要做一個新事物,然后你還要做大投入,你還看不到回報,最大的可能就是過不了半年就被砍掉了,我們要考慮一個發(fā)展的問題,這是第一個,所以我們要控制成本。那么像我這個團(tuán)隊(duì)大概十個人,其實(shí)其中只有大概四個人專門干這件事情,其他的人還在兼顧干著其他事情。
那么所以你可以認(rèn)為說,我在這方面的投入主要是這四個人的工資,這四個人很優(yōu)秀,里頭我有的同事是又能寫代碼,又能做設(shè)計(jì),包含有這樣的人,這是控制成本。第二個的話,你要給企業(yè)回報。第一就是名,我們希望我們做的作品去評選評獎,一方面來講如果得了獎,那么我們會有成就感、榮譽(yù)感,使得大家也會更努力。另外一個方面的話,你比如說我們在國內(nèi)能拿第一,拿到國際上只能入圍或者拿優(yōu)秀獎,這樣會給自己構(gòu)成很大的壓力和動力,逼你去進(jìn)步。另外拿獎也是為企業(yè)在市場上做一個提升,也算是給企業(yè)一個回報。不白拿公司的錢。再有就是我們現(xiàn)在也幫一些其他的企業(yè)或者媒體等等,我們做一些可視化的外包,把我們的技術(shù)輸出出去。在這個過程中,我們把自己看成是一個技術(shù)服務(wù)公司,我去做這件事情,也能給企業(yè)帶來一定的回報,通過這樣的事情,這樣才能有可持續(xù)的發(fā)展。
我們從去年年底到現(xiàn)在,我們做了很多的案例,這些案例的話,包括有支付寶的,有天貓的,有淘寶的,還有唯品會的,平安銀行的等等,基本上來講還有例如說之前的有一個市場調(diào)研公司,基本上來講,或者是跨國公司或者上市公司,那么他們希望說用嘗試更多的手段來展示他們的內(nèi)容。像我們剛才為大家演示的產(chǎn)品,兩天之內(nèi)獲得了二十萬的訪問量,作為一個市場回報來講,這是非常劃算的。
這里是我們作品集的一個演示,我們所有手機(jī)類的作品都會放在這里。接下來的話,我會給大家分享一些我們在這以外做的其他一些工作。去年年底以來,我是跑了十多所高校,在許多高校做將多。主要以新聞傳播學(xué)院為主,去介紹數(shù)據(jù)新聞的東西。我看到就是說,有一些高,F(xiàn)在已經(jīng)非常的重視這個事情,那么他們是例如傳媒大學(xué)、復(fù)旦大學(xué)等等,現(xiàn)在我都看到他們是在課堂上系統(tǒng)的教授這個數(shù)據(jù)新聞。那么我在做這件事情的過程中,我就會發(fā)現(xiàn),我們太需要這種又懂新聞、又懂設(shè)計(jì)、又會寫代碼的復(fù)合型人才,但是我在國內(nèi)一個都沒有找到,在國外有,國內(nèi)一個都沒有,國內(nèi)最好的情況是你能掌握其中的兩門,而在國外的話,現(xiàn)在他們叫有意思名字叫哥倫比亞大學(xué),他們都會開設(shè)的課是計(jì)算機(jī)和新聞的雙學(xué)位,密蘇里新聞學(xué)院也是,他們也會有意識的教授計(jì)算機(jī)。所以我認(rèn)為這個是需要我們,業(yè)界和學(xué)界一起做這個事情,我也認(rèn)為說現(xiàn)在在高校,新聞學(xué)院里頭等等,就是你不培養(yǎng)復(fù)合型人才,你不培養(yǎng)將來要做記者的人,你不讓他學(xué)寫一些代碼這是不夠的。給大家介紹一下這三個網(wǎng)站,一個是我們自己的,這個叫數(shù)字說的網(wǎng)站,我們所有的數(shù)據(jù)都放在上面,叫財(cái)新數(shù)字說。第二個是叫財(cái)新數(shù)據(jù)可視化實(shí)驗(yàn)室,這個是實(shí)驗(yàn)室的網(wǎng)站,那么上面除了財(cái)新的作品以外,那么我們還放置我們分享一些體會、心得,那么上面也會有其他家的作品,以及我們平時搜集的很多案例分享還有一些活動信息等等,我們會放在實(shí)驗(yàn)室的網(wǎng)站上面。
第三個是數(shù)據(jù)新聞網(wǎng),數(shù)據(jù)新聞網(wǎng)主要是在境外讀書的年輕人,他們很喜歡讀新聞,他們用業(yè)余的時間搭建了這樣一個網(wǎng)站,搜集了很多數(shù)據(jù)新聞方面的信息。
最后的話,是我的聯(lián)系方式。如果大家會后有什么問題的話,歡迎通過這個聯(lián)系方式來跟我聯(lián)系,這個維碼只要你們一掃就把所有的聯(lián)系方式存進(jìn)去了,也歡迎大家加我微信,加微信的時候麻煩把你的實(shí)名和單位一塊報出,這樣方便我做記錄,這個就是我今天要跟大家分享的內(nèi)容。謝謝大家!
編輯:王天怡
關(guān)鍵詞:大數(shù)據(jù);研討會
2015-03-27 17:15:00
2015-03-27 17:06:00
2015-03-27 16:53:00
參與討論
我想說
央廣網(wǎng)官方微信
手機(jī)央廣網(wǎng)
