2017-03-16 10:09:44分類(lèi):行業(yè)資訊4468
隨著(zhù)技術(shù)的發(fā)展,越來(lái)越多的新聞媒體希望通過(guò)先進(jìn)的技術(shù)提高發(fā)稿數量,提升新聞服務(wù)質(zhì)量。"機器新聞寫(xiě)作"是人工智能技術(shù)在新聞傳播領(lǐng)域一個(gè)現象級的發(fā)展。早些年,福布斯網(wǎng)站、美聯(lián)社、彭博社、洛杉磯時(shí)報等媒體已在體育、財經(jīng)、天氣等領(lǐng)域實(shí)現了"機器人寫(xiě)新聞"。今年以來(lái),國內的騰訊公司、新華社相繼推出了研發(fā)多時(shí)的新聞寫(xiě)作機器人,并直接應用于新聞寫(xiě)作實(shí)踐,引發(fā)熱議。
信息科技時(shí)代,高科技武裝的機器智能正越來(lái)越多地解放著(zhù)人的體力和腦力。事實(shí)上,我們正生活在一個(gè)越來(lái)越由人工智能所定義的世界里--智能搜索引擎告訴我們哪些資訊更重要;算法根據個(gè)人習慣和興趣,推算出我們應該看什么電影,聽(tīng)什么歌,買(mǎi)什么商品;警方利用犯罪大數據決定在哪里強化治安部署……就新聞領(lǐng)域而言,技術(shù)對新聞行業(yè)的入侵早已不是什么新鮮事,即使是新聞寫(xiě)作,這項長(cháng)期依賴(lài)于記者采訪(fǎng)的累活兒,在人工智能科技的高速推進(jìn)下,也正變得越來(lái)越"新潮"。
前不久,新華社正式推出新聞機器人"快筆小新"參與寫(xiě)稿項目。這臺智能化的機器人可以快速完成體育賽事、中英文稿件和財經(jīng)信息稿件的自動(dòng)撰寫(xiě)。實(shí)際上這并不是國內第一個(gè)"寫(xiě)稿"機器人。早在9月10日,騰訊財經(jīng)一則標題為《8月CPI同比上漲2.0%創(chuàng )12個(gè)月新高》的消息就由一款自動(dòng)新聞寫(xiě)作軟件Dreamwriter"操刀"完成,這款寫(xiě)作軟件能根據算法進(jìn)行及時(shí)分析和研判,在一分鐘內將重要資訊和對信息的解讀送達用戶(hù)。在科技發(fā)達的歐美國家,相關(guān)技術(shù)更進(jìn)一步。福布斯網(wǎng)站早在兩年前就已經(jīng)啟用NarrativeScience的程序自動(dòng)生成財經(jīng)新聞。在去年7月,美聯(lián)社也開(kāi)始使用自動(dòng)化技術(shù)報道公司業(yè)績(jì),截至2014年底,其智能寫(xiě)作系統已完成了4400篇財報新聞,效率是人類(lèi)記者的15倍。
那么,機器人寫(xiě)稿子到底是如何運行的呢?
對于相對"格式化"的新聞資訊,機器人消除了傳統媒體的弊端,可以做到瞬間反應、迅捷生成,在短時(shí)間內處理大量數據,且差錯率較低。他們內容生產(chǎn)過(guò)程的核心,是基于云計算和大數據分析的人工智能,依賴(lài)于一個(gè)或多個(gè)采集存儲了大量高質(zhì)量數據的龐大數據庫,在寫(xiě)稿時(shí),機器人先從海量數據庫中找出符合新聞主題需要的原始數據信息,然后通過(guò)一系列結構化處理、清洗,把數據信息重新排列組合,形成高質(zhì)量的結構化數據,最后套用設定好的固定新聞模板將文本呈現出來(lái)。數據挖掘中間上下前后的連接邏輯也比較簡(jiǎn)單,并且數據源比較單一。這方面,在內容相對單調枯燥,報道風(fēng)格單一,又對數據準確度和速度要求很高的體育賽事播報、證券財經(jīng)類(lèi)、領(lǐng)導人公共活動(dòng)、天氣預報等新聞中,機器人"智能填充輸出"優(yōu)勢十分明顯。正因此,無(wú)論是美聯(lián)社與AutomatedInsights(AI)公司合作,使用他們的Wordsmith平臺自動(dòng)生產(chǎn)財報,還是新華社"快筆小新"應用在中國足球超級聯(lián)賽報道,都很大程度上加快了出稿速度,減少了記者工作量。
知識概念模型技術(shù)的應用,有助于將記者、編輯、專(zhuān)家話(huà)語(yǔ)智慧轉換成計算機可識別數據,從而在信息數據的整合編排過(guò)程中,機器人能快速從海量數據中挖掘可用于文本分析的專(zhuān)家智慧數據,從而模仿類(lèi)似專(zhuān)家的行為(人工智能模仿),自動(dòng)生成包括原因、結論、推測等深度分析新聞。同時(shí),若添加、串聯(lián)不同語(yǔ)言風(fēng)格的語(yǔ)料庫,在出色的語(yǔ)義分析技術(shù)帶動(dòng)下,機器人新聞生成將匹配更加豐富的自然語(yǔ)言,內容輸出將呈現多樣性、個(gè)性化,以適應不同社會(huì )階層或年齡段的受眾群體。特別是隨著(zhù)大數據的發(fā)展以及相關(guān)用戶(hù)行為痕跡的記錄跟蹤,與之匹配的新聞推送早已成熟,隨之而來(lái)的"私人訂制"的新聞生產(chǎn)也并非遙不可及。
其實(shí)這種憂(yōu)慮為時(shí)尚早,因為當下的機器人新聞生產(chǎn)尚處在"稿子拼湊、語(yǔ)言堆砌"的稚拙摸索階段,即"幼年"期,在未來(lái)相當長(cháng)一段時(shí)間內機器智能還遠遠無(wú)法替代人的"大腦",尤其是那些需要體現思考價(jià)值、人文審美的新聞稿件,依舊依賴(lài)于媒體記者們來(lái)完成。"機器可以根據格式和語(yǔ)法規則寫(xiě)一首詩(shī),或者一篇小說(shuō),但全世界的數據加起來(lái),也無(wú)法讓一個(gè)程序理解愛(ài)、悲傷或恐懼。"[1]AutomatedInsight的CEORobbieAllen早前就說(shuō)過(guò):"其實(shí)就是讓機器人把數據轉化成故事,真正的難點(diǎn)在于怎么讓它看起來(lái)像人寫(xiě)的,因為只有數據不是好故事。"
事實(shí)也是如此,新華社"快筆小新"盡管已能夠采寫(xiě)多種類(lèi)型的資訊稿件,但"編輯簽發(fā)"依舊是無(wú)法忽略的重要環(huán)節。即使是美聯(lián)社也公開(kāi)承認,隨著(zhù)大量財報新聞?dòng)蓹C器人撰寫(xiě),新聞的質(zhì)量將會(huì )有所下降,針對一些關(guān)注度比較高的公司,如Google、蘋(píng)果的財報,美聯(lián)社直接承諾將繼續由資深記者手工撰寫(xiě),以避免帶來(lái)風(fēng)險性。
當下時(shí)髦的機器人新聞寫(xiě)作還有一個(gè)致命缺陷,就是其局限于現有數據庫的信息加工。這有兩個(gè)方面的影響:
一是平臺數據庫積累的大小、質(zhì)量、類(lèi)別等,都將影響機器人新聞生產(chǎn)的內容質(zhì)量,特別是一旦出現數據缺陷或算法邏輯差異,都可能導致不同的內容輸出結果。更為致命的是,諸如情緒、價(jià)值這種東西是很難用數據量化并存儲的,具體新聞故事場(chǎng)景中,機器人新聞生產(chǎn)很難相應加入"情感"元素,為此,他們更多只是"機械地"從數據庫里抽取形容詞。
二是新聞寫(xiě)作機器人即使能通過(guò)對數據庫的深入挖掘與信息組合,創(chuàng )造出很多原創(chuàng )性新聞,但發(fā)生于社會(huì )現實(shí)的素材或者說(shuō)實(shí)地實(shí)景的社會(huì )信息,依舊難以呈現。這背后實(shí)際上道出了一個(gè)機器人寫(xiě)作的現實(shí)背景:即機器人能進(jìn)行新聞寫(xiě)作并不是本身有多高明,而在于,在這個(gè)時(shí)代,新聞生產(chǎn)可以不完全依賴(lài)于線(xiàn)下采訪(fǎng)。新聞生產(chǎn)和采訪(fǎng)的脫離,是互聯(lián)網(wǎng)蓬勃發(fā)展對傳統新聞業(yè)整體性的顛覆,也是當今時(shí)代媒體行業(yè)的重大變更。反過(guò)來(lái)也一樣,現實(shí)生活中的題材依然離不開(kāi)記者的實(shí)地采訪(fǎng),最起碼線(xiàn)下的信息內容需要編輯記者人工輸入到統一的數據庫中,新聞寫(xiě)作機器人才能進(jìn)行下一步工作。即使只有這一過(guò)程,記者的價(jià)值依舊不可替代。
盡管多家媒體推出了新聞機器人,但目前主流輿論依然認為,記者工作是一種復雜的、高級的腦力勞動(dòng),人性是機器難以逾越的鴻溝,人類(lèi)的深刻理解力和創(chuàng )造力是機器難以效仿的。不過(guò),這種看法或許太過(guò)保守,科技進(jìn)步之下機器的進(jìn)化速度令人驚嘆,未來(lái)的機器人必將越來(lái)越智能。特別是人工智能、大數據運算、機器學(xué)習等新技術(shù)不斷取得突破性發(fā)展,我們已看到了語(yǔ)音識別、機器翻譯、機器人寫(xiě)新聞、即時(shí)數據展示、個(gè)性化推薦等許多媒介變化。當代最有影響的媒介理論家之一DouglasRushkoff在《編程,或者被編程》一書(shū)中寫(xiě)道:隨著(zhù)計算機和網(wǎng)絡(luò )計算能力的不斷提升,"思考本身將不再--至少不再是獨一無(wú)二地--成為人類(lèi)的特權"。瑞典學(xué)者的一項研究顯示,大多數讀者無(wú)法分辨自動(dòng)寫(xiě)作軟件和記者撰寫(xiě)的某些報道。有軟件公司負責人預測,在5年之內機器人所撰寫(xiě)的文章就能獲得普利策新聞獎,并稱(chēng)將來(lái)90%新聞稿由機器人撰寫(xiě)。
顯然,過(guò)分夸大和低估智能機器帶給新聞行業(yè)乃至人類(lèi)社會(huì )的影響,都是極其不負責任的。那么,如何定位當下聲名鵲起的新聞寫(xiě)作機器人相對適合呢?機器人"Quakebot"的設計者舒文克提出一種相對中性的觀(guān)點(diǎn),他認為,機器人寫(xiě)手雖有其技術(shù)優(yōu)勢,但卻無(wú)法完全具備人的靈活性和創(chuàng )造力,讓機器人成為記者的幫手,相信它會(huì )使工作更有趣。國內不少媒體人士也指出,相對程序化、枯燥的工作交由機器人后,記者們將有更多精力和時(shí)間來(lái)應付更需要獨特角度和思考的報道。2014年3月26日,《人民日報》刊發(fā)署名為"趙鐸"的文章《"機器人記者"忙起來(lái)》指出,機器人寫(xiě)手只是一種輔助形式,它可以節省時(shí)間,把記者從一堆基礎數據和信息中解放出來(lái)。但機器人撰寫(xiě)新聞的過(guò)程就像一個(gè)復雜的填詞游戲,一些具有固定模式的行業(yè)性文章更符合它的能力,"如果有一天記者真的被冷冰冰的機器人取代,新聞恐將淪為諸多報道模式的生硬拼盤(pán)"。
不管如何爭論,如今,機器人與人工智能已不再停留在暢想階段,它們正成為產(chǎn)業(yè)新風(fēng)口,掀起新一輪技術(shù)創(chuàng )新浪潮。如何適應未來(lái)的技術(shù)變革,顯然也是國內外媒體亟需思考的命題。筆者認為,以下兩點(diǎn)尤其值得各媒體提前做好內功:
1.積極搶占數據浪潮的高地
智能化離不開(kāi)互聯(lián)網(wǎng)數據,隨著(zhù)新聞傳播業(yè)數據庫建設的發(fā)展,大數據庫不僅成為新聞媒體向用戶(hù)提供新聞信息服務(wù)的直接手段之一,也是媒體內容生產(chǎn)走向自動(dòng)化深入挖掘轉型的重要基礎。特別是隨著(zhù)互聯(lián)網(wǎng)跨界融合的發(fā)展,互聯(lián)網(wǎng)開(kāi)放技術(shù)賦予各媒介平臺流量信息的共享與豐富,活躍于互聯(lián)網(wǎng)媒介的信息用戶(hù)正成為新聞寫(xiě)作素材的間接生產(chǎn)者,每天提供著(zhù)海量的網(wǎng)絡(luò )信息(數據),這些有跡可循的用戶(hù)行為痕跡都可能成為未來(lái)新聞智能創(chuàng )作的基礎數據??梢哉f(shuō),未來(lái)?yè)碛谢A數據的規模,將成為衡量一個(gè)媒體實(shí)力的重要標志。反過(guò)來(lái),采集大量高質(zhì)量的數據,又有助于通過(guò)數據挖掘實(shí)現信息篩選與新聞生產(chǎn)的個(gè)性化、精準化定位,大大降低用戶(hù)獲取有效信息的成本。
2.大力推進(jìn)業(yè)務(wù)與技術(shù)深度融合
我們正在歷經(jīng)一場(chǎng)由技術(shù)應用推動(dòng)的媒體轉型,媒體形態(tài)和輿論格局正在發(fā)生深刻調整,智能化趨勢下,新聞業(yè)無(wú)論是產(chǎn)品形態(tài),還是新聞生產(chǎn)力,都會(huì )經(jīng)歷新的洗禮,新聞傳播正處于一個(gè)重要的歷史分界點(diǎn)。但無(wú)論是現在還是未來(lái),行業(yè)的信息技術(shù)含量會(huì )越來(lái)越重,其中人工智能交互將是最核心趨勢。目前,類(lèi)似百度新聞和今日頭條的個(gè)性化推薦就是智能交互的初級階段。尤其是新媒體領(lǐng)域,新媒體發(fā)展最關(guān)鍵在技術(shù)層面,新媒體本身就是技術(shù)驅動(dòng)的媒體,比如雅虎、Facebook、微博、微信等,都是一個(gè)新的技術(shù)運用很快占領(lǐng)市場(chǎng)。因此,媒體轉型必須跟蹤前沿技術(shù),創(chuàng )造自己獨特的技術(shù),打造屬于自己的獨創(chuàng )產(chǎn)品。
"機器人寫(xiě)作"是知識技術(shù)融合的產(chǎn)物,機器稿件生產(chǎn)系統的出現,雖然將給新聞傳播行業(yè)帶來(lái)深刻而長(cháng)遠的變化,但萬(wàn)變不離其宗的是,新聞從來(lái)都是一種極富"專(zhuān)業(yè)性、創(chuàng )造性"的智力活動(dòng)。在新聞寫(xiě)作過(guò)程中,記者們創(chuàng )作出更具專(zhuān)業(yè)性、思想性的新聞內容,我們才不至于被機器人所代表的科技力量所擊潰。