Dolphin1000智能廣告監(jiān)播分析系統(tǒng)】
(智能自動(dòng)截取工業(yè)級(jí) 詳情見(jiàn)www.zghpc.com)
1,廣告公司、電視購(gòu)物公司、廣告投放量大的企業(yè)都需要解決以下問(wèn)題:
實(shí)時(shí)收看將要播出的電視廣告(有線(xiàn)電纜內(nèi)包含的全部頻道);
監(jiān)控廣告播出情況,對(duì)漏播、延播、廣告前后環(huán)境實(shí)施錄像,以便日后核對(duì);
將同業(yè)的個(gè)別或全部產(chǎn)品廣告實(shí)施錄像,以便隨時(shí)參閱、分析、篩選產(chǎn)品和時(shí)段;
實(shí)現(xiàn)無(wú)人值守的電視廣告錄像,以提高員工工作效率;
利用系統(tǒng)自動(dòng)地對(duì)電視廣告播出視頻進(jìn)行廣告識(shí)別、條目登記,直接生成廣告監(jiān)播報(bào)表和分析圖表;
相關(guān)部門(mén)經(jīng)理需要在工作筆記本上隨時(shí)隨地的監(jiān)控電視廣告的播出;
鑒于以上問(wèn)題,現(xiàn)將系統(tǒng)的關(guān)鍵性環(huán)節(jié)說(shuō)明如下,以利于盡可能的靠近用戶(hù)的現(xiàn)實(shí)需要:
2,傳統(tǒng)的廣告監(jiān)播方式
用傳統(tǒng)的廣告監(jiān)播方式來(lái)處理一套電臺(tái)(電視)節(jié)目中廣告信息的過(guò)程通常包括下列步驟:
第一日: 用傳統(tǒng)的錄像機(jī)、錄音機(jī)錄制節(jié)目并保存
第二日: 廣告監(jiān)測(cè)人員通過(guò)回放錄音/錄象,記錄出現(xiàn)的廣告信息
第三日: 廣告監(jiān)測(cè)人員將監(jiān)看數(shù)據(jù)交監(jiān)播中心處理
第四日: 獲取監(jiān)播報(bào)告
我們通常說(shuō)廣播、電視廣告監(jiān)測(cè)是大量的人力堆積起來(lái)的數(shù)據(jù),這一點(diǎn)都不夸張,尤其是電臺(tái)廣播,因?yàn)槿说亩o(wú)法辨別以倍速播放聲音的內(nèi)容,但卻能大致看明白以倍速播放的視頻圖象。也就是說(shuō),一個(gè)監(jiān)測(cè)員若要真實(shí)可信地處理前一天全部24小時(shí)的數(shù)據(jù),就必須花26-30個(gè)小時(shí)的時(shí)間。這樣,一個(gè)電臺(tái)一個(gè)頻段每天24小時(shí)的監(jiān)測(cè)數(shù)據(jù)處理,將需要3-4個(gè)人工來(lái)完成,而后還需要人員錄入、QC,*后才能生成監(jiān)播結(jié)果報(bào)告單,總共需要4-5個(gè)人工來(lái)完成。
3,基于音頻的廣告智能監(jiān)播技術(shù)原理
在電臺(tái)或電視節(jié)目中播放的廣告普遍具有下列特征:
1、 同一版本的某個(gè)廣告的播出時(shí)間上具有重復(fù)性和連續(xù)性,時(shí)間短的會(huì)重復(fù)播放一星期,長(zhǎng)的甚至?xí)_(dá)到半年以上。
2、 重復(fù)播放的廣告都具有相同的音頻特征(聲紋和頻譜)。
3、 不同版本的廣告具有完全不同的音頻特征。
例如,下面看到的就是某個(gè)廣告樣本的“音頻特征波形圖”:
如果能夠通過(guò)語(yǔ)音識(shí)別引擎將某套節(jié)目中首次出現(xiàn)的某廣告的音頻特征信息提取出來(lái),制作為該廣告的音頻識(shí)別樣本,就可以通過(guò)語(yǔ)音識(shí)別引擎用該樣本對(duì)后續(xù)數(shù)據(jù)進(jìn)行連續(xù)自動(dòng)識(shí)別,并將識(shí)別出的廣告記錄到數(shù)據(jù)庫(kù)中,從而實(shí)現(xiàn)基于音頻的廣告自動(dòng)監(jiān)播。
實(shí)現(xiàn)基于音頻的廣告自動(dòng)監(jiān)播的技術(shù)關(guān)鍵是語(yǔ)音識(shí)別引擎的設(shè)計(jì),需要解決下列技術(shù)難題:
? 廣告識(shí)別準(zhǔn)確度。如果識(shí)別準(zhǔn)確度低于80%,系統(tǒng)的可信程度就不可接受。而識(shí)別準(zhǔn)確度高的算法往往計(jì)算量也非常大。
? 計(jì)算能力。語(yǔ)音識(shí)別算法的計(jì)算量非常大,普通的CPU難以負(fù)擔(dān),只能采用專(zhuān)用DSP硬件實(shí)現(xiàn)的方案。
? 處理速度。一般而言,實(shí)際的應(yīng)用系統(tǒng)都需要同時(shí)監(jiān)播數(shù)十套電臺(tái)、電視節(jié)目。這對(duì)識(shí)別引擎的硬件設(shè)計(jì)提出了很高的要求。
4,ZG DOLPHIN 1000型 智能廣告監(jiān)播系統(tǒng),
ZG DOLPHIN 1000型 智能廣告監(jiān)播系統(tǒng)以99%的識(shí)別準(zhǔn)確度為設(shè)計(jì)目標(biāo),充分利用了飛速發(fā)展的DSP技術(shù),攻克了上述技術(shù)難題,使基于音頻的廣告自動(dòng)監(jiān)播進(jìn)入實(shí)用階段。
ZG DOLPHIN 1000型 智能廣告監(jiān)播系統(tǒng)采用基于高速DSP高速、高精度語(yǔ)音識(shí)別算法,實(shí)現(xiàn)了電臺(tái)、有線(xiàn)電視節(jié)目中播出廣告的自動(dòng)識(shí)別和分析統(tǒng)計(jì)。根據(jù)操作員預(yù)先確定的廣告樣本,本系統(tǒng)能從電臺(tái)、電視的聲音信號(hào)中準(zhǔn)確地識(shí)別出某個(gè)廣告是否出現(xiàn)、在什么時(shí)間出現(xiàn)(精確到0.1秒),以及該廣告播放的時(shí)間長(zhǎng)度。識(shí)別出的廣告的相關(guān)信息被自動(dòng)存入數(shù)據(jù)庫(kù)。
ZG DOLPHIN 1000型 智能廣告監(jiān)播系統(tǒng)除了具備廣告智能監(jiān)播功能以外,同時(shí)還具有節(jié)目監(jiān)錄功能。通過(guò)掛接大容量的海量存儲(chǔ)設(shè)備,ZG系統(tǒng)夠?qū)⑷抗?jié)目數(shù)據(jù)保存30天以上甚至更長(zhǎng),以便事后查證。
4.1,語(yǔ)音識(shí)別工作站
語(yǔ)音識(shí)別工作站是整個(gè)音頻廣告自動(dòng)監(jiān)播系統(tǒng)的核心設(shè)備,包括廣告識(shí)別所需的全部硬件部分和軟件,具體包括:
a,工業(yè)級(jí)的高性能專(zhuān)業(yè)計(jì)算平臺(tái)及相應(yīng)的調(diào)度軟件,滿(mǎn)足系統(tǒng)24小時(shí)連續(xù)不間斷運(yùn)行的需要。
b,專(zhuān)用的超大容量音頻數(shù)據(jù)采集硬件及相應(yīng)軟件,可以同時(shí)對(duì)多達(dá)10路電臺(tái)音頻(或電視伴音信號(hào))進(jìn)行數(shù)字化,并將數(shù)字化的聲音數(shù)據(jù)和視頻數(shù)據(jù)以文件方式保存到工作站的本地硬盤(pán)或外掛的磁盤(pán)陣列上。
c,專(zhuān)用的視頻數(shù)據(jù)采集硬件及相應(yīng)軟件,采用*先進(jìn)的MPEG4壓縮技術(shù),可以同時(shí)對(duì)多達(dá)10路輸入視頻信號(hào)進(jìn)行數(shù)據(jù)采集和壓縮,將視頻數(shù)據(jù)的碼流將到了*低。
d,專(zhuān)用硬件構(gòu)成的超級(jí)語(yǔ)音識(shí)別引擎,用以對(duì)輸入的原聲數(shù)據(jù)提取音頻特征。語(yǔ)音識(shí)別引擎使用了目前*先進(jìn)的DSP芯片陣列和識(shí)別算法,可以同時(shí)對(duì)多達(dá)10路輸入原聲數(shù)據(jù)的音頻特征進(jìn)行并行計(jì)算。
e,每臺(tái)識(shí)別工作站可以同時(shí)處理多達(dá)10套廣播或電視節(jié)目。
4.2,磁盤(pán)陣列
音頻、視頻信號(hào)數(shù)字化后,每天產(chǎn)生的數(shù)據(jù)量是相當(dāng)可觀(guān)的。對(duì)于電臺(tái)節(jié)目,每天24小時(shí)產(chǎn)生的數(shù)據(jù)大約為1G(1000M bytes)左右;對(duì)于電視節(jié)目,采用*先進(jìn)的MPEG4壓縮格式,每天24小時(shí)產(chǎn)生的數(shù)據(jù)大約為6G左右(包括聲音原聲數(shù)據(jù)和視頻圖象數(shù)據(jù))。
例如,如果需要在一臺(tái)識(shí)別工作站上同時(shí)監(jiān)測(cè)16套電視節(jié)目和16套廣播節(jié)目,并且要求聲音和圖象數(shù)據(jù)都至少保存90天,那么需要的存儲(chǔ)空間大約為:
6G*16*90 = 8640 G
1G*16*90=1440G
如此大的存儲(chǔ)要求需要使用海量存儲(chǔ)設(shè)備,通常是磁盤(pán)陣列。
4.3,操作員終端
本系統(tǒng)中,所有需要人工參與的工作都是在操作員終端上進(jìn)行。操作員終端提供友好、方便的圖形化人機(jī)交互界面,實(shí)現(xiàn)正常節(jié)目的確定、廣告樣本的提取、廣告監(jiān)聽(tīng)/監(jiān)看、自動(dòng)識(shí)別、廣告識(shí)別結(jié)果的存儲(chǔ)和管理等功能。
操作員每天的主要任務(wù),主要包括下列內(nèi)容:
(1) 打開(kāi)保存在工作站上的某套電臺(tái)或電視節(jié)目某天的錄音和錄象文件。
(2) 系統(tǒng)用前一日(或多日)的樣本庫(kù)對(duì)當(dāng)日原聲進(jìn)行自動(dòng)預(yù)識(shí)別。識(shí)別出的廣告會(huì)自動(dòng)標(biāo)注到波形上,同時(shí)將相關(guān)信息保存到數(shù)據(jù)庫(kù)中。
(3) 利用終端軟件提供的工具聽(tīng)?。ú榭矗┰晹?shù)據(jù)(和圖象),從中發(fā)現(xiàn)新廣告,將新出新廣告制作成樣本。
(4) 給新樣本輸入主題詞并保存。此時(shí)終端軟件會(huì)自動(dòng)在當(dāng)日原聲文件中對(duì)新樣本進(jìn)行自動(dòng)識(shí)別,將識(shí)別出的新樣本在波形上進(jìn)行標(biāo)記,并記錄到數(shù)據(jù)庫(kù)中。
(5) 操作員重復(fù)步驟(3)~(4),直到完成對(duì)該日全部新廣告的提取和處理。
操作員終端按照實(shí)際需要進(jìn)行配置。一般而言,如果每天24小時(shí)的數(shù)據(jù)都需要處理,每3~4套節(jié)目需要配置一臺(tái)操作員終端。
下面是操作員終端的一個(gè)操作界面:
4.4,監(jiān)播結(jié)果數(shù)據(jù)庫(kù)服務(wù)器
數(shù)據(jù)庫(kù)服務(wù)器上主要存放每套節(jié)目的樣本信息和監(jiān)播結(jié)果的數(shù)據(jù)庫(kù)。
監(jiān)播結(jié)果數(shù)據(jù)庫(kù)集中存放各套節(jié)目監(jiān)播結(jié)果。數(shù)據(jù)庫(kù)中每條記錄都包含下列信息:
? 媒體來(lái)源,如某某廣播電臺(tái)FM xx.xxxHz,某某廣播電臺(tái)AM xx.xxxHz,某某電視臺(tái)
? 廣告名稱(chēng)(主題詞)
? 節(jié)目類(lèi)型。對(duì)于17號(hào)令的應(yīng)用而言,分公益廣告、酒類(lèi)廣告、影響進(jìn)食類(lèi)廣告、普通廣告、禁止播放類(lèi)廣告、節(jié)目
? 播出日期、時(shí)間
? 廣告/節(jié)目持續(xù)時(shí)長(zhǎng)
用戶(hù)收益:
? 實(shí)現(xiàn)實(shí)時(shí)監(jiān)督播出的廣告播出長(zhǎng)度,播出時(shí)間的精確性
? 可以監(jiān)督電視臺(tái)因工作過(guò)失產(chǎn)生的漏播,缺幀等情況
? 可作為電視臺(tái)是否落實(shí)廣告播出合同的依據(jù)
? 可實(shí)現(xiàn)在同一時(shí)刻內(nèi)同時(shí)監(jiān)控多個(gè)廣告播出情況的功能
? 可有效地收集同業(yè)的媒介廣告播出情況,利于用戶(hù)有效地進(jìn)行行業(yè)分析