美国国家公共广播电台(NPR)采用Splunk进行Web分析

Posted by admin on Jun 20, 2011 in 更多文档 | 0 comments


美国国家公共广播电台(NPR)公司开创了Splunk的新应用,即,采用Splunk日志搜索引擎分析其音频流和下载端的Web流量。

于纽约举行的“GigaOm数据”大会上,NPR度量分析师SondraRussell介绍了Splunk在NPR的应用。

Splunk提供了一款专门用于搜索设备数据的搜索引擎。它最初用于解析日志文件、文件程序和硬件,并记录交易、错误和其他操作信息。系统管理员可通过Splunk整合不同应用程序和硬件中的信息时间戳,从而精确找到那些难以定位的系统问题。

近几年来,用户已在Splunk的基础上开发了各种各样的应用,Splunk首席技术总监Erik Swan 表示,Web流量分析和商业智能就是Splunk的两个主要附带用途。

事实上,NPR此前一直使用标准Web流量分析软件来监控大部分的Web流量。该软件可显示每张Web网页的访问人数。此类软件一般通过使用cookies或在每张网页上嵌入一个小小的脚本来统计访问人数。当用户浏览网页时,网页上嵌入的脚本向软件发出警报,从而实现访问人数的统计。

然而,NPR发现该软件在很多方面无法对其服务进行可靠的统计。例如,NPR需要知道收听NPR音/视频节目的具体听众人数。

为了获得这一数据,NPR曾经编写过一个PHP脚本来分析服务器日志文件,并将分析结果转换成一张可以用Omniture软件(Adobe的一款Web分析工具)分析的表格。然而,这一方式需耗费24小时才能得到结果,且Russel表示该软件的分析结果并不精确。

许多用户在使用音/视频流时一般遵循“启动——暂停——再启动”的顺序,或者在Internet连接失败后再进行重启。这些事件仅作为单独事件而非单一用户操作结果记入服务器日志文件。因此,NPR无法确定具体有多少连接来自不同的听众,也无法确定同一用户使用了多少音/视频流。

“PHP脚本无法进行复杂分析,因此,我们的数字可能不全面,从而很难作出理性决定”Russell说道。

但是,通过使用Splunk,NPR可直接从其服务器的日志文件中导出听众人数和信息,将搜索结果编写成脚本,并通过图表或表格形式将结果显示出来。

例如,对于NPR的每一个即播或下载节目,Splunk均可提供节目的具体听众人数。“有了Splunk,我们可以将多个日志条目打包成一个个可区分的访问,这使我觉得我得到的数据是真实准确的。”她说道。

Splunk还可帮助识别用户的移动平台。当前,移动客户端对NPR网站的访问日益增多,如iPhones、iPads和Android智能手机。在一个案例中,一位经理想了解哪一种Iphone操作系统最常访问NPR,以便引导该公司Iphone应用程序的设计。

Russell说“如果没有Splunk,我无法回答他的问题。”

Splunk还为NPR解决了一个看似不可能解决的问题,即,如何支付音频流式歌曲的版税。NPR提供歌曲的流服务,称作SoundExchange。对于NPR播放的每一首歌曲,NPR必须根据播放歌曲时听众数量产生的流量来支付歌曲的版税。“核对每一首歌曲与其对应的听众流量,是非常复杂的。”Russell说道。

但是,Russell能够通过Splunk合并歌曲列表文件和歌曲播放时听众的流量文件。Russell表示“Splunk能够将两个文件合并在一起。”

Leave a Reply

Your email address will not be published. Required fields are marked *

*

You may use these HTML tags and attributes: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>