|
|
过去两年,互联网档案馆(Internet Archive)旗下的网络存档服务 Archive-It 与 明尼苏达大学哈伯德新闻与大众传播学院以及杜克大学德威特·华莱士媒体与民主中心的研究人员合作,开展了一项旨在评估地方媒体生态系统健康状况的项目,该项目是“新闻衡量研究项目”(News Measures Research Project)的一部分,由民主基金会(Democracy Fund)资助。该项目由杜克大学的菲尔·那不勒斯(Phil Napoli)和明尼苏达大学的马修·韦伯(Matthew Weber)领导。项目团队与 Archive-It 合作,抓取并存档了代表美国 100 个社区的 663 个地方新闻网站的主页。从 7 月到 9 月,他们每天进行七次抓取,共收集了超过 2.2TB 的独特数据和 1600 万个 URL。研究的初步结果详细阐述了地方社区如何报道诸如紧急情况、政治和交通等核心议题。其他研究结果则考察了不同媒体机构制作的地方新闻数量,并揭示了地方报纸在为社区提供相关内容方面的重要作用。
新闻指标研究项目的目标是通过分析样本社区的本地新闻报道数量和类型
来评估地方社区新闻的健康状况。为了生成随机且无偏的社区样本,研究团队使用了美国人口普查数据。先前的研究表明,社区的平均收入与本地新闻报道的数量呈正相关;因此,研究团队决定利用人口普查数据将社区划分为三个不同的收入等级(高、中、低)。为了减少异常值,研究团队从样本中剔除了农村地区和主要城市;最终得到1559个社区,人口数量从2万到30万不等,家庭 WS 数据库 平均收入从2.1万美元到21.5万美元不等。接下来,研究团队随机抽取了100个社区,并运用严格的搜索流程,最终确定了663家报道这些社区本地新闻的媒体机构(基于网络搜索和Cision等权威媒体目录)。
新闻测量研究项目(News Measures Research Project)的网络抓取数据提供了一个独特的美国地方新闻概览。该项目着重分析地方层面的新闻报道性质,同时也考察了更广泛的社区新闻特征。在地方层面,100个社区样本提供了一种观察地方新闻报道性质的方法。接下来,一个编码团队分析了存档网页上的内容,以评估特定新闻媒体的报道内容。通常,服务于当地社区的网站只是聚合其他媒体的内容,而不是提供原创内容。研究团队最感兴趣的是了解地方新闻媒体在多大程度上真正报道了与特定社区相关的议题(例如当地政治)。在全局层面,该团队考察了社区新闻网站之间的互动(例如内容共享)以及对报道量的自动测量。
研究人员的主要数据来源是存档的本地社区新闻数据
此外,团队还利用人口普查数据汇总了其他指标,例如报纸发行量数据。这些数据使团队能够根据社区特征分析本地新闻的数量和类型变化。由于团队使用了多个数据集,网络数据只是其中的一部分。WAT数据格式在这方面对团队尤为有用。使用 WAT 文件格式使团队无需深入挖掘数据——WAT 数据允许团队在无需检查每个 WARC 记录内容的情况下,查看数据的高层结构。未来,WARC 数据将支持更深入的分析,但 WAT 文件更轻量级的元数据格式使得早期分析成为可能。
|
本帖子中包含更多资源
您需要 登录 才可以下载或查看,没有账号?立即注册
x
|
|
|
|
|
|
|
|