来源:全球深度报道网
我们进入了一个言必称“大数据”的时代,以致这个出现不过两年的概念似有被滥用之嫌。但无可否认的事实是,全球各地*府、企业,乃至个人每天都在制造着海量数据。这些数据中又往往隐藏着“独家猛料”,吸引着越来越多的记者投身其中,进而在新闻行业中催生了数据新闻(DataJournalism)这一时髦的分支。
bloks
大数据时代的记者有必要懂得如何获取“结构化的信息”,通过整理并准确地分析数据来挖掘出有价值的新闻。全球深度报道网为此专门整理出一份数据新闻实用清单,帮助大家推开大数据之门。如果你有任何最新资料,都欢迎你告诉我们:hello
gijn.org。衷心感谢你的支持。入门必读
数据新闻在上世纪80-90年代以计算机辅助新闻报道(Computer-AssistedReporting)的名义首次出现在新闻行业。
年在美国成立的计算机辅助新闻报道协会(TheNationalInstituteforComputer-AssistedReporting)是一个致力于在全世界培养深度报道记者的组织。除了开展新手训练营等培训项目,协会还设有电子图书馆和练习用数据库,并每年举办一次计算机辅助新闻报道研讨会。
协会将有关资料集结出版,现已成为一部畅销书籍:《计算机辅助新闻报道实用手册》(Computer-AssistedReporting:APracticalGuide)。手册的网络版可供读者免费阅读。
对于刚接触数据新闻的朋友,美国的Poytner网站以“五个秘诀”和“十个工具”教你如何效地分析数据。
在英国,深度报道新闻学中心(TheCenterforInvestigativeJournalism)也出版了一本有关数据新闻学的手册。CIJ还在其网站上分享了大量关于数据新闻的书籍、指南和视频资源。
著名的数据驱动新闻学(DataDrivenJournalism)网站准备了非常全面的学习资料,值得参考。
你也可以在国际记者网上找到数据新闻有关的课程、辅助工具和其它资料。
Hacks/Hackers是一个聚集大批程序员和深度报道记者的全球性组织,目标是推动用数据发掘有影响力的报道。该组织通过各地分的支机构向记者提供培训课程。
TheInvestigativeDashboard网站上囊括了数据挖掘、数据可视化以及人际关系网络分析等方面的应用工具。
djh-facing-left3不得不提的还有数据新闻学手册(DataJournalismHandbook)是一本由来自世界各国的数十位数据新闻学专家合作编纂而成的教材。这是一本由世界各国的数十位数据新闻专家合著的教材。你可以在网上免费下载包括中文在内的各语言版本。
数据挖掘
数据新闻记者并不一定要成为程序猿,但懂得通过计算机语言运行一些简单的数据处理程序,甚至亲自动手编写一小段算法可帮助你更好地理解数据背后的逻辑,也更有利于在开展数据新闻项目的时候加强和技术部门同事之间的沟通。
对计算机一窍不通?上网总会吧?那就够了。
CodeAcademy是一个提供互动式编程培训的免费网站,手把手地教你使用常见的程序语言,包括HTML,CSS,JavaScript,Python,Ruby,和PHP.
麻省理工大学官方网站提供了若干免费在线课程,讲解如何使用Python,Java和C++这些计算机语言编写程序。
计算机教育专家MichaelMart在网上发布了一本开源的培训教材,供人们自学RubyonRails。
想知道如何从网页和各种电子文档(尤其是PDF)抓取文本数据?新闻网站ProPublica开列出一份清单,囊括了相关的若干实用工具和自学教程。
此外,scraperwiki是一个抓取数据的在线工具,,OnlineJournalism网站发布了一篇相关的入门指南。
数据分析
inertPyrDDJ
InvestigativeReportersandEditors上有将PDF文件转换成普通文本格式文件的简单教程。
如果想将PDF文件中的电子表格导出为Excel表格,则可以参考加拿大麦吉尔大学的网上教程。
SchoolofData提供了从如何找到合适的数据库,到基础的Excel使用技巧,再到如何利用挖掘到的数据完成新闻报道的一整套解决方案。
程序开发员DanNguyen整合了使用GoogleRefine清洗结构化数据的方法,以及一些视频教学链接。
Github提供了“SQL入门介绍”。
数据可视化
美国统计学家EdwardTufte在可视化信息测绘方面有一些著述和课程,现已成为行业标准。
美国统计学家邱南森创立了FlowingData网站,他同时也是《鲜活的数据:数据可视化指南》和《数据之美:一本书学会可视化设计》这两本书的作者。
Visualisationofdata.