编程是数据科学的重要组成部分,理解编程逻辑、循环和函数的开发者也更容易成为数据科学家。但是,对于那些未在大学时期学习过软件开发,或接触过编程语言的人们来说,就真的没办法涉足这一领域?
近些年,随着数据科学的蓬勃发展,许多公司(也包括很多创业公司)都推出了基于GUI(图形用户界面)的数据科学工具。即便不具备任何编程经验或对算法知之甚少,你都可以借助这些工具来构建高质量的机器学习模型,进而成为一名合格的数据科学家。本文我们总结了目前最为简单易用的数据科学工具清单,也希望你能尽早成为这一领域的专家。
RapidMiner
RapidMiner(RM)最初源自YALE(YetAnotherLearningEnvironment)项目,年正式更名为RapidMiner。RM涵盖了预测建模的整个生命周期,包括数据准备、数据建模、验证和部署。借助RM,你可以在没有一行代码的情况下运行各种各样的机器算法,同时,RM也支持R和Python脚本。
目前,RM被用于各行各业,包括汽车、银行、保险、生命科学、制造业、石油和天然气、零售、电信和公用事业等。年,RM正式进入中国预测性分析市场,主要为中国用户提供预测性分析解决方案、技术支持、培训及认证服务。
RM产品线包括:
RapidMinerStudio:一款可用于数据准备,可视化分析和统计建模的客户端软件。
RapidMinerServer:适用于企业级环境,具有中央存储库功能,可以轻松进行团队协同,项目管理和模型部署,与RapidMinerStudio无缝集成。
RapidMinerRadoop:可以实现以Hadoop为中心的大数据分析功能。
RapidMinerCloud:基于云的存储库,可以轻松实现各种设备之间信息共享。
RapidMiner中文