向美国排名第一的公立研究型大学学习,加入下一代数据科学家行列。
密歇根大学信息学院的应用数据科学硕士学位旨在帮助有抱负的数据科学家通过实践项目学习和应用技能。您将学习如何使用数据来改善结果并实现雄心勃勃的目标。
密歇根大学信息学院的应用数据科学硕士课程通过掌握机器学习和自然语言处理等核心数据科学概念,帮助您成为该领域的领导者。通过深入研究隐私、数据伦理和有说服力的沟通等关键主题,您将为在当今的组织中取得成功做好准备。在构建展示您技能的工作组合时,您还将使用来自顶级公司的真实数据集。了解可帮助组织克服数据过载并做出明智决策的系统和技术。
无论您是想为数据知情的解决方案制定更好的问题陈述、构建预测模型,还是在仪表板中可视化数据,这个硕士课程都会教授您在不断变化的领域取得成功所需的技能。
当您获得密歇根大学信息学院的应用数据科学硕士学位时,您将能够:
使用数据来改善结果并实现雄心勃勃的目标。
掌握核心数据科学概念,如机器学习和自然语言处理。
了解隐私、数据道德和有说服力的沟通等关键主题。
构建预测模型并在仪表板中可视化数据。
为数据知情解决方案制定更好的问题陈述。
参加密歇根大学信息学院应用数据科学硕士课程的学生将学习应用数据科学所有基本科目的课程,重点是端到端方法。
下面是密歇根大学信息学院应用数据科学硕士学位的收集和处理数据课程和参考学习书籍介绍:
收集和处理数据:
SQLDatabases
SQL架构与技术
大数据:高效的数据处理
大数据:可扩展的数据处理
数据操作
实验设计与分析
参考学习书籍:
《从头开始学习T-SQL:在SQLServer中设计、开发和部署数据库以及高效编写T-SQL查询的易于遵循的指南(LearnT-SQLFromScratch:AnEasy-to-FollowGuideforDesigning,Developing,andDeployingDatabasesintheSQLServerandWritingT-SQLQueriesEfficiently)》
《从头开始学习T-SQL:在SQLServer中设计、开发和部署数据库以及高效编写T-SQL查询的易于遵循的指南》
本书提升您作为SQLServer开发人员和DBA的职业生涯
本书的主要特点
●来自社区专家的前沿报道,学习T-SQL编程。
●概念和技术的详细说明,便于理解。
●大量T-SQL查询和编程应用程序的实际演示。
对本书的描述
本书将教你SQL,SQLServer,数据库的基础知识,以及如何使用T-SQL编写查询和程序。阅读本书后,您将能够创建、修改和删除数据库、表和索引。您可以练习查询数据并对其运行复杂的分析。您还可以添加、删除和修改过程、用户定义的函数、触发器和视图。
通过本书学习T-SQL的过程始于对SQL和数据库基础知识的理解。你将探索用于开发和管理SQLServer数据库的SQLServerManagementStudio(SSMS)。然后,您将学习如何使用DDL语句创建、修改和删除表和索引。渐渐地,你将能够使用DML语句、联接和各种内置函数在T-SQL中进行查询。
通过本书你将学到什么
●对关系数据库和SQLServer的简明理解。
●了解如何使用T-SQL创建数据库表和索引。
●学习添加、修改和删除记录。
●练习如何通过运行智能T-SQL查询对数据进行切片和切块。
●使用各种功能执行高级分析。
●发现错误处理和事务管理。
●使用T-SQL管理XML和JSON处理。
●为T-SQL对象练习不同的部署模式。
这本书是为谁写的
如果您想知道如何设计、开发和维护SQLServer数据库,以及如何轻松运行复杂的T-SQL查询,那么本书适合您。对编程有基本了解的读者将具有优势。
《实用的CockroachDB:构建容错分布式SQL数据库(PracticalCockroachDB:BuildingFault-TolerantDistributedSQLDatabases)》
《实用的CockroachDB:构建容错分布式SQL数据库》
获取CockroachDB的实用介绍。本书从安装和基本概念开始,引导您创建可用于生产环境的群集。您将学习如何在单区域和多区域环境中创建、优化和操作CockroarchDB集群。您将遇到要避免的反模式,以及用于集成和负载测试的测试技术。
这本书解释了为什么CockroachDB存在,介绍了它的主要优点,并迅速过渡到安装和配置CockroachDB。同样快的是,您将创建数据库,将数据导入这些数据库,并从应用程序中查询该数据。您将逐步了解GDPR和CCPA等数据隐私法,并了解CockroachDB的全球分发功能如何帮助您遵守不断变化的数据主权法规。从那里,你将进入部署拓扑、集成测试和负载测试指南、最佳做法以及生产部署的准备情况清单。
通过学习本书您将学到什么
部署并与CockroachDB交互
设计和优化数据库和表
选择正确的数据类型进行数据建模
使用数据库和表加密保护数据
遵守国际数据隐私法规
以增强数据库性能的方式扩展数据库
监视对数据库的数据和运行状况的更改
本书适合那些希望为其数据提供安全、可靠且轻松的分布式家园的开发人员和数据库管理员;那些希望使用现代工具来解决以前需要专门团队才能解决的各种扩展挑战的人;任何想要利用他们的数据库来解决不平凡问题的人,在保护数据和用户的同时应对现实挑战;
《SQL和NoSQL数据库:大数据管理的模型、语言、一致性选项和架构(SQLNoSQLDatabases:Models,Languages,ConsistencyOptionsandArchitecturesforBigDataManagement)》
《SQL和NoSQL数据库:大数据管理的模型、语言、一致性选项和架构》
本书全面介绍了关系(SQL)和非关系(NoSQL)数据库。作者彻底回顾了数据库工具和技术的现状,并研究了即将到来的创新。本书开篇就对数据管理进行了广泛的介绍,包括信息系统和数据库的概述,以及对当代数据库类型的解释:?SQL和NoSQL数据库及其各自的管理系统
?大数据的性质和用途?数据管理组织的高级视图:数据建模和一致性在关系数据库和图形数据库中提供章节长度的处理,包括企业范围的数据架构和数据库设计公式。语言的覆盖范围从运算符概述扩展到SQL和QBE(按示例查询),再到完整性约束等等。一整章探讨了确保数据一致性的挑战,涵盖:?多用户操作?故障排除?海量分布式数据的一致性?ACID和BASE一致性模型的比较,以及更多系统架构也从其自己的章节中获得,该章节探讨了同构和异构数据的处理;存储和访问结构;多维数据结构和使用MapReduce的并行处理等主题。后关系数据库和NoSQL数据库:关于后关系数据库的章节讨论了SQL的局限性-以及超越的内容,包括多维数据库,知识库和模糊数据库。最后一章介绍NoSQL数据库,以及:?非关系技术的发展
?键值,列系列和文档存储?XML数据库和图形数据库等本书包括多个表格,示例和插图,每章都提供了供进一步阅读的资源列表。SQL和NoSQL数据库传达了关系和非关系方法的优点和缺点,并展示了如何进行大数据应用程序的开发。这本书使读者受益,包括应用信息技术广泛领域的学生和从业者。该教科书已被推荐并用于德国,奥地利和瑞士的大学课程。
《使用ApacheBeam构建大数据管道:使用单个编程模型进行批处理和流数据处理(BuildingBigDataPipelineswithApacheBeam:Useasingleprogrammingmodelforbothbatchandstreamdataprocessing)》
《使用ApacheBeam构建大数据管道:使用单个编程模型进行批处理和流数据处理》
使用ApacheBeam实施、运行、操作和测试数据处理管道
主要特点
了解如何在实施梁管道时提高可用性和生产力
了解如何使用ApacheBeam使用有状态处理来实现复杂的用例
借助专家提示和技术实施、测试和运行ApacheBeam管道
书籍简介
ApacheBeam是一个开源统一编程模型,用于实现和执行数据处理管道,包括提取、转换和加载(ETL)、批处理和流处理。
本书将帮助您自信地使用ApacheBeam构建数据处理管道。您将从ApacheBeam的概述开始,并了解如何使用它来实现基本管道。您还将学习如何有效地测试和运行管道。随着您的进步,您将探索如何构建代码以实现可重用性,并使用各种域特定语言(DSL)。后面的章节将介绍如何使用架构并使用(流式处理)SQL查询数据。最后,您将了解高级ApacheBeam概念,例如实现您自己的I/O连接器。
在本书结束时,您将对ApacheBeam模型有深入的了解,并能够将其应用于解决问题。
你将学到什么
了解ApacheBeam的核心概念和架构
实现无状态和有状态数据处理管道
使用状态和计时器处理实时事件处理
构建代码以实现可重用性
使用流式处理SQL处理实时数据,以提高工作效率和数据可访问性
使用可移植运行器运行管道,并使用ApacheBeamPythonSDK实现数据处理
使用SplittableDoFnAPI实现ApacheBeamI/O连接器
这本书是为谁写的
本书面向想要了解ApacheBeam工作原理的数据工程师、数据科学家和数据分析师。假定具有Java编程语言的中级知识。
目录
使用ApacheBeam进行数据处理简介
实现、测试和部署基本管道
使用有状态处理实现管道
构建可重用性代码
使用SQL进行管道实现
使用具有可移植性的首选语言
扩展ApacheBeam的I/O连接器
了解运行程序如何执行管道
《数据处理的代数方法:技术和应用(AlgebraicApproachtoDataProcessing:TechniquesandApplications)》
《数据处理的代数方法:技术和应用》
本书探讨了选择和设计数据处理技术的新通用方法。这种代数方法背后的对称性和不变性思想在物理学中取得了成功,其中许多新理论都是用对称术语表述的。
本书解释了这种方法,并将其扩展到新的应用领域,从工程、医学、教育到社会科学。在许多情况下,这种方法可以带来最佳技术和最佳解决方案。
同样的数据处理技术帮助我们更好地分析木质结构、肺功能障碍和深度学习算法,这很好地表明这些技术也可以用于许多其他应用。
本书推荐给需要选择数据处理技术的研究人员和从业者,或者在现有技术不起作用时想要设计新技术的研究人员和从业者。还推荐给想要学习最先进的数据处理的学生。
《查询SQLServer:运行T-SQL操作、数据提取、数据操作和自定义查询以提供简化的分析(QueryingSQLServer:RunT-SQLoperations,dataextraction,datamanipulation,andcustomqueriestodeliversimplifiedanalytics)》
《查询SQLServer:运行T-SQL操作、数据提取、数据操作和自定义查询以提供简化的分析》
使用SQL学习真实世界的分析
本书的主要特点
●实践方法来学习数据分析的基础知识
●通过示例涵盖从新手到精通的所有级别的SQL专业知识
●包括更有效地查询复杂数据库的技术和方法
本书的描述
本书将带您踏上交互式旅程,使用各种T-SQL技术从最基本到最高级的级别掌握SQL查询,以从您的SQLServer数据中提供有意义的见解。
本书首先介绍了SQL和SQLServer的基本概念。然后,它指导读者完成构建查询的过程,使用简单然后更复杂的表联接和逐步更高级的数据筛选,以提供基于各种SQL技术的高级查询。读者将通过学习如何在T-SQL、关系逻辑中应用基本计算以及如何对数据进行分组和聚合,了解如何提供相关且可信的数据分析。还涵盖了其他SQL概念,例如格式化查询、编写子查询、创建派生表、联接和筛选表等。除此之外,本书还讨论了如何进行滚动分析、检查时间序列数据以及管理大型复杂数据集。
读完这本书后,读者不仅可以编写复杂的查询;相反,他们将能够构建用于分析关系数据集并得出所需见解的方法。
你将学到什么
●使用简单的数学和逻辑、多个过滤器和数据聚合来分析数据。
●精通表表达式、子查询和编写复杂的计算。
●使用高级方法进行滚动分析和时间序列分析。
●查看SQL概念,例如表连接、数据筛选、查询结构和表派生。
这本书是为谁写的
本书适用于数据专业人员,例如数据库开发人员,SQL开发人员,数据分析师和BI专家,他们希望构建复杂的查询并从数据集中提取所需的分析。这本书还鼓励聪明的新学习者学习SQL,并立即在他们的第一份工作中使用它。
《使用R设计和分析实验和观察性研究(DesignandAnalysisofExperimentsandObservationalStudiesusingR)》
《使用R设计和分析实验和观察性研究》
科学研究设计与分析导论通过现代框架-鲁宾因果模型向本科生和研究生展示经典实验设计和观察研究的基础。因果推理框架在设计、数据收集和分析中很重要,因为它为研究人员提供了一个框架,让他们能够轻松评估研究局限性并得出适当的结论。R用于实现设计并分析收集的数据。
本书的特色:
经典实验设计,重点是在R中使用tidyverse包进行计算。
实验设计在临床试验、A/B测试和其他现代示例中的应用。
讨论经典实验设计与因果推理之间的联系。
随机化在大数据时代实验设计和抽样中的作用。
有答案的练习。
RMarkdown中的讲师幻灯片,将开发一个新的R包以与book一起使用,并且该书的书籍版本将免费提供。拟议的书将强调道德,沟通和决策作为设计,数据分析和统计思维的一部分。