Introduction to Data Science

开始时间: 04/22/2022 持续时间: 8 weeks

所在平台: CourseraArchive

课程类别: 信息,技术与设计

大学或机构: University of Washington(华盛顿大学)

授课老师: Bill Howe

课程主页: https://www.coursera.org/course/datasci

课程评论: 5 个评论

评论课程        关注课程

课程详情

Commerce and research is being transformed by data-driven discovery and prediction. Skills required for data analytics at massive levels – scalable data management on and off the cloud, parallel algorithms, statistical modeling, and proficiency with a complex ecosystem of tools and platforms – span a variety of disciplines and are not easy to obtain through conventional curricula. Tour the basic techniques of data science, including both SQL and NoSQL solutions for massive data management (e.g., MapReduce and contemporaries), algorithms for data mining (e.g., clustering and association rule mining), and basic statistical modeling (e.g., linear and non-linear regression).

课程大纲

Part 0: Introduction 

  • Examples, data science articulated, history and context, technology landscape
Part 1: Data Manipulation, at Scale
  • Databases and the relational algebra 
  • Parallel databases, parallel query processing, in-database analytics 
  • MapReduce, Hadoop, relationship to databases, algorithms, extensions, languages  
  • Key-value stores and NoSQL; tradeoffs of SQL and NoSQL
  • Entity resolution, record linkage, data cleaning
Part 2: Analytics
  • Basic statistical modeling, experiment design, introduction to machine learning, overfitting
  • Supervised learning: overview, simple nearest neighbor, decision trees/forests, regression 
  • Unsupervised learning: k-means, multi-dimensional scaling  
  • Graph Analytics: PageRank, community detection, recursive queries, iterative processing  
  • Text Analytics: latent semantic analysis  
  • Collaborative Filtering: slope-one
Part 3: Communicating Results
  • Visualization, data products, visual data analytics 
  • Provenance, privacy, ethics, governance 
Part 4: Guest Lectures
  • Guest Lectures: AMPLab, Datameer, SciDB, more 

课程评论(5条)

0

Cloga在路上 2013-07-31 23:01 0 票支持; 0 票反对

很好的一门课,尤其对于我这种初学者,老师讲的面很广,涉及了数据科学的很多方面。
不足之处是课程内容过多有些内容讲的很匆忙,比如数据可视化这个部分,大家普遍反馈讲的有点水,Graph那部分也有点水。
比较好玩的是,课程结束后Bill好像有些事情,拖了一段时间才给出分数,大家在课程论坛上各种吐槽,无比欢乐。

-2

高峡之数据时代 2013-06-29 14:46 1 票支持; 3 票反对

前段时间去CourseRA注册了一个Introduction to Data Science,谈一下收获顺便谈一下美国的教育:

1. 语言:最大的差别是语言,全程英文教学,这让我一瞬间仿佛回到了美国的课堂,所以如果大家英文基础不好的话,有点痛苦了,只能看PPT中的英文猜测了;

2. 进度:老师授课进程非常快,基本是台上十分钟,台下几个星期的自学(如果没有基础的话);

* 这真是美国课堂发生的事情,进度非常快,不是填鸭式的教育,一律都是点到即止,下面深入的东西得自己学;我头一学期在美国学了5门课程,后来发现实在跟不上,课下花的时间太多了,最后Drop了一门;
* 我的主业是数据挖掘,所以大部分的内容我都清楚,学这门课还有一个想法,是实践回归理论,看看只是有没有死角,看看实践有没有更好的理论提升空间;所以我建议还是需要有一定的时间之后,再回去学相应的课程,收获更大一点;
* 美国教育最大的不同,就是培养独立思考,自学成才,着从老师授业的方式完全可见一斑,老师从来不会限制学生们的思维方式和各种奇怪的问题,而且对抄袭是零容忍,搞大了,还可以退学的。

3. GFW: 课堂作业非常不习惯,一上来就是Twitter的实时数据分析,你不知道中国有个GFW,完全访问不了Twitter的API,所以作业基本都没有办法完成的,这是国情,逃避不了的;

4. 孤独:独学而无友,则孤陋而寡闻。在线教育目前是孤独的,一个人学完一门课程,需要很大的时间,空间乃至内心的孤独。


* 和老师的互动很少,这一点不大习惯,我们原来在课堂上提的问题老师实时答疑的机会没有了,有问题自由自己解决,学习曲线变陡峭了,本来名师一点通的东西,现在得靠自学了;
* 和同学之间的互动也很少,这一点我觉得应该引入社交,我现在都很感概在新东方读书时的盛况,和大家的激情,和改变自己命运的决心;
* 一个小插曲,有次半期考试我考了C,老师说得C的同学这门课直接就Fail,我吓得半死,赶紧去找到老师,说我也是教师子弟,这次失手确实是选的课程太多了,老师果然法外开恩,互动太好了。


说了这么多,在线教育对社会的贡献还是非常大,让学生足不出户就能感受到先进的课程,按照自己的兴趣安排时间来系统的学习课程,让教育彻底摆脱了应试的范围,这是对教育最大的贡献。

0

伟伟酱说 2013-06-26 17:18 0 票支持; 0 票反对

正如老师开始所讲的,这门课的目的只是让你成为advanced beginer,课程内容涵盖了数据库(SQL,NoSQL),MapReduce,基本的数值分析,机器学习,数据可视化。类似于另外一门课Web intelligence and big data,两者都应该算是入门型课程,学生想要深入学习的话可以选择其他专门的课程。
有人认为老师讲课枯燥,你总不能指望每个老师把数学课讲的有历史课那么有趣吧~

1

ototsuyume 2013-06-26 16:50 1 票支持; 0 票反对

我来泼泼冷水,只上了三个星期课,感受如下:
1、老师讲得不清楚,不流畅,这是最大的问题。
2、课程结构有问题,什么都想讲但什么都讲不清楚,简单而言就是大杂烩。像sql、nosql这种东西没有必要专门花一两个星期去讲,而且讲不了什么内容,让学生专门去上一下数据库这门课效果不是更好吗?
3、参考文献很丰富,应该算是这门课唯一值得称赞的地方了。
总而言之,不太推荐。

1

钛合金蛙眼 2013-06-26 12:22 1 票支持; 0 票反对

希望和失望并存。。。课程内容结构很好,讲的不好;作业很赞,对有一定基础的人不难,但入门的同学可能还是有困难。如果只是想粗浅了解课程各个topic的,跟着做作业就不错,想深入还需自学

课程简介

Join the data revolution. Companies are searching for data scientists. This specialized field demands multiple skills not easy to obtain through conventional curricula. Introduce yourself to the basics of data science and leave armed with practical experience extracting value from big data.

课程标签

数据科学 数据挖掘 数据分析 数学模型 数据分析方法 数据革命 大数据 数据科学导论 NOSQL SQL 华盛顿大学 UW

83人关注该课程

主题相关的课程

Introduction to Computational Finance and Financial Econometrics 关注

Scientific Computing 关注

Algorithms: Design and Analysis, Part 1 关注

Passion Driven Statistics 关注

Mathematical Biostatistics Boot Camp 关注

Computing for Data Analysis 关注

Algorithms, Part II 关注

Linear and Integer Programming 关注

Data Management for Clinical Research 关注

Algorithms, Part I 关注