开始时间: 12/21/2023 持续时间: 6 weeks of study, 2-4 hours/week
所在平台: Coursera |
课程主页: https://www.coursera.org/learn/python-network-data
课程评论:没有评论
课程名称:使用Python访问网络数据 概述:本课程将展示如何将互联网视为数据来源。我们将学习如何抓取、解析和读取网络数据,以及如何使用网络API访问数据。课程中将涉及Python中的HTML、XML和JSON数据格式。本课程涵盖《Python for Everybody》教材的第11至13章。要成功完成本课程,您应熟悉教材第1至10章的内容以及本专业化的前两门课程,这些主题包括变量与表达式、条件执行(循环、分支和try/except)、函数、Python数据结构(字符串、列表、字典和元组)和文件处理。本课程使用Python 3。 课程大纲: 1. **入门:** 在本节中,您将安装Python和文本编辑器。在之前的专业课程中,此项任务为可选,但在本课程中是开始的必要要求。之后,我们将停止使用基于浏览器的Python评分环境,因为该环境(Skulpt)无法运行本课程中将开发的更复杂的程序。 2. **正则表达式(第11章):** 正则表达式是一种非常专业的语言,允许我们简洁地搜索字符串并从中提取数据。虽然并非必需完全掌握正则表达式的使用,但它们在处理字符串时非常有用且强大。 3. **网络与套接字(第12章):** 本节我们将学习网络浏览器用来检索文档的协议,以及Web应用程序与应用程序接口(API)互动所用的协议。 4. **网络爬虫程序(第12章):** 本节中我们将学习如何使用Python从网站和API中检索数据。 5. **Web服务与XML(第13章):** 本节我们将学习如何检索和解析XML(可扩展标记语言)数据。 6. **JSON与REST架构(第13章):** 在此模块中,我们将使用JavaScript对象表示法(JSON)数据格式与应用程序接口/ Web服务进行操作。 本课程将为您的网络数据访问和处理能力提供坚实基础,助您在数据科学和编程领域更进一步。
Name:Getting Started
Description:In this section you will install Python and a text editor. In previous classes in the specialization this was an optional assignment, but in this class it is the first requirement to get started. From this point forward we will stop using the browser-based Python grading environment because the browser-based Python environment (Skulpt) is not capable of running the more complex programs we will be developing in this class.
Name:Regular Expressions (Chapter 11)
Description:Regular expressions are a very specialized language that allow us to succinctly search strings and extract data from strings. Regular expressions are a language unto themselves. It is not essential to know how to use regular expressions, but they can be quite useful and powerful.
Name:Networks and Sockets (Chapter 12)
Description:In this section we learn about the protocols that web browsers use to retrieve documents and web applications use to interact with Application Program Interfaces (APIs).
Name:Programs that Surf the Web (Chapter 12)
Description:In this section we learn to use Python to retrieve data from web sites and APIs over the Internet.
Name:Web Services and XML (Chapter 13)
Description:In this section, we learn how to retrieve and parse XML (eXtensible Markup Language) data.
Name:JSON and the REST Architecture (Chapter 13)
Description:In this module, we work with Application Program Interfaces / Web Services using the JavaScript Object Notation (JSON) data format.
# 在Coursera上学习Python以获取网络数据 — 课程推荐 随着科技的不断发展,数据已经成为推动各行各业进步的重要力量。而网络,作为一个巨大的数据源,提供了丰富的信息供我们挖掘。今天,我想向大家推荐一个出色的Coursera课程——《Using Python to Access Web Data》。如果你希望掌握如何利用Python从网络获取数据,这门课程将是你不可错过的选择。 ## 课程概述 《Using Python to Access Web Data》这门课程,旨在教会学员如何将互联网视为一个有效的数据来源。课程内容涵盖了网络数据的抓取、解析与读取,同时还涉及如何使用网络API访问数据。学员将接触到 HTML、XML 和 JSON 等数据格式,并在Python中进行实际操作。要顺利完成本课程,学员需具备教材《Python for Everybody》一至十章的相关知识,以及本专业的前两门课程的基础,包括变量与表达式、条件执行(循环、分支、异常处理)、函数、Python数据结构(字符串、列表、字典和元组)以及文件操作等内容。本课程使用的是Python 3。 ## 课程大纲 ### 1. 初步准备 在这一部分,你将安装Python和文本编辑器。在之前的课程中,这只是一个可选的任务,但在本课程中,它是入门的必备要求。从这一时刻起,我们将不再使用基于浏览器的Python评分环境,因为在这门课中,我们将开发一些更复杂的程序。 ### 2. 正则表达式(第11章) 正则表达式是一种特殊的语言,能够帮助我们简洁地搜索字符串并从中提取数据。掌握正则表达式并非必需,但它们在处理字符串数据时极为有用和强大。 ### 3. 网络与套接字(第12章) 在这一部分,我们将学习网络浏览器如何使用协议来检索文档,以及Web应用程序如何与应用程序接口(API)进行交互。 ### 4. 用于网络浏览的程序(第12章) 本部分将教你如何使用Python从网站和API中检索数据,帮助你建构具备网络交互能力的Python程序。 ### 5. Web服务与XML(第13章) 在这一部分,我们学习如何获取和解析XML(可扩展标记语言)数据,掌握机器与机器之间通信的基础。 ### 6. JSON与REST架构(第13章) 最后一部分,我们将使用JavaScript对象表示法(JSON)数据格式来处理应用程序接口/网络服务,为实现现代Web应用打下基础。 ## 小结与推荐 总的来说,《Using Python to Access Web Data》是一门高质量的课程,适合希望深入理解网络数据获取的初学者和进阶者。通过系统学习正则表达式、网络协议、XML与JSON等知识,大家将能够熟练掌握从任何网页或API抓取数据的技能。 如果你对数据科学、网络爬虫或者后端开发感兴趣,这门课程无疑能够为你提供丰富的知识储备与实战经验。而且,Coursera的学习方式相对灵活,能够让每个人都能根据自己的节奏进行学习。 推荐大家前往[Coursera](https://www.coursera.org)注册并报名参加这门课程,开启你的网络数据探索之旅吧!希望大家能够在课程中收获满满,运用所学知识,开启未来职业的无限可能。