《Python程序设计与数据采集》教学大纲

发表时间:2024-06-03 19:45:48 来源:节能开发案例

  配套教材:董付国著,《Python程序设计与数据采集(微课版)》,ISBN:978-7-115-61183-3,人民邮电出版社,2023年5月出版

  配套资源:教学大纲、电子教案、课件、源码、数据文件、章节习题及答案、25小时微课、在线练习与考试系统

  2)熟练使用Python的函数式编程模式,能够编写出优雅的Python程序;

  3)熟练运用Python内置函数与运算符、列表、元组、字典、集合、字符串等基本数据类型以及推导式、切片、序列解包等语法来解决实际问题;

  4)熟练掌握Python选择结构、循环结构、异常处理结构的语法和应用,能够编写鲁棒性较强的程序;

  6)熟练使用字符串对象方法和运算符、内置函数、部分标准库函数和扩展库对字符串的操作;

  7)熟练掌握文本文件与常见类型的二进制文件操作,熟练掌握文件夹遍历的方法;

  8)熟练掌握从文本文件、Word文件、Excel文件、PowerPoint文件、PDF文件、图像文件、音频文件、视频文件等不一样文件中采集数据的技术;

  9)熟练掌握从麦克风、扬声器、摄像头、温度湿度传感器等不一样设备中采集数据的技术;

  12)具有一定的代码调试与集成能力,具有较强的学习能力、资料查阅能力和代码阅读能力,具有一定的代码优化与安全编程意识和能力。

  Python编程模式中很重要的一条是代码要优雅、简洁、直观。除了保证功能正确和适当优化之外,同时还应保证代码具有较强的可读性和可维护性。

  在教学过程中需要非常注意的是,不可以使用其他编程语言的思维去理解和使用Python,不要在Python程序中带有其他编程语言的痕迹,要尽量从最简单的角度去思考和解决实际问题、实现自身的想法和思路,保证代码的优雅、简洁,让代码更加Pythonic。

  Python是以快速处理问题为目的的编程语言,教学过程中不建议在语言细节和内置对象、标准库对象实现原理上花费太多时间,尤其不要纠结内存管理的问题。使用Python编程处理问题应充分借鉴和使用成熟的内置对象、标准库对象和扩展库对象,尽可能的避免自主编写完整的业务逻辑,部分具体操作可完全使用扩展库来实现,大幅度提升开发效率,在开发速度和工作速度之间达到最佳平衡。例如,若需要进行排序则直接用内置函数sorted或列表的sort办法来进行排序,切不可再使用选择法排序、冒泡法排序、快速排序算法或堆排序等排序算法来编写代码实现;如果要测试一段代码的运行时间,应使用标准库time或timeit中的有关函数;要测试一个年份是否为闰年,应使用calendar标准库中的isleap函数;词频统计推荐使用标准库collections中的Counter类;组合、排列推荐使用标准库itertools中的combinations和permutations函数;要进行编写爬虫程序,建议使用标准库urllib或扩展库requests、bs4、scrapy;中文分词推荐使用扩展库jieba;拼音处理推荐使用pypinyin;视频处理推荐使用moviepy。

  授课过程中,应把主要精力放在处理问题的代码实现原理和调试分析上。例如,讲解操作docx格式文件的案例时应讲清楚Word和WPS这两个软件创建的文件内部实现有啥不一样的区别,然后再讲解代码,要让学生理解为何需要这样写。在讲解网络爬虫程序时,要让学生理解程序代码和网页源代码之间的对应关系,以及网页源代码发生改变时如何修改爬虫程序代码,采集另一个同类网站的数据时如何修改爬虫程序代码。讲解所有案例时,尽量不给学生源码,而是让学生自己输入代码运行程序,发生错误时引导学生阅读提示信息、定位错误位置、修改代码,让学生充分思考。

  教学内容:安装Python官方解释器和开发环境IDLE,IDLE交互模式和程序模式的使用,在IDLE中运行程序的方式。

  教学内容:内置模块、标准库、扩展库的基本概念,在线、离线安装扩展库,安装扩展库过程中的普遍的问题与解决方法。

  教学内容:缩进,空行与空格,标识符命名,续行,注释,对象导入,代码优化。

  教学内容:整数、实数、复数、列表、元组、字典、集合、字符串、函数等基本概念与简单使用。

  教学内容:算术运算符、关系运算符、成员测试运算符、集合运算符、逻辑运算符、下标运算符与属性访问运算符、赋值运算符,功能与语法。

  教学内容:单分支选择结构、双分支选择结构、多分支选择结构、嵌套选择结构的语法与应用。

  教学重点:else关键字的应用场景,使用for循环遍历可迭代对象,break语句对循环结构执行流程的影响。

  思政元素:避免让异常暴露在终端用户面前,没有被处理的异常应转换为提示信息告诉用户接下来该如何做,避免给终端用户造成困扰。注重高效沟通。

  教学内容:列表创建与删除、列表元素访问、列表常用方法、列表对象支持的运算符、内置函数对列表的操作,列表推导式语法与应用,使用切片访问列表、元组、字符串中部分元素。

  教学内容:元组创建、元组方法与常用操作、元组与列表的区别、生成器表达式语法。

  教学难点:元组的元素数量和引用不可变,生成器对象具有惰性求值的特点,生成器对象中的每个值只可以使用一次。

  教学重点:等号左侧变量的数量和等号右侧值得数量必须相同,且所有变量的赋值是一起进行的。

  习题:填空题1~5、13、14,选择题2、3、6、7、10、11、12,判断题1~5、7、8、15

  习题:填空题6~12、15,选择题1、4、5、8、9、13、14、15,判断题6、9~14

  教学内容:函数定义与调用基本语法、递归函数定义与调用、函数嵌套定义与调用,实参与形参的概念。

  教学重点:几种形式的函数参数传递方式,调用函数时是把实参的引用传递给形参。

  思政元素:在例7-4的演示字符串中使用“雾锁山头山锁雾”类似的回文,引导学生发现中文的美与博大精深;讲解例7-9的秦九韶算法时,适当展开介绍我国古代和现代的成就。

  教学内容:内置函数open、文件对象常用方法、上下文管理语句with、文本文件操作例题解析。

  教学重点:内置函数open的参数file、mode和encoding,读写文件内容时会自动修改文件指针的位置,使用关键字with管理文件对象的用法。

  习题:填空题1~4,选择题1、2、3、7、8、9,判断题1~7,程序设计题1

  教学内容:标准库os、os.path、shutil中的常用成员、文件夹操作例题解析。

  教学内容:Word、Excel、PowerPoint、PDF等不一样文件内容的读取,采集需要的数据。

  习题:填空题17,选择题4、5、6,判断题8、9、10,程序设计题3、4

  教学内容:从图像文件、音频文件、视频文件等不一样的多媒体文件中采集数据。

  教学内容:从麦克风、扬声器、摄像头、温度湿度传感器等不一样的设备中采集数据。

  教学内容:转换Python函数为SQL函数的方法,Connection对象、Cursor对象的用法,执行SQL语句的不同方法,为SQL语句传递参数的不同形式。

  教学内容:查询数据库中用户表记录数量,从数据库中导出数据并写入Excel文件,数据库备份。

  教学内容:常用HTML标签含义,网页源代码阅读方式,动态网页提交参数方式GET和POST的区别。

  教学重点:网页源代码阅读方式,动态网页提交参数方式GET和POST的区别。

  教学内容:正则表达式基本语法,常用正则表达式元字符含义,标准库re常用函数功能和语法,使用urllib读取网页源代码,使用正则表达式采集指定内容,常见反爬机制与对抗。

  教学重点:使用urllib读取网页源代码,使用正则表达式采集指定内容,常见反爬机制与对抗。

  思政元素:告诫学生不可滥用爬虫技术,举例说明滥用的难以处理的后果。尊重知识产权,遵守职业道德和行业规范,不滥用技术。《刑法》第二百一十七条,《刑法》第二百五十三条。

  习题:填空题1~5,选择题1、2、14、15,判断题3~8、23,简答题2,程序设计题1

  教学内容:使用扩展库requests读取网页源代码,使用扩展库bs4提取网页源代码中的指定内容。

  教学内容:使用扩展库Scrapy编写爬虫项目,采集网页源代码,XPath选择器与CSS选择器语法。

  1.董付国.《Python程序设计与数据采集》(ISBN:33),人民邮电出版社,2023.5

  2.董付国.《Python程序设计实验指导书》(ISBN:90),清华大学出版社

  ,在公众号后台发送消息“大事记”能查看董付国老师与Python有关的重要事件;发送消息“

  ”能查看董付国老师出版的Python系列教材(已累计印刷超过180次)的适用专业详情;发送消息“历史文章”能查看董付国老师推送的超过1300篇原创技术文章;发送消息“会议”能查看近期董付国老师的培训安排;发送消息“微课”能查看董付国老师免费分享的超过700节Python微课视频;发送消息“课件”可以查看董付国老师免费分享的Python教学资源;发送消息“小屋刷题”可以下载“Python小屋刷题神器”,免费练习2435道客观题和648道编程题,题库持续更新;发送消息“编程比赛”了解Python小屋编程大赛详情。返回搜狐,查看更多责任编辑:

  平台声明:该文观点仅代表作者本人,搜狐号系信息发布平台,搜狐仅提供信息存储空间服务。


上一篇: 中国工业软件产业高质量发展大势与突破方向 下一篇: 关于政协第十四届全国委员会第二次会议第02997号(农业水利类217号)提案答复函的摘要