南开23秋学期(仅限-高起专1909、专升本1909)《网络爬虫与信息提取》在线作业[答案][答案]

作者:奥鹏作业答案 字体:[增加 减小] 来源:南开在线 时间:2023-11-16 08:33

23秋学期(仅限-高起专1909、专升本1909)《网络爬虫与信息提取》在线作业-00002 试卷总分:100 得分:100 一、单选题 (共 20 道试题,共 40 分) 1.当需要把Python里面的数据发送给网页时,应先将其转换成

南开23秋学期(仅限-高起专1909、专升本1909)《网络爬虫与信息提取》在线作业[答案][答案]

南开23秋学期仅限-高起1909专升本1909)《网络爬虫与信息提取》在线作业[答案]

正确答案:D

23秋学期仅限-高起专1909、专升本1909)《网络爬虫与信息提取》在线作业-00002

正确答案:A

试卷总分:100  得分:100

一、单选题 (共 20 道试题,共 40 分)

1.当需要把Python里面的数据发送给网页时,应先将其转换成()

A.Json字符串

B.GET

C.POST

D.Request

正确答案:B

 

2.Scrapy中使用Xpath获得的结果调用了.extract方法,结果以()形式生成

A.列表

B.元组

C.字典

D.集合

正确答案:A

正确答案:C

正确答案:C

正确答案:B

正确答案:C

正确答案:B

正确答案:A

 

3.Python中Object={'obj_1':'1','obj_2':'2'},则Objcet是()

A.列表

B.元组

C.字典

D.集合

 

4.当需要把Python里面的数据发送给网页时,需要先转换成()字符串

A.Python

B.Json

C.正则表达式

D.Ajax

正确答案:D

 

5.Python正则表达式模块的findall方法提取内容包含多个,则返回结果的列表中会包含()

正确答案:D

A.列表

B.元组

C.字典

D.集合

 

6.HTTP常用状态码表明服务器不允许访问那个资源的是()

A.500

B.503

C.403

D.405

正确答案:A

 

7.Python中退出循环应用关键字()

A.break

B.continue

C.exit

D.return

正确答案:D

 

8.使用python定制mitmproxy,下面的语句请求的是()。{req.headers["User-Agent"]}

正确答案:C

A.headers

正确答案:B

B.文本内容

C.目标网站

D.user-agent

正确答案:D

 

9.requests中post请求方法的使用为requests.post('网址', data=data)中的data为()

正确答案:B

A.列表

B.元组

C.字典

D.集合

 

10.在Scrapy的目录下,哪个文件负责存放爬虫的各种配置信息?()

A.spiders文件夹

正确答案:B

B.item.py

C.pipeline.py

D.settings.py

正确答案:A

 

11.通常使用()工具来模拟浏览器进行爬虫请求

A.Selenium

B.Chrome

C.ChromeDriver

正确答案:D

D.WebDriver

正确答案:C

 

12.当爬虫运行到yield scrapy.Request()或者yield item的时候,下列哪个爬虫中间件的方法被调用?

正确答案:C

A.process_spider_output()

正确答案:A

B.process_spider_exception()

正确答案:C

C.process_spider_input()

正确答案:A

D.process_start_ requests()

正确答案:B

 

13.下面代码一共执行循环多少次(): i=0 while i<10: i+=1

A.9

B.10

C.11#0

 

14.使用UI Automator获滚动屏幕的操作是得到相应控件后使用命令()

A.scroll

B.scroll_up

C.scroll_forword

D.scroll_back

正确答案:C

 

15.某些网站在发起Ajax请求时会携带()字符串用于身份验证

A.Token

B.Cookie

C.ReqTime

D.sum

正确答案:B

 

16.Python中以下哪个容器里的元素不能重复()

A.列表

B.元组

C.字典

D.集合

 

17.Python操作CSV文件可通过()容器的方式操作单元格

A.列表

B.元组

C.字典

D.集合

 

21.以下哪个命令是利用URL语法在命令行下工作的文件传输工具()

A.curl

B.tar -zxvf

C.mkdir

正确答案:B

D.cp

正确答案:D

 

19.Python中若定义object="12345",则print(object[::-1])输出()

A.1

B.5

C.54321

D.程序报错

正确答案:A

 

20.在Mac OS下安装MongoDB使用命令() install mongodb

正确答案:B

正确答案:A

A.brew

B.apt-get

C.sudo

正确答案:D

D.apt

正确答案:C

 

南开23秋学期(仅限-高起专1909、专升本1909)《网络爬虫与信息提取》在线作业[答案]多选题答案

正确答案:D

二、多选题 (共 10 道试题,共 20 分)

21.网络爬虫的用途有()

A.收集数据

B.尽职调查

C.提高流量

D.攻击服务器

正确答案:C

 

22.以下HTTP状态码表示服务器没有正常返回结果的是

A.200

B.301

C.404

D.500

正确答案:B

 

23.requests中post请求方法的第二个参数可以为()

A.字典

B.列表

C.json数据

D.字符串

正确答案:B

 

24.HTTP常用状态码表明表明服务器本身发生错误的有()

A.403

B.404

C.500

D.503

正确答案:B

 

25.MongoDB中获取名字为db的库的语句为()

正确答案:C

A.client.db

B.client('db')

正确答案:D

C.client['db']

正确答案:B

D.client{'db'}

正确答案:C

 

26.使用BeautifulSoup对象后可以使用()来查找内容

A.find_all

正确答案:C

B.find

C.search

正确答案:D

D.search_all

正确答案:D

 

27.Python中的容器有()

A.列表

B.元组

C.字典

D.集合

 

28.PyMongo删除操作有()

A.delete

正确答案:A

B.delete_all

正确答案:D

C.delete_one

正确答案:B

D.delete_many

正确答案:B

 

29.PyMongo更新操作有()

A.update

正确答案:C

B.update_all

正确答案:B

C.update_one

正确答案:C

D.update_many

正确答案:C

 

30.Redis中的值可以支持()

正确答案:B

A.列表

B.哈希

C.集合

D.有序集合

正确答案:D

 

三、判断题 (共 20 道试题,共 40 分)

31.使用UI Automatorr操作实体键的命令为device.press.实体按键名称()

正确答案:D

 

32.当Charles抓包以后,在Mac OS系统下可以按Command+F组合键,在Windows系统下按Ctrl+F组合键打开Charles进行搜索

正确答案:C

 

33.XPath提取出来的内容是一个SelectorList对象,它的第0个元素就是网页的源代码。

 

34.Python中写CSV文件的writerow方法参数为包含字典的列表类型

 

35.Python中相比于findall方法,search方法对于从超级大的文本里面只找第1个数据特别有用,可以大大提高程序的运行效率。

正确答案:C

 

36.process_spider_output(response, result, output)是在下载器中间件处理完成后,马上要进入某个回调函数parse_xxx()前调用

正确答案:C

 

37.Redis中写数据命令lpush中l代表list

正确答案:A

 

38.为了保证数据插入效率,在内存允许的情况下,应该一次性把数据读入内存,尽量减少对MongoDB的读取操作。

正确答案:B

 

39.HTTP状态码503表示服务器内部故障。

 

40.Robo 3T与RoboMongo是完全不一样的软件

 

41.使用AJAX技术,可以在不刷新网页的情况下更新网页数据

 

42.Python中条件语句在使用and连接的多个表达式中,只要有一个表达式不为真,那么后面的表达式就不会执行。

正确答案:C

 

43.UI Automator Viewer与Python uiautomator可以同时使用

 

44.在默认情况下,Scrapyd可以从外网访问

正确答案:D

 

45.需要实名认证的打码网站更加安全可靠。

 

46.requests中post请求方法的使用为requests.post('网址', data=data)

正确答案:D

 

47.HTTP状态码中303状态码明确表示客户端应当采用POST方法获取资源

 

48.自己能查看的数据,允许擅自拿给第三方查看

 

49.chrome开发者工具没法对数据进行搜索。如果想知道一个特定的异步加载内容来自哪个请求,必须在“Network”选项卡里面一个请求一个请求地进行查看.

正确答案:D

 

50.在请求头中设置User-Agent即可正常请求网站

南开23秋学期(仅限-高起专1909、专升本1909)《网络爬虫与信息提取》在线作业[答案]历年参考题目如下:







南开23秋学期(仅限-高起专1909、专升本1909)《网络爬虫与信息提取》在线作业[答案][答案]相关练习题:
车场的必备设备包括()

哪一方面的自由是伏尔泰不大关注的?

“不知为什么大家都饿得那样精瘦,唯独张国焘却养得那样肥胖。但这样一个大块头却装得软绵绵的,他的声音、笑貌、动作都使你感到虚伪。他讲话时,微微弯一点腰,装腔作势,把两手合在胸前,皮笑肉不笑,而每句话拖得长长的尾音,露出他的傲慢。”这段文字的描写属( )

套期保值者是指那些把期货市场当作转移价格风险的场所,利用期货合约的买卖,对其现在已拥有或将来会拥有的金融资产的价格进行保值的法人和个人。

下列哪些位置可以修改Photoshop插值运算的方式( )。

服务是各层向它的上层提供的一组原语,协议是定义同层对等实体之间交换的帧、分组和报文格式及意义的一组规则。

容积型压缩机中,气体压力的提高是由于气体分子的运动速度转化的结果。

外界对存储器的控制信号包括下列的()。

S7-200共有4个32位的累加器。

现行成本法是建立在()变动的基础上的

第三方物流的整合策略分为( )。

金属可以与酸反应,非金属不与酸反应。 ( )

()是指对同一教学内容,在不同时间、不同情境下,为不同的教学目的,用不同的方式呈现,从而使学生获得对同一事物或同一问题的多方面的认知和理解。

9、战略管理的主体是()。

新巴塞尔协议的三大支柱有( )。

航空公司这样的高固定成本、低变动成本的服务企业适宜采用收益管理

Scala 配备了一种表现型的系统,它以静态的方式进行抽象,以安全和连贯的方式进行使用。

Most of us require an environment( )outside distraction.

知识的特性包括()

我国法律规定,依法转让用材林、经济林、薪炭林的使用权的限制条件之一是()

在“建安纪年以来,犹未十稔”中,“稔”之义为:

一般填土的压实方法有( )

所谓测量就是对所确定的研究内容或调查指标进行有效的观测与量度。

下面关于数组的初始化正确的是()。

能与青霉素结合蛋白结合, 阻止胞壁肽聚糖最终合成的是

“紧紧拉着哥哥的袖……只盼你哥哥早回家门口”是出自歌曲()。

德国大部分普通幼儿园都按年龄分班。

 公务员职务中非领导职务序列包括 ____。

 新蓄电池的实际容量与其额定容量之差超过某一期限时则应报废

当前,反腐败斗争已经取得完全胜利。

作业咨询:
点击这里给我发消息

论文咨询:
点击这里给我发消息

合作加盟:
点击这里给我发消息

服务时间:
8:30-24:00(工作日)

Baidu
map