正确答案:A
22秋学期(高起本1709-2103、全层次2109-2103)《网络爬虫与信息提取》在线作业-00001
正确答案:B
试卷总分:100 得分:100
一、单选题 (共 20 道试题,共 40 分)
1.Python在Windows路径字符串左引号的左边加()符号来避免反斜杠问题
正确答案:C
A.s
B.c
C.d
D.r
正确答案:A
2.使用UI Automator获取屏幕上显示的文本内容的操作是得到相应控件后使用命令()
A.content
B.text
C.title
D.body
正确答案:D
3.Python中Object={1, 2, 3, 4, 5},则Objcet是()
A.集合
B.字典
C.列表
D.元组
正确答案:A
4.使用UI Automatorr让屏幕向左滚动的操作是得到相应控件后使用命令()
A.scroll.left
B.scroll.horiz.left
C.scroll.forward
D.scroll.horiz.forward
正确答案:B
5.chrome默认打开开发者工具的快捷是
A.F5
B.F11
C.F12
D.F2
正确答案:B
6.Python中把列表转换为集合需要使用##函数
A.set
B.list
C.convert
D.change
正确答案:C
7.Python中跳过本次循环应用关键字()
A.break
B.continue
C.exit
D.return
正确答案:A
正确答案:B
8.PyMongo中逻辑查询表示大于等于的符号是()
A.$gt
B.$lt
C.$gte
D.$lte
正确答案:A
9.PyMongo中逻辑查询表示小于的符号是()
A.$gt
B.$lt
C.$gte$$lte
10.可以通过()绕过网站登录。
A.session
B.cookies
C.moonpies
D.localstorage
正确答案:D
11.requests中post请求方法的使用为requests.post('网址', data=data)中的data为()
正确答案:C
A.列表
B.元组
C.字典
D.集合
正确答案:B
正确答案:D
正确答案:B
正确答案:D
12.在Linux中哪个命令是添加权限的()
A.chmod
B.sudo
正确答案:A
C.cp
D.mkdir
正确答案:B
13.在Scrapy的目录下,哪个文件负责存放爬虫文件?()
A.spiders文件夹
正确答案:A
B.item.py
C.pipeline.py
D.settings.py
正确答案:C
14.Python中退出循环应用关键字()
A.break
B.continue
C.exit
D.return
15.Python中专门用来处理图像的第三方库是
A.lxml
B.Pillow
C.beautifulsoup
D.pytesseract
正确答案:B
16.Python中Object={'obj_1':'1','obj_2':'2'},则Objcet.get('boj_1','3')是()
A.1
B.2
C.3
D.无输出
正确答案:B
17.使用UI Automatorr判断元素是否存在的操作是得到相应控件后使用命令()
A.exist
B.exists
C.isnull
D.contains
正确答案:B
21.使用UI Automator使屏幕向上滚动一屏的操作是得到相应控件后使用命令()
A.scroll_forwad
B.scroll_up
正确答案:B
C.scroll.forward
D.scroll.vert.forward
正确答案:C
19.如果使用Python的数据结构来做类比的话,MongoDB中文档相当于一个()
正确答案:B
A.列表
B.元组
C.字典
D.集合
20.当需要把Python里面的数据发送给网页时,应先将其转换成()
A.Json字符串
B.GET
C.POST
D.Request
正确答案:B
南开22秋学期《网络爬虫与信息提取》在线作业[答案]多选题答案
正确答案:B
二、多选题 (共 10 道试题,共 20 分)
21.Python中的容器有()
A.列表
B.元组
C.字典
D.集合
22.Python中()容器有推导式
A.列表
B.元组
C.字典
D.集合
23.MongoDB中获取名字为db的库的语句为()
正确答案:D
A.client.db
正确答案:B
B.client('db')
正确答案:D
C.client['db']
正确答案:C
D.client{'db'}
正确答案:C
24.以下HTTP状态码表示服务器本身发生错误的是
A.400
B.503
C.302
D.500
正确答案:A
25.cookies的缺点是
A.实现自动登录
B.跟踪用户状态
C.http中明文传输
D.增加http请求的流量
正确答案:B
26.requests中post请求方法的第二个参数可以为()
A.字典
B.列表
C.json数据
D.字符串
正确答案:A
27.以下哪些可以独立成为Python编译器()
A.Pycharm
B.IDLE
正确答案:A
C.Eclipse
D.Visual Studio 2010
正确答案:D
28.一个可行的自动更换代理的爬虫系统,应该下列哪些功能?
A.有一个小爬虫ProxySpider去各大代理网站爬取免费代理并验证,将可以使用的代理IP保存到数据库中
正确答案:D
B.在发现某个请求已经被设置过代理后,什么也不做,直接返回
C.在ProxyMiddlerware的process_request中,每次从数据库里面随机选择一条代理IP地址使用
正确答案:B
D.周期性验证数据库中的无效代理,及时将其删除
正确答案:D
29.HTTP常用状态码表明请求被正常处理的有()
A.200
B.301
C.302
D.204
正确答案:C
30.Python中一个函数可以有()个return语句
A.0
B.1
C.多个
D.2
正确答案:A
三、判断题 (共 20 道试题,共 40 分)
31.如果通过爬虫抓取某公司网站的公开数据,分析以后发现这个公司业绩非常好,于是买入该公司股票并赚了一笔钱。这是合法的。
32.一般来说在页面都通过GET将用户登录信息传递到服务器端。
33.MongoDB是一个关系数据库产品
正确答案:D
34.PyMongoDB中排序方法sort第二个参数-1表示升序
正确答案:C
35.Python正则表达式中“.*”是贪婪模式,获取最长的满足条件的字符串。
正确答案:C
36.上课传纸条。A要把纸条传给B,但是A与B距离太远,于是让C来转交纸条。此时,C先篡改纸条的内容再传给B,这是一种类似抓包的方式。
37.Charles是一个收费软件,如果没有注册,安装以后的前30天可以正常使用。30天以后,虽然功能不会缩水,但每过30分钟Charles会自动关闭一次
38.使用AJAX技术,可以在不刷新网页的情况下更新网页数据
39.Redis中使用lrange读取数据后数据也会删除
正确答案:D
40.Selenium必须加载对应的webdriver才能模拟浏览器访问
正确答案:B
41.Redis插入数据都是插入到列表右侧,因此读取数据也是从右侧读取
正确答案:D
42.Redis中查询列表长度命令llen中l代表left,即从左侧开始数
正确答案:D
43.Python中函数返回值的个数可以是多个
44.使用Charles直接抓取HTTPS的数据包,就会出现大量的Method为CONNECT的请求,但是这些请求又全部都会失败,是没有安装SSL证书导致的
正确答案:C
45.Python中元组生成以后还可以往里面继续添加数据,也可以从里面删除数据;
46.UI Automator Viewer与Python uiautomator可以同时使用