人工智能训练师职业技能竞赛题库及答案 (公开题目)

发布日期:2025-10-17

 

一、单选题

1、人工智能的定义是什么?

A、计算机模拟人类智能的技术

B、机器能够独立思考和学习

C、使机器具备人类的情感和意识

D、利用机器进行科学研究的方法

正确答案:A

2、以下哪种技术不属于人工智能?

A、机器学习

B、自然语言处理

C、数据挖掘

D、云计算

正确答案:D

3、人工智能中的“机器学习”是指什么?

A、让机器可以像人类一样学习知识

B、通过算法让机器从数据中学习和改进

C、让机器具备自主学习能力

D、通过神经网络让机器学习

正确答案:B

4、人工智能中的“深度学习”是指什么?

A、一种特殊的机器学习算法

B、让机器可以进行深度思考的能力

C、通过模拟人脑神经网络的方式进行学习

D、让机器可以进行复杂问题的推理和决策

正确答案:C

5、以下哪个不是人工智能应用的例子?

A、语音助手

B、机器人导游

C、自动驾驶汽车

D、手机游戏

正确答案:D

6、人工智能中的“自然语言处理”是指什么?

A、让机器可以理解和处理人类的自然语言

B、让机器能够像人类一样进行语音交流

C、利用机器进行语言学研究的方法

D、让机器能够进行自动翻译

正确答案:A

7、人工智能中的“计算机视觉”是指什么?

A、让机器可以理解和处理图像和视频

B、让机器能够像人类一样进行视觉感知

C、让机器可以进行图像识别和分析

D、利用机器进行图像处理和图像生成的技术

正确答案:C

8、以下哪个不是人工智能的伦理问题?

A、隐私保护

B、自主决策

C、就业岗位流失

D、网络安全

正确答案:D

9、人工智能的发展会对社会产生哪些影响?

A、提高生产效率和经济发展

B、减少人类工作岗位

C、改变人类生活方式和社会结构

D、所有选项都正确

正确答案:D

10、人工智能的未来发展方向包括以下哪些?

A、强化学习

B、量子计算

C、多模态学习

D、所有选项都正确

正确答案:D

11、人工智能的历史可以追溯到哪个时期?

A、20世纪50年代

B、19世纪80年代

C、21世纪90年代

D、18世纪30年代

正确答案:A

12、以下哪个不是人工智能的子领域?

A、机器学习

B、自动化

C、计算机视觉

D、自然语言处理

正确答案:B

13、人工智能中的“强化学习”是指什么?

A、让机器具备自主决策能力

B、通过奖惩机制让机器学习最优策略

C、利用神经网络进行学习和决策

D、让机器能够进行复杂问题的推理和决策

正确答案:B

14、以下哪个不是人工智能中常用的算法?

A、决策树

B、朴素贝叶斯

C、深度学习

D、遗传算法

正确答案:D

15、人工智能中的“机器人”是指什么?

A、一种可以执行任务的机器设备

B、一种具备智能和意识的机器

C、一种可以进行复杂推理的机器

D、一种可以进行学习和决策的机器

正确答案:A

16、人工智能中的“专家系统”是指什么?

A、一种可以模拟人类专家知识的系统

B、一种可以进行自主学习的系统

C、一种可以进行复杂推理的系统

D、一种可以进行图像识别的系统

正确答案:A

17、人工智能中的“语音识别”是指什么?

A、让机器能够理解和识别人类的语音

B、让机器能够进行语音合成

C、让机器能够进行语音翻译

D、让机器能够进行自动语音识别

正确答案:D

18、机器学习是一种:

A、人工智能技术

B、数据分析方法

C、编程语言

D、机械工程技术

正确答案:A

19、在机器学习中,监督学习是指:

A、机器通过观察数据自主学习

B、机器根据给定的数据和标签进行学习

C、机器通过交互式学习改进自身性能

D、机器根据强化学习算法进行学习

正确答案:B

20、以下哪项不是机器学习的主要任务?

A、分类

B、聚类

C、回归

D、排序

正确答案:D

21、机器学习的一个常见应用是:

A、语音识别

B、图像处理

C、自然语言处理

D、所有上述

正确答案:D

22、以下哪项不是机器学习中的评估指标?

A、准确率

B、精确率

C、召回率

D、速度

正确答案:D

23、什么是过拟合(Overfitting)?

A、模型在训练集上表现良好,但在测试集上表现差

B、模型在训练集上表现差,但在测试集上表现良好

C、模型对新数据的泛化能力强

D、模型对新数据的泛化能力弱

正确答案:A

24、以下哪种算法不属于监督学习算法?

A、决策树

B、支持向量机

C、K均值聚类

D、神经网络

正确答案:C

25、什么是梯度下降(GradientDescent)?

A、一种优化算法,用于最小化损失函数

B、一种分类算法,用于处理非线性数据

C、一种数据预处理技术,用于降低数据维度

D、一种特征选择方法,用于选择最相关的特征

正确答案:A

26、智慧医疗的发展目前不受哪些因素影响

A、缺少复合型人才

B、用户隐私数据安全问题

C、医学水平不够

D、市场主需求量不足以带动发展

正确答案:C

27、人工智能核心技术体系不包括以下哪个层面()

A、通用技术层

B、中间层

C、应用技术层

D、基础技术层

正确答案:B

28、机器学习的流程包括:分析案例、数据获取、()和模型验证这四个过程

A、数据清洗

B、数据分析

C、模型训练

D、模型搭建

正确答案:C

29、机器翻译属于下列哪个领域的应用()

A、自然语言系统

B、机器学习

C、专家系统

D、人类感官模拟

正确答案:A

30、为了解决如何模拟人类的感性思维,例如视觉理解、直觉思维、悟性等,研究者找到一个重要的信息处理的机制是()

A、专家系统

B、人工神经网络

C、模式识别

D、智能代理

正确答案:B

31、下面关于函数说法错误的是()

A、函数的三要素是函数名、参数和返回值,定义函数时参数和返回值不是必须的

B、如果没有return语句,则Python函数默认返回值为None

C、函数不可以嵌套

D、使用def定义函数

正确答案:C

32、关于函数参数传递中,形参与实参的描述错误的是()

A、实参与形参分别存储在各自的内存空间中,是两个不相关的独立变量

B、Python实行按值传递参数。值传递指调用函数时将常量或变量的值传递给函数的参数

C、实参与形参的名字可以相同,也可以不同

D、在函数内部改变形参的值时,实参的值也会改变的

正确答案:D

33、已知列表对象ls,哪个选项对ls.append(x)的描述是正确的()

A、x不能是一个列表对象

B、只能向列表ls最后增加一个元素x

C、向列表ls最前面增加一个元素x

D、替换列表ls最后一个元素为x

正确答案:B

34、专家系统中知识库的知识可以获取的来源是

A、领域专家

B、专家系统的用户

C、计算机系统管理员

D、专家系统程序的开发者

正确答案:A

35、关于Python的列表,以下选项中描述错误的是

A、Python列表的长度不可变

B、Python列表是一个可以修改数据项的序列类型

C、Python列表用中括号[]表示

D、Python列表是包含0个或者多个对象引用的有序序列

正确答案:A

36、下列选项不属于专家系统底层核心部分的是

A、知识库

B、推理机

C、规则库

D、决策树

正确答案:D

37、如果问题存在最优解,则下面几种搜索算法中,()必然可以得到该最优解

A、广度优先搜索

B、深度优先搜索

C、有界深度优先搜索

D、启发式搜索

正确答案:A

38、研究某超市销售记录数据后发现,买啤酒的人很大概率也会购买尿布,这种属于数据挖掘的那类问题

A、关联规则发现

B、聚类

C、分类

D、自然语言处理

正确答案:A

39、关于Python的字典类型,以下选项中描述错误的是()

A、用{}标识,以key:value的形式存储数据

B、字典当中的元素是通过键(key)来存取的,而不是通过索引去取值

C、字典的元素是键值对,键(key)必须使用不可变类型

D、同一个字典中,键(key)不是唯一的

正确答案:D

40、关于Python的字典类型,以下选项中描述正确的是()

A、通过def函数创建字典

B、键值对之间以分号分隔

C、如果通过get(key)函数获取值:key不存在返回None

D、如果通过dict['key']获取值:key不存在不会报错

正确答案:C

41、专家系统的发展趋势不包括

A、知识库变大

B、推理引擎更加专用

C、用户接口更多样

D、用户需求量减少

正确答案:D

42、BP神经网络模型拓扑结构不包括

A、输入层

B、隐层

C、翰出层

 D、显层

 正确答案:D

43、机器学习研究如何通过计算的手段,利用经验来改善系统自身的性能,请问机器学习利用数据训练出什么

 A、模型

 B、表结构

 C、结果

 D、报表

 正确答案:A

44、BP神经网络的学习规则是

 A、梯度上升法

 B、梯度下降法

 C、梯度提升法

 D、梯度曲线法

 正确答案:B

45、关于Python的元组类型,以下选项中描述错误的是()

 A、元组中元素不可以是不同类型

 B、元组一旦创建就不能被修改

 C、Python中元组采用逗号和圆括号(可选)来表示

 D、一个元组可以作为另一个元组的元素,可以采用多级索引获取信息

 正确答案:A

46、关于Python的元组类型,以下选项中描述正确的是()

 A、不可以索引取值

 B、可以切片操作

 C、元祖是可变序列

 D、使用中括号包裹元素

 正确答案:B

 47、机器学习的实质在于

 A、找

 B、想

 C、判断

 D、理解

 正确答案:A

 48、一个机器学习系统的基本结构不包括以下那个

 A、感知

 B、学习

 C、环境

 D、知识库

 正确答案:A

 49、所谓不确定性推理就是从()的初始证据出发,通过运用()的知识,最终推出具有一定程度的不确定性但却是合理或者近乎合理的结论的思维过程

 A、不确定性,不确定性

 B、确定性,确定性

 C、确定性,不确定性

 D、不确定性确定性

 正确答案:A

 50、机器通过人类发现的问题空间的数据,进行机器学习,具有在人类发现的问题空间中求解的能力,并且求解的过程与结果可以被人类智能(),此为机器智能的产生

 A、理解

 B、参考

 C、相同

 D、采纳

 正确答案:A

 51、第一个成功应用的专家系统是

 A、ELIZA

 B、Dendral

 C、Xcon

 D、Deppepblue

 正确答案:B

 52、对抗学习中两个网络互相竞争,一个负责生成样本,另一个负责

 A、判别样本

 B、计算样本

 C、统计样本

 D、生成样本

 正确答案:A

 53、影响深度卷积神经网络算法的关键参数是

 A、网站数量

 B、网络深度

 C、网络结构

 D、网络主体

 正确答案:B

 54、深度学习的实质是

 A、推理机制

 B、映射机制

 C、识别机制

 D、模拟机制

 正确答案:B

 55、在深度优先策略中,open表是()的数据结构

 A、先进先出

 B、先进后出

 C、根据估价函数值重排

 D、随机出

 正确答案:B

 56、归纳推理是()推理

 A、从一般到个别

 B、从个别到一般

 C、从个别到个别

 D、从一般到一般

 正确答案:B

 57、JSON对象结构以””开始,以””结束

 A、{}

 B、()

 C、[]

 D、<>

 正确答案:A

 58、JSON对象关键字和值之间以””分隔

 A、/

 B、,

 C、:

 D、.

 正确答案:C

59、JSON数组结构以””开始,””结束

A、{}

B、()

C、()

D、<>

正确答案:C

60、XML格式的文件由组成

A、属性

B、标签对

C、键值对

D、逗号分隔的字符串

正确答案:B

61、如下关于XML格式的文件,哪一个不是真的

A、属性必须加引号

B、不区分大小写字母

C、有根元素

D、有关闭标签

正确答案:B

62、ExecutableFile是由执行的

A、用户程序

B、应用程序

C、虚拟机

D、操作系统

正确答案:D

63、CSV文件

A、开头不留空不含列名

B、一行数据可跨行

C、用半角引号将字段值包含起来

D、一行数据里用冒号隔开

正确答案:A

64、文本编码类型不可为

A、ASCII

B、Unicode

C、FLV

D、UTF-8

正确答案:C

65、在同一台计算机中,内存和外存存取速度

A、看情况

B、一样快

C、内存快

D、外存快

正确答案:C

66、32位微处理器中的32表示的技术指标是

A、速度

B、字长

C、内存个数

D、接口数

正确答案:B

67、Labelme不能对图像进行标注

A、多边形

B、曲线

C、矩形

D、多段线

正确答案:B

68、Labelme以文件存储标注信息

A、XML

B、CSV

C、TXT

D、JSON

正确答案:D

69、Labelme是一个图像标注软件,使用语言编写

A、C

B、JAVA

C、Python

D、C++

正确答案:C

70、视频源数据管理包含

A、视频信息管理和视频档案管理

B、视频质量管理和视频目录管理

C、视频信息管理和视频目录管理

D、视频时间管理和视频字幕管理

正确答案:C

71、ImageNet项目标注了图像

A、万张图像

B、百万张图像

C、千万张图像

D、亿张

正确答案:C

72、CIFAR-100中,每类各有个训练图像和个测试图像

A、500100

B、100500

C、200300

D、300200

正确答案:A

73、属于闭区域标注的有

A、线标注和多边形标注

B、曲线标注和多边形标注

C、曲线标注和点标注

D、曲线标注和多边形标注

正确答案:B

74、图像区域标注现在主要是

A、手动标注

B、自动化标注

C、半自动化标注

D、人工智能标注

正确答案:A

75、图像前处理对图像进行

A、查重处理

B、尺寸处理

C、分辨率处理

D、标注

正确答案:A

76、开区域标注常见的标注有

A、曲线标注

B、多边形标注

C、框标注

D、线标注

正确答案:D

77、交互式智能图像分割标注针对图像分割标注的预识别算法,实现通过机器对图像进行智能分割,再进行,从而大幅提高生产效率,减少人工成本,减少人工差错

A、机器标注和筛选

B、人工修边和筛选

C、人工审核

D、自动识别与标注

正确答案:B

78、老张交换名片后,小王打开手机中安装的灵云智能输入法app,拍照老张的名片,很快得到名片文字信息并保存,这其中最主要应用的技术是

A、模式识别

B、文字合成

C、图像搜索

D、图像还原

正确答案:A

79、()是自然语言处理的重要应用,也可以说是最基础的应用。

A、文本识别

B、机器翻译

C、文本分类

D、问答系统

正确答案:C

80、下面()是LabelImg数据标注结果文件的后缀名。

A、.avi

B、.xml

C、.jpg

D、.mov

正确答案:B

81、flv格式是()的常见后缀名。

A、语音文件

B、视频文件

C、文本文件

D、图像文件

正确答案:B

82、在计算机内部,数据的表示形式是()。

A、八进制

B、十进制

C、二进制

D、十六进制

正确答案:C

83、将原始数据进行集成、变换、维度规约、数值规约是以下哪个步骤的任务()

A、频繁模式挖掘

B、分类和预测

C、数据预处理

D、数据流挖掘

正确答案:C

84、下面哪种不属于数据预处理方法()。

A、变量代换

B、离散化

C、聚类

D、估计遗漏值

正确答案:D

85、在Windows操作系统中,当双击myfile.docx文件时下面说法正确的是()

A、直接在notepad下打开myfile.docx文件

B、直接在记事本下打开myfile.docx文件

C、直接在Word下打开myfile.docx文件

D、弹出选择打开方式对话框

正确答案:C

86、CSV文件是以什么标点符号为分隔符的()。

A、逗号

B、句号

C、单引号

D、双引号

正确答案:A

87、下面哪种说法是错误的

A、文本文件是基于字符编码方式存储文件

B、二进制文件是按二进制的编码方式来存放文件的

C、数据是以二进制编码方式存储在计算机文件中的

D、计算机只能识别文本文件

正确答案:D

88、下面对数据标注描述哪一个是正确的

A、所有的数据标注都可以使用脚本语言自动标注

B、可以通过算法来实现数据的自动标注

C、OCR手写转录完全可以通过识别工具实现自动转录

D、数据标注是个重复性很强的工作

正确答案:D

89、下面对JSON文档叙述不正确的是()

A、Object是一个无序的“‘名称/值'对”集合

B、一个对象以“[”开始,“]”结束

C、每个“名称”后跟一个“:”(冒号)

D、“‘名称/值'对”之间使用“,”分隔

正确答案:B

90、下面对数据标注描述哪一个是正确的()

A、所有的数据标注都可以使用脚本语言自动标注

B、可以通过算法来实现数据的自动标注

C、OCR手写转录完全可以通过识别工具实现自动转录

D、数据标注是个重复性很强的工作

正确答案:D

91、下列关于合格数据标注员应该具备的素质中,描述错误的是

A、持续的学习力是标注工作的基础

B、有耐心才能坚持在标注行业

C、具备一定的管理能力

D、较强专注力可提高个人工作效率

正确答案:C

92、标注公司的岗位角色包括

A、数据标注员

B、质检员

C、项目负责人

D、以上都是

正确答案:D

93、下列关于数据标注员对数据进行标注的描述,错误的是

A、需要参照数据标注规则

B、遇到数据标注规则模糊的问题需要及时询问

C、按照自己的想法猜测标注

D、数据标注员需要总结经验并及时汇报遇到的问题

正确答案:C

94、初级数据标注员应该具备的职业机能包括()①拥有一定的职业道德规范②行业基础知识掌握③具备基础业务能力④具备质检能力⑤具备团队管理能力

A、①②③

B、③④⑤

C、②③④

D、①②⑤

正确答案:A

95、中级数据标注员应该具备的职业机能包括()①具备较高的职业道德和一定的从业经验②具备较高的业务能力和责任心③具备业务开发能力④具备简单质检能力⑤具备团队管理能力

A、①②③⑤

B、①②④⑤

C、①②③④⑤

D、①②④⑤

正确答案:D

96、数据标注规则的特点包括()①数据标注规则需要一致②数据标注规则需要不断完善③需求方优先规则④质检优先规则⑤数据标注规则不能改变

A、①②③④

B、②③④⑤

C、①③④⑤

D、①②④⑤

正确答案:A

97、语音识别产品体系有四部分,下列哪项不是体系之一。()

A、语音合成

B、语音播放

C、语音识别

D、语义理解

正确答案:B

98、以下数据单位从小到大排列的顺序是()

A、GBBKB

B、BKBMB

C、KBZBPB

D、BMBKB

正确答案:B

99、人工智能在某种意义上来说是人工+智能,以下那些需要人工做的工作()

A、数据采集

B、数据清洗

C、做标签

D、以上都对

正确答案:D

100、图像去雾的应用场景不包括()。

A、视频监控

B、远程感应

C、自动驾驶

D、美颜相机

正确答案:D

101、不属于图像分类技术应用领域的是()

A、商品自动分类

B、运输车辆识别

C、残次品自动分类

D、自动驾驶技术

正确答案:D

102、语音识别、语义理解、语音合成、OCR识别、人脸识别等都属于人工智能技术,以下哪种事物没有应用到人工智能技术()

A、机器猫

B、无人机

C、微信客服

D、哈利波特的扫帚

正确答案:D

103、()是人以自然语言同计算机进行交互的综合性技术,结合了语言学、心理学、工程、计算机技术等领域的知识。

A、情感交互

B、语音交互

C、体感交互

D、脑机交互

正确答案:B

104、通常一个标注任务的准确率高于()称该任务合格。

A、0.6

B、0.8

C、0.9

D、0.95

正确答案:D

105、下列选项中,不属于生物特征识别技术的是()

A、步态识别

B、声纹识别

C、文本识别

D、虹膜识别

正确答案:C

106、计算机视觉与很多学科都有密切关系,例如()为计算机视觉提供了图像处理的方法与工具。

A、数字图像处理

B、美术学

C、计算机绘图

D、物理学

正确答案:A

107、()致力于计算机理解人类语言的句子或词语,目的是实现人机交互。

A、文字校对技术

B、自然语言生成技术

C、中文自动分词技术

D、自然语言处理技术

正确答案:D

108、对于神经退行性疾病,()将成为主要的检测手段。

A、窥镜

B、计算机断层扫描

C、X光

D、核磁共振成像

正确答案:D

109、我国在语音语义识别领域的领军企业是()

A、华为

B、图谱科技

C、科大讯飞

D、阿里巴巴

正确答案:C

110、Cortana是()推出的个人语音助手。

A、苹果

B、亚马逊

C、微软

D、阿里巴巴

正确答案:C

111、现有的主流人工智能对自然语言处理是基于()视角的。

A、第一人称

B、第二人称

C、第三人称

D、对象

正确答案:C

112、仅个体变元被量化的谓词称为()。

A、一阶谓词

B、原子公式

C、二阶谓词

D、全称谓词

正确答案:A

113、不是自然语言处理要实现的目标的是()

A、理解别人讲的话

B、对自然语言表示的信息进行分析概括或编辑

C、欣赏音乐

D、机器翻译

正确答案:C

114、客流分析可准确分析顾客年龄、性别等信息,区别新老客户,助力精准营销,其应用的主要技术不包括()

A、人脸识别

B、比对

C、文字识别

D、搜索技术

正确答案:C

115、观察一批数据中的每一个数据在所有数据的总和中所占的比例,适合的图形是()

A、散点图

B、柱形图

C、直方图

D、饼图

正确答案:D

116、自然语言理解(NaturalLanguageUnderstanding)是一项()

A、网络技术

B、语言技术

C、理解能力

D、人工智能技术

正确答案:D

117、文本比语音中的内容多了一个字,应该怎么办?

A、判该句无效

B、删除文本中多余的字

C、提交反馈“语音有误”

D、无需理会

正确答案:B

118、若规范要求,语句前后,需要各预留0.3~0.5秒的静音段。你在句尾之后的0.4秒处,发现有个按键音,以下哪种方法最合适?

A、在句子后0.5秒处切音

B、在句子后0.4秒处切音

C、在句子后0.3秒处切音

D、判该句无效

正确答案:C

119、文本内容是:我饿了。但是录音人有点儿结巴,连着说了四个我。该怎么标注?

A、判该句无效

B、四个我饿了

C、我我我我饿了

D、我饿了

正确答案:C

120、一句语音中,出现后面有第二人说话的声音。该怎么办?

A、判该句无效

B、只写出主说话人的内容

C、两人的说话内容都写出

D、只写出第二人的内容

正确答案:A

121、可以标为坏数据的是()。

A、图片显示方向不正确

B、图片局部显示不全

C、图片模糊放大后仍看不清楚

D、图片不够清晰但放大后可以看清楚

正确答案:C

122、一道大题内包含选择题和填空题,则该大题的属性是()。

A、选择题

B、填空题

C、其他

D、噪声

正确答案:C

123、下列选项中没有体现人工智能在消费品与电商领域行业的应用的是()。

A、智能店铺管理

B、智能客服

C、无人超市

D、天猫精灵

正确答案:B

124、下列选项中有关人工智能可以带来的商业价值分析不正确的是()。

A、在金融行业,通过人工智能技术在风险评估、资产配置、智能交易等方向的应用,预计人工智能将带来约6000亿元人民币的降本增益效益。

B、在零售行业,人工智能在推荐系统上的运用将提高在线销售的销量表现,同时更加精准的市场预测将降低库存成本,预计人工智能技术将带来约4200亿元人民币的降本与增益价值。

C、在医疗行业,通过人工智能技术在药物研发领域提高成功率、在医疗服务机构内提供疾病诊断辅助、疾病监护辅助等提高服务效率的应用,预计人工智能可以带来约4000亿元人民币的降本价值。

D、在汽车行业,人工智能在自动驾驶上的技术突破将带来约5000亿元人民币的价值增益。

正确答案:A

125、以下不属于无人超市采用的智能技术的是()。

A、技术机视觉

B、深度算法学习

C、传感器定位

D、图像处理

正确答案:D

126、下列说法中对通用人工智能说明错误的是()。

A、具备知识技能迁移能力,可以快速学习。

B、是真正在这次人工智能浪潮中起到影响的主角。

C、是众多科幻作品中颠覆人类社会的人工智能形象。

D、充分利用已掌握的技能来解决新问题、达到甚至超过人类智慧的人工智能。

正确答案:B

127、下列说法中对专用人工智能理解正确的是()。

A、在某一个特定领域应用的人工智能。

B、不是真正在这次人工智能浪潮中起到影响的主角。

C、充分利用已掌握的技能来解决新问题、达到甚至超过人类智慧的人工智能。

D、是众多科幻作品中颠覆人类社会的人工智能形象。

正确答案:A

128、下列有关人工智能说法错误的是()。

A、不是人的智能,虽然不能像人那样思考、按时有可能会超过人的智能。

B、人工智能可以对人的意识、思维的信息过程的模拟。

C、它是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。

D、人工智能就是研究如何使计算机去做过去只有人才能做的智能工作。

正确答案:A

129、下列说法中哪个选项反应了人工智能学科的基本思想和基本内容()。

A、人工智能是计算机科学的一个分支,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机

B、人工智能就是研究如何使计算机去做过去只有人才能做的智能工作。

C、人工智能不是人的智能,但能像人那样思考、也可能超过人的智能。

D、以上都不正确

正确答案:B

130、人工智能是一门利用计算机模拟人类智能行为科学的统称,它涵盖了训练计算机使其能够完成()等人类行为的范畴。

A、自主学习、判断、执行

B、决策、判断、执行

C、自主学习、决策、执行

D、自主学习、判断、决策

正确答案:D

131、()是汽车人工智能领域目前最为火热的方向。

A、整车的智能营销

B、驾驶辅助系统

C、零部件的预测维修

D、数据驱动的产品优化

正确答案:B

132、下列哪个选项是专用人工智能的定义()。

A、在某一个特定领域应用的人工智能。

B、指具备知识技能迁移能力,可以快速学习,充分利用已掌握的技能来解决新问题、达到甚至超过人类智慧的人工智能。

C、是一门利用计算机模拟人类智能行为科学的统称。

D、是计算机科学的一个分支。

正确答案:A

133、下列选项中哪些是不属于专用人工智能和通用人工智能之间的区别()。

A、知识技能的迁移能力

B、跨领域推理能力

C、实现特定领域的应用

D、意识的认识与掌握

正确答案:C

134、()是零售行业内应用最为广泛、效果最为显著的人工智能技术,线上线下的零售巨头都在运用此技术帮助进行交叉销售、向上销售、提高复购率。

A、智能店铺管理

B、无人超市

C、智能交易策略

D、精准营销与个性化推荐系统

正确答案:D

135、淘宝美工——鲁班这一案例属于人工智能产业应用的哪个场景()。

A、人工智能在汽车行业中的应用

B、人工智能在消费品和电商领域行业的应用

C、人工智能在金融行业的应用

D、人工智能在个人生活娱乐学习方面的应用

正确答案:B

136、智能医疗可以在()等方面发挥重要作用。

A、辅助诊疗、疾病预测、医疗影像辅助诊断、药物开发

B、货物搬运、仓储管理、货物配送

C、人脸识别、指纹解锁、产品检测

D、远程维护、企业管理、个性化定制

正确答案:A

137、下面活动中应用了智能语音技术的是()。

A、当天黑了家里的窗帘自动拉合

B、下雨天窗户自动关闭

C、夜间起床说声“开灯”,夜灯就亮了

D、当宝宝大声哭泣,智能床铃就开始播放音乐

正确答案:C

138、通过交通信息采集系统采采集道路中的车辆流量、行车速度等信息,经智能系统分析后调整各路口红绿灯时长属于人工智能在()领域的应用。

A、智能物流

B、智能安防

C、智能控制

D、智能交通

正确答案:D

139、下面不是应用于智能物流领域的机器人是()。

A、迎宾机器人

B、搬运机器人

C、货架穿梭车

D、分拣机器人

正确答案:A

140、下面关于人工智能说法错误的是()。

A、人工智能一定程度上能模仿人类的活动

B、人工智能可以全面取代人类活动

C、人工智能的发展将改变人类社会生活

D、人工智能的发展也会产生一些负面的社会影响

正确答案:B

141、下面关于企业客服机器人说法正确的是()。

A、企业客服机器人是闲聊机器人

B、企业客服机器人能回答所有用户提出的问题

C、企业客服机器人属于聊天机器人

D、企业客服机器人不是以任务目的为导向的机器人

正确答案:C

142、下面不属于领域知识智能问答机器人的是()。

A、淘宝智能客服机器人

B、南航智能客服

C、分拣机器人

D、电信智能客服

正确答案:C

143、在与智能客服机器人交流时,人们采用的是()。

A、关键字

B、自然语言

C、纯语音

D、纯文字

正确答案:B

144、不属于当今的人工智能发展方向的是()

A、以机器与人结合而成的增强型混合智能系统

B、用机器、人、网络结合成新的群智系统

C、用机器、人、网络和物结合成的更加复杂的智能系统

D、用计算机模拟人工智能

正确答案:D

145、生物特征识别技术是指通过个体生理特征或行为特征对个体身份进行识别认证的技术。下列技术不属于生物特征识别技术的是()。

A、人脸识别

B、3D识别

C、虹膜识别

D、声纹识别

正确答案:B

146、根据机器智能水平由低到高,()是正确的是。

A、计算智能、感知智能、认知智能

B、计算智能、感应智能、认知智能

C、机器智能、感知智能、认知智能

D、机器智能、感应智能、认知智能

正确答案:A

147、三大流派的演化正确的是()。

A、符号主义->知识表示->机器人

B、联结主义->控制论->深度学习

C、行为主义->控制论->机器人

D、符号主义->神经网络->知识图谱

正确答案:C

148、()不是手机里常用的智能APP。

A、美颜

B、语音助手

C、人脸识别

D、机器翻译

正确答案:C

149、掀起人工智能发展的第三个高潮是由()的。

A、计算驱动

B、数据驱动

C、知识驱动

D、常识驱动

正确答案:B

150、只专注于完成某个特别设定的任务的人工智能属于()。

A、超人工智能

B、弱人工智能

C、强人工智能

D、认知智能

正确答案:B

151、()系统包括了学习、语言、认知、推理、创造和计划,目标是使人工智能在非监督学习情况下处理前所未见的细节,并同时与人类开展交互式学习。

A、超人工智能

B、弱人工智能

C、强人工智能

D、认知智能

正确答案:C

152、Python中的变量var如果包含字符串的内容,下面哪种数据类型不可能创建var?()

A、list

B、string

C、char

D、dict

正确答案:C

153、Python程序在执行一次之后会自动生成扩展名为()的字节码文件,以提高运行效率。

A、.pyf

B、.pyb

C、.py

D、.pyc

正确答案:D

154、Python函数定义的关键字是()

A、def

B、function

C、import

D、main

正确答案:A

155. 在图像分类任务中,标注框(Bounding Box)主要用于标记?( )  

A. 图像整体类别

B. 图像中特定目标的位置和范围

C. 图像像素值

D. 图像分割区域  

答案:B

156、关于python列表,下列选项中,描述错误的选项是。

A、列表中的元素之间用逗号分隔

B、列表中的元素可以是列表类型

C、列表中可以包含数字类型的元素

D、列表中的元素类型必须相同

正确答案:D

157、python中,已知ls=[12,34.5,True,'test',3+5j],则下列选项中,输出结果为“['test']”的选项是()

A、ls[3]

B、ls[4]

C、ls[3:4]

D、ls[4:5]

正确答案:C

158、下列哪种说法是错误的()

A、python是一门面向对象的语言;

B、python是一门面向过程的语言;

C、python是一种解释型语言的计算机程序设计语言;

D、python程序无需编译成二进制代码,而是在执行时对语句一条一条编译。

正确答案:B

159、关于函数参数传递中,形参与实参的描述错误的是()。

A、实参与形参分别存储在各自的内存空间中,是两个不相关的独立变量

B、Python实行按值传递参数。值传递指调用函数时将常量或变量的值传递给函数的参数

C、实参与形参的名字必须相同

D、在函数内部改变形参的值时,实参的值一般是不会改变的

正确答案:C

160、Python脚本的扩展名是()

A、.python

B、.py

C、.pt

D、.pg

正确答案:B

161、关于aorb描述错误的是()。

A、若a=Trueb=True则aorb==True

B、若a=Trueb=False则aorb==True

C、若a=Trueb=True则aorb==False

D、若a=Falseb=False则aorb==False

正确答案:C

162、关于函数说法错误的是()。

A、函数可以没有参数

B、函数可以有多个返回值

C、函数可以没有return语句

D、函数都有返回值

正确答案:B

163、以下不合法的pythhon变量名是()。

A、Python2

B、N.X

C、sum

D、Hello_World

正确答案:B

164、关于python类说法错误的是()。

A、类的实例方法必须创建对象后才可以调用

B、类的实例方法必须创建对象前才可以调用

C、类的类方法可以用对象和类名来调用

D、类的静态属性可以用类名和对象来调用

正确答案:B

165、list(range(6))[::2]的执行结果为()?

A、[0,1,2,3,4,5]

B、[2,3,4,5,6]

C、[0,2,4]

D、[1,3,5]

正确答案:C

166、表达式[xforxinrange(10)ifx%2==0]的结果是()

A、语法错误

B、[1,2,3,4,5,6,7,8,9,10]

C、(2,4,6,8,10)

D、[0,2,4,6,8]

正确答案:D

167、下面哪个数是float类型()?

A、10

B、TRUE

C、1+2j

D、3.14

正确答案:D

168、一个字符串str=""HelloPython"",则str[1:8]是()?

A、HelloPy

B、elloPy

C、elloPyt

D、HelloP

正确答案:B

169、下面关于Python语言特点的描述,错误的是()?

A、Python语言是开源、跨平台的语言。

B、Python语言具有可移植性。

C、Python语言是FLOSS之一,可以使用但不能随意进行改动。

D、Python语言是解释性语言,通过解释器将源码转换成字节码。

正确答案:C

170、输出函数print()参数中使用下面哪个属性来指定末尾符号为换行符()?

A、sep=''

B、end='\n'

C、file=sys.stdout

D、flush=False

正确答案:B

171、下面转义字符中哪个符号是制表符()?

A、\t

B、\n

C、\\

D、\'

正确答案:A

172、range(5)的取值范围是()?

A、[0,1,2,3,4,5]

B、[1,2,3,4,5]

C、[0,1,2,3,4]

D、[5]

正确答案:C

173、下面哪个函数用于从键盘接收信息()?

A、int()

B、print()

C、input()

D、range()

正确答案:C

174、Python程序使用缩进来组织代码的层次结构,1个缩进是几个空格()?

A、1

B、2

C、8

D、8

正确答案:C

175、关于Python变量,说法正确的是

A、变量无需赋值便可以直接使用

B、变量无需声明数据类型便可以直接赋值

C、Python变量只有数字型和字符串型2种

D、Python变量与其他所有高级程序设计语言变量的数据类型没有区别

正确答案:B

176、在Anaconda中进行第三方库的安装,正确的命令是

A、pipinstall包名

B、conda包名

C、condasetup包名

D、pipsetup包名

正确答案:A

177、下面关于Python语言的说法,错误的是

A、Python源代码区分大小写

B、Python语言是解释性的,可以在>>>提示符下交互输入Python语句

C、python语言是编译执行的,不支持逐条语句执行方式

D、Python用#引出行注释

正确答案:C

178、已有变量x和y,以下()不能实现交换变量x和变量y的值。

A、x=y;y=x

B、x,y=y,x

C、t=y;y=x;x=t

D、x=y+x;y=x-y;x=x-y

正确答案:A

179、以下选项中,Python代码的注释使用的符号是()

A、//

B、/*……*/

C、%

D、#

正确答案:D

180、可以使用()接受用户的键盘输入。

A、input命令

B、input()函数

C、int()函数

D、format()函数

正确答案:B

181、已知area=1963.4375000000002,执行print(""{:.2f}"".format(area))语句,输出结果为

A、1919

B、1963

C、1963.43

D、1963.44

正确答案:D

182、下列数据类型中,()属于无序数据类型。

A、set、tuple

B、str、list

C、list、tuple

D、set、dict

正确答案:D

183、设有变量a="Me","You",则变量a属于

A、字符串

B、元组

C、列表

D、集合

正确答案:B

184、数据表是由行(记录)和列(字段)构成,因此也称()

A、数据

B、二维表

C、表格

D、大数据

正确答案:B

185、在数据表中,表的“行”称为()

A、数据

B、字段

C、记录

D、大数据

正确答案:C

186、()是指对客观事件记录的符号,是对客观事物的性质、状态及相互关系等进行记载的物理符号或这些物理符号的组合。

A、数据

B、字段

C、记录

D、大数据

正确答案:A

187、在数据表中,表的“列”称为()

A、数据

B、字段

C、记录

D、大数据

正确答案:B

188、数据采集器不能采集以下哪种数据()

A、图片

B、文字

C、网站信息

D、专利

正确答案:D

189、下列哪种不是数据采集器

A、Python爬虫

B、⼋⽖鱼采集器

C、⽕车头采集器

D、后羿采集器

正确答案:A

190、某用户在使用支付宝绑定银行卡时,网站要求验证用户的真实姓名和⾝份证号码。这时要求采集的数据必须有()

A、准确性

B、完整性

C、一致性

D、相关性

正确答案:A

191、数据的存储方式有()

A、Excel

B、CSV

C、数据库

D、以上都对

正确答案:D

192、通用网络爬虫基本工作流程包含()

A、抓取网页

B、数据存储

C、预处理

D、以上都对

正确答案:D

193、防采集措施不包含以下哪种()

A、封IP

B、验证码识别

C、不允许打开网页

D、登录

正确答案:C

194、商务数据的来源不包括()

A、个人数据

B、电子商务平台

C、社交平台

D、O2O数据

正确答案:A

195、数据的获取途径没有()

A、从别人数据库窃取

B、产品白有数据

C、调查问卷

D、互联网数据导入

正确答案:A

196、常见的爬虫语言不包含()

A、HTML

B、Python

C、java

D、php

正确答案:A

197、以下对字典的说法不正确的是()

A、字典可以为空

B、字典的键不能相同

C、字典的键不可变

D、字典的值不可变

正确答案:D

198、如果把知识按照作用来分类,下述()不在分类的范围内。

A、用控制策略表示的知识,即控制性知识。

B、可以通过文字、语言、图形、声音等形式编码记录和传播的知识,即显性知识。

C、用提供有关状态变化、问题求解过程的操作、演算和行动的知识,即过程性知识。

D、用提供概念和事实使人们知道是什么的知识,即陈述性。

正确答案:B

199、下述()不是知识的特征。

A、复杂性和明确性

B、进化和相对性

C、客观性和依附性

D、可重用性和共享性

正确答案:A

200、人类智能的特性表现在哪4个方面。()

A、聪明、灵活、学习、运用。

B、能感知客观世界的信息、能对通过思维对获得的知识进行加工处理、能通过学习积累知识增长才干和适应环境变化、能对外界的刺激作出反应传递信息。

C、感觉、适应、学习、创新。

D、能捕捉外界环境信息、能够利用利用外界的有利因素、能够传递外界信息、能够综合外界信息进行创新思维。

正确答案:B

201、人工智能的目的是让机器能够(),以实现某些脑力劳动的机械化。

A、具有智能

B、和人一样工作

C、完全代替人的大脑

D、模拟、延伸和扩展人的智能

正确答案:D

202、下列关于人工智能的叙述不正确的是()。

A、人工智能技术它与其他科学技术相结合极大地提高了应用技术的智能化水平。

B、人工智能是科学技术发展的趋势。

C、因为人工智能的系统研究是从上世纪五十年代才开始的,非常新,所以十分重要。

D、人工智能有力地促进了社会的发展。

正确答案:C

203、人工智能研究的一项基本内容是机器感知。以下列()不属于机器感知的领域。

A、使机器具有视觉、听觉、触觉、味觉、嗅觉等感知能力。

B、让机器具有理解文字的能力。

C、使机器具有能够获取新知识、学习新技巧的能力。

D、使机器具有听懂人类语言的能力

正确答案:C

204、尽管人工智能学术界出现“百家争鸣”的局面,但是,当前国际人工智能的主流派仍属于:()

A、连接主义

B、符号主义

C、行为主义

D、经验主义

正确答案:B

205、被誉为国际“人工智能之父”的是:()

A、图灵(Turing)

B、费根鲍姆(Feigenbaum)

C、傅京孙(K.S.Fu)

D、尼尔逊(Nilsson)

正确答案:A

206、人工智能的含义最早由()于1950年提出,并且同时提出一个机器智能的测试模型。

A、明斯基

B、扎德

C、图灵

D、冯.诺依曼

正确答案:C

207、下列哪个不是人工智能的研究领域()。

A、机器证明

B、模式识别

C、人工生命

D、编译原理

正确答案:D

208、AI是()的英文缩写。

A、AutomaticIntelligence

B、ArtificalIntelligence

C、AutomaticeInformation

D、ArtificalInformation

正确答案:B

209、为了解决如何模拟人类的感性思维,例如视觉理解、直觉思维、悟性等,研究者找到一个重要的信息处理的机制是()。

A、专家系统

B、人工神经网络

C、模式识别

D、智能代理

正确答案:B

210、下述()不是人工智能中常用的知识格式化表示方法。

A、框架表示法

B、状态空间表示法

C、语义网络表示法

D、形象描写表示法

正确答案:D

 

二、多选题

1. 以下哪些算法属于深度学习的常见优化算法?

A.随机梯度下降(SGD)

B.牛顿法

C.自适应矩估计(Adam)

D.均方根传播(RMSProp)
答案:ACD

2、以下哪些属于传统机器学习算法?

A.决策树

B.卷积神经网络(CNN)

C.支持向量机(SVM)

2. D.朴素贝叶斯
答案:ACD

3. 深度学习中常用的激活函数包括哪些?

A.ReLU

B.Sigmoid

C.Tanh

D.Softmax
答案:ABCD

4. 数据标注的核心质量指标包括哪些?

A.标注准确性

B.标注一致性

C.标注覆盖率

D.标注速度
答案:ABC

5. 图像数据标注中,以下哪些标注类型适用于不同任务?

A.边界框标注(BoundingBox)

B.语义分割标注(SemanticSegmentation)

C.关键点标注(KeypointLabeling)

6. D.实例分割标注(InstanceSegmentation)
答案:ABCD

7. 数据增强的常用方法包括哪些?

A.旋转

B.翻转

C.缩放

D.添加噪声
答案:ABCD

8、自然语言处理(NLP)的主要难点包括哪些?

A.语言歧义性

B.知识依赖

C.语境理解

D.机器性能
答案:ABC

9、训练二分类模型时,可能遇到的问题包括哪些?

A.数据量不足

B.正负样本不均衡

C.模型过拟合

D.特征维度过高
答案:ABCD

10、模型优化的目标通常包括哪些?

A.提高准确性

B.减少训练时间

C.降低计算资源消耗

D.增加模型复杂度
答案:ABC

11、以下哪些属于人工智能的层次?

A.运算智能

B.感知智能

C.认知智能

D.自主智能
答案:ABCD

12. 模型解释技术包括:

A. 特征重要性

B. 注意力机制

C. 反事实解释

D. 局部近似

答案:ABCD

13、以下哪些是多标签分类的应用场景?

A.垃圾邮件判别(是/否)

B.情绪识别(愤怒/高兴/平静)
C.新闻主题标签(体育、C罗、欧冠)
D.图像分类(猫/狗)
答案:BC

14、以下哪些属于深度神经网络模型?

 A. DNN(深层神经网络)

 B. CNN(卷积神经网络)

 C. RNN(循环神经网络)

 D. GAN(生成对抗网络)

答案:ABCD

15、基因遗传算法的组成部分包括哪些?

 A. 选择(Selection)

 B. 交叉(Crossover)

 C. 变异(Mutation)

 D. 反向传播(Backpropagation)

答案:ABC

 

 

16、以下哪些技术可以加速深度学习模型训练并提高图像分类准确率?

 A. 使用卷积神经网络(CNN)

 B. 数据增强(Data Augmentation)

 C. 批量归一化(Batch Normalization)

 D. 增加模型参数量

答案:ABC

 

17、数据质量评估的核心指标包括哪些?

 A. 准确性

 B. 完整性

 C. 一致性

 D. 时效性

答案:ABCD

 

18、文本数据处理技术包括哪些?

 A. 词法分析

 B. 句法分析

 C. 语义分析

 D. 情感分析

答案:ABCD

 

19、在数据清洗中,可能涉及的操作包括哪些?

 A. 处理缺失值

 B. 去除重复数据

 C. 标准化数据格式

 D. 删除所有异常值

答案:ABC

 

20、.以下关于小批量梯度下降(MBGD)的描述正确的是?

 A. 使用固定尺寸的小批量样本更新权值

 B. 兼顾训练效率和稳定性

 C. 容易跳过局部极值

 D. 实际应用中最常用的梯度下降算法

答案:ABCD

21、提高模型可解释性的技术包括哪些?

 A. 激活图(Activation Maps)

 B. 特征重要性分析

 C. 决策路径可视化

 D. 预测概率输出

答案:ABCD

 

 

22、模型过拟合的解决方法包括哪些?

 A. 增加训练数据量

 B. 使用Dropout技术

 C. 提前停止(Early Stopping)

 D. 降低模型复杂度

答案:ABCD

 

23.人工智能训练师的核心职责包括哪些?

A. 设计数据标注规则

B. 分析模型错误案例并优化数据

C. 选择适合任务的模型架构

D. 编写模型部署的Docker镜像

答案:ABC

 

24、.多模态融合模型可应用于哪些场景?

A. 视频描述生成(融合视觉与音频)

B. 医疗影像诊断(融合图像与文本报告)

C. 自动驾驶(融合激光雷达与摄像头数据)

D. 单一文本分类任务

答案:ABC

 

 

25.处理时间序列数据时,适合捕捉长距离依赖关系的模型是?

A. LSTM

B. Transformer

C. ARIMA

D. 逻辑回归

答案:AB

 

 

26、.以下哪些属于机器学习类型?

A. 有监督学习

B. 无监督学习

C. 半监督学习

D. 强化学习

答案:ABCD

 

27.大模型在自然语言处理中的关键能力包括?

A. 词义消歧

B. 上下文理解

C. 多语言翻译

D. 图像分割

答案:ABC

 

28.以下哪些是深度学习常见优化器?

A. Adam

B. RMSprop

C. 随机梯度下降(SGD)

D. K-Fold交叉验证

答案:ABC

 

 

29. 关于梯度下降算法的描述,正确的选项是?

 A. 小批量梯度下降(MBGD)使用固定尺寸的批次样本更新权值

 B. MBGD容易跳过局部极值,是实际最常用的梯度下降算法

 C. 随机梯度下降(SGD)每次仅用一个样本,训练速度快但波动大

 D. 批量梯度下降(BGD)对所有样本计算梯度,内存消耗高

 答案:ABCD

 

30、以下哪些技术可以加速深度学习训练并提升图像分类准确率?

 A. 使用卷积神经网络(CNN)

 B. 批量归一化(Batch Normalization)

 C. 数据增强(Data Augmentation)

 D. 增加全连接层数量

 答案:ABC

 

31. 基因遗传算法的核心操作包括?

 A. 选择(Selection)

 B. 交叉(Crossover)

 C. 变异(Mutation)

 D. 反向传播(Backpropagation)

 答案:ABC

 

32、 数据质量评估的关键指标有哪些?

 A. 准确性(标注与真实值的一致性)

 B. 完整性(无缺失值)

 C. 一致性(标注规则统一)

 D. 时效性(数据更新频率)

 答案:ABCD

33. 文本数据处理技术包括哪些?

 A. 词法分析(如分词、词性标注)

 B. 句法分析(依存关系解析)

 C. 语义分析(实体识别、情感分析)

 D. 数据增强(同义词替换)

 答案:ABCD

 

 

34 数据清洗中正确的操作是?

 A. 缺失值填充(均值/中位数)

 B. 异常值检测与合理处理

 C. 标准化(如Z-Score归一化)

 D. 直接删除所有不完整样本

 答案:ABC

 

35. 以下哪些方法能提高模型可解释性?

 A. LIME(局部可解释模型)

 B. SHAP值分析

 C. 决策树可视化

 D. 激活热力图(CNN可视化)

 答案:ABCD

 

36. 解决过拟合的常见策略包括?

 A. 增加Dropout层

 B. 早停法(Early Stopping)

 C. L1/L2正则化

 D. 扩大训练数据集

 答案:ABCD

 

 

 

37. 批量归一化(BatchNorm)的作用是?

 A. 加速模型收敛

 B. 减少内部协变量偏移

 C. 替代正则化功能

 D. 允许更高学习率

 答案:ABD

 

38. 人工智能训练师的核心职责包括?

A. 制定数据标注规范与质检流程

B. 分析模型错误案例并优化数据集

C. 参与模型架构设计与超参数调优

D. 编写API接口部署模型

答案:ABC

 

39. 多模态融合模型的典型应用场景是?

A. 视频内容理解(图像+音频+文本)

B. 医疗诊断(CT影像+电子病历文本)

C. 自动驾驶(激光雷达+摄像头+雷达)

D. 单一文本情感分析

答案:ABC

 

 

40 处理长序列依赖问题适合的模型是?

A. LSTM

B. Transformer

C. ARIMA

D. 逻辑回归

答案:AB

 

41. 影响大模型公平性的因素包括?

A. 训练数据偏见

B. 评估指标偏差

C. 模型结构设计

D. 硬件计算速度

答案:ABC

 

42 模型部署时需考虑哪些因素?

A. 推理延迟

B. 硬件资源占用

C. 模型可解释性

D. 数据隐私合规

答案:ABCD

 

 

43. 数据清洗时处理缺失值的正确方法包括?

 A. 删除缺失率超过70%的特征

 B. 对核心特征使用均值/中位数填充

 C. 分析缺失机制是否与目标变量相关

 D. 直接删除所有含缺失值的样本

 答案:ABC

 

44. 提升数据质量的措施包括?

 A. 消除噪声数据

 B. 平衡正负样本比例

 C. 增加负样本多样性

 D. 仅使用高精度标注工具

 答案:ABC

 

45. 关键点标注适用于哪些任务?

 A. 人体姿态估计

 B. 医学影像器官定位

 C. 文本情感分类

 D. 语音识别

 答案:AB

 

 

46. 小批量梯度下降(MBGD)的特点包括?

 A. 使用固定尺寸批次更新权值

 B. 平衡训练效率与稳定性

 C. 易跳过局部极值

 D. 内存消耗高于批量梯度下降

 答案:ABC

 

47 以下哪些属于监督学习?

 A. 支持向量机(SVM)

 B. K均值聚类

 C. 线性回归

 D. 强化学习

 答案:AC

 

48. 提高模型可解释性的技术包括?

 A. SHAP值分析

 B. LIME局部解释

 C. 决策树可视化

 D. 增加神经网络层数

 答案:ABC

 

 

49. 解决过拟合的常见策略包括?

 A. Dropout

 B. 数据增强

 C. 早停法

 D. 降低学习率

 答案:ABC

 

50. 批量归一化(BatchNorm)的作用是?

 A. 加速收敛

 B. 减少内部协变量偏移

 C. 允许更高学习率

 D. 替代正则化

 答案:ABC

 

51. 多模态融合的典型应用包括?

 A. 自动驾驶(激光雷达+摄像头)

 B. 医疗诊断(CT+电子病历)

 C. 视频内容审核(图像+音频)

 D. 纯文本翻译

 答案:ABC

 

 

52. 影响模型公平性的因素包括?

A. 训练数据偏见

B. 评估指标偏差

C. 模型结构复杂度

D. GPU型号

答案:AB

 

53. AI训练师的核心职责包括?

A. 制定数据标注规范

B. 模型超参数调优

C. 编写部署API

D. 分析错误案例

答案:ABD

 

54. 以下哪些是AI训练师常用工具?

A. LabelImg(图像标注)

B. PyTorch

C. Docker

D. Tableau

答案:AB

 

 

55. 以下哪些属于机器学习的主要类型?

A. 监督学习

B. 无监督学习

C. 强化学习

D. 深度学习

答案:ABCD

 

56. 人工智能训练师的核心职责包括:

A. 数据清洗与标注

B. 模型训练与调优

C. 算法研发

D. 模型部署

答案:AB

 

57. 以下哪些是常见的数据标注类型?

A. 图像分类

B. 目标检测

C. 语义分割

D. 文本分类

答案:ABCD

 

 

58. 机器学习中的"过拟合"是指:

A. 模型在训练集上表现很好

B. 模型在测试集上表现很差

C. 模型过于复杂

D. 模型过于简单

答案:ABC

 

59. 以下哪些是常用的机器学习算法?

A. 决策树

B. 支持向量机

C. K近邻

D. 线性回归

答案:ABCD

 

60. 数据清洗的主要任务包括:

A. 处理缺失值

B. 处理异常值

C. 数据标准化

D. 特征选择

答案:ABCD

 

 

61. 以下哪些是常用的数据增强方法?

A. 图像旋转

B. 添加噪声

C. 色彩变换

D. 裁剪

答案:ABCD

 

62. 处理类别不平衡问题的常用方法有:

A. 过采样

B. 欠采样

C. 类别权重

D. 数据增强

答案:ABCD

 

63. 特征工程的主要目的是:

A. 提高模型性能

B. 降低计算复杂度

C. 提高可解释性

D. 减少数据量

答案:ABC

 

64. 以下哪些是常用的特征选择方法?

A. 方差选择法

B. 相关系数法

C. 卡方检验

D. 互信息法

答案:ABCD

 

65. 以下哪些是深度学习的常用框架?

A. TensorFlow

B. PyTorch

C. Keras

D. Scikit-learn

答案:ABC

 

66. 模型训练中常用的优化器包括:

A. SGD

B. Adam

C. RMSprop

D. Adagrad

答案:ABCD

 

 

 

67. 以下哪些方法可以防止过拟合?

A. 正则化

B. Dropout

C. 早停法

D. 数据增强

答案:ABCD

 

68. 模型评估的常用指标包括:

A. 准确率

B. 精确率

C. 召回率

D. F1值

答案:ABCD

 

69. 超参数调优的常用方法有:

A. 网格搜索

B. 随机搜索

C. 贝叶斯优化

D. 遗传算法

答案:ABCD

 

 

70. 计算机视觉的常见任务包括:

A. 图像分类

B. 目标检测

C. 图像分割

D. 图像生成

答案:ABCD

三、判断题

1、产品自有数据就是自身产品销售过程中产生的数据

A、正确

B、错误

正确答案:A

 

2、k均值算法,是一种原型聚类算法。

A、正确

B、错误

正确答案:A

 

3、商务数据指用户在电子商务网站购买商品的过程中,网站记录用户行为的大量数据。

A、正确

B、错误

正确答案:A

 

4、分布式文件系统的设计目标是高性能、可伸缩性、可靠性及高安全性。

A、正确

B、错误

正确答案:B

5、数据采集又称数据获取,是利用设备或技术手段从现实环境及网络获取数据并放入系统内部进行使用。

A、正确

B、错误

正确答案:A

6、监督学习的学习数据既有特征(feature),也有标签(label)。

A、正确

B、错误

正确答案:A

7、常见的采集方法包括web爬虫采集和API接口采集。

A、正确

B、错误

正确答案:A

8、调用网站自身提供的应用程序编程接口,可以实现网络数据采集。

A、正确

B、错误

正确答案:A

9、数据采集工具分为编程类和可视化采集工具两类。

A、正确

B、错误

正确答案:A

10、在MapReduce计算模型中,数据经过Reduce阶段处理后传送给Map阶段继续处理。

A、正确

B、错误

正确答案:B

11、在噪声数据中,波动数据比离群点数据偏离整体水平更大。

A、正确

B、错误

正确答案:B

12、简易采集模式是利用系统内置模板进行数据采集的模式。

A、正确

B、错误

正确答案:A

13、单页采集只能采集列表数据。

A、正确

B、错误

正确答案:B

14、表格数据采集要先选中表格中的一行数据。

A、正确

B、错误

正确答案:A

15、采集列表详情页数据不需要循环步骤。

A、正确

B、错误

正确答案:B

16、URL循环是通过使用多个URL地址进行数据采集。

A、正确

B、错误

正确答案:A

17、分页循环采集是指把一页数据分成多页进行采集。

A、正确

B、错误

正确答案:B

18、采集器⽆法识别验证码。

A、正确

B、错误

正确答案:B

19、Cookie登录中Cookie长期存在,所以是登录采集中,最方便的采集方式。

A、正确

B、错误

正确答案:B

20、Ajax可以通过在后台与服务器进行少量数据交换,可以重新加载整个网页。

A、正确

B、错误

正确答案:B

21、不同于基于关键词搜索的传统搜索引擎,知识图谱可用来更好地查询复杂的关联信息,从语义层面理解用户意图,改进搜索质量。()。

A、正确

B、错误

正确答案:A

22、如果设置了Ajax技术的网页,在采集设置时,没有勾选Ajax加载,则不能进行采集。

A、正确

B、错误

正确答案:B

23、XPath语言是网页内容定位语言,它可以帮助采集工具查找网页内容在网页中的位置。

A、正确

B、错误

正确答案:A

24、XPath中,Text()函数,主要功能为选中指定文本内容的元素。

A、正确

B、错误

正确答案:A

25、XPath中,contains(参数1,参数2),主要功能为选中参数1中包含参数2中内容的元素。

A、正确

B、错误

正确答案:A

26、XPath中,last(),主要功能为选中同胞元素中最后一位的元素。

A、正确

B、错误

正确答案:A

27、XPath中,position(),主要功能为描述元素在同胞元素中的位置。

A、正确

B、错误

正确答案:A

28、在公安经侦领域通过对网络敏感信息监控比对管理,帮助公安经济侦查工作的开展和提供数据层面的支持。

A、正确

B、错误

正确答案:A

29、空值是指缺失或不知道具体的值,可能是一条记录中的某个属性缺失,也可能是整条记录都丢失。

A、正确

B、错误

正确答案:A

30、数据质量的数据一致性是指在数据库中,不同表中存储和使用的同一数据应当是等价的,表⽰数据有相等的值和相同的。

A、正确

B、错误

正确答案:A

31、数据质量的时效性是指有些数据会随时间而变化的。

A、正确

B、错误

正确答案:A

32、数据质量的可信性由三个因素决定:数据来源的权威性、数据的规范性、数据产生的时间。

A、正确

B、错误

正确答案:A

33、由于操作员重复录入,并发处理等不规范的操作,导致产生不完整,不准确的,⽆效的数据也可以用在数据分析⾥。

A、正确

B、错误

正确答案:B

34、处理空缺值的基本方法有6种,包括忽略元组、人工填写空缺值、使用全局常量替换空缺值、使用属性的中⼼度量填充空缺值、使用与给定元组属同一类的所有样本的平均值来填充空缺值、使用最可能的值填充空缺值。

A、正确

B、错误

正确答案:A

35、噪声数据也可以用于数据挖掘进行分析。

A、正确

B、错误

正确答案:B

36、孤立点的是不符合数据模型的数据。

A、正确

B、错误

正确答案:A

 

37、数据集成是指将互相关联的分布式异构数据源集成到一起,使用户能够以透明的方式访问这些数据源。

A、正确

B、错误

正确答案:A

38、实体识别,它所解决的问题是如何匹配多个信息源在现实世界中的实体事物。

A、正确

B、错误

正确答案:A

39、文本标注需要按照自然语言处理的要求进行标注,其中自然语言处理的英简称是NPL。

A、正确

B、错误

正确答案:A

40、情感语音方面的研究理论与方法尚不成熟,而人类情感具有复杂性和个性化的特点,给其研究带来诸多困难。

A、正确

B、错误

正确答案:A

41、语音转换可以理解为如下语音处理过程:先通过语音识别将输入语音转换为文字,对文字进行转换,再将转换之后的文字通过语音合成技术输出新的语音。

A、正确

B、错误

正确答案:B

42、计算机具有从图像中识别物体的能力,但是图像噪音较大时识别率不高。

A、正确

B、错误

正确答案:A

43、自然语言是人类创造,是一种为某些特定目的而创造的语言。

A、正确

B、错误

正确答案:B

44、尺寸标注表示的是机件的真实大小,应以图样上所注的尺寸数值为依据,与图形的大小及绘图准确度无关。

A、正确

B、错误

正确答案:A

45、线性尺寸的数字一般注写在尺寸线的下方或中断处。

A、正确

B、错误

正确答案:B

46、计算机视觉的任务还包括人眼不擅长的工作,例如图像中涉及场景、人物的三维重建。与很多学科都有密切关系,例如数字图像处理、模式识别、机器学习、计算机图形学等。

A、正确

B、错误

正确答案:A

47、强人工智能观点认为可能创造出真正推理和解决问题的智能机器。

A、正确

B、错误

正确答案:A

48、智能音箱本质上是音箱、智能语音交互系统、互联网、内容叠加的产物。

A、正确

B、错误

正确答案:A

49、Pandas中利用merge函数合并数据表时默认的是内连接方式。

A、正确

B、错误

正确答案:A

50、医疗健康领域,人工智能在医学影像方面的应用被认为最不可能率先实现商业化。

A、正确

B、错误

正确答案:B

51、强人工智能观点认为可能创造出真正推理和解决问题的智能机器。

A、正确

B、错误

正确答案:A

52、自然语言处理并不是一般地研究自然语言,而在于研制能有效地实现自然语言通信的计算机系统,特别是其中的软件系统,但它并不属于计算机科学的一部分。

A、正确

B、错误

正确答案:B

53、Json格式的数据就是python中的字典。

A、正确

B、错误

正确答案:B

54、Flink的流水线运行时系统可以执行批处理和流处理程序,但是不支持迭代算法。

A、正确

B、错误

正确答案:B

55、Python代码的注释只有一种方式,那就是使用#符号。

A、正确

B、错误

正确答案:B

56、Python支持使用字典的“键”作为下标来访问字典中的值。

A、正确

B、错误

正确答案:A

57、、已知x为⾮空列表,那么表达式sorted(x,reverse=True)==list(reversed(x))的值一定是True。

A、正确

B、错误

正确答案:B

58、在Python3.x中语句print(*[1,2,3])不能正确执行。

A、正确

B、错误

正确答案:B

15、在UTF-8编码中一个汉字需要占用3个字节。

A、正确

B、错误

正确答案:A

60、如果仅仅是用于控制循环次数,那么使用foriin range(20)和foriin range(20,40)的作用是等价的。

A、正确

B、错误

正确答案:A

61、机器学习是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。

A、正确

B、错误

正确答案:A

62、python中如果导入cv2,使用cap=cv2.VideoCapture(0)表示打开笔记本的内置摄像头。

A、正确

B、错误

正确答案:A

63、计算机视觉(Computer Vision)是指利用摄像机和电脑代替人眼,使得计算机拥有类似于人类的那种对目标进行分割、分类、识别、跟踪、判别决策的功能。

A、正确

B、错误

正确答案:A

64、决策树学习是一种逼近离散值目标函数的方法,学习到的函数被表⽰为一棵决策树。

A、正确

B、错误

正确答案:A

65、使用pip命令安装库的时候,为了提高效率,有时会使用国内镜像安装库,命令格式是pipinstall+库名+-m+镜像地址。

A、正确

B、错误

正确答案:B

66、pytorch通常需要用户编写自定义训练循环,训练循环的代码风格因人而异。有3类典型的训练循环代码风格:脚本形式训练循环,函数形式训练循环,类形式训练循环。

A、正确

B、错误

正确答案:A

67、对抗神经网络可以通过两个神经网络的博弈,达到更好的学习效果。正确。

A、正确

B、错误

正确答案:A

68、监督学习需要有大量标注好的数据集来对模型进行训练。

A、正确

B、错误

正确答案:A

69、RNN循环神经网络是用来处理文本、视频、音频等序列数据。

A、正确

B、错误

正确答案:A

70、DNN是卷积神经网络。

A、正确

B、错误

正确答案:B