人工智能考试

主管题复习资料扣子平台 · 机器学习 · 智能应用开发

题目 1

以含有异常值和缺失值的企业员工考勤数据为例，通过扣子平台搭建与实验要求相同的完整工作流，对比"数据预处理"与"无数据预处理"两个流程的分析结果，验证数据预处理对分析结论的影响。请结合给定的数据集，描述工作流的具体实现步骤。注意标明需要的工作节点及简要功能描述。

数据集

某企业的员工考勤记录，包括员工 ID、部门名称、打卡时间、考勤类型、请假天数、加班时长等信息。

参考：工作流节点功能对照表

步骤	名称	核心功能	操作重点
1	工作流创建与初始化	完成平台登录，搭建基础框架	明确工作流名称，简要描述分析目标（验证预处理对考勤分析结论的影响）
2	数据读取	接入目标数据集，为后续分析提供原始数据支持	正确配置文件路径、数据格式参数，确保考勤数据（员工 ID、部门名称、打卡时间等字段）完整读取
3	选择器节点	拆分分析分支，实现"有预处理"与"无预处理"的并行分析	设定分支判断条件，确保两条路径独立运行，考勤数据不交叉干扰
4	数据预处理代码节点	清洗原始数据，提升数据质量	针对性执行去重（重复打卡记录）、缺失值填充（打卡时间 / 请假天数）、异常值修正（不合理加班时长）等关键操作
5	大模型可视化	转化分析结果为直观报告，呈现核心分析指标	聚焦各部门考勤率、请假时长分布、加班时长统计三大核心维度，生成易对比的可视化图表
6	变量聚合与网页发布	整合两条分支的分析结果，提供可访问的成果载体	确保聚合后数据合为一个数据流，网页链接可正常打开
7	测试与对比	验证工作流有效性，核心对比预处理对分析结论的影响	试运行无报错后，重点对比两条路径下"各部门考勤行为差异"的一致性与偏差

题目 2

某快递公司统计了 40 名快递员的"每日派送单数（件）与当日提成（元）"数据（提成规则为固定单价 + 基础提成，派送单数与提成呈严格线性关系），目标是通过派送单数快速计算提成，提高薪资核算效率。

要求：

（一）请描述基于该数据集构建线性回归模型的完整机器学习流程，写出各核心步骤的目的与内容（注意：目的和内容都要有）。

（二）另外，结合日常生活场景，再举一个符合线性回归核心特征的示例，重点指明示例中的自变量和因变量，并解释采用线性回归模型的依据。

参考

（一）线性回归机器学习流程

数据预处理

目的：规范数据格式、消除干扰因素，确保数据满足线性回归模型的输入要求。

内容包括：

处理缺失值（如补充快递员未记录的派送单数或提成数据）；
检查和处理异常值（如剔除明显不合理的极端派送单数或提成金额）；
数据清洗（去除重复记录的快递员数据）。

数据分析

目的：探索数据内在规律，验证"派送单数"与"当日提成"的线性关联性，为建模提供依据。

内容包括：

描述性统计：计算派送单数的均值、最大值、最小值，以及提成的均值、方差等统计特征；
数据可视化：绘制散点图，观察派送单数与提成是否呈现明显的线性趋势。

数据集划分

目的：分离训练数据与测试数据，避免模型过拟合，客观评估模型的泛化能力。

内容包括：

按 7:3 或 8:2 的比例随机划分训练集和测试集，保证数据分布的一致性；
训练集用于模型学习派送单数与提成的线性映射关系，测试集用于检验模型在新数据上的预测准确性。

创建模型

目的：确定线性回归模型的参数（固定单价、基础提成），建立派送单数到提成的预测公式。

内容：

定义线性回归模型：设提成 (y) = 固定单价 (w) × 派送单数 (x) + 基础提成 (b)，明确参数 w 和 b；
设定损失函数（如均方误差 MSE），衡量预测值与真实提成的偏差；
选择参数学习方法（如梯度下降法、最小二乘法），最小化损失函数；
输入训练集数据迭代训练，求解最优参数 w 和 b，得到最终预测模型。

模型评估

目的：量化模型的预测效果，判断是否满足薪资核算效率和准确性需求。

内容包括：在测试集上计算误差指标，如 MSE（均方误差）、R²（拟合优度），评估模型预测值与真实提成的贴合程度。

（二）日常生活的线性回归示例

示例：超市苹果的购买重量与付款金额的关系

指明自变量和因变量

自变量：苹果的购买重量（千克），是可主动控制和输入的量；
因变量：付款金额（元），是由购买重量决定的输出量。

采用线性回归的依据

核心思想：自变量每增加一个单位，因变量按固定比例增加。苹果单价固定时，每多买 1 千克，付款金额就增加对应单价的金额，"购买重量增加 → 付款金额增加"呈现严格线性关系，完全符合线性回归"自变量与因变量线性相关"的核心特征。

题目 3

请基于扣子（Coze）应用体平台，结合您所学专业，完成以下内容：

一、课题立项

课题名称：基于大语言模型的汽车 CMF（色彩、材质、工艺）智能设计引擎开发

课题目标：

利用生成式 AI 技术解决汽车设计前期调研中"感性意向"与"理性参数"转化效率低的问题。开发一个能够接收用户模糊风格词（如"未来主义"、"可持续感"），并自动产出符合工业生产逻辑的 CMF 报告（包含 HEX 色码、具体材质建议、表面处理工艺）的智能应用。

课题意义：

理论层面：探索大模型在工业设计垂直领域的知识图谱映射能力，验证 RAG（检索增强生成）技术在 CMF 规范化表达中的准确性。实际应用层面：通过 AI 快速生成标准化的设计语言，降低设计师与工程师、供应商之间的沟通成本，提升设计决策的科学性，适配新能源汽车快速迭代的市场需求。

二、需求分析

功能性需求：

意向解析与生成功能：系统需准确识别用户的自然语言描述，并将其转化为结构化的 CMF 方案。

实现方式：配置大语言模型节点，通过语义分析将模糊词汇映射至专业设计词库。

专业参数自动化输出：系统需自动匹配并输出专业的 HEX 颜色代码及符合工业标准的材质名称。

实现方式：在模型节点配置系统提示词（System Prompt）约束输出格式，确保数据符合工业生产标准。

结果可视化渲染功能：生成的方案需以直观、专业的报表形式呈现。

实现方式：通过 Markdown 渲染组件绑定工作流输出变量，将非结构化文本转化为标准的设计表格。

非功能性需求：

响应性能要求：系统需具备快速响应能力，单次工作流运行及结果返回时间需控制在 10 秒以内，保证设计调研的连续性。

易用性要求：界面设计需符合设计师习惯，操作流程极简，采用"一次输入、一次点击"即可获得完整报告的交互模式。

三、开发设计

界面设计：

布局逻辑：采用居中式纵向布局。顶部为应用标题，中部为核心交互区，底部为结果展示区。操作流程：用户在输入框填入设计风格关键词 → 点击"生成"按钮 → 触发后端工作流 → 界面组件自动更新并显示报告。界面元素：输入框：用于接收用户风格关键词。生成按钮：绑定工作流，设置为点击即触发。结果展示组件：用于渲染复杂的表格数据，将文本转化为标准的设计报告格式。

业务逻辑设计：

工作流设计：开始节点：获取前端界面传来的 Input 变量。LLM 节点：结合预设的"资深汽车工业设计师"系统提示词，对字符串进行专业化扩充与逻辑映射。结束节点：封装最终的 Output 变量，将处理后的数据回传至前端组件。数据处理流程：采用"端到端"的自动化架构，各环节通过变量引用实现数据传递，确保从感性词汇到理性参数转化的一致性。