一、單項選擇題(本大題共 15 小題)
1、根據湯姆·米切爾(Tom Mitchell)對機器學習的定義,一個計算機程序被稱為可以學習,是指它能夠針對某個任務 T 和某個性能指標 P 從經驗 E 中學習,其特點是( )。
① 程序在 T 上的被 P 所衡量的性能會隨著經驗 E 的增加而提高
② 程序不需要任何數據即可自動提升性能
③ 程序必須通過人工編寫規則來更新知識
④ 程序的性能與經驗 E 無關
2、在機器學習的三要素中,作為模型學習的“經驗來源”的是( ),實現“規律”的具體體現的是( )。
① 模型;數據 ② 學習過程;算法
③ 數據;模型 ④ 算法;數據
3、以下關于監督學習的描述,正確的是( )。
① 訓練數據不包含標簽,模型自主發現規律
② 訓練數據包含輸入特征和對應的期望輸出(標簽)
③ 監督學習只能用于分類任務,不能用于回歸任務
④ 監督學習不需要劃分訓練集和測試集
4、在回歸任務中,因變量的特征是( );在分類任務中,因變量的特征是( )。
① 連續的數值;離散的類別標簽
② 離散的類別標簽;連續的數值
③ 文本字符串;數值
④ 無序的集合;有序序列
5、線性回歸模型的基本形式為 y = ax + b,其核心用途是( )。
① 預測離散類別
② 預測連續數值(如房價、溫度)
③ 將數據劃分為多個簇
④ 降低數據維度
6、關于 K 近鄰(KNN)算法的描述,錯誤的是( )。
① KNN 算法通過計算待分類樣本與訓練樣本之間的距離來尋找最近鄰
② KNN 算法的預測結果受 K 值選擇的影響
③ KNN 算法在預測階段通常需要計算待預測樣本與訓練樣本之間的距離,計算成本較高
④ KNN 算法的預測結果與距離度量和特征尺度無關
7、在常見分類決策樹算法中,選擇分類分裂特征時常用的衡量標準不包括( )。
① 信息增益 ② 基尼指數
③ 均方誤差 ④ 信息增益比
8、以下關于無監督學習的說法,正確的是( )。
① 無監督學習的訓練數據包含標簽,需要人工標注
② 聚類和降維是無監督學習的典型任務
③ 無監督學習的目標是預測未知樣本的類別標簽
④ 無監督學習無法處理未標注數據
9、降維(Dimensionality Reduction)的核心用途是( )。
① 將相似樣本歸為同一簇
② 減少特征數量,同時盡可能保留數據關鍵信息,用于可視化和簡化計算
③ 預測連續數值
④ 實現二分類
10、K-means 聚類算法中,簇中心更新的方式是( )。
① 隨機選擇新的中心點
② 計算簇內所有樣本的均值作為新中心
③ 選擇簇內距離其他點最近的點作為新中心
④ 保持初始中心不變
11、在模型評估中,用于衡量回歸模型預測誤差的常用指標是( )。
① 準確率(Accuracy) ② 精確率(Precision)
③ 均方誤差(MSE) ④ F1 分數
12、在二分類問題的混淆矩陣中,真正例(TP)表示( ),假正例(FP)表示( )。
① 正類樣本被正確預測為正類;負類樣本被錯誤預測為正類
② 負類樣本被正確預測為負類;正類樣本被錯誤預測為負類
③ 正類樣本被錯誤預測為負類;負類樣本被正確預測為負類
④ 負類樣本被錯誤預測為正類;正類樣本被正確預測為正類
13、以下關于過擬合和欠擬合的說法,正確的是( )。
① 過擬合是指模型在訓練集上表現差,在測試集上也差
② 欠擬合是指模型在訓練集上表現好,但在測試集上表現差
③ 過擬合通常是由于模型過于復雜,學習了數據中的噪聲
④ 增加訓練數據一定可以緩解欠擬合
14、當需要分析“用戶購買行為特征并將用戶自動分群”時,應優先選擇( );當需要預測“明天股票收盤價”時,應優先選擇( )。
① 聚類算法;回歸算法
② 分類算法;降維算法
③ 回歸算法;聚類算法
④ 分類算法;回歸算法
15、精確率(Precision)的計算公式是( ),召回率(Recall)的計算公式是( )。
① TP/(TP+FP);TP/(TP+FN)
② TP/(TP+FN);TP/(TP+FP)
③ (TP+TN)/(TP+TN+FP+FN);TP/(TP+FP)
④ TP/(TP+FP);(TP+TN)/(TP+TN+FP+FN)
二、判斷題(本大題共 5 小題)
1、監督學習可以分為回歸和分類兩大類任務,其中回歸任務的輸出是連續值,分類任務的輸出是離散類別。( )
2、KNN 算法不需要顯式的訓練過程,屬于“懶惰學習”算法。( )
3、K-means 聚類算法需要預先指定聚類數量 K,且對初始簇中心的選擇不敏感。( )
4、在回歸任務中,決定系數 R2 的取值范圍一定是 [0,1],越接近 1 通常表示模型擬合效果越好。( )
5、為了評估模型的泛化能力,通常將數據集劃分為訓練集和測試集,且測試集應參與模型訓練過程。( )
三、編程填空題(本大題共 5 小題)
1、補全以下代碼,使用單變量線性回歸預測房價。已知房屋面積(平方米)與價格(萬元)的數據,請訓練線性回歸模型并預測面積為 85 平方米的房價。
2、補全以下代碼,使用 KNN 算法對鳶尾花數據集進行分類,并計算準確率。
3、補全以下代碼,使用 K-means 算法對生成的二維數據進行聚類,并輸出聚類中心。
4、補全以下代碼,使用交叉驗證評估線性回歸模型的性能。
5、補全以下代碼,對特征進行標準化后訓練線性回歸模型,并輸出模型的系數。
“點贊有美意,贊賞是鼓勵”
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.