一、單項選擇題(本大題共 30 小題)
1、1943 年,麥卡洛克(McCulloch)與皮茨(Pitts)提出的 M-P 模型的主要貢獻是( )。
① 首次實現(xiàn)了多層感知機的訓練算法
② 提出了模擬生物神經(jīng)元工作原理的簡化數(shù)學模型
③ 解決了異或(XOR)問題
④ 發(fā)明了反向傳播算法
2、1958 年羅森布拉特提出的感知器(Perceptron)與 M-P 模型相比,最重要的改進是( )。
① 使用了非線性激活函數(shù)
② 引入了可學習的連接權重
③ 增加了隱藏層
④ 支持反向傳播
3、單層感知器被證明無法解決異或(XOR)問題,這直接導致了( )。
① 神經(jīng)網(wǎng)絡第一次研究低潮(1969 年左右)
② 反向傳播算法的發(fā)明
③ 卷積神經(jīng)網(wǎng)絡的提出
④ 深度學習的興起
4、在 M-P 神經(jīng)元模型中,神經(jīng)元輸出為 1 的條件是( )。
① 所有輸入信號均為 1
② 輸入信號的加權和大于等于閾值
③ 至少有一個輸入信號為 1
④ 輸入信號的加權和小于閾值
5、以下關于單層感知器局限性的描述,正確的是( )。
① 只能處理二分類問題
② 只能解決線性可分問題
③ 無法使用激活函數(shù)
④ 只能處理圖像數(shù)據(jù)
6、為了突破單層感知器的線性可分局限,有效的改進方法是( )。
① 增加更多輸入特征
② 堆疊多個感知器形成多層感知機(MLP)并引入非線性激活函數(shù)
③ 使用更大的學習率
④ 減少訓練數(shù)據(jù)
7、激活函數(shù)在神經(jīng)網(wǎng)絡中的核心作用是( )。
① 增加模型的參數(shù)數(shù)量
② 引入非線性變換,使神經(jīng)網(wǎng)絡能夠擬合復雜的非線性關系
③ 將輸出值限制在 0 到 1 之間
④ 加快模型訓練速度
8、以下關于 Sigmoid 函數(shù)的描述,錯誤的是( )。
① 輸出值被壓縮到 (0,1) 區(qū)間
② 函數(shù)光滑且可導
③ 在輸入絕對值較大時,梯度趨近于 0,容易導致梯度消失
④ 輸出關于原點對稱
9、在多分類神經(jīng)網(wǎng)絡的輸出層,通常使用的激活函數(shù)是( )。
① Sigmoid
② Tanh
③ ReLU
④ Softmax
10、以下關于 ReLU 激活函數(shù) ReLU(x)=max(0,x) 的描述,正確的是( )。
① 輸出值始終為正數(shù)
② 當輸入小于 0 時,輸出為 0,可能導致神經(jīng)元“失活”
③ 函數(shù)關于原點對稱
④ 梯度始終為 1
11、前饋神經(jīng)網(wǎng)絡(Feedforward Neural Network)的特點是( )。
① 神經(jīng)元之間存在循環(huán)連接,具備記憶功能
② 信息從輸入層經(jīng)過隱藏層單向傳遞至輸出層,無反饋
③ 每個神經(jīng)元與同一層其他神經(jīng)元相連
④ 必須包含至少三個隱藏層
12、在深度神經(jīng)網(wǎng)絡的參數(shù)學習過程中,正確的訓練步驟順序是( )。
① 前向傳播 → 誤差估計(損失計算) → 反向傳播 → 參數(shù)更新
② 反向傳播 → 前向傳播 → 參數(shù)更新 → 誤差估計
③ 參數(shù)更新 → 前向傳播 → 誤差估計 → 反向傳播
④ 誤差估計 → 前向傳播 → 反向傳播 → 參數(shù)更新
13、在梯度下降法中,學習率(Learning Rate)的作用是( )。
① 控制每次參數(shù)更新的步長大小
② 決定使用多少樣本計算梯度
③ 設置隱藏層的神經(jīng)元數(shù)量
④ 選擇激活函數(shù)的類型
14、以下關于不同樣本選取策略的描述,正確的是( )。
① 全梯度下降(Full-Batch)每次使用全部樣本,計算開銷大,但梯度準確
② 隨機梯度下降(SGD,batch size=1)梯度穩(wěn)定,收斂平滑
③ 小批量梯度下降(Mini-batch)無法在計算效率和穩(wěn)定性之間取得平衡
④ 實際訓練中從不使用小批量梯度下降
15、為了在訓練過程中動態(tài)調整學習率,以下哪種優(yōu)化器通過累積歷史梯度平方來自適應調整?( )
① SGD
② Adagrad
③ Momentum
④ Nesterov
16、以下優(yōu)化器中,結合了動量(Momentum)與自適應學習率機制,并在深度學習中被廣泛應用的是( )。
① Adagrad
② RMSprop
③ Adam
④ SGD
17、以下哪個選項是深度學習框架的主要作用?( )
① 替代算法設計,自動生成神經(jīng)網(wǎng)絡結構
② 提供高級接口和自動微分功能,簡化模型構建、訓練和部署過程
③ 只能運行在 CPU 上,不支持 GPU 加速
④ 專門用于數(shù)據(jù)可視化
18、目前學術研究和工程實踐中常用的深度學習框架之一是 PyTorch,其核心優(yōu)勢不包括( )。
① 動態(tài)計算圖,易于調試和靈活構建模型
② 強大的社區(qū)支持和豐富的預訓練模型
③ 編程風格符合 Python 直覺,學習曲線平緩
④ 僅支持圖像數(shù)據(jù),不支持文本和語音
19、在 PyTorch 中,核心的數(shù)據(jù)結構是 Tensor(張量)。以下關于 Tensor 的描述,正確的是( )。
① Tensor 只能表示二維矩陣
② Tensor 可以支持 GPU 加速和自動求導
③ Tensor 與 NumPy 數(shù)組完全不兼容
④ Tensor 的數(shù)據(jù)類型只能是浮點數(shù)
20、在 PyTorch 中,若要執(zhí)行兩個二維矩陣的標準乘法(矩陣乘),應使用( )。
① torch.mul
② torch.add
③ torch.mm 或 @ 運算符
④ torch.dot
21、卷積神經(jīng)網(wǎng)絡(CNN)中,實現(xiàn)“局部連接”和“參數(shù)共享”的核心層是( )。
① 全連接層
② 池化層
③ 卷積層
④ Dropout 層
22、池化層(Pooling Layer)的主要作用不包括( )。
① 降低特征圖的空間維度,減少計算量
② 增強模型對微小位移和形變的魯棒性
③ 提取圖像的邊緣、角點等低級特征
④ 壓縮信息,保留最顯著特征
23、殘差網(wǎng)絡(ResNet)通過引入( )有效緩解了深層網(wǎng)絡的梯度消失和退化問題。
① 更深的卷積層
② 批量歸一化(Batch Normalization)
③ 殘差連接(Skip Connection / Shortcut)
④ Dropout 正則化
24、循環(huán)神經(jīng)網(wǎng)絡(RNN)相比前饋神經(jīng)網(wǎng)絡的核心特點是( )。
① 使用卷積操作提取空間特征
② 引入了循環(huán)連接,使信息可以跨越時間步傳遞,具備處理序列數(shù)據(jù)的能力
③ 只能處理固定長度的輸入
④ 不需要激活函數(shù)
25、為了緩解 RNN 在處理長序列時的梯度消失問題,提出的兩種經(jīng)典變體是( )。
① CNN 和 GAN
② LSTM 和 GRU
③ AlexNet 和 VGGNet
④ Transformer 和 BERT
26、長短期記憶網(wǎng)絡(LSTM)中,負責決定從細胞狀態(tài)中丟棄哪些舊信息的結構是( )。
① 輸入門
② 遺忘門
③ 輸出門
④ 更新門
27、生成對抗網(wǎng)絡(GAN)由生成器和判別器組成,其訓練過程可以概括為( )。
① 生成器獨立優(yōu)化,判別器不參與
② 兩者協(xié)同生成相同的輸出
③ 生成器試圖生成逼真數(shù)據(jù)“欺騙”判別器,判別器努力區(qū)分真假,兩者交替訓練達到納什均衡
④ 判別器負責生成內容,生成器負責鑒別
28、擴散模型(Diffusion Model)的核心思想是( )。
① 通過對抗博弈生成數(shù)據(jù)
② 學習一個將純噪聲逐步去噪還原為清晰數(shù)據(jù)的反向過程(逆向擴散)
③ 使用自注意力機制處理序列
④ 直接擬合數(shù)據(jù)分布的概率密度函數(shù)
29、以下哪一項是循環(huán)神經(jīng)網(wǎng)絡(RNN)及其變體(LSTM、GRU)典型適用的任務類型?( )
① 圖像分類
② 語音識別與文本生成
③ 目標檢測
④ 圖像語義分割
30、在 PyTorch 中,若要在每次反向傳播前清除模型參數(shù)的累積梯度,正確的做法是( )。
① optimizer.step()
② loss.backward()
③ optimizer.zero_grad()
④ model.forward()
二、判斷題(本大題共 5 小題)
1、多層感知機(MLP)通過堆疊多個感知器并引入非線性激活函數(shù),能夠解決異或(XOR)等線性不可分問題。( )
2、在卷積神經(jīng)網(wǎng)絡(CNN)中,全連接層通常位于卷積層和池化層之后,負責對提取的特征進行全局整合與高階推理。( )
3、RNN 在訓練過程中使用隨時間反向傳播(BPTT),隨著時間步增加,梯度可能呈指數(shù)級衰減或增長,這就是梯度消失和梯度爆炸問題。( )
4、生成對抗網(wǎng)絡(GAN)的訓練過程中,生成器和判別器的能力需要保持平衡,否則容易出現(xiàn)訓練不穩(wěn)定或模式崩潰。( )
5、在 PyTorch 中,張量(Tensor)的 requires_grad 屬性設置為 True 時,PyTorch 會自動跟蹤其上的所有運算,以便后續(xù)調用 backward() 計算梯度。( )
“點贊有美意,贊賞是鼓勵”
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.