AP過去問 令和7年度春期 午前 問3
AP過去問 令和7年度春期 午前 問2前の問題へ
AP過去問 令和7年度春期 午前 問4次の問題へ
問3(問題文)
AIにおける機械学習の過程において、過学習と疑われたときの解消方法として、最も適切なものはどれか。
ア 訓練したときと同じ精度を出すために、訓練データをテストデータとして使用する。
イ 精度を高めるために、元の訓練データに加工を施し、訓練データの量を増やす。
ウ 予測した結果に近づけるために、モデルをより複雑にする。
エ より多くの未知のデータに対して予測できるように、汎化性能を下げる。
回答・解説
この問題は、機械学習において過学習(オーバーフィッティング)が疑われる場合に、どのような対応が適切かを問うものです。
過学習とは、モデルが訓練データに過度に適合してしまい、新しいデータ(未知のデータ)に対する予測性能が低下する現象です。これを防ぐ、または解消するには、モデルがより一般的なパターンを学べるような工夫が求められます。
アは❌間違いです。訓練したときと同じ精度を出すために、訓練データをテストデータとして使用する。
- →これは不適切です。訓練データをテストデータとして使用すると、モデルの性能評価が正しくできず、過学習に気付けなくなる恐れがあります。
イは✅正しいです。精度を高めるために、元の訓練データに加工を施し、訓練データの量を増やす。
- →これは適切です。データの拡張(データオーギュメンテーション)によって訓練データを多様化させることで、モデルがより汎化しやすくなり、過学習の抑制につながります。
ウは❌間違いです。予測した結果に近づけるために、モデルをより複雑にする。
- →これは不適切です。モデルを複雑にすると、さらに訓練データに過度に適合する可能性が高まり、過学習が悪化する恐れがあります。
エは❌間違いです。より多くの未知のデータに対して予測できるように、汎化性能を下げる。
- →これは不適切です。未知のデータに対応するには汎化性能を高めることが重要であり、下げるのは逆効果です。
したがって
イ
が答えです。
汎化性能とは、機械学習モデルが訓練に使っていない未知のデータに対しても正しく予測できる能力のことを指します。
もう少しやさしく言いかえると、
訓練データにだけ詳しくなるのではなく、初めて見るデータにも対応できる力
ということです。
具体例を使って説明します
たとえば、犬と猫の画像を分類するAIを作っているとします。
訓練データには「特定の犬や猫の画像」しか含まれていないとします。
モデルがその訓練データの犬や猫の特徴(たとえば背景や画像の明るさなど)ばかり覚えてしまうと、他の画像にうまく対応できません。
この状態は過学習です。つまり「訓練データにだけ詳しくなった」状態です。
それに対して、
モデルが犬や猫の一般的な特徴(耳の形や体の輪郭など)を学び、
初めて見る犬や猫の画像でも正しく分類できるようになった
このようなモデルは汎化性能が高いといえます。
AP過去問 令和7年度春期 午前 問2前の問題へ
AP過去問 令和7年度春期 午前 問4次の問題へ