AP過去問 令和7年度春期 午前 問3

提供:yonewiki
2025年4月23日 (水) 00:41時点におけるYo-net (トーク | 投稿記録)による版 (→‎回答・解説)
(差分) ← 古い版 | 最新版 (差分) | 新しい版 → (差分)

AP過去問 令和7年度春期 午前 問題に戻る

AP過去問 令和7年度春期 午前 問2前の問題へ

AP過去問 令和7年度春期 午前 問4次の問題へ

 

問3(問題文)

 AIにおける機械学習の過程において、過学習と疑われたときの解消方法として、最も適切なものはどれか。


ア 訓練したときと同じ精度を出すために、訓練データをテストデータとして使用する。

イ 精度を高めるために、元の訓練データに加工を施し、訓練データの量を増やす。

ウ 予測した結果に近づけるために、モデルをより複雑にする。

エ より多くの未知のデータに対して予測できるように、汎化性能を下げる。

 

回答・解説

 この問題は、機械学習において過学習(オーバーフィッティング)が疑われる場合に、どのような対応が適切かを問うものです。


 過学習とは、モデルが訓練データに過度に適合してしまい、新しいデータ(未知のデータ)に対する予測性能が低下する現象です。これを防ぐ、または解消するには、モデルがより一般的なパターンを学べるような工夫が求められます。


は❌間違いです。訓練したときと同じ精度を出すために、訓練データをテストデータとして使用する。

→これは不適切です。訓練データをテストデータとして使用すると、モデルの性能評価が正しくできず、過学習に気付けなくなる恐れがあります。

は✅正しいです。精度を高めるために、元の訓練データに加工を施し、訓練データの量を増やす。

→これは適切です。データの拡張(データオーギュメンテーション)によって訓練データを多様化させることで、モデルがより汎化しやすくなり、過学習の抑制につながります。

は❌間違いです。予測した結果に近づけるために、モデルをより複雑にする。

→これは不適切です。モデルを複雑にすると、さらに訓練データに過度に適合する可能性が高まり、過学習が悪化する恐れがあります。

は❌間違いです。より多くの未知のデータに対して予測できるように、汎化性能を下げる。

→これは不適切です。未知のデータに対応するには汎化性能を高めることが重要であり、下げるのは逆効果です。


 したがって



 が答えです。


 汎化性能とは、機械学習モデルが訓練に使っていない未知のデータに対しても正しく予測できる能力のことを指します。


 もう少しやさしく言いかえると、


 訓練データにだけ詳しくなるのではなく、初めて見るデータにも対応できる力

 ということです。


 具体例を使って説明します

 たとえば、犬と猫の画像を分類するAIを作っているとします。

 訓練データには「特定の犬や猫の画像」しか含まれていないとします。

 モデルがその訓練データの犬や猫の特徴(たとえば背景や画像の明るさなど)ばかり覚えてしまうと、他の画像にうまく対応できません。

 この状態は過学習です。つまり「訓練データにだけ詳しくなった」状態です。


 それに対して、

 モデルが犬や猫の一般的な特徴(耳の形や体の輪郭など)を学び、

 初めて見る犬や猫の画像でも正しく分類できるようになった

 このようなモデルは汎化性能が高いといえます。


 過学習への対策として「データを使いまわす=加工(データ拡張)」はとても有効ですが、やみくもに加工するのではなく、意味のある加工(その問題に合った加工)をすることが大切です。

 以下に、加工の仕方とそのコツを紹介します。

データ加工(データ拡張)のコツ

1. タスクに沿った加工をする

加工方法はタスクの種類(画像・音声・テキストなど)や、モデルの目的に応じて変えるべきです。

たとえば画像分類なら:

回転・反転・拡大縮小

→ 物体の向きや位置に依存しないようにするため。

明るさ・色合いの変更

→ 照明条件の違いに強くなる。

切り出し・ノイズの付与

→ カメラのブレや背景の違いを再現。

 ただし、たとえば「手書き文字認識」のような場合は、180度回転すると「6」と「9」が逆転するなど、やってはいけない加工もあります。なので、そのデータに意味を損なわない変形だけを使うことが重要です。結局、学習するしかないんですけど、ほかの方法もありますが選択肢にはないだけです。例えばリセットするとか、違うファクターをいじるとかがあるんです。けど、エの未知のデータに対応したいという思いを提示しておきながら汎化性能を下げるというワードで騙しているわけです。いやらしい問題です。


 過学習には、最適なデータでさらに学習させる方法があるという、一見、さらに学習させるようにみせかけてデータを適切に加工してるんだぞってところをサラッと加工という一言で片づけているんですね。どんな加工なのか一切言わないのは卑怯な選択肢であると思いますが、この問題は過去にも出ていて、味を占めた問題なのでしょう。ちょっとした知識のある人をおとしめる問題なんですね。


やだな。こういう姑息な問題が嫌ですね。問題を作った人も、採用した人も根性悪いので、死んだら地獄に行きますね。IPAの関係者全員を敵に回してでもいっておきたいですね。根性が悪いとね。

 

AP過去問 令和7年度春期 午前 問2前の問題へ

AP過去問 令和7年度春期 午前 問4次の問題へ

AP過去問 令和7年度春期 午前 問題に戻る