第6回 模倣はいけないのか? 「AIはハトに勝てるか?」の探究活動
[6-1]模倣を積極的に取り入れた探究活動
皆さん、こんにちは。テラオカ電子です。一般に「研究」では、独創性(オリジナリティ)が求められます。したがって、模倣は良くないとされます。第6回「AIはハトに勝てるか?」では、これを逆手に積極的に模倣をした探究活動を述べます。この活動は、「研究」としては、独自性がないのですが、視点を変えて「教育」としてみれば、面白いものになったと考えています。最後までお付き合いください。
この探究活動の狙いは、2つありました。一つは、優れた研究を模倣すれば研究方法を学ぶことができるのではないかということです。模倣した「優れた研究」というのは、1995年に慶應義塾大学文学部名誉教授の渡辺茂先生が行った「ピカソとモネの絵を見分けるハトの研究」で、イグノーベル賞(Awards makes people Laugh and then Think)を受賞した研究です。これは、ハトに道具的条件付けの弁別学習を行った研究です。
「イグノーベル賞」とは
生徒に「イグノーベル賞」って知ってる?と聞いたら「知らない」と答えた生徒がいました。せっかく「権威?」ある研究で、興味を高めようとしたのですが、少し残念でした。でも、これを機会に関心を持ってくれました。ちなみに、中野信子氏は、『人は、なぜ他人を許せないのか?』の中で、「大変残念なことですが、日本国内においては、独創的で自由な研究は、大規模になるほどやりにくい土壌があるのかもしれません。半面、日本人研究者はイグノーベル賞(「人を笑わせ、そして考えさせる研究」に対して贈られる、ノーベル賞のパロディ)の常連です。これは、お金がかからず小規模でできる研究であれば、結果を出しやすいということを端的に示しているように思います」と言っています。高校生の探究学習は、お金がありませんので、イグノーベル賞の研究は、参考になると思います。
もう一つの狙いは、生徒たちが、AIの工程(作り方)を体験してAIの理解を深めることです。ちなみに、私は、AIの理解(AIリテラシー)を高めるには、「AIの仕組み」と「AIの活用」と、この「AIの工程」を学ぶことがよいのではないかと考えています。今回の探究活動は、AIの工程に焦点を当てています。
また、探究活動では、教員が主体となるのか、生徒が主体となるのか、どちらに軸足を置くかが問題となりますが、今回の探究活動は、教員(私)が主体となって取り組ませた活動です。よく探究活動は、生徒主体でないといけないという声を聴くのですが、探究活動の狙いや生徒の状況(今回の場合はAIについての生徒の既有知識)を考慮して、教員主体で進めました。
「学習者中心アプローチ」と「教育者中心アプローチ」
佐藤浩章:『高校教員にための探究学習入門』で、「プロジェクト学習自転車」モデル(Trilling & Fadel 2009)が紹介されています。ここで、「このモデルに従えば、教員が主体か生徒が主体かという問いに対する唯一の最適解は存在しないことになります。・・・探究学習をデザインする教員が、目の前の生徒の状況や各校の文脈にあわせて、ステップ毎に最適なバランスを設定できます。」とあります。
今回も、最初に【研究の背景】を述べたあと、次に【研究の目的】、【研究方法】、【実験結果】、【考察】、【まとめ】を述べ、最後に本探究活動の【評価】を述べたいと思います。
なお、今回も第3、4回で紹介した「いじめの研究」と同様、生徒がサイエンスコンテストで発表したものを、私が代読した形ですがYouTubeで公開しています。ご視聴いただくと研究の全体像を把握できます。
【テラオカ電子:「「AIはハトに勝てるか!」を公開します。」はこちらから】
[6-2] 生徒にイグノーベル賞という関心の高いテーマで注意を喚起
【研究の背景】
では、研究の背景です。この研究も、3年生が「課題研究」という授業で行ったものです。
渡辺先生は、この研究で、ピカソとモネの絵をそれぞれ10枚ずつハトに見せて訓練させました。すると、ハトは訓練を繰り返すうちに、ピカソの絵のときだけその画面をつつくようになりました。また、逆に、モネの絵のときだけつつくようにも訓練できました。しかし、これだけでは、ハトは、用意した10枚ずつの絵を丸覚えしただけかもしれません。そこで、覚えさせた10枚以外の作品も見せました。それでもハトはピカソとモネの絵を判別できました。したがって、ハトは、絵を丸覚えしたわけではなく、絵の持つ共通の性質を覚えたことになります(汎化性能がある)。
さらに、印象派(モネ)とキュービズム(立体派・ピカソ)の絵の違いは、一般的に輪郭線が決め手とされますが、絵をぼかしたり、あるいは白黒にしたりしてもハトは判別できることを示しました。これらのことから、ハトは決定的な手掛かりを頼りにしているわけではなく、総合的に絵を見て判別していると考えられます。結論として、渡辺先生は、ハトは絵全体のイメージを捉えており、絵の見方は人間と近いと報告しています。
そこで、私たちは、AIモデルにハトの訓練と同じようにピカソとモネの絵を学習させ、2つの絵を見分けられるかを検証することにしました。本研究の目的は、渡辺先生が行ったハトへの学習条件と近い状態でAIを学習させ、AIがハトと同じように判別できるのかを検証することです。
なお、上記の渡辺先生の研究は、「ハトがピカソとモネの絵を見分ける!?動物から学ぶ人間の心理:渡辺 茂氏【イグノーベル賞インタビュー Laugh and Think 第5回】」という記事を参考にしました。しかし、今回アクセスしたらサービス終了になっていました。ご興味のある方は、すみませんが、元論文にあたってください。今回の探究活動では、元論文にはあたらず、この記事の情報だけで探究を進めています。探究学習をきちんと行う際には、先行研究調査を十分にする必要があります。
[6-3] ハトの研究と対比させる
【研究方法】
本研究では、まず、渡辺先生が行ったハトへの学習条件と近い状態で、AIを学習させます。
ここで、AIモデルの学習や推論には、ラズベリーパイを使いました。ラズベリーパイは、低価格の小型のコンピュータですが、機械学習のライブラリーを扱えるPython言語が使えます。本研究では、簡単なAIモデル(詳細は後述します)を使い、また扱う画像(絵)も少ないことから、ラズベリーパイで十分に使用に耐えうると考えました。また、昨年度の先輩が作ったAIモデルを使っています(うまくいくと、おおよそ予想ができるため)。
次に、学習を終えたら、AIに絵の持つ共通の性質を学習しているかを、AIに学習した絵と異なる絵を判定させることで汎化性能(意味は後述)を検証します(推論)。
さらに、AIは、絵を全体的に見て判別しているのかを、渡辺先生と同様に、AIに白黒(グレースケール)にした絵や、ぼかした絵を判定させることで検証します。
本探究活動では、生徒に研究の方法をハトの研究と比較するように指導しました。汎化性能をみるために、どうして学習に使っていない絵でないといけないのか、また、どうして、白黒にした絵や、ぼかした絵を判定させることが、絵を全体的に判別しているかの検証に繋がるのかを指導しました。当時、生徒たちが、十分に納得できたかどうかは不明ですが、研究方法を理解するために重要な点です。
「汎化(はんか)性能」とは
Bingチャットの回答:
「汎化性能」は、機械学習モデルが未知のデータに対してどれだけ適切に予測や分類ができるかを示す指標です。つまり、訓練データだけでなく、未知のデータに対しても正確に予測できる能力のことを指します。
例えば、あるモデルが訓練データに対して非常に高い精度を示している場合でも、そのモデルが未知のデータに対して同じような精度を示せない場合、そのモデルの汎化性能は低いと言えます。逆に、訓練データだけでなく未知のデータに対しても高い精度を示すモデルは、高い汎化性能を持つと言えます。
機械学習の目的は、汎化性能が高いモデルを作成することであり、この汎化性能が高いほど、モデルは未知のデータに対しても適切に対応できると言えます。したがって、機械学習モデルを設計する際には、汎化性能を最大化することが重要となります。
[6-4] AIの工程(作り方)を体験してAIの理解を深める
【実験結果】
1 画像の収集
YouTubeの動画をスクリーンショットで収集しました。図1に収集した絵の画像の一部を示します。ピカソの絵は、23枚、モネの絵は、76枚収集しましたが、学習には、それぞれ20枚を使用しました。渡辺先生のハトの訓練では、各10枚ですが、AIの場合、10枚では少なすぎて学習がうまくいかなかったので20枚としました(これで十分なのかどうかは検証していません)。
画像の選別は、ピカソの絵20枚を基準に、それに近いと思われるモネの絵を20枚選択しました(合計40枚)。例えば、人物ならば人物、植物ならば植物という具合です。
【くりりん:『パブロ・ピカソ作品集』はこちらから】
【Beautiful world:『印象派画家」クロード・モネ(Claude Monet)の絵画』はこちらから】
ある研究大会で、この探究活動を紹介したとき、「ピカソの絵は、色々な特徴のものがあるのではないか?初期の作品はだいぶ違っているよ。」と指摘を受けました。ピカソについては、斎藤孝:『天才の読み方 究極の元気術』の中で、その凄さが書かれていますが、ピカソの作品スタイルの多様さや、その作品数の多さ(6万点とも8万点ともいわれている)は、半端ではありません。なので、AIをピカソの絵の「鑑定AI」として構築することが目的であれば、ピカソの絵を隈なくAIに学習させる必要がありますが、しかし、今回の研究では、人が見て、「何となくピカソ」だと分かることが、AIに分かるかどうかを検証するのですから、人が見て「ピカソ」と分かる絵をAIの学習データとしています。
2 AIモデルの定義
AIのモデルには、画像分類に一般的に使われているCNN(Convolutional Neural Network:畳み込みニューラルネットワーク)を使いました。CNNは、画像認識の分野において高い精度を生んでいるネットワークです。
AIモデルの技術的内容に関しては、この記事では割愛します。申し訳ありませんが、専門書をあたってください。今回使ったモデルは、以下の通りです。これは、クジラ飛行机、杉山陽一、遠藤俊輔:『PythonによるAI/機械学習アプリの作り方』という書籍を参考にしています。書籍では、VGG likeと呼ばれるモデルとして紹介されています。今回は、これをさらに簡素化したモデルにしました。なお、入力画像は、148×148ピクセルに変換しています。また、昨年度の先輩生徒が、ニッパとワイヤーストリッパーとドライバーの画像分類を様々なCNNで比較研究を行ったのですが、その結果として、このモデルが一番安定して学習できたからです。
3 AIモデルの学習
最初に予備実験をします。学習データとしてピカソ、モネそれぞれ各20枚準備します。学習は、この学習データを訓練データ80%(合計32枚)と学習を検証するデータ(以下検証データ)20%(合計8枚)に分割して行いました。これは、どの程度のエポック数(学習更新回数)まで進めるかを把握するためです。エポック数を、25回まで学習させました。この時の学習させた精度と損失誤差の推移結果を図2および図3に示します。青線が訓練データ、橙線が検証データを示しています。
これらの結果からエポック数が約8回以上で過学習(訓練データに適合しすぎる)の傾向がみられたので、次に、訓練データとして、全学習データ(合計40枚)でエポック数を8回としてモデル構築のための本学習を行いました(8回が妥当かどうかは検証していません)。図4および図5に、全学習データで学習した精度および損失誤差の結果を示します。学習データでの精度はおよそ70%でした。損失誤差は、きれいに減少していますので、うまく学習が進んだと考えられます。
4 汎化性能の評価
3枚、学習には使っていない画像)で、上記のモデルで推論(判定)を行いました。これらの画像は、人が見て、「ピカソらしい」、「モネらしい」ものを選んでいます。図6にその推論結果を示します。
結果、ピカソについては、2つはピカソと正しく分類できました。モネについては、3つ全てでモネと正しく分類できました。しかしながら、その確率値の差は、僅差でした。
5 総合的分別かどうかの評価
次に、テスト画像をグレースケールにした画像で推論(判定)を行いました。グレースケール画像は、まず、カラー画像をOpenCVのcvtColor()関数を使ってグレースケール画像に変換します。AIモデルは、カラー画像しか入力できないので、そのグレースケール画像(1次元)を3次元になるように配列をコピーして推論を行いました。図7に推論結果を示します。結果、ピカソについては、1つしかピカソと正しく分類できませんでした。モネについては、3つ全てでモネと正しく分類できました。しかしながら、その確率値の差は、僅差でした。
さらに、テスト画像をぼかした画像で推論を行いました。画像のぼかしは、OpenCVのGaussianBlur()関数を使いました。これは、ガウシアンフィルタと呼ばれ、2Dガウス関数にしたがって重み計算を行うものです。フィルタの形状は、中央部分の重みが大きく、同心円状です。ぼかしの範囲は、(11,11)画素としました。またその標準偏差は、関数で自動的に決まる設定としました。図8に推論結果を示します。ピカソについては、2つピカソと正しく分類できました。モネについては、3つ全てでモネと正しく分類できました。しかしながら、その確率値の差は、これも僅差でした。
[6-5]【考察】
本研究では、以下のように考察をまとめました。
- 図6より、AIモデルは、1枚を除いて、訓練データと異なる画像でも、ピカソとモネの絵を判別できました。このことからAIもハトと同じように絵を丸覚えしたわけではないことがわかりました。
- 図7より、グレースケール画像にすると、ピカソの絵と正しく判定する2枚の画像の確率が、6から23%減少しました(1枚はモネと誤った)。一方、モネの絵と正しく判定していた3枚の画像の確率は、2%程度、モネの絵の方に確信が高まりました。このことからAIモデルは、グレースケール画像にするとモネの絵への確信が高まる傾向があることがわかりました。これは、人が見てもそう感じるので、自然であるといえます。
- 図8より、ぼかし画像にしても、グレースケール画像と同じ傾向を示しました。ただしその影響は、グレースケール画像よりも少なかった。
以上より、AIモデルもハトと同様、訓練画像でない画像をおおむね判別できたこと、また、グレースケール画像やぼかし画像にするとモネと判断する傾向がみられますが、その傾向は3つのテスト画像で同じ傾向であり、また、人と同じ感覚であることから、ピカソとモネの絵の全体的な特徴をつかんでいるとしました。
[6-6]【まとめ】
まとめです。以上、本研究では、渡辺先生のハトの弁別学習の研究にそって、AIモデルを評価しました。
まず、AIは、絵の持つ共通の性質を獲得しているかを、AIに学習した絵と異なる絵を判定させることで汎化性能を検証しました。その結果、訓練画像でないテスト画像においてもおおむねピカソとモネの絵を判別できることを示しました。
さらに、AIは、絵を全体的に見て判別しているのかを、グレースケール画像にした絵や、ぼかした絵を判定させることで検証しました。その結果、全体的にモネの絵だとする確率が増加し、その傾向はテスト画像に共通にみられるものでした。この傾向は、人が見てもそう感じるところなので自然です。
以上、本研究により、ハトの弁別学習の研究手法をもとに、AIモデルは、ハト同様、ピカソとモネの絵の全体的な特徴をつかんでいることを示しました。ただし、本研究では、一つのAIモデルをもとに検証を行ったものです。AIモデルは、そのハイパーパラメータを変えることでその特性は変化します。また、モデル構造自体も多くのものがあります。今後は、絵の分類が得意なAIモデルで追検証をしていくことが必要です。
今回の探究活動では、イグノーベル賞という、高校生にとっても興味のあるテーマ?に取り組みました。AIと「ハト」を比較することで、学習とはどういうことなのかということに関心を向けるきっかけにもなった研究として意義があったと考えています。
[6-7] 「フィードバックを最もたくさん得るものが勝ち残る。」(ケン・ブランチャード)【評価】
最後に、この探究活動の評価を述べたいと思います。
この研究も第3、4回で紹介した「いじめ」の研究と同様、2つのコンテストに出しています。
一つは、県内の大学が主催する高校生対象のサイエンスコンテストです。
写真は、ポスター発表の様子です。本来は、生徒たちが発表するのですが、この時、「流行り病」のため欠席でしたので、やむなく私が他校の生徒に説明しました。AIの関心は高くて、多くの生徒が熱心に話を聞いてくれました。
また、審査員の大学の先生に、この研究テーマは、「生徒が研究方法を学ぶために、優れた研究を模倣する授業としてデザインしたものです」とお話したところ、「大変面白い」と興味を持っていただきました。もちろん、コンテストとしては、私がポスター発表している時点で審査対象外ですが。
もう一つは、読売新聞社が主催している日本学生科学賞です。こちらは論文審査だけですが、丁寧な講評が記載された「審査カード」を返してくれます。
「いじめ」の研究の時と同様、「課題研究」の振り返りとして、これら2つの専門家からの講評をフィードバックとして生徒に伝えています。こうすることで生徒のメタ意識が高まり研究方法の理解が深まります。
サイエンスコンテストからの講評では、
非常に興味深い研究であるが、たとえば指標となる形とか色とかの要素に分解して、もう少し詳細な研究・分析を実施したほうが科学的になると考える。
ハトでの先行研究の対象をAIにかえた研究とした点で、現代的であり、よい着想の研究だったと思います。パネル発表の説明で、成果がだされた研究方法に沿って高校生が行うことで、研究とはどんなものかを体験してほしいという目的がこの研究の背景にあることを聞いて、こうした研究体験は高校生にとって意味あるものだと感じました。今後は、高校生の発想や着想を取り入れて、さらに研究を進めていって欲しいと願います。
とコメントをいただきました。
また、日本学生科学論文賞の講評では、
ピカソとモネを見分けるハト」というイグノーベル賞を受賞した研究をベースに、AIも同様のことができるのかという問いを立て、実際にCNNを使って調査している。身近になったAI技術をまさに「日曜大工」のように活用し、ぼかし画像やグレースケール画像なども使ってその認識能力を調べた点は評価できる。今後はそれらの技術を使いながら、より独自性のある問題を設定し、その解決を図る研究テーマを見つけてステージアップして欲しい。
と講評をいただきました。
本探究活動を十分にご理解いただきましたので、嬉しいです。生徒も喜んでいました。ありがとうございました。
最後に、今回の探究活動の「仮説」について述べます。
この探究活動の目的は、「研究方法」を学ぶことでした。そして、それを実現するために「優れた先行研究を模倣すれば研究方法を深く理解できるのではないか」という仮説を設定し、探究活動を実施しました。具体的には、イグノーベル賞の研究を模倣したのでした。
一般に「研究」とは、
①問いを立て、こうすればうまくいくという
②仮説を設定し、それを
③実験・観察して検証し、最後に
④問いの答えを論文やプレゼンで発表すること
とされています。問いを立てることも難しいのですが、仮説を設定することも難しいです。
今回は、「研究方法」学ぶことに対して、いろいろなアプローチを考えましたが、王道である「模倣」を考えました。次に、どんな模倣がよいかですが、ハトの学習を思い出してイグノーベル賞の模倣としました。こうした仮説を作り出す推論の方法としてパースが提唱した「アブダクション」があります。仮説をうまく作ることができれば、その問題の「解き方」も得ることができるので、有用な思考法です。
羽田庸祐氏は、『問題解決力を高める「推論」の技術』の中で、アブダクションを「新たな仮説を発見する推論法」として、
アブダクション=「起こった現象」に対して「法則」を当てはめ、起こった現象をうまく説明できる仮説を導き出す推論法と定義しています。この定義に沿って、今回の私の仮説をあてはめると、
起こった現象:生徒は、「研究方法」を知らない。
法則の当てはめ:模倣すれば効率よく理解できる。
導かれる仮説:よって、「優れた先行研究を模倣すれば研究方法を深く理解できるのではないか」
となります。
【「パースのアブダクション」についての参考サイトはこちらから】コテンto 名著:『パースのアブダクション』(注)この例では、「起こった現象」と「法則の当てはめ」の順が逆になっています。
これで、「AIはハトに勝てるか! -ピカソとモネの絵の分類における認識の比較-」の探究活動の紹介は終わりです。最後まで読んでくれて、ありがとうございます。
ご質問・ご意見・ご感想等がありましたらコメントください。
テラオカ電子
【YouTube動画:藤井 風 – 花 (Official Video)】
季節の変わり目である6月のある日、16歳の高校生カップルが、スーパーマーケットに来ています。アイスクリームを買ってレジ出ようとしたとき、入り口の横に、七夕の笹が置かれているのに気づきました。見ると、幾つかの「願い事」が書かれた短冊がかかっています。「早く走れますように」とか「頭がよくなりますように」とか「コロナがはやく終息しますように」とか書かれています。高校生の二人は、『今、とっても幸せです』と書いて笹につけました。織姫と彦星が二人を永遠に見守っていることでしょう。
【2023/11/26投稿】
コメント