第30回 好きな小説はなんですか?(ミニ探究学習)

第30回 好きな小説はなんですか?(ミニ探究学習)

「探究学習をやってみよう(その1):小説の文章スタイル分析」の探究活動

皆さん、こんにちは。テラオカ電子です。これまで、私が高校で指導してきた探究活動を「打ち上げ花火」的に紹介してきました。今回は、このブログ記事も第30回になりましたので(ネタが無くなったわけではありません)、皆さんが実際に行うことができる探究学習の教材を紹介します。コンピュータさえあれば簡単にできるものです。時間も2,3時間あればできます。ぜひトライしてください。ようするに、今回は、実際に「探究学習をやってみよう」です。

目次

【1今回の探究学習の概要】

はじめに、今回取り組んでいただく探究学習の概要を説明します。

さて、皆さんは、どんな小説をよく読みますか?どんな小説が好きですか?小説に興味がある方なら今回の探究学習は面白いと思います。興味がなくてもやっているうちに面白くなることもありますから、面倒がらずに取り組んでください。

小説には、作家の文章スタイルがありますね。好きな作家の作品を読み続ける方も多いと思いまが、そこには、その作家独特の言い回しとか、言葉の使い方にほれ込むこともあるのではないでしょうか?そこで、同じ作家の作品であれば、似たような文章スタイルを持っていることを、統計的に分析します。分析方法として作品の特定の品詞(動詞とか形容詞など)の出現頻度に着目して、それを多次元尺度法を使って、作品間の距離が近いか遠いかを計算し、グラフで可視化します。

多次元尺度法という難しい分析手法に関しては、後ほど説明しますが、この理論の計算方法に関しは、さくっとイメージを掴んでいただくだけでOKだと考えます。計算は、コンピュータが瞬時に行ってくれます。プログラムも公開しますので、それをダウンロードして頂ければよいです。

プログラムは、pythonです。ほとんどの学校では、教科「情報Ⅰ」でpythonを学習していると思いますので、あまり抵抗はないと思います。プログラムが全く分からないという方でも、ボタンをクリックしていくだけで、分析ができますので、心配は不要です。ただし、このpythonプログラムは、Google Colaboratory上で動作させます。なのでGoogleのアカウント(無料)が必要になります。Googleの回し者ではありませんが、これは、現代の「運転免許」のようなものですので、持っていると大変便利です。

では、概要はこれくらいにして、探究学習を楽しみましょう。

【2研究の問い:テーマを決めよう】

それでは、まず、探究のテーマを決めましょう。いきなりテーマを決めるのは難しいと思いますので(もし、思いつたテーマがあれば、忘れないようにメモしておきましょう)、今回は、夏目漱石の『それから』と『三四郎』、芥川龍之介の『羅生門』と『蜘蛛の糸』、そして宮沢賢治の『セロ弾きのゴーシュ』と『銀河鉄道の夜』を扱うことにします。これら、6作品の類似度を分析します

ただ、これでは、あまりにも恣意的ですので、補足説明します。これら3人の小説家を取り上げた理由は、一つには、作品のテキストデータを「青空文庫」のサイトから簡単にダウンロードできる点です。やり方は、次の【3準備】のところで説明します。二つ目は、教科書でよく取り上げられていて高校生に馴染があるからです。

次に、どの作品を分析するかですが、同じ作家でも文章スタイルは、作品によって異なることがあります。そこで、私は、文学に詳しくないので、ChatGTP(3.5の無料版)に訊いてみました。

以上、いささか安易ではありますが、ChatGPTからの回答を参考に、上記の挙げた6作品を選びました。これは、あくまでも一例です。違った観点から選んでもよいですし、また、ChatGPTが選んだものと、自分の感覚で選んだものとの比較をテーマとするのでもよいと思います。

さらに、もう一作品を加えます。生成AIが浸透してきたので、生成AIが作る作品も加えたいと思います。追加するテーマは、「生成AIは、小説家の文章スタイルを真似することができるか」です。ChatGPTは、どれほどうまく真似ができるか楽しみですね。それでは、テーマを決めたならば、いよいよ準備に入りましょう

【3準備】

(補足)とりあえず動かした場合は、①から③を省略してもできます。

青空文庫から小説をダウンロードしよう。

「青空文庫」のサイトから、作品(「テキストファイル」)を選びダウンロードします。

 ②ダウンロードしたZIPファイルから作品のテキストファイルを取り出そう。

テキストファイルの文章の中で、説明部分を削除(デリート)しよう。

これは、純粋に小説の文章だけで分析するためです。削除したら上書き保存してください。

私のGitHubからプログラムをダウンロードしよう。
「Code」ぼボタンからプルダウン表示させて、ZIPファイルでダウンロードできます。

Google Driveにファイルをアップロードしよう。
Googleのアカウントが必要です。MyDriveに自分でフォルダ(名前は自分で決めてください)を作り、そこに④でダウンロードしたファイルをアップロードします。下図のようになればOKです。
私の場合は、「novel_style」のフォルダの下にアップロードしています(下図)。

以上で、準備は完了です。次は、いよいよプログラムを走らせよう。

【4プログラムの動作】

  1. 「python_tajigen_ver1.ipynb」をダブルクリックしてGoogle Colaboratoryを立ち上げよう。

右クリックで「アプリで開く」からでもOKです。

【「Google Colaboratory」の使い方はこちらを参考にしてください】

  1. ファイルを立ち上げたら、下図のコードセルの左の三角ボタン(赤○で示した場所)を順にクリックしていきます。

実行したいセルを選択してSHIFT + ENTER でもOKです。下図は、三角ボタンを押した後の状態です。

  1. 次のコードセル「ドライブのマウント」のセルを押して、ドライブのファイルをアクセスできるようにしましょう。

ポップアップのウインドウが出たら「次へ」や「続行」を押していってください。

  1. 元のテキストファイル:input_folderと作成したテキストファイル:output_folderのパスをご自身のフォルダのパスに書き換えよう。

左の「1」フォルダのアイコンクリックして、左のサイドウインドウからアップロードしたフォルダを表示させ、「2」C_00(C_01も同様、後のresultも同じやり方)のフォルダを右クリックします。そして現れたプルダウンの中から「パスをコピー」をクリックします。「3」それを右のプログラムのダブルクオテーションの中に貼り付けます。

  1. 抽出する品詞を設定しよう。ここを書き換えてください。

名詞は、固有名詞が含まれるので、外してあります。ここを変えて分析がどう変わるかを探究テーマとするのも面白いかもしれません。

  1. 次のパスも書き換えよう。

このセルを実行させると単語の頻度表(下図)が作成されます。

  1. 作成された単語の頻度表を保存しよう。

結果のresultフォルダのパスを書き換えてください。④を参考にしてください。

次のセルを実行させて、多次元尺度法で計算したグラフを表示させよう。

これで、作業は終わりです。楽勝でしたね。

【5AIで小説を書く】

応用として、ChatGPTで文章を作成します。以下を参考にしてください。一回の問い合わせでは、生成される文章が短いので、「続けてください」を何度も繰り返してください。今回は、漱石風の文章を作ることにしました。出だしは、オリジナルなものにしています。

こうして作成した文章をメモ帳に貼り付けていき、ドライブにアップして分析します。

小説を書くAIは、たくさんありますので、調べてください。この違いを分析するテーマも面白いと思います。

【6考察】

多次元尺度法で2次元グラフにした結果は以下のようなものでした(再掲)。

夏目漱石と芥川龍之介のそれぞれの2つの小説は近い位置になりました。宮沢賢治の作品は互いに離れていますが、他の2人とも離れていることが分かります。また、漱石風のAIは漱石の作品に近くなりました。

作品の原文にあたる必要がありますが(ここは重要です)、単語の出現頻度という単純な分析でも、各作品の文章スタイルを分析できるようです。 今回分析に使った多次元尺度法は、各要因(多次元)間での距離を求めるものです。この距離の違いにより類似度を知ることができます。

【「多次元尺度法」についてはこちらを参考にしてください】

【7まとめ】

今回は、小説のスタイル分析を行う探究活動を紹介しました。この方法を応用して、ご自身の興味のあるテーマを設定して探究を進めてください。

面白い分析ができましたら、本サイト(CQゼミ)の「問い合わせ」から教えてください。また、プログラムが動かなかったり、何かトラブルがあったりしたら、教えてください。直ぐには、返信できませんが、対応していきます。

では、人生が楽しくなる探究活動ライフをおくりましょう。

今回は、ここまでです。

テラオカ電子 

(追記)

今回は、pythonを使って分析を行いましたが、Rを使った同様の分析も行っています。こちらから観ることができます。参考にしてください。

【テラオカ電子:「文章生成AIによる文章スタイルの分析」を行いましたので報告します。】

【イチオシのYouTube動画】

このコーナでは、記事に関連する(関連しないかもしれません)気になるYouTube動画を紹介しています。今回は、鈴木瑛美子『フロントメモリー』(2018)を紹介します。この曲は、映画「恋は雨上がりのように」の主題歌で、人気バンド「神聖かまってちゃん」のカバーです。私は、この原作漫画も映画も観ていないのですが、一度このMVを見ただけで大体内容が分かってしまう不思議な動画です(ただしクライマックスは隠されているのかもしれませんが)。一方、小説は、細々と読んでいかないと分からないものです。動画の力を思い知らされます。学習に関しても、以前は、テキストを読んで知識を得ていましたが、最近は、動画で勉強することが普通になりました(コロナでリモート授業が普通になった)。なので、このブログ記事もできるだけYouTubeを活用したハイブリットのコンテンツにしていきたいと考えています。

小松菜奈が全力疾走! 映画「恋は雨上がりのように」主題歌「フロントメモリー」MVが公開

【2024/03/24投稿】

よかったらシェアしてね!
  • URLをコピーしました!
  • URLをコピーしました!

この記事を書いた人

目次