今回は、ChatGPTにデータ分析を手伝ってもらおう。
なお、本稿では、「無料版」でご紹介している。
データ分析の例
先ずは、Excelで、次のような表データを作成してみよう。

[ファイル]-[名前を付けて保存]を選択する。
[名前を付けて保存]ダイアログボックスが表示されるので、[ファイルの種類]ボックス一覧から「CSV(カンマ区切り)」を選択する。
[保存先]を指定して、[保存]ボタンをクリックする。
ここでは、「test1.csv」とする。
csvファイル
Name,Japanese,Mathematics,English,Student ID
Taro,83,88,75,A001
Giro,66,90,90,B001
Saburo,100,82,83,B002
Hanako,60,76,78,A002
Chika,92,63,65,C001
Kenta,73,100,95,C002
「チャットボックス」の「クリップ」ボタンをクリックすると、「test1.csv」をアップロードできる。

そして、以下の通り質問してみよう。
会話例

わたし
このデータからわかることを教えてください。

ChatGPT
このデータには以下の情報が含まれています:
列(カラム)の構成:
Name: 生徒の名前Japanese: 国語の点数Mathematics: 数学の点数English: 英語の点数Student ID: 学生ID
基本情報:
- 全体のデータは6行5列です。
- 各列には欠損値がなく、完全なデータセットです。
- 点数はすべて整数(
int64)、名前と学生IDは文字列(object)として記録されています。
サンプルデータ:
| Name | Japanese | Mathematics | English | Student ID |
|---|---|---|---|---|
| Taro | 83 | 88 | 75 | A001 |
| Giro | 66 | 90 | 90 | B001 |
| Saburo | 100 | 82 | 83 | B002 |
| Hanako | 60 | 76 | 78 | A002 |
| Chika | 92 | 63 | 65 | C001 |
このデータを使って、以下のような分析が可能です:
- 科目別の得点分布や平均値・中央値の計算
- 総合得点によるランキング作成
- 学生ごとの得意科目・苦手科目の特定
特定の分析をリクエストいただければ、さらに詳細をお伝えします!

わたし
各科目の得点分布やヒストグラムを教えてください。

ChatGPT

こちらは各科目(国語、数学、英語)の得点分布を示すヒストグラムです:
- 国語: 高得点(90点以上)が多い傾向があります。
- 数学: 点数は比較的分散していますが、80点以上の得点者が多めです。
- 英語: 60点から90点までの範囲で点数がばらけています。
さらに分析が必要であればお知らせください!
このように、データ分析の提案から、実際に分析まで行ってくれる。
(参考)ChatGPTプログラミング1年生 森 巧尚 (著) 翔泳社



コメント