今回は、ChatGPTにデータ分析を手伝ってもらおう。
なお、本稿では、「無料版」でご紹介している。
データ分析の例
先ずは、Excelで、次のような表データを作成してみよう。

[ファイル]-[名前を付けて保存]を選択する。 
[名前を付けて保存]ダイアログボックスが表示されるので、[ファイルの種類]ボックス一覧から「CSV(カンマ区切り)」を選択する。 
[保存先]を指定して、[保存]ボタンをクリックする。
ここでは、「test1.csv」とする。
csvファイル
Name,Japanese,Mathematics,English,Student ID
Taro,83,88,75,A001
Giro,66,90,90,B001
Saburo,100,82,83,B002
Hanako,60,76,78,A002
Chika,92,63,65,C001
Kenta,73,100,95,C002
「チャットボックス」の「クリップ」ボタンをクリックすると、「test1.csv」をアップロードできる。

そして、以下の通り質問してみよう。
会話例

わたし
このデータからわかることを教えてください。

ChatGPT
このデータには以下の情報が含まれています:
列(カラム)の構成:
- Name: 生徒の名前
- Japanese: 国語の点数
- Mathematics: 数学の点数
- English: 英語の点数
- Student ID: 学生ID
基本情報:
- 全体のデータは6行5列です。
- 各列には欠損値がなく、完全なデータセットです。
- 点数はすべて整数(int64)、名前と学生IDは文字列(object)として記録されています。
サンプルデータ:
| Name | Japanese | Mathematics | English | Student ID | 
|---|---|---|---|---|
| Taro | 83 | 88 | 75 | A001 | 
| Giro | 66 | 90 | 90 | B001 | 
| Saburo | 100 | 82 | 83 | B002 | 
| Hanako | 60 | 76 | 78 | A002 | 
| Chika | 92 | 63 | 65 | C001 | 
このデータを使って、以下のような分析が可能です:
- 科目別の得点分布や平均値・中央値の計算
- 総合得点によるランキング作成
- 学生ごとの得意科目・苦手科目の特定
特定の分析をリクエストいただければ、さらに詳細をお伝えします!

わたし
各科目の得点分布やヒストグラムを教えてください。

ChatGPT

こちらは各科目(国語、数学、英語)の得点分布を示すヒストグラムです:
- 国語: 高得点(90点以上)が多い傾向があります。
- 数学: 点数は比較的分散していますが、80点以上の得点者が多めです。
- 英語: 60点から90点までの範囲で点数がばらけています。
さらに分析が必要であればお知らせください!
このように、データ分析の提案から、実際に分析まで行ってくれる。
(参考)ChatGPTプログラミング1年生 森 巧尚 (著) 翔泳社

 
 

コメント