今回は、ChatGPTにデータ分析を手伝ってもらおう。
なお、本稿では、「無料版」でご紹介している。
データ分析の例
先ずは、Excelで、次のような表データを作成してみよう。
[ファイル]-[名前を付けて保存]を選択する。
[名前を付けて保存]ダイアログボックスが表示されるので、[ファイルの種類]ボックス一覧から「CSV(カンマ区切り)」を選択する。
[保存先]を指定して、[保存]ボタンをクリックする。
ここでは、「test1.csv」とする。
csvファイル
Name,Japanese,Mathematics,English,Student ID
Taro,83,88,75,A001
Giro,66,90,90,B001
Saburo,100,82,83,B002
Hanako,60,76,78,A002
Chika,92,63,65,C001
Kenta,73,100,95,C002
「チャットボックス」の「クリップ」ボタンをクリックすると、「test1.csv」をアップロードできる。
そして、以下の通り質問してみよう。
会話例
わたし
このデータからわかることを教えてください。
ChatGPT
このデータには以下の情報が含まれています:
列(カラム)の構成:
Name
: 生徒の名前Japanese
: 国語の点数Mathematics
: 数学の点数English
: 英語の点数Student ID
: 学生ID
基本情報:
- 全体のデータは6行5列です。
- 各列には欠損値がなく、完全なデータセットです。
- 点数はすべて整数(
int64
)、名前と学生IDは文字列(object
)として記録されています。
サンプルデータ:
Name | Japanese | Mathematics | English | Student ID |
---|---|---|---|---|
Taro | 83 | 88 | 75 | A001 |
Giro | 66 | 90 | 90 | B001 |
Saburo | 100 | 82 | 83 | B002 |
Hanako | 60 | 76 | 78 | A002 |
Chika | 92 | 63 | 65 | C001 |
このデータを使って、以下のような分析が可能です:
- 科目別の得点分布や平均値・中央値の計算
- 総合得点によるランキング作成
- 学生ごとの得意科目・苦手科目の特定
特定の分析をリクエストいただければ、さらに詳細をお伝えします!
わたし
各科目の得点分布やヒストグラムを教えてください。
ChatGPT
こちらは各科目(国語、数学、英語)の得点分布を示すヒストグラムです:
- 国語: 高得点(90点以上)が多い傾向があります。
- 数学: 点数は比較的分散していますが、80点以上の得点者が多めです。
- 英語: 60点から90点までの範囲で点数がばらけています。
さらに分析が必要であればお知らせください!
このように、データ分析の提案から、実際に分析まで行ってくれる。
(参考)ChatGPTプログラミング1年生 森 巧尚 (著) 翔泳社
コメント