本專案為「統計基礎及 R 語言應用」課程的期末報告。主要目標為運用公開數據集進行嚴謹的統計分析,探討各變數間的關聯性與影響,並以學術、專業的方式呈現研究結果。
chapters/: 存放報告各章節的原始碼檔案 (.md)。data/: 存放原始數據集 (CSV 檔案)。output/: 存放所有由腳本自動產生的結果。figures/: 存放所有視覺化圖表。final_report_integrated.md: 整合後的期末報告全文(Markdown 格式,彙整所有章節內容,便於檢閱與提交)。statistical_methods.md: 統計方法與模型說明(詳細記錄本專案所用的統計分析方法、模型設定及其應用說明)。
scripts/: 存放所有執行的 R 分析腳本。prompt_master_outline.md: 定義報告大綱及各章節分析方向的提示文件。README.md: 專案說明文件(本文件)。
本專案使用以下三個主要數據集進行分析:
-
salary_data_100_113.csv(產業薪資資料)- 來源:行政院主計總處
- 內容:包含民國 100 年至 113 年各主要行業別的「經常性薪資」與「總薪資」統計數據,以及其年度增長率。
- 用途:用於分析不同行業間薪資結構的差異及其成長趨勢。
-
tcte_birth_cohort_statistics_100_113.csv(出生世代與統測人數對照)- 來源:內政部戶政司 & 技專校院入學測驗中心
- 內容:將統測學年度(100-113)與其對應的考生出生年份(民國 82-95 年)進行對照,並包含該年度的出生總人口數與統測總報名人數。
- 用途:用於計算出生人口轉化為技職考生的比例,評估少子化對技職教育生源的影響。
-
tcte_registration_100_114.csv(統測各群類報名人數)- 來源:技專校院入學測驗中心
- 內容:詳細列出民國 100 年至 114 年間,統測各專業群類(如機械群、電機與電子群、餐旅群等)的報名人數。
- 用途:用於觀察不同群類的招生趨勢,並作為分析產業薪資結構對群類選擇影響的依據。
本專案中的所有視覺化圖表與統計分析均由 R 腳本自動產生,確保分析流程的可重現性與科學性。
需求:
- 已安裝 R 環境 (R version 4.0.0 或以上)。
- 已安裝 R 的相關套件。
執行步驟:
-
安裝套件: 開啟 R 環境,並執行以下指令來安裝所有必要的套件:
install.packages(c("readr", "dplyr", "tidyr", "ggplot2", "svglite", "gghighlight", "scales", "stringr"))
-
執行腳本: 在專案的根目錄下,開啟終端機(Command Prompt, PowerShell, Terminal),並依序執行以下所有指令以產生完整的分析結果:
Rscript scripts/2_descriptive_analysis.R Rscript scripts/3-1_analysis.R Rscript scripts/3-2_analysis.R Rscript scripts/3-3_analysis.R Rscript scripts/3-4_analysis.R
注意: 若系統提示
Rscript不是可辨識的指令,請確認 R 的安裝路徑已加入系統環境變數PATH。可將 R 的bin資料夾路徑(如C:\Program Files\R\R-4.x.x\bin)新增至PATH。執行成功後,所有最新的圖表與分析結果將會被儲存至
output/figures/及output/資料夾中。