Skip to content

YanagiSiki/final_report_project

Repository files navigation

「統計基礎及 R 語言應用」期末報告專案

本專案為「統計基礎及 R 語言應用」課程的期末報告。主要目標為運用公開數據集進行嚴謹的統計分析,探討各變數間的關聯性與影響,並以學術、專業的方式呈現研究結果。

目錄結構

  • chapters/: 存放報告各章節的原始碼檔案 (.md)。
  • data/: 存放原始數據集 (CSV 檔案)。
  • output/: 存放所有由腳本自動產生的結果。
    • figures/: 存放所有視覺化圖表。
    • final_report_integrated.md: 整合後的期末報告全文(Markdown 格式,彙整所有章節內容,便於檢閱與提交)。
    • statistical_methods.md: 統計方法與模型說明(詳細記錄本專案所用的統計分析方法、模型設定及其應用說明)。
  • scripts/: 存放所有執行的 R 分析腳本。
  • prompt_master_outline.md: 定義報告大綱及各章節分析方向的提示文件。
  • README.md: 專案說明文件(本文件)。

數據集

本專案使用以下三個主要數據集進行分析:

  • salary_data_100_113.csv (產業薪資資料)

    • 來源:行政院主計總處
    • 內容:包含民國 100 年至 113 年各主要行業別的「經常性薪資」與「總薪資」統計數據,以及其年度增長率。
    • 用途:用於分析不同行業間薪資結構的差異及其成長趨勢。
  • tcte_birth_cohort_statistics_100_113.csv (出生世代與統測人數對照)

    • 來源:內政部戶政司 & 技專校院入學測驗中心
    • 內容:將統測學年度(100-113)與其對應的考生出生年份(民國 82-95 年)進行對照,並包含該年度的出生總人口數與統測總報名人數。
    • 用途:用於計算出生人口轉化為技職考生的比例,評估少子化對技職教育生源的影響。
  • tcte_registration_100_114.csv (統測各群類報名人數)

    • 來源:技專校院入學測驗中心
    • 內容:詳細列出民國 100 年至 114 年間,統測各專業群類(如機械群、電機與電子群、餐旅群等)的報名人數。
    • 用途:用於觀察不同群類的招生趨勢,並作為分析產業薪資結構對群類選擇影響的依據。

如何產生/更新所有圖表與分析結果

本專案中的所有視覺化圖表與統計分析均由 R 腳本自動產生,確保分析流程的可重現性與科學性。

需求:

  • 已安裝 R 環境 (R version 4.0.0 或以上)。
  • 已安裝 R 的相關套件。

執行步驟:

  1. 安裝套件: 開啟 R 環境,並執行以下指令來安裝所有必要的套件:

    install.packages(c("readr", "dplyr", "tidyr", "ggplot2", "svglite", "gghighlight", "scales", "stringr"))
  2. 執行腳本: 在專案的根目錄下,開啟終端機(Command Prompt, PowerShell, Terminal),並依序執行以下所有指令以產生完整的分析結果:

    Rscript scripts/2_descriptive_analysis.R
    Rscript scripts/3-1_analysis.R
    Rscript scripts/3-2_analysis.R
    Rscript scripts/3-3_analysis.R
    Rscript scripts/3-4_analysis.R

    注意: 若系統提示 Rscript 不是可辨識的指令,請確認 R 的安裝路徑已加入系統環境變數 PATH。可將 R 的 bin 資料夾路徑(如 C:\Program Files\R\R-4.x.x\bin)新增至 PATH

    執行成功後,所有最新的圖表與分析結果將會被儲存至 output/figures/output/ 資料夾中。

About

114學年度統計學期末報告

Resources

Stars

Watchers

Forks

Contributors

Languages