Skip to content

anonymaew/bdi-hackathon-2026-sampled-dataset

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

12 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

BDI Hackathon 2026 Sampled Dataset

ชุดข้อมูลตัวอย่างสำหรับการแข่งขัน BDI Hackathon แบ่งเป็น 8 Dataset 3 Track

Important

ชุดข้อมูลนี้เป็นชุดข้อมูลตัวอย่างเท่านั้น ไม่ใช่ชุดข้อมูลเต็ม ใช้สำหรับประกอบการเขียน Proposal และระดมไอเดีย ผู้เข้ารอบเท่านั้นถึงจะได้ชุดข้อมูลเต็ม

Data Overview

ชื่อชุดข้อมูล Track สไลด์นำเสนอ คำอธิบาย
ชุดข้อมูลสเปกตรัม NMR สำหรับตรวจรูปแบบสารเคมี Phenome สไลด์ NMR Spectrum (sample: PDF, full: TSV/CSV) : ~20,000+ feature/ตัวอย่าง — สัญญาณแปลงเป็น intensity × ppm แล้ว พร้อม compound annotation บางส่วน; ใช้ ML จำแนกสารประกอบ/ระบุ biomarker
ชุดข้อมูลสารเมตาบอไลต์ NMR สำหรับเปรียบเทียบผู้ป่วย Phenome สไลด์ Metabolite Abundance (TSV, 486 samples, 20K+ columns) : ค่าปริมาณสารเมตาบอไลต์ + metadata ของตัวอย่าง; เปรียบเทียบผู้ป่วยเบาหวาน+ความดัน vs. กลุ่มควบคุม; ใช้ค้นหา biomarker จำนวนน้อยที่สุดที่แยกโรคได้แม่นยำ
ชุดข้อมูล EMR ผู้ป่วยความดันแบบติดตามยาว Health สไลด์ Hypertension EMR (XLSX, 150K patients, sampled 100) : ข้อมูล longitudinal แบ่ง Period ทุก 60 วันรอบวันวินิจฉัย; มี Vitalsign, Lab (HbA1c, lipid), Comorbidity, ยา (ARB/CCB/ACEI); ใช้วิเคราะห์ประสิทธิภาพยา, พยากรณ์ความเสี่ยงหัวใจ/ไต
ชุดข้อมูล EMR ผู้ป่วยเบาหวานแบบติดตามยาว Health สไลด์ Diabetes EMR (XLSX, 70K patients, sampled 100) : ข้อมูล longitudinal แบ่ง Period ทุก 60 วัน; มี HbA1c, C-peptide, ยา (metformin/insulin/GLP-1); แบ่ง Type 1 ~2K, Type 2 ~50K, Unknown ~20K; ใช้จำแนกประเภท, พยากรณ์ HbA1c/แทรกซ้อน
ชุดข้อมูลคลื่นของเครื่องช่วยหายใจจากผู้ป่วย ICU Health สไลด์ Ventilator Waveform (CSV/JSON, 17K records) : สัญญาณ 3 แกน (Flow/Pressure/Volume) บันทึก 25 Hz, 24 ชั่วโมง/วัน, ติดต่อกัน 2–3 สัปดาห์ + patient demographics/diagnosis/handling; ใช้ตรวจจับความผิดปกติ, พยากรณ์ ICU stay, จำแนกโหมดการช่วยหายใจ
ชุดข้อมูลภาพกล้องจราจรเมืองขอนแก่น Smart City Traffic Video + Count Statistics (35 videos + 25 points) : วิดีโอ 35 คลิปจาก YouTube + สถิติ 25 จุดตรวจ (แยก Car/Motorcycle/Truck พร้อมพิกัด GPS); ใช้ Unique Vehicle Counting, จำแนกประเภทยานพาหนะ, วิเคราะห์ความหนาแน่นตามพื้นที่/เวลา
ชุดข้อมูลสแกน 3 มิติ เมืองขอนแก่น Smart City 3D Point Cloud / Mesh (tar.gz, 1,274 tiles, sampled 12) : ข้อมูลสแกนเมืองขอนแก่นพร้อม texture และ metadata จัดเป็น Grid Tile; ใช้ตรวจจับวัตถุ 3D (อาคาร, ยานพาหนะ, ต้นไม้), วิเคราะห์ผังเมือง, เปรียบเทียบการเปลี่ยนแปลงพื้นที่
ชุดข้อมูลบันทึกคำร้องจากประชาชน เทศบาลนครขอนแก่น Smart City Municipal Complaints (XLSX, 46K records, sampled 462) : คำร้องประชาชนต่อเทศบาลนครขอนแก่น พร้อมวันที่รับ-เสร็จ, เขต/ชุมชน, สถานะ, ส่วนงาน; ใช้ NLP จัดหมวดหมู่ข้อความ, วิเคราะห์ประสิทธิภาพการแก้ปัญหา, พยากรณ์วันเสร็จ, Heatmap ความหนาแน่นตามพื้นที่

Note

ชุดข้อมูลทั้งหมดผ่านการ anonymization เรียบร้อย ไม่สามารถโยงกลับไปหาเจ้าของข้อมูลเดิมได้

About

Sampled Datasets for BDI Hackathon 2026

Topics

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

 
 
 

Contributors