Skip to content

weby-homelab/AI-HOMELAB

Repository files navigation

🇺🇦 Українська | 🇬🇧 English

Made in Ukraine License MIT AI Local First Status

🧠 AI-HomeLab

Домашні AI-Лабораторії в Україні 🇺🇦

Локальний ШІ · Мультиагентні системи · Енергоавтономність


Ласкаво просимо до центрального репозиторію ініціативи AI-HomeLab! Цей проєкт створено для того, щоб сформувати в Україні культуру відповідального, безпечного та практичного використання моделей штучного інтелекту та автономних агентів у домашніх умовах із обмеженим бюджетом.

Навіщо це потрібно? Межа між звичайним користувачем ChatGPT та інженером, який вміє локально розгортати, квантувати та оркеструвати ШІ-агентів, визначає майбутнє технологічного ринку праці та цифрової безпеки України.


📌 ЗМІСТ (TABLE OF CONTENTS)


📜 МЕМОРАНДУМ ТА ФІЛОСОФІЯ ПРОЄКТУ

Кожен учасник спільноти AI-HomeLab та контриб'ютор цього репозиторію поділяє чотири фундаментальні принципи:

1. 🛡️ Технологічна Гігієна та Безпека

Ми дотримуємося принципів безпеки та гігієни розробки. Раніше діяла повна заборона на моделі з Китаю. Наразі знято заборону на використання деяких китайських локальних моделей (зокрема, серій Qwen та DeepSeek) виключно з метою локального тестування, порівняння та підвищення продуктивності в агентному кодуванні. Водночас будь-які російські моделі штучного інтелекту та інструменти (на кшталт YandexGPT, GigaChat) перебувають під СУВОРОЮ ТА ДОВІЧНОЮ ЗАБОРОНОЮ. Високоякісні моделі міркування (Reasoning) західного походження (як-от серія Ornith від американської компанії DeepReinforce Team) є вкрай рекомендованими для використання.

Caution

Категорично заборонені моделі та інструменти: YandexGPT, GigaChat, будь-які інші сервіси та моделі від компаній з країни-агресора РФ.

Категорія Інструменти
LLM-моделі Meta LLaMA 4 (Scout/Maverick), Google Gemma 4, Mistral (Large 3 / Medium 3.5 / Small 4), Microsoft Phi-4 (Reasoning/Vision/Multimodal), Qwen 3.6 (Dense/MoE), DeepSeek-V4 (Flash/Pro)
Хмарні API OpenAI (GPT-5.5/5.4, GPT-5.4 mini/nano), Anthropic (Claude 4.x / 4.6 / 4.5), Google (Gemini 3.5/3.1)
Інференс Ollama, vLLM, llama.cpp
Оркестрація LangGraph, CrewAI, PydanticAI

*Примітка: моделі з КНР (Qwen, DeepSeek) допускаються виключно для локального тестування, порівняння та підвищення продуктивності в агентному кодуванні згідно з Меморандумом.

2. 🔒 Локальність та Суверенітет Даних

Чутливі українські дані (персональна інформація, внутрішні документи компаній, локальні реєстри) не мають залишати периметр нашої країни чи персонального комп'ютера.

Ми вчимося розгортати ШІ локально (через Ollama/vLLM), забезпечуючи повну автономність від сторонніх серверів:

flowchart LR
    subgraph SECURE["🏠 Ваш Домашній Сервер — Безпечний Периметр"]
        direction LR
        USER["🧑‍💻 Користувач"]
        UI["🖥️ Open WebUI"]
        LLM["🧠 Ollama / vLLM"]
        DATA["📁 Ваші Дані"]
        EMB["🔗 Embeddings"]

        USER -->|Запит| UI
        UI -->|Інференс| LLM
        LLM -->|Відповідь| UI
        UI -->|Відповідь| USER
        DATA -->|RAG| EMB
        EMB -->|Контекст| LLM
    end

    CLOUD["☁️ Зовнішні Сервери"]
    SECURE -.-x|"🚫 Дані НІКОЛИ\nне залишають периметр"| CLOUD

    style SECURE fill:#0d1117,stroke:#58a6ff,stroke-width:3px,color:#c9d1d9
    style USER fill:#1f6feb,stroke:#58a6ff,color:#ffffff
    style UI fill:#238636,stroke:#2ea043,color:#ffffff
    style LLM fill:#8957e5,stroke:#a371f7,color:#ffffff
    style DATA fill:#d29922,stroke:#e3b341,color:#0d1117
    style EMB fill:#f778ba,stroke:#f778ba,color:#0d1117
    style CLOUD fill:#da3633,stroke:#f85149,color:#ffffff
Loading

3. ⚡ Економічність та Енергоефективність

Ми створюємо рішення, адаптовані до українських реалій. Це означає:

  • Максимум результату на споживчому залізі — RTX 3060/4060/5060 або Apple Silicon
  • Використання безкоштовних/дешевих API — Gemini 3.5 Flash / 3.1 Flash-Lite, GPT-5.4 mini для гібридних систем
  • Агресивна квантизація моделей — Q4/Q8 через GGUF для економії VRAM
  • 🔋 Енергоавтономність (стійкість до відключень) — оптимізація споживання для стабільної роботи лабораторії від інверторів та зарядних станцій (EcoFlow, Bluetti) під час знеструмлень

Tip

Типова домашня лабораторія споживає 80-150W — менше за електрочайник. Одного повербанку на 2000Wh вистачить на 13-25 годин безперервної роботи.

4. 🚀 Практичність та Кар'єрний Ліфт

Домашня лабораторія — це не просто хобі, це найкращий рядок у вашому CV. Ми фокусуємося не на написанні "промптів", а на розробці складної логіки:

  • Мультиагентні системи — автономні команди ШІ-агентів, що вирішують складні задачі
  • RAG (Retrieval-Augmented Generation) — пошук та генерація по вашим документам
  • Type-safe інтеграції — надійний production-ready код із валідацією через Pydantic
  • Реальні пет-проєкти — що конвертуються у офери та успішні продукти

5. 🔄 Архітектурна Взаємодія Компонентів

Сучасна домашня ШІ-лабораторія функціонує як трирівнева архітектура (Оркестрація ↔ Інференс ↔ Інструменти), інтегрована через відкриті та стандартизовані протоколи:

flowchart TD
    ORCH["🏗️ Оркестрація & Логіка\n(LangGraph / CrewAI / PydanticAI)"]
    LOCAL["🧠 Локальний Інференс\n(Ollama / vLLM / llama.cpp)"]
    CLOUD["☁️ Хмарні API\n(GPT-5.5 / Claude 4.6 / Gemini 3.5)"]
    MCP["🔌 Model Context Protocol\n(MCP Servers)"]
    RES["📁 Джерела та Інструменти\n(Files, DBs, Web APIs)"]

    ORCH -->|API запити| LOCAL
    ORCH -->|API запити| CLOUD
    LOCAL -->|Універсальний доступ| MCP
    CLOUD -->|Універсальний доступ| MCP
    MCP -->|Зчитування/Виконання| RES

    style ORCH fill:#1f6feb,stroke:#58a6ff,color:#ffffff
    style LOCAL fill:#8957e5,stroke:#a371f7,color:#ffffff
    style CLOUD fill:#da3633,stroke:#f85149,color:#ffffff
    style MCP fill:#238636,stroke:#2ea043,color:#ffffff
    style RES fill:#d29922,stroke:#e3b341,color:#0d1117
Loading
  • Шар оркестрації керує логікою агентів, збереженням стану діалогів та суворою валідацією типів на рівні Python.
  • Шар інференсу виконує моделі локально або звертається до хмари, використовуючи сумісні API (OpenAI/Anthropic Messages API).
  • Шар інструментів (MCP) надає моделям стандартизований доступ до зовнішніх ресурсів без необхідності написання кастомних конекторів.

⚡ ШВИДКИЙ СТАРТ (Quick Start)

Станом на липень 2026 року (07.2026), ви можете розгорнути локальну ШІ-лабораторію за двома основними сценаріями:

Опція А: Стандартний стек (Ollama + Open WebUI) — Рекомендовано для початківців

Найпростіший шлях для ноутбуків та домашніх серверів.

  1. Встановіть Ollama:
    curl -fsSL https://ollama.com/install.sh | sh
  2. Завантажте сучасну модель сімейства Gemma 4, Qwen 3.6 або DeepSeek V4:
    # Надшвидка мультимодальна edge-модель для слабких ПК (до 8GB RAM):
    ollama pull gemma4:e4b
    
    # Нова флагманська 12B модель з нативним аудіо без енкодерів (потрібно 16GB RAM):
    ollama pull gemma4:12b
    
    # Лідер за точністю кодування та RAG (потрібно 16GB RAM / GPU 12GB+ VRAM):
    ollama pull qwen3.6:14b
    
    # Швидке міркування з CoT (потрібно 16GB RAM / GPU 8GB+ VRAM):
    ollama pull deepseek-v4:flash
  3. Запустіть Open WebUI в один клік через Docker:
    docker run -d \
      --name open-webui \
      -p 3000:8080 \
      --add-host=host.docker.internal:host-gateway \
      -v open-webui:/app/backend/data \
      -e OLLAMA_BASE_URL=http://host.docker.internal:11434 \
      --restart always \
      ghcr.io/open-webui/open-webui:main
    Відкрийте http://localhost:3000 — ваш локальний ChatGPT готовий! 🎉

Опція Б: Професійний стек розробника (llama-server + OpenCode) — Конфігурація WS

Цей стек розгорнуто на нашій виділеній робочій станції WS (IP: 100.68.179.109 / 192.168.2.24) для максимальної швидкості (MTP, Flash Attention, 128K context).

  1. Запуск обчислювального ядра (Llama.cpp Server): Створіть systemd-сервіс /etc/systemd/system/llama-server.service для автоматичного запуску (налаштовано під Xeon E5-2666 v3 + 11GB VRAM на RTX 2080 Ti з використанням локальної reasoning-моделі Ornith-1.0-35B-MTP):
    # start_llama.sh
    /root/llama.cpp/build/bin/llama-server \
        -m /root/llama-models/Ornith-1.0-35B-Q6_K-MTP.gguf \
        -ngl 14 -t 10 -c 128000 -fa on -np 1 -b 512 -ub 512 \
        -ctk q8_0 -ctv q8_0 -fit off \
        --spec-type draft-mtp --spec-draft-n-max 2 \
        --chat-template-kwargs "{\"preserve_thinking\":true}" \
        --host 0.0.0.0 --port 8080
  2. Конфігурація клієнта OpenCode (~/.config/opencode/opencode.jsonc): Прив'яжіть клієнт до локального сервера з підтримкою автоматичного спадання (fallback) на хмару та збереженням думок (preserve_thinking):
    {
      "model": "local-infrastructure/ornith-1.0-35b-it",
      "provider": {
        "local-infrastructure": {
          "npm": "@ai-sdk/openai-compatible",
          "name": "Local Infrastructure (WS)",
          "options": {
            "baseURL": "http://127.0.0.1:8080/v1",
            "apiKey": "sk-llama-cpp-local-token"
          },
          "models": {
            "ornith-1.0-35b-it": {
              "name": "Ornith-1.0 35B Local (MTP)",
              "limit": { "context": 128000, "output": 4096 }
            }
          }
        }
      },
      "lsp": false
    }
  3. Запустіть клієнт:
    opencode --model local-infrastructure/ornith-1.0-35b-it

📊 Моніторинг сесій

Для зручного моніторингу активних сесій OpenCode у реальному часі рекомендується використовувати термінальну утиліту llmtop (професійний інструмент моніторингу локальних LLM-сесій та ШІ-агентів, розроблений Weby Homelab):

  • Відображення заповнення контекстного вікна (context_percent та context_window) на основі вхідних та вихідних токенів.
  • Моніторинг активних сесій, процесів та лімітів.

Important

На Linux переконайтеся, що у вашій системі встановлено sqlite3 (необхідний для зчитування бази даних сесій OpenCode).

Note

Детальні інструкції для кожної платформи (Windows/macOS/Linux) дивіться у розділі docs/setup/.


💻 МІНІМАЛЬНІ ВИМОГИ

Компонент Мінімум Рекомендовано Преміум
CPU 4 ядра (Intel i5/Ryzen 5) 8 ядер (Intel i7/Ryzen 7) Apple M2 Pro+
RAM 8 GB 16 GB 32+ GB
GPU — (CPU-only) RTX 3060 12GB RTX 4060 Ti 16GB / RTX 5060
Сховище 50 GB SSD 256 GB NVMe 1 TB NVMe
ОС Ubuntu 22.04+ / macOS 13+ Ubuntu 24.04 / macOS 14+ Proxmox VE 8+
Енерго 220V розетка UPS 600VA EcoFlow + інвертор

Important

Apple Silicon (M1/M2/M3/M4) — ідеальний вибір для українських реалій: висока продуктивність при мінімальному енергоспоживанні (15-30W під навантаженням). Працює від будь-якого повербанку через USB-C.


🛠️ СТРУКТУРА РЕПОЗИТОРІЮ

📂 AI-HOMELAB/
├── 📁 benchmarks/Бенчмарки заліза та енергоефективність
│   ├── ⚡ hardware_efficiency.mdGPU vs Apple Silicon (t/s/W)
│   └── 🚀 large_moe_optimization.mdОптимізація MoE моделей на WS (RTX 2080 Ti)

├── 📁 configs/Готові Docker-compose конфігурації
│   ├── ✅ ollama/Ollama + Open WebUI в один клік
│   ├── 🔌 production-agent-stack/Комплексний стек (Ollama, LiteLLM, Qdrant, n8n, Open WebUI)
│   ├── ⏳ vllm/(coming soon) vLLM для production-grade інференсу
│   ├── ⏳ dify/(coming soon) Dify AI — no-code платформа оркестрації та RAG
│   ├── ⏳ offline-knowledge/(coming soon) Стек Kiwix + Wikipedia для роботи офлайн
│   ├── ⏳ mcp-stack/(coming soon) Стек локальних MCP-серверів (Filesystem, SQLite, Fetch)
│   └── ⏳ dashboard/(coming soon) Стартовий AI-HomeLab Dashboard

├── 📁 templates/Шаблони та приклади коду
│   ├── 🧠 langgraph_rag_agent.pyCorrective RAG Agent (LangGraph + Qdrant)
│   ├── 🤖 agent-code-cli/Claude Code Style Agent CLI (Ollama + Claude)
│   ├── 💾 agent_persistent_memory.pyДовготривала пам'ять агента (SQLite + Ollama)
│   ├── ⏳ local_deep_research_agent.py(coming soon) Автономний дослідницький агент (SearXNG/DuckDuckGo)
│   ├── ⏳ offline_wikipedia_rag.py(coming soon) RAG-пошук по локальних базах Kiwix (.zim)
│   └── 📦 requirements.txtЗалежності для запуску шаблонів "з коробки"

├── 📁 projects/(coming soon) Ідеї та реалізації пет-проєктів
│   ├── ⏳ local-osint/(coming soon) Локальні OSINT-помічники
│   ├── ⏳ biz-automation/(coming soon) Автоматизатори бізнес-рутини
│   └── ⏳ rag-pipeline/(coming soon) RAG-пайплайн по власним документам

├── 📁 docs/Документація та гайди
│   ├── 📁 research/Дослідження AI-ландшафту
│   │   ├── 🔬 ai-landscape-july-2026.mdЗвіт по ШІ-моделях та стеку
│   │   ├── 🔬 nomad-odysseus-analysis.mdПорівняльний аналіз проєктів N.O.M.A.D. та Odysseus
│   │   ├── 🔬 local-ai-experience-june-2026.mdПрактичний досвід з Odysseus, OpenCode та Gemma 4
│   │   └── 🚀 free-ai-tools-lifehacks.mdБезкоштовні ШІ-інструменти та лайфхаки
│   ├── 📁 setup/Крок-за-кроком для кожної ОС
│   │   ├── ⏱️ first-model-15-min.mdШвидкий запуск першої моделі
│   │   ├── 🔋 blackout-guide.mdГайд з енергоефективності під час блекаутів
│   │   ├── 🏗️ reference-architectures.mdЕталонні архітектури (Tier 1/2/3)
│   │   └── 📊 ai-ops.mdМетрики, моніторинг та обсервабільність (AI Ops)
│   ├── 📁 security/Політики, аудити та ізоляція моделей
│   │   ├── 🛡️ model_isolation.mdІзоляція виконання та TEE
│   │   ├── 🛡️ advanced_hardening.mdГлибока ізоляція (VLAN, nftables, Gitleaks)
│   │   ├── 🛡️ model-vetting.mdКритерії перевірки моделей
│   │   └── 🛡️ threat-modeling.mdМоделювання загроз автономних агентів
│   ├── 📄 templates.mdПосібник із використання кодових шаблонів
│   └── ✅ quantization.mdГайд по квантизації (Q4/Q8/GGUF)

├── 📄 README.mdЦей файл (UA)
├── 📄 README_ENG.mdEnglish version
├── 📄 CONTRIBUTING.mdГайд для контриб'юторів
├── 📄 SECURITY.mdПолітики безпеки
├── 📄 LICENSEMIT ліцензія
└── 📄 ROADMAP.mdДорожня карта проєкту


📚 МОДУЛІ ТА НАВІГАЦІЯ

Для зручності всі навчальні та практичні матеріали репозиторію розділені на тематичні блоки:

🚀 1. Швидкий Старт та Базова Інфраструктура

Модуль та Посилання Опис Головні Файли Статус
⏱️ 15-Min Setup Швидкий покроковий запуск Ollama, завантаження першої моделі та чат через Docker-контейнер Open WebUI. first-model-15-min.md ✅ Готово
🐳 Ollama + Open WebUI Конфігурація Docker Compose для спільного запуску сервісів (CPU/GPU профілі, безпечна прив'язка портів). docker-compose.yml ✅ Готово
🏗️ Reference Architectures Еталонні апаратні конфігурації (Tier 1/2/3) для розгортання домашніх AI-лабораторій від $300 до $3000+. reference-architectures.md ✅ Готово
🔌 Production Agent Stack Конфігурація повного інфраструктурного стеку (Ollama, LiteLLM, Qdrant, n8n, Open WebUI) для мультиагентних систем. docker-compose.yml ✅ Готово
🚀 Free AI Tools & Hacks Перелік безкоштовних інструментів розробки та 7 лайфхаків для покращення якості відповідей. free-ai-tools-lifehacks.md ✅ Готово

🧠 2. Розробка, Шаблони та Агенти

Модуль та Посилання Опис Головні Файли Статус
🤖 Agent CLI Консольний ШІ-агент у Claude Code стилі (безпечна робоча директорія, виконання bash з вашого дозволу, інтерактивний diff-перегляд). cli.py ✅ Готово
🧠 CRAG Agent Corrective RAG (CRAG) агент на LangGraph + Qdrant із циклічним графом оцінки та переформулювання запитів. langgraph_rag_agent.py ✅ Готово
🧠 Agent Memory Шаблон довготривалої сесійної пам'яті (SQLite + Ollama nomic-embed-text) для збереження фактів та рішень між сесіями. agent_persistent_memory.py ✅ Готово
📄 Templates Guide Загальний покроковий посібник із налаштування та запуску всіх кодових шаблонів репозиторію. templates.md ✅ Готово

⚡ 3. Апаратне Забезпечення та Енергоефективність

Модуль та Посилання Опис Головні Файли Статус
🔋 Blackout Guide Налаштування лаби для роботи під час відключень світла (Nvidia Power Limit, обмеження потоків CPU, робота від EcoFlow, Starlink 12V PoE, Tailscale, Offline RAG). blackout-guide.md ✅ Готово
Hardware Benchmarks Детальний аналіз GPU vs Apple Silicon (tokens/second/Watt), аналіз холодного старту та VRAM contention. hardware_efficiency.md ✅ Готово
🚀 MoE Optimization Оптимізація та порівняльний бенчмарк великих MoE моделей (Gemma 4 26B, Qwen 3.6 35B, Ornith 1.0 35B) на робочій станції WS. large_moe_optimization.md ✅ Готово
📊 AI Ops & Observability Моніторинг апаратного забезпечення (GPU Power Draw), метрик інференсу (Ollama/vLLM /metrics) та трейсинг агентів через Langfuse. ai-ops.md ✅ Готово
📦 Quantization Guide Посібник з квантизації моделей: вибір форматів (Q4/Q8/GGUF), розрахунок VRAM, квантування через llama.cpp та інтеграція в Ollama. quantization.md ✅ Готово

🛡️ 4. Безпека, Харденінг та Ізоляція Моделей

Модуль та Посилання Опис Головні Файли Статус
🛡️ Advanced Hardening VLAN-ізоляція IoT-сегменту, nftables фаєрвол для хоста Proxmox, безпека Docker daemon та Gitleaks pre-commit лінтер. advanced_hardening.md ✅ Готово
🛡️ Model Isolation Ізоляція виконання моделей: пісочниці gVisor, Firecracker, WASM, довірені середовища виконання (TEE) та Zero-Trust. model_isolation.md ✅ Готово
🛡️ Model Vetting Критерії перевірки моделей (модельна гігієна, приватність інференсу, безпечні формати GGUF/Safetensors та ліцензування). model-vetting.md ✅ Готово
🛡️ Threat Modeling Моделювання загроз для автономних агентів (Prompt Injection, Tool Poisoning, Agent Escape, Secrets Leakage). threat-modeling.md ✅ Готово
🔐 Security Policy Загальні політики безпеки проєкту, модельна гігієна, ізоляція чутливих даних та управління секретами. SECURITY.md ✅ Готово

🔬 5. Стратегія, Дорожня Карта та Спільнота

Модуль та Посилання Опис Головні Файли Статус
🔬 AI Landscape 2026 Аналіз ринку ШІ станом на липень 2026 року: моделі, API, фреймворки, RAG, MCP, а також stealth-браузери та асистенти. ai-landscape-july-2026.md ✅ Готово
🔬 Local AI Experience Практичний досвід налаштування та роботи з Odysseus UI, OpenCode TUI та моделями Gemma 4 MoE. local-ai-experience-june-2026.md ✅ Готово
🗺️ Roadmap Детальний план розвитку проєкту: Фаза 1 (Фундамент), Фаза 2 (Практика), Фаза 3 (Спільнота). ROADMAP.md ✅ Готово
🤝 Contributing Гайд для контриб'юторів: як створювати Issues, розробляти у гілках та оформлювати Pull Requests. CONTRIBUTING.md ✅ Готово

🗺️ ДОРОЖНЯ КАРТА (ROADMAP)

Note

Станом на 16 червня 2026 року (16.06.2026), Фазу 1 (Фундамент) повністю завершено із випередженням графіку! Проєкт активно працює над реалізацією Фази 2. Проведено апаратні бенчмарки на базі моделі Gemma 4 26B (MoE) на робочій станції WS.

🏁 Фаза 1 — Фундамент (Q3 2026) — 🎉 Виконано достроково!

  • Меморандум та філософія проєкту
  • Docker-compose для Ollama + Open WebUI
  • Бенчмарки RTX 3060/4060/5060 з квантизованими моделями
  • Гайд: "Перша модель за 15 хвилин"
  • Шаблон RAG-пайплайну на LangGraph (CRAG Agent)
  • Глибока ізоляція домашньої лаби (Advanced Hardening)
  • Бенчмарки енергоефективності (t/s/W)
  • Консольний ШІ-агент для кодування (Claude Code style CLI)

🚀 Фаза 2 — Практика (Q4 2026) — ⏳ У процесі розробки

  • Мультиагентний шаблон на LangGraph / PydanticAI для бізнес-автоматизації (Stateful workflows з human-in-the-loop та durable checkpointing у PostgreSQL/SQLite)
  • Блекаут-гайд: налаштування лаби для роботи від EcoFlow, Starlink 12V PoE, Tailscale, Offline RAG
  • Локальний Deep Research агент на LangGraph / PydanticAI із інтеграцією з SearXNG/DuckDuckGo та автоматичним генеративним синтезом звітів
  • Посібник та compose-конфіги для локальних MCP-серверів (Filesystem, SQLite, Git, Fetch) та їх нативного використання в Cursor/Windsurf/Claude Code
  • Універсальний локальний AI-асистент (на базі OpenClaw / LangGraph) з прямим безпечним доступом до інструментів (Bash, Browser, Filesystem) та ізоляцією в gVisor/Docker
  • Гібридна маршрутизація запитів (Hybrid Routing): Розумне балансування навантаження між локальними SLM (Gemma 4 12B/26B) для дешевих/приватних кроків та хмарними API (Claude 4.x Sonnet, GPT-5) для складних логічних висновків з урахуванням Prompt Caching
  • Observability & Tracing: Шаблони інтеграції локального стека з OpenTelemetry та сервісами трейсингу (Pydantic Logfire, Langfuse)
  • Офлайн-база знань та RAG: Docker-compose стек Kiwix + Wikipedia (.zim) із конфігурацією RAG-ембедінгів без доступу до інтернету
  • Конфігурація локальних IDE-інструментів (Continue.dev, Aider) з використанням моделей Gemma 4 (12B/26B MoE) та MTP-драфтингу (Multi-Token Prediction) для прискорення генерації коду
  • Інтеграція сесійної пам'яті (AgentMemory) у шаблони агента
  • Еталонні архітектури обладнання (Tier 1/2/3) для локального ШІ
  • Комплексний Docker-compose стек (Ollama, LiteLLM, Qdrant, n8n, Open WebUI) для мультиагентних систем
  • Моделювання загроз автономних ШІ-агентів (Threat Modeling)
  • Налаштування збору апаратних метрик та трейсингу запитів (AIOps & Observability)

🌟 Фаза 3 — Спільнота (Q1 2027) — 📅 Планується

  • Continuous Benchmarking CI/CD: Автоматизовані конвеєри для регулярного тестування швидкості (t/s/W) та точності локальних моделей при оновленні драйверів або релізах нових версій
  • LLM-as-a-Judge: Шаблони оцінки точності та відповідності (validation pipelines) для локальних RAG-систем без надсилання даних у хмару
  • Нативний голосовий помічник (Direct Speech-to-Speech): Інтеграція та запуск моделі Gemma 4 12B (encoder-free native audio) на локальному залізі без додаткових ASR (Whisper) / TTS прошарків
  • AI-HomeLab Portal: Стартовий веб-дашборд для моніторингу статусу локальних серверів, VRAM, активних інференсів та логів агентів
  • Практичне керівництво з vLLM & llama.cpp: Тюнінг PagedAttention, KV-cache offloading та налаштування Speculative Decoding (MTP драфтери)
  • Партнерства з українськими AI-спільнотами та публікація матеріалів (DOU.ua, dev.to)
  • Щомісячний дайджест нових локальних моделей та інструментів розробки

🔐 БЕЗПЕКА

Ми серйозно ставимося до безпеки. Перед використанням будь-якої моделі у вашій лабораторії:

  1. Перевірте походження — модель повинна мати прозору ліцензію та відоме джерело датасетів
  2. Ізолюйте середовище — запускайте моделі у Docker-контейнерах або віртуальних машинах
  3. Не передавайте чутливі дані — у хмарні API відправляйте тільки знеособлені дані
  4. Оновлюйте регулярно — слідкуйте за CVE та оновленнями безпеки інструментів

Детальніше: SECURITY.md


🤝 ПРИЄДНУЙТЕСЬ ДО СПІЛЬНОТИ

💬 Канали зв'язку

Платформа Посилання Призначення
Telegram Скоро Обговорення заліза, архітектури, купівля/продаж GPU
GitHub Discussions Discussions Питання, ідеї, RFC
Issues Issues Баг-репорти та feature requests

🤲 Як контриб'ютити

Знайшли круту модель, оптимізували конфіг під EcoFlow або написали корисного локального агента?

  1. Fork цього репозиторію
  2. Створіть Issue з описом вашої ідеї
  3. Створіть гілку feature/ваша-фіча
  4. Зробіть Pull Request з детальним описом

Детальніше: CONTRIBUTING.md


📄 Ліцензія

Цей проєкт ліцензовано під MIT License.


🇺🇦 Давайте будувати AI-майбутнє України разом!

Створено з ❤️ для української tech-спільноти

About

🇺🇦 AI-HomeLab: Домашні AI-Лабораторії в Україні — локальний ШІ, мультиагентні системи, блекаут-резилієнтність

Topics

Resources

License

Contributing

Security policy

Stars

Watchers

Forks

Packages

 
 
 

Contributors

Languages