🇺🇦 Українська | 🇬🇧 English
Локальний ШІ · Мультиагентні системи · Енергоавтономність
Ласкаво просимо до центрального репозиторію ініціативи AI-HomeLab! Цей проєкт створено для того, щоб сформувати в Україні культуру відповідального, безпечного та практичного використання моделей штучного інтелекту та автономних агентів у домашніх умовах із обмеженим бюджетом.
Навіщо це потрібно? Межа між звичайним користувачем ChatGPT та інженером, який вміє локально розгортати, квантувати та оркеструвати ШІ-агентів, визначає майбутнє технологічного ринку праці та цифрової безпеки України.
- 📜 Меморандум та Філософія Проєкту
- ⚡ Швидкий Старт (Quick Start)
- 💻 Мінімальні Вимоги
- 🛠️ Структура Репозиторію
- 📚 Модулі та Навігація
- 🗺️ Дорожня Карта (Roadmap)
- 🔐 Безпека
- 🤝 Приєднуйтесь до Спільноти
- 📄 Ліцензія
Кожен учасник спільноти AI-HomeLab та контриб'ютор цього репозиторію поділяє чотири фундаментальні принципи:
Ми дотримуємося принципів безпеки та гігієни розробки. Раніше діяла повна заборона на моделі з Китаю. Наразі знято заборону на використання деяких китайських локальних моделей (зокрема, серій Qwen та DeepSeek) виключно з метою локального тестування, порівняння та підвищення продуктивності в агентному кодуванні. Водночас будь-які російські моделі штучного інтелекту та інструменти (на кшталт YandexGPT, GigaChat) перебувають під СУВОРОЮ ТА ДОВІЧНОЮ ЗАБОРОНОЮ. Високоякісні моделі міркування (Reasoning) західного походження (як-от серія Ornith від американської компанії DeepReinforce Team) є вкрай рекомендованими для використання.
Caution
Категорично заборонені моделі та інструменти: YandexGPT, GigaChat, будь-які інші сервіси та моделі від компаній з країни-агресора РФ.
| Категорія | Інструменти |
|---|---|
| LLM-моделі | Meta LLaMA 4 (Scout/Maverick), Google Gemma 4, Mistral (Large 3 / Medium 3.5 / Small 4), Microsoft Phi-4 (Reasoning/Vision/Multimodal), Qwen 3.6 (Dense/MoE), DeepSeek-V4 (Flash/Pro) |
| Хмарні API | OpenAI (GPT-5.5/5.4, GPT-5.4 mini/nano), Anthropic (Claude 4.x / 4.6 / 4.5), Google (Gemini 3.5/3.1) |
| Інференс | Ollama, vLLM, llama.cpp |
| Оркестрація | LangGraph, CrewAI, PydanticAI |
*Примітка: моделі з КНР (Qwen, DeepSeek) допускаються виключно для локального тестування, порівняння та підвищення продуктивності в агентному кодуванні згідно з Меморандумом.
Чутливі українські дані (персональна інформація, внутрішні документи компаній, локальні реєстри) не мають залишати периметр нашої країни чи персонального комп'ютера.
Ми вчимося розгортати ШІ локально (через Ollama/vLLM), забезпечуючи повну автономність від сторонніх серверів:
flowchart LR
subgraph SECURE["🏠 Ваш Домашній Сервер — Безпечний Периметр"]
direction LR
USER["🧑💻 Користувач"]
UI["🖥️ Open WebUI"]
LLM["🧠 Ollama / vLLM"]
DATA["📁 Ваші Дані"]
EMB["🔗 Embeddings"]
USER -->|Запит| UI
UI -->|Інференс| LLM
LLM -->|Відповідь| UI
UI -->|Відповідь| USER
DATA -->|RAG| EMB
EMB -->|Контекст| LLM
end
CLOUD["☁️ Зовнішні Сервери"]
SECURE -.-x|"🚫 Дані НІКОЛИ\nне залишають периметр"| CLOUD
style SECURE fill:#0d1117,stroke:#58a6ff,stroke-width:3px,color:#c9d1d9
style USER fill:#1f6feb,stroke:#58a6ff,color:#ffffff
style UI fill:#238636,stroke:#2ea043,color:#ffffff
style LLM fill:#8957e5,stroke:#a371f7,color:#ffffff
style DATA fill:#d29922,stroke:#e3b341,color:#0d1117
style EMB fill:#f778ba,stroke:#f778ba,color:#0d1117
style CLOUD fill:#da3633,stroke:#f85149,color:#ffffff
Ми створюємо рішення, адаптовані до українських реалій. Це означає:
- Максимум результату на споживчому залізі — RTX 3060/4060/5060 або Apple Silicon
- Використання безкоштовних/дешевих API — Gemini 3.5 Flash / 3.1 Flash-Lite, GPT-5.4 mini для гібридних систем
- Агресивна квантизація моделей — Q4/Q8 через GGUF для економії VRAM
- 🔋 Енергоавтономність (стійкість до відключень) — оптимізація споживання для стабільної роботи лабораторії від інверторів та зарядних станцій (EcoFlow, Bluetti) під час знеструмлень
Tip
Типова домашня лабораторія споживає 80-150W — менше за електрочайник. Одного повербанку на 2000Wh вистачить на 13-25 годин безперервної роботи.
Домашня лабораторія — це не просто хобі, це найкращий рядок у вашому CV. Ми фокусуємося не на написанні "промптів", а на розробці складної логіки:
- Мультиагентні системи — автономні команди ШІ-агентів, що вирішують складні задачі
- RAG (Retrieval-Augmented Generation) — пошук та генерація по вашим документам
- Type-safe інтеграції — надійний production-ready код із валідацією через Pydantic
- Реальні пет-проєкти — що конвертуються у офери та успішні продукти
Сучасна домашня ШІ-лабораторія функціонує як трирівнева архітектура (Оркестрація ↔ Інференс ↔ Інструменти), інтегрована через відкриті та стандартизовані протоколи:
flowchart TD
ORCH["🏗️ Оркестрація & Логіка\n(LangGraph / CrewAI / PydanticAI)"]
LOCAL["🧠 Локальний Інференс\n(Ollama / vLLM / llama.cpp)"]
CLOUD["☁️ Хмарні API\n(GPT-5.5 / Claude 4.6 / Gemini 3.5)"]
MCP["🔌 Model Context Protocol\n(MCP Servers)"]
RES["📁 Джерела та Інструменти\n(Files, DBs, Web APIs)"]
ORCH -->|API запити| LOCAL
ORCH -->|API запити| CLOUD
LOCAL -->|Універсальний доступ| MCP
CLOUD -->|Універсальний доступ| MCP
MCP -->|Зчитування/Виконання| RES
style ORCH fill:#1f6feb,stroke:#58a6ff,color:#ffffff
style LOCAL fill:#8957e5,stroke:#a371f7,color:#ffffff
style CLOUD fill:#da3633,stroke:#f85149,color:#ffffff
style MCP fill:#238636,stroke:#2ea043,color:#ffffff
style RES fill:#d29922,stroke:#e3b341,color:#0d1117
- Шар оркестрації керує логікою агентів, збереженням стану діалогів та суворою валідацією типів на рівні Python.
- Шар інференсу виконує моделі локально або звертається до хмари, використовуючи сумісні API (OpenAI/Anthropic Messages API).
- Шар інструментів (MCP) надає моделям стандартизований доступ до зовнішніх ресурсів без необхідності написання кастомних конекторів.
Станом на липень 2026 року (07.2026), ви можете розгорнути локальну ШІ-лабораторію за двома основними сценаріями:
Найпростіший шлях для ноутбуків та домашніх серверів.
- Встановіть Ollama:
curl -fsSL https://ollama.com/install.sh | sh - Завантажте сучасну модель сімейства Gemma 4, Qwen 3.6 або DeepSeek V4:
# Надшвидка мультимодальна edge-модель для слабких ПК (до 8GB RAM): ollama pull gemma4:e4b # Нова флагманська 12B модель з нативним аудіо без енкодерів (потрібно 16GB RAM): ollama pull gemma4:12b # Лідер за точністю кодування та RAG (потрібно 16GB RAM / GPU 12GB+ VRAM): ollama pull qwen3.6:14b # Швидке міркування з CoT (потрібно 16GB RAM / GPU 8GB+ VRAM): ollama pull deepseek-v4:flash
- Запустіть Open WebUI в один клік через Docker:
Відкрийте
docker run -d \ --name open-webui \ -p 3000:8080 \ --add-host=host.docker.internal:host-gateway \ -v open-webui:/app/backend/data \ -e OLLAMA_BASE_URL=http://host.docker.internal:11434 \ --restart always \ ghcr.io/open-webui/open-webui:main
http://localhost:3000— ваш локальний ChatGPT готовий! 🎉
Цей стек розгорнуто на нашій виділеній робочій станції WS (IP: 100.68.179.109 / 192.168.2.24) для максимальної швидкості (MTP, Flash Attention, 128K context).
- Запуск обчислювального ядра (Llama.cpp Server):
Створіть systemd-сервіс
/etc/systemd/system/llama-server.serviceдля автоматичного запуску (налаштовано під Xeon E5-2666 v3 + 11GB VRAM на RTX 2080 Ti з використанням локальної reasoning-моделі Ornith-1.0-35B-MTP):# start_llama.sh /root/llama.cpp/build/bin/llama-server \ -m /root/llama-models/Ornith-1.0-35B-Q6_K-MTP.gguf \ -ngl 14 -t 10 -c 128000 -fa on -np 1 -b 512 -ub 512 \ -ctk q8_0 -ctv q8_0 -fit off \ --spec-type draft-mtp --spec-draft-n-max 2 \ --chat-template-kwargs "{\"preserve_thinking\":true}" \ --host 0.0.0.0 --port 8080
- Конфігурація клієнта OpenCode (
~/.config/opencode/opencode.jsonc): Прив'яжіть клієнт до локального сервера з підтримкою автоматичного спадання (fallback) на хмару та збереженням думок (preserve_thinking):{ "model": "local-infrastructure/ornith-1.0-35b-it", "provider": { "local-infrastructure": { "npm": "@ai-sdk/openai-compatible", "name": "Local Infrastructure (WS)", "options": { "baseURL": "http://127.0.0.1:8080/v1", "apiKey": "sk-llama-cpp-local-token" }, "models": { "ornith-1.0-35b-it": { "name": "Ornith-1.0 35B Local (MTP)", "limit": { "context": 128000, "output": 4096 } } } } }, "lsp": false } - Запустіть клієнт:
opencode --model local-infrastructure/ornith-1.0-35b-it
Для зручного моніторингу активних сесій OpenCode у реальному часі рекомендується використовувати термінальну утиліту llmtop (професійний інструмент моніторингу локальних LLM-сесій та ШІ-агентів, розроблений Weby Homelab):
- Відображення заповнення контекстного вікна (
context_percentтаcontext_window) на основі вхідних та вихідних токенів. - Моніторинг активних сесій, процесів та лімітів.
Important
На Linux переконайтеся, що у вашій системі встановлено sqlite3 (необхідний для зчитування бази даних сесій OpenCode).
Note
Детальні інструкції для кожної платформи (Windows/macOS/Linux) дивіться у розділі docs/setup/.
| Компонент | Мінімум | Рекомендовано | Преміум |
|---|---|---|---|
| CPU | 4 ядра (Intel i5/Ryzen 5) | 8 ядер (Intel i7/Ryzen 7) | Apple M2 Pro+ |
| RAM | 8 GB | 16 GB | 32+ GB |
| GPU | — (CPU-only) | RTX 3060 12GB | RTX 4060 Ti 16GB / RTX 5060 |
| Сховище | 50 GB SSD | 256 GB NVMe | 1 TB NVMe |
| ОС | Ubuntu 22.04+ / macOS 13+ | Ubuntu 24.04 / macOS 14+ | Proxmox VE 8+ |
| Енерго | 220V розетка | UPS 600VA | EcoFlow + інвертор |
Important
Apple Silicon (M1/M2/M3/M4) — ідеальний вибір для українських реалій: висока продуктивність при мінімальному енергоспоживанні (15-30W під навантаженням). Працює від будь-якого повербанку через USB-C.
📂 AI-HOMELAB/
├── 📁 benchmarks/ — Бенчмарки заліза та енергоефективність
│ ├── ⚡ hardware_efficiency.md — GPU vs Apple Silicon (t/s/W)
│ └── 🚀 large_moe_optimization.md — Оптимізація MoE моделей на WS (RTX 2080 Ti)
│
├── 📁 configs/ — Готові Docker-compose конфігурації
│ ├── ✅ ollama/ — Ollama + Open WebUI в один клік
│ ├── 🔌 production-agent-stack/ — Комплексний стек (Ollama, LiteLLM, Qdrant, n8n, Open WebUI)
│ ├── ⏳ vllm/ — (coming soon) vLLM для production-grade інференсу
│ ├── ⏳ dify/ — (coming soon) Dify AI — no-code платформа оркестрації та RAG
│ ├── ⏳ offline-knowledge/ — (coming soon) Стек Kiwix + Wikipedia для роботи офлайн
│ ├── ⏳ mcp-stack/ — (coming soon) Стек локальних MCP-серверів (Filesystem, SQLite, Fetch)
│ └── ⏳ dashboard/ — (coming soon) Стартовий AI-HomeLab Dashboard
│
├── 📁 templates/ — Шаблони та приклади коду
│ ├── 🧠 langgraph_rag_agent.py — Corrective RAG Agent (LangGraph + Qdrant)
│ ├── 🤖 agent-code-cli/ — Claude Code Style Agent CLI (Ollama + Claude)
│ ├── 💾 agent_persistent_memory.py — Довготривала пам'ять агента (SQLite + Ollama)
│ ├── ⏳ local_deep_research_agent.py — (coming soon) Автономний дослідницький агент (SearXNG/DuckDuckGo)
│ ├── ⏳ offline_wikipedia_rag.py — (coming soon) RAG-пошук по локальних базах Kiwix (.zim)
│ └── 📦 requirements.txt — Залежності для запуску шаблонів "з коробки"
│
├── 📁 projects/ — (coming soon) Ідеї та реалізації пет-проєктів
│ ├── ⏳ local-osint/ — (coming soon) Локальні OSINT-помічники
│ ├── ⏳ biz-automation/ — (coming soon) Автоматизатори бізнес-рутини
│ └── ⏳ rag-pipeline/ — (coming soon) RAG-пайплайн по власним документам
│
├── 📁 docs/ — Документація та гайди
│ ├── 📁 research/ — Дослідження AI-ландшафту
│ │ ├── 🔬 ai-landscape-july-2026.md — Звіт по ШІ-моделях та стеку
│ │ ├── 🔬 nomad-odysseus-analysis.md — Порівняльний аналіз проєктів N.O.M.A.D. та Odysseus
│ │ ├── 🔬 local-ai-experience-june-2026.md — Практичний досвід з Odysseus, OpenCode та Gemma 4
│ │ └── 🚀 free-ai-tools-lifehacks.md — Безкоштовні ШІ-інструменти та лайфхаки
│ ├── 📁 setup/ — Крок-за-кроком для кожної ОС
│ │ ├── ⏱️ first-model-15-min.md — Швидкий запуск першої моделі
│ │ ├── 🔋 blackout-guide.md — Гайд з енергоефективності під час блекаутів
│ │ ├── 🏗️ reference-architectures.md — Еталонні архітектури (Tier 1/2/3)
│ │ └── 📊 ai-ops.md — Метрики, моніторинг та обсервабільність (AI Ops)
│ ├── 📁 security/ — Політики, аудити та ізоляція моделей
│ │ ├── 🛡️ model_isolation.md — Ізоляція виконання та TEE
│ │ ├── 🛡️ advanced_hardening.md — Глибока ізоляція (VLAN, nftables, Gitleaks)
│ │ ├── 🛡️ model-vetting.md — Критерії перевірки моделей
│ │ └── 🛡️ threat-modeling.md — Моделювання загроз автономних агентів
│ ├── 📄 templates.md — Посібник із використання кодових шаблонів
│ └── ✅ quantization.md — Гайд по квантизації (Q4/Q8/GGUF)
│
├── 📄 README.md — Цей файл (UA)
├── 📄 README_ENG.md — English version
├── 📄 CONTRIBUTING.md — Гайд для контриб'юторів
├── 📄 SECURITY.md — Політики безпеки
├── 📄 LICENSE — MIT ліцензія
└── 📄 ROADMAP.md — Дорожня карта проєкту
Для зручності всі навчальні та практичні матеріали репозиторію розділені на тематичні блоки:
| Модуль та Посилання | Опис | Головні Файли | Статус |
|---|---|---|---|
| ⏱️ 15-Min Setup | Швидкий покроковий запуск Ollama, завантаження першої моделі та чат через Docker-контейнер Open WebUI. | first-model-15-min.md |
✅ Готово |
| 🐳 Ollama + Open WebUI | Конфігурація Docker Compose для спільного запуску сервісів (CPU/GPU профілі, безпечна прив'язка портів). | docker-compose.yml |
✅ Готово |
| 🏗️ Reference Architectures | Еталонні апаратні конфігурації (Tier 1/2/3) для розгортання домашніх AI-лабораторій від $300 до $3000+. | reference-architectures.md |
✅ Готово |
| 🔌 Production Agent Stack | Конфігурація повного інфраструктурного стеку (Ollama, LiteLLM, Qdrant, n8n, Open WebUI) для мультиагентних систем. | docker-compose.yml |
✅ Готово |
| 🚀 Free AI Tools & Hacks | Перелік безкоштовних інструментів розробки та 7 лайфхаків для покращення якості відповідей. | free-ai-tools-lifehacks.md |
✅ Готово |
| Модуль та Посилання | Опис | Головні Файли | Статус |
|---|---|---|---|
| 🤖 Agent CLI | Консольний ШІ-агент у Claude Code стилі (безпечна робоча директорія, виконання bash з вашого дозволу, інтерактивний diff-перегляд). | cli.py |
✅ Готово |
| 🧠 CRAG Agent | Corrective RAG (CRAG) агент на LangGraph + Qdrant із циклічним графом оцінки та переформулювання запитів. | langgraph_rag_agent.py |
✅ Готово |
| 🧠 Agent Memory | Шаблон довготривалої сесійної пам'яті (SQLite + Ollama nomic-embed-text) для збереження фактів та рішень між сесіями. | agent_persistent_memory.py |
✅ Готово |
| 📄 Templates Guide | Загальний покроковий посібник із налаштування та запуску всіх кодових шаблонів репозиторію. | templates.md |
✅ Готово |
| Модуль та Посилання | Опис | Головні Файли | Статус |
|---|---|---|---|
| 🔋 Blackout Guide | Налаштування лаби для роботи під час відключень світла (Nvidia Power Limit, обмеження потоків CPU, робота від EcoFlow, Starlink 12V PoE, Tailscale, Offline RAG). | blackout-guide.md |
✅ Готово |
| ⚡ Hardware Benchmarks | Детальний аналіз GPU vs Apple Silicon (tokens/second/Watt), аналіз холодного старту та VRAM contention. | hardware_efficiency.md |
✅ Готово |
| 🚀 MoE Optimization | Оптимізація та порівняльний бенчмарк великих MoE моделей (Gemma 4 26B, Qwen 3.6 35B, Ornith 1.0 35B) на робочій станції WS. | large_moe_optimization.md |
✅ Готово |
| 📊 AI Ops & Observability | Моніторинг апаратного забезпечення (GPU Power Draw), метрик інференсу (Ollama/vLLM /metrics) та трейсинг агентів через Langfuse. | ai-ops.md |
✅ Готово |
| 📦 Quantization Guide | Посібник з квантизації моделей: вибір форматів (Q4/Q8/GGUF), розрахунок VRAM, квантування через llama.cpp та інтеграція в Ollama. |
quantization.md |
✅ Готово |
| Модуль та Посилання | Опис | Головні Файли | Статус |
|---|---|---|---|
| 🛡️ Advanced Hardening | VLAN-ізоляція IoT-сегменту, nftables фаєрвол для хоста Proxmox, безпека Docker daemon та Gitleaks pre-commit лінтер. | advanced_hardening.md |
✅ Готово |
| 🛡️ Model Isolation | Ізоляція виконання моделей: пісочниці gVisor, Firecracker, WASM, довірені середовища виконання (TEE) та Zero-Trust. | model_isolation.md |
✅ Готово |
| 🛡️ Model Vetting | Критерії перевірки моделей (модельна гігієна, приватність інференсу, безпечні формати GGUF/Safetensors та ліцензування). | model-vetting.md |
✅ Готово |
| 🛡️ Threat Modeling | Моделювання загроз для автономних агентів (Prompt Injection, Tool Poisoning, Agent Escape, Secrets Leakage). | threat-modeling.md |
✅ Готово |
| 🔐 Security Policy | Загальні політики безпеки проєкту, модельна гігієна, ізоляція чутливих даних та управління секретами. | SECURITY.md |
✅ Готово |
| Модуль та Посилання | Опис | Головні Файли | Статус |
|---|---|---|---|
| 🔬 AI Landscape 2026 | Аналіз ринку ШІ станом на липень 2026 року: моделі, API, фреймворки, RAG, MCP, а також stealth-браузери та асистенти. | ai-landscape-july-2026.md |
✅ Готово |
| 🔬 Local AI Experience | Практичний досвід налаштування та роботи з Odysseus UI, OpenCode TUI та моделями Gemma 4 MoE. | local-ai-experience-june-2026.md |
✅ Готово |
| 🗺️ Roadmap | Детальний план розвитку проєкту: Фаза 1 (Фундамент), Фаза 2 (Практика), Фаза 3 (Спільнота). | ROADMAP.md |
✅ Готово |
| 🤝 Contributing | Гайд для контриб'юторів: як створювати Issues, розробляти у гілках та оформлювати Pull Requests. | CONTRIBUTING.md |
✅ Готово |
Note
Станом на 16 червня 2026 року (16.06.2026), Фазу 1 (Фундамент) повністю завершено із випередженням графіку! Проєкт активно працює над реалізацією Фази 2. Проведено апаратні бенчмарки на базі моделі Gemma 4 26B (MoE) на робочій станції WS.
- Меморандум та філософія проєкту
- Docker-compose для Ollama + Open WebUI
- Бенчмарки RTX 3060/4060/5060 з квантизованими моделями
- Гайд: "Перша модель за 15 хвилин"
- Шаблон RAG-пайплайну на LangGraph (CRAG Agent)
- Глибока ізоляція домашньої лаби (Advanced Hardening)
- Бенчмарки енергоефективності (t/s/W)
- Консольний ШІ-агент для кодування (Claude Code style CLI)
- Мультиагентний шаблон на LangGraph / PydanticAI для бізнес-автоматизації (Stateful workflows з human-in-the-loop та durable checkpointing у PostgreSQL/SQLite)
- Блекаут-гайд: налаштування лаби для роботи від EcoFlow, Starlink 12V PoE, Tailscale, Offline RAG
- Локальний Deep Research агент на LangGraph / PydanticAI із інтеграцією з SearXNG/DuckDuckGo та автоматичним генеративним синтезом звітів
- Посібник та compose-конфіги для локальних MCP-серверів (Filesystem, SQLite, Git, Fetch) та їх нативного використання в Cursor/Windsurf/Claude Code
- Універсальний локальний AI-асистент (на базі OpenClaw / LangGraph) з прямим безпечним доступом до інструментів (Bash, Browser, Filesystem) та ізоляцією в gVisor/Docker
- Гібридна маршрутизація запитів (Hybrid Routing): Розумне балансування навантаження між локальними SLM (Gemma 4 12B/26B) для дешевих/приватних кроків та хмарними API (Claude 4.x Sonnet, GPT-5) для складних логічних висновків з урахуванням Prompt Caching
- Observability & Tracing: Шаблони інтеграції локального стека з OpenTelemetry та сервісами трейсингу (Pydantic Logfire, Langfuse)
- Офлайн-база знань та RAG: Docker-compose стек Kiwix + Wikipedia (.zim) із конфігурацією RAG-ембедінгів без доступу до інтернету
- Конфігурація локальних IDE-інструментів (Continue.dev, Aider) з використанням моделей Gemma 4 (12B/26B MoE) та MTP-драфтингу (Multi-Token Prediction) для прискорення генерації коду
- Інтеграція сесійної пам'яті (AgentMemory) у шаблони агента
- Еталонні архітектури обладнання (Tier 1/2/3) для локального ШІ
- Комплексний Docker-compose стек (Ollama, LiteLLM, Qdrant, n8n, Open WebUI) для мультиагентних систем
- Моделювання загроз автономних ШІ-агентів (Threat Modeling)
- Налаштування збору апаратних метрик та трейсингу запитів (AIOps & Observability)
- Continuous Benchmarking CI/CD: Автоматизовані конвеєри для регулярного тестування швидкості (t/s/W) та точності локальних моделей при оновленні драйверів або релізах нових версій
- LLM-as-a-Judge: Шаблони оцінки точності та відповідності (validation pipelines) для локальних RAG-систем без надсилання даних у хмару
- Нативний голосовий помічник (Direct Speech-to-Speech): Інтеграція та запуск моделі Gemma 4 12B (encoder-free native audio) на локальному залізі без додаткових ASR (Whisper) / TTS прошарків
- AI-HomeLab Portal: Стартовий веб-дашборд для моніторингу статусу локальних серверів, VRAM, активних інференсів та логів агентів
- Практичне керівництво з vLLM & llama.cpp: Тюнінг PagedAttention, KV-cache offloading та налаштування Speculative Decoding (MTP драфтери)
- Партнерства з українськими AI-спільнотами та публікація матеріалів (DOU.ua, dev.to)
- Щомісячний дайджест нових локальних моделей та інструментів розробки
Ми серйозно ставимося до безпеки. Перед використанням будь-якої моделі у вашій лабораторії:
- Перевірте походження — модель повинна мати прозору ліцензію та відоме джерело датасетів
- Ізолюйте середовище — запускайте моделі у Docker-контейнерах або віртуальних машинах
- Не передавайте чутливі дані — у хмарні API відправляйте тільки знеособлені дані
- Оновлюйте регулярно — слідкуйте за CVE та оновленнями безпеки інструментів
Детальніше:
SECURITY.md
| Платформа | Посилання | Призначення |
|---|---|---|
| Telegram | Скоро | Обговорення заліза, архітектури, купівля/продаж GPU |
| GitHub Discussions | Discussions | Питання, ідеї, RFC |
| Issues | Issues | Баг-репорти та feature requests |
Знайшли круту модель, оптимізували конфіг під EcoFlow або написали корисного локального агента?
- Fork цього репозиторію
- Створіть Issue з описом вашої ідеї
- Створіть гілку
feature/ваша-фіча - Зробіть Pull Request з детальним описом
Детальніше:
CONTRIBUTING.md
Цей проєкт ліцензовано під MIT License.
🇺🇦 Давайте будувати AI-майбутнє України разом!
Створено з ❤️ для української tech-спільноти