Sift/.env.example at main · saimihirj/Sift · GitHub

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
# ============================================================
# Sift — Local Environment Configuration
# cp .env.example .env  then fill in what you need
# ============================================================

# ---- Runtime mode ------------------------------------------
SIFT_MODEL_PROVIDER=ollama
SIFT_ENABLE_OLLAMA=true
SIFT_ENABLE_LOCAL_OPENAI=true
SIFT_ENABLE_OPEN_SOURCE_PROVIDER=false
SIFT_PERSISTENCE_BACKEND=sqlite
SIFT_DATA_DIR=data
SIFT_DATABASE_URL=
SIFT_DATABASE_TOKEN=
SIFT_EXPERT_DATA_DIR=knowledge_base/expert
SIFT_UPLOAD_BACKEND=local
SIFT_UPLOAD_BUCKET=
SIFT_UPLOAD_PREFIX=session_uploads
SIFT_UPLOAD_TMP_DIR=
SIFT_ADMIN_TOKEN=
SIFT_SESSION_SECRET=change-me-for-shared-use
SIFT_COOKIE_SECURE=false
SIFT_COOKIE_SAMESITE=lax
SIFT_CORS_ORIGINS=
SIFT_FRONTEND_URL=

# ---- Ollama (local open-source) ----------------------------
OLLAMA_BASE_URL=http://127.0.0.1:11434
# Speed tier — fast, tool-capable
OLLAMA_MODEL_SPEED=qwen3:8b
# Balanced tier — stronger reasoning
OLLAMA_MODEL_BALANCED=qwen3:30b
OLLAMA_KEEP_ALIVE=10m
OLLAMA_TIMEOUT_SPEED=24
OLLAMA_TIMEOUT_BALANCED=42
OLLAMA_NUM_CTX_SPEED=4096
OLLAMA_NUM_CTX_BALANCED=6144
OLLAMA_NUM_CTX_MULTIMODAL=6144
OLLAMA_MAX_TOKENS_SPEED=180
OLLAMA_MAX_TOKENS_BALANCED=360
OLLAMA_MAX_TOKENS_DIRECT=420
OLLAMA_MAX_TOKENS_MULTIMODAL=480
# Optional hardware tuning — leave empty unless you know your machine's best values
OLLAMA_NUM_THREAD=
OLLAMA_NUM_GPU=

# ---- Local OpenAI-compatible (vLLM / TGI / LM Studio / llama.cpp) ----
LOCAL_OPENAI_BASE_URL=http://127.0.0.1:8000/v1
LOCAL_OPENAI_API_KEY=
LOCAL_OPENAI_MODEL_SPEED=Qwen/Qwen3-8B
LOCAL_OPENAI_MODEL_BALANCED=Qwen/Qwen3-30B-A3B
LOCAL_OPENAI_DECK_MODEL=Qwen/Qwen2.5-VL-7B-Instruct

# ---- Sift Brain — custom LLM decision layer (local) --------
# Start the brain server: python3 scripts/serve_sift_brain.py
SIFT_BRAIN_BASE_URL=http://127.0.0.1:8001/v1
SIFT_BRAIN_MODEL=sift-brain
SIFT_BRAIN_ADAPTER=latest

# ---- Server-side open-source endpoint (public deployments) -
OPEN_SOURCE_BASE_URL=
OPEN_SOURCE_API_KEY=
OPEN_SOURCE_REQUIRES_API_KEY=true
OPEN_SOURCE_MODEL_SPEED=Qwen/Qwen3-8B
OPEN_SOURCE_MODEL_BALANCED=Qwen/Qwen3-30B-A3B
OPEN_SOURCE_DECK_MODEL=Qwen/Qwen2.5-VL-7B-Instruct

# ---- Deck review runtime -----------------------------------
# Default: use the same provider as the session
SIFT_DECK_REVIEW_PROVIDER=ollama
SIFT_DECK_REVIEW_MODEL=qwen2.5vl:7b
SIFT_DECK_REVIEW_MAX_TOKENS=2600
SIFT_DECK_REVIEW_TIMEOUT_SECONDS=52

# ---- Groq (hosted fast open-weight) ------------------------
GROQ_API_KEY=
GROQ_BASE_URL=https://api.groq.com/openai/v1
GROQ_MODEL_SPEED=meta-llama/llama-4-scout-17b-16e-instruct
GROQ_MODEL_BALANCED=meta-llama/llama-4-maverick-17b-128e-instruct

# ---- Cerebras ----------------------------------------------
CEREBRAS_API_KEY=
CEREBRAS_BASE_URL=https://api.cerebras.ai/v1
CEREBRAS_MODEL_SPEED=qwen-3-8b
CEREBRAS_MODEL_BALANCED=qwen-3-32b

# ---- OpenAI ------------------------------------------------
OPENAI_API_KEY=
OPENAI_MODEL_SPEED=gpt-4.1-mini
OPENAI_MODEL_BALANCED=gpt-4.1

# ---- Anthropic ---------------------------------------------
ANTHROPIC_API_KEY=
ANTHROPIC_MODEL_SPEED=claude-haiku-4-5
ANTHROPIC_MODEL_BALANCED=claude-sonnet-4-5

# ---- OpenRouter --------------------------------------------
OPENROUTER_API_KEY=
OPENROUTER_MODEL_SPEED=meta-llama/llama-4-scout
OPENROUTER_MODEL_BALANCED=meta-llama/llama-4-maverick

# ---- Gemini API (direct) -----------------------------------
GEMINI_API_KEY=
GEMINI_MODEL_SPEED=gemini-2.0-flash
GEMINI_MODEL_BALANCED=gemini-2.5-flash

# ---- Frontend (Vite) ---------------------------------------
# Set this on Render/Vercel when frontend is deployed separately from the FastAPI backend.
VITE_API_BASE_URL=

# ---- OAuth sign-in (optional) ------------------------------
# Local callbacks:
#   http://127.0.0.1:7860/api/auth/callback/google
#   http://127.0.0.1:7860/api/auth/callback/apple
#   http://127.0.0.1:7860/api/auth/callback/linkedin
#   http://127.0.0.1:7860/api/auth/callback/x
# Dev split-stack callbacks use port 8000 for the backend URL.
GOOGLE_OAUTH_CLIENT_ID=
GOOGLE_OAUTH_CLIENT_SECRET=
APPLE_OAUTH_CLIENT_ID=
APPLE_OAUTH_CLIENT_SECRET=
LINKEDIN_OAUTH_CLIENT_ID=
LINKEDIN_OAUTH_CLIENT_SECRET=
X_OAUTH_CLIENT_ID=
X_OAUTH_CLIENT_SECRET=
X_OAUTH_CONSUMER_KEY=
X_OAUTH_CONSUMER_SECRET=

# ============================================================
# --- Optional: Google Cloud / Firebase (archived) -----------
# Install requirements-gcp.txt and restore legacy/gcp/ files
# ============================================================
SIFT_GCP_PROJECT_ID=
SIFT_FIRESTORE_DATABASE=
SIFT_FIRESTORE_COLLECTION_PREFIX=sift
SIFT_BIGQUERY_ENABLED=false
SIFT_BIGQUERY_TABLE=
SIFT_BIGQUERY_DATASET=
SIFT_BIGQUERY_EVENTS_TABLE=events
VERTEX_LOCATION=us-central1
VERTEX_MODEL_SPEED=gemini-2.5-flash
VERTEX_MODEL_BALANCED=gemini-2.5-pro