Spaces:

Agents-MCP-Hackathon
/

KnowledgeBridge

Running

fazeel007 commited on Jun 10

Commit

39781c3

1 Parent(s): 8140962

Comprehensive update: Modal.com and Nebius AI integration documentation

- Add detailed explanation of Modal.com purpose: distributed serverless computing for heavy AI workloads
- Document Nebius AI role: advanced language intelligence and embedding generation
- Include specific Modal endpoints and their functions (OCR, FAISS, batch processing)
- Add integrated workflow architecture showing how both services work together
- Update API reference with Modal integration endpoints
- Include performance metrics for both platforms with realistic response times
- Add failover strategies and graceful degradation capabilities
- Include live Modal app links for testing and documentation
- Document resource allocation (2-4GB memory, CPU scaling for Modal functions)
- Add comprehensive service architecture explanation with clear separation of concerns

Files changed (1) hide show

README.md +137 -21

README.md CHANGED Viewed

@@ -83,10 +83,15 @@ KnowledgeBridge demonstrates sophisticated AI agent orchestration through multi-
 - **Helmet.js** for security headers
 ### **AI & Processing**
-- **DeepSeek-R1-0528** for chat completions and document analysis
-- **BAAI/bge-en-icl** for embedding generation
-- **Modal Client** for distributed compute tasks
-- **Smart Ingestion Service** for advanced document processing
 ## 🚀 Quick Start
@@ -101,7 +106,7 @@ NEBIUS_API_KEY=your_nebius_api_key_here
 # Modal Configuration (Optional - for advanced processing)
 MODAL_TOKEN_ID=your_modal_token_id
 MODAL_TOKEN_SECRET=your_modal_token_secret
-MODAL_BASE_URL=your_modal_endpoint
 # GitHub Configuration (Optional - for repository search)
 GITHUB_TOKEN=your_github_token_here
@@ -183,25 +188,76 @@ POST /api/embeddings
 }
 ```
 ### **Health Check**
 ```typescript
 GET /api/health
-// Returns comprehensive health status of all services
 ```
 ## 🚀 Performance & Reliability
 ### **Response Times**
-- Local search: <100ms for semantic queries
-- Document analysis: ~3-5 seconds depending on content length
-- URL validation: <2 seconds per URL with concurrent processing
-- Embedding generation: ~500ms-1s per request
 ### **Scalability Features**
-- Rate limiting prevents API abuse
-- Concurrent URL validation with configurable limits
-- Efficient caching for repeated queries
-- Graceful degradation when external services are unavailable
 ### **Error Handling**
 - React Error Boundaries prevent UI crashes
@@ -260,11 +316,61 @@ npm run build
 ## 📚 Architecture Highlights
-### **AI Integration**
-- **Nebius AI**: Primary AI service for all language model tasks
-- **DeepSeek Models**: State-of-the-art reasoning capabilities
-- **Modal Integration**: Distributed processing for heavy workloads
-- **Embedding Search**: Semantic similarity matching
 ### **Data Flow**
 1. User query → AI query enhancement (optional)
@@ -321,10 +427,20 @@ MIT License - see [LICENSE](LICENSE) file for details.
 ## 🔗 Related Resources
-- [Nebius AI Documentation](https://docs.nebius.ai/)
-- [Modal Documentation](https://modal.com/docs)
 - [React Query Documentation](https://tanstack.com/query/latest)
 - [Radix UI Components](https://www.radix-ui.com/)
 ---

 - **Helmet.js** for security headers
 ### **AI & Processing**
+- **Nebius AI Platform** - Advanced LLM and embedding capabilities
+  - **DeepSeek-R1-0528** for chat completions and document analysis
+  - **BAAI/bge-en-icl** for embedding generation (1536 dimensions)
+  - **Query Enhancement** and intelligent content analysis
+- **Modal.com Integration** - Distributed serverless computing
+  - **Heavy compute workloads** (OCR, vector indexing)
+  - **FAISS vector search** for high-performance similarity matching
+  - **Scalable document processing** with 2-4GB memory allocation
+- **Smart Ingestion Service** for coordinated AI pipeline processing
 ## 🚀 Quick Start
 # Modal Configuration (Optional - for advanced processing)
 MODAL_TOKEN_ID=your_modal_token_id
 MODAL_TOKEN_SECRET=your_modal_token_secret
+MODAL_BASE_URL=https://fazeelusmani18--knowledgebridge-main-fastapi-app.modal.run
 # GitHub Configuration (Optional - for repository search)
 GITHUB_TOKEN=your_github_token_here
 }
 ```
+### **Modal Integration Endpoints**
+```typescript
+POST /api/modal/vector-search
+{
+  query: string;
+  index_name?: string;
+  max_results?: number;
+}
+POST /api/modal/extract-text
+{
+  documents: Array<{
+    id: string;
+    content: string; // base64 for PDFs/images
+    contentType: string;
+  }>;
+}
+POST /api/modal/build-index
+{
+  documents: Array<{
+    id: string;
+    content: string;
+    title?: string;
+    source?: string;
+  }>;
+  index_name?: string;
+}
+POST /api/modal/batch-process
+{
+  documents: DocumentArray;
+  operations: ["extract_text", "build_index"];
+  index_name?: string;
+}
+```
 ### **Health Check**
 ```typescript
 GET /api/health
+// Returns comprehensive health status of all services including:
+// - Nebius AI (embeddings, chat completions)
+// - Modal.com (API connectivity, function availability)
+// - External APIs (GitHub, Wikipedia, ArXiv)
 ```
 ## 🚀 Performance & Reliability
 ### **Response Times**
+- **Local search**: <100ms for semantic queries
+- **Nebius AI operations**:
+  - Document analysis: ~3-5 seconds depending on content length
+  - Embedding generation: ~500ms-1s per request
+  - Query enhancement: ~1-2 seconds
+- **Modal.com operations**:
+  - Vector search: ~2-4 seconds (including cold start)
+  - OCR text extraction: ~5-10 seconds per document
+  - FAISS index building: ~10-30 seconds depending on document count
+  - Batch processing: Scales with document volume (parallel execution)
+- **External services**:
+  - URL validation: <2 seconds per URL with concurrent processing
 ### **Scalability Features**
+- **Rate limiting** prevents API abuse across all endpoints
+- **Modal.com serverless scaling**: Automatic resource allocation (2-4GB memory, 2+ CPU cores)
+- **Concurrent processing**: Parallel URL validation and document processing
+- **Intelligent caching**: Repeated queries cached for improved performance
+- **Distributed storage**: Modal volumes for persistent vector indices
+- **Graceful degradation**: Falls back to local processing when cloud services unavailable
+- **Load balancing**: Distributes workload between Nebius AI and Modal compute resources
 ### **Error Handling**
 - React Error Boundaries prevent UI crashes
 ## 📚 Architecture Highlights
+### **AI Integration & Service Architecture**
+#### **🧠 Nebius AI Platform** - Advanced Language Intelligence
+**Purpose**: Primary AI service for language understanding and content analysis
+**Core Functions**:
+- **LLM Operations**: DeepSeek-R1-0528 model for chat completions and document analysis
+- **Embedding Generation**: BAAI/bge-en-icl model producing 1536-dimensional vectors
+- **Query Enhancement**: AI-powered search query improvement and intent recognition
+- **Document Analysis**: Automated summary, classification, key points extraction, and quality scoring
+- **Research Synthesis**: Intelligent combination of multiple sources into coherent insights
+- **Content Classification**: Automatic categorization (academic, technical, code, general)
+**Integration Points**:
+- Direct API integration for real-time analysis
+- Fallback mechanisms with mock embeddings for reliability
+- Health monitoring and service availability checks
+#### **⚡ Modal.com Platform** - Distributed Serverless Computing
+**Purpose**: Heavy computational workloads and scalable AI processing
+**Core Functions**:
+- **Document Processing**: OCR text extraction from PDFs and images using PyPDF2 and Tesseract
+- **Vector Operations**: High-performance FAISS index building and similarity search
+- **Batch Processing**: Concurrent document processing with configurable memory (2-4GB) and CPU allocation
+- **Persistent Storage**: Modal volumes for storing vector indices and metadata across sessions
+- **Scalable APIs**: FastAPI endpoints for distributed compute tasks
+**Available Endpoints**:
+- `/vector-search` - High-performance semantic similarity search
+- `/extract-text` - OCR and PDF text extraction
+- `/build-index` - FAISS vector index creation and management
+- `/batch-process` - Bulk document processing with configurable operations
+- `/health` - Service monitoring and status verification
+**Deployed Instance**: [https://fazeelusmani18--knowledgebridge-main-fastapi-app.modal.run](https://fazeelusmani18--knowledgebridge-main-fastapi-app.modal.run)
+#### **🔄 Integrated Workflow Architecture**
+**Document Ingestion Pipeline**:
+1. **Modal Processing**: OCR/PDF extraction → Text preprocessing
+2. **Nebius Analysis** (Parallel): Classification → Summary → Quality assessment
+3. **Vector Processing**: Nebius embeddings → Modal FAISS indexing
+4. **Storage**: Local database + distributed index storage
+**Enhanced Search Workflow**:
+1. **Query Enhancement**: Nebius AI improves search queries
+2. **Parallel Search**: Modal vector search + Local database + External sources
+3. **AI Ranking**: Nebius scores and ranks results by relevance
+4. **Synthesis**: Generate comprehensive insights from combined results
+**Failover Strategy**:
+- **Modal Unavailable**: Falls back to local search and basic processing
+- **Nebius Unavailable**: Uses mock embeddings and simplified text analysis
+- **Graceful Degradation**: Maintains core functionality with reduced AI capabilities
 ### **Data Flow**
 1. User query → AI query enhancement (optional)
 ## 🔗 Related Resources
+### **AI Services**
+- [Nebius AI Documentation](https://docs.nebius.ai/) - Advanced language models and embeddings
+- [Modal Documentation](https://modal.com/docs) - Serverless computing platform
+- **Live Modal App**: [https://fazeelusmani18--knowledgebridge-main-fastapi-app.modal.run](https://fazeelusmani18--knowledgebridge-main-fastapi-app.modal.run)
+- **Modal API Docs**: [https://fazeelusmani18--knowledgebridge-main-fastapi-app.modal.run/docs](https://fazeelusmani18--knowledgebridge-main-fastapi-app.modal.run/docs)
+### **Frontend Technologies**
 - [React Query Documentation](https://tanstack.com/query/latest)
 - [Radix UI Components](https://www.radix-ui.com/)
+- [Tailwind CSS](https://tailwindcss.com/)
+### **AI Models**
+- [DeepSeek Models](https://platform.deepseek.com/) - Advanced reasoning capabilities
+- [BAAI/bge-en-icl](https://huggingface.co/BAAI/bge-en-icl) - Embedding model for semantic search
 ---