🌐 Planejamento da Fase 1 — Fundação do Ambiente Base
Objetivo: implantar o ambiente mínimo viável (MVP) para automação de processos e IA, garantindo segurança, escalabilidade e custo/benefício.
1) Plataforma Central (Automação)
Escolha: n8n em VPS HostGator
Planos disponíveis
| Prazo | Mensal aprox. | Pagamento | Observações |
|---|---|---|---|
| 1 ano | R$ 45/mês | Anual | Sugestão inicial para validar uso real. |
| 2 anos | R$ 35/mês | Bienal | Melhor custo que 1 ano. |
| 3 anos | R$ 30,39/mês | Trienal | Total estimado R$ 1.094,11. |
Especificação alvo
- 3 vCPU • 4 GB RAM DDR4 • 160 GB SSD
- IP dedicado • Execuções ilimitadas
- Painel com instalador automático n8n
Motivo da escolha
Equilíbrio custo × desempenho × escalabilidade para o volume atual previsto. Permite filas, webhooks e fluxos agendados sem limites práticos para o MVP.
Escalabilidade
Migração vertical para VPS n8n Optimized/Platinum ou horizontalização com múltiplas instâncias por fila de trabalho.
Custo estimado
- 1 ano: ~R$ 540
- 2 anos: ~R$ 840
- 3 anos: R$ 1.094,11 (≈ R$ 30,39/mês)
Saídas desta etapa
- VPS provisionada e endurecida (SSH, firewall, backups)
- n8n instalado/rodando com domínio e HTTPS (Let’s Encrypt)
2) MCP (Model Context Protocol)
O que é
Camada de orquestração de modelos para desacoplar os fluxos do provedor de IA.
Função
Centraliza a comunicação n8n ↔ LLMs (OpenAI, Gemini, Ollama/Mistral) e permite troca ou mix cloud/local sem reescrever fluxos.
Por que agora
- Evita vendor-lock-in
- Permite estratégia híbrida (custo × confidencialidade)
Saídas
- Gateway MCP acessível por token interno
- Conectores prontos: OpenAI API, Google AI, Ollama
3) Estrutura de RAG (Retrieval-Augmented Generation)
Fontes iniciais
- Entrevistas, diagnósticos, processos, planilhas operacionais
Armazenamento
- PostgreSQL + pgVector (preferência) ou ChromaDB/Weaviate (setup simples)
Pipeline (n8n)
- Upload/coleta
- Limpeza/normalização
- Vetorização
- Indexação
- Consulta via agente
Benefício
A IA responde com base em informações reais da Fogassa, reduzindo alucinações.
Saídas
- Índice vetorial populado com documentos prioritários
- Rotas de
/ingeste/querydocumentadas
4) Formas de Acesso aos Fluxos
Inicial (MVP)
- Open WebUI conectado ao n8n/MCP (acesso web autenticado)
Expansão (futuro)
- Telegram Bot para times internos
- WhatsApp (Waha/Twilio) para casos selecionados
- App próprio sobre a API do n8n (Node/Next.js) quando/SE necessário
Saídas
- Portal único (Open WebUI) com SSO simples e logs de auditoria
5) LLMs (Modelos de Linguagem)
Cloud (início)
- OpenAI GPT-4o mini (≈ US$ 0,15 / 1M input | US$ 0,60 / 1M output)
- Gemini 1.5 Flash (≈ US$ 0,075 / 1M tokens)
Local (dados sensíveis)
- Ollama com Mistral 7B ou Llama 3 8B
- ↓ custo e ↑ privacidade
Estratégia híbrida
- Interno/confidencial → LLM local (Ollama)
- Criativo/complexo → Cloud (OpenAI/Gemini)
Saídas
- Rotas MCP/Providers configuradas
- Políticas de roteamento (regras: confidencialidade, custo, latência)
6) Custos Resumidos
- Infra VPS (1 ano): R$ ~540
- Infra VPS (2 anos): R$ ~840
- Infra VPS (3 anos): R$ 1.094,11 (≈ R$ 30,39/mês)
- APIs LLM (variável): US$ 30–50/mês (~R$ 150–250) como faixa inicial
- Banco vetorial: open-source (sem custo de licença)
- Domínio/SSL: incluído (Let’s Encrypt)
- Reserva de contingência: 10–15% do custo variável
7) Cronograma Previsto
| Semana | Atividades | Entregas-Chave |
|---|---|---|
| Semana 1 | Contratação da VPS e configuração inicial | VPS provisionada com n8n instalado, domínio e HTTPS ativos |
| Semana 2 | Implantação do MCP | Gateway ativo com conectores (OpenAI, Gemini, Ollama) configurados |
| Semana 3 | Estruturação do RAG | Banco vetorial ativo, pipeline de ingestão e primeiros documentos indexados |
| Semana 4 | Acesso e fluxos iniciais | Open WebUI configurado, fluxo de teste funcionando e documentação entregue |
Tempo total estimado: ~4 semanas (20 dias úteis)
8) Visão Resumida das Próximas Fases
Fase 2 – Padronização de Processos
Objetivo: uniformizar fluxos entre setores, criar checklists e definir pontos de integração.
Prazo estimado: ~1 mês
Fase 3 – Automação Inicial (Quick Wins)
Objetivo: implantar soluções simples de alto impacto, como automatização de tarefas no CAD e Corte Laser.
Prazo estimado: 2 a 3 meses
Fase 4 – Expansão de IA
Objetivo: aplicar IA em processos-chave (orçamentos, financeiro, almoxarifado).
Prazo estimado: 4 a 6 meses
Fase 5 – Integração Global
Objetivo: dashboard unificado com KPIs de toda a operação, integrando produção e administrativo.
Prazo estimado: 6 a 9 meses
Fase 6 – Otimização Contínua
Objetivo: incorporar IA na rotina, reavaliar processos e expandir uso de dados históricos.
Prazo estimado: contínuo (após 1 ano)