Microsoft lança FARĀ-7B: IA agentiva roda em PCs comuns
-
Maicon Ramos
- 2 minutos de leitura
Navegue por tópicos
A Microsoft Research anunciou o FARĀ-7B, um modelo de IA agentiva de 7 bilhões de parâmetros projetado para rodar localmente em laptops e automatizar tarefas em navegadores web.
- Lançamento: 25 de novembro de 2025, licença MIT.
- Vantagens: Privacidade total on-device, custo 25x menor que GPT-4o.
- Desempenho: 73,5% no WebVoyager; roda em CPU comum.
- Limitações: Requer Magnetic-UI experimental; falha em 61,6% de tarefas complexas.
A Microsoft Research lançou em 25 de novembro de 2025 o FARĀ-7B, primeiro modelo de linguagem pequeno (SLM) open-weight especializado em uso computacional agentivo. O modelo de 7 bilhões de parâmetros opera diretamente em dispositivos locais, como laptops com Windows, automatizando tarefas web via percepção visual de screenshots e comandos de clique precisos.
Disponível no Hugging Face e Microsoft Foundry sob licença MIT, o FARĀ-7B resolve gargalos de privacidade, latência e custo em agentes de IA. Ele processa dados localmente, evitando envios para a nuvem.
Arquitetura e Treinamento
Derivado do Qwen2.5-VL-7B, o modelo recebe screenshots e prompts textuais, gerando pensamentos e tool calls com coordenadas (ex.: click(x=320, y=450)). O treinamento usou o pipeline FaraGen, com 145.603 trajetórias sintéticas validadas, custando cerca de US$ 1 por trajetória.
Para demonstração detalhada, assista ao vídeo explicativo:
Desempenho em Benchmarks
O FARĀ-7B destaca-se em eficiência. Veja a comparação:
| Modelo | Parâmetros | WebVoyager | WebTailBench | Custo de Inf. | Local |
|---|---|---|---|---|---|
| FARĀ-7B | 7B | 73,5% | 38,4% | $0,0013 | ✅ |
| UI-TARS 1.57B | 1.57B | 66,4% | 31,3% | $0,0021 | ❌ |
| GPT-4o | 1.8T | 78,2% | 42,1% | $0,032 | ❌ |
| SOM Agent | 70B | 71,0% | 35,7% | $0,018 | ❌ |
Fonte: Whitepaper Microsoft (2025). Apesar de ser 254x menor que GPT-4o, fica 8,7% atrás no WebTailBench.
Requisitos e Integração
- Hardware mínimo: 8 GB RAM + CPU 4-core (ex.: Intel i5-1235U).
- Velocidade: Até 15 FPS com GPU; 2-3 ações/min sem.
- Dependência: Requer Magnetic-UI, plataforma experimental da Microsoft.
Limitações e Críticas
O modelo falha em 61,6% das tarefas do WebTailBench, como páginas dinâmicas ou com reCAPTCHA. Não lida isoladamente e depende de Magnetic-UI, ainda em fase de pesquisa, com integração prometida no Windows 11 em 2026 (Thurrott).
Browserbase critica a lentidão: 5 segundos por ação vs. 0,5s de APIs dedicadas (Browserbase Blog). Riscos incluem cliques em phishing sem safeguards robustos para novas ameaças.
É open-weight, mas sem código de treinamento completo, limitando uso comercial sem permissão.














