Microsoft lança FARĀ-7B: IA agentiva roda em PCs comuns

Microsoft lança FARĀ-7B: IA agentiva roda em PCs comuns

Navegue por tópicos

A Microsoft Research anunciou o FARĀ-7B, um modelo de IA agentiva de 7 bilhões de parâmetros projetado para rodar localmente em laptops e automatizar tarefas em navegadores web.

  • Lançamento: 25 de novembro de 2025, licença MIT.
  • Vantagens: Privacidade total on-device, custo 25x menor que GPT-4o.
  • Desempenho: 73,5% no WebVoyager; roda em CPU comum.
  • Limitações: Requer Magnetic-UI experimental; falha em 61,6% de tarefas complexas.

A Microsoft Research lançou em 25 de novembro de 2025 o FARĀ-7B, primeiro modelo de linguagem pequeno (SLM) open-weight especializado em uso computacional agentivo. O modelo de 7 bilhões de parâmetros opera diretamente em dispositivos locais, como laptops com Windows, automatizando tarefas web via percepção visual de screenshots e comandos de clique precisos.

Disponível no Hugging Face e Microsoft Foundry sob licença MIT, o FARĀ-7B resolve gargalos de privacidade, latência e custo em agentes de IA. Ele processa dados localmente, evitando envios para a nuvem.

Arquitetura e Treinamento

Derivado do Qwen2.5-VL-7B, o modelo recebe screenshots e prompts textuais, gerando pensamentos e tool calls com coordenadas (ex.: click(x=320, y=450)). O treinamento usou o pipeline FaraGen, com 145.603 trajetórias sintéticas validadas, custando cerca de US$ 1 por trajetória.

Para demonstração detalhada, assista ao vídeo explicativo:

Desempenho em Benchmarks

O FARĀ-7B destaca-se em eficiência. Veja a comparação:

Modelo Parâmetros WebVoyager WebTailBench Custo de Inf. Local
FARĀ-7B 7B 73,5% 38,4% $0,0013
UI-TARS 1.57B 1.57B 66,4% 31,3% $0,0021
GPT-4o 1.8T 78,2% 42,1% $0,032
SOM Agent 70B 71,0% 35,7% $0,018

Fonte: Whitepaper Microsoft (2025). Apesar de ser 254x menor que GPT-4o, fica 8,7% atrás no WebTailBench.

Requisitos e Integração

  • Hardware mínimo: 8 GB RAM + CPU 4-core (ex.: Intel i5-1235U).
  • Velocidade: Até 15 FPS com GPU; 2-3 ações/min sem.
  • Dependência: Requer Magnetic-UI, plataforma experimental da Microsoft.

Limitações e Críticas

O modelo falha em 61,6% das tarefas do WebTailBench, como páginas dinâmicas ou com reCAPTCHA. Não lida isoladamente e depende de Magnetic-UI, ainda em fase de pesquisa, com integração prometida no Windows 11 em 2026 (Thurrott).

Browserbase critica a lentidão: 5 segundos por ação vs. 0,5s de APIs dedicadas (Browserbase Blog). Riscos incluem cliques em phishing sem safeguards robustos para novas ameaças.

É open-weight, mas sem código de treinamento completo, limitando uso comercial sem permissão.

Foto de Maicon Ramos

Maicon Ramos

Infoprodutor e especialista em automações de Marketing, fundador do Automação sem Limites, uma comunidade para ajudar empreendedores e startup.