• início
  • confira
  • sobre nós
  • serviços
  • contato
  • flash!

Project Mariner

Significado da palavra Project Mariner

Project Mariner é um agente de inteligência artificial (IA) desenvolvido pela Google DeepMind com o objetivo de automatizar tarefas no navegador por meio de raciocínio multimodal. A ferramenta representa um avanço no campo da automação baseada em agentes, permitindo que usuários interajam com a web de maneira mais eficiente. Diferente de assistentes virtuais tradicionais, o Mariner observa visualmente o conteúdo das páginas da web, compreende o contexto apresentado (como textos, imagens, elementos gráficos e até mesmo código) e é capaz de executar ações por conta própria. O grande diferencial está na sua habilidade de planejar e agir com base em objetivos dados em linguagem natural, utilizando uma combinação de visão computacional, linguagem natural e raciocínio lógico. Ele integra os modelos da família Gemini, com destaque para o Gemini 1.5 Pro, que oferece memória expandida e maior capacidade de raciocínio. Além disso, a Google dotou o Mariner com a funcionalidade “Teach and Repeat”, uma abordagem de aprendizado por demonstração que permite ao usuário ensinar uma tarefa uma única vez, sendo o agente capaz de reproduzi-la em diferentes contextos posteriormente. Isso reduz drasticamente o tempo necessário para configurar tarefas repetitivas. Atualmente, o Project Mariner está disponível em fase experimental para assinantes do plano Ultra do Gemini nos Estados Unidos, com planos de expansão global e integração com produtos como a API do Gemini e o Vertex AI. Seu lançamento foi anunciado durante o Google I/O 2025, e o projeto já está sendo considerado uma das iniciativas mais promissoras no campo de agentes autônomos baseados em IA. Esse avanço representa um marco importante não apenas para usuários comuns, mas também para empresas que desejam automatizar interações com páginas da web, como navegação, compras online, preenchimento de formulários, entre outras ações.

Como o Project Mariner funciona

O Project Mariner funciona observando o navegador em tempo real e identificando os elementos presentes na interface. Ele processa as informações visualmente, sem precisar de APIs ou estruturas de dados específicas da página. Assim, é capaz de compreender campos de formulários, botões de navegação, imagens, tabelas e outros elementos visuais. Após interpretar o conteúdo, o Mariner planeja sua ação com base no comando do usuário, que pode ser passado em linguagem natural, como: “Encontre passagens para São Paulo na próxima sexta-feira e compare preços”. A partir dessa instrução, o agente estrutura um plano de ações, que pode incluir abrir sites de companhias aéreas, preencher formulários de busca, analisar resultados e retornar com uma resposta organizada.

Uma das capacidades mais inovadoras do Mariner é o chamado multimodal reasoning (raciocínio multimodal), que permite ao agente cruzar informações textuais com dados visuais para compreender o que está acontecendo na tela. Por exemplo, ele pode comparar imagens de produtos em uma loja virtual com os textos das descrições para determinar qual item oferece o melhor custo-benefício. A Google desenvolveu o Mariner com um sistema de memória temporária para lidar com múltiplas abas e contextos simultaneamente. Dessa forma, o agente pode executar até 10 tarefas ao mesmo tempo, sem perder o foco ou a sequência lógica das ações. Cada decisão é baseada em inferência contextual, garantindo que as respostas estejam alinhadas com a intenção do usuário.

Teach and Repeat: aprendendo com o usuário

A funcionalidade Teach and Repeat é um marco no desenvolvimento de agentes inteligentes. Trata-se de um recurso que permite ao usuário ensinar uma tarefa ao Mariner apenas uma vez — por exemplo, como realizar o cadastro em uma plataforma específica — e, nas próximas vezes, o agente será capaz de repetir essa tarefa automaticamente. Essa abordagem se baseia em técnicas de aprendizado por demonstração, amplamente utilizadas em robótica e IA aplicada. No Mariner, essa técnica é adaptada para o ambiente do navegador, com aprendizado baseado em histórico de cliques, sequência de navegação e reconhecimento visual.

Uma aplicação prática é o preenchimento de formulários de inscrição em eventos ou sistemas internos de empresas. Após ensinar o Mariner uma única vez, ele poderá executar essa tarefa em diferentes contextos, adaptando campos variáveis automaticamente. Isso elimina a necessidade de criar scripts específicos ou extensões de navegador. O agente, por ser visual e adaptável, consegue lidar com alterações simples nas interfaces, como campos renomeados ou botões reposicionados.

Aplicações práticas do Project Mariner

O potencial do Project Mariner vai muito além da automação pessoal. Ele já está sendo testado em cenários como atendimento ao cliente, navegação em painéis administrativos e suporte a fluxos de trabalho repetitivos em empresas. Por exemplo, ele pode ser usado para configurar anúncios em plataformas como Google Ads, verificar métricas em painéis de analytics ou navegar em sistemas ERP complexos. A promessa da Google é que o Mariner consiga ser útil tanto para usuários leigos quanto para desenvolvedores e analistas que precisam automatizar ações específicas em sistemas web.

Durante a demonstração pública no Google I/O, o Mariner foi mostrado navegando em sites de reservas de imóveis, aplicando filtros personalizados e extraindo dados de preço. Tudo isso sem qualquer codificação ou comando técnico. Essa acessibilidade é fundamental para sua adoção em larga escala. Ainda segundo a Google, o Mariner também poderá ser usado em conjunto com outros serviços baseados em IA, como o Google Workspace, oferecendo automações como preenchimento automático de e-mails com base em dados extraídos da web.

Integração com produtos da Google

O Mariner está sendo preparado para integração com o ecossistema da Google, especialmente com o Gemini API e o Vertex AI. O Gemini é a plataforma que hospeda os modelos de linguagem e visão utilizados pelo Mariner, enquanto o Vertex AI é a infraestrutura de desenvolvimento para soluções de machine learning em nuvem. Essa integração permitirá que empresas incorporem o Mariner em fluxos internos, utilizando APIs para acionar o agente com comandos específicos, processar resultados e integrar com bancos de dados, sistemas CRM e outros softwares corporativos.

Com isso, o Mariner deixa de ser apenas um assistente pessoal e passa a ser uma ferramenta estratégica em automação de processos de negócio. Por exemplo, em um e-commerce, ele poderá realizar auditorias em páginas de produtos, corrigindo automaticamente imagens fora de padrão ou descrições incompletas. Em serviços financeiros, poderá cruzar informações em diferentes portais para validar dados de crédito. Essas funcionalidades abrem caminho para uma nova geração de agentes corporativos, mais inteligentes e adaptáveis.

Considerações sobre privacidade e controle

Uma das maiores preocupações relacionadas ao uso de agentes inteligentes é a privacidade dos dados e o controle das ações automatizadas. A Google afirmou que o Project Mariner opera localmente no navegador, sem transmitir dados sensíveis para servidores externos sem o consentimento do usuário. Além disso, todas as ações executadas pelo Mariner podem ser visualizadas, interrompidas ou revistas pelo usuário em tempo real, garantindo transparência.

Esse modelo de operação garante maior segurança e confiabilidade para aplicações em ambientes corporativos, onde o controle sobre as informações é essencial. O usuário mantém a soberania sobre o que o agente pode ou não fazer, configurando permissões específicas para diferentes tipos de tarefas. Essa abordagem favorece o uso do Mariner em setores regulados, como saúde, finanças e jurídico.

Conclusão

O Project Mariner inaugura uma nova era de interação com a web, permitindo que agentes de IA compreendam contextos visuais e executem tarefas com autonomia. Combinando raciocínio multimodal, aprendizado por demonstração e integração com a plataforma Gemini, o Mariner é uma das ferramentas mais promissoras da atualidade para automação de tarefas no navegador. À medida que a Google amplia seu acesso e integra a solução com outros produtos, é esperado que o Mariner desempenhe um papel central na forma como pessoas e empresas lidam com atividades repetitivas, ganhando tempo e eficiência.

Palavras relacionadas ao termo Project Mariner:

  • agente
  • automação
  • gemini
  • IA
  • multimodal
  • navegador
  • raciocínio multimodal
  • reasoning

Glossário A-Z

  • A
  • B
  • C
  • D
  • E
  • F
  • G
  • H
  • I
  • J
  • K
  • L
  • M
  • N
  • O
  • P
  • Q
  • R
  • S
  • T
  • U
  • V
  • W
  • X
  • Y
  • Z
Compartilhar
Fechar

Compartilhar

  • Facebook
  • Twitter
  • LinkedIn
  • WhatsApp
  • o mundo muda na velocidade de um raio. se inscreva na Flash!, nossa newsletter

    • início
    • confira
    • sobre nós
    • serviços
    • contato
    • flash!
    DESDE 2006
    • Política de privacidade
    • Aviso legal
    • LinkedIn
    • Instagram
    • Pinterest