2 março 2025
HomeTecnologiaFuncionamento do novo agente de inteligência artificial

Funcionamento do novo agente de inteligência artificial

AGENTE – Interação com páginas da web: robô atua como um ser humano

A OpenAI apresentou o Operator, um agente que opera um navegador para executar tarefas na internet de forma autônoma. Utilizando um navegador próprio, o Operator consegue interagir com diferentes sites, clicando, digitando e rolando, como uma pessoa faria. Atualmente, está na fase de pesquisa e disponível para usuários Pro nos Estados Unidos, com planos de evolução baseados no feedback recebido. O objetivo é ampliar o acesso a outros usuários e integrar essas funcionalidades ao ChatGPT em um futuro próximo.

O funcionamento do Operator se baseia em um novo modelo denominado Computer-Using Agent (CUA). Este sistema combina a capacidade de visão do GPT-4 com raciocínio avançado por aprendizado por reforço, sendo treinado para interagir com interfaces gráficas de usuário (GUIs). O Operator consegue “ver” por meio de capturas de tela e interage com o navegador através de ações de mouse e teclado, o que permite a realização de atividades na web sem a necessidade de integrações de API personalizadas.

Quais são suas funcionalidades?
O Operator é capaz de realizar diversas tarefas repetitivas, como completar formulários, planejar viagens, fazer reservas em restaurantes, realizar compras de supermercado e até criar memes. O agente possui a capacidade de se auto-corrigir quando enfrenta dificuldades ou comete erros. Em situações mais complexas, ele pode solicitar que o usuário assuma o controle da ação.

Os usuários têm a opção de personalizar seus fluxos de trabalho com diretrizes específicas para todos ou alguns sites. O Operator ainda permite que prompts sejam salvos para acesso rápido, o que é ideal para tarefas que se repetem. Além disso, é possível executar várias tarefas ao mesmo tempo, abrindo novas conversas, como se fossem abas em um navegador.

segurança e privacidade
A segurança é um aspecto fundamental, com três camadas de proteção destinadas a evitar abusos.

O usuário permanece sempre no controle e o Operator solicita permissão em momentos críticos. Quando for necessário inserir informações sensíveis, como dados de login ou detalhes de pagamento, o Agent pede para que o usuário intervenha. Ele não coleta ou faz capturas de tela das informações inseridas nesse modo. Antes de ações relevantes, como concluir uma compra ou enviar um e-mail, o agente verifica com o usuário, que também pode supervisionar de perto as ações do Operator em sites sensíveis, como serviços de e-mail ou financeiros.

O gerenciamento de dados e a privacidade são igualmente importantes. O usuário pode optar por desativar a utilização dos dados do Operator para fins de treinamento de modelos e também pode excluir todos os dados de navegação com um simples clique. Além disso, o sistema é projetado para detectar e ignorar injeções de prompt e possui um mecanismo de monitoramento para identificar comportamentos suspeitos.

NOTÍCIAS RELACIONADAS
- Publicidade -

NOTÍCIAS MAIS LIDAS

error: Conteúdo protegido !!