feat: MCP Browser v3.1.1 - 56+ tools, visual overlays, fixes

- Added 9 new tools: visual overlay, highlight, toast, drag-drop, etc.
- Fixed evaluateJS to support function arguments
- Fixed hover for non-visible elements
- Fixed storage operations with try/catch
- Added 10 new wait tools: clickable, element visible, text
- Fixed tool name mapping in server.js for MCP protocol
- Updated README with 60+ tools documentation
- Version bump to 3.1.1
This commit is contained in:
2026-04-07 16:29:38 -03:00
parent 13f7392555
commit d8796531ee
17 changed files with 675 additions and 77 deletions
+91 -17
View File
@@ -1,21 +1,18 @@
# MCP-Browser v3.0.0
# MCP-Browser v3.1.1
MCP server para automação de navegador de alta qualidade usando [Playwright](https://playwright.dev/) com **42 tools** para automação avançada.
MCP server para automação de navegador de alta qualidade usando [Playwright](https://playwright.dev/) com **60+ tools** para automação avançada.
![Node](https://img.shields.io/badge/Node.js-18+-339933?logo=node.js&logoColor=white)
![MCP](https://img.shields.io/badge/MCP-stdio-blue)
![Platform](https://img.shields.io/badge/Windows%20|%20Linux%20|%20macOS-lightgrey)
![Tools](https://img.shields.io/badge/42%20tools-green)
![Tools](https://img.shields.io/badge/60%2B%20tools-green)
## Novidades v3.0
## Novidades v3.1.1
- **Correções de bugs** - hover, storage, evaluateJS com argumentos
- **Melhor responsividade** - Visual overlay adaptável para mobile/tablet
- **Stealth Mode** - Anti-detecção avançada
- **25 novas tools** - Muito mais poder
- **Multi-Tab real** - Gerenciamento completo
- **PDF generation** - Geração de PDFs
- **Network Monitoring** - Logs de rede
- **Device Emulation** - iPhone, Pixel, etc
- **Performance Metrics** - Métricas detalhadas
- **60+ ferramentas** - Cobertura completa de automação
## Instalação
@@ -30,7 +27,7 @@ npx playwright install chromium
node server.js
```
## Tools Disponíveis (42)
## Tools Disponíveis (60+)
### Navegação
| Tool | Descrição |
@@ -55,7 +52,8 @@ node server.js
| `hover` | Faz hover |
| `select` | Seleciona opção |
| `press_key` | Pressiona tecla |
| `scroll_to` | Rola página |
| `scroll_to` | Rola página (top/bottom/selector/px) |
| `drag_and_drop` | Arrasta e solta elemento |
| `upload_file` | Upload de arquivo |
### Extração
@@ -67,6 +65,7 @@ node server.js
| `get_buttons` | Lista botões |
| `get_forms` | Lista formulários |
| `extract_elements` | Extrai elementos |
| `get_input_values` | Obtém valores de inputs |
| `get_url` | URL atual |
| `get_title` | Título da página |
| `evaluate_js` | Executa JavaScript |
@@ -75,8 +74,16 @@ node server.js
| Tool | Descrição |
|------|-----------|
| `screenshot` | Screenshot (full/elemento) |
| `annotated_screenshot` | Screenshot com elementos highlights |
| `pdf` | Gera PDF |
### Visuais & Overlay
| Tool | Descrição |
|------|-----------|
| `enable_visual_overlay` | Ativa cursor customizado + indicadores |
| `highlight_element` | Destaca elemento com animação |
| `show_toast` | Notificação toast na página |
### Viewport & Device
| Tool | Descrição |
|------|-----------|
@@ -109,6 +116,9 @@ node server.js
|------|-----------|
| `wait` | Aguarda ms |
| `wait_for_selector` | Espera elemento |
| `wait_for_element_visible` | Espera elemento visível |
| `wait_for_clickable` | Espera elemento clicável |
| `wait_for_text` | Espera texto aparecer |
### Automação
| Tool | Descrição |
@@ -133,13 +143,16 @@ fill_form_auto({"email": "user@test.com", "password": "123"})
smart_click("Entrar")
wait_for_url("**dashboard**")
// Destacar elemento
highlight_element("button.submit")
// Screenshot com anotações
annotated_screenshot({highlight: [".product-card", ".buy-button"]})
// Extrair dados
get_links()
get_text(".product-title")
// Screenshot
screenshot({fullPage: true})
// Emular mobile
emulate_device("iphone-14")
```
@@ -158,9 +171,24 @@ MCP-Browser/
├── server.js # Servidor MCP
├── browser.js # Engine Playwright
├── package.json
└── tools/ # 42 tools
└── tools/ # 60+ tools
├── openUrl.js
├── click.js
├── type.js
├── screenshot.js
├── getText.js
├── getLinks.js
├── waitForSelector.js
├── extractElements.js
├── smartClick.js
├── smartType.js
├── getButtons.js
├── smartWaitNavigation.js
├── getForms.js
├── fillFormAuto.js
├── agentFlow.js
├── agentFlowV2.js
├── closeBrowser.js
├── getURL.js
├── getTitle.js
├── getHTML.js
@@ -190,9 +218,55 @@ MCP-Browser/
├── blockResources.js
├── uploadFile.js
├── getPerformanceMetrics.js
── wait.js
── wait.js
├── enableVisualOverlay.js
├── showToast.js
├── highlightElement.js
├── dragAndDrop.js
├── annotatedScreenshot.js
├── getInputValues.js
├── waitForClickable.js
├── waitForElementVisible.js
└── waitForText.js
```
## Sugestões de Novas Funcionalidades Premium
### 1. Gravação e Replay de Ações
- Gravar sequência de ações (click, type, scroll)
- Replay automatizado com timing
- Exportar/importar scripts
### 2. OCR e Detecção Visual
- Detectar texto em imagens (Tesseract)
- Identificar elementos por imagem
- Screenshots AI-driven
### 3. Integração com IA
- Análise de página com LLM
- Auto-complete de ações
- Detecção de formulários智能化
### 4. Proxy Rotativo
- Múltiplos proxies
- Rotação automática
-Geo-targeting
### 5. Sessões Persistentes
- Salvar/carregar estado
- Snapshot de abas
- Backup de cookies
### 6. Webhooks e Eventos
- Notificações em tempo real
- Monitoramento de mudanças
- Integração com Zapier
### 7. headless + UI Mode
- Alternar entre headless/visible
- DevTools integrado
- Debug visual
## Licença
MIT