Notic.IA
Posts
Notic.IA

Notic.IA

A IA vs o teste de QI 🧠

Felipe Berg
7 de fevereiro de 2025

🧠Por Que o QI é um Teste Ruim para a IA🧠

Durante uma recente aparição na imprensa, Sam Altman, CEO da OpenAI, comentou sobre a rápida melhoria no "QI" da inteligência artificial nos últimos anos.

“Acho que, aproximadamente, a cada ano movemos um desvio padrão de QI,” disse Altman. “Mas isso é mais uma sensação do que uma medição científica exata.”

Essa ideia, entretanto, enfrenta críticas. Muitos especialistas argumentam que o QI é uma medida inadequada e enganosa para avaliar as capacidades de um modelo de IA.

Críticas ao Uso do QI na IA

Sandra Wachter, pesquisadora de tecnologia e regulação em Oxford, destacou que usar medidas humanas para descrever capacidades de IA é como “comparar maçãs com laranjas.” Os testes de QI, por serem relativos, não capturam a inteligência prática e são meros instantâneos de análise lógica e raciocínio abstrato, sem considerar a complexidade da inteligência humana.
Além disso, testes de QI possuem origens controversas e são criticados por possíveis viés culturais. Os Keyes, doutorando na Universidade de Washington, ressalta que essas provas falham em medir cognição e inteligência de forma abrangente. A IA, com seus vastos recursos de memória e dados, tem vantagem injusta, fácil de manipular para alcançar altos resultados nesses testes.

A Busca por Novos Testes

Mike Cook, pesquisador em IA do King’s College London, adverte que comparar diretamente a performance de sistemas de IA com habilidades humanas é inadequado. "Os testes foram projetados para humanos, e a IA resolve problemas de maneiras muito distintas."
Heidy Khlaaf, cientista-chefe do AI Now Institute, sublinha a necessidade de desenvolver novos benchmarks, pois testes de QI foram concebidos com fins humanos em mente e não refletem a natureza computacional das IAs.

💋Tinder Apostará em Combinações Guiadas por IA Enquanto Aplicativo de Namoro Perde Usuários💋

Iniciativas de IA do Tinder

O Tinder espera reverter a sua queda contínua de usuários ativos apostando na Inteligência Artificial. No próximo trimestre, o aplicativo de namoro, controlado pela Match, vai lançar novos recursos de descoberta e combinação acionados por IA.

Alternativa ao "Deslizar"

As adições visam oferecer aos solteiros cansados uma alternativa ao gesto de "deslizar", característico do aplicativo. Gary Swidler, CFO do Match Group, comunicou aos investidores que a combinação baseada em IA oferecerá aos usuários “algo além do deslizar” para conhecer novas pessoas.

Complemento e Não Substituição

No entanto, Swidler deixou claro que a combinação por IA será um complemento ao deslizar vigente e não uma substituição. Ele destacou o desejo de aumentar o engajamento e a qualidade das combinações.

Desafios e Quedas no Crescimento

A inovação em IA chega em um momento desafiador para o Tinder e a indústria de aplicativos de namoro em geral. O cansaço dos usuários com o formato dos aplicativos, as preocupações de segurança e a percepção de opções limitadas têm contribuído para o afastamento dos consumidores.
O crescimento global de usuários do Tinder ainda está em declínio. Em outubro, os usuários ativos mensais caíram 10% ano a ano, apesar de uma leve recuperação posterior.

Perspectivas Futuras

A receita do Tinder também ficou abaixo das previsões internas, somando $476 milhões em comparação com a previsão de $480-485 milhões. Para o futuro, o Match Group nomeou Spencer Rascoff como novo CEO, trazendo otimismo quanto ao potencial da IA em transformar o segmento de encontros online.
Rascoff vê a explosão atual na IA como uma oportunidade semelhante à transição do desktop para o móvel de uma década atrás, esperançoso de que iniciativas com IA possam renovar o engajamento da base de usuários.

🤖Google Introduz Silenciosamente o Modelo de IA Experimental Gemini 2.0 Pro🤖

Lançamento Silencioso

O Google introduziu silenciosamente seu mais recente modelo de IA, o Gemini 2.0 Pro Experimental, através de uma atualização de changelog em seu aplicativo de chatbot Gemini. Ao contrário dos lançamentos anteriores de IA com alto perfil, esta atualização não teve um grande anúncio.

Atualização do Modelo

O novo modelo melhora o Gemini 1.5 Pro, lançado em fevereiro do ano passado. Essa mudança ocorre enquanto a indústria de IA observa de perto a startup chinesa DeepSeek, cujos modelos estão rivalizando com os principais produtos americanos, gerando preocupações no Vale do Silício e no governo dos EUA.
Disponibilidade e Capacidades
A partir de quinta-feira, o Gemini 2.0 Pro Experimental estará acessível para usuários do Gemini Advanced, sendo o modelo mais avançado na linha de IA Gemini do Google. O Google afirma que ele melhora a precisão factual e oferece melhores desempenhos em codificação e questões matemáticas.

Objetivos e Aplicações

Conforme indicado no changelog, este modelo é projetado para solucionar desafios complexos, como criar programas completos do zero ou resolver problemas matemáticos elaborados, incluindo modelos estatísticos e algoritmos quânticos.

Planos de Acesso

O modelo está disponível através do plano Premium do Google AI no Google One e está incluído nos add-ons do Gemini para o Google Workspace.

Questões e Limitações

O Google classificou o novo modelo como uma versão “visualização antecipada”, advertindo que pode apresentar comportamentos inesperados ou erros. Diferente de outros modelos no aplicativo Gemini, ele não tem acesso a informações em tempo real e não é compatível com certos recursos do aplicativo.

Reações ao Lançamento

Apesar das promessas do novo modelo, o lançamento discreto levantou dúvidas. Alguns usuários notaram que o changelog mencionava o Gemini 2.0 Pro Experimental, mas essa referência foi posteriormente removida. O Google explicou que uma “nota de lançamento desatualizada” foi publicada por engano. Enquanto traz melhorias, suas limitações evidenciam os desafios contínuos desenvolvendo a IA.

🖼️GitHub Copilot Transforma Mockups em Código a Partir de Imagens🖼️

Novas Funcionalidades do Copilot

A GitHub anunciou uma série de atualizações para o Copilot, revelando um vislumbre de um futuro mais "agêncico" para seu programador parceiro impulsionado por IA. Entre as atualizações notáveis está um recurso chamado Vision for Copilot, que permite aos usuários anexar uma captura de tela, foto ou diagrama a um chat, com o Copilot gerando a interface, o código e o texto alternativo para dar vida ao conteúdo.

Exemplos de Uso

Por exemplo, alguém de uma equipe de marketing pode tirar uma captura de tela de uma página da web e ilustrar algumas mudanças que gostaria de fazer nessa página. Em vez de solicitar essas alterações por meio de prompts de texto, agora é possível fazer upload de uma imagem e simplesmente pedir ao Copilot para implementar as alterações indicadas no arquivo.

Disponibilidade e Integração

Vale ressaltar que este recurso estava disponível como uma extensão no VS Code desde outubro, com a Microsoft confirmando na descrição do aplicativo que eventualmente seria descontinuado em favor de uma funcionalidade nativa dentro do GitHub Copilot Chat. Anteriormente, também exigia que o usuário tivesse sua própria chave de API.

Sugestões de Próxima Edição

O GitHub também está introduzindo uma nova funcionalidade chamada "sugestões de próxima edição", como parte da funcionalidade abrangente de autocompletar código do Copilot. Antes, o Copilot no editor VS Code trabalhava a partir da posição do cursor, mas agora ele analisará outras edições recentes para prever o que você pode querer fazer a seguir, utilizando pistas contextuais mais ricas para identificar e sugerir automaticamente qual deve ser a próxima edição.

Futuro Agêncico do GitHub

O GitHub estreou o Copilot Edits no último novembro, servindo como uma nova maneira de realizar edições em múltiplos arquivos usando prompts de linguagem natural. Este recurso agora está disponível para uso geral e inclui um novo “modo agente” que identifica todos os arquivos relevantes para as alterações que um desenvolvedor está tentando fazer, em vez de depender deles para selecionar manualmente os arquivos a serem modificados.

Projeto Padawan

A longo prazo, o objetivo é aplicar esses "modos agente" a outros aspectos do Copilot, permitindo maior automação em uma gama mais ampla de tarefas interligadas. Por isso, a GitHub deu um vislumbre de uma nova iniciativa chamada Projeto Padawan, que é basicamente um agente de engenharia de software (SWE) que pode gerenciar tarefas inteiras sob a direção de um desenvolvedor que atribui questões ao Copilot.
Thomas Dohmke, CEO da GitHub, não especificou quando isso estará disponível, apenas observou que estará trabalhando com parceiros e a comunidade para aprimorá-lo.

🦾Pesquisadores da Hugging Face Visam Criar uma Versão 'Aberta' da Ferramenta de Pesquisa Profunda da OpenAI🦾

Iniciativa da Hugging Face

Um grupo de desenvolvedores da plataforma de desenvolvimento de IA Hugging Face, incluindo Thomas Wolf, co-fundador e cientista-chefe da empresa, afirma ter criado uma versão "aberta" da ferramenta de pesquisa profunda da OpenAI.

Anúncio da OpenAI

A OpenAI revelou seu recurso chamado pesquisa profunda em um evento no domingo, que rastreia a web para compilar relatórios de pesquisa sobre qualquer assunto. Enquanto impressionante, esta funcionalidade está disponível apenas em prévia limitada para usuários assinantes do plano ChatGPT Pro de $200 por mês.

Projeto Open Deep Research

O projeto da equipe Hugging Face, denominado Open Deep Research, consiste em um modelo de IA — o o1 da OpenAI — e uma "estrutura agentic" de código aberto que ajuda o modelo a planejar sua análise e o guia para utilizar ferramentas como motores de busca. O o1 é um modelo proprietário, mas a equipe diz que ele apresentou desempenho superior aos modelos "abertos", como o R1 da DeepSeek.

Capacidade de Navegação Autônoma

Em menos de 24 horas, os pesquisadores conseguiram fazer o o1 usar um navegador simples baseado em texto e um kit de ferramentas chamado "inspector de texto" para ler arquivos na web. O Open Deep Research pode navegar online autonomamente, afirmam os desenvolvedores, passando por páginas, manipulando arquivos e até mesmo realizando cálculos com dados.

Desempenho em Benchmarks

No GAIA, um benchmark para assistentes de IA gerais, o Open Deep Research atinge uma pontuação de 54%, em comparação à pontuação de 67,36% da pesquisa profunda da OpenAI.

Limitações e Melhorias Futuras

Em um teste público da demonstração configurada pela equipe, a carga na página era alta, resultando em mensagem de erro após 10 minutos de espera.
Os pesquisadores garantem que estão comprometidos em melhorar a experiência e disponibilizaram o código fonte no GitHub para inspeção e feedback.

Alternativas à Pesquisa Profunda

Vale destacar que há várias "reproduções" da pesquisa profunda da OpenAI na web, algumas usando modelos e ferramentas abertas. No entanto, o componente crucial que elas — e o Open Deep Research — não possuem é o o3, o modelo que fundamenta a pesquisa profunda. Poucos modelos, se houver, superam o o3 em testes relacionados a responder perguntas complexas e coleta de informações, sugerindo que alternativas à pesquisa profunda talvez não sejam tão eficazes quanto a original.

Ferramenta da Semana

Bem-vindo à nossa nova seção "Ferramenta da Semana", onde traremos, a cada edição, uma análise detalhada de uma ferramenta inovadora que está causando impacto no mundo da tecnologia e da inteligência artificial. Nosso objetivo é mantê-lo informado e inspirado pelas soluções que estão transformando a forma como trabalhamos, criamos e interagimos.

📖 Você nunca mais vai gerenciar seus workflows do mesmo jeito 📖

n8n é uma ferramenta inovadora que transforma a maneira como você automatiza processos e gerencia fluxos de trabalho, utilizando uma plataforma open-source para proporcionar uma experiência de automação altamente eficiente e customizável. Com sua interface intuitiva e poderosa, o n8n assegura que você leve a automação das suas tarefas para o próximo nível.

Funcionalidades Principais

Automação Personalizável: O n8n permite criar automações personalizadas e complexas sem necessidade de programação extensiva. De fluxos simples a integrações avançadas, suas possibilidades são vastas.
Fluxos Visuais Intuitivos: Com sua interface de arrastar e soltar, você pode configurar fluxos visualmente, facilitando a compreensão e edição dos mesmos. Isso agiliza a criação de workflows, mesmo para iniciantes.
Conectores Multipropósito: Oferece integrações nativas com centenas de aplicativos e serviços, garantindo uma conexão fluida com ferramentas essenciais como CRM, ERP, email, e muito mais.
Execução Self-hosted: Hospede o n8n em seus próprios servidores para controle total e segurança dos dados, ou opte por serviços em nuvem para flexibilidade extra.
Gatilhos e Ações Dinâmicas: Configure gatilhos e ações que respondem a eventos em tempo real, garantindo que seus processos sejam acionados imediatamente sempre que uma condição é atendida.
Comunidade Ativa e Documentação Rica: Com suporte de uma comunidade vibrante, é fácil encontrar exemplos, tutoriais e assistência para personalizar seu uso do n8n.

👉Descubra como o n8n pode revolucionar seus workflows e levar sua automação a um novo patamar de excelência!