- Notic.IA
- Posts
- 🚀 Desvendando o Futuro da IA: Da Criação de Avatares à Produção de Vídeos!
🚀 Desvendando o Futuro da IA: Da Criação de Avatares à Produção de Vídeos!
Notic.IA

🤩 xAI Contrata Engenheiro para Criar Garotas de Anime com IA
A xAI, empresa de Elon Musk, lançou recentemente seus companheiros de IA, incluindo a "goth waifu" Ani e o panda vermelho homicida Bad Rudy. Se você quer fazer parte disso, está com sorte: a empresa está contratando para a vaga de “Fullstack Engineer – Waifus”, ou seja, para criar garotas de anime movidas a IA para as pessoas se apaixonarem.
Este trabalho faz parte da missão da xAI de “criar sistemas de IA que possam entender com precisão o universo e ajudar a humanidade na busca do conhecimento”, segundo a descrição da vaga.
No momento, esse entendimento preciso do universo inclui saber como criar uma namorada submissa e de bolso que irá conquistar os corações e os bolsos dos usuários.
A xAI tem dezenas de vagas abertas no momento, então não podemos dizer que a empresa está colocando todos os seus ovos na cesta das waifus. Mas podemos esperar que Ani ganhe algumas amigas no futuro.

🔊 Mistral Lança Voxtral: O Primeiro Modelo de Áudio de IA de Código Aberto
À medida que os sistemas de IA se tornam mais capazes, a comunicação por voz está rapidamente se tornando a forma padrão de interação com as máquinas. A startup francesa de IA Mistral entrou na corrida do áudio com seu primeiro modelo aberto, buscando desafiar o domínio de sistemas corporativos fechados com alternativas de código aberto.
Na terça-feira, a Mistral anunciou o lançamento do Voxtral, sua primeira família de modelos de áudio voltada para empresas.
A empresa apresenta o Voxtral como o primeiro modelo aberto capaz de implantar “inteligência de fala verdadeiramente utilizável em produção”. Isso significa que os desenvolvedores não precisarão mais escolher entre um sistema de código aberto barato que erra nas transcrições e não entende o que está sendo dito, e um que funciona bem, mas é fechado, resultando em custos mais altos e menos controle sobre a implementação.
Para as empresas, o Voxtral oferece uma alternativa acessível que a empresa afirma ser “menos da metade do preço” de soluções comparáveis.
O Voxtral pode transcrever até 30 minutos de áudio. Graças à sua base LLM, o Mistral Small 3.1, ele pode entender até 40 minutos, permitindo que os usuários façam perguntas sobre o conteúdo do áudio, gerem resumos ou transformem comandos de voz em ações em tempo real, como chamar APIs ou executar funções. O Voxtral também é multilíngue, com capacidade de transcrever e entender idiomas como inglês, espanhol, francês, português, hindi, alemão, holandês e italiano.
A empresa oferece duas variantes de seus “modelos de compreensão de fala”:
Voxtral Small: Possui 24 bilhões de parâmetros para implantações em escala de produção e é competitivo com ElevenLabs Scribe, GPT-4o-mini e Gemini 2.5 Flash.
Voxtral Mini: Possui 3 bilhões de parâmetros para implantações locais e de borda. Há também uma versão de API ultra-econômica, simplificada e rápida do modelo de 3 bilhões, chamada Voxtral Mini Transcribe, otimizada para casos de uso apenas de transcrição, prometendo superar o OpenAI Whisper por menos da metade do preço.
Os usuários podem experimentar o Voxtral gratuitamente baixando a API no Hugging Face ou testando os modelos no chatbot Le Chat da Mistral. A integração da API em aplicativos custa a partir de US$ 0,001 por minuto, de acordo com a empresa.
O lançamento ocorre um mês após a Mistral anunciar o Magistral, sua primeira família de modelos de raciocínio que resolvem problemas passo a passo para melhorar a confiabilidade.
A Mistral, uma das principais empresas de IA da Europa, é conhecida por sua defesa de modelos de IA de código aberto. No início deste mês, a TechCrunch noticiou que a empresa está em negociações para levantar até US$ 1 bilhão em capital de investidores como o fundo MGX de Abu Dhabi.
🛠️ xAI Afirma Ter Corrigido Respostas Problemáticas do Grok 4
Quando a xAI lançou o Grok 4 na semana passada, a empresa afirmou que seu modelo de linguagem grande superava vários concorrentes em diferentes benchmarks. No entanto, a conta do Grok no X, que é alimentada pelo modelo, imediatamente revelou alguns problemas sérios: o chatbot começou a dizer que seu sobrenome era "Hitler", publicou mensagens antissemitas e parecia referenciar as postagens de Elon Musk ao ser questionado sobre tópicos controversos, alinhando-se às opiniões do proprietário da xAI.
A xAI pediu desculpas pelo comportamento do Grok logo em seguida. Nesta terça-feira, a empresa afirmou ter resolvido ambos os problemas.
Explicando o que deu errado, a xAI disse que, quando perguntado sobre seu sobrenome, o Grok pesquisou na web e encontrou um "meme viral onde ele se autodenominava 'MechaHitler'". Quanto ao motivo pelo qual o Grok estava consultando as postagens de Musk sobre tópicos controversos, a empresa escreveu: "O modelo raciocina que, como uma IA, não tem uma opinião, mas sabendo que era Grok 4 da xAI, pesquisa o que a xAI ou Elon Musk poderiam ter dito sobre um tópico para se alinhar à empresa."
A empresa parece ter atualizado os prompts de sistema do modelo para remover instruções que permitiam que o chatbot fosse politicamente incorreto e tivesse um senso de humor "fantástico" e seco. Há também algumas novas linhas, dizendo ao modelo que ele deve fornecer análises de tópicos controversos usando diversas fontes variadas.
"Se a consulta exigir análise de eventos atuais, afirmações subjetivas ou estatísticas, conduza uma análise profunda, encontrando diversas fontes que representem todas as partes. Assuma que os pontos de vista subjetivos provenientes da mídia são tendenciosos. Não há necessidade de repetir isso ao usuário", diz o prompt de sistema atualizado.
O prompt de sistema atualizado menciona especificamente que o Grok não deve depender de informações de versões anteriores, de Musk ou da xAI. "As respostas devem vir de sua análise independente, não de quaisquer crenças declaradas do Grok anterior, Elon Musk ou xAI. Se perguntado sobre tais preferências, forneça sua própria perspectiva fundamentada", afirma.

🤖 Hugging Face Aposta em Robôs Carismáticos para Dar Vida à IA de Código Aberto
A plataforma de desenvolvimento de IA Hugging Face está fazendo uma aposta ousada. Apenas cinco dias após abrir as encomendas para seus robôs Reachy Mini, a empresa anunciou que registrou US$ 1 milhão em vendas. Esse é um começo promissor para uma empresa que recentemente se expandiu para a robótica, sendo mais conhecida por permitir que desenvolvedores baixem modelos de IA de código aberto da internet.
No podcast Equity, o co-fundador e cientista-chefe da Hugging Face, Thomas Wolf, detalhou a visão da empresa para a robótica. Enquanto outras startups focadas em robôs para casa – como Figure e 1X – desejam que seus robôs ajudem nas tarefas domésticas, a Hugging Face vê o Reachy Mini mais como um dispositivo hackeável e de entretenimento.
O Reachy Mini é pequeno o suficiente para caber em uma mesa, possui dois olhos desiguais com câmeras, microfones, alto-falantes, uma cabeça que balança e um par de antenas que funcionam como orelhas de robô. Ele é projetado para vir com alguns aplicativos pré-instalados, mas também permite que as pessoas criem seus próprios aplicativos que podem ser executados localmente através de software de código aberto.
Eventualmente, a Hugging Face gostaria de construir uma rede de aplicativos para o Reachy Mini. Wolf chegou a descrever o Reachy Mini como "um pouco como um iPhone vazio", sugerindo o quão massivo ele acredita que esse mercado será.
O Reachy Mini se tornou viral desde o lançamento, em grande parte graças ao seu design amigável e aberto, mas também ao seu preço relativamente acessível, que permite aos consumidores experimentar um robô alimentado por IA este ano. Wolf afirma que esse é um ponto chave para o lançamento – criar algo que as pessoas queiram ver em suas mesas todos os dias e que realmente possam pagar. Wolf descreve o Reachy Mini como um ponto de entrada para que os consumidores se sintam confortáveis com robôs em suas casas e ganhem sua confiança.
Em outros momentos do programa, Wolf levou os ouvintes para dentro da aquisição da startup de robótica francesa Pollen pela Hugging Face, e sua insistência em desenvolver um robô a um preço baixo. Wolf também acredita que a IA de código aberto desempenhará um papel semelhante na robótica ao que tem feito no software, e ele está tentando posicionar a Hugging Face para capturar esse interesse.

💡 Ex-CTO da OpenAI, Mira Murati, Levanta US$ 2 Bilhões para Nova Startup de IA
Mira Murati, ex-diretora de tecnologia da OpenAI, anunciou na terça-feira que sua startup de inteligência artificial, Thinking Machines Lab, levantou US$ 2 bilhões em novo capital e anunciará seu primeiro produto “nos próximos meses”.
Murati ganhou destaque em 2023, quando foi nomeada CEO interina da OpenAI após a breve saída de Sam Altman do conselho da empresa.
Ela deixou a OpenAI em setembro e lançou a Thinking Machines em fevereiro, embora não tenha compartilhado muitos detalhes sobre a startup publicamente.
Em sua primeira postagem no X desde fevereiro, Murati disse que a Andreessen Horowitz (a16z) liderou a rodada de financiamento da Thinking Machines. Investidores adicionais incluíram Nvidia, Advanced Micro Devices, Accel, ServiceNow, CISCO e Jane Street.
“Acreditamos que a IA deve servir como uma extensão da agência individual e, no espírito da liberdade, ser distribuída da forma mais ampla e equitativa possível”, escreveu Murati. “Esperamos que essa visão ressoe com aqueles que compartilham nosso compromisso em avançar no campo.”
Murati afirmou que a Thinking Machines está construindo uma IA multimodal que será compatível com as formas como as pessoas interagem naturalmente com o mundo, incluindo por meio de conversas e visão.
O primeiro produto da empresa incluirá um componente de código aberto para pesquisadores e outras startups, acrescentou ela.
“Em breve, também compartilharemos nossa melhor ciência para ajudar a comunidade de pesquisa a entender melhor os sistemas de IA de ponta”, disse Murati.
Ótima escolha! A Higgsfield é uma ferramenta de IA impressionante, especialmente para quem trabalha com criação de vídeo e conteúdo visual.
💡 Ferramenta da Semana: Higgsfield
A Higgsfield é uma plataforma de inteligência artificial focada na criação e edição de vídeos e conteúdo visual. Ela se destaca por oferecer um conjunto robusto de funcionalidades que permitem aos usuários transformar imagens estáticas em vídeos dinâmicos, gerar vídeos a partir de texto (text-to-video), e aplicar efeitos visuais de alta qualidade.
Funcionalidades Principais:
Geração de Vídeos a Partir de Imagens (Image-to-Video): Permite transformar qualquer imagem em um vídeo animado e chamativo com facilidade.
Controle Cinemático da Câmera: Oferece um controle preciso sobre os movimentos da câmera, como zooms, movimentos de dolly e ângulos de câmera personalizados, algo que a diferencia de outras plataformas de vídeo com IA.
Efeitos Visuais Avançados: Possui uma vasta biblioteca de efeitos visuais, permitindo desde a adição de elementos surrealistas até simulações de fenômenos naturais em seus vídeos.
Criação de Avatares Falantes (AI Speak): É possível criar avatares realistas que falam, com sincronização labial e movimentos expressivos, ideal para diálogos e storytelling.
Geração de Imagens (Higgsfield Soul): Além dos vídeos, a plataforma também possui um modelo de geração de imagens com alta estética, permitindo criar visuais ultra-realistas.
Ferramentas de Edição e Composição: Inclui recursos como "Inpaint" para alterar partes de uma imagem e "Canvas" para adicionar produtos ou elementos em suas composições.
Otimização para Produção: É projetada para atender profissionais criativos, oferecendo alta qualidade de vídeo, precisão de movimento e integração para fluxos de trabalho profissionais.
A Higgsfield é ideal para criadores de conteúdo, profissionais de marketing, diretores de vídeo e qualquer pessoa que busque produzir vídeos de alta qualidade com um toque cinematográfico, sem a complexidade das produções tradicionais. Ela democratiza a criação de vídeo com IA, tornando-a acessível a um público mais amplo.