A Microsoft anunciou o lançamento de três novos modelos pela sua divisão Microsoft AI (MAI): MAI-Transcribe-1, MAI-Voice-1 e MAI-Image-2. Os modelos, que geram texto, voz e imagens/vídeo, estão disponíveis na Microsoft Foundry; os de transcrição e voz podem também ser testados no MAI Playground. Segundo a empresa, o MAI-Transcribe-1 transcreve discurso em 25 idiomas e é 2,5 vezes mais rápido do que a oferta Azure Fast da Microsoft; o MAI-Voice-1 permite gerar 60 segundos de áudio em cerca de um segundo e criar vozes personalizadas; o MAI-Image-2 centra-se na geração de vídeo. A Microsoft destaca preços competitivos face à Google e à OpenAI e promete integrar os modelos em produtos e experiências da marca. Mustafa Suleyman, CEO da Microsoft AI, reafirmou uma abordagem “humanista” na criação dos modelos e disse que a empresa continua a colaborar com a OpenAI, apesar de uma renegociação recente que lhe deu mais margem para desenvolver investigação própria.