A OpenAI anunciou novas funcionalidades na sua API que acrescentam capacidades de voz: um modelo de voz capaz de conversar de forma realista e dotado de raciocínio da classe GPT‑5, um serviço de tradução em tempo real (GPT‑Realtime‑Translate) e uma nova ferramenta de transcrição ao vivo (GPT‑Realtime‑Whisper). A empresa afirma que as traduções suportam 13 línguas de saída, enquanto não detalhou o número exacto de línguas de entrada na comunicação disponível. A OpenAI indica que estes modelos visam ampliar usos em atendimento ao cliente, educação, media e plataformas de criadores, e diz ter integrado mecanismos de proteção para travar spam, fraudes e conteúdos que violem as suas directrizes. A faturação distingue serviços: Translate e Whisper são cobrados por minuto, o GPT‑Realtime‑2 é cobrado por consumo de tokens.

92 ARTIGOS


















