Microsoft lanza MAI-1 y MAI-Voice-1: sus nuevos modelos de IA para competir con OpenAI y Google

0
365

Microsoft ha anunciado el lanzamiento de dos nuevos modelos de inteligencia artificial diseñados para competir directamente con OpenAI, Google y otros líderes del sector. Tras meses de rumores, el gigante tecnológico presentó los primeros desarrollos de su división de IA, liderada por Mustafá Sulaymán, cofundador de DeepMind. Estos modelos abarcan diferentes segmentos, y uno de ellos fue desarrollado utilizando procesos similares a los empleados por DeepSeek y otros modelos chinos.

Según una publicación oficial en su sitio web de IA, Microsoft introdujo MAI-Voice-1 y MAI-1-preview. El primero es un modelo de generación de voz «altamente expresivo y natural», capaz de producir un minuto de audio en menos de un segundo. Optimizado para funcionar con una sola GPU, este sistema ya se ha integrado en los resúmenes de noticias de Copilot Daily y Podcasts debido a su alta eficiencia.

MAI-Voice-1 ofrece audio de alta fidelidad con entonación natural, ideal para narrar historias, crear meditaciones guiadas o desarrollar asistentes virtuales con conversación en tiempo real. Para demostrar sus capacidades, Microsoft lanzó «Expresiones de audio de Copilot» en Copilot Labs, una herramienta que genera audio a partir de guiones y permite a los usuarios personalizar estilos de narración, incluyendo modos emotivos y narrativos.

Mientras MAI-Voice-1 se centra en la velocidad de inferencia, MAI-1-preview fue diseñado para rivalizar con modelos de IA más robustos. Es el primer modelo basado en texto de Microsoft que impulsará las futuras versiones de Copilot. Entrenado con aproximadamente 15.000 GPU NVIDIA H-100 utilizando la arquitectura Mixture-of-Experts (MoE), este sistema emplea un enfoque de aprendizaje automático que divide el modelo en componentes especializados, activando solo las partes necesarias para cada tarea y optimizando así el uso de recursos.

En una entrevista con Semafor, Mustafá Sulaymán destacó que aprovecharon técnicas de código abierto para mejorar los modelos con recursos mínimos. «MAI-1-preview está diseñado para proporcionar capacidades poderosas a los consumidores que buscan beneficiarse de modelos especializados en seguir instrucciones y ofrecer respuestas útiles para consultas cotidianas», afirmó.

Te podría interesar:

Aunque MAI-1-preview no reemplazará a GPT-5 en Copilot, Microsoft planea integrarlo en las próximas semanas para tareas específicas, evaluando su rendimiento y utilizando feedback de usuarios para futuras mejoras. El modelo también estará disponible en LMArena y mediante una API para desarrolladores.

Pese a que uno de los modelos está diseñado para ser expresivo, Sulaymán aclaró que eliminarán cualquier cualidad que sugiera que la IA tiene sentimientos o objetivos propios. Recientemente, publicó un artículo advirtiendo sobre los riesgos de crear sistemas que simulen ser humanos: «Hace unos años, hablar de IA consciente parecía una locura. Hoy se percibe como algo cada vez más urgente. Debemos construir una IA para las personas; no hacerla una persona digital».

**REDACCIÓN FV MEDIOS**