Microsoft AI ha dado un paso importante en la inteligencia artificial al anunciar oficialmente sus primeros modelos desarrollados internamente. Se tratan de MAI-Voice-1 AI y MAI-1-preview, dos propuestas con enfoques distintos pero con un mismo objetivo: reforzar la independencia tecnológica de la compañía y potenciar la experiencia del consumidor.
El modelo MAI-Voice-1 viene centrado en el audio y presume una velocidad impresionante para hacerlo, puede generar 1 minuto de voz en menos de 1 segundo usando una sola GPU. Por su parte, el modelo MAI-1-preview anticipa las nuevas capacidades que se integrarán en Microsoft Copilot, ofreciendo respuestas más acertadas y naturales a las consultas cotidianas de los usuarios.
Microsoft AI presenta sus modelos MAI-Voice-1 AI y MAI-1-preview
- MAI-Voice-1: un modelo de voz ultrarrápido: en la actualidad, Microsoft ya utiliza este modelo en Copilot Daily, una función que recita las principales noticias del día con voz generada por IA, e incluso, permite generar debates al estilo de los podcast. Si eres un usuario interesado, puedes probar el modelo MAI-Voice-1 en Copilot Labs, ajustando el tono, la voz y el estilo del habla según tus preferencias. Con está nueva tecnología, los Redmond se acercan a un nuevo estándar de voz sintética más expresiva y realista, un terreno en el que compite directamente con avances recientes de OpenAI con gpt-realtime.
- MAI-1-preview: una apuesta de Microsoft más allá de OpenAI: este segundo modelo se entrenó con más de 15.000 GPU Nvidia H100, y apunta a convertirse en una alternativa real a los grandes modelos de OpenAI. Este nuevo modelo ya se está probando públicamente en la plataforma LMArena y Microsoft lo implementará de forma progresiva en casos de uso de texto en Copilot. El enfoque de este modelo está puesto en responder instrucciones complejas de forma más precisa y útil, optimizando el asistente hacia las necesidades de los consumidores.
Estos dos avances encajan en la estrategia descritas por Mustafa Suleyman, director de IA de Microsoft, quien ha reiterado que la compañía busca crear modelos optimizados para los consumidores, más allá del uso empresarial.
Con estos movimientos realizados por Microsoft, la compañía pretende reducir su dependencia de OpenAI y construir un ecosistema de modelos internos especializados, los cuales, tienen que cubrir desde la voz hasta el texto y así los diferentes escenarios de interacción.
La llegada del modelo MAI-1-preview nos recuerda a la herramienta Claude para Chrome, mientras que MAI-Voice-1 apunta a transformar la forma en la que los usuarios interactúan con Copilot en su día a día.
Si quieres entender cómo Microsoft ha ido integrando IA en todo su ecosistema, también puedes revisar las novedades de Copilot en Microsoft 365, donde la compañía ya mostró parte de sus planes a corto plazo.
Comentarios!