Microsoft está apostando fuerte por que Copilot tenga éxito como asistente activado por voz donde Cortana fracasó estrepitosamente.
Como prácticamente todos los anuncios importantes de Windows en los últimos tres años, las características que Microsoft anunció hoy para el sistema operativo giran en torno a la inteligencia artificial generativa. En particular, se centran en la obsesión más reciente de la compañía con la IA «agéntica», una palabra de moda de la industria que significa «decirle al software impulsado por IA que realice una tarea, que luego ejecuta en segundo plano mientras tú pasas a otras cosas».
Pero la impresión general que obtuve, tanto al leer el anuncio como al asistir a una conferencia de prensa a principios de este mes, es que Microsoft está usando modelos de lenguaje y otras tecnologías de IA generativa para intentar nuevamente con Cortana, la entrada fallida y descontinuada de Microsoft en las guerras de asistentes de voz de la década de 2010.
El regreso del «Hey» activado por voz
Según Yusuf Mehdi, director de marketing para consumidores de Microsoft, las «PC con IA» deberían poder reconocer la entrada «naturalmente, en texto o voz», ser capaces de guiar a los usuarios basándose en lo que está en sus pantallas en cualquier momento dado, y los asistentes de IA «deberían poder tomar acciones en tu nombre».
El mayor de los anuncios de hoy es la introducción de una nueva frase de activación «Hey, Copilot» para las PC con Windows 11, que una vez habilitada permite a los usuarios invocar el chatbot usando solo su voz en lugar de un ratón o teclado. Si prefieres usar el teclado, ya sea la tecla Copilot o el mismo atajo de teclado Windows + C que solía activar Cortana también invocará a Copilot. Decir «adiós» despedirá a Copilot cuando hayas terminado de trabajar con él.
Las Mac y la mayoría de los smartphones han tenido funcionalidad similar durante un tiempo, pero Microsoft obviamente espera que tener a Copilot respondiendo esas preguntas en lugar de Cortana conduzca al éxito en lugar de otro fracaso.
La limitación clave de los asistentes tradicionales
La limitación clave de la Cortana original, además de Siri, Alexa y el resto de sus similares, es que realmente solo podía hacer una lista relativamente limitada y predeterminada de acciones. Las consultas complejas, o cualquier cosa que los asistentes no entiendan, a menudo se redirigen a una búsqueda web general.
Para hacer a Copilot más útil, Microsoft también anunció que Copilot Vision se está desplegando mundialmente «en todos los mercados donde se ofrece Copilot». Copilot Vision leerá el contenido de una pantalla o una ventana de aplicación y puede intentar ofrecer orientación o retroalimentación útil, como guiarte a través de una tarea oscura en Excel o hacer sugerencias basadas en un grupo de fotos o una lista de elementos.
Características de IA se adentran en el corazón de Windows
Ya sea que hables de la aplicación Copilot, las características de IA generativa añadidas a aplicaciones como Notepad y Paint, o la función de raspado de datos Windows Recall, la mayoría de las adiciones de IA a Windows en los últimos años han sido específicas de aplicaciones, o acordonadas de alguna manera de las características centrales de Windows como la barra de tareas y el Explorador de archivos.
Pero las características de IA están cada vez más abriéndose camino hacia características fundamentales de Windows como la barra de tareas y el menú Inicio, y se les están dando capacidades que les permiten analizar o editar archivos o incluso realizar tareas de gestión de archivos.
Transformación del campo de búsqueda
El campo de búsqueda estándar que ha sido parte de Windows 10 y Windows 11 durante la última década, por ejemplo, está siendo transformado en un campo «Ask Copilot». Esta característica aún podrá buscar a través de archivos locales como la versión actual del cuadro de búsqueda, pero Microsoft también lo visualiza como una interfaz impulsada por teclado para Copilot para los momentos en que no puedes o no quieres usar tu voz.
Copilot Actions: el agente de propósito general
Una característica llamada Copilot Actions también expandirá el número de formas en que Copilot puede interactuar con archivos locales en tu PC. Microsoft cita «ordenar a través de fotos recientes de vacaciones» y extraer información de PDFs y otros documentos como dos casos de uso posibles, y que esta versión de vista previa temprana se enfocará en «un conjunto estrecho de casos de uso».
Pero está destinado a ser «un agente de propósito general» capaz de «interactuar con aplicaciones de escritorio y web». Esto le da mucha libertad para aumentar o reemplazar la entrada básica de teclado y ratón para algunas interacciones.
Configuración del sistema simplificada
Finalmente, Microsoft está tomando otro intento de permitir que Copilot cambie la configuración en tu PC, algo que versiones anteriores podían hacer pero que fueron removidas en una iteración posterior. Copilot intentará responder a preguntas en lenguaje simple sobre la configuración de tu PC con un enlace a la parte apropiada de la gran y laberíntica aplicación de Configuración de Windows.
Nuevas características complementarias
Estas nuevas características se complementan con otras que Microsoft ha estado probando durante algunas semanas o meses. Copilot Connectors puede dar a Copilot acceso a servicios de correo electrónico y compartir archivos como Gmail y Dropbox. Las nuevas características de creación de documentos permiten a Copilot exportar el contenido de un chat de Copilot a un documento de Word o PDF, hoja de cálculo de Excel, o presentación de PowerPoint.
Las acciones de IA en el Explorador de archivos aparecen en el menú de clic derecho de Windows y permiten la manipulación directa de archivos, incluyendo edición por lotes de imágenes y resúmenes de documentos.
Lecciones aprendidas de Recall
Microsoft al menos parece haber aprendido lecciones del despliegue fallido de Windows Recall el año pasado. El plan inicial de Microsoft había sido desplegar Recall con la primera oleada de PC Copilot+, pero sin enviarlo primero a través del programa Windows Insider Preview.
Los investigadores de seguridad que lograron obtener la versión temprana de Recall descubrieron una característica profundamente defectuosa que preservaba demasiada información personal y era trivialmente fácil de explotar: un archivo de texto plano con texto OCR de todo el uso de PC de un usuario podía ser tomado por prácticamente cualquiera con acceso a la PC.
Al final, Microsoft retiró esa versión de Recall, tomó casi un año para revisar su arquitectura de seguridad, y pasó meses dejando que la característica se abriera camino a través de los canales de Windows Insider Preview antes de finalmente desplegarla a las PC Copilot+.