La IA se ha convertido en una parte importante de la estrategia de Microsoft durante el último año. Claro, eso podría decirse de muchas empresas, ya que la IA parece ser la palabra de moda en este momento. Pero Microsoft recientemente tomó la audaz decisión de llevarla aWindows 11en forma deWindows Copilot, un nuevo asistente de IA que es (extraoficialmente) un sucesor de Cortana. Está impulsado por el modelo de lenguaje grande GPT-4 utilizado en Bing Chat para crear una herramienta que espera ser más útil que nunca.

Si bien el potencial es emocionante, la implementación actual de Copilot en las compilaciones de Windows Insider es muy básica y no se diferencia demasiado de usarBing Chaten la web. Tengo algunas ideas sobre lo que Microsoft puede hacer para que Copilot sea una parte verdaderamente esencial de Windows 11.

1Admitetodaslas configuraciones del sistema y las funciones principales.

Captura de pantalla de la aplicación Configuración de Windows 11 que muestra la configuración de energía y batería. Windows Copilot está en el lado derecho y no puede cambiar estas configuraciones.

El gran atractivo de Windows Copilot en el lanzamiento fue que podía interactuar con tu PC de maneras que Bing Chat, como simple navegador, no podía. Y este es un gran punto de partida. A muchos usuarios avanzados ya les gusta usar interfaces basadas en texto y comandos de teclado para realizar ciertas tareas, por lo que poder cambiar muchas de estas configuraciones desde un solo lugar tiene mucho potencial.

Sin embargo, la implementación actual solo admite algunas funciones, como poder cambiar al modo claro u oscuro, activar el modo No molestar o tomar una captura de pantalla. Esto realmente necesita expandirse atodaslas configuraciones de Windows que se pueden encontrar en la aplicación Configuración (el Panel de control probablemente debería dejarse atrás en este punto), o al menos a muchas más de las que tenemos ahora. Podría cambiar el color de énfasis, deshabilitar una de las pantallas en una configuración de múltiples monitores, cambiar los dispositivos de reproducción, etc. Incluso podría iniciar una sesión de concentración.

Si Windows Copilot pudiera ayudar con todo esto, podría hacer que la interacción con ciertas configuraciones fuera mucho más rápida, especialmente para las personas que lo hacen con frecuencia. Hay muchas cosas que se pueden hacer y Microsoft ha prometido algunas de ellas, pero aún no las ha cumplido.

2Ganchos de aplicaciones fáciles

Captura de pantalla de una página de inicio de Spotify y Copilot en el lado derecho que no puede interactuar con la aplicación

Otra cosa que creo que determinará la utilidad de Copilot es su integración con otras aplicaciones. Con el objetivo de convertirse en un asistente de inteligencia artificial centralizado, Copilot debe poder integrarse fácilmente con todo tipo de aplicaciones de terceros. Vimos esto en acción cuando Microsoft hizo una demostración de Copilot enla Build de este añoy lo usamos para reproducir música con Spotify. Pero aún no hemos visto que se vuelva funcional y debe ir más allá de los socios habituales de Microsoft.

Copilot debería poder abrir aplicaciones e iniciar una tarea específica dentro de ellas, o reproducir un programa específico en Netflix, o cualquier otra cosa que pueda ser útil en estas aplicaciones.

3Integración con el explorador de archivos

Captura de pantalla de una ventana del Explorador de archivos junto a Windows Copilot

Sé que la gente probablemente esté harta de que Microsoft meta a la fuerza servicios no deseados donde pueda, pero creo que tener la integración de Copilot en el Explorador de archivos podría hacerlo útil para más que solo usuarios que desean escribir instrucciones en Copilot, especialmente porque eso requiere que la ventana de Copilot ocupe espacio en su pantalla casi permanentemente.

Podría ser interesante tener una función en el Explorador de archivos que te permita hacer clic derecho en un archivo y elegir una opción llamada "Enviar a Copilot", que luego te preguntaría qué quieres hacer con dicho archivo. Por ejemplo, con una imagen, podrías pedirle a Copilot que elimine el fondo, o podrías pedirle que transcriba un archivo de audio. Estas son dos funciones que hemos visto en demostración, pero eso normalmente requeriría que arrastres y sueltes el archivo en el panel de Copilot. Creo que poder acceder a él directamente desde el Explorador de archivos sería bienvenido (pero la opción de desactivarlo también sería agradable).

4Control de voz

Captura de pantalla del panel de escritura por voz en Windows 11 con un mensaje que dice "Escuchando"

Sospecho que soy el único que piensa así, por eso lo he dejado un poco más abajo. Obviamente, los comandos de voz son más populares en los teléfonos y, en este momento, Bing Chat solo admite esta función si estás en tu teléfono. Pero creo que sería bueno que los comandos de voz también sean compatibles conportátilesy PC. Poder cambiar todas estas configuraciones, comenzar a reproducir música o abrir una aplicación con la voz podría ser útil. Y lo mismo ocurre con las preguntas a Bing. Cortana lo admitió cuando se presentó Windows 11 y Microsoft quería que fuera algo importante, así que no estoy seguro de si realmente ganaría mucho terreno, pero definitivamente puedo ver usos para ello.

Con un navegador, hay que hacer un pequeño esfuerzo para iniciar la interacción por voz, pero con una función integrada, se puede tener una palabra clave de activación o un acceso directo, de modo que se puedan decir rápidamente los comandos. Me imagino que no sería tan difícil de implementar, ya que el reconocimiento de voz ya se utiliza en varias partes de Windows.

5Lectura de pantalla y OCR

Captura de pantalla de un artículo de noticias en XDA mostrado en Microsoft Edge en Windows 11, con Copilot resumiendo el contenido del artículo en el lateral.

Una última cosa que me encantaría que Copilot pudiera hacer es leer la información en la pantalla y, especialmente, el reconocimiento óptico de caracteres (OCR). En este momento, puedes pedirle a Copilot que resuma una página, pero tiene que estar en un sitio web abierto en Edge, lo que limita severamente la funcionalidad. Si bien el enfoque ideal sería que esto funcione con otros navegadores de forma nativa, sería interesante si Copilot pudiera actuar básicamente como un lector de pantalla (como Narrador) y usar eso para extraer información de cualquier página en cualquier navegador o aplicación para resumirla.

Otra característica interesante sería el OCR, o la capacidad de reconocer texto en imágenes, por lo que podría pedirle a Copilot que tomara texto de una imagen o un escaneo de PDF y simplemente lo copiara o lo resumiera. En realidad, esto no es tan descabellado, ya que se ha informado de que se planea algún tipo de capacidad de OCR paraWindows 12, por lo que estoy seguro de que podríamos ver algo similar.

Hay más potencial sin explotar

Exploré mis preferencias y deseos personales aquí, pero con algo tan capaz como Copilot y los grandes modelos de lenguaje que lo impulsan, estoy seguro de que hay muchas más ideas que podrían resultar útiles a la gente. De todos modos, el futuro de Copilot y Windows es bastante emocionante, suponiendo que Microsoft pueda cumplir la promesa de este producto. Si eso sucederá o no es otra cuestión.