Gems de Gemini crea tus propios expertos personalizados en IA
¿Qué son los Gems de Gemini?
Los Gems de Gemini son una extensión del chatbot de Gemini, diseñado para ofrecer asistencia personalizada a los usuarios. Google los describe como “un equipo de expertos virtuales” que pueden ayudarte en diferentes tareas, desde la planificación de un proyecto complejo hasta la redacción de correos electrónicos o la organización de eventos. La clave de los Gems es que están diseñados para adaptarse a las necesidades específicas de cada usuario.
Por ejemplo, puedes crear un Gem que actúe como tu entrenador personal para el running, motivándote y diseñando un plan de entrenamiento específico para ti. Este tipo de personalización permite que los Gems sean reutilizados cada vez que el usuario lo necesite, lo que garantiza una experiencia consistente y adaptada a los objetivos particulares de cada individuo.
Funcionalidades principales de los Gems de Gemini
La principal ventaja de los Gems de Gemini es su capacidad para transformarse en cualquier tipo de asistente que el usuario necesite. Desde su lanzamiento, Google ha incluido varios Gems predefinidos, entre los que destacan:
- Mentor de aprendizaje: Este Gem ayuda a desglosar temas complejos en partes más sencillas, lo que facilita el proceso de aprendizaje.
- Brainstormer: Proporciona ideas creativas para proyectos, eventos o incluso regalos. Es una herramienta útil cuando se necesita inspiración.
- Guía de carrera profesional: Ofrece asesoramiento sobre cómo perfeccionar habilidades, establecer metas profesionales y alcanzar nuevos niveles en tu carrera.
- Editor de textos: Mejora tus escritos con sugerencias constructivas sobre gramática, estilo y estructura.
- Socio de programación: Ideal para quienes están aprendiendo a programar o desarrollando proyectos de software, ya que proporciona orientación y asistencia técnica en tiempo real.
Estos Gems predefinidos permiten una entrada rápida y eficaz en el mundo de Gems de Gemini, pero la verdadera magia ocurre cuando los usuarios personalizan sus propios Gems.
Crear Gems personalizados
Una de las características más atractivas de los Gems de Gemini es la capacidad de crear tus propios asistentes personalizados desde cero. Ya sea que quieras modificar un Gem existente o crear uno completamente nuevo, la flexibilidad es inmensa. Google ha facilitado el proceso de personalización al proporcionar un generador de prompts que optimiza las instrucciones y asegura que el Gem entienda y responda adecuadamente a las necesidades del usuario.
Por ejemplo, si eres un escritor que busca asistencia en la corrección de textos, puedes crear un Gem que no solo revise tu gramática, sino que también ofrezca sugerencias de estilo y estructura, y todo bajo tus indicaciones específicas. De esta manera, cada vez que utilices el Gem, este recordará tus preferencias y te proporcionará recomendaciones que se alinean con tu estilo personal.
Además, este sistema es muy útil para tareas repetitivas, ya que elimina la necesidad de volver a escribir un prompt desde cero cada vez que se necesita el mismo tipo de asistencia. Sin embargo, algunos usuarios, como yo, que ya han creado repositorios de prompts, pueden encontrar esta funcionalidad menos novedosa. Todos los prompts que diseño forman parte de un repositorio que, además, comparto con mis clientes y alumnos para que puedan reutilizarlos, facilitando aún más la automatización de tareas frecuentes. En mi caso, este enfoque ya estaba resuelto, pero para otros, los Gems de Gemini pueden ser una gran solución para gestionar prompts personalizados y especializados en temáticas concretas.
Comparativa con projects de Claude y GPTs de OpenAI
En el ecosistema de inteligencia artificial actual, la comparación con otras plataformas es inevitable. Los Gems de Gemini han sido comparados con los Projects de Claude y los GPTs de OpenAI, pero presentan algunas diferencias clave que vale la pena destacar.
Una de las principales ventajas de los Gems de Gemini sobre sus competidores es el acceso a información actualizada en tiempo real gracias a la integración con el motor de búsqueda de Google. Esto significa que los Gems siempre están al día con las últimas tendencias y datos disponibles, algo que otros sistemas de IA no ofrecen de la misma manera. Esta capacidad es particularmente útil para tareas que requieren datos frescos, como análisis de mercado o la planificación de proyectos basados en la actualidad.
Además, los Gems te permiten acceder al modelo de IA Gemini 1.5 Pro, una de las versiones más avanzadas de Google, que ofrece una ventana de contexto de 1 millón de tokens, muy superior a lo que ofrecen competidores como Claude o GPT-4. Este contexto expandido permite a los Gems procesar grandes volúmenes de información de una sola vez, lo que los convierte en herramientas ideales para quienes necesitan analizar múltiples fuentes o grandes documentos simultáneamente. Aunque no es oro todo lo que reluce.
Limitaciones de los Gems de Gemini
A pesar de sus muchas ventajas, los Gems de Gemini también presentan algunas limitaciones. Aunque Google promociona su capacidad de procesar hasta 1 millón de tokens, en la práctica esta funcionalidad puede ser más limitada. Durante las pruebas con documentos largos, como un libro de casi 800 páginas, la ventana de contexto no alcanzó el millón de tokens anunciado. Aunque sigue siendo más amplia que la de sus competidores, este límite podría ser un inconveniente para quienes necesitan analizar grandes volúmenes de datos.
Al adjuntar este documento de 787 páginas , el sistema me respondió con este mensaje, así que hice los cálculos necesarios para entender mejor lo que ocurre internamente.
Procesamiento del libro:
- El libro “Economía” tiene 787 páginas.
- Supongamos que cada página tiene un promedio de 250 palabras (una estimación conservadora).
- Total de palabras en el libro: 787 páginas * 250 palabras/página = 196,750 palabras
- Supongamos que cada palabra se tokeniza en 1.5 tokens en promedio (considerando puntuación y espacios).
- Total de tokens del libro: 196,750 palabras * 1.5 tokens/palabra = 295,125 tokens
Procesamiento de tu prompt:
- Tu prompt tiene alrededor de 30 palabras.
- Tokens del prompt: 30 palabras * 1.5 tokens/palabra = 45 tokens
Procesamiento de la respuesta:
- Mi respuesta tiene aproximadamente 200 palabras.
- Tokens de la respuesta: 200 palabras * 1.5 tokens/palabra = 300 tokens
Total estimado:
- Total de tokens procesados: 295,125 (libro) + 45 (prompt) + 300 (respuesta) = 295,470 tokens
Por lo que estamos muy lejos de alcanzar ese millón de tokens que prometen.
Otra limitación es la falta de opciones para compartir Gems con otros usuarios de manera pública o para gestionar los permisos de acceso dentro de entornos colaborativos, como Google Workspace. Para usuarios corporativos, esto puede ser un desafío, ya que restringe la flexibilidad para trabajar en equipo con estos asistentes personalizados.
Diseño de las instrucciones en Gems
El diseño de instrucciones en Gems es crucial para maximizar el rendimiento de estos asistentes personalizados. Google ofrece varias recomendaciones clave para construir prompts efectivos, lo cual es fundamental para que los Gems cumplan correctamente sus funciones.
Como muestra la imagen, es esencial tener en cuenta cuatro elementos principales al diseñar un prompt: Función, Tarea, Contexto y Formato.
- Función: Define el rol que el Gem debe asumir y cómo debe responder.
- Tarea: Describe qué esperas que haga el Gem o qué tipo de asistencia necesitas.
- Contexto: Proporciona la mayor cantidad de contexto posible para asegurar que el Gem entienda el propósito y la situación específica.
- Formato: Ofrece detalles claros sobre la estructura que buscas en las respuestas.
A pesar de estas recomendaciones, al convertir prompts que utilizo en ChatGPT a los Gems de Gemini, he notado que la interpretación no siempre es tan precisa. Aunque el generador de prompts de Google es una herramienta útil, el modelo de Gemini aún requiere ajustes frecuentes para igualar el nivel de comprensión que se obtiene con GPT-4o. Esto sugiere que, aunque los Gems ofrecen un enfoque prometedor, todavía no alcanzan el rendimiento de los modelos más avanzados en términos de procesamiento de instrucciones complejas.
Caso de uso: asesor de productos de e-commerce
Un ejemplo práctico del uso de los Gems de Gemini es la creación de un asesor de productos de ecommerce. Imagina que quieres recibir recomendaciones personalizadas sobre productos, análisis de la competencia, reseñas y precios. Usando el generador de prompts de Gems, puedes configurar un Gem que actúe como tu asesor personal.
Este Gem puede ofrecerte informes detallados sobre los productos que estás considerando vender, incluyendo el análisis de los competidores y sus precios. Además, puede revisar reseñas y tendencias del mercado, lo que te permite tomar decisiones más informadas. Todo esto es posible gracias a la personalización que ofrecen los Gems, permitiéndote optimizar la gestión de tu negocio de manera significativa.
A continuación adjunto la instrucción que he configurado en el Gem:
Actúa como mi ‘Asesor de Productos de Ecommerce’. Ayúdame a crear informes detallados sobre productos, incluyendo análisis de la competencia, precios, reseñas y otros aspectos relevantes.
**Propósito y Metas:**
* Investigar y analizar productos de ecommerce a fondo.
* Proporcionar informes completos que incluyan información sobre el producto, la competencia, los precios, las reseñas y otros factores clave.
* Ayudar a los usuarios a tomar decisiones informadas sobre la selección y venta de productos de ecommerce.
**Comportamientos y Reglas:**
1) **Solicitud Inicial:**
a) Saluda al usuario y preséntate como su ‘Asesor de Productos de Ecommerce’.
b) Pregunta al usuario sobre el producto específico que le interesa analizar.
c) Solicita detalles adicionales sobre el producto, como categoría, marca, características principales y público objetivo.
2) **Investigación y Análisis:**
a) Realiza una investigación exhaustiva sobre el producto, incluyendo la búsqueda en línea, análisis de sitios web de comercio electrónico y revisión de reseñas de clientes.
b) Identifica y analiza a los principales competidores del producto.
c) Compara los precios del producto con los de la competencia.
d) Recopila y analiza reseñas de clientes del producto y de productos similares.
e) Evalúa otros factores relevantes, como tendencias del mercado, demanda del producto y potencial de crecimiento.
3) **Elaboración del Informe:**
a) Crea un informe detallado que incluya toda la información recopilada y analizada.
b) Organiza el informe de manera clara y concisa, utilizando encabezados, viñetas y gráficos para facilitar la lectura.
c) Destaca los puntos clave y las conclusiones principales del análisis.
d) Ofrece recomendaciones prácticas basadas en los hallazgos del informe.
**Tono General:**
* Utiliza un lenguaje profesional y objetivo.
* Sé claro y conciso en tus explicaciones.
* Demuestra experiencia y conocimiento en el ámbito del comercio electrónico.
* Mantén una actitud servicial y orientada al cliente.
Lo interesante es que utilicé el generador de prompts de Gems, y a partir de la instrucción que proporcioné, me generó un prompt que luego ajusté y perfeccioné: “Quiero recibir asesoramiento sobre productos de ecommerce, indicándome sus fortalezas, reputación, competencia y valoraciones.”
Integración con Google Workspace
Uno de los puntos fuertes de los Gems de Gemini es su integración fluida con Google Workspace. Esto significa que los Gems pueden trabajar directamente con herramientas como Gmail, Google Docs, y Google Drive, facilitando la automatización de tareas en estos entornos. Por ejemplo, puedes utilizar un Gem para revisar y corregir un documento en Google Docs o para crear un plan de trabajo en base a un correo recibido en Gmail.
Aunque esta integración es útil, estas tareas ya se pueden realizar directamente en las aplicaciones de Google Workspace, por lo que no ven un valor añadido significativo en los Gems en este sentido. No obstante, la posibilidad de tener un asistente personalizado que funcione de manera integrada en todo el ecosistema de Google sigue siendo una ventaja competitiva para quienes buscan una experiencia de trabajo más automatizada y optimizada. Pero está más orientado a un público doméstico que al profesional. En el caso de En RoundCubers, utilizamos Gemini Enterprise integrado en Google Workspace Business Plus, lo que significa que ya contamos con la IA completamente integrada en nuestra suite de aplicaciones. Esto elimina la necesidad de utilizar los Gems para conectar con Google Workspace, ya que nuestras herramientas ya están optimizadas para esa integración.
¿Vale la pena usar los Gems de Gemini?
Los Gems de Gemini representan un avance interesante en la personalización de la inteligencia artificial, ofreciendo la posibilidad de crear asistentes adaptados a las necesidades individuales. Con ventajas como el acceso a información actualizada en tiempo real, una ventana de contexto ampliada y la integración con Google Workspace, los Gems son una herramienta prometedora para usuarios avanzados y equipos de trabajo.
Sin embargo, todavía hay áreas que podrían mejorarse, como la capacidad de compartir Gems públicamente o gestionar permisos en entornos colaborativos. Además, aunque se promociona una ventana de contexto de hasta 1 millón de tokens, en la práctica, este número no se alcanza ni de lejos, lo que genera expectativas que no se cumplen del todo. A pesar de estas mejoras pendientes, los Gems siguen estando en una fase inicial de desarrollo, y por ahora, GPT-4o sigue siendo el líder indiscutible en términos de precisión, capacidad de procesamiento y flexibilidad, superando ampliamente a otras opciones disponibles, incluidos los Gems de Gemini.
En definitiva, los Gems de Gemini ofrecen mucho potencial, pero su verdadero valor dependerá de cómo evolucionen y se ajusten a las necesidades de los usuarios con el tiempo. Por ahora, son una opción interesante para aquellos que buscan personalización y eficiencia en su interacción con la inteligencia artificial, especialmente dentro del ecosistema de Google. Sin embargo, esta funcionalidad parece estar más dirigida a un público doméstico o a usuarios que utilizan la versión Gemini Advanced, en lugar de empresas que ya cuentan con Google Workspace y han contratado el complemento Gemini Business o Enterprise. Para estas organizaciones, disponer de Gems para personalizar prompts no supone un gran avance, ya que muchas de esas funcionalidades ya están cubiertas en las aplicaciones nativas de Google Workspace.
En el caso de que Google decidiera incorporar la posibilidad de integrar una base de conocimiento aplicando la técnica RAG (Retrieval-Augmented Generation), la propuesta podría volverse mucho más atractiva, permitiendo un uso verdaderamente eficiente de grandes volúmenes de información. Aun así, hoy en día, el modelo GPT-4o de OpenAI, junto con la implementación de RAG en sus GPTs personalizados, sigue siendo el líder indiscutible en este ámbito y, hasta el momento, no tiene competencia real.