Resumen de las últimas noticias en IA: Amazon, Google y Meta hacen grandes avances.
Este documento resume los temas e ideas clave de cuatro artículos recientes sobre los últimos desarrollos en el campo de la inteligencia artificial:
1. "Primeras impresiones de los nuevos LLMs Amazon Nova (a través de un nuevo plugin llm-bedrock)" por Simon Willison:
Amazon lanza Nova, una nueva familia de LLMs: Disponible en tres tamaños: Micro, Lite y Pro, Nova compite con la familia Google Gemini, ofreciendo precios extremadamente competitivos y capacidad para manejar imágenes, video y PDFs en los modelos más grandes.
"Como se puede ver, Nova Micro es 0,25 centavos más barato en entrada y 1 centavo más barato en salida que el anterior campeón, Gemini 1.5 Flash-8B."
Destacando la accesibilidad y multi-modalidad: Willison elogia la capacidad multi-modal de Nova y la facilidad de uso a través de su plugin llm-bedrock, aunque critica la complejidad del acceso a la API de AWS.
"Estas parecen ser buenos modelos multi-modales: su manejo de imágenes se siente sólido y es genial tener un nuevo modelo de entrada de video (aunque sea bastante limitado en comparación con Gemini)"
GAMOA, la nueva era de proveedores de modelos: El autor concluye que Amazon ha alcanzado el nivel superior de proveedores de modelos, junto con Google, Meta, OpenAI y Anthropic, sugiriendo un nuevo acrónimo: GAMOA.
"Con este lanzamiento, creo que Amazon puede haberse ganado un lugar entre los proveedores de modelos de primer nivel. Tal vez necesitemos un nuevo acrónimo FAANG que cubra OpenAI, Anthropic, Google, Meta y Amazon. Me gusta GAMOA."
2. "Google presenta Gemini 2.0: Un nuevo modelo de IA para la era de los agentes" por Sundar Pichai, Demis Hassabis y Koray Kavukcuoglu:
Gemini 2.0, un modelo diseñado para agentes: Google DeepMind presenta Gemini 2.0, un modelo más capaz que sus predecesores, con salida nativa de imagen y audio, uso de herramientas y mayor capacidad de agencia.
"Si Gemini 1.0 se trataba de organizar y comprender la información, Gemini 2.0 se trata de hacerla mucho más útil." - Sundar Pichai
Gemini 2.0 Flash ya disponible para pruebas: La versión experimental del modelo, Gemini 2.0 Flash, está disponible para desarrolladores y probadores de confianza, con disponibilidad general prevista para principios del próximo año.
"Gemini 2.0 Flash está disponible ahora como un modelo experimental para desarrolladores a través de la API de Gemini en Google AI Studio y Vertex AI..."
Explorando experiencias de agentes: Se presentan prototipos como Project Astra, Project Mariner y Jules, que demuestran las capacidades de Gemini 2.0 para actuar como agentes y realizar tareas complejas.
"Estamos explorando esta nueva frontera con una serie de prototipos que pueden ayudar a las personas a realizar tareas y hacer las cosas."
Construyendo con responsabilidad: Google enfatiza su compromiso con la seguridad y la responsabilidad en el desarrollo de IA.
"Creemos firmemente que la única forma de construir IA es ser responsable desde el principio y continuaremos priorizando la seguridad y la responsabilidad como un elemento clave de nuestro proceso de desarrollo de modelos..."
3. "MasterClass On Call te da acceso a facsímiles de IA de sus expertos bajo demanda" por Igor Bonifacic:
MasterClass se adentra en la tutoría bajo demanda con IA: MasterClass lanza On Call, una nueva aplicación que permite a los usuarios interactuar con versiones de IA de sus instructores famosos.
"MasterClass se está expandiendo más allá de las lecciones de video pregrabadas para ofrecer tutoría bajo demanda de algunos de sus instructores famosos más populares."
IA entrenada con datos propios: Las IA se basan en datos exclusivos de los instructores, incluyendo notas, investigaciones y experiencias nunca antes compartidas.
"Hemos construido esto con nuestros expertos, entrenando la IA con conjuntos de datos propietarios (por ejemplo, notas no publicadas, investigación privada, sus lecciones, correos electrónicos y experiencia que nunca antes habían compartido)." - David Rogier, CEO de MasterClass.
Servicio independiente con suscripción separada: On Call tiene un costo adicional al servicio regular de MasterClass.
"On Call es también un producto independiente con una suscripción separada de la oferta regular de la empresa. Para usar On Call, los usuarios deberán pagar $10 por mes o $84 por año."
4. "Guía del usuario de Patchwork" por Midjourney:
Patchwork, un lienzo infinito para la creación de mundos: Midjourney presenta Patchwork, una herramienta de IA para la creación colaborativa de mundos ficticios en un lienzo infinito.
"Patchwork es un lienzo infinito colaborativo, con soporte de IA para crear mundos ficticios."
Generación y edición de elementos del mundo: Los usuarios pueden generar personajes, facciones, lugares y más, editar texto, vincular elementos, generar imágenes y mucho más.
"Puedes usar ? para pedir a la IA que genere contenido, basándose en lo que existe en la entidad."
Colaboración y control de acceso: Patchwork permite la colaboración en tiempo real y ofrece opciones para controlar el acceso y la edición de los mundos creados.
"Puedes hacer el mundo privado, visible o editable por otros. Haz clic en el botón 'compartir' y podrás ver el panel de permisos."
En general, estos artículos muestran un panorama emocionante de la rápida evolución de la IA y su creciente impacto en diversas industrias.
??Los modelos de lenguaje multi-modales como Nova y Gemini 2.0 abren nuevas posibilidades para la interacción con la información, mientras que aplicaciones como MasterClass On Call y Patchwork aprovechan la IA para democratizar el acceso al conocimiento y la creatividad. Sin embargo, también se destaca la importancia de la responsabilidad y la ética en el desarrollo y la implementación de estas tecnologías.