IBM lanza el modelo de IA Granite 3.0 que promete ser de código abierto

ibm granite 3.0 ai models artificial intelligence large language llm

Corporación Internacional de Máquinas de Negocios La serie de modelos de inteligencia artificial más compleja hasta la fecha, denominada Granite 3.0, se presentó en la conferencia anual de la compañía Intercambio técnico evento.

La gama Granite 3.0 incluye una gama de modelos diseñados para una variedad de aplicaciones:

  • General/Idioma: Variantes 8B y 2B en instrucciones y configuración base
  • Seguridad: Los modelos Guardian están disponibles en tamaños 8B y 2B y están diseñados para la implementación de barandillas.
  • Expert Mix: una familia de modelos optimizados para diferentes escenarios de implementación

IBM afirma que sus nuevos modelos de lenguaje 8B y 2B pueden igualar o superar el rendimiento de productos de tamaño similar de proveedores líderes en numerosos puntos de referencia académicos e industriales. Posicionados como los caballos de batalla versátiles de la IA empresarial, estos modelos destacan en tareas como la generación de aumento de recuperación (RAG), clasificación, resumen y extracción de entidades.

Un diferenciador clave de la serie Granite 3.0 es el compromiso de IBM con la IA de código abierto. Lanzados bajo la licencia Apache 2.0, estos modelos brindan a los clientes empresariales y a la comunidad de IA en general una combinación única de rendimiento, flexibilidad y autonomía.

IBM cree que al combinar modelos compactos Granite con datos empresariales patentados, particularmente utilizando su novedosa tecnología de alineación InstructLab, las empresas pueden lograr un rendimiento específico de tareas comparable al de modelos más grandes a una fracción del costo. Las primeras pruebas de concepto demuestran un ahorro potencial de costos de hasta 23 veces en comparación con los grandes modelos de vanguardia.

Proyecto de ley de inteligencia artificial de la UE: una preparación temprana puede dar a las empresas una ventaja competitivaProyecto de ley de inteligencia artificial de la UE: una preparación temprana puede dar a las empresas una ventaja competitiva

IBM dijo que la transparencia y la seguridad siguen siendo las principales prioridades en su estrategia de IA. La compañía publicó un informe técnico y una guía de uso responsable de Granite 3.0, que detalla los conjuntos de datos utilizados, los pasos del procesamiento de datos y los resultados de las pruebas comparativas. Además, IBM ofrece indemnización por propiedad intelectual para todos los modelos Granite en su plataforma watsonx.ai, lo que brinda a las empresas una mayor confianza al integrar estos modelos con sus propios datos.

El modelo Granite 3.0 8B Instruct mostró resultados particularmente prometedores, superando a los modelos de código abierto de tamaño similar de Meta y Mistral en los puntos de referencia académicos estándar. También lidera en todas las dimensiones de seguridad medidas del benchmark de seguridad IBM AttaQ.

IBM también lanzó el modelo Granite Guardian 3.0, diseñado para implementar barreras de seguridad examinando las indicaciones de los usuarios y las respuestas de LLM ante diversos riesgos. Estos modelos proporcionan un conjunto integral de capacidades de detección de riesgos y peligros, incluidas verificaciones únicas para problemas específicos de RAG, como la fundamentalidad y la dependencia contextual.

El conjunto completo de modelos Granite 3.0 está disponible para descargar en HuggingFace, con opciones de uso comercial disponibles en la plataforma Watsonx de IBM. IBM también está trabajando con socios del ecosistema para integrar el modelo Granite en una variedad de productos, brindando más opciones a las empresas globales.

A medida que IBM continúa avanzando en su cartera de inteligencia artificial, la compañía dijo que se centra en desarrollar tecnologías de agentes de IA más sofisticadas que permitan una mayor autonomía y la capacidad de resolver problemas complejos. Estos incluyen planes para introducir nuevas capacidades de agentes de IA en IBM Watsonx Orchestrate en 2025 y desarrollar capacidades de agentes en toda su cartera.

Anthropic lanza el nuevo modelo Claude AI y Anthropic lanza el nuevo modelo Claude AI y "control por computadora"

Ver también: Puntuación de modelos de IA: Endor Labs lanza una herramienta de evaluación

¿Quiere aprender más sobre inteligencia artificial y big data de la mano de los líderes de la industria? Controlar Expo Inteligencia Artificial y Big Data Celebrada en Amsterdam, California y Londres. El evento integral se lleva a cabo al mismo tiempo que otros eventos importantes, incluidos Conferencia de automatización inteligente, brockx, Semana de la Transformación Digitaly Expo Ciberseguridad y Nube.

Explore otros próximos eventos y seminarios web de tecnología empresarial impulsados ​​por TechForge aquí.

Etiqueta: ai, inteligencia artificial, empresa, Granite 3, IBM, modelo de lenguaje grande, LLM, modelo, techxchange

Descubre herramientas IA similares a IBM lanza el modelo de IA Granite 3.0 que promete ser de código abierto puedes visitar la categoría Noticias.

Avatar de Repositoria

Repositoria

Relacionado:

Subir