ChatGPT

Llega MiniGPT-4, el chatbot que entiende imágenes

Descubre el sorprendente avance en inteligencia artificial de código abierto capaz de describir y comprender imágenes.

¡Atención, amantes de la inteligencia artificial! ¡MiniGPT-4 ha llegado y es hora de celebrarlo! Pero, ¿qué es MiniGPT-4 y por qué debería interesarte? Pues bien, es una versión más pequeña del famoso GPT-4 de OpenAI, pero con un toque especial: ¡puede entender imágenes! ¿A que suena increíble? ¡Sigue leyendo para enterarte de todo!

Resulta que OpenAI presentó el GPT-4 como un modelo multimodal con comprensión de imágenes, pero aún no ha lanzado esa parte al público. ¡No desesperes! Aquí es donde entra MiniGPT-4, que ya está disponible como modelo de código abierto.

Como su hermano mayor, MiniGPT-4 es capaz de describir imágenes y responder preguntas sobre su contenido. Por ejemplo, si le muestras una foto de un plato preparado, el modelo te puede dar una receta (quizás) adecuada o generar una descripción de la imagen para personas con discapacidad visual. ¡Incluso puede generar código HTML a partir de bocetos de páginas web hechos a mano! ¿No es genial?

Lo asombroso de MiniGPT-4 es que se basa en el modelo de lenguaje Vicuna-13B LLM y el modelo de lenguaje y visión BLIP-2, ambos de código abierto. Esto significa que no se necesita una gran cantidad de dinero, datos o recursos informáticos para entrenarlo y ajustarlo.

El equipo de desarrollo ha publicado el código, las demostraciones y las instrucciones de entrenamiento de MiniGPT-4 en Github. También anunciaron una versión más pequeña del modelo que funcionará en una sola tarjeta gráfica Nvidia 3090. ¡Más accesible imposible!

MiniGPT-4, el chatbot que entiende imágenes
MiniGPT-4, el chatbot que entiende imágenes
MiniGPT-4, el chatbot que entiende imágenes

El progreso de MiniGPT-4 es un gran ejemplo del avance que la comunidad de código abierto ha logrado en poco tiempo. Esto sugiere que las empresas de modelos de IA pura podrían no tener tanta ventaja como se pensaba. De hecho, ayer mismo se lanzó OpenAssistant, otro chatbot de código abierto entrenado con datos recopilados por voluntarios que pretende convertirse en una alternativa a ChatGPT.

Ante este panorama, tiene sentido que OpenAI se enfoque en construir un ecosistema de socios que utilice complementos de ChatGPT para GPT-4, en lugar de entrenar GPT-5 por ahora. La investigación y el esfuerzo de entrenamiento para un nuevo modelo podrían ser mayores para OpenAI que la ventaja que podría obtener frente a sus competidores o la comunidad de código abierto. En comparación, construir un ecosistema de chat es un desafío mayor y económicamente insostenible, pero puede generar un efecto de bloqueo en los usuarios.

Para los curiosos, podéis probarlo ya mismo en su página web. Si queréis probar en vuestra propia máquina, en el repositorio de github está toda la información para ponerlo a andar.

Así que ya lo sabes, ¡el futuro de la inteligencia artificial está aquí y MiniGPT-4 es una prueba de ello! No pierdas tiempo y echa un vistazo a este emocionante avance en el mundo de la IA.

Publicaciones relacionadas

Botón volver arriba