Skip to main content

Introducción

En esta publicación de blog, presentamos cómo crear modelos de OpenAI dentro de MindsDB. En este ejemplo, le pedimos a un modelo que proporcione un resumen de un texto. Los datos de entrada se toman de nuestra base de datos MongoDB de muestra.

Requisitos previos

Para seguir este tutorial, puedes registrarte para obtener una cuenta en cloud.mindsdb.com. Alternativamente, dirígete a la documentación de MindsDB y sigue las instrucciones para configurar manualmente una instancia local de MindsDB a través de Docker o pip.

Cómo conectar MindsDB a una base de datos

Utilizamos una colección de nuestra base de datos de demostración pública de MongoDB, así que comencemos conectando MindsDB a ella. Puedes usar Mongo Compass o Mongo Shell para conectar nuestra base de datos de muestra de esta manera:
test> use mindsdb
mindsdb> db.databases.insertOne({
            'name': 'mongo_demo_db',
            'engine': 'mongodb',
            'connection_args': {
                "host": "mongodb+srv://user:MindsDBUser123!@demo-data-mdb.trzfwvb.mongodb.net/",
                "database": "public"
            }
        })

Tutorial

En este tutorial, creamos un modelo predictivo para resumir un artículo. Ahora que hemos conectado nuestra base de datos a MindsDB, consultemos los datos que se utilizarán en el ejemplo:
mindsdb> use mongo_demo_db
mongo_demo_db> db.articles.find({}).limit(3)
Aquí está la salida:
{
  _id: '63d01398bbca62e9c7774ab8',
  article: "Video footage has emerged of a law enforcement officer…",
  highlights: 'The 53-second video features…"
}
{
  _id: '63d01398bbca62e9c7774ab9',
  article: "A new restaurant is offering a five-course…",
  highlights: "The Curious Canine Kitchen is…"
}
{
  _id: '63d01398bbca62e9c7774aba',
  article: 'Mother-of-two Anna Tilley survived after spending four days…',
  highlights: 'Experts have warned hospitals not using standard treatment…'
}
Creemos una colección de modelos para resumir todos los artículos del conjunto de datos de entrada:
mongo_demo_db> use mindsdb
mindsdb> db.models.insertOne({
            name: 'text_summarization',
            predict: 'highlights',
            training_options: {
                        engine: 'openai',
                        prompt_template: 'provide an informative summary of the text text:{{article}} using full sentences'
                }
        })
En la práctica, elinsertOnemétodo hace que MindsDB genere una colección de IA llamadatext_summarizationque utiliza la integración de OpenAI para predecir un campo llamadohighlights. El modelo se crea dentro delmindsdbproyecto predeterminado. En MindsDB, los proyectos son una forma natural de mantener separados los artefactos, como modelos o vistas, según la tarea predictiva que resuelven. Puedes aprender más sobre los proyectos de MindsDBaquí. La clavetraining_optionsespecifica los parámetros que requiere este controlador.
  • El parámetroenginedefine que usamos el motoropenai.
  • El parámetroprompt_templatetransmite la estructura de un mensaje que se completará con texto adicional generado por el modelo.
Sigueesta instrucciónpara configurar la integración de OpenAI en MindsDB.
Una vez que el métodoinsertOneha comenzado la ejecución, podemos verificar el estado del proceso de creación con la siguiente consulta:
mindsdb> db.getCollection('models').find({
            'name': 'text_summarization'
        })
Puede llevar un tiempo registrarse como completo dependiendo de la conexión a internet. Una vez que la creación esté completa, el comportamiento es el mismo que con cualquier otra colección de IA: puedes consultarla especificando datos sintéticos en la consulta real:
mindsdb> db.text_summarization.find({
            article: "Apple's Watch hits stores this Friday when customers and employees alike will be able to pre-order the timepiece. And boss Tim Cook is rewarding his staff by offering them a 50 per cent discount on the device."
        })
Aquí están los datos de salida:
{
  highlights: "Apple's Watch hits stores this Friday, and employees will be able to pre-order the",
  article: "Apple's Watch hits stores this Friday when customers and employees alike will be able to pre-order the timepiece. And boss Tim Cook is rewarding his staff by offering them a 50 per cent discount on the device."
}
O uniéndola con una colección para predicciones por lotes:
mindsdb> db.text_summarization.find(
            {
                'collection': 'mongo_demo_db.articles'
            },
            {
                'text_summarization.highlights': 'highlights',
                'articles.article': 'article'
            }
        ).limit(3)
Aquí están los datos de salida:
{
  highlights: 'A video has emerged of a law enforcement officer grabbing a cell phone from a woman who was',
  article: "Video footage has emerged of a law enforcement officer..."
}
{
  highlights: 'A new restaurant in London is offering a five-course drink-paired menu for dogs',
  article: "A new restaurant is offering a five-course..."
}
{
  highlights: "Sepsis is a potentially life-threatening condition that occurs when the body's response to an",
  article: 'Mother-of-two Anna Tilley survived after spending four days...'
}
La colecciónarticlesse utiliza para hacer predicciones por lotes. Al unir el modelotext_summarizationcon la colecciónarticles, el modelo utiliza todos los valores del campoarticle.

Aprovecha las capacidades de NLP con MindsDB

Al integrar bases de datos y OpenAI usando MindsDB, los desarrolladores pueden extraer fácilmente información de datos de texto con solo unos pocos comandos SQL. Estos potentes modelos de procesamiento de lenguaje natural (NLP) son capaces de responder preguntas con o sin contexto y completar indicaciones generales. Además, estos modelos están impulsados por grandes modelos de lenguaje pre-entrenados de OpenAI, por lo que no hay necesidad de trabajo de desarrollo manual. En última instancia, esto proporciona a los desarrolladores una forma fácil de incorporar potentes capacidades de NLP en sus aplicaciones mientras ahorran tiempo y recursos en comparación con los métodos y flujos de trabajo tradicionales de desarrollo de ML. En resumen, ¡MindsDB hace posible que los desarrolladores aprovechen el poder de OpenAI de manera eficiente! MindsDB es ahora la plataforma de aprendizaje automático aplicado de código abierto de más rápido crecimiento en el mundo. Su comunidad continúa contribuyendo a más de 70 integraciones de fuentes de datos y marcos de ML. ¡Mantente atento a las próximas características, incluyendo más control sobre los parámetros de interfaz y el ajuste fino de modelos directamente desde MindsDB! Experimenta con los modelos de OpenAI dentro de MindsDB y desbloquea la capacidad de ML sobre tus datos en minutos. Recuerdaregistrarte para una cuenta de demostración gratuitay seguir los tutoriales, quizás esta vez usando tus propios datos. Finalmente, si la visión de MindsDB de democratizar el ML te parece emocionante, dirígete a nuestroSlack de la comunidad, donde puedes obtener ayuda y encontrar personas para charlar sobre el uso de otras fuentes de datos disponibles, marcos de ML, o escribir un controlador para traer los tuyos propios! Sigue nuestra introducción a la integración de OpenAI de MindsDBaquí. Además, tenemos una variedad de tutoriales que utilizan MySQL y MongoDB:

¿Qué sigue?

¡Diviértete mientras lo pruebas tú mismo! Si este tutorial te fue útil, por favor danos una estrella en GitHubaquí.