Skip to main content

Introducción

En esta publicación de blog, presentamos cómo crear modelos de OpenAI dentro de MindsDB. En este ejemplo, hacemos una pregunta a un modelo y obtenemos una respuesta. Los datos de entrada se toman de nuestra base de datos MongoDB de muestra.

Requisitos previos

Para seguir este tutorial, puedes registrarte para obtener una cuenta en cloud.mindsdb.com. Alternativamente, dirígete a la documentación de MindsDB y sigue las instrucciones para configurar manualmente una instancia local de MindsDB a través de Docker o pip.

Cómo conectar MindsDB a una base de datos

Utilizamos una colección de nuestra base de datos de demostración pública de MongoDB, así que comencemos conectando MindsDB a ella. Puedes usar Mongo Compass o Mongo Shell para conectar nuestra base de datos de muestra de esta manera:
test> use mindsdb
mindsdb> db.databases.insertOne({
            'name': 'mongo_demo_db',
            'engine': 'mongodb',
            'connection_args': {
                "host": "mongodb+srv://user:MindsDBUser123!@demo-data-mdb.trzfwvb.mongodb.net/",
                "database": "public"
            }
        })

Tutorial

En este tutorial, creamos un modelo predictivo para responder preguntas en un dominio específico. Ahora que hemos conectado nuestra base de datos a MindsDB, consultemos los datos que se utilizarán en el ejemplo:
mindsdb> use mongo_demo_db
mongo_demo_db> db.questions.find({}).limit(3)
Aquí está la salida:
{
  _id: '63d01350bbca62e9c77732c0',
  article_title: 'Alessandro_Volta',
  question: 'Was Volta an Italian physicist?',
  true_answer: 'yes'
}
{
  _id: '63d01350bbca62e9c77732c1',
  article_title: 'Alessandro_Volta',
  question: 'Is Volta buried in the city of Pittsburgh?',
  true_answer: 'no'
}
{
  _id: '63d01350bbca62e9c77732c2',
  article_title: 'Alessandro_Volta',
  question: 'Did Volta have a passion for the study of electricity?',
  true_answer: 'yes'
}
Creemos una colección de modelos para responder todas las preguntas del conjunto de datos de entrada:
mongo_demo_db> use mindsdb
mindsdb> db.models.insertOne({
            name: 'question_answering',
            predict: 'answer',
            training_options: {
                        engine: 'openai',
                        prompt_template: 'answer the question of text:{{question}} about text:{{article_title}}'
                }
        })
En la práctica, el insertOne método desencadena que MindsDB genere una colección de IA llamada question_answering que utiliza la integración de OpenAI para predecir un campo llamado answer. El modelo se crea dentro del proyecto mindsdb predeterminado. En MindsDB, los proyectos son una forma natural de mantener separados los artefactos, como modelos o vistas, según la tarea predictiva que resuelven. Puedes aprender más sobre los proyectos de MindsDB aquí. La clave training_options especifica los parámetros que requiere este controlador.
  • El parámetro engine define que usamos el motor openai.
  • El parámetro prompt_template transmite la estructura de un mensaje que se completará con texto adicional generado por el modelo.
Sigue esta instrucción para configurar la integración de OpenAI en MindsDB.
Una vez que el método insertOne ha comenzado la ejecución, podemos verificar el estado del proceso de creación con la siguiente consulta:
mindsdb> db.getCollection('models').find({
            'name': 'question_answering'
        })
Puede tomar un tiempo registrarse como completo dependiendo de la conexión a internet. Una vez que la creación esté completa, el comportamiento es el mismo que con cualquier otra colección de IA: puedes consultarla especificando datos sintéticos en la consulta real:
mindsdb> db.question_answering.find({
            question: 'Was Abraham Lincoln the sixteenth President of the United States?',
            article_title: 'Abraham_Lincoln'
        })
Aquí están los datos de salida:
{
  answer: 'Yes, Abraham Lincoln was the sixteenth President of the United States.',
  question: 'Was Abraham Lincoln the sixteenth President of the United States?',
  article_title: 'Abraham_Lincoln'
}
O uniéndola con una colección para predicciones por lotes:
mindsdb> db.question_answering.find(
            {
                'collection': 'mongo_demo_db.questions'
            },
            {
                'question_answering.answer': 'answer',
                'questions.question': 'question',
                'questions.article_title': 'article_title'
            }
        ).limit(3)
Aquí están los datos de salida:
{
  answer: 'Yes, Volta was an Italian physicist.',
  question: 'Was Volta an Italian physicist?',
  article_title: 'Alessandro_Volta'
}
{
  answer: 'No, Volta is not buried in the city of Pittsburgh.',
  question: 'Is Volta buried in the city of Pittsburgh?',
  article_title: 'Alessandro_Volta'
}
{
  answer: 'Yes, Volta had a passion for the study of electricity. He was fascinated by the',
  question: 'Did Volta have a passion for the study of electricity?',
  article_title: 'Alessandro_Volta'
}
La colección questions se utiliza para hacer predicciones por lotes. Al unir el modelo question_answering con la colección questions, el modelo utiliza todos los valores de los campos article_title y question.

Aprovecha las capacidades de NLP con MindsDB

Al integrar bases de datos y OpenAI usando MindsDB, los desarrolladores pueden extraer fácilmente información de datos de texto con solo unos pocos comandos SQL. Estos potentes modelos de procesamiento de lenguaje natural (NLP) son capaces de responder preguntas con o sin contexto y completar indicaciones generales. Además, estos modelos están impulsados por grandes modelos de lenguaje pre-entrenados de OpenAI, por lo que no hay necesidad de trabajo de desarrollo manual. En última instancia, esto proporciona a los desarrolladores una forma fácil de incorporar potentes capacidades de NLP en sus aplicaciones, ahorrando tiempo y recursos en comparación con los métodos y pipelines de desarrollo de ML tradicionales. En resumen, ¡MindsDB hace posible que los desarrolladores aprovechen el poder de OpenAI de manera eficiente! MindsDB es ahora la plataforma de aprendizaje automático aplicado de código abierto de más rápido crecimiento en el mundo. Su comunidad continúa contribuyendo a más de 70 integraciones de fuentes de datos y marcos de ML. ¡Mantente atento a las próximas características, incluyendo más control sobre los parámetros de interfaz y el ajuste fino de modelos directamente desde MindsDB! Experimenta con modelos de OpenAI dentro de MindsDB y desbloquea la capacidad de ML sobre tus datos en minutos. Recuerda registrarte para obtener una cuenta de demostración gratuita y seguir los tutoriales, quizás esta vez usando tus propios datos. Finalmente, si la visión de MindsDB de democratizar el ML te parece emocionante, dirígete a nuestro Slack de la comunidad, donde puedes obtener ayuda y encontrar personas para chatear sobre el uso de otras fuentes de datos disponibles, marcos de ML o escribir un controlador para traer el tuyo propio! Sigue nuestra introducción a la integración de OpenAI de MindsDB aquí. Además, tenemos una variedad de tutoriales que utilizan MySQL y MongoDB:

¿Qué sigue?

¡Diviértete mientras lo pruebas tú mismo! Si este tutorial te fue útil, por favor danos una estrella en GitHub aquí.